Anda di halaman 1dari 68

BAB 1

PENDAHULUAN
1. Pengantar
Dalam percakapan sehari-hari di kalangan guru/ dosen, sering kali
terdengar komentar, bahwa mengevaluasi suatu hasil sebuah Proses Belajar
Mengajar (PBM) adalah pekerjaan yang paling gampang. Atau pernahkah
kalian mendengar komentar bahwa menjadi seorang pendidik yang penting
adalah menguasai materi, soal mengevaluasi itu sangat mudah. Atau adakah di
antara kalian yang mempunyai anggapan yang senada dengan pendapat-
pendapat tersebut ?. Jika anda menjawab ya, maka pemahaman seperti itu
termasuk pendapat yang sangat keliru, karena sesungguhnya pekerjaan yang
paling sulit bagi seorang pendidik (guru/dosen) adalah melakukan evaluasi,
Pendapat tersebut dapat muncul dari seseorang (guru / dosen) karena mereka
tidak pernah mempelajari secara serius tata aturan membuat sebuah perangkat
instrumen evaluasi. Jika ada yang berpendapat bahwa membuat sebuah
perangkat instrumen evaluasi belajar adalah mudah, karena mereka yang
bersangkutan itu sudah memahami secara utuh bagaimana tata aturan dan
kriteria sebuah instrumen evaluasi yang dikatakan berkualitas.
Yang lebih menyedihkan adalah seorang pendidik (guru atau dosen,
termasuk calon guru) bahkan tidak bisa membedakan makna sesungguhnya
apa itu pengukuran, penilaian dan evaluasi hasil dari sebuah proses
pembelajaran. Belum lagi jika mereka tidak dapat membedakan apa yang
dimaksud dengan hasil belajar, dan prestasi belajar.
Sesungguhnya apabila seorang guru/dosen semakin banyak mereka
mempelajari teori-teori yang berkaitan dengan evaluasi pembelajaran, maka
akan disadari bahwa melakukan evaluasi suatu hasil proses pembelajaran
membutuhkan pemahaman dan pengetahuan yang sangat luas dan kompleks.
Seorang pendidik ketika melakukan evaluasi terhadap hasil sebuah proses
pembelajaran, sebelum melaksanakan kegiatan pembelajaran, sudah harus
memahami dan mengerti betul tujuan dari evaluasi yang akan dilakukan..

I Made Sudana Evaluasi Pembelajaran Page 1


Tujuan dan fungsi dari evaluasi harus dimengerti; apakah hanya untuk melihat
tingkat pemahaman seorang peserta didik ditinjau dari sisi kemampuan
memahami dan mengerti tentang apa yang telah dipelajari, atau hanya untuk
mengetahui rata-rata kemampuan penguasaan materi secara klasikal atau
untuk tujuan pemetaan dan sebagainya. Oleh karena itu seorang pendidik
sebelum melakukan evaluas,i sudah harus memiliki landasan pengetahuan
yang memadai tentang cara-cara mengevaluasi.
Banyak di antara pendidik (guru usia muda dan atau baru jadi guru /
dosen) memunculkan keluhan dan Jika ada yang berpendapat bahwa membuat
sebuah perangkat instrumen evaluasi belajar dikatakan mudah, karena yang
bersangkutan itu sudah memahami secara utuh bagaimana tata aturan dan
kriteria sebuah instrumen evaluasi.komentar di antara peserta didiknya, bahwa
guru/dosen tersebut dianggap cara mengajanya tidak menarik, kurang
menguasai materi, metodenya statis, tidak bisa membangun interkasi, kalau
ditanya peserta didik jawabannya tidak jelas, bahkan malah marah kalau
ditanya oleh siswanya.dan yang lebih mengecewakan mereka, kalau
memberikan nilai sangat pelit. Kondisi ini bisa terjadi di antara ke dua belah
pihak, di samping guru/dosennya memang seperti itu. Tetapi ada kemungkinan
karena kualitas peserta didiknya yang kurang memiliki daya intelektual
tergolong kurang. Oleh Karena itu, diperlukan adanya instrospeksi dan refleksi
di antara ke dua belah pihak, sehingga dapat menyadari kelemahan masing-
masing.

2. Makna Evaluasi
Wandt dan Brown, 1977 (dalam Sudjiono, 2006) memberikan makna
dari evaluasi sebagai berikut: evaluation refer to the act or process to
determining the value of something. Evaluasi dapat diartikan sebagai suatu
proses kegiatan yang terencana untuk mengetahui keadaan suatu
objek dengan menggunakan instrumen dan hasilnya dibandingkan dengan
suatu tolak ukur untuk memperoleh suatu kesimpulan.

I Made Sudana Evaluasi Pembelajaran Page 2


Sebelum mengajar pendidik (guru/dosen) wajib membuat Rencana
Program Smester (RPS) atau RPP. Dengan dasar RPP, maka seorang
pengajar akan memegang mekanisme yang harus dia lakukan sesuai dengan
apa yang mereka buat. Oleh Karena itua evaluasi dapat digunakan untuk
mengetahui ketercapaian tujuan pembelajaran dan capaian pembelajaran
seperti yang tertuang di dalam RPS atau RPP. Dengan demikian hasil evaluasi
dari sebuah kegiatan proses belajar mengajar (PBM) sangat dipengaruhi oleh
kualitas instrumen penilaian yang digunakan, cara guru mengajar, kualitas
media pembelajaran, strategi guru dalam mengajar, metode yang digunakan,
jenis evaluasi yang dipakai. Dalam melakukan evaluasi pembelajaran,
diperlukan keahlian membuat instrumen (alat ukur), sehingga dapat
menghasilkan instrumen ukur yang berkualitas, Dengan demikian maka proses
evaluasi akan terlaksana dengan baik dan benar, serta menghasilkan informasi
yang akurat tentang hasil belajar peserta didik.

3. Langkah-Langkah di dalam Mengevaluasi


Seorang pendidik ketika melakukan evaluasi pada praktiknya diawali
dengan langkah-langkah mengukur dan menilai, lalu mengeksekusi apa
yang diperoleh dari hasil penilaian. Maka evaluasi merupakan tahap akhir yaitu
mengambil keputusan (―jugdment‖) yaitu mengeksekusi dan memutuskan
dengan menetapkannya sebagai hasil capaian dari pembelajaran. Diharapkan
dari hasil evaluasi dapat dijadikan refleksi oleh pendidik, sampai seberapa
besar hasil yang telah dicapai dari kegiatan pembelajaran yang telah
dilaksanakan. Pendidik akan tahu keputusan apa yang akan diberikan terhadap
seorang pembelajar, dan tindakan apa yang harus dilakukan pada proses
pembelajaran selanjutnya, aspek-aspek apa saja yang harus diperbaiki, untuk
dijadikan bahan perancangan Rencana Program Smester (RPS) berikutnya,
agar kelak ada perbaikan hasil pada pembelajaran nantinya. Karena itu
langkah-langkah di dalam mengevaluasi hasil PBM, dimulai dari pengukuran
yaitu proses pemberian skor atau angka-angka (kuantitatif) terhadap suatu

I Made Sudana Evaluasi Pembelajaran Page 3


keadaan atau gejala berdasarkan atura-aturan tertentu, sedangkan penilaian
bermakna memberikan kriteria capaiannya (kualitatif) yang diakhiri dengan
evaluasi (kualitatif).
Kegiatan pengukuran merupakan dasar untuk memberikan penilaian
dalam proses evaluasi. Dengan demikian evaluasi dapat diartikan sebagai
proses mendeskripsikan (kualitatif), mengumpulkan dan menyajikan suatu
informasi yang bermanfaat untuk pertimbangan dalam pengambilan keputusan.
Dengan demikian terdapat tiga aktivitas yang berkaitan erat yaitu antara
pengukuran (measurment), penilaian (assessment) dan evaluasi (evaluation).
Secara konsep dapat dimaknai, bahwa mata kuliah evaluasi pembelajaran
secara nomenklatur sangat tepat karena dari hasil pengukuran dan penialaian
akan dimaknai sebagai tindakan untuk memutuskan, apakah hasilnya termasuk
memenuhi kriteria atau belum dari capaian hasil pembelajaran yang dilakukan.

4. Prasyarat

Hal pertama yang perlu diperhatikan sekarang oleh mahasiswa yang


mengambil mata kuliah Evaluasi Pembelajaran adalah paling tidak seorang
mahasiswa (calon guru kependidikan) harus sudah lulus mata kuliah Statistika
maupun strategi belajar mengajar (SBM), karena materinya harus bercermin
pada silabus. Di samping itu akan banyak dilibatkan dalam memahami tata
cara mengembangkan instrumen yang kelak akan digunakan untuk mengetahui
hasil evaluasi pembelajaran. Karena itu mata kuliah

I Made Sudana Evaluasi Pembelajaran Page 4


BAB 2
PENGERTIAN, TUJUAN DAN JENIS EVALUASI PEMBELAJARAN

1. Pengertian Evaluasi
Mengacu pada PP.19/2005 tentang Standar Nasional Pendidikan di
dalam Bab I pasal 1 ayat 17 dikemukakan bahwa ―penilaian adalah proses
pengumpulan dan pengolahan informasi untuk mengukur pencapaian hasil
belajar peserta didik‖.Ditjen Dikdasmen Depdiknas (2003: 1) secara
eksplisit mengemukakan bahwa antara penilaian dan evaluasi mempunyai
persamaan dan perbedaan. Dalam UU No.20/2003 tentang Sistem Pendidikan
Nasional Bab I Pasal 1 ayat 21 dijelaskan bahwa evaluasi pendidikan adalah
kegiatan pengendalian, penjaminan, dan penetapan mutu pendidikan terhadap
berbagai komponen pendidikan pada setiap jalur, jenjang, dan jenis pendidikan
sebagai bentuk pertanggungjawaban penyelenggaraan pendidikan.
Ada pengertian yang bermakna sama dan berbeda antara penilaian
dan evaluasi. Persamaannya adalah keduanya mempunyai pengertian menilai
atau menentukan nilai sesuatu.Adapun perbedaannya terletak pada konteks
penggunaannya. Penilaian (assessment) digunakan dalam konteks yang lebih
sempit dan biasanya dilaksanakan secara internal oleh mereka yang menjadi
bagian atau terlibat dalam sistem yang bersangkutan, seperti guru/ dosen
menilai hasil belajar murid, atau supervisor menilai guru. Adapun evaluasi
digunakan dalam konteks yang lebih luas dan biasanya dilaksanakan secara
eksternal, seperti konsultan yang disewa untuk mengevaluasi suatu program,
baik pada level terbatas maupun pada level yang luas.
Istilah pengukuran (measurement) mengandung arti “theact or process
of ascertaining the extent or quantity of something”(Wand and Brown, 1997
dalam Zainal Arifin, 1991).Pengukuran sebagai suatu proses yang
menghasilkan gambaran berupa angka-angka berdasarkan hasil pengamatan
mengenai beberapa ciri(atribute)tentang suatu objek, orang atau peristiwa.
Dengan demikian, evaluasi dan penilaian berkenaan dengan kualitas daripada

I Made Sudana Evaluasi Pembelajaran Page 5


sesuatu, sedangkan makna pengukuran berkenaan dengan kuantitas (yang
menunjukkan angka-angka) daripada sesuatu. Oleh karena itu, dalam proses
pengukuran diperlukan alat ukur yang standar, baik dalam tes maupun nontes.

2. Tujuan Evaluasi Pembelajaran


Tujuan evaluasi pembelajaran adalah untuk menghimpun informasi
yang dijadikan dasar untuk mengetahui taraf kemajuan, perkembangan, dan
pencapaian belajar peserta didik, serta keefektifan pengajaran yang
dilaksanakan oleh pendidik, sehingga evaluasi pembelajaran dibedakan atas
evaluasi diagnostik, selektif, penempatan, formatif dan sumatif. Jika ditinjau dari
sasarannya, evaluasi pembelajaran dapat dibedakan atas evaluasi konteks,
input, proses, hasil dan learning outcome. Dengan demikian di dalam
prosesnya, evaluasi dilakukan melalui beberapa tahapan yaitu perencanaan,
pelaksanaan, pengolahan hasil, refleksi dan pelaporan.
Secara umum, tujuan evaluasi pembelajaran adalah untuk mengetahui
efektivitas proses pembelajaran yang telah dilaksanakan. Secara khusus,
tujuan evaluasi adalah untuk: (a) mengetahui tingkat penguasaan peserta
didik terhadap kompetensi yang telah ditetapkan, (b) mengetahui kesulitan-
kesulitan yang dialami peserta didik dalam proses belajar, sehingga dapat
dilakukan diagnosis dan kemungkinan memberikan remedial teaching, dan (c)
mengetahui efisiensi dan efektifitas strategi pembelajaran yang digunakan guru,
baik yang menyangkut metode, media maupun sumber-sumber belajar.
Depdiknas (2003 : 6) mengemukakan tujuan evaluasi pembelajaran
adalah untuk: (a) melihat produktivitas dan efektivitas kegiatan belajar-meng-
ajar, (b) memperbaiki dan menyempurnakan kegiatan guru, (c) memperbaiki,
menyempurnakan dan mengembangkan program belajar-mengajar, (d)
mengetahui kesulitan-kesulitan apa yang dihadapi oleh peserta didik
selama kegiatan belajar dan mencarikan jalan keluarnya, dan (e)
menempatkan peserta didik dalam situasi belajar-mengajar yang tepat
sesuai dengan kemampuannya.

I Made Sudana Evaluasi Pembelajaran Page 6


3. Fungsi Evaluasi Pembelajaran
Fungsi evaluasi adalah (a) secara psikologis, peserta didik perlu
mengetahui prestasi belajarnya, sehingga ia merasakan kepuasan dan
ketenangan, (b) secara sosiologis, untuk mengetahui apakah peserta didik
sudah cukup mampu untuk terjun ke masyarakat. Mampu dalam arti dapat
berkomunikasi dan beradaptasi dengan seluruh lapisan masyarakat dengan
segala karakteristiknya, (c) secara didaktis-metodis, evaluasi berfungsi untuk
membantu guru dalam menempatkan peserta didik pada kelompok
tertentu sesuai dengan kemampuan dan kecakapannya masing-masing, (d)
untuk mengetahui kedudukan peserta didik di antara teman-temannya, apakah
ia termasuk peserta didik yang pandai, sedang atau kurang, (e) untuk
mengetahui taraf kesiapan peserta didik dalam menempuh program
pendidikannya, (f) untuk membantu guru dalam memberikan bimbingan dan
seleksi, baik dalam rangka menentukan jenis pendidikan, jurusan maupun
kenaikan tingkat/kelas, (g) secara administratif, evaluasi berfungsi untuk
memberikan laporan tentang kemajuan peserta didik kepada pemerintah,
pimpinan/kepala sekolah, pendidik, termasuk peserta didik itu sendiri.
Fungsi evaluasi dapat dilihat berdasarkan jenis evaluasi itu sendiri, yaitu
: (a) formatif, yaitu memberikan feed backbagi pengajar sebagai dasar untuk
memperbaiki proses pembelajaran dan mengadakan program remedial bagi
peserta didik yang belum menguasai sepenuhnya materi yang dipelajari, (b)
sumatif, yaitu mengetahui tingkat penguasaan peserta didik terhadap materi
pelajaran, menentukan angka (nilai) sebagai bahan keputusan kenaikan
kelas/kelulusan dan laporan perkembangan belajar, serta dapat meningkatkan
motivasi belajar, (c) diagnostik, yaitu dapat mengetahui latar belakang peserta
didik (psikologis, fisik, dan lingkungan) yang mengalami kesulitan belajar, (d)
seleksi dan penempatan, yaitu hasil evaluasi dapat dijadikan dasar untuk
menyeleksi dan menempatkan peserta didik sesuai dengan minat
dan kemampuannya.

I Made Sudana Evaluasi Pembelajaran Page 7


4. Prinsip-Prinsip Evaluasi
Prinsip-prinsip umum dalam evaluasi adalah: kontinuitas, komprehensif,
objektivitas, kooperatif, mendidik, akuntabilitas, dan praktis. Dengan demikian,
evaluasi pembelajaran hendaknya (a) dirancang sedemikian rupa, sehingga
jelas abilitas yang harus dievaluasi, materi yang akan dievaluasi, alat evaluasi
dan interpretasi hasil evaluasi, (b) menjadi bagian integral dari proses
pembelajaran, (c) agar hasilnya objektif, evaluasi harus menggunakan berbagai
alat (instrumen) dan sifatnya komprehensif, (d) diikuti dengan tindak lanjut. Di
samping itu, evaluasi juga harus memperhatikan prinsip keterpaduan, prinsip
berorientasi kepada kompetensi dan kecakapan hidup, prinsip belajar aktif,
prinsip koherensi, dan prinsip diskriminalitas.

5. Ruang Lingkup Evaluasi Pembelajaran


Ruang lingkup evaluasi pembelajaran dalam perspektif penilaian
berbasis kelas (dalam KKNI) adalah :

a. Penilaian kompetensi dasar mata pelajaran.


Kompetensi dasar pada hakikatnya adalah pengetahuan,
keterampilan, sikap dan nilai-nilai yang direfleksikan dalam kebiasaan
berfikir dan bertindak setelah peserta didik menyelesaikan suatu aspek
atau subjek mata pelajaran tertentu.

b. Penilaian Kompetensi Rumpun Pelajaran.


Rumpun pelajaran merupakan kumpulan dari mata pelajaran atau
disiplin ilmu yang lebih spesifik. Dengan demikian, kompetensi rumpun
pelajaran pada hakikatnya merupakan pengetahuan, keterampilan, sikap
dan nilai-nilai yang direfeksikan dalam kebiasaan berfikir dan bertindak
yang seharusnya dicapai oleh peserta didik setelah menyelesaikan
rumpun pelajaran tersebut.

I Made Sudana Evaluasi Pembelajaran Page 8


c. Penilaian Kompetensi Lintas Kurikulum.
Kompetensi lintas kurikulum merupakan kompetensi yang harus
dicapai melalui seluruh rumpun pelajaran dalam kurikulum. Kompetensi
lintas kurikulum pada hakikatnya merupakan pengetahuan, keterampilan,
sikap dan nilai-nilai yang direfleksikan dalam kebiasaan berfikir dan
bertindak yang mencakup kecakapan belajar sepanjang hayat dan
kecakapan hidup yang harus dicapai oleh peserta didik melalui
pengalaman belajar secara berkesinambungan.Penilaian ketercapaian
kompetensi lintas kurikulum ini dilakukan terhadap hasil belajar dari setiap
rumpun pelajaran dalam kurikulum.

d. Penilaian Kompetensi Tamatan.


Kompetensi tamatan merupakan pengetahuan, keterampilan,
sikap dan nilai-nilai yang direfleksikan dalam kebiasaan berfikir dan
bertindak setelah peserta didik menyelesaikan jenjang tertentu.

e. Penilaian Terhadap Pencapaian Keterampilan Hidup.


Penguasaan berbagai kompetensi dasar, kompetensi lintas
kurikulum, kompetensi rumpun pelajaran dan kompetensi tamatan melalui
berbagai pengalaman belajar juga memberikan efek positif (nurturan
effects) dalam bentukkecakapan hidup (life skills). Jenis-jenis kecakapan
hidup yang perlu dinilai antara lain :
1. Keterampilan diri (keterampilan personal) : penghayatan diri sebagai
makhluk Tuhan YME, motivasi berprestasi, komitmen, percaya diri,
dan mandiri.
2. Keterampilan berpikir rasional: berpikir kritis dan logis,sistematis
terampil menyusun rencana dan memecahkan masalah secara
sistematis.

3. Keterampilan sosial: keterampilan berkomunikasi lisan dan tertulis;


keterampilan bekerjasama, kolaborasi, lobi; keterampilan berpartisipasi;
keterampilan mengelola konflik; keterampilan mempengaruhi orang lain.
I Made Sudana Evaluasi Pembelajaran Page 9
4. Keterampilan akademik : keterampilan merancang, melaksanakan, dan
melaporkan hasil penelitian ilmiah; keterampilan membuat karya tulis
ilmiah; keterampilan mentransfer dan mengaplikasikan hasil-hasil
penelitian untuk memecahkan masalah, baik berupa proses maupun
produk.

5. Keterampilan vokasional: keterampilan menemukan algoritma, model,


prosedur untuk mengerjakan suatu tugas; keterampilan melaksanakan
prosedur; keterampilan mencipta produk dengan menggunakan konsep,
prinsip, bahan dan alat yang telah dipelajari.

6. Jenis-Jenis Evaluasi Pembelajaran


Ada beberapa jenis evaluasi pembelajaran, berdasarkan tujuan dan
manfaat yang diinginkan, dibedakan:
a. Berdasarkan tujuan
Berdasarkan tujuannya, dibedakan atas lima jenis evaluasi :
1. Evaluasi diagnostik

Evaluasi diagnostik adalah evaluasi yang di tujukan untuk menelaah


kelemahan-kelemahan peserta didika beserta faktor-faktor penyebabnya.
2. Evaluasi selektif

Evaluasi selektif adalah evaluasi yang di gunakan untuk memilih siwa


yang paling tepat sesuai dengan kriteria program kegiatan tertentu.
3. Evaluasi penempatan

Evaluasi penempatan adalah evaluasi yang digunakan untuk


menempatkan peserta didika dalam program pendidikan tertentu yang sesuai
dengan karakteristik peserta didika.
4. Evaluasi formatif

Evaluasi formatif adalah evaluasi yang dilaksanakan bertujuan untuk


memperbaiki dan meningkatan proses belajar dan mengajar.

I Made Sudana Evaluasi Pembelajaran Page 10


5. Evaluasi sumatif

Evaluasi sumatif adalah evaluasi yang dilakukan untuk menentukan


hasildan kemajuan bekajra peserta didika.

b. Berdasarkan Sasaran :
1. Evaluasi konteks

Evaluasi yang ditujukan untuk mengukur konteks program baik


mengenai rasional tujuan, latar belakang program, maupun kebutuhan-
kebutuhan yang muncul dalam perencanaan
2. Evaluasi input

Evaluasi yang diarahkan untuk mengetahui input baik sumber daya


maupun strategi yang digunakan untuk mencapai tujuan.
3. Evaluasi proses

Evaluasi yang di tujukan untuk melihat proses pelaksanaan, baik


mengenai kalancaran proses, kesesuaian dengan rencana, faktor pendukung
dan faktor hambatan yang muncul dalam proses pelaksanaan, dan
sejenisnya.
4. Evaluasi hasil atau produk

Evaluasi yang diarahkan untuk melihat hasil program yang dicapai


sebagai dasar untuk menentukan keputusan akhir, diperbaiki, dimodifikasi
ditingkatkan atau dihentikan.
5. Evaluasi outcome atau lulusan

Evaluasi yang diarahkan untuk melihat hasil belajar peserta didik lebih
lanjut, yakni evaluasi lulusan setelah terjun ke masyarakat.

I Made Sudana Evaluasi Pembelajaran Page 11


c. Berdasarkan Lingkup Kegiatan Pembelajaran :
1. Evaluasi program pembelajaran

Evaluasi yang mencakup terhadap tujuan pembelajaran, isi


program pembelajaran, strategi belajar mengajar, aspe-aspek program
pembelajaran yang lain.
2. Evaluasi proses pembelajaran

Evaluasi yang mencakup kesesuaian antara proses pembelajaran


dengan garis-gari besar program pembelajaran yang di tetapkan,
kemampuan guru dalam melaksanakan proses pembelajaran,
kemampuan peserta didika dalam mengikuti prosespembelajaran.
3. Evaluasi hasil pembelajaran

Evaluasi hasil belajar mencakup tingkat penguasaan peserta didik


terhadap tujuan pembelajaran yang ditetapkan, baik umum maupun
maupun khusus, ditinjau dalam aspek kognitif, afektif, psikomotorik.

d. Berdasarkan Objek dan Subjek Evaluasi


Berdasarkan objek :

1. Evaluasi input

Evaluasi terhadap peserta didik mencakup kemampuan kepribadian, sikap


keyakinan.
2. Evaluasi transformasi
Evaluasi terhadap unsur-unsur transformasi proses pembelajaran antara
lain materi, media, metode dan lain-lain.
3. Evaluasi output
Evaluasi terhadap lulusan yang mengacu pada ketercapaian hasil
pembelajaran.

I Made Sudana Evaluasi Pembelajaran Page 12


e. Berdasarkan subjek :
1. Evaluasi internal

Evaluasi yang dilakukan oleh orang dalam sekolah/kampus sebagai


evaluator, misalnya guru/dosen.
2. Evaluasi eksternal

Evaluasi yang dilakukan oleh orang luar sekolah sebagai evaluator,


misalnya orangtua, masyarakat, peneliti.
Dari uraian di atas dapat disimpulkan, bahwa untuk dapat
mengetahui hasil suatu proses pembelajaran, maka harus melalui beberapa
tahapan dengan menggunakan berbagai bentuk instrumen pengukuran
disesuaikan dengan tujuan, sasaran manfaat dan keperluan.

I Made Sudana Evaluasi Pembelajaran Page 13


BAGIAN 3
SISTEM PENILAIAN DALAM KKNI

1. Pengantar

Penilaian yang diterapkan dalam KKNI adalah Penilaian Berbasis Proses


(PBP). PBP memiliki pengertian penilaian sebagai assessment, yaitu kegiatan
yang dilakukan untuk memperoleh dan mengefektifkan informasi tentang hasil
belajar peserta didik selama dan setelah kegiatan belajar mengajar.
Data/informasi dari PBP merupakan salah satu bukti yang dapat digunakan
untuk mengukur keberhasilan suatu program pendidikan.
Dalam konsep KKNI, penilaian meliputi ketiga ranah (afektif, kongnitif dan
psikomotor) yang dalam pelaksaannya menekankan pada upaya mengukur
kemampuan pemahaman pengetahuan dan keterampilan peserta didik yang
didasarkan pada aspek pembentukan sikap spiritual dan sosial. Oleh karena itu
seorang calon guru dituntut untuk mengerti prosedur assesment secara utuh.

2. Ragam Penilaian Kelas


2.1.Tes Tertulis
Tes tertulis merupakan tes dalam bentuk bahan tulisan (baik soal
maupun jawabannya). Dalam menjawab soal peserta didik tidak selalu harus
merespon dalam bentuk menulis kalimat jawaban tetapi dapat juga dalam
bentuk mewarnai, memberi tanda, menggambar grafik, diagram dan
sebagainya.
a. Bentuk instrumen tes dan penskorannya
Obyektif :
1) Pilihan ganda
2) Benar – Salah
3) Menjodohkan
4) Isian singkat

I Made Sudana Evaluasi Pembelajaran Page 14


Non Obyektif (Subyektif):
1) Jawaban singkat atau isian singkat
2) Uraian obyektif (Esai berstruktur)
3) Uraian bebas (Esai bebas)
Bentuk instrumen ini dapat dipakai untuk mengukur
kompetensi peserta didik dalam semua tingkat ranah kognitif.Kaidah
penulisan instrumen bentuk uraian bebas adalah : (a) gunakan kata-
kata seperti mengapa, uraikan, jelaskan, bandingkan, tafsirkan,
hitunglah dan buktikan; (b) hindari penggunaan pertanyaan seperti
siapa, apa, kapan, dan lain-lain.
4) Pertanyaan lisan
Tes yang dilakukan dengan mengajukan pertanyaan langsung
kepada peserta didik.

2.2 PenilaianKinerja (Performance Asessment)


Performance Asessment merupakan penilaian dengan berbagai
macam tugas dan situasi dimana peserta tes diminta untuk
mendemonstrasikan pemahaman dan pengaplikasian pengetahuan yang
mendalam, serta keterampilan di dalam berbagai macam konteks.
Contoh-contoh alat penilaian kinerja : permainan, drama, demonstrasi,
olahraga, bermain musik, bernyanyi, pantomim, berdoa, membaca puisi,
berpidato, diskusi, wawancara, debat, bercerita, menari, kerajinan tangan,
pesawat sederhana, simpul tali-temali, dan sebagainya.

I Made Sudana Evaluasi Pembelajaran Page 15


Contoh Tugas Penilaian Kerja
Form Penilaian Pembuatan Proyek
Nama Peserta Didik :
Tema Proyek :
Petunjuk :
Berikan centang pada angka dimana kemampuan peserta didik
teramati pada waktu membuat proyek
No Ekspresi 1 2 3 4
1 Fisik (Physical Expression)
* Posisi tubuh saat membuat pola/ gambar
* Posisi tangan saat memegang alat
* Posisi tubuh saat membaca instrument ukur
2 Suara (vocal expression) saat dikusi
* Berbicara dengan kata-kata yang jelas
* Nada suaranya berubah-ubah sesuai dengan
pernyataan yang disajikan
* Berbicara cukup keras untuk didengar oleh peserta
Lain
3 Verbal (Verbal expression)
* Memilih kata yang tepat untuk menegaskan arti
* Menggunakan kalimat yang lengkap untuk
mengutarakan suatu pikiran
* Menyimpulkan pokok-pokok pikiran yang penting

2.3. Penilaian Portofolio


Portofolio merupakan kumpulan atas berkas pilihan yang dapat
memberikan informasi bagi suatu penilaian.
Tujuan portofolio :
a). Menghargai perkembangan yang dialami peserta didik
b). Mendokumentasikan proses pembelajaran yang berlangsung
c). Memberi perhatian pada prestasi kerja peserta didik yang terbaik.
Contoh alat penilaian portofolio : puisi, karangan, gambar/tulisan,
peta/denah,makalah, laporan observasi, sinopsis, naskah pidato, naskah
drama, kartu ucapan, surat, teks lagu, resep masakan, dan sebagainya.
Contoh Tugas Penilaian Portofolio (membuat makalah)
Nama peserta didik : ...............
Tanggal : ...............

I Made Sudana Evaluasi Pembelajaran Page 16


No Aspek yang dinilai Skor (10 – 20)
1 Latar belakang masalah/pendahuluan
2 Kajian pustaka
3 Ketajaman pembahasan/analisis
4 Penyimpulan/penutup
5 Tata tulis dan bahasa
6 Cara membuat simpulan dan pengajuan saran
Skor total (maksimal 100)

2.4. Penilaian Proyek


Yang dimaksud proyek adalah tugas yang harus diselesaikan dalam
periode / waktu tertentu.Tugas tersebut berupa suatu investigasi sejak dari
pengumpulan, pengorganisasian, pengevaluasian, hingga penyajian data.
Hasil belajar dapat dinilai ketika peserta didik sedang melakukan proyek,
misalnya pada saat :
a). Merencanakan dan mengorganisasikan investigasi
b). Bekerja dalam tim
c). Arahan diri
Contoh Tugas Penilain Proyek
Materi : Koperasi Sekolah, cara pengelolaan dan dampaknya bagi sekolah
Perancangan Kegiatan :
* Observasi ke beberapa koperasi sekolah
* Wawancara dengan beberapa ahli dari bidang perkoperasian,
pengelola koperasi, dan anggota koperasi.
* Pembuatan laporan/makalah dari kegiatan observasi. Format dibuat
oleh guru dan dapat juga dikembangkan oleh peserta didik.
* Mengadakan diskusi di dalam kelas yang dimoderatori oleh guru
Tentang makalah yang telah disusun berdasarkan hasil observasi
tersebut.

I Made Sudana Evaluasi Pembelajaran Page 17


Penilaian dilakukan terhadap :
 Keaktifan pada saat kegiatan wawancara
 Makalah yang dibuat
 Aktivitas dalam diskusi

2. 5. Penilaian Hasil Kerja (Product Asessment)


Penilaian hasil kerja peserta didik merupakan penilaian terhadap
keterampilan peserta didik dalam membuat suatu produk benda tertentu dan
kualitas produk tersebut. Terdapat dua tahapan penilaian yaitu : pertama,
penilaian tentang pemilihan dan cara penggunaan alat serta prosedur kerja
peserta didik. Kedua, penilaian tentang kualitas teknik maupun estetika hasil
karya / kerja peserta didik.
Hasil kerja dapat berupa produk kerja peserta didik yang bisa saja
terbuat dari kain, kertas, metal, kayu, plastik, keramik, dan hasil karya seni
seperti lukisan, gambar, dan patung.Hasil kerja yang berupa aransemen
musik, koreografi, karya sastra tidak termasuk hasil kerja yang dimaksud
disini.
Contoh Tugas Penilaian Produk
Tugas : Buatlah rancangan model benda yang menggunakan roda!
Ketentuan:
Gambar rancangan model!
Bahan untuk model tertulis dalam rancangan!
Tentukan spesifikasi bahan untuk model!
Contoh Tabel Penskoran Tugas Penilaian Produk:
No Kriteria Skor
1 Ada gambar rancangan model B C K
2 Bahan tertulis dalam model B C K
3 Spesifikasi bahan tertulis B C K
4 Unsur estetika B C K

I Made Sudana Evaluasi Pembelajaran Page 18


Kriteria penskoran
B = gambar proporsional, bahan tertulis lengkap, spesifikasi bahan jelas
C = gambar kurang proporsinal, bahan tertulis kurang lengkap,
spesifikasi bahan kurang jelas.
K = gambar tidak proporsional, bahan tertulis tidak lengkap, spesifikasi
bahan tidak jelas.

2.6. Penilaian sikap


Penilaian sikap merupakan penilaian terhadap perilaku dan
keyakinan peserta didik terhadap suatu obyek, fenomena/masalah.Secara
umum, penilaian sikap dalam berbagai mata pelajaran dapat dilakukan
berkaitan dengan berbagai obyek sikap sebagai berikut :
a). Sikap terhadap mata pelajaran
b). Sikap guru terhadap mata pelajaran
c). Sikap terhadap proses pembelajaran, dan lain-lain.
Penilaian ini dapat dilakukan dengan beberapa cara, antara lain:
 Observasi perilaku, misalnya tentang kerja sama, inisiatif, perhatian
 Pertanyaan langsung, misalnya tanggapan terhadap tata tertib sekolah
yang baru
 Laporan pribadi, misalnya menulis tentang ―tawuran antar pelajar‖
Contoh Tabel Penilaian Sikap
Pilihan Sikap
No Pernyataan
SS S N TS STS
1 Kegiatan pentas seni drama perlu
diadakan di sekolah
2 Kepala sekolah dan guru hendaknya
ikut aktif dalam apresiasi terhadap
sastra khusunya drama
3 Pementasan drama tidak mendukung
untuk menumbuhkan kreativitas
peserta didik.

I Made Sudana Evaluasi Pembelajaran Page 19


2.7. Penilaian Diri (Self Assessment)
Penilaian diri di tingkat kelas (PDK) atau Classroom Self Assessment
(CSA) adalah penilaian yang dilakukan sendiri oleh guru atau peserta didik
yang bersangkutan untuk kepentingan pengelolaan kegiatan belajar
mengajar (KBM) di tingkat kelas.Penerapan konsep PDK adalah sejalan
dengan penerapan Kurikulum Berbasis Kompetensi (KBK) yang menerapkan
penilaian berbasis kelas atau Classroom Based Assessment.Hasil PDK
merupakan masukan bagi guru di kelas dan bagi pimpinan sekolah untuk
meningkatkan kinerja semua staf dan guru-guru di sekolah di masa datang.

Contoh Penilaian Diri


Format Penilaian Diri Peserta didik dalam Mata Pelajaran Rangkaian Listrik
Nama Peserta didik :………. ……………
Hari : …………………….
1. Terhadap pelajaran Pelajaran Rangkaian Liistrik,
saya ……………………………
2. Tujuan mempelajari atau memahami Rangkaian Listrik adalah ….…
3. Rangkaian Listrik merupakan mata pelajaran yang ……………………
4. Pokok bahasan yang paling saya sukai dar rangkaian Listrik……..…

I Made Sudana Evaluasi Pembelajaran Page 20


BAGIAN 4
PENILAIAN ACUAN

Dalam sistem evaluasi pembelajaran, ada beberapa kriteria yang


digunakan oleh pengajar sebagai dasar atau acuan penilaian untuk
menentukan keberhasilan pencapaian dari pembelajaran, seperti Penilaian
Acuan Norma (PAN).Penilaian Acuan Patokan (PAP) termasuk Kriteria
Ketuntasan Minimum (KKM). Namun sebelum memilih salah satu acuan
dimaksud, maka terlebih dahulu perlu adanya pemahaman yang mendalam dari
para pengguna, agar tidak mengalami kekeliruan dalam penerapannya.

A. Pengertian Penilaian Acuan Norma (PAN)


Ada beberapa pendapat tentang pengertian Penilaian Acuan Norma,
yaitu:

1. Acuan Norma merupakan elemen pilihan yang memberikan daftar


dokumen normatif yang diacu dalam standar sehingga acuan tersebut
tidak terpisahkan dalam penerapan standar. Data dokumen normatif yang
diacu dalam standar yang sangat diperlukan dalam penerapan standar.
2. Pengolahan dan pengubahan skor mentah menjadi nilai dilakukan dengan
mengacu pada norma atau kelompok. Cara ini dikenal sebagai Penilaian
Acuan Norma (PAN).
3. PAN adalah Nilai sekelompok peserta didik dalam suatu proses
pembelajaran didasarkan pada tingkat penguasaan di kelompok itu.
Artinya pemberian nilai mengacu pada perolehan nilai di kelompok itu.
4. Penilaian Acuan Norma (PAN) yaitu dengan cara membandingkan nilai
seorang peserta didik dengan nilai kelompoknya. Jadi dalam hal ini
prestasi seluruh peserta didik dalam kelas / kelompok dipakai sebagai
dasar penilaian.

I Made Sudana Evaluasi Pembelajaran Page 21


Dari beberapa pengertian ini dapat disimpulkan bahwa Penilaian Acuan
Norma (PAN) adalah penilaian yang dilakukan dengan mengacu pada
normakelompok; nilai-nilai yang diperoleh peserta didik diperbandingkan
dengan nilai-nilai peserta didik yang lain yang termasuk di dalam kelompok itu.

B. Penilaian Acuan Norma (PAN)

PAN (Norm ReferencedEvaluation) dikenal pula dengan sebutan


―Standar Relatif‖ atau ―norma kelompok”. Pendekatan ini menafsirkan hasil
tes yang diperoleh peserta didik dibandingkan dengan hasil tes peserta didik
lain dalam kelompoknya. Alat pembanding itu ditentukan berdasarkan skor
yang diperoleh peserta didik dalam satu kelompok.Ini berarti bahwa standar
kelulusan baru dapat ditentukan setelah diperoleh skor peserta didik.Hal ini
mengisyaratkan kepada kita bahwa standar yang dibuat untuk kelompok
tertentu tidak dapat digunakan untuk kelompok lainnya. Begitu pula dengan
standar yang digunakan untuk hasil tes sebelumnya tidak dapat digunakan
untuk hasil tes sekarang atau yang akan datang. Jadi setiap kali kita
memperoleh data hasil tes, kita dituntut untuk membuat norma baru. Jika
dibandingkan anatara norma yang satu dengan yang lainnya mungkin saja
akan ditemukan standar yang sangat berbeda. Jika kelompok tertentu
kebetulan peserta didiknya pintar-pintar, maka norma/standar kelulusannya
akan tinggi. Sebaliknya jika peserta didiknya kurang pintar, maka standar
kelulusannya pun akan rendah. Itulah sebabnya pendekatan ini disebut standar
relatif.
Pendekatan PAN ini mendasarkan pada asumsi distribusi normal,
walaupun kadar kenormalannya tidak selalu sama untuk tiap kelompok.
Dengan demikian, walaupun tiap-tiap kelompok sama-sama menghasilkan
kurva normal, mean kurva yang satu dengan kurva lainnya mungkin saja
berbeda. Sebagai konsekuensinya, seorang peserta didik yang memperoleh
nilai tinggi dalam suatu kelompok mungkin akan memperoleh nilai rendah jika ia
dimasukkan ke dalam kelompok lainnya, demikian pula sebaliknya.

I Made Sudana Evaluasi Pembelajaran Page 22


Dari beberapa pengertian ini dapat disimpulkan bahwa Penilaian Acuan
Norma adalah penilaian yang dilakukan dengan mengacu pada norma
kelmpok; nilai-nilai yang diperoleh peserta didika diperbandingkan dengan nilai-
nilai peserta didika yang lain yang termasuk di dalam kelompok itu.Penilaian
Acuan Norma (PAN) merupakan pendekatan klasik, karena tampilan
pencapaian hasil belajar peserta didik pada suatu tes dibandingkan dengan
penampilan peserta didik lain yang mengikuti tes yang sama. Pengukuran ini
digunakan sebagai metode pengukuran yang menggunakan prinsip belajar
kompetitif. Menurut prinsip pengukuran norma, tes baku pencapaian
diadministrasi dan penampilan baku normative dikalkulasi untuk kelompok-
kelompok pengambil tes yang bervariasi. Skor yang dihasilkan peserta didik
dalam tes yang sama dibandingkan dengan hasil populasi atau hasil
keseluruhan yang telah dibakukan. Guru/Dosen kemudian mengikuti asas yang
sama, mengukur pencapaian hasil belajar peserta didik, dengan tepat
membandingkan terhadap peserta didik lain dalam tes yang sama. Seperti
evaluasi empiris, guru/dosen melakukan pengukuran, mengadministrasi tes,
menghitung skor, merangking skor, dari tes yang tertinggi sampai yang
terendah, menentukan skor rerata menentukan simpang baku dan variannya .

Berikut ini beberapa ciri dari Penilaian Acuan Norma:

1. Penilaian Acuan Norma digunakan untuk menentukan status setiap


peserta didik terhadap kemampuan peserta didik lainnya. Artinya,
Penilaian Acuan Norma digunakan apabila kita ingin mengetahui
kemampuan peserta didik di dalam komunitasnya seperti di kelas,
sekolah, dan lain sebagainya.
2. Penilaian Acuan Norma menggunakan kriteria yang bersifat ―relative‖.
Artinya, selalu berubah-ubah disesuaikan dengan kondisi dan atau
kebutuhan pada waktu tersebut.
3. Nilai hasil dari Penilaian Acuan Normatidak mencerminkan tingkat
kemampuan dan penguasaan peserta didik tentang materi pengajaran

I Made Sudana Evaluasi Pembelajaran Page 23


yang diteskan, tetapi hanya menunjuk kedudukan peserta didik
(peringkatnya) dalam komunitasnya (kelompoknya).
4. Penilaian Acuan Normamemiliki kecendrungan untuk menggunakan
rentangan tingkat penguasaan seseorang terhadap kelompoknya, mulai
dari yang sangat istimewa sampai dengan yang mengalami kesulitan
yang serius.
5. Penilaian Acuan Normamemberikan skor yang menggambarkan
penguasaan kelompok.

C. Penilaian Acuan Patokan (PAP)


Penilaian Acuan Patokan (PAP) biasanya disebut juga criterion
evaluation merupakan pengukuran yang menggunakan acuan yang berbeda.
Dalam pengukuran ini peserta didik dikomparasikan dengan kriteria yang telah
ditentukan terlebih dahulu dalam tujuan instruksional, bukan dengan
penampilan peserta didik yang lain. Keberhasilan dalam prosedur acuan
patokan tegantung pada penguasaaan materi atas kriteria yang telah
dijabarkan dalam item-item pertanyaan guna mendukung tujuan instruksional.
Dengan PAP setiap individu dapat diketahui apa yang telah dan belum
dikuasainya. Bimbingan individual untuk meningkatkan penguasaan peserta
didik terhadap materi pelajaran dapat dirancang, demikian pula untuk
memantapkan apa yang telah dikuasainya dapat dikembangkan. Guru dan
setiap peserta didik mendapat manfaat dari adanya PAP.Melalui PAP
berkembang upaya untuk meningkatkan kualitas pembelajaran dengan
melaksanakan tes awal (pre-test) dan tes akhir (post-test). Perbedaan hasil
tes akhir dengan test awal merupakan petunjuk tentang kualitas proses
pembelajaran.
Pembelajaran yang menuntut pencapaian kompetensi tertentu
sebagaimana diharapkan dan termuat pada kurikulum saat ini, PAP merupakan
cara pandang yang harus diterapkan.PAP juga dapat digunakan untuk
menghindari hal-hal yang tidak diinginkan, misalnya kurang terkontrolnya

I Made Sudana Evaluasi Pembelajaran Page 24


penguasaan materi, terdapat peserta didik yang diuntungkan atau dirugikan,
dan tidak dipenuhinya nilai-nilai kelompok berdistribusi normal.PAP ini
menggunakan prinsip belajar tuntas (mastery learning).

D. Persamaan dan Perbedaan Penilaian Acuan Norma (PAN) dan Penilaian


Acuan Patokan (PAP)
Penilaian Acuan Norma dan Penilaian Acuan Patokan mempunyai
beberapa persamaan sebagai berikut:

1. Penilaian Acuan Norma dan Acuan Patokan memerlukan adanya tujuan


evaluasi spesifik sebagai penentuan fokus item yang diperlukan. Tujuan
tersebut termasuk tujuan intruksional umum dan tujuan intruksional
khusus
2. Kedua pengukuran memerlukan sampel yang relevan, digunakan sebagai
subjek yang hendak dijadikan sasaran evaluasi. Sampel yang diukur
mempresentasikan populasi peserta didik yang hendak menjadi target
akhir pengambilan keputusan.
3. Untuk mandapatkan informasi yang diinginkan tentang peserta didik,
kedua pengukuran sama-sama menerlukan item-item yang disusun dalam
satu tes dengan menggunakan aturan dasar penulisan instrumen.
4. Keduanya mempersyaratkan perumusan secara spesifik perilaku yang
akan diukur.
5. Keduanya menggunakan macam tes yang sama seperti tes subjektif, tes
karangan, tes penampilan atau keterampilan.
6. Keduanya dinilai kualitasnya dari segi validitas dan reliabilitasnya.
7. Keduanya digunakan ke dalam pendidikan walaupun untuk maksud yang
berbeda.
Perbedaan kedua penilaian adalah sebagai berikut:

I Made Sudana Evaluasi Pembelajaran Page 25


1. Penilaian acuan norma biasanya mengukur sejumlah besar perilaku
khusus dengan sedikit butir tes untuk setiap perilaku. Penilaian acuan
patokan biasanya mengukur perilaku khusus dalam jumlah yang terbatas
dengan banyak butir tes untuk setiap perilaku.
2. Penilaian acuan norma menekankan perbedaan di antara peserta tes dari
segi tingkat pencapaian belajar secara relatif. Penilaian acuan patokan
menekankan penjelasan tentang apa perilaku yang dapat dan yang tidak
dapat dilakukan oleh setiap peserta tes.
3. Penilaian Acuan Norma lebih mementingkan butir-butir tes yang
mempunyai tingkat kesulitan sedang dan biasanya membuang tes yang
terlalu mudah dan terlalu sulit. Penilaian Acuan Patokan mementingkan
butir-butir tes yang relevan dengan perilaku yang akan diukur tanpa
perduli dengan tingkat kesulitannya.
4. Penilaian Acuan Norma digunakan terutama untuk survei. Penilaian
Acuan Patokan digunakan terutama untuk penguasaan kompetensi.

E. Pengertian Konversi Nilai (Norma, Absolut dan Kombinasi)


Pada umumnya pengukuran menghasilkan data dalam bentuk angka
mentah yang masih memerlukan pemaknaan. Untuk itu dilakukan proses
konversi agar dapat diinterprestasikan/dimaknai. Jadi konversi adalah kegiatan
mengubah atau mengolah skor mentah menjadi huruf. Jika tidak ada kegiatan
konversi ini, maka nilai tidak bisa dinterpretasikan. Konversi nilai dapat
dilakukan dengan menggunakan ―Mean” dan Standard Deviasi (SD) atau
dikenal juga dengan batas Mean lulusan. Cara yang kedua adalah dengan
Mean Ideal dan SD Ideal atau Remmers.
Untuk cara pertama, langkah pertama yang harus dilakukan adalah
mencari nilai Mean dan SD, kemudian menentukan besarnya SUD (Skala Unit
Deviasi), dan langkah terakhir adalah menentukan batas atas dan batas bawah.
1. Konversi Nilai dalam Bentuk Norma Relatif

I Made Sudana Evaluasi Pembelajaran Page 26


Konversi nilai dalam bentuk norma relatif merupakan bagian dari Penilaian
Acuan Norma (PAN). Penilaian Acuan Norma (PAN) adalah penilaian yang
dilakukan dengan mengacu pada norma kelompok; nilai-nilai yang
diperoleh peserta didika diperbandingkan dengan nilai-nilai peserta didika
yang lain yang termasuk di dalam kelompok itu (Ngalim Purwanto:
2010).Norma dalam hal ini mengacu pada kapasitas atau prestasi
kelompok, dan kelompok disini adalah semua peserta didik yang mengikuti
tes tersebut.
2. Konversi Nilai dalam Bentuk Absolut
Penentuan nilai hasil tes belajar dengan menggunakan Penilaian
Acuan Patokan (PAP), mengandung arti bahwa nilai yang akan diberikan
kepada ―testee‖ itu harus didasarkan pada standar mutlak (standard
absolut) artinya, pemberian nilai kepada testee itu dilaksanakan dengan
jalan membandingkan antara skor mentah hasil tes yang dimiliki oleh
masing-masing individu testee, dengan Skor Maksimum Ideal (SMI) yang
mungkin dapat dicapai oleh peserta didik, kalau saja seluruh soal tes dapat
dijawab dengan betul.
Karena itu maka pada penentuan nilai yang mengacu kepada kriterium atau
patokan ini, tinggi rendahnya atau besar kecilnya nilai yang diberikan
kepada masing-masing individu, mutlak ditentukan oleh besar kecil atau
tinggi rendahnya skor yang dapat capai oleh masing-masing peserta didik
yang bersangkutan. Itulah sebabnya mengapa penentuan nilai dengan
mengacu pada kriterium sering disebut sebagai: penentuan nilai secara
mutlak (absolute), atau penentuan nilai secara individual.
3. Konversi Nilai dalam Bentuk Kombinasi
Dalam menentukan nilai dengan menggunakan konversi nilai
kombinasi berarti kita menggabungkan antara PAP (Penilaian Acuan
Patokan) dan PAN (Penilaian Acuan Norma).
Dalam mengkonversi nilai dengan menggunakan metode kombinasi
antara PAP dan PAN, hal pertama yang kita lakukan adalah

I Made Sudana Evaluasi Pembelajaran Page 27


membandingkan terlebih dahuluantara jumlah peserta didik yang mencapai
nilai A, B, C, D, dan E pada penentuan nilai yang menggunakan standar
mutlak(PAP : Penilaian Acuan Patokan) dengan penentuan nilai yang
menggunakan standar relatif (PAN : Penilaian Acuan Norma).
Dengan mengkombinasikan PAP dan PAN, maka kita akan bisa
melihat lebih jelas kelemahan dan kelebihan dari dua pendekatan tersebut.
Sehingga, hasil penilaian akan lebih sempurna.
4. Contoh Cara Mengkonversi Nilai Norma Kelompok
Definisi Konversi
Konversi adalah adalah kegiatan mengubah atau mengolah skor
mentah menjadi huruf. Jika tidak ada kegiatan konversi ini, maka nilai tidak
bisa dinterpretasikan. Konversi nilai dapat dilakukan dengan menggunakan
Meaan dan SD atau dikenal juga dengan batas lulus Mean (Mean = SD).
Cara yang kedua adalah dengan Mean Ideal dan SD Ideal atau Remmers.
Untuk cara pertama, langkah pertama yang harus dilakukan adalah
mencari nilai Mean dan SD, kemudian menentukan besarnya SUD (Skala
Unit Deviasi), dan langkah terakhir adalah menentukan batas atas dan batas
bawah. Untuk menentukan batas atas dan batas bawah tersebut, rumusnya
adalah sebagai berikut:
Batas bawah C = M – 0,5 SUD
Batas bawah D = M – 1,5 SUD
Batas atas C = M + 0,5 SUD
Batas atas B = M + 1,5 SUD

Skala sikap yang diberi bobot nilai 0 – 4 atau 1 – 5 sesuai dengan


alternatif respon pada dasarnya merupakan skala yang bernilai Ordinal atau
pemeringkatan sebab responden diminta merespon/menjawab sesuai dengan
kecenderungan sikapnya untuk kemudian diberi kode/nilai peringkat oleh
peneliti, namun demikian terdapat para Pakar yang menganggapnya sebagai
Skala Interval sehingga memungkinkan pengolahan datanya dengan analisis
Statistik Parametrik. Terlepas dari kontroversi tersebut, mereka yang
I Made Sudana Evaluasi Pembelajaran Page 28
berpendapat bahwa skala sikap bernilai ordinal mengajukan suatu cara untuk
mengkonversi nilai skala tersebut menjadi bernilai Interval dengan
menempatkan masing-masing nilai skala dalam kelompoknya pada suatu
distribusi norma, sehingga jarak nilai menjadi sama. Dengan cara ini penentuan
nilai skala dilakukan dengan memberi bobot dalam satuan deviasi normal bagi
setiap kategori respon pada suatu kontinum psikologis.
Tentu pernah melaksanakan penilaian hasil belajar.Dalam KTSP ada
berbagai macam teknik penilaian antara tes, observasi, penugasan,
interventori, portofolio, jurnal, penilaian diri, penilaian antar teman dan lain-lain.
Jadi penilaian itu bukan melalui siswa menjawab soal saja, tapi banyak jenis
bentuk lain dari penilaian hasil belajar peserta didik. Kombinasi penggunaan
berbagai teknik penilaian di atas akan memberikan informasi yang lebih akurat
tentang kemajuan belajar peserta didik.
Salah satu teknik penilaian yang sering (bahkan selalu ini saja) adalah
dalam bentuk tes.Tes adalah pemberian sejumlah pertanyaan yang
jawabannya dapat benar atau salah.Tes dapat berupa tes tertulis, tes lisan, dan
tes praktik atau tes kinerja.Tes tertulis adalah tes yang menuntut peserta tes
memberi jawaban secara tertulis berupa pilihan dan/atau isian.Tes yang
jawabannya berupa pilihan meliputi pilihan ganda, benar-salah, dan
menjodohkan.Sedangkan tes yang jawabannya berupa isian dapat berbentuk
isian singkat dan/atau uraian.Tes lisan adalah tes yang dilaksanakan melalui
komunikasi langsung (tatap muka) antara peserta didik dengan pengajar.
Pertanyaan dan jawaban diberikan secara lisan.Tes praktik (kinerja) adalah tes
yang meminta peserta didik melakukan perbuatan/ mendemonstasikan/
menampilkan keterampilan.
Dalam rancangan penilaian, tes dilakukan secara berkesinambungan
melalui berbagai macam ulangan dan ujian.Ulangan meliputi ulangan harian,
ulangan tengah semester, ulangan akhir semester, dan ulangan kenaikan
kelas. Sedangkan ujian terdiri atas ujian nasional dan ujian sekolah. Ulangan
adalah proses yang dilakukan untuk mengukur pencapaian kompetensi peserta

I Made Sudana Evaluasi Pembelajaran Page 29


didik secara berkelanjutan dalam proses pembelajaran, untuk melakukan
perbaikan pembelajaran, memantau kemajuan dan menentukan keberhasilan
belajar peserta didik. Ujian adalah kegiatan yang dilakukan untuk mengukur
pencapaian kompetensi peserta didik sebagai pengakuan prestasi belajar
dan/atau penyelesaian dari suatu satuan pendidikan. Dari Undang-Undang
Nomor 20 tahun 2003 tentang Sistem Pendidikan Nasional dan Peraturan
Pemerintah Nomor 19 tahun 2005 tentang Standar Nasional Pendidikan.
Setelah melaksakana ulangan atau ujian pernah tidak menemukan nilai peserta
didik kita sangat rendah atau dibawah nilai Kriteria Ketuntasan Minimal.Jika
dalam bentuk ulangan harian dan ulangan tengah semester kita bisa
melaksakan program perbaikan yg disebut dengan remedial, tapi jika ulangan
semester atau ujian sekolah kapan lagi melaksanakan program perbaikannya.
Salah satu cara mengatasinya bisa dengan sistem konversi nilai.

Berikut caranya :
Misalkan ada 50 soal pilihan ganda, kita koreksi dulu hasil ulangan
peserta didik hingga mendapatkan skor mentah. Skor yang di dapat adalah
jumlah soal yang dijawab benar oleh peserta didik dari 50 soal yang diberikan.
Lalu kita mendapatkan skor tertinggi dan skor terendah, misalnya:
Skor tertinggi = 30
Skor terendah = 10
Lalu kita menentukan berapa nilai tertinggi
dan terendah yang inginkan,misalnya
Skor tertinggi = 30 dapat nilai 8
Skor terendah = 10 dapat nilai 6
Rumus yang kita pakai adalah Y = ax + b
Terlebih dahulu kita menentukan nilai
a, dengan cara : Niali Tertinggi 8 = 30a + b (30
adalah skor tertinggi) Nilai Terendah 6 = 10a + b –
(10 adalah skor terendah) 2 = 20a
a = 2/20
I Made Sudana Evaluasi Pembelajaran Page 30
a = 1/10
atau 0,1
Sekarang kita menentukan b, dengan cara :

8 = 1/10 x 30 + b ( 1/10 atau 0,1 adalah a sedang 30 adalah skor


tertinggi)8 = 3 + b
b=8–3
b=5

Sekarang kita tinggal memasukkan ke dalam rumus Y= ax + b


sekarang kita buktikan untuk menentukan nilai konversi
Y = 0,1 x 30 + 5
Y=3+5
Y=8

Artinya siswa dengan skor 30 mendapat nilai konversi 8, bagaimana dengan


yang terendah berikut perhitungannya
Y= (0,1 x 10) + 5
Y=1+5
Y= 6.

Bagaimana dengan yang lain,misalkan skornya 20,dengan rumus Y = ax + b


Y = (0,1 x 20) + 5
Y=2+5
Y=7

Dari contoh di atas, nampak dengan jelas bagaimana pengajar dapat


menentukan hasil studi yang diperoleh oleh seorang peserta didik. Dengan
demikian, mengacu pada kriteria yang telah ditetapkan, maka akan dapat
dieksekusi, apakah seorang peserta didik dinyatakan tntas atau tidaknya, untuk
selanjutnya diambil tindakan berikutnya.
Dapat dipertegas, bahwa konversi adalah pengubahan atau

I Made Sudana Evaluasi Pembelajaran Page 31


pengolahan skor mentah hasil tes belajar menjadi nilai standar. Skor adalah
hasil pekerjaan memberikan angka yang diperoleh dengan jalan menjumlahkan
angka-angka bagi setiap butir item yang oleh testee telah dijawab dengan betul,
dengan memperhitungkan bobot jawaban betulnya.Nilai pada dasarnya adalah
angka atau huruf yang melambangkan seberapa jauh atau seberapa besar
kemampuan yang telah ditunjukkan oleh testee terhadap materi atau bahan
yang diteskan, sesuai dengan tujuan instruksional khusus yang telah
ditentukan.

I Made Sudana Evaluasi Pembelajaran Page 32


BAGIAN 4
PENGEMBANGAN TES

Pengantar
Banyak pengajarmelaksanakan suatukegiatan tanpa perencanaan yang
jelas, sehingga hasilnyapun kurang maksimal.Oleh sebab itu, Anda harus dapat
membuat perencanaan dengan baik, tidakterkecuali dalam kegiatan evaluasi,
dalam hal ini difokuskan pada perencanaan danpelaksanaan evaluasi
pembelajaran.Untuk itu diperlukan pemahaman yang lebih mendalam tentang
mekanisme di dalam mengembangan sebuah instrument tes.

1. Perencanaan Evaluasi
Membuat perencanaanadalah pertama yang harus dilakukan dalam
kegiatan evaluasi.Hal ini penting karena akan mempengaruhilangkah-langkah
selanjutnya, dan keefektifan prosedurevaluasi secara menyeluruh. W. James
Popham (1974 : 159) mengemukakanmaksud perencanaan evaluasi adalah ‖to
facilitate gathering data, therebymaking possible valid statements about the
effect or out comes of the program,practice, or policy under study”.
Robert H.Davis, dkk. (1974 : 81-82) mengemukakantiga manfaat dari
perencanaan evaluasi, yaitu :
a. Evaluation plan helps you to determine whether or not you have stated your
objective in behavioral terms. If the conditions, behavior or standards or
objective have been stated ambiguosly, you will have difficulty designing a test
to measure student achievement.
b. Evaluation plan early in the design process is that you will be prepared to
collect the information you need when it is available.
c. Evaluation plan is that it provides sufficient time for test design. To design a
good test requires careful preparation, and the quality of a test usually improves
if it can be designed in a leisurely fashion.

I Made Sudana Evaluasi Pembelajaran Page 33


Implikasinya adalah perencanaan evaluasi harus dirumuskan secara
jelas danspesifik, terurai dan komprehensif, sehingga perencanaan tersebut
bermaknadalam menentukan langkah-langkah selanjutnya. Berdasarkan
perencanaanevaluasi yang matang maka dapat ditetapkan tujuan-tujuan
tingkah laku(behavioral objective) atau indikator yang akan dicapai,
persiapanpengumpulan data dan informasi yang dibutuhkan dalam waktu yang
tepat.Norman E.Gronlund (1985) tentang langkah-langkah yangharus ditempuh
dalam perencanaan suatu tes sebagai berikut :
1. Menentukan tujuan tes (detrermine the purpose of the test).
2. Mengidentifikasi hasil belajar yang akan diukur melalui tes (identify the
learning outcomes to be measured by the test).
3. Merumuskan hasil belajar dalam bentuk perilaku yang spesifik dan
dapatdiamati (define the learning outcomes in the terms of specific,
observablebehavior).
4. Menyusun garis besar materi pelajaran yang akan diukur melalui tes
(out line the subject matter to be measurred by the test).
5. Menyiapkan suatu tabel yang spesifik atau kisi-kisi (prepare
specification a of table ).
6. Menggunakan tabel spesifik sebagai dasar untuk persiapan tes (use
the tableof specification as basis for preparing test).
Berdasarkan uraian di atas, maka dalam perencanaan evaluasi, ada
beberapahal yang harus Anda perhatikan, seperti : tujuan, kisi-kisi, menulis
soal, uji-cobadan analisis soal, revisi dan merakit soal.

2. Menyusun Kisi-kisi Soal

Penyusunan kisi-kisi dimaksudkan agar materi evaluasi betul-


betulrepresentatif dan relevan dengan materi pelajaran yang sudah diberikan
oleh pengajar kepada peserta didik.Untuk melihat apakah materievaluasi
relevan dengan materi pelajaran atau apakah materi evaluasi terlalubanyak
atau kurang, maka harus disusun kisi-kisi (lay-out atau blue-printatau table of

I Made Sudana Evaluasi Pembelajaran Page 34


specifications).Kisi-kisi adalah format pemetaan soal yang menggambarkan
distribusi itemuntuk berbagai topik atau pokok bahasan berdasarkan jenjang
kemampuantertentu.Fungsi kisi-kisi adalah sebagai pedoman untuk menulis
soal ataumerakit soal menjadi perangkat tes.Kisi-kisi yang baik
akanmenghasilkan perangkat soal yang relatif sama sekalipunpenulis
soalnya berbeda. Dalam konteks penilaian hasil belajar, kisi-kisidisusun
berdasarkan silabus setiap mata pelajaran.Jadi, harusdilakukan analisis
silabus terlebih dahulu.
Dalam praktiknya, seringkali guru membuat soal langsungdari buku
sumber.Hal ini jelas sangat keliru, karena buku sumber belumtentu sesuai
dengan silabus.Kisi-kisi ini menjadi penting dalam perencanaanevaluasi,
karena didalamnya terdapat sejumlah indikator sebagai acuandalam
menulis soal. Kisi-kisi soal yang baik harus memenuhi persyaratantertentu,
antara lain :
a. Representatif, yaitu harus mewakili isi kurikulum yang akan dievaluasi.
b. Komponen-komponennya harus terurai/rinci, jelas, dan mudah dipahami.
Namun demikian, sekedaruntuk memperoleh gambaran, format kisi-
kisi dapat dibagi menjadi dua komponen pokok, yaitu komponen identitas
dan komponen matriks. Komponen identitas ditulis di bagian atas matriks,
sedangkan komponen matriks dibuatdalam bentuk kolom yang
sesuai.Komponen identitas meliputi jenis/jenjang pendidikan,
jurusan/program studi (bila ada), bidang studi/mata pelajaran,tahun ajaran
dan semester, kurikulum acuan, alokasi waktu, jumlah soalkeseluruhan,
dan bentuk soal.Sedangkan komponen matriks terdiri ataskompetensi
dasar, materi, jumlah soal, jenjang kemampuan, indikator, dannomor urut
soal.

I Made Sudana Evaluasi Pembelajaran Page 35


Contoh :
KISI-KISI SOAL UJIAN SMESTER
Nama Lembaga :
Mata Kuliah :
Jurusan/Prodi :
Semester :
Hari/Tanggal :
Alokasi Waktu :
Jumlah Soal :
Standar Kompetensi :
Jenjang Bentuk Nomor
NO KD Materi Indikator
Kemampuan Soal Soal
1
2
3
dst
Catatan:

Apabila bentuk soal yang akan digunakan lebih dari satu, sebaiknya
dimasukkan ke dalam komponen matriks.

Salah satu unsur penting dalam komponen matriks adalah


indikator.Indikator adalah rumusan pernyataan sebagai bentuk ukuran
spesifik yangmenunjukkan ketercapaian kompetensi dasar dengan
menggunakan katakerja operasional (KKO).

Perhatikan indikator dalam contoh matriks berikut ini :


Mata Kuliah : Matematika Semester : II

Standar Kompetensi Kompetensi Dasar Indikator


Menggunakanpengukuran Menggunakan alatukur • Menyebutkan macam-
waktu,panjang, dan berat tidak bakudan baku yang macam alat ukur panjang
dalam pemecahanmasalah sering digunakan. tidak baku dalam kehidupan
sehari-hari (jengkal, depa,
langkah kaki, dll.)
• Menggunakan alat ukur
tidak baku.
• Menyebutkan alat ukur
I Made Sudana Evaluasi Pembelajaran Page 36
baku yang biasa digunakan
dalam kehidupan sehari-
hari.
Menggunakan alat ukurbaku.
• Menarik kesimpulan bahwa
pengukuran dengan alat
ukur tidak baku hasilnya
berbeda.Dalam praktiknya,
penggunaan kata kerja
operasion

3. Menulis Soal

Penulisan soal merupakan salah satu langkah penting untuk dapat


menghasilkan alat ukur atau tes yang baik.Penulisan soal adalah penjabaran
indikator menjadi pertanyaan-pertanyaan yang karakteristiknya sesuai
dengan pedoman kisi-kisi.Setiap pertanyaan harus jelas dan terfokus serta
menggunakan bahasa yang efektif, baik bentuk pertanyaan maupun bentuk
jawabannya. Kualitas butir soal akan menentukan kualitas tes secara
keseluruhan. Setelah semua soal ditulis, sebaiknya soal tersebut dibaca lagi,
jika perlu didiskusikan kembali dengan tim penelaah soal, baik dari ahli
bahasa, ahli bidang studi, termasuk ahli evaluasi.

4. Uji Coba dan Analisis Soal

Jika semua soal sudah disusun dengan baik, maka perlu


diujicobakan terlebih dahulu dilapangan. Tujuannya untuk melihat soal-soal
mana yang perlu diubah, diperbaiki, bahkan dibuang sama sekali, serta soal-
soal mana yang baik untuk dipergunakan selanjutnya. Soal yang baik adalah
soal yang sudah mengalami beberapa kali uji-coba dan revisi, yang
didasarkan atas analisis empiris dan rasional.Analisis empiris dimaksudkan
untuk mengetahui kelemahan-kelemahan setiap soal yang digunakan.
Informasi empirik pada umumnya menyangkut segala hal yang dapat
mempengaruhi validitas soal, seperti aspek-aspek keterbacaan soal, tingkat
kesukaran soal, bentuk jawaban, daya pembeda soal, pengaruh kultur, dan
sebagainya. Sedangkan analisis rasional dimaksudkan untuk memperbaiki

I Made Sudana Evaluasi Pembelajaran Page 37


kelemahan-kelemahan setiap soal.
Dalam melaksanakan uji-coba soal, ada
beberapa hal yang harus Anda perhatikan, antar lain : (a) ruangan
tempatnya tes hendaknya diusahakan seterang mungkin, jika perlu dibuat
papan pengumuman diluar agar orang lain tahu bahwa ada tes yang sedang
berlangsung, (b) perlu disusun tata tertib pelaksanaan tes, baik yang
berkenaan dengan peserta didik itu sendiri, guru, pengawas, maupun teknis
pelaksanaan tes, (c) para pengawas tes harus mengontrol pelaksanaan tes
dengan ketat, tetapi tidak mengganggu suasana tes. Peserta didik yang
melanggar tata tertib tes dapat dikeluarkan dari ruang tes, (d) waktu yang
digunakan harus sesuai dengan banyaknya soal yang diberikan, sehingga
peserta didik dapat bekerja dengan baik, (e) peserta didik harus benar-benar
patuh mengerjakan semua petunjuk dan perintah dari penguji. Sikap ini
harus tetap dipelihara meskipun diberikan kesempatan kepada peserta didik
untuk mengajukan pertanyaan bila ada soal yang tidak dimengerti atau
kurang jelas.Tanggung jawab penguji dalam hal ini adalah memberikan
petunjuk dengan sikap yang bersifat lugas, jujur, adil dan jelas.Namun
demikian, antara penguji dan peserta didik hendaknya dapat menciptakan
suasana yang kondusif, dan (f) hasil uji coba hendaknya diolah, dianalisis,
dan diadministrasikan dengan baik, sehingga dapat diketahui soal-soal mana
yang lemah untuk selanjutnya dapat diperbaiki kembali.

5. Revisi dan Merakit Soal

Setelah soal diuji-coba dan dianalisis, kemudian direvisi sesuai


dengan proporsi tingkat kesukaran soal dan daya pembeda.Dengan
demikian, ada soal yang masih dapat diperbaiki dari segi bahasa, ada juga
soal yang harus direvisi total, baik yang menyangkut pokok soal (stem)
maupun alternatif jawaban (option), bahkan ada soal yang harus dibuang
atau disisihkan.Berdasarkan hasil revisi soal ini, barulah Anda merakit soal
menjadi suatu alat ukur yang terpadu.Semua hal yang dapat mempengaruhi

I Made Sudana Evaluasi Pembelajaran Page 38


validitas skor tes, seperti nomor urut soal, pengelompokkan bentuk soal,
penataan soal, dan sebagainya haruslah diperhatikan.

I Made Sudana Evaluasi Pembelajaran Page 39


BAGIAN 4
UJI KUALITAS INSTRUMEN

Ada tiga syarat utama yang harus dipenuhi oleh sebuah instrumen tes yaitu
validitas, reabilitas dan karakteristik tes

A. Validitas

Sebuah alat pengukur dapat dikatakan valid apabila alat pengukur


tersebut dapat mengukur apa yang hendak diukur secara tepat. Suatu tes
dikatakan memiliki validitas yang tinggiapabila tes itu tersebut betul-betul
dapat mengukur hasil belajar.Ada dua unsur penting dalam validitas
ini.Pertama, validitas menunjukkan suatu derajat, ada yang sempurna, ada
yang sedang, dan ada pula yang rendah.Kedua, validitas selalu dihubungkan
dengan suatu putusan atau tujuan yang spesifik.Menurut Thorndike dan
Hagen (1977: 56) bahwa “validity is always in relation to a specific decision
or use”. Gronlund (1985 : 79-81) mengatakan ada tiga faktor yang
mempengaruhi validitas hasil tes, yaitu ―faktor instrumen evaluasi, faktor
administrasi evaluasi dan penskoran, dan faktor dari jawaban peserta didik‖.

1. Faktor instrumen evaluasi

Untuk mengembangkan instrumen evaluasi, seorang evaluator


harus memperhatikan hal-hal yang mempengaruhi validitas instrumen dan
berkaitan dengan prosedur penyusunan instrumen, seperti silabus, kisi-
kisi soal, petunjuk mengerjakan soal dan pengisian lembar jawaban, kunci
jawaban, penggunaan kalimat efektif, bentuk alternatif jawaban, tingkat
kesukaran, daya pembeda, dan sebagainya.

2. Faktor administrasi evaluasi dan penskoran

Dalam administrasi evaluasi dan penskoran, banyak sekali terjadi


penyimpangan atau kekeliruan, seperti : alokasi waktu untuk pengerjaan
soal yang tidak proporsional, memberikan bantuan kepada peserta didik
dengan berbagai cara, peserta didik saling menyontek ketika ujian,

I Made Sudana Evaluasi Pembelajaran Page 40


kesalahan penskoran, termasuk kondisi fisik dan psikis peserta didik yang
kurang menguntungkan.

3. Faktor jawaban dari peserta didik

Dalam praktiknya, faktor jawaban peserta didik justru lebih banyak


berpengaruh daripada dua faktor sebelumnya. Faktor ini meliputi
kecenderungan peserta didik untuk menjawab secara cepat tetapi tidak
tepat, keinginan melakukan coba-coba, dan penggunaan gaya bahasa
tertentu dalam menjawab soal bentuk uraian.

Selanjutnya, Kerlinger (1986) mengemukakan ―validitas instrumen


tidak cukup ditentukan oleh derajat ketepatan instrumen untuk mengukur apa
yang seharusnya diukur, tetapi perlu juga dilihat dari tiga kriteria yang lain,
yaitu appropriatness, meaningfullness, dan usefullness‖. Appropriatness
menunjukkan kelayakan dari tes sebagai suatu instrumen, yaitu seberapa
jauh instrumen dapat menjangkau keragaman aspek perilaku peserta
didik.Meaningfullness menunjukkan kemampuan instrumen dalam
memberikan keseimbangan soal-soal pengukurannya berdasar tingkat
kepentingan dari setiap fenomena.Usefullness to inferences menunjukkan
sensitif tidaknya instrumen dalam menangkap fenomena perilaku dan tingkat
ketelitian yang dit Sebuah alat pengukur dapat dikatakan valid apabila alat
pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat.
Demikian pula dalam alat-alat evaluasi.Suatu tes dapat dikatakan memiliki
validitas yang tinggiapabila tes itu tersebut betul-betul dapat mengukur hasil
belajar. Jadi bukan sekedar mengukur daya ingatan atau kemampuan
bahasa saja misalnya.unjukkan dalam membuat kesimpulan.
Dalam literatur modern tentang evaluasi, banyak
dikemukakan tentang jenis-jenis validitas, antara lain : validitas permukaan
(face validity), validitas isi (content validity), validitas empiris (empirical
validity), dan validitas konstruk (construct validity), dan validitas faktor
(factorial validity).

I Made Sudana Evaluasi Pembelajaran Page 41


1. Validitas permukaan

Validitas ini menggunakan kriteria yang sangat sederhana, karena hanya


melihat dari sisi muka atau tampang dari instrumen itu sendiri. Artinya, jika
suatu tes secara sepintas telah dianggap baik untuk mengungkap
fenomena yang akan diukur, maka tes tersebut sudah dapat dikatakan
memenuhi syarat validitas permukaan, sehingga tidak perlu lagi adanya
judgement yang mendalam.

2. Validitas isi

Validitas isi sering digunakan dalam pengukuran hasil belajar. Tujuan


utamanya adalah untuk mengetahui hinggamana peserta didik menguasai
rnateri pelajaran yang telah disampaikan, dan perubahan-perubahan
psikologis apa yang timbul pada diri peserta didik tersebut setelah
mengalami proses pembelajaran tertentu. Jika dilihat dari segi
kegunaannya dalam penilaian hasil belajar, validitas isi ini sering disebut
juga validitas kurikuler dan validitas perumusan.

Validitas kurikuler berkenaan dengan pertanyaan apakah materi tes


relevan dengan kurikulum yang sudah ditentukan.Diharapkan dengan
validitas kurikuler ini timbul ketelitian yang jelas dan totalitas dengan
menjelajahi semua aspek yang tercakup dalam kisi-kisi dan Rencana
Pelaksanaan Pembelajaran (RPP) yang bersangkutan. Validitas kurikuler
dapat dilakukan dengan beberapa cara, antara lain mencocokkan materi
tes dengan silabus dan kisi-kisi, melakukan diskusi dengan sesama
pendidik, atau mencermati kembali substansi dari konsep yang akan
diukur.

Validitas perumusan berkenaan dengan pertanyaan apakah


aspek-aspek dalam soal-soal itu betul-betul tercakup dalam perumusan
tentang apa yang hendak diukur. Di samping itu, validitas isi dapat juga
disebut validitas rasional atau validitas logis. Sebagaimana dikemukakan
I Made Sudana Evaluasi Pembelajaran Page 42
oleh Thorndike dan Hagen (1977: 58) bahwa “scientific analysis is
essentially a rational and judgmental one, this is sometimes spoken of as
rational or logical validity”. Pernyataan ini memang ada benarnya, karena
pengujian validitas harus dilakukan secara rasional dan logis, sehingga
suatu tes hasil belajar dapat memiliki validitas yang sempurna.

3. Validitas empiris

Validitas ini biasanya menggunakan teknik statistik, yaitu analisis


korelasi.Validitas empiris disebut juga validitas yang dihubungkan dengan
kriteria (criterion-related validity) atau validitas statistik (statistical validity).
Ada tiga macam validitas empiris, yaitu:

a. Validitas prediktif (predictive validity)

b. Validitas kongkuren (concurrent validity)

c. Validitas sejenis (congruent validity)

Validitas prediktif ialah jika kriteria standar yang digunakan adalah untuk
meramalkan prestasi belajar murid di masa yang akan datang. Dengan
kata lain, validitas prediktif bermaksud melihat sampai dimana suatu tes
dapat memprakirakan perilaku peserta didik pada masa yang akan
datang. Sedangkan validitas konkuren ialah jika kriteria standarnya
berlainan.Misalnya, skor tes dalam matapelajaran Matematika
dikorelasikan dengan skor tes Fisika.Sebaliknya, jika kriteria standarnya
sejenis, maka validitas tersebut disebut validitas sejenis.Dalam mengukur
validitas suatu tes hendaknya yang menjadi kriteria sudah betul-betul
valid, sehingga dapat diandalkan keampuhannya dan dapat dianggap
sebagai tes standar. Sebaliknya, bila kriterianya tidak valid, maka tes-tes
lain yang akan divalidasi menjadi kurang atau tidak meyakinkan. Suatu tes
akan mempunyai koefisien validitas yang tinggi jika tes itu betul-betul
dapat mengukur apa yang hendak diukur dari peserta didik tertentu.

Ada beberapa hal yang harus diperhatikan dalam menginterpre-


tasikan koefisien validitas, antara lain data mengenai karakteritik sampel
I Made Sudana Evaluasi Pembelajaran Page 43
validitas, prosedur-prosedur dalam pengukuran validitas, dan pola kriteria
khusus yang dikorelasikan dengan hasil tes itu. Sehubungan dengan
kriteria khusus, Anastasi dalam Conny Semiawan Stamboel (1986 : 50),
mengemukakan ada delapan kriteria sebagai bahan bandingan untuk
merumuskan apa yang hendak diselidiki oleh suatu tes, yaitu ―diferensiasi
umur, kemajuan akademis, kriteria dalam pelaksanaan latihan khusus,
kriteria dalam pelaksanaan kerja, penilaian, kelompok yang
dipertentangkan, korelasi dengan tes lain, dan konsistensi internal‖.

a. Diferensiasi umur

Kriteria yang paling utama dalam validitas tes intelegensi adalah


umur.Kebanyakan tes intelegensi, baik yang dipakai di madrasah
maupun tes pra-madrasah, senantiasa dibandingkan dengan umur
kronologis untuk menentukan apakah angka bertambah dengan
bertambahnya umur. Jika suatu tes dianggap valid, maka nilai tes bagi
peserta didik akan naik dengan bertambahnya umur. Namun, anggapan
ini tidak berlaku bagi perkembangan semua fungsi dalam hubungannya
dengan bertambahnya umur secara konsisten (ini terbukti dari
beberapa tes kepribadian).Suatu hal yang juga perlu dicermati adalah
corak kondisi lingkungan tempat tes itu dibakukan.Kriteria peningkatan
umur tidak bersifat universal tetapi tidak dapat juga dikatakan bahwa ini
berlaku bagi corak masing-masing kebudayaan.

b. Kemajuan akademis

Pada umumnya tes intelegensi divalidkan dengan kemajuan


akademis.Juga sering dikatakan bahwa makin lama seseorang belajar
di madrasah, makin tinggi pendidikannya, makin tinggi pula kemajuan
akademisnya.Bagi peserta didik yang tak sanggup meneruskan, biasa-
nya termasuk dropout.Namun demikian, banyak pula faktor non-
intelektual yang ikut mempengaruhi keberhasilan pendidikan seorang
peserta didik. Dengan kata lain, berhasil tidaknya pendidikan seseorang

I Made Sudana Evaluasi Pembelajaran Page 44


tidak hanya dilihat dari faktor intelektual tetapi juga faktor non-
intelektual. Untuk memperoleh gambaran yang komprehensif dan
holistik tentang hal ini perlu diadakan penyelidikan yang lebih jauh.318 |
E valuasi Pembelajaran Modul 8

I Made Sudana Evaluasi Pembelajaran Page 45


c. Kriteria dalam pelaksanaan latihan khusus

Corak kriteria dalam pengembangan tes bakat khusus didasarkan atas


prestasi dalam latihan tertentu secara khusus.Beberapa tes bakat
profesi (profesional aptitude test) telah divalidkan dengan tes hasil
belajar dalam bidang-bidang tersebut.Ada beberapa tes untuk
memasuki profesi tertentu yang disebut tailor-made test, yaitu tes yang
telah dibuat khusus untuk keperluan tersebut, seperti tes penerbangan.

d. Kriteria dalam pelaksanaan kerja

Dalam validitas tes kepribadian dan validitas tes bakat khusus banyak
digunakan kriteria yang didasarkan atas kinerja dalam pelaksanaan
kerja (on the job performance).Mengingat masing-masing pekerjaan
memiliki kekhasan sendiri dan berbeda-beda tingkat, bentuk, maupun
coraknya, maka untuk masing-masing pekerjaan diciptakan tes yang
terkenal dengan istilah tailor-made test.

e. Penilaian

Pengertian penilaian disini adalah teknik untuk memperoleh informasi


tentang kemajuan belajar peserta didik di madrasah.Selain itu, juga
mencakup pekerjaan yang memerlukan latihan khusus ataupun sukses
dalam penilaian pribadi oleh seorang pengamat terhadap berbagai
fungsi psikologis.Misalnya, kondisi-kondisi, orijinalitas, kepemimpinan,
atau kejujuran.Jika kondisi-kondisi pengenalan dalam situasi tempat
kemampuan yang khusus itu dinyatakan, maka perlu disertai skala
penilaian yang dipersiapkan secara teliti.

f. Kelompok yang dipertentangkan

Konsep validitas melalui kelompok yang dipertentangkan menyelidiki


pengaruh kehidupan sehari-hari yang tak disengaja. Kriteria ini
didasarkan atas kelebihan suatu kelompok tertentu dihadapkan kepada
kelompok yang lain dalam mejalankan suatu tes tertentu. Misalnya,
suatu tes bakat musik dicobakan dalam suatu sekolah musik maupun
I Made Sudana Evaluasi Pembelajaran Page 46
dalam suatu madrasah.Kriteria itu didasarkan atas faktor yang
menyolok, yang diperoleh dari hasil nilai kedua kelompok tersebut
dalam menjalankan tes itu.

g. Korelasi dengan tes lain

Korelasi antara tes baru dengan tes lama merupakan perbandingan


kriteria dalam menyelidiki perilaku yang sama. Dalam hal ini suatu tes
verbal tertulis bisa dibandingkan dengan tes individual atau tes
kelompok. Untuk mengukur apakah suatu tes yang baru memiliki
validitas dan bebas dari pengaruh faktor lain, maka dipergunakan tes
jenis lain dalam membandingkannya. Jadi, kadang-kadang tes
kepribadian dikorelasikan dengan tes internal atau tes hasil belajar.

h. Konsistensi internal

Kriteria konsistensi internal adalah skor total yang diperoleh peserta


didik dalam suatu tes. Kriteria ini terutama digunakan dalam bidang tes
kepribadian.Kadang-kadang untuk keperluan ini juga digunakan
percobaan tes dengan dua kelompok, yaitu antara kelompok berhasil
dan kelompok kurang berhasil.Skor setiap soal tes dari kelompok yang
berhasil dibandingkan dengan skor setiap soal tes dari kelompok yang
kurang berhasil.Soal-soal yang gagal menunjukkan perbedaan antara
kelompok yang berhasil dengan kelompok yang kurang berhasil harus
diperbaiki, atau dibuang.Kriteria konsistensi internal ini menghasilkan
indeks homoginitas soal, tetapi tidak dapat dianggap sepenuhnya
sebagai pengganti validitas.

Untuk menguji validitas empiris dapat dihitung dengan korelasi


product-moment, korelasi perbedaan peringkat, dan diagram pencar.

a. Korelasi product-moment dengan angka simpangan

I Made Sudana Evaluasi Pembelajaran Page 47


Rumus

=

Keterangan : r = koefisien korelasi

Σxy = jumlah produk x dan y

Contoh :

10 orang mahasiswa mendapat nilai dalam mata dasar Digital dan


Mikroprosesorseperti berikut :

Nilai 10 Orang Mahasiswa dalam Mata Kuliah Teknik Digital dan

Mikroprosesor

No Nama Digital Mikroprosesor


.
1. A. 5 6
2. B. 7 8
3. C. 8 7
4. D. 5 5
5. E. 6 7
6. F. 7 7
7. G. 4 5
8. H. 5 7
9. I. 8 8
10. J. 6 6

Langkah-langkah penyelesaian :
1) Buat tabel persiapan seperti berikut :
No. X Y x Y x2 y2 xy
1
2
3
4
5
dst

I Made Sudana Evaluasi Pembelajaran Page 48


2) Masukkan nilai masing-masing mata pelajaran, dimana nilai Teknik

Digital sebagai variabel X dan nilai Mikroprosesor sebagai variabel Y.

3) Jumlahkan semua nilai yang ada dalam variabel X dan variabel Y,


kemudian hitung rata-rata X dan rata-rata Y.

4) Cari nilai pada kolom x dengan jalan nilai tiap-tiap peserta didik dalam
kolom X dikurangi dengan rata-rata X.

5) Cari nilai pada kolom y dengan jalan nilai tiap-tiap peserta didik dalam
kolom Y dikurangi dengan rata-rata Y.

6) Cari nilai pada kolom x2 dengan jalan menguadratkan masing-masing


nilai dalam kolom x.

7) Cari nilai pada kolom y2 dengan jalan menguadratkan masing-masing


nilai dalam kolom y.

8) Cari nilai pada kolom xy dengan jalan mengalikan tiap-tiap nilai dalam
kolom x dengan nilai-nilai dalam kolom y.

Tabel Perhitungan Korelasi product Moment

Nilai (X- ̅ (Y-̅̅̅̅


No Digital Mikrokon X Y x2 Y2 xy
(X) (Y)
1 5 6 -1,1 - 0,6 1,21 0,36 0,66

2 7 8 0,9 1,4 0,81 1,96 1,26


3 8 7 1,9 0,4 3,61 0,16 0,76
4 5 5 -1,1 -1,6 1,21 2,56 1,76 -
5 6 7 -0,1 0,4 0,01 0,16 -0,04
6 7 7 0,9 0,4 0,81 0,16 0,36
7 4 5 -2,1 -1,6 4,41 2,56 3,36 -
8 5 7 -1,1 0,4 1,21 0,16 0,44
9 8 8 1,9 1,4 3,61 1,96 2,66
10 6 6 -0,1 -0,6 0,01 0,36 0,06

I Made Sudana Evaluasi Pembelajaran Page 49


∑ 61 66 16,9 10,4 10,4
6,1 6,6

rxy = =

B. Reliabilitas
Reliabilitas berasal dari kata reliable yang berarti dapat dipercaya.
Reliabilitas suatu tes menunjukkan atau merupakan sederajat ketetapan,
keterandalan atau kemantapan (the level of consistency) tes yang
bersangkutan dalam mendapatkan data (skor) yang dicapai seseorang,
apabila tes tersebut diberikan kepadanya pada kesempatan (waktu) yang
berbeda., atau dengan tes yang pararel (eukivalen) pada waktu yang sama.
Atau dengan kata lain sebuah tes dikatakan reliable apabila hasil-hasil tes
tersebut menunjukan ketetapan, keajegan, atau konsisten. Artinya, jika
kepada para siswa diberikan tes yang sama pada waktu yang berlainan,
maka setiap siswa akan tetap berada dalam urutan (ranking) yang sama
dalam kelompoknya. Contoh

Waktu Tes
No Nama siswa Pengetesan Pengetesan
Ranking
Pertama Kedua

Andi 6 7 3.a

Budi 5.5 6.6 4

Cici 8 9 1

Didi 5 6 5

Evi 6 7 3.b

Fifi 7 8 2

Ada beberapa cara untuk mencari reliabilitas suatu tes, antara lain :

I Made Sudana Evaluasi Pembelajaran Page 50


1).Teknik Berulang

Tehnik ini adalahdengan memberikan tes tersebut kepada sekelompok


anak-anak dalam dua kesempatan yang berlainan.misalnya suatu tes
diberikan pada kepada group A. selang 3 hari atau seminggu tes tes
tersebut diberikan lagi kepada group A dengan syarat-syarat tertentu.

2).TeknikBentuk Paralel

Teknik ini dipergunakan dua buah tes yang sejenis (tetapi tidak identik),
mengenai isinya; proses mental yang diukur, tingkat kesukaran jumlah item
dan aspek-aspek lain.

3).Teknik belah dua

Ada dua prosedur yang dapat digunakan dalam tes belah dua ini yaitu :

-genap, artinya seluruh item yang bernomor ganjil


dikumpulkan menjadi satu kelompok dan yang bernomor genap
menjadi kelompok yang lain.

dengan jalan lotre, atau dengan


jalan menggunakan tabel bilangan random.

C. Karakteristik Tes

1). Objektivitas

Sebuah tes dikatakan memiliki objektivitas apabila dalam


melaksanakan tes itu tidak ada faktor subyektif yang mempengaruhi. Hal
ini terutama pada sistem skoringnya, apabila dikaitkan dengan reliabilitas
maka obyektivitas menekankan ketetapan pada sistem skoring,
sedangkan reliabilitas menekankan ketetapan dalam hasil tes.Ada dua
faktor yang mempengaruhi subjektivitas dari sesuatu tes yaitu bentuk tes
dan penilaian.

I Made Sudana Evaluasi Pembelajaran Page 51


2). Praktikabilitas

Sebuah tes dikatakan memiliki praktikabilitas yang tinggi apabila


tes itu bersifat praktis, mudah untuk pengadministrasiannya. Tes yang
praktis adalah tes yang:

a). Mudah dilaksanakannya; misalnya tidak menuntut peralatan yang banyak


dan memberi kebebasan kepada siswa untuk mengerjakan terlebih
dahulu bagian yang dianggap mudah oleh siswa.

b). Mudah memeriksanya artinya bahwa tes itu dilengkapi dengan kunci
jawaban maupun pedoman skoringnya. Untuk soal yang obyektif,
pemeriksaan akan lebih mudah dilakukan jika dikerjakan oleh siswa
dalam lembar jawaban.

c). Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat


diberikan/ diawali oleh orang lain

3). Ekonomis

Yang dimaksud dengan ekonomis ialah bahwa pelaksanaan tes


tersebut tidak membutuhkan ongkos/biaya yang mahal, tenaga yang
banyak danwaktu yang lama, baik untuk memproduksinya maupun untuk
melaksanakan dan mengolah hasilnya.Dengan mempertimbangkan
kriteria-kriteriates tersebut, sewajarnya dapat dihasilkan alat tes (soal-
soal) yang berkualitas yang memenuhi syarat-syarat dibawah ini :

1). Shahih (valid), yaitu mengukur yang harus diukur, sesuai dengan
tujuan 2).Relevan, dalam arti yang diuji sesuai dengan tujuan yang
diinginka 3).Spesifik, soal yang hanya dapat dijawab oleh peserta
I Made Sudana Evaluasi Pembelajaran Page 52
didik yang betul- betul belajar dengan rajin
4).Tidak mengandung ketaksaan (tafsiran
ganda).harus ada patokan; tugas ditulis konkret. Apa yang harus
diminta; harus dijawab berapa lengkap 5). Representatif, soal mewakili
materi ajar secara keseluruhan 6).Seimbang, dalam arti pokok-pokok
yang penting diwakili, dan yang tidak penting tidak selalu
perlu.

4. Tingkat Kesukaran Soal


Tingkat kesukaran soal juga harus diperhatikan agar dapat
mengetahuidan menetapkan berapa jumlah soal yang termasuk sukar,
sedang dan mudah.Adapun besar-kecilnya jumlah soal untuk tiap-tiap tingkat
kesukaran tidakada yang mutlak. Biasanya, jumlah soal sedang lebih banyak
daripada jumlahsoal mudah dan sukar, sedangkan jumlah soal mudah dan
soal sukar samabanyaknya. Misalnya, soal mudah ditentukan 30%, sedang
40%, dan sukar 30%.Contoh :
BS 50 PG 30 M 20
Mater Pen Pemh Apli Jlm Pen Pemh Apli Jlm Pen Pemh Apli Jlm
i g n 40 h g n 40 h g n 40 h
30% 30% % 30% 30% % 30% 30% %
A
40%
6 6 8 20 3 4 5 12 2 2 4 8
B
40%
6 6 8 20 3 4 5 12 2 2 4 8
C
20%
3 3 4 10 2 2 2 6 1 1 2 4
Jmlh 15 15 20 50 8 10 12 30 5 5 10 20

Penjelasan :
a. Misalnya, jumlah soal keseluruhan adalah 100, terdiri atas 50 soal bentuk
benar-salah,30 soal bentuk pilihan-ganda, dan 20 soal bentuk menjodohkan
Selanjutnya, tentukan pula persentase soal untuk masing-masing materi,
misalnya 40 %, 40 %, dan 20 %.
Untuk soal bentuk B – S = 50, maka jumlah soal untuk setiap materi
adalah
Materi A = 40 % x 50 = 20 soal
I Made Sudana Evaluasi Pembelajaran Page 53
Materi B = 40 % x 50 = 20 soal
Materi C = 20 % x 50 = 10 soal
Untuk bentuk P – G = 30, maka jumlah soal untuk setiap materi adalah :
Materi A = 40 % x 30 = 12 soal
Materi B = 40 % x 30 = 12 soal
Materi C = 20 % x 30 = 6 soal
Untuk bentuk Menjodohkan = 20, maka jumlah soal untuk setiap materi
adalah:
Materi A = 40 % x 20 = 8 soal
Materi B = 40 % x 20 = 8 soal
Materi C = 20 % x 20 = 4 soal
b. Selanjutnya, menghitung jumlah soal untuk setiap jenjang kemampuan,
yaitu persentase pada setiap jenjang kemampuan dikalikan dengan jumlah
soal untuk setiap bentuk soal.
Misalnya :
Pengetahuan : 30 % x 20 = 6 soal
Pengetahuan : 30 % x 20 = 6 soal
Pengetahuan : 40 % x 20 = 8 soal, demikian seterusnya.
Untuk menghitung tingkat kesukaran soal, maka pada setiap
jenjang kemampuan/aspek yang diukur (pengetahuan, pemahaman, dan
aplikasi) harus dibagi menjadi tiga kolom, yakni untuk kolom mudah,
sedang, dan sukar dengan perbandingan (misalnya) 30 %, 40 %, dan 30
%. Dengan demikian, jumlah soal untuk masing-masing tingkat kesukaran
pada setiap jenjang kemampuan dapat dihitung seperti berikut :

Untuk jenjang kemampuan pengetahuan :

Mudah : 30 % x 6 = 1,8 dihitung 2 soal.

Sedang : 40 % x 6 = 2,4 dihitung 2 soal.

Sukar : 30 % x 8 = 1,8 dihitung 2 soal.

Demikian seterusnya, sehingga melahirkan tabel yang lebih terurai.

I Made Sudana Evaluasi Pembelajaran Page 54


Perhitungan tingkat kesukaran soal adalah pengukuran seberapa besar
derajat kesukaran suatu soal.Jika suatu soal memiliki tingkat kesukaran
seimbang (proporsional), maka dapat dikatakan bahwa soal tersebut
baik.Suatu soal tes hendaknya tidak terlalu sukar dan tidak pula terlalu
mudah.

1. Menghitung tingkat kesukaran soal bentuk objektif

Untuk menghitung tingkat kesukaran soal bentuk objektif dapat digunakan


dengan dua cara, yaitu :

Cara Pertama, menggunakan rumus tingkat kesukaran (TK) :

(WL + WH)
TK = ———————— x 100 %
(nL + nH) 10
Keterangan :
WL = jumlah peserta didik yang menjawab salah dari kelompok bawah
WH = jumlah peserta didik yang menjawab salah dari kelompok atas
nL = jumlah kelompok bawah
nH = jumlah kelompok atas
Sebelum menggunakan rumus di atas, maka Anda harus menempuh
terlebih dahulu langkah-langkah sebagai berikut :

a. Menyusun lembar jawaban peserta didik dari skor tertinggi sampai


dengan skor terendah.

b. Mengambil 27 % lembar jawaban dari atas yang selanjutnya disebut


kelompok atas (higher group), dan 27 % lembar jawaban dari bawah
yang selanjutnya disebut kelompok bawah (lower group). Sisa
sebanyak 46% disisihkan.

c. Membuat tabel untuk mengetahui jawaban (benar atau salah) dari


setiap peserta didik, baik untuk kelompok atas maupun kelompok

I Made Sudana Evaluasi Pembelajaran Page 55


bawah. Jika jawaban peserta didik benar, diberi tanda + (plus),
sebaliknya jika jawaban peserta didik salah, diberi tanda - (minus).

Contoh:
KELOMPOK ATAS/KELOMPOK BAWAH
Siswa
1 2 3 4 5 6 dst
No. Soal
1
2
3
4
5
Dst

Tabel distribusi soal dapat digambarkan sbb:

No soal WL WH WL + WH WL - WH

Contoh :
36 orang peserta siswa SMK ujian akhir semester dalam mata pelajaran
Matematika.Berdasarkan hasil ujian tersebut kemudian disusun lembar
jawaban peserta didik dari yang mendapat skor tertinggi sampai dengan
skor terendah. Selanjutnya, diambil 27% dari skor tertinggi, yaitu 27% x
36 orang = 9,72 = 10 orang (dibulatkan) dan 27% dari skor terendah,

I Made Sudana Evaluasi Pembelajaran Page 56


yaitu 27% x 36 orang = 9,72 = 10 orang (dibulatkan). Setelah diketahui
jumlah sampel kelompok atas dan kelompok bawah, kemudian membuat
tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta
didik dalam kelompok tersebut.

5. Analisis Pengecoh

Pada soal bentuk pilihan-ganda ada alternatif jawaban (opsi) yang


merupakan pengecoh. Butir soal yang baik, pengecohnya akan dipilih secara
merata oleh peserta didik yang menjawab salah. Sebaliknya, butir soal yang
kurang, pengecohnya akan dipilih secara tidak merata.

Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu
sama atau mendekati jumlah ideal. Indeks pengecoh dihitung dengan

rumus:

IP =

Keterangan :

IP = indeks pengecoh

P = jumlah peserta didik yang memilih pengecoh

N = jumlah peserta didik yang ikut tes

B = jumlah peserta didik yang menjawab benar pada setiap soal

n = jumlah alternatif jawaban (opsi)

1 = bilangan tetap

Catatan :
I Made Sudana Evaluasi Pembelajaran Page 57
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai
kunci jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan
demikian, pengecoh tidak berfungsi.

Contoh :

50 orang peserta didik di tes dengan 10 soal bentuk pilihan-ganda.Tiap soal


memiliki 5 alternatif jawaban (a, b, c, d dan e). Kunci jawaban (jawaban yang
benar) soal nomor 8 adalah c. Setelah soal nomor 8 diperiksa untuk semua
peserta didik, ternyata dari 50 orang peserta didik, 20 peserta didik
menjawab benar dan 30 peserta didik menjawab salah. Idealnya, pengecoh
dipilih secara merata, artinya semua pengecoh secara merata ikut
menyesatkan peserta didik. Perhatikan contoh soal nomor 8 berikut ini :

Alternatif jawaban a b c d e

Distribusi jawaban peserta didik 7 8 20 7 8

IP 93% 107% ** 93% 107%

Kualitas pengecoh ++ ++ ** ++ ++

Keterangan :

** : kunci jawaban

++ : sangat baik

+ : baik

- : kurang baik

_ : jelek

_ _ : sangat jelek

Pada contoh di atas, IP butir a, b, d, dan e adalah 93%, 107%, 93% dan
107%.Semuanya dekat dengan angka 100%, sehingga digolongkan sangat
baik, sebab semua pengecoh itu berfungsi. Jika pilihan jawaban peserta
didik menumpuk pada satu alternatif jawaban, misalnya seperti berikut :

Alternatif jawaban a b c d e
I Made Sudana Evaluasi Pembelajaran Page 58
Distribusi jawaban peserta didik 20 2 20 8 0

IP 267% 27% ** 107% 0%

Kualitas pengecoh _ - ** ++

Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e)
dan (b) tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan
(e) perlu diganti karena termasuk jelek, dan pengecoh (b) perlu direvisi
karena kurang baik. Adapun kualitas pengecoh berdasar indeks pengecoh
adalah :

Sangat baik IP = 76% - 125%

Baik IP = 51% - 75% atau 126% - 150%

Kurang baik IP = 26% - 50% atau 151% - 175%

Jelek IP = 0% - 25% atau 176% - 200%

Sangat jelek IP = lebih dari 200%

Untuk analisis pengecoh perlu dibuat tabel khusus agar setiap butir soal
diketahui berapa banyak peserta didik yang menjawab a, b, c dan
seterusnya.Hal ini tentu saja sangat memakan waktu dan tenaga.Jika diolah
dengan komputer dan data sudah dimasukkan dalam disket, pengolahan ini
hanya memerlukan waktu beberapa detik saja.

6. Analisis Homoginitas Soal

Homogin tidaknya butir soal diketahui dengan menghitung koefisien korelasi


antara skor tiap butir soal dengan skor total.Perhitungan dilakukan sebanyak
butir soal dalam tes bersangkutan.Jika jumlah soal ada 100, maka
perhitungan koefisien korelasi sebanyak 100 kali. Skor setiap butir soal
adalah 1 atau 0, sedang skor total tiap peserta didik akan bervariasi. Salah
satu teknik korelasi yang dapat digunakan adalah korelasi product-moment
atau korelasi point biserial. Butir soal dikatakan homogin, apabila koefisien

I Made Sudana Evaluasi Pembelajaran Page 59


korelasinya sama atau di atas batas signifikansi (harga kritik korelasi).
Sebaliknya, butir soal dikatakan tidak homogin, jika koefisien korelasinya
negatif atau lebih kecil dari batas signifikansi. Butir soal yang tidak homogin
kemungkinan besar mengukur aspek lain di luar materi/ bahan yang
diajarkan, karena tidak sesuai dengan kompetensi yang telah ditetapkan.
Butir soal yang demikian sebaiknya direvisi atau di buang.

7. Efektifitas Fungsi Opsi

Setelah tingkat kesukaran soal, daya pembeda, homogenitas dan analisis


pengecoh dihitung, selanjutnya Anda perlu mengetahui pula apakah suatu
opsi (alternatif jawaban) dari setiap soal berfungsi secara efektif atau tidak.
Untuk itu, dapat digunakan langkah-langkah sebagai berikut:

a. Menentukan jumlah peserta didik (N).

b. Menentukan jumlah sampel (n), baik untuk kelompok atas maupun


kelompok bawah, yaitu 27 % x N

c. Membuat tabel pengujian efektifitas opsi seperti berikut :

Opsi
a B c d E
Kelompok
Atas
Bawah

I Made Sudana Evaluasi Pembelajaran Page 60


d. Menghitung jumlah alternatif jawaban yang dipilih peserta didik, baik untuk
kelompok atas maupun kelompok bawah.

e. Menentukan efektifitas fungsi opsi dengan kriteria :

1) Untuk opsi kunci :

a) Jumlah pemilih kelompok atas dan kelompok bawah berada diantara

25 % - 75 %.

Rumusnya adalah

Keterangan :
ΣPKA = jumlah pemilih kelompok atas
ΣPKB = jumlah pemilih kelompok bawah
n1= jumlah sampel kelompok atas (27 %)
n2 = jumlah sampel kelompok bawah (27 %)
b) Jumlah pemilih kelompok atas harus lebih besar daripada jumlah
pemilih kelompok bawah.
2) Untuk opsi pengecoh :
a) Jumlah pemilih kelompok atas dan kelompok bawah tidak kurang
dari :
25 % x x (Ka + Kb)

Keterangan :
d = jumlah opsi pengecoh
Ka = kelompok atas
Kb = kelompok bawah
b) Jumlah pemilih kelompok bawah harus lebih besar daripada jumlah
pemilih kelompok atas.
Contoh :
Diketahui :
Jumlah peserta didik (N) = 40 orang
n (27%x40) = 10,80 = 11 (dibulatkan)
Jumlah soal = 10.
Bentuk soal = pilihan-ganda.
Jumlah opsi = 5 (a, b, c, d, e)
I Made Sudana Evaluasi Pembelajaran Page 61
Kunci jawaban (opsi kunci) soal nomor 1 (misalnya) adalah (c) dan opsi
pengecohnya adalah (a), (b), (d), dan (e).

Distribusi pilihan peserta didik terhadap opsi untuk kelompok atas


adalah:

opsi (a) = 0; opsi (b) = 1; opsi (c) = 7; opsi (d) = 3; opsi (e) = 0.

Distribusi pilihan peserta didik terhadap opsi untuk kelompok bawah


adalah :
opsi (a) = 2; opsi (b) = 6; opsi (c) = 2; opsi (d) = 1; opsi (e) = 0.

Dengan demikian, kita dapat membuat tabel distribusi seperti berikut :

Tabel Distribusi Pilihan Peserta Didik Terhadap Opsi Soal


Opsi Kelompok a b c d e
Atas 0 1 7 3 0
Bawah 2 6 2 1 0

Berdasarkan tabel di atas, dapat menentukan efektif tidaknya fungsi


opsi sebagai berikut :

√ Untuk opsi (c) sebagai opsi kunci berfungsi efektif, karena jumlah
pemilih kelompok atas dan kelompok bawah adalah 2 2 7 + x 100 %
= 40,91 %. Angka ini berada diantara 25 % - 75 %. Di samping itu,
jumlah pemilih kelompok atas (7 orang) lebih besar daripada jumlah
pemilih kelompok bawah (2 orang).

√ Untuk opsi (a) sebagai opsi pengecoh berfungsi efektif, karena jumlah
pemilih kelompok atas dan kelompok bawah 2 orang. Jumlah ini di
atas minimal dari :

25 % x 4 2 1x x (11 + 11) = 25 % x 2,75 = 0,69. Di samping itu,


jumlah

pemilih kelompok bawah (2 orang) lebih besar daripada jumlah


pemilih kelompok atas (tidak ada pemilih).

I Made Sudana Evaluasi Pembelajaran Page 62


√ Untuk opsi (b) sebagai opsi pengecoh berfungsi efektif, karena jumlah
pemilih kelompok atas dan kelompok bawah 7 orang. Jumlah ini di
atas minimal dari :

25 % x 4 2 1x x 22 = 0,69. Di samping itu, jumlah pemilih kelompok


bawah (6 orang) lebih besar daripada jumlah pemilih kelompok atas
(1 orang).

√ Untuk opsi (d) sebagai opsi pengecoh tidak berfungsi secara efektif,
karena jumlah pemilih kelompok atas (3 orang) lebih besar daripada
jumlah pemilih kelompok bawah (1 orang).

√ Untuk opsi (e) sebagai opsi pengecoh tidak berfungsi secara efektif,
karena jumlah pemilih kelompok atas dan kelompok bawah kurang dari
0,69.

I Made Sudana Evaluasi Pembelajaran Page 63


DAFTAR BACAAN
Arifin, Z. (2011), Evaluasi Pembelajaran : Prinsip-Teknik-Prosedur, Cetakan Ke-
3, Bandung : PT.Remaja Rosdakarya.
Arifin, Z. (2006), Konsep Guru Tentang Evaluasi dan Aplikasinya Dalam Proses
Pembelajaran PAI, Tesis, Bandung : Universitas Pendidikan Indonesia.
Anastasi, A. (1976) Psychological Testing, New York : The Macmillan
Company, Inc.
Atwi Suparman. (1997). Desain Instruksional, Jakarta: PAU.

Depdiknas.(2003). UU No. 20 Tahun 2003 tentang Sistem Pendidikan Nasional.


Jakarta.

Depdiknas.(2005). PP.19 Tahun 2005 tentang Standar Nasional Pendidikan.


Jakarta.

Dimyati dan Mudjiono (1994) Belajar dan Pembelajaran, Jakarta : P3MTK-


Ditjen Dikti-Depdikbud.
Gronlund, N.E. (1985) Measurement and Evaluation in Teaching, Fifth Edition,
New York : Mc Millan Publishing Co., Inc.
http://pbsindonesia.fkip-uninus.org/media.php?module=detailmateri&id=59
http://blogwirabuana.wordpress.com/2011/03/16/penilaian-acuan-norma-pan
dan- penilaian-acuan-patokan-pap/

Kerlinger, Fred.N., (1986) Foundation of Behaviour Research, Halt-Rinehart


and Winston, Inc.

Mudjijo.(1995). Tes Hasil Belajar. Jakarta: Bumi Aksara.

Purwanto, N. (2010). Prinsip-Prinsip dan Teknik Evaluasi pengajaran. Bandung:


PTRemaja Rosdakarya.

Rofiek, A. (2007). Assessment Pembelajaran_6 Pdf.

Sanjaya, W. (2008).Perencanaan dan Desain Sistem Pembelajaran. Jakarta:


Prenada media Group.

Sirait, B. (1985). Menyusun Tes Hasil Belajar. Semarang Press.


Stamboel, C. S., (1986) Prinsip dan Teknik Pengukuran dan Penilaian di Dalam
Dunia Pendidikan, Cetakan Ke-2, Jakarta : Mutiara Sumber Widya.

I Made Sudana Evaluasi Pembelajaran Page 64


Sudjiono, A. (2006). Pengantar Evaluasi Pendidikan. Jakarta : PT Raja
Grafindo Persada.

Suharsimi, A. (2008). Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi Aksara.

Sukardi.E, dan Maramis. W. F. (1986).Penilaian Keberhasilan Belajar. Jakarta:


Erlangga: University Press.

Thorndike, R. L., and Hagen, H.P., (1977) Measurement and Evaluation in


Psychology and Education, New York : John Willey & Sons, Ltd.

I Made Sudana Evaluasi Pembelajaran Page 65


MODUL

EVALUASI PEMBELAJARAN

Oleh
Dr. I MADE SUDANA, M. Pd

PROGRAM STUDI PTIK


JURUSAN TEKNIK ELEKTRO- FAKULTAS TEKNIK
UNIVERSITAS NEGERI SEMARANG
2016

I Made Sudana Evaluasi Pembelajaran Page 66


DAFTAR ISI
Halaman

JUDUL …………………………………………………..........
DAFTAR ISI ………………………...……………………………... i
PRA KATA ………………………...……………………………... ii
BAGIAN 1 PENDAHULUAN ...…………...……………………………... 1
1. Pengantar………………..……………...……………………………... 1
2. Makna Evaluasi ……………………………………………………….
3. Langkah-Langkah di Dalam Evaluasi …………………………... 2
4. Prasyarat ………………………………………………………………. 4
BAGIAN 2 TUJUAN DAN JENIS EVALUASI PEMBELAJARAN ………. 5
1. Pengertian Evaluasi ……………………………………………………. 5
2. Tujuan Evaluasi Pembelajaran ………………………………………..
5. Fungsi Evaluasi Pembelajaran ……………………………………..
5. Ruang Lingkup Evaluasi Pembelajaran………………………………
BAGIAN 3

I Made Sudana Evaluasi Pembelajaran Page 67


I Made Sudana Evaluasi Pembelajaran Page 68

Anda mungkin juga menyukai