BAB I
EVALUASI
Dalam kehidupan sehari-hari tanpa disadari sebenarnya kita sering membuat suatu
kegiatan evaluasi dan selalu menggunakan prinsip mengukur dan menilai. Namun, banyak
orang belum memahami secara tepat arti kata evaluasi, pengukuran, dan penilaian bahkan
masih banyak orang yang lebih cenderung mengartikan ketiga kata tersebut dengan suatu
pengertian yang sama.
Secara umum orang hanya mengidentikkan kegiatan evaluasi sama dengan menilai,
karena aktivitas mengukur biasanya sudah termasuk di dalamnya. Pengukuran, penilaian dan
evaluasi merupakan kegiatan yang bersifat hierarki. Artinya ketiga kegiatan tersebut tidak
dapat dipisahkan satu sama lain dan dalam pelaksanaannya harus dilaksanakan secara
berurutan.
A. Evaluasi
Secara harafiah evaluasi berasal dari bahasa Inggris evaluation yang berarti penilaian
atau penaksiran suatu proses yang sistematis untuk menentukan atau membuat keputusan
sampai sejauh mana tujuan program telah tercapai (Gronlund, 1985, dalam Djaali dan Pudji
M). (John M. Echols dan Hasan Shadily: 1983).
Evaluasi juga bisa di katakan keseluruhan kegiatan pengumpulan data dan informasi,
pengolahan, penafsiran, dan pertimbangan untuk membuat keputusan.
Menurut Stufflebeam, dkk (1971) mendefinisikan evaluasi sebagai “The process of
delineating, obtaining, and providing useful information for judging decision alternatives”.
Artinya evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikan
informasi yang berguna untuk merumuskan suatu alternatif keputusan.
Pendapat yang sama juga dikemukakan oleh Wrightstone, dkk (1956) yang
mengemukakan bahwa evaluasi pendidikan adalah penaksiran terhadap pertumbuhan dan
kemajuan siswa ke arah tujuan atau nilai-nilai yang telah ditetapkan dalam kurikulum.
Secara garis besar dapat dikatakan bahwa evaluasi adalah pemberian nilai terhadap
kualitas sesuatu. Selain dari itu, evaluasi juga dapat dipandang sebagai proses
merencanakan, memperoleh, dan menyediakan informasi yang sangat diperlukan untuk
membuat alternatif-alternatif keputusan. Dengan demikian, Evaluasi merupakan suatu
proses yang sistematis untuk menentukan atau membuat keputusan sampai sejauh mana
tujuan-tujuan pengajaran telah dicapai oleh siswa (Purwanto, 2002).
selain itu evaluasimerupakan proses menilai sesuat berdasarkan criteria tertentu, yang
selanjunya diikuti dengan pengambilan sebuah keputusan atas objek yang dievaluasi.
B. Pengukuran
Pengukuran dalam bahasa inggris yang memiliki istilah measurement merupakan
kegiatan yang dilakukan untuk mengukur dalam arti memberi angka terhadap sesuatu
yang disebut obyek pengukuran atau obyek ukur.
Measurement (pengukuran) merupakan proses yang mendeskripsikan performance
siswa dengan menggunakan suatu skala kuantitatif (system angka) sedemikian rupa
sehingga sifat kualitatif dari performance siswa tersebut dinyatakan dengan angka-angka
(Alwasilah et al.1996).
Sebelum seorang evaluator menilai tentang proses sebuah pendidikan, maka langkah
awal yang dilakukan adalah melakukan sebuah pengukuran. Dalam penilaian pendidikan,
evaluator harus mengatahui standar penilain yang telah telah ditetapkan oleh pemerintah
sebagai acuan dasar, sehingga dari situ evaluator mampu melakukan pengukuran sesuai
dengan apa yang seharusnya diakur dalam bidang pendidikan. Umumnya sebuah
pengukuran, akan dapat dilakukan dengan baik apabila evaluator mengetahui dengan pasti
objek apa yang akan diukur, dengan begitu evaluator dapat menentukan instrument yang
digunakan dalam pengukuran.
Pengukuran merupakan proses yang mendeskripsikan performance siswa dengan
menggunakan suatu skala kuantitatif (system angka) sedemikian rupa sehingga sifat
kualitatif dari performance siswa tersebut dinyatakan dengan angka-angka (Alwasilah et
al.1996).
C. Penilaian
Penilaian adalah kegiatan menentukan nilai suatu objek, seperti baik-buruk, efektif-
tidak efektif, berhasil-tidak berhasil, dan semacamnya sesuai dengan kriteria atau tolak
ukur yang telah ditetapkan sebelumnya.
Penilaian (assessment) merupakan penerapan berbagai cara dan penggunaan beragam
alat penilaian untuk memperoleh informasi tentang sejauh mana hasil belajar peserta didik
atau ketercapaian kompetensi (rangkaian kemampuan) peserta didik.
Penilaian menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang
peserta didik.Hasil penilaian dapat berupa nilai kualitatif (pernyataan naratif dalam kata-
kata) dan nilai kuantitatif (berupa angka). Pengukuran berhubungan dengan proses
pencarian atau penentuan nilai kuantitatif tersebut.
BAB II
JENIS, FUNGSI DAN TUJUAN EVALUASI PEMBELAJARAN MATEMATIKA
Selain jenis – jenis evaluasi di atas, masih ada jenis evaluasi yang lainnya , yaitu :
3. Evaluasi dampak
Yaitu untuk mengetahui dampak yang ditimbulkan oleh suatu program pembelajaran.
Dampak ini dapat diukur berdasarkan kriteria keberhasilan sebagai indikator
ketercapaian tujuan program pembelajaran.
4. Evaluasi efisiensi-ekonomis
Yaitu untuk menilai tingkat efisiensi program pembelajaran. Untuk itu, diperlukan
perbandingan antara jumlah biaya, tenaga dan waktu yang diperlukan dalam program
pembelajaran dengan program lainnya yang memiliki tujuan yang sama.
5. Evaluasi program komprehensif
Yaitu untuk menilai program pembelajaran secara menyeluruh, seperti pelaksanaan
program, dampak program, tingkat keefektifan dan efisiensi.
selain tujuan evaluasi sesuai dengan fungsi ebaluasi terdapat juga tujuan evaluasi yang
lain, yaitu:
1. Menentukan angka kemajuan atau hasil belajar pada siswa. Berfungsi sebagai :
a. Laporan kepada orang tua / wali siswa.
b. Penentuan kenaikan kelas
c. Penentuan kelulusan siswa.
2. Penempatan siswa ke dalam situasi belajar mengajar yang tepat dan serasi dengan
tingkat kemampuan, minat dan berbagai karakteristik yang dimiliki.
3. Mengenal latar belakang siswa (psikologis, fisik dan lingkungan) yang berguna baik
bagi penempatan maupun penentuan sebab-sebab kesulitan belajar para siswa, yakni
berfungsi sebagai masukan bagi tugas Bimbingan dan Penyuluhan (BP).
4. Sebagai umpan balik bagi guru, yang pada gilirannya dapat digunakan untuk
memperbaiki proses belajar mengajar dan program remdial bagi siswa.
BAB III
PEMBUATAN INSTRUMEN EVALUASI
A. Tes
Tes sebagai alat penilaian adalah pertanyaan-pertanyaan yang diberikan kepada siswa
untuk mendapat jawaban dari siswa dalam bentuk lisan (tes lisan), dalam bentuk tulisan
(tes tulisan), dan dalam bentuk perbuatan (tes tindakan).
Secara umum tes diartikan sebagai alat yang dipergunakan untuk mengukur
pengetahuan atau penguasaan objek ukur terhadap seperangkat kontendan meteri tertentu.
Menurut Sudijono (1996) tes adalah alat atau prosedur yang digunakan dalam rangka
pengukuran dan penilaian. Tes dapat juga diartikan sebagai alat pengukur yang
mempunyai standar objektif, sehingga dapat dipergunakan secara meluas, serta betul-betul
dapat dipergunakan untuk mengukur dan membandingkan keadaan psikis atau tingkah
laku individu. Sedangkan menurut Norman (1976) tes merupakan salah satu prosedur
evaluasi yang komprehensif, sistematik, dan objektif yang hasilnya dapat dijadikan dasar
dalam pengambilan keputusan (Djaali & Pudji Mulyono, 2007).
Ada 2 jenis tes yakni tes uraian (subjektif) dan tes objektif. Tes uraian terdiri dari uraian
bebas, uraian terbatas, dan uraian terstruktur. Sedangkan tes objektif terdiri dari beberapa
bentuk, yakni bentuk pilihan benar salah, pilihan ganda dengan banyak variasi,
menjodohkan, dan isian pendek atau melengkapi.
Dapat disimpulkan bahwa kelebihan atau keunggulan tes uraian antara lain adalah:
1) Dapat mengukur proses mental yang tinggi atau aspek kognitif tingkat tinggi;
Dipihak lain kelemahan atau kekurangan yang terdapat dalam tes ini antara lain
adalah:
1) Sampel tes sangat terbatas sebab dengan tes ini tidak mungkin dapat menguji
semua bahan yang telah diberikan, tidak seperti pada tes objektif yang dapat
menanyakan banyak hal melalui sejumlah pertanyaan;
2) Sifatnya sangat subjektif, baik dalam menanyakan, dalam membuat pertanyaan,
maupun dalam cara memeriksanya.
3) Tes ini biasanya kurang reliable, mengungkap aspek yang terbatas,
pemeriksaannya memerlukan waktu lama sehingga tidak praktis bagi kelas yang
jumlah siswanya relative besar.
Bentuk tes uraian dibedakan menjadi 3 yaitu uraian bebas, uraian terbatas dan uraian
berstruktur.
1. Uraian bebas
Dalam uraian bebas jawaban siswa tidak dibatasi, bergantung pada pandangan siswa
itu sendiri. Hal ini disebabkan oleh isi pertanyaan uraian bebas sifatnya umum.
Melihat karakteristiknya, pertanyaan bentuk uraian bebas tepat digunakan apabila
bertujuan untuk:
a) Mengungkapkan pandangan para siswa terhadap suatu masalah sehingga dapat
diketahui luas dan intensitas.
b) Pengupas suatu persoalan yang kemungkinan jawabannya beraneka ragam
sehingga tidak satupun jawaban yang pasti.
c) Mengembangkan daya analisis siswa dalam melihat suatu persoalan dari
berbagai segi atau dimensinya.
Kelemahan tes ini ialah sukar menilainya karena jawaban siswa bervariasi, sulit
menentukan criteria penilaian, sangat subjektif karena bergantung pada guru sebagai
penilainya.
2. Uraian terbatas
Bentuk kedua dari tes uraian adalah tes uraian terbatas. Dalam bentuk ini pertanyaan
telah diarahkan kepada hal-hal tertentu atau ada pembatasan tertentu. Pembatasan
dilhat dari segi: (a) ruang lingkupnya, (b) sudut pandang menjawabnya, (c) indicator -
indikatornya.
3. Uraian berstruktur
Soal berstruktur dipandang sebagai bentuk antara soal-soal objektif dan soal-soal esai.
Soal berstruktur merupakan serangkaian soal jawaban singkat sekalipun bersifat
terbuka dan bebas memberikan jawaban.
2. Tes objektif
Soal-soal bentuk objektif dikenal ada beberapa bentuk yakni:
Bentuk jawaban singkat
Bentuk soal jawaban singkat merupakan soal yang menghendaki jawaban dalam
bentuk kata, bilangan, kalimat atau symbol. Ada dua bentuk jawaban singkat yaitu
bentuk pertanyaan langsung dan bentuk pertanyaan tidak langsung.
Selain itu untuk melaksanakan evaluasi hasil mengajar dan belajar, seorang guru dapat
menggunakan dua mecam tes, yakni tes yang telah distandarkan (standardized test) dan
tes buatan guru sendiri (teacher-made test).
1. Tes Lisan
Tes lisan merupakan sekumpulan item pertanyaan atau pernyataan yang disusun
secara terencana, diberikan oleh seorang guru kepada para siswanya tanpa melalui
media tulis. Pada kondisi tertentu, seperti jumlah siswa kecil (kelompok siswa
yang praktek laboratorium) atau sebagian siswa yang memerlukan tes remidi,
maka tes lisan dapat digunakan secara efektif. Tes lisan ini sebaiknya berfungsi
sebagai tes pelengkap, setelah tes utama dalam bentuk tertulis dilakukan (Sukardi,
2008).
2. Tes Essay
Secara ontology tes esai adalah salah satu bentuk tes tertulis, yang susunannya
terdiri atas item-item pertanyaan yang masing-masing mengandung permasalahan
dan menuntut jawaaban siswa melui uraian-urain kata yang merefleksikan
kemampuan berfikir siswa (Sukardi, 2008).
Menurut Sukardi (2008: 96) untuk meningkatkan mutu pertanyaan esai sebagai
alat pengukur hasil belajar yang komplek, memerlukan dua hal penting yang perlu
diperhatikan oleh para evaluator. Kedua hal penting tersebut, yaitu: (a) bagaimana
mengkonstruksi pertanyaan esai yang mengukur perilaku yang direncanakan, dan
(b) bagaiman menskor jawaban yang diperoleh dari siswa. Berikut adalah cara-
cara dalam menyusun tes esai yang dimaksud.
1. Para guru hendaknya memfokuskan pertanyaan esai pada materi pembelajaran
yang tidak dapat diungkap dengan bentuk tes lain misalnya tes objektif. Ada
beberapa faktor penting dalam proses belajar mengajar,yang hanya bisa
diungkap oleh tes esai.
2. Para guru hendaknya memformulasikan item pertanyaan yang mengungkap
perilaku spesifik yang diperoleh dari pengalamanhasil belajar. Tes yang
direncanakan oleh guru, baik tes objektif maupun tes esai perlu tetap mengukur
penilaian tujuan intruksional.
3. Item-item pertanyaan tes esai sebaiknya jelas dan tidak menimbulkan
kebingungan sehingga para siswa dapat menjawab dengan tidak ragu-ragu
4. Sertakan petunjuk waktu pengerjaan untuk setiap pertanyaan, agar para siswa
dapat memperhitungkan kecepatan berfikir, menulis dan menungankan ide
sesuai dengan waktu yang disediakan.
5. Ketika mengonstruksi sejumlah pertanyaan esai, para guru hendaknya
menghindari penggunaan pertanyaan pilihan. Pertanyaan pilihan biasanya
terletak pada kalimat instruksi pengerjaan padaa aawal tes, misalnya “pilih
empat soal dari lima pertanyaaan yang tersedia”.
Menurut Sri Esti W.D (2004: 429) juga mengemukakan bahwa ada beberapa petunjuk
atau saran untuk menyusun tes isian seperti dibawah ini:
1. Kita hendaknya tidak mengutip kalimat atau pernyataan dalam buku teks atau
buku catatan.
2. Bagian yang kosong hendaknya hanya dapat diisi dengan satu jawaban yang
benar
3. Bagian yang dikosongkan terdiri dari satu kata kunci, atau kata pokok bukan
sembarang kata
4. Kalimat harus sederhana dan jelas sehingga lebih mudah dimengerti
5. Bagian yang kosong ditaruh diakhir kalimat, misalnya menteri keuangan yang
bertugas sekarang ialah .......?
a. Fungsi Tes
Menurut Anas Sudijono (2001: 67) secara umum ada dua fungsi tes antara lain:
Tes sebagai alat pengukur terhadap peserta didik. Dalam hubungan ini ters berfungsi
mengukur tingkat perkembangan atau kemajuan yang telah dicapai oleh peserta didik
setelah mereka menempuh proses belajar mengajar dalam jangka waktu tertentu.
Tes sebagai alat pengukur keberhasilan program mengajar di sekolah. Sebab melalui
tes akan dapat diketahui sudah berapa jauh program pengajaran yang telah ditentukan
atau dicapai.
Pendapat lain juga dikemukakan oleh Djaali & Pudji Mulyono (2007: 7) fungsi tes dibagi
menjadi tiga, antara lain:
Sebagai alat untuk mengukur prestasi belajar siswa tes dimaksudkan untuk
mengukru tingkat perkembangan atau kemajuan yang telah dicaai siswa setelah
menempuh proses belajar mengajar dalam waktu tertentu. Dalam kaitan ini tes
digunakan untuk mengukur keberhasilan program pengajaran. Sebagai alat untuk
mengukur keberhasilan program pengajaran, tes berfungsi untuk menunjukkan
seberapa jauh program pengajaran yang telah ditentukan dapat dicapai, dan
seberapa banyak yang belum tercapai serta menentukan langkah apa yang perlu
dilakukakan untuk mencapainya.
b. Jenis tes
Ada beberapa jenis tes yang sering digunakan dalam proses pendidikan, yaitu:
1. Tes penempatan
Tes yang dilaksanakan untuk keperluan penempatan bertujuan agar setiap siswa
yang mengikutin kegiatan pembelajaran di kelas atau pada jenjang pendidikan
tertentu dapat mengikuti kegiatan pembelajaran secara efektif, karena dengan
bakat dan kemampuannya masing-masing. Contohnya tes bakat, tes kecerdasan
dan tes minat.
2. Tes Diagnostik
Tes diagnostik dilaksanakan untuk mengidentifikasi kesulitan belajar yang
dialami siswa, menentukan faktor-faktor yang menyebabkan kesulitan belajar dan
menetapkan cara mengatassi kesulitan belajat tersebut. Dengan demikian jelas ada
kaitan yang erat antara tes penempatan dan diagnostic. Bahkan dapat dikatakan
keduanya saling melengkapi dalam memberikan kontribusi terhadap peningkatan
efektivitas kegiatan pendidikan pada suatu jenis atau jenjang pendidikan tertentu.
3. Tes Formatif
Tes formatif pada dasarnya adalah tes yang bertujuan untuk mendapatkan umpan
balik bagi usaha perbaikan kualitas pembelajaran dalam konteks kelas. Kulaitas
B. Non-Tes
Hasil belajar dan proses belajar tidak hanya dinilai oleh tes, tetapi dapat juga dinilai
olah alat-alat nontes atau bukan tes. Berikut ini dijelaskan alat-alat non - tes:
Tehnik evaluasi nontes berarti melaksanakan penilain dengan tidak mengunakan tes.
Tehnik penilaian ini umumnya untuk menilai kepribadian anak secara menyeluruh
meliputi sikap, tingkah laku, sifat, sikap sosial, ucapan, riwayat hidupdan lain-lain. Yang
berhubungan dengan kegiatan belajar dalam pendidikan, baik secara individumaupun
secara kelompok.
Berikut adalah beberapa intrumen non-tes yang sering dgunakan dalam evaluasi
dibidang pendidikan:
1. Wawancara
Wawancara merupakan suatu cara yang digunakan untuk mendapatkan informasi
dari siswa dengan melakukan Tanya jawaab sepihak. Kelebihan wawancara adalah
biasa kontak langsung dengan siswa sehingga dapat mengungkapkan jawaban lebih
bebas dan mendalam. Wawancara dapat direkam sehingga jawaban siswa bisa dicatat
secara lengkap. Melalui wawancara, data bisa diperoleh dalam bentuk kualitatif dan
kuantitatif. Pertanyaan yang tidak jelas dapat diulang dan dijelaskan lagi, begitupun
dengan jawaban yang belun jelas.
Ada dua jenis wawancara, yakni wawancara terstruktur dan wawanncara bebas.
Dalam wawancara berstruktur kemungkinan jawaban telah di siapkan sehingga siswa
tinggal mengkategorikannya kepada alternative jawaban yang telah dibuat.
Keuntungannya ialah mudah di olah dan dianalisis untuk dibuat kesimpulan.
Sedangkan untuk wawancara bebas, jawaban tidak perlu disiapkan sehingga siswa
bebas mengemukakan pendapatnya. Keuntungannya ialah informasi lebih padat dan
lengkap sekalipun kita harus bekerjakeras dalam menganalisisnya sebab jawabanya
bias beraneka ragam.
a. Pembagian wawancara
Ada dua jenis wawancara yang dapat dipergunakan sebagai alat dalam evaluasi, yaitu:
1. Wawancara terpimpin (guided interview)
Yaitu biasanya juga dikenal dengan istilah wawancara berstruktur (structured
interview) atau wawancara sistematis (systematic interview), dimana
wawancara ini selalu dilakukan oleh evaluator dengan cara mengajukan
pertanyaan-pertanyaan yang telah disusun terlebih dahulu dalam bentuk
panduan wawancara (interview guide). Jadi, dalam hal ini responden pada
waktu menjawab pertanyaan tinggal memilih jawaban yang sudah disediakan.
2. Wawancara tidak terpimpin (un-guided interview)
biasanya juga dikenal dengan istilah wawancara sederhana (simple interview)
atau wawancara tidak sistematis (nonsystematic interview) atau wawancara
bebas, diamana responden mempunyai kebebasan untuk mengutarakan
pendapatnya, tanpa dibatasi oleh patokan-patokan yang telah dibuat oleh
evaluator. Dalam wawancara bebas, pewancara selaku evaluator mengajukan
pertanyaan-pertanyaan kepada peserta didik atau orang tuanya tanpa
dikendalikan oleh pedoman tertentu, mereka dengan bebas mengemukakan
jawabannya. Hanya saja pada saat menganilis dan menarik kesimpulan hasil
wawancara bebas ini evaluator akan dihadapkan kesulitan-kesulitan, terutama
apabila jawaban mereka beraneka ragam. Mengingat bahwa daya ingat
manusia itu dibatasi ruang dan waktu, maka sebaiknya hasil
b. Tujuan wawancara
Menurut Zainal (2009) ada 3 tujuan dalam melaksanakan wawancara yakni :
Untuk memperoleh informasi secara langsung guna menjelaskan suatu hal atau
situasi dan kondisi tertentu.
Untuk melengkapi suatu penyelidikan ilmiah.
Untuk memperoleh data agar dapat mempengaruhi situasi atau orang tertentu.
2. Angket (kuisioner)
Kuisioner adalah suatu tekhnik pengumpulan informasi yang memungkinkan
analisis mempelajari sikap – sikap, keyakinan, perilaku dan karakteristik dari siswa.
Pada dasarnya, angket adalah sebuah daftar pertanyaan yang harus diisi oleh orang
yang akan diukur (responden). Adapun tujuan penggunaan angket atau kuesioner
dalam proses pembelajaran terutama adalah untuk memperoleh data mengenai latar
belakang peserta didik sebagai salah satu bahan dalam menganalisis tingkah laku dan
proses belajar mereka. Hal ini juga disampaikan oleh Yusuf (dalam Arniatiu, 2010)
yang menyatakan kuisioner adalah suatu rangkaian pertanyaan yang berhubungan
dengan objek yang dinilai dengan maksud untuk mendapatkan data.
Selain itu, data yang dihimpun melalui angket biasanya juga berupa data yang
berkenaan dengan kesulitan-kesulitan yang dihadapi oleh siswa dalam mengikuti
pelajaran. Misalnya: cara belajar, bimbingan guru dan orang tua, sikap belajar dan lain
sebagainya. Angket pada umumnya dipergunakan untuk menilai hasil belajar pada
ranah afektif. Angket dapat disajikan dalam bentuk pilihan ganda atau skala sikap.
b. Jenis kuesioner
Jenis-jenis kuesioner (menurut Yusuf , dalam Artiatiu, 2010):
1) Kuesioner dari segi isi dapat dibedakan atas 4 bagian yaitu:
Pertanyaan fakta adalah pertanyaan yang menanyakan tentang fakta antara
lain seperti jumlah sekolah, jumlah jam belajar, dll.
c. Kelebihan
Dengan angket kita dapat memperoleh data dari sejumlah anak yang banyak
yang hanya membutuhkan waktu yang sigkat.
Setiap anak dapat memperoleh sejumlah pertanyaan yang sama
Dengan angket anak pengaruh subjektif dari guru dapat dihindarkan
d. Kekurangan
Pertanyaan yang diberikan melalui angket adalah terbatas, sehingga apabila ada
hal-hal yang kurang jelas maka sulit untuk diterangkan kembali
Kadang-kadang pertanyaan yang diberikan tidak dijawab oleh semua anak, atau
mungkin dijawab tetapi tidak sesuai dengan kenyataan yang sebenarnya. Karena
anak merasa bebas menjawab dan tidak diawasi secara mendetail.
Ada kemungkinan angket yang diberikan tidak dapat dikumpulkan semua,
sebab banyak anak yang merasa kurang perlu hasil dari angket yang diterima,
sehingga tidak memberikan kembali angketnya.
3. Skala
Skala adalah alat untuk mengukur sikap , nilai, minat dan perhatian, dll. Yang
disusun dalam bentuk pernyataan untuk dinilai oleh responden dan hasilnya dalam
bentuk rentangan nilai sesuatu dengan criteria yang ditentukan.
a. Skala penilaian
Skala penilaian mengukur penampilan atau prilaku orang lain oleh seseorang
melalui pernyataan prilaku individu pada suatu titik yang bermakna nilai. Titik
atau kategori diberi nilai rentangan mulai dari yang tertinggi sampai yang
terendah, bias daalam bentuk huruf atau angka. Hal yang penting diperhatikan
dalam skala penilaian adalah criteria skala nilai, yakni penjelasan operasional
untuk setiap alternative jawaban. Adanya criteria yang jelas akan mempermudah
pemberian penilaian.
Skala penilaian lebih tepat digunakan untuk mengukur suatu proses, misalnya
proses mengajar pada guru, siswa, atau hasil belajar dalam bentuk prilaku seperti
keterampilan, hubunagan social siswa, dan cara memecahkan masalah. Skala
penilaian dalam pelaksanaannya dapat digunakan oleh dua orang penilai atau
lebih dalam menilai subject yang sama. Maksudnya agar diperoleh hasil penilaian
yang objektif mengenai prilaku subject yang dinilai.
b. Skala sikap
Skala sikap digunakan untuk mengukur sikap seseorang terhadap objek tertentu.
Hasilnya berupa kategori sikap, yakni mendukung (positif), menolak (negative ),
dan netral. Sikap pada hakikatnya dapat diartikan reaksi seseorang terhadap suatu
stimulus yang dating kepada dirinya.
Ada 3 komponen sikap yakni:
Kognitif, berkenaan dengan pengetahuan seseorang tentang objek atau
stimulus yang dihadapinnya.
Afeksi, berkenaan dengan perasaan dalam menanggapi objek tersebut.
Psikomotor, berkenaan dengan kecenderungan berbuat terhadap objek
tersebut.
Skala sikap dinyatakan dalam bentuk pernyataan untuk dinilai oleh responden,
apakah pernyataan itu didukung atau ditolaknya, melalui rentangan nilai tertentu.
Oleh karena itu, pernyataan yang diajukan dibagi ke dalam dua kategori yakni
pernyataan positif dan pernyataan negative. Salah satu skala yang sering digunakan
adalah Likert. Dalam skala Likert, pernyataan-pernyataan yang diajukan baik
pernyataan positif maupun negative, dinilai oleh subjek dengan sangat setuju,
setuju, tidak punya pendapat, tidak setuju, dan sangat tidak setuju. Skor yang
diberikan terhadap pilihan tersebut bergantung pada penilai asal penggunaannya
konsisten. Yang jelas, skor untuk pernyataan positif atau negative adalah
kebalikannya.
4. Observasi
Observasi atau pengamatan sebagai alat penilaian banyak digunakan untuk
mengukur tingkah laku individu ataupun proses terjadinya suatu kegiatan yang dapat
idamati, baik dalam situasi yang sebenarnya maupun dalam situasi buatan.
Secara garis besar terdapat dua rumusan tentang pengertian observasi, yaitu
pengertian secara semmpit dan luas. Dalam arti sempit, observasi berarti pengamatan
secara langsung terhadap apa yang diteliti, Dalam arti luas observasi meliputi
pengamatan yang dilakukan secara langsungmaupun tidak langsung terhadap objek
yang diteliti (Susilo Rahardjo & Gudnanto, 2011).
Menurut Susilo Surya dan Natawidjaja ( dalam Susilo Rahardjo & Gudnanto, 2011:
48-49) membedakan observasi menjadi observasi partisipatif, observasi sistematis, dan
observasi experimental.
1) Observasi partisipatif, ialah observasi dimana orang yang mengobservasi
(pengamat, observer) benar-benar turut serta mengambil bagian dalam kegiatan
yang dilakukan oleh orang atau objek yang diamati.
2) Observasi sistematis, ialah observasi dimana sebelumnya telah diatur struktur
yang berisikan faktor-faktor yang telah diataur berdasarkan kategori masalah
nyang hendak diobservasi. Pada observasi sistematis ini sebelumnya pengamat
menyusun kisi-kisi yang memuat faktor-faktor yang akan diobservasi beserta
kategori masalahnya.
3) Obsevasi eksperiental, ialah observasi yang dilakukan secara nonpartisipatif dan
secara sistematis, untuk mengetahui perubahan-perubahan atau gejala-gejala
sebagai akibat dari situasi yang sengaja diadakan.
Apabila dilihat dari teknis pelaksaannya, observasi dapat ditempuh melalui tiga cara,
yaitu:
1. Observasi langsung, adalah pengamatan yang dilakukan terhadap gejala atau
proses yang terjadi dalam situasi yang sebenarnya dan langsung diamati oleh
pengamat
2. Observasi tidak langsung, adalah observasi yang dilakasanakan dengan
menggunakan alat seperti mikroskop utuk mengamati bakteri, suryakanta
untuk melihat pori-pori kulit.
Observasi partisipasi, adalah observasi yang dilaksanakan dengan cara
pengamat harus melibatkan diri atau ikut serta dalam kegiatan yang
dilaksanakan oleh individu atau kelompok yang diamati, sehingga pengamat
bias lebih menghayati, merasakan dan mengalami sendiri seperti inddividu
yang sedang diamatinya.
Jika kita melihat dari dari kerangka kerjanya, observasi dapat dibedakan menjadi
dua jenis, yaitu:
1. Observasi berstruktur, yaitu semua kegiatan guru sebagai observer telah
ditetapkan terlebih dahulu berdasarkan kerangka kerja yang berisi faktor
yang telah diatur kategorisasinya. Isi dan luas materi observasi telah
ditetapkan dan dibatasi dengan jelas dan tegas.
2. Observasi tak berstruktur, yaitu semua kegiatan guru sebagai obeserver
tidak dibatasi oleh suatu kerangka kerja yang pasti. Kegiatan obeservasi
hanya dibatasi oleh tujuan observasi itu sendiri.
b) Mengukur perilaku kelas (baik perilaku guru maupun peserta didik), interaksi
antara peserta didik dan guru, dan faktor-faktor yang dapat diamati lainnya,
terutama kecakapan sosial (social skill)
c) Menilai tingkah laku individu atau proses yang tejadi dalam situasi sebenarnya
maupun situasi yang sengaja dibuat.
Dalam evaluasi pembelajaran, observasi dapat digunakan untuk menilai proses dan
hasil belajar peserta didik pada waktu belajar, berdiskusi, mengerjakan tugas, dan lain-
lain. Selain itu, observasi juga dapat digunakan untuk menilai penampilan guru dalam
mengajar, suasana kelas, hubungan sosial sesama, hubungan sosial sesama peserta
didik, hubungan guru dengan peserta didik, dan perilaku sosial lainnya
b. Kekurangan
Seringkali pelaksanaan observasi terganggu oleh keadaan cuaca, bahkan ada
kesan yang kurang menyenangkan dari observer ataupun observasi itu sendiri.
Biasanya masalah pribadi sulit diamati.
Jika yang diamati memakan waktu lama, maka observer sering menjadi jenuh.
Studi kasus pada dasarnya mempelajari secara intensif seorang individu yang
dipandang mengalami kasus tertentu. Misalnya mempelajari secara khusus anak nakal,
anak yang tidak bisa bergaul dengan orang lain, anak yang selalu gagal dalam belajar,
dan lain - lain. Kasus tersebut dipelajari secara mendalam dan dalam kurun waktu
yang cukup lama. Mendalam artinya mengungkapkan semua variable yang
menyebabkan terjadinya kasus tersebut dari berbagai aspek yang mempengaruhi
dirinya. Penekana yang utama dalam studi kasus adalah mengapa individu melalukan
apa yang dilakukannya dan bagaimana tingkah lakunya dalam kondisi dan
pengaruhnya terhadap lingkungan. Datanya biasa diperoleh berbagai sumbar seperti
orang tua, teman dekatnya, guru, bahkan juga dari dirinya.
Studi kasus adalah mempelajari individu dalam proses tertentu secara terus menerus
untuk melihat perkembangannya (Djamarah : 2000). Misalnya peserta didik yang
sangat cerdas, sangat lamban, sangat rajin, sangat nakal, atau kesulitan dalam belajar.
Untuk itu guru menjawab tiga percayaan inti dalam studi kasus, yaitu:
1) Mengapa kasus tersebut bisa terjadi?
2) Apa yang dilakukan oleh seseorang dalam kasus tersebut?
3) Bagaimana pengaruh tingkah laku seseorang terhadap lingkungan
Kelebihan studi kasus adalah bahwa subjek dapat dipelajari se0 cara mendalam dan
menyeluruh. Namun, kelemahannya sesuai dengan sifat studi kasus bahwa informasi
yang diperoleh sifatnya subjektif, artinya hanya untuk individu yang bersangkutan,
dan belum tentu dapat digunakan untuk kasus yang sama pada individu yang lain.
6. Riwayat Hidup
Ini adalah salah satu tehnik non tes dengan menggunakan data pribadi seseorang
sebagaibahan informasi penelitian. Dengan mempelajari riwayat hidup maka subjek
evaluasi akan dapat menarik suatu kesimpulan tentang kepribadian, kebiasaan dan
sikap dari objek yang dinilai.
Evaluasi cara ini mengenai kemajuan, perkembangan atau keberhasilan belajar
peserta didik tanpa menguji (teknik non-tes) juga dapat dilengkapi atau diperkaya
dengan cara melakukan pemeriksaan terhadap dokumen-dokumen, misalnya: dokumen
yang menganut informasi mengenai riwayat hidup (auto biografi), seperti kapan kapan
dan dimana peserta didik dilahirkan, agama yang dianut, kedudukan anak didalam
keluarga dan sebagainya. Selain itu juga dokumen yang memuat informasi tentang
orang tua peserta didik, dokumen yang memuat tentang orang tua peserta didik,
dokumen yang memuat tentang lingkungan non-sosial, seperti kondisi bangunan
rumah, ruang belajar, lampu penerangan dan sebagainya (Sudijono : 2009).
Beberapa informasi, baik mengenai peserta didik, orang tua dan lingkungannya itu
bukan tidak mungkin pada saat-saat tertentu sangat diperlukan sebagai bahan
pelengkap bagi pendidik dalam melakukan evaluasi hasil belajar terhadap peserta.
sebaliknya. Jika terjadi demikian perlu ditanyakan apakah persyaratan instrumen yang
digunakan menilai sudah sesuai dengan kaidah-kaidah penyusunan instrumen.
Menurut Sukardi (2008: 8) mengemukakan bahwa, suatu evaluasi memenuhi syarat-syarat
sebelum diterapkan kepada siswa yang kemudian direfleksikan dalam bentuk tingkah laku.
Evaluasi yang baik, harus mempunyai syarat seperti berikut: 1) valid, 2) andal, 3) objektif , 4)
seimbang, 5) membedakan, 6) norma, 7) fair, dan 8) praktis.
Sedangkan Wina Sanjaya (2008: 352-354), mengatakan bahwa syarat-syarat alat evaluasi
yang baik harus:
a) Memberikan motivasi
Memberikan penilaian evaluasi diarahkan untuk meninkatkan motivasi belajar bagi
siswa melalui upaya pemahaman akan kekuatan dan kelemahan yang dimiliki baik oleh
guru maupun siswa. Siswa perlu memahami makna dari hasil penilaian.
b) Validitas
Penilaian diarahkan bukan semata-mata untuk melengkapi syarat administrasi saja,
akan tetapi diarahkan untuk memperoleh informasi tentang ketercapaian kompetensi
seperti yang terumuskanan dalam kurikulum. Oleh sebab itu, penilaian tidak
menyimpang dari kompetensi yang ingin dicapai. Dengan kata lain penilaian harus
menjamin validitas.
c) Adil
Setiap siswa memiliki kesempatan yang sama dalam proses pembelajaran tanpa
memandang perbedaan sosial-ekonomi, latar belakang budaya dan kemampuan. Dalam
penilaian, siswa disejajarkan untuk mendapatkan perlakuan yang sama.
d) Terbuka
Alat penilaian yang baik adalah alat penilaian yang dipahami baik oleh penilai
maupun yang dinilai. Siswa perlu memahami jenis atau prosedur penilaian yang akan
dilakukan beserta kriteria penilaian. Keterbukaan ini bukan hanya akan mendorong
siswa untuk memperoleh hasil yang baik sehingga motovasi belajara mereka akan
bertambah juga, akan tetapi sekaligus mereka akan memahami posisi mereka sendiri
dalam pencapaian kompetensi.
e) Berkesinambungan
Penilaian tidak pernah mengenal waktu kapan penilaian seharusnya dilakukan.
Penilaian dilakukan secara terus-menerus dan berkesinambungan.
f) Bermakna
Penilaian tersusun dan terarah akan memberikan makna kepada semua pihak
khususnya siswa untuk mengetahui posisi mereka dalam memperoleh kompetensi dan
memahami kesulitan yang dihadapi dalam mencapai kompetensi. Dengan demikian,
hasil penilaian itu juga bermakna bagi guru juga termasuk bagi orang tua dalam
memberika bimbingan kepada siswa dalam upaya memperoleh kompetensi sesuai
dengan target kurikulu.
g) Menyeluruh
h) Edukatif
Penilaian kelas tidak semata-mata diarahkan untuk memperoleh gambaran
kemampuan siswa dalam pencapaian kompetensi melalui angka yang diperoleh, akan
tetapi hasil penilaian harus memeberikan umpan balik untuk memperbaiki proses
pembelajaran, baik yang dilakukan oleh guru maupun siswa, sehingga hasil belajar lebih
optimal. Dengan demikian, proses penilaian tidak semata-mata tanggung jawab guru
akan tetapi juga merupakan tanggung jawab siswa. Artinya siswa harus ikut terlibat
dalam proses penilaian, sehingga mereka meyadari, bahwa penilaian adalah bagian dari
proses pembelajara.
Sedangkan Daryanto (1997: 19-28) membagi syarat-syarat evaluasi menjadi 5 (lima) bagian,
diantaranya:
a) Keterpaduan
Evaluasi merupakan komponen integral dalam program pengajaran disamping tujuan
serta metode. Tujuan inttruksional, materi dan metode, serta evaluasi merupakan tiga
keterpaduan yang tidak boleh dipisahkan.
b) Koherensi
Dengan prinsip koherensi diharapkan evaluasi harus berkualitas dengan materi
pengajran yang sudah disajikan dan sesuai dengan ranah kemampuan yang hendak
diukur.
c) Pedagogis
Evaluasi perlu diterapkan sebagai upaya perbaikan sikap dan tingkah laku ditinjau dari
segi pedagogis. Evaluasi dan hasilnya hendaknya dapat dipakai sebagai alat motivasi
untuk siswa dalam kegiatan belajarnya.
d) Akuntabilitas
Sejauh mana keberhasilan program pengajaran perlu disampaikan kepada pihak-
pihak yang berkepentingan dengan pendidikan sebagai laporan pertanggungjawaban
(accountability).
BAB IV
KUALITAS ALAT EVALUASI
A. Validitas
Suatu alat evaluasi disebut valid (absah atau sahih) apabila alat tersebut mampu
mengevaluasi apa yang seharusnya dievaluasi. Oleh karena itu keabsahannya
tergantung pada sejauh mana ketepatan alat evaluasi itu dalam melaksanakan
fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika ia dapat
mengevaluasi dengan tepat sesuatu yang dievaluasi itu.
2. Validitas kriterium
Validitas ini diperoleh dengan melalui observasi atau pengalaman yang bersifat
empirik, kriterium itu dipergunakan untuk menentukan tinggi -rendahnya koefisien
validitas alat evaluasi yang dibuat melalui perhitungan korelasi. Ada dua macam
validitas yang termasuk ke dalam validitas kriterium ini, yaitu:
1. Validitas banding
Validitas banding seringkali disebut validitas bersama. Misalnya alat evaluasi
yang diselidiki validitasnya adalah tes matematika buatan guru (kita) dengan
menggunakan kriterium nilai rata-rata harian atau nilai tes sumatif yang telah ada,
dengan asumsi hasil evaluasi yang digunakan untuk kriterium itu telah
mencerminkan kemampuan siswa sebenarnya. Kedua tes tersebut diberikan
kepada subyek (siswa) yang sama. Apabila kedua nilai atau skor itu berkorelasi
tinggi, maka tes yang kita buat itu memiliki validitas yang tinggi pula.
2. Validitas Ramal
Sebuah alat evaluasi dikatakan memiliki validitas ramal yang baik jika ia
mempunyai kemampuan untuk meramalkan hal-hal yang akan terjadi di masa yang
akan dating.
Cara menentukan tingkat (indeks) validitas kriterium adalah dengan menghitung
koefisien korelasi antara alat evaluasi yang akan diketahui validitasnya dengan alat
ukur lain yang telah dilaksanakan dan diasumsikan telah memiliki validitas yang
tinggi (baik).
B. Realibilitas
Reliabilitas suatu alat ukur atau alat evaluasi dimaksudkan sebagai suatu alat yang
memberikan hasil yang tetap sama (konsisten). Hasil pengukuran itu harus tetap sama
(relatif sama) jika pengukurannya diberikan pada subyek yang sama meskipun dilakukan
oleh orang yang berbeda, waktu yang berbeda, dan tempat yang berbeda pula. Relatif di
sini dimaksudkan tidak tepat sama, tetapi mengalami perubahan yang tak berarti
(tidak signifikan) dan bisa diabaikan, Perubahan hasil evaluasi ini disebabkan adanya
unsur pengalaman dari peserta tes dan kondisi lainnya.
Jika anda mempunyai seperangkat tes misalnya tes untuk mengukur penguasaan siswa
dalam matematika, maka untuk mengetahui apakah tes tersebut mempunyai reliabilitas
yang tinggi atau tendah dapat dengan mudah Anda lakukan yaitu dengan mengujikan set
tes tersebut pada kelas yang sama sebanyak dua kali dengan selisih waktu yang tidak
terlalu lama dan juga tidak terlalu dekat. Pada perinsipnya hal ini berhubungan dengan
kekhawatiran bahwa siswa masih mengingat soal – soal tersebut dan kekhawatiran adanya
penambahan pengetahuan selama selang waktu kedua pengukuran tersebut. Jadi skor yang
anda peroleh dari pelaksanaan tes pertama tidak jauh berbeda dengan skor yang Anda
peroleh dari waktu tes kedua maka dapat dikatakan bahwa set tes Anda mempunyai
reliabilitas yang tinggi. Semakin sama skor yang Anda peroleh pada pengukuran pertama
dan kedua menunjukkan semakin tinggi reliabilitas set tes tersebut.
C. Daya Pembeda
Pengertian Daya Pembeda (DP) dari sebuah butir soal menyatakan seberapa jauh
kemampuan butir soal tersebut mampu membedakan antara testi yang mengetahui
jawabannya dengan benar dengan testi yang tidak dapat menjawab soal tersebut (atau
testi yang menjawab salah). Dengan perkataan lain daya pembeda sebuah butir soal
adalah kemampuan butir soal itu untuk membedakan antara testi (siswa) yang pandai atau
berkemampuan tinggi dengan siswa yang bodoh.
Daya pembeda suatu soal tes dapat dihitung dengan menggunakan rumus seperti
berikut:
DP=(WL-WH) / n
Keterangan:
DP : Daya Pembeda
n : Jumlah kelompok atas atau kelompok bawah
WL : jumlah peserta didik yang menjawab salah dari kelompok bawah
WH : jumlah peserta didik yang menjawab salah dari kelompok atas
Contoh:
Untuk mendapatkan gambar yang lebih jelas mengenai langkah-langkah yang
ditempuh dalam mencari Indeks kesukaran dan daya pembeda suatu item, di bawah ini
akan dikemukakan sebuah contoh.
1. Kita misalkan murid yang mengikuti tes yang kita berikan adalah sebanyak 50
orang. Lembar jawaban murid-murid tersebut kita susun dari skor tertinggi paling
atas sampai dengan skor rendah yang terbawah.
2. Kita ambil 27% dari mereka yang mendapatkan skor tertinggi. Dalam hal ini, 27%
x 50 orang sama dengan 13,5 orang kita bulatkan menjadi 14 orang. Begitu pula
kita ambil 27% dari mereka yang mendapatkan skor yang terendah. Jumlahnya
tentu sama dengan kelompok atas, yaitu 14 orang.
3. Misalkan data yang diperoleh adalah sebagai berikut:
Untuk item no.1, dari kelompok bawah salah 9 orang dan dari kelompok atas
salah 2 orang.
Untuk item no.2, dari kelompok bawah salah 8 orang dan dari kelompok atas
salah 5 orang.
Untuk item no.3, dari kelompok bawah salah 14 orang dan dari kelompok atas
salah 5 orang.
Untuk item no.4, dari kelompok bawah salah 6 orang dan dari kelompok atas
tidak ada yang salah.
Untuk item no.5, dari kelompok bawah salah 13 orang dan dari kelompok atas
salah 10 orang.
Untuk item no.6, dari kelompok bawah salah 2 orang dan dari kelompok atas
salah 3 orang.
4. Berdasarkan data tersebut, maka dapat dibuat tabel seperti di bawah ini.
No.Item WL WH WL + WH WL - WH
1 9 2 11 7
2 8 5 13 3
3 14 8 23 6
4 6 0 6 6
5 13 11 24 2
6 2 3 5 -1
5. Berdasarkan tabel diatas, maka indeks kesukaran untuk masing-masing item dapat
dicari sebagai berikut:
Untuk item no.1
DP=7/14=0,5
Untuk item no.2
DP=3/14=0,21
Untuk item no.3
DP=6/14=0,43
Untuk item no.4
DP=6/14=0,43
Untuk item no.5
DP=2/14=0,14
Untuk item no.6
DP=-1/14=-0,07
Daya Pembeda yang ideal adalah daya pembeda 0,40 ke atas. Namun untuk
ulangan-ulangan harian, masih dapat ditolerir daya pembeda sebesar 0,20. Item-
item yang memenuhi syarat dapat kita simpan dan kita gunakan untuk keperluan
evaluasi yang akan datang. Item-item yang tidak memenuhi syarat harus dibuang
atau direvisi.
Untuk menghitung tingkat kesukaran soal bentuk objektif dapat digunakan dengan dua
cara yaitu :
Menggunakan rumus tingkat kesukaran (TK) :
TK={(WL+WH)/(nL+nH)}X100%
Keterangan :
WL : jumlah peserta didik yang menjawab salah dari kelompok bawah
WH : jumlah peserta didik yang menjawab salah dari kelompok atas
nL : jumlah kelompok bawah
nH : jumlah kelompok atas
a) Menyusun lembar jawaban peserta didik dari skor tertinggi sampai skor terendah.
b) Mengambil 27% lembar jawaban dari atas yang selanjutnya disebut kelompok atas
(higher group), dan 27% lembar jawaban dari bawah yang selanjutnya disebut
kelompok bawah (lower group). Sisa sebanyak 46% disisihkan.
c) Membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta
didik, baik untuk kelompok atas maupun kelompok bawah. Jika jawaban peserta
didik benar, diberi tanda + (plus), sebaliknya jika jawaban peserta didik salah
diberi tanda – (minus).
Cara menghitung tingkat kesukaran untuk soal bentuk uraian adalah menghitung berapa
persen peserta didik yang gagal menjawab benar atau ada dibawah batas lulus (passing
grade) untuk tiap-tiap soal.
Untuk menafsirkan tingkat kesukaran soalnya dapat digunakan kriteria sebagai
berikut:
1. Jika jumlah peserta didik yang gagal mencapai 27%, termasuk mudah.
2. Jika jumlah peserta didik yang gagal antara 28% sampai dengan 72%, termasuk
sedang.
3. Jika jumlah peserta didik yang gagal 72% keatas, termasuk sukar.
Contoh :
33 orang peserta didik dites dengan 5 soal bentuk uraian. Skor maksimum ditentukan
10 dan skor minimum 0. Jumlah peserta didik yang memperoleh nilai 0-5 = 10 orang
(berarti gagal), nilai 6 = 12 orang, dan nilai 7 – 10 = 11 orang.
Jadi, tingkat kesukaran (TK) =10/33 X 100% =30,3%
Tingkat kesukaran 30,3 berada diantara 28 dan 72, berarti soal tersebut termasuk
sedang. Catatan : Batas lulus ideal = 6 (skala 0-10).
E. Efektivitas Option
Option adalah kemungkinan jawaban yang disediakan pada butir soal (tes) tipe
obyektif bentuk pilihan ganda atau memasangkan untuk dipilih oleh peserta tes, sesuai
dengan petunjuk yang diberikan. Suatu option disebut efektif jika memenuhi fungsinya
atau tujuan disajikannya option tersebut tercapai. Hal ini berarti bahwa setiap option yang
disajikan masing-masing mempunyai kemungkinan yang sama untuk dipilih, jika testi
menjawab soal itu dengan menerka-nerka (spekulasi).
Option yang merupakan jawaban yang benar disebut option kunci, sedangkan option
lainnya disebut option pengecoh. Agar suatu option yang disajikan efektif harus
diusahakan homogen (serupa), baik dari segi isi (materi), notasi, maupun panjang-
pendeknya kalimat pada option tersebut.
Berdasarkan distribusi pilihan pada setiap option untuk siswa kelompok atas dan
kelompok bawah, dapat ditentukan option yang berfungsi efektif atau tidak. Kriteria
option yang berfungsi efektif adalah:
1. Untuk option kunci
a. Jumlah pemilih kelompok atas harus lebih banyak daripada jumlah pemilih
kelompok bawah.
b. Jumlah pemilih kelompok atas dan kelompok bawah lebih dari 25% tetapi tidak
lebih dari 75% dari seluruh siswa kelompok atas dan kelompok bawah.