Anda di halaman 1dari 20

BAB I

PENDAHULUAN

1.1 Latar Belakang


Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran. Untuk
mengukur keberhasilan proses pembelajaran diperlukan evaluasi dan proses analisis dari
evaluasi. Manfaat dari analisis evaluasi untuk mengetahui kekuatan dan kelemahan
pembelajaran dalam rangka meningkatkan proses pembelajaran. Karena itu begitu
pentingnya guru mengadakan analisis butir soal (distraktor, tingkat kesukaran, daya pembeda,
dan kualitas soal), validasi dan reliabilitas instrument.

Hasil dari proses penilaian perlu dilakukan analisis, untuk melihat validitas dan
efektivitas instrument, serta untuk mengetahui kelemahan dan kekuatan proses pembelajaran.
Ada tiga sasaran pokok ketika guru melakukan analisis terhadap hasil belajar, yaitu terhadap
guru, siswa dan prosedur pembelajaran. Fungsi analisis untuk guru terutama untuk
mendiagnosis keberhasilan pembelajaran dan sebagai bahan untuk merevisi dan
mengembangkan pembelajaran dan tes. Bagi siswa, analisis diharapkan
berfungsi mengetahui keberhasilan belajar, mendiagnosa mengoreksi kesalahan belajar, serta
Memotivasi siswa belajar lebih baik.

Pada makalah ini akan dibahas mengenai analisis soal berupa validitas, Reabilitas,
tingkat kesulitan soal, daya beda, dan fungsi pengecoh yang berguna sebagai pedoman bagi
pendidikan dalam melakukan analisis soal terutam untuk soal objektif.

1.2 Rumusan Masalah


1. Jelaskan Pengertian, karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan kelemahan
Validitas !
2. Jelaskan Pengertian, karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan kelemahan
Reliabilitas !
3. Jelaskan Pengertian, karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan kelemahan
Tingkat kesulitan soal !

1
4. Jelaskan Pengertian, karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan kelemahan
Daya beda !
5. Jelaskan Pengertian, karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan kelemahan
Fungsi pengecoh !

1.3 Tujuan Makalah


1. dapat menjelaskan Pengertian, karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan
kelemahan Validitas !
2. dapat menjelaskan karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan kelemahan
Reliabilitas !
3. dapat menjelaskan karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan kelemahan
Tingkat kesulitan soal !
4. dapat menjelaskan karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan kelemahan
Daya beda !
5. dapat menjelaskan karakteristik, prinsip-prinsip, fungsi, serta kelebihan dan kelemahan
Fungsi pengecoh !

2
BAB II
PEMBAHASAN

2.1 Validitas
• Pengertian
Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang
dilakukan oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris
guna mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas
adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya.
Suatu alat ukur disebut memiliki validitas apabila alat ukur tersebut isinya layak
mengukur objek yang seharusnya diukur dan sesuai dengan kreteria tertentu, artinya adanya
kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran. Ini sesuai
dengan Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B Anderson dan
disadur oleh Prof. Dr. Suharsimi Arikunto (2007, 65) bahwa A test is valid if it measures
what it purpose to measure bila diartikan sebuah tes dikatakan valid apabila tes tersebut
mengukur apa yang hendak diukur. Bilamana alat ukur tidak memiliki validitas yang dapat
dipertanggung jawabkan, maka data yang masuk juga sis dan kesimpulan yang ditarik juga
menjadi salah.

1. Validasi logis
Mengandung arti penalaran, sehingga validitas logis untuk suatu instrumen
evaluasi menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan
valid berdasarkan hasil penalaran. Kondisi valid itu dipandang terpenuhi karena
instrument itu telah dirancang sebaik mungkin menurut ketentuan yang ada.
Dengan keadaan itu validitas logis dapat dicapai apabila instrument disusun
mengikuti ketentuan yang ada. Validitas logis yang dapat dicapai oleh sebuah
instrumen terdiri dari dua yaitu :
a) Validitas Isi
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrument
yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Sebuah tes dikatakan
memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan
materi atau isi pelajaran yang di berikan. Oleh karena materi yang diajarkan tertera
dalam kurikulum maka validitas ini sering disebut juga dengan validitas kurikuler.

3
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara
merinci materi kurikulum atau materi buku pelajaran.
b) Validitas Konstruk
Validitas konstruk sebuah instrumen menunjukkan suatu kondisi sebuah
instrumen yang disusun berdasarkan konstruk-konstruk aspek kejiwaan yang
seharusnya dievaluasi. Sebuah tes dikatakan memiliki validitas konstruk apabila butir-
butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang
disebutkan dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir soal
mengukur aspek berfikir tersebut sudah sesuai dengan aspek berfikir yang menjadi
tujuan instruksional.

2. Validitas Empiris
Mengandung arti kata pengalaman. Sebuah instrument dikatakan memiliki
validitas empiris apabila sudah di uji dengan pengalaman. Sebagai contoh, seseorang
dapat diakui jujur oleh masyarakat lain apabila dalam pengalaman dia diakui memang
jujur.
Pada Validitas empiris terdiri dari dua cara yang dilakukan untuk mengujinya sehingga
dia menjadi valid. Pengujian itu dilakuakn dengan membandingkan kondisi instrumen
yang bersangkutan dengan suatu ukuran. Kriteria yang digunakan adalah :
a) Validitas Konkuren
Disebut juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan validitas
empiris. Sebuah instrument dikatakan memiliki validitas empiris jika hasilnya sesuai
dengan pengalaman. Jika ada istilah :sesuai” tentu ada dua hal yang dipasangkan,
dimana dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman
selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang
sudah ada.
Dalam membandingkan hasil sebuah tes maka diperlukan suatu alat pembanding. Maka
hasil tes merupakan sesuatu yang dibandingkan. Contoh : seorang guru ingin
mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini perlu
sebuah kreteria masa lalu yang datanya sekarang dimiliki. Misalnya nilai ulangan
harian atau nilai semester yang lalu.
b) Validitas prediksi
Prediksi artinya meramal. Dengan meramal selalu mengenai hal yang akan datang jadi
sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi apabila
4
mempunyai kemampuan untuk meramalkan apa yang terjadi pada masa yang akan
datang. Misalnya tes masuk perguruan tinggi adalah sebuah tes yang diperkirakan
dapat meramalkan keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan
datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi
rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin
keberhasilan kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena memiliki
nilai tes yang rendah jadi diperkirakan akan tidak mampu mengikuti perkuliahan yang
akan datang. a. Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh setelah peserta tes mengikuti pelajaran diperguruan tinggi. Jika ternyata siapa
yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan
yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki
validitas.

• Karakteristik
Karakteristik validitas yaitu sebagai berikut :
1) instrumen yang pengukurannya harus benar-benar mengukur konsep teori yang dianut
dan bukan konsep lainnya
2) konsepnya diukur dengan tepat.
3) Validitas menunjuk pada hasil dari penggunaan instrumen tersebut bukan pada
istrumennya. Suatu instrumen dikatakan valid, jika instrumen tersebut benar-benar
mengukur aspek atau segi yang akan diukur.
4) Validitas menunjukkan suatu derajat atau tingkatan.
5) Validitas instrumen tidak berlaku umum.

• Prinsip-prinsip
Validitas memiliki empat prinsip dalam melakukan uji validitas, yaitu :

- Interpretasi yang diberikan pada asesmen hanya valid terhadap derajat yang diarahkan ke
suatu bukti yang mendukung kecocokan dan kebenarannya.
- Kegunaan yang dapat dibuat dari hasil asesment hanya valid terhadap derajat yang
diarahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya.
- Interpretasi dan kegunaan dari hasil asesment hanya valid saat nilai (values) yang
dihasilkan sesuai.

5
- Interpretasi dan kegunaan dari hasil asesment hanya valid saat konsekuensi
(consequences) dari interpretasi dan kegunaan ini konsisten dengan nilai kecocokan.

• Fungsi
Fungsi dan kegunaan Validitas sendiri adalah untuk mengetahui sejauh mana
ketetapan dan kecermatan suatu instrumen pengukuran dalam melakukan fungsi ukurnya agar
data yang diperolah relevan atau sesuai dengan tujuan diadakanya pengukuran tersebut.

• kelebihan dan kelemahan


-Kelebihan :

1) agar dapat mengukur ketetapan dan kecermatan instrument dalam fungsi ukurnya

2) dapat menganalisis hasil evaluasi dari instrument ukur yang digunakan

-Kelemahan :

1) Ketakterwakilan konstruk, Menunjukkan bahwa tugas yang diukur dalam penilaian


tidak mencakup dimensi penting dari konstruk. Oleh karena itu, hasil tes tersebut tidak
mungkin untuk mengungkapkan kemampuan siswa sebenarnya dalam konstruk yang
hendak diukur oleh instrumen;

2) Penyimpangan keragaman konstruk berarti bahwa instrumen tersebut mengukur terlalu


banyak variabel, dan kebanyakan variabel tersebut tidak relevan terhadap isi konstruk.

2.2 Reliabilitas
• Pengertian
Kata reliabilitas dalam bahasa Indonesia yang digunakan saat ini, sebenarnya diambil
dari kata reliability dalam bahasa Inggris dan berasal dari kata reliable yang artinya dapat
dipercaya,keajegan, konsisten, keandalan, kestabilan. Suatu tes dapat dikatakan reliabel jika
tes tersebut menunjukkan hasil yang dapat dipercaya dan tidak bertentangan.

6
Menurut Sugiono (2005) Reliabilitas adalah serangkaian pengukuran atau serangkaian
alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu
dilakukan secara berulang. Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni
sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relatif tidak
berubah walaupun diteskan pada situasi yang berbeda-beda. Sedangkan Sukadji (2000)
mengatakan bahwa reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara
konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai
koefisien. Koefisien tinggi berarti reliabilitas tinggi.

Menurut Nursalam (2003) Reliabilitas adalah kesamaan hasil pengukuran atau


pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali–kali dalam
waktu yang berlainan. Alat dan cara mengukur atau mengamati sama–sama memegang
peranan penting dalam waktu yang bersamaan.

Menurut Arifin (1991), suatu tes dapat dikatakan andal (reliable) jika tes tersebut
mempunyai hasil yang taat asas (konsisten). Sedangkan Sudjana (2004) mengatakan bahwa
reliabilitas suatu tes adalah ketepatan atau kejegan tes tersebut dalam menilai apa adanya,
artinya kapan pun tes tersebut digunakanakan memberikan hasil yang sama atau relatif sama.

Berdasarkan beberapa pendapat tentang reliabilitas di atas, maka dapat diambil


kesimpulan bahwa reliabilitas adalah suatu pengukuran terhadap suatu tes yang melihat
apakah tes tersebut dapat mengukur apa yang seharusnya di ukur.

• Karakteristik
Sebuah tes dianggap memiliki reliabilitas yang baik apabila memiliki karakteristik
sebagai berikut:

1. Reliabilitas adalah properti dari serangkaian hasil tes. Ini berarti bahwa suatu tes
dikatakan baik jika dapat memberikan hasil yang akurat. Jika tes ditugaskan ke kelas
tertentu, itu juga dapat memberikan hasil yang konsisten ketika ditugaskan ke kelas
lain atau relatif berbeda jika diberikan ke kelas yang sama pada waktu yang berbeda.
2. Tes dianggap dapat diandalkan jika dua tes dilakukan pada interval yang berbeda dan
hampir tidak memberikan hasil apa pun.
3. Keandalan dapat diberikan untuk dua atau lebih pengukuran independen yang
diperoleh dari tes yang sama untuk setiap anggota kelompok.

7
• Prinsip-prinsip

1. Mengonsep satu variabel dengan jelas


2. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel. Sebuah
variabel harus spesifik agar dapat mengurangi intervensi informasi dari variabel lain.
3. Menggunakan level pengukuran yang tepat. Semakin tinggi atau semakin tepat
suatu level pengukuran, maka variabel yang dibuat akan
semakin reliabel karena informasi yang dimiliki semakin mendetai Prinsip dasarnya
adalah cobalah melakukan pengukuran pada level paling tepat yang mungkin
diperoleh
4. Gunakan lebih dari satu indikator.[2] Dengan adanya lebih dari satu indikator
yang spesifik, peneliti dapat melakukan pengukuran dari range yang lebih luas
terhadap konten definisi konseptual.
5. Gunakan Tes Pilot, yakni dengan membuat satu atau lebih draft atau dalam sebuah
pengukuran sebelum menuju ke tahap hipotesis (pretest).[2] Dalam penggunaan Pilot
Studies, prinsipnya adalah mereplikasi pengukuran yang pernah dilakukan
oleh peneliti terdahulu dari literatur-literatur yang berkaitan. Selanjutnya, pengukuran
terdahulu dapat dipergunakan sebagai patokan dari pengukuran yang dilakukan
peneliti saat ini. Kualitas pengukuran dapat ditingkatkan dengan berbagai cara
sejauh definisi dan pemahaman yang digunakan oleh peneliti kemudian tetap sama.

• Fungsi
Kegunaan reliabilitas data adalah untuk mengetahui atau menunjukkan keajekan suatu
tes dalam mengukur gejala yang sama pada waktu dan kesempatan yang berbeda. Untuk
mengetahui reliabilitas instrumen dalam penelitian ini digunakan analisis statistik dengan
menggunakan rumus alpa. Dengan taraf signifikansi 5% maka apabila r hitung > r tabel,
berarti item tersebut dinyatakan diterima (reliabel) sedangkan r hitung < r tabel, berarti item
tersebut dinyatakan tidak diterima (tidak reliabel). Pada pengujian reliabel ini hanya butir-
butir item atau soal yang valid saja diujikan dalam penelitian. Hal ini dimaksudkan untuk
mengurangi suatu kesalahan dalam pengambilan reliabilitas suatu instrumen.

• kelebihan dan kelemahan

8
- Kelebihan :
1. Reliabilitas memiliki derajat ketepatan, ketelitian atau keakuratan yang ditujukan oleh
instrumen pengukuran
2. menunjukkan sejauhmana hasil pengukuran tetap konsisten bila dilakukan
pengukuran dua kali atau lebih terhadap gejala yang sama, dengan alat ukur yang
sama
3. untuk mengetahui atau menunjukkan keajekan suatu tes dalam mengukur gejala yang
sama pada waktu dan kesempatan yang berbeda

-kelemahan
Kooefisien reliabilitas harus benar-benar diperhitungkan lebih dahulu standar
kesalahan pengukurannya, karena biasanya terdapat Perbedaan skor dari suatu pengukuran
kepengukuran lain ini terjadi karena adanya standard eror of measurement atau standar
kesalahan pengukuran

2.3 Tingkat kesulitan soal


• Pengertian
tingkat kesukaran tes atau tingkat kesulitan soal didefinisikan sebagai proporsi
peserta yang menjawab butir itu dengan benar. Apabila butir tes dijawab dengan benar oleh
semua peserta tes, berarti butir tes tersebut sangat mudah. Sebaliknya apabila tidak ada
peserta tes yang menjawab benar, berati butir tes tersebut sangat sukar. 1

Perhitungan analisis tingkat kesukaran soal adalah pengukuran seberapa besar


derajat kesukaran suatu soal. Suatu soal tes hendaknya tidak terlau sukar dan tidak pula
terlalu mudah.2 Asumsi yang digunakan untuk memperoleh kualitas soal yang baik
disamping memenuhi validitas dan reabilitas, adalah adanya keseimbangan dari tingkat
kesulitan soal tersebut. Keseimbangan yang dimaksudkan adalah adanya soal-soal yang
termasuk mudah, sedang, dan sukar secara proporsional. Jika suatu soal memiliki tingkat
kesukaran seimbang (proporsional), maka dapat dikatakan bahwa soal tersebut baik.
Tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam
menjawabnya, bukan dilihat dari sudut pandang guru sebagai pembuat soal.

1 Suwarto, Penge mban gan Tes Di agno stik dalam Pembel ajaran : Pan duan Praktis Ba gi Pendidik d an Cal on Pen didik, (Yo gyakarta: Pu staka Pelajar, 2 013 ), hlm. 105
2 Zainal Arifin, Evaluasi Pe mbelaj aran: Prin sip, Teknik, Prose dur…, hlm. 266

9
Tingkat kesukaran soal atau tingkat kesulitan soal adalah peluang untuk menjawab
benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk
indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang
besarnya berkisar 0,00 - 1,00 (Aiken (1994: 66). Semakin besar indeks tingkat kesukaran
yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK=
0,00 artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki TK= 1,00 artinya
bahwa siswa menjawab benar. Perhitungan indeks tingkat kesukaran ini dilakukan untuk
setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal
yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan
untuk soal obyektif. Rumusnya adalah seperti berikut ini (Nitko, 1996: 310).

Hasil perhitungan dengan menggunakan rumus di atas menggambarkan tingkat


kesukaran soal itu. Klasifikasi tingkat kesukaran soal dapat dicontohkan seperti berikut ini.

0,00 - 0,30 soal tergolong sukar

0,31 - 0,70 soal tergolong sedang

0,71 - 1,00 soal tergolong mudah

Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor tes.
Untuk tes yang sangat sukar (TK= < 0,25) distribusinya berbentuk positif skewed, sedangkan
tes yang mudah dengan TK= >0,80) distribusinya berbentuk negatif skewed.

• Karakteristik
Karakteristik dari tingkat kesukaran soal yakni Tingkat kesukaran soal dalaam
mengukur tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks.
Indeks tingkat kesukaran ini dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 -
1,00. Memiliki pengecoh yang membuat siswa lebih berpikir dan menganalisis. Teknik

10
analisis tingkat kesukaran soal dibedakan menjadi dua, yaitu soal bentuk pilihan ganda dan
soal bentuk uraian,dan Penafsiran tingkat kesukaran soal didasarkan atas beberapa kriteria.

• Prinsip-prinsip
(1) tes hasil belajar hendaknya mengukur hasil belajar yang telah ditentukan dengan jelas
dan sesuai dengan tujuan pengajaran
(2) tes hasil belajar hendaknya mengukur sampel yang representatif dari hasil belajar dan
bahan-bahan yang tercakup dalam pengajaran,
(3) tes hasil belajar hendaknya mencakup jenis-jenis pertanyaan yang paling sesuai untuk
mengukur hasil belajar yang diinginkan,
(4) tes hasil belajar hendaknya direncanakan agar hasilnya sesuai dengan hasil atau tujuan
yang diinginkan untuk keperluan tertentu,
(5) tes hasil belajar hendaknya dibuat dengan reliabilitas yang tinggi dan kemudian harus
ditafsirkan dengan hati-hati

• Fungsi
Tingkat kesukaran butir soal memiliki dua kegunaan, yaitu untuk guru dan untuk
pengujian atau pengajaran. Kegunaan bagi guru diantaranya adalah
1. Sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan
kepada peserta didik tentang hasil belajar mereka.
2. Memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir
soal yang bias.
Adapun kegunaan bagi pengujian dan pengajaran adalah
1. Pengenalan konsep yang diperlukan untuk diajarkan ulang
2. Tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah
3. Member masukan kepada siswa
4. Tanda-tanda kemungkinan adanya butir soal yang bias
Merakit tes yang memiliki ketepatan data soal.

• kelebihan dan kelemahan


-kelebihan :

11
1. sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan kepada
siswa tentang hasil belajar mereka,

2. memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal
yang bias.

3. dapat Merakit tes yang memiliki ketepatan data soal.

- Kelemahan

Tingkat kesukaran sangat sulit untuk mengestimasi secara tepat karena estimasi
tingkat kesukaran dibiaskan oleh sampel (Haladyna, 1994: 145). Jika sampel berkemampuan
tinggi, maka soal akan sangat mudah (TK= >0,90). Jika sampel berkemampuan rendah, maka
soal akan sangat sulit (TK = < 0,40).

2.4 Daya Beda


• Pengertian
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antarasiswa
yang berkemampuan tinggi dengan siswa yang berkemampuan rendah(Arikunto, 1999).
Metode uji yang ditujukan untuk mengukur kefektifan dari setiap butir soal yang termasuk
kedalam kategori skor tinggi dan skor rendah dalam keseluruhan tes.

Daya Pembeda (DP) dari sebuah butir soal menyatakan seberapa jauh kemampuan
butir soal tersebut mampu membedakan antara siswa mengetahui jawabannya dengan benar
dengan siswa yang tidak dapat menjawab soal tersebut (siswa yang menjawab dengan salah).
Dengan kata lain, daya pembeda sebuah butir soal adalah kemampuan butir soal untuk
membedakan antara siswa yang pandai dan siswa yang kurang pandai. Pengertian tersebut
didasarkan pada asumsi Galton bahwa suatu perangkat alat tes yang baik harus bisa
membedakan antara siswa yang pandai, rata-rata, dan bodoh karena dalam suatu kelas
biasanya terdiri dari ketiga kelompok tersebut. Sehingga hasil evaluasinya tidak baik semua
atau sebaliknya buruk semua. Juga tidak sebagian besar baik sebagian besar buruk, tetapi
haruslah berdistribusi normal. Siswa yang memiliki nilai baik dan siswa yang memiliki nilai
buruk ada (mewakili) meskipun sedikit, bagian terbesar berada pada hasil yang cukup.
Derajat daya pembeda (DP) suatu butir soal dinyatakan dengan Indeks Diskriminasi
(Discriminating Index) yang bernilai dari -1,00 sampai dengan 1,00. Indeks diskriminasi

12
makin mendekati 1,00 berarti daya pembeda soal tersebut makin baik, sebaliknya jika makin
mendekati 0,00 berarti daya pembeda soal tersebut makin buruk. Indeks diskriminasi bernilai
negatif (kurang dari 0,00) berarti kelompok siswa kurang pandai banyak yang menjawab
benar untuk soal tersebut, sebaliknya kelompok siswa yang pandai banyak yang menjawab
salah. Hal ini mengakibatkan siswa yang bodoh mendapatkan nilai yang baik, sedangkan
siswa yang pandai mendapatkan nilai yang jelek. Suatu butir soal yang indeks
diskriminasinya 0,00 berarti soal tersebut tidak memiliki daya pembeda. Hal ini terjadi jika
siswa pandai maupun siswa kurang pandai sama menjawab benar untuk soal tersebut, atau
sebaliknya kedua kelompok siswa tersebut menjawab salah. Jelas soal tersebut tidak baik.
Jika suatu soal memiliki indeks diskriminasi 1,00 berarti daya pembedanya sangat baik
(sempurna), meskipun kondisi ini jarang sekali terjadi.hal ini terjadi jika semua kelompok
siswa pandai menjawab benar dan semua kelompok siswa kurang pandai menjawab salah.

Rumus untuk menentukan daya pembeda adalah:

Siswa-siswa yang termasuk ke dalam kelompok atas adalah siswa pandai atau siswa
yang mendapat skor tinggi dalam menempuh evaluasi tersebut, sedangkan siswa-siswa yang
termasuk dalam kelompok bawah adalah siswa yang mendapatkan skor rendah (kecil).
Klasifikasi interpretasi untuk daya pembeda yang banyak digunakan adalah:
DP ≤ 0,00 sangat jelek
0,00 < DP ≤ 0,20 jelek
0,20 < DP ≤ 0,40 cukup
0,40 < DP ≤ 0,70 baik
0,70 < DP ≤ 1,00 sangat baik

13
• Karakteristik
Daya pembeda item itu dapat diketahui melalui atau dengan melihat besar kecilnya
angka indeks diskriminasi item, butir soal menyatakan seberapa jauh kemampuan butir soal
tersebut mampu membedakan antara siswa mengetahui jawabannya dengan benar dengan
siswa yang tidak dapat menjawab soal tersebut

• Prinsip-prinsip
salah satu dasar yang dipegang untuk menyusun butir-butir item tes hasil belajar
adalah adanya anggapan, bahwa kemampuan antara siswa yang satu dengan siswa yang lain
itu berbeda-beda, dan bahwa butir-butir tes hasil belajar itu haruslah mampu memberikan
hasil tes yang mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat di
kalangan siswa tersebut.
Langkah-langkah yang dilakukan untuk menganalisis daya pembeda butir tes adalah
sebagai berikut :
1. Mengurutkan jawaban siswa mulai dari yang tertinggi sampai dengan yang terendah.
2. Membagi kelompok Atas dan kelompok Bawah masing-masing 25 % atau 30 % atau
40 %.
3. Memberi skor 1 untuk setiap jawaban yang benar dan 0 untuk jawaban yang salah pada
tes pilihan ganda. Sedangkan pada tes essay diberikan skor sesuai pada rentangan yang
ditentukan.
4. Menghitung daya beda dengan rumus yang telah ditentukan.

• Fungsi
Fungsi daya pembeda butir soal adalah seperti berikut ini.

1) Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks
daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau
ditolak.

2) Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan


kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi yang

14
diajarkan guru. Apabila suatu butir soal tidak dapat membedakan kedua kemampuan
siswa itu, maka butir soal itu dapat dicurigai "kemungkinannya" seperti berikut ini.

• kelebihan dan kelemahan


- Kelebihan
Untuk mengukur apakah siswa mampu mengetahui jawabannya dengan benar dengan
siswa yang tidak dapat menjawab soal tersebut, Untuk meningkatkan mutu setiap
butir soal melalui data empiriknya. Berdasarkan indeks daya pembeda

2.5 Fungsi pengecoh


• Pengertian

Disebut juga dengan pola jawaban atau fungsi pengecoh, yaitu distribusi siswa dalam
hal menentukan pilihan pada soal bentuk pilihan ganda. Fungsi distraktor ini diperoleh
dengan menghitung banyaknya siswa yang memilih pilihan jawaban a, b, c, d dan e yang
tidak memiliki pilihan manapun. Dalam istilah evaluasi disebut omit disingkat O.
Pada saat membicarakan tentang objektif bentuk multiple choice item telah
dikemukakan bahwa pada tes objektif bentuk multiple choice item tesebut untuk setiap butir
item yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan beberapa
kemungkinan jawab, atau yang sering dikenal dengan istilah option atau alternatif.
Option atau alternatif itu jumlahnya berkisar antara tiga sampai dengan lima buah,
dan dari kemungkinan-kemungkinan jawab yang terpasang pada setiap butir item itu, salah
satu diantaranya adalah merupakan jawaban betul, sedangkan sisanya adalah merupakan
jawaban salah. Jawaban-jawaban salah itulah yang biasa dikenal dengan istilah distraktor
(pengecoh).
Menganalisis fungsi pengecoh (distractor) dikenal dengan istilah menganalisis
pola penyebaran jawaban butir soal pada soal bentuk pilihan ganda. Pola tersebut diperoleh
dengan menghitung banyaknya testee yang memilih pilihan jawaban butir soal atau yang
tidak memilih pilihan manapun (blangko). Dari pola penyebaran jawaban butir soal dapat
ditentukan apakah pengecoh berfungsi dengan baik atau tidak. Suatu pengecoh dapat
dikatakan berfungsi dengan baik jika paling sedikit dipilih oleh 5 % pengikut tes. Distraktor
adalah option (alternatif) yang mendampingi kunci jawaban. Fungsinya sebagai pengecoh.

15
Tujuannya: untuk mengecoh peserta tes. Semakin banyak peserta tes yang terkecoh, maka
distraktor tersebut semakin baik dalam menjalankan fungsinya. Dengan kata lain, distraktor
dapat dikatakan berfungsi dengan baik jika punya daya rangsang. Sebuah distraktor
dikatakan baik jika minimal 5% dari peserta tes memilihnya (terkecoh).

Indeks pengecoh dihitung dengan rumus:

IP = P x 100%

(N - B) (n - 1)

Keterangan:

IP = indeks pengecoh

P = jumlah peserta didik yang memilih pengecoh

N = jumlah peserta didik yang ikut tes

B = jumlah peserta didik yang menjawab benar pada setiap soal

n = jumlah alternatif jawaban

1= bilangan tetap

Catatan:

Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci jawaban),
maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian pengecoh tidak berfungsi.

Contoh:

50 orang peserta didik dites dengan 10 soal bentuk pilihan ganda. Tiap soal memiliki
alternatif jawaban (a, b, c, d, e). Kunci jawaban (jawaban yang benar) no. 8 adalah c. Setelah
soal no.8 diperiksa untuk semua peserta didik, ternyata dari 50 orang peserta didik, 20 peserta
didik menjawab benar dan 30 peserta didik menjawab salah. Idealnya, pengecoh dipilih
secara merata.

Berikut ini adalah contoh soal no.8.

Alternatif jawaban A B C D E

Distribusi jawaban peserta


7 8 20 7 8
didik

IP 93% 107% ** 93% 107%

16
Kualitas pengecoh ++ ++ ++ ++ ++

Keterangan:

** = kunci jawaban

++ = sangat baik

+ = baik

= kurang baik

_ = jelek

_ _ = sangat jelek

Pada contoh diatas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan 107%.
Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik sebab semua
pengecoh itu berfungsi. Jika pilihan jawaban peserta didik menumpuk pada satu alternatif
jawaban, misalnya seperti berikut:

Alternatif jawaban A B C D E

Distribusi jawaban peserta didik 20 2 20 8 0

IP 267% 27% ** 107% 0%

Kualitas pengecoh _ - ** ++ _

Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan (b)
tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu diganti karena
termasuk jelek, danpengecoh (b) perlu direvisikarena kurang baik. adapun kualitas pengecoh
berdasar indeks pengecoh adalah:

Sangat baik IP = 76% - 125%

Baik IP = 51% - 75% atau 126% - 150%

Kurang baik IP = 26% - 50% atau 151% - 175%

Jelek IP = 0% - 25% atau 176% - 200%

Sangat jelek IP = lebih dari 200%

17
• Karakteristik
Ciri-Ciri Pengecoh Yang Baik
1. Ada yang memilih, khususnya dari kelompok bawah
2. Dipilih lebih banyak oleh kelompok rendah daripada kelompok tinggi
3. Jumlah pemilih kelompok tinggi pada pengecoh itu tidak menyamai jumlah kelompok
tinggi yang memilih kunci jawaban
4. Paling sedikit dipilih oleh 5% pengikut tes

• Fungsi
Fungsi dari pemasangan distraktor pada setiap butir item itu adalah, agar dari sekian
banyak testee yang mengikuti tes hasil belajar ada yang tertarik untuk memilihnya, sebab
mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban betul. Jadi
mereka terkecoh, menganggap bahwa distraktor yang terpasang pada item itu sebagai kunci
jawaban item, padahal bukan. Semakin banyak testee yang terkecoh, maka dapat dinyatakan
bahwa distraktor yang dipasang itu makin dapat menjalankan fungsinya dengan sebaik-
baiknya. Sebaliknya, apabila distraktor yang dipasang pada setiap butir item itu “tidak
laku”(maksudnya: tidak ada seorangpun dari sekian banyak testee yang merasa tertarik
untuk memilih distraktor tersebut sebagai jawaban betul), maka hal ini mengandung makna
bahwa distraktor tersebut tidak menjalankan fungsinya dengan baik.

• kelebihan dan kelemahan


- Kelebihan
Dapat digunakan untuk mengukur sejauh mana tingkat pemahaman siswa dan cara
menganalisis soal

- Kelemahan
siswa yang memiliki kemampuan rendah susah untuk menganalisis soal karena
adanya pengecoh yang membuat siswa harus memiliki kemampuan berpikir dan
menganalisis lebih dalam

18
BAB III
PENUTUP

3.1 Kesimpulan
Pengolahan tes hasil belajar dalam rangka memperoleh proses belajar mengajar dapat
dilakukan dengan berbagai cara yaitu dengan membuat analisis soal ( item analysis ) dan
dengan menghitung validitas dan keandalan tes.
Perhitungan tingkat kesukaran soal adalah pengukuran seberapa besar derajat
kesukaran suatu soal. Soal yang baik adalah soal yang tidak terlalu mudah atau tidak
terlalu sukar. Item yang baik adalah item yang mempunyai derajat kesukaran tertentu.
Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal mampu
membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang
belum/kurang menguasai kompetensi berdasarkan kriteria tertentu.
Fungsi distraktor disebut juga dengan pola jawaban atau fungsi pengecoh, yaitu
distribusi siswa dalam hal menentukan pilihan pada soal bentuk pilihan ganda. Fungsi
distraktor ini diperoleh dengan menghitung banyaknya siswa yang memilih pilihan
jawaban a, b, c, d dan e yang tidak memiliki pilihan manapun.

3.2 Saran
Diharapkan para pendidik dan calon pendidik memahami bahwa evaluasi non tes juga
sangat penting disamping evaluasi tes. Karena dapat dinilai sikap, afektif dan psikomotorik
dari mahasiswa sehingga dapat dijadikan panduan untuk meningkatkan kualitas
kependidikan.

19
DAFTAR PUSTAKA

Arikunto, Suharsimi. 2006. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara


Arifin,Zaenal (2009), Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur, Bandung: PT.
Remaja Rosdakarya.
Arniatiu (2010). Evaluasi Pembelajaran. Makalah Perkuliahan. Padang : Non-Publikasi.
Bahri Djamarah, Saiful (2008). Psikologi Belajar. Jakarta : PT Rineka Cipta
Daryanto (2008), Evaluasi Pendidikan, Jakarta: PT. Rineka Cipta.

20

Anda mungkin juga menyukai