Analisis tingkat kesukaran dimaksudkan untuk mengetahui apakah bentuk soal tergolong
mudah atau sukar. Tingkat kesukaran adalah bilangan yang menunjukan sukar atau
mudahnya suatu soal. (Arikunto, 1999: 207). Selain itu juga Tingkat kesukaran soal adalah
peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya
dinyatakan dalam bentuk indeks.
Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya untuk
keperluan ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk
keperluan seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar, dan
untuk keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran
rendah/mudah.
Untuk mengetahui tingkat kesukaran soal bentuk uraian digunakan rumus berikut ini.
: Skor maksimum
Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor tes. Untuk tes
yang sangat sukar (TK= < 0,25) distribusinya berbentuk positif skewed, sedangkan tes yang
mudah dengan TK= >0,80) distribusinya berbentuk negatif skewed.
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan kegunaan
bagi pengujian dan pengajaran.
(1) sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan kepada
siswa tentang hasil belajar mereka
(2) memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal
yang biasa.
Di samping kedua kegunaan di atas, dalam konstruksi tes, tingkat kesukaran butir soal sangat
penting karena tingkat kesukaran butir dapat:
(1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan penyebaran skor
tes atau jumlah soal dan korelasi antar soal),
(2) berhubungan dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi
korelasi antar soal, semakin tinggi reliabilitas.
Tingkat kesukaran butir soal juga dapat digunakan untuk memprediksi alat ukur itu sendiri
(soal) dan kemampuan peserta didik dalam memahami materi yang diajarkan guru. Misalnya
satu butir soal termasuk kategori mudah, maka prediksi terhadap informasi ini adalah seperti
berikut.
2) Sebagian besar siswa menjawab benar butir soal itu; artinya bahwa sebagian besar siswa
telah memahami materi yang ditanyakan.
Bila suatu butir soal termasuk kategori sukar, maka prediksi terhadap informasi ini adalah
seperti berikut.
3) Materi yang ditanyakan belum diajarkan atau belum tuntas pembelajarannya, sehingga
kompetensi minimum yang harus dikuasai siswa belum tercapai.
4) Materi yang diukur tidak cocok ditanyakan dengan menggunakan bentuk soal yang
diberikan (misalnya meringkas cerita atau mengarang ditanyakan dalam bentuk pilihan
ganda).
Namun, analisis secara klasik ini memang memiliki keterbatasan, yaitu bahwa tingkat
kesukaran sangat sulit untuk mengestimasi secara tepat karena estimasi tingkat kesukaran
dibiaskan oleh sampel (Haladyna, 1994: 145). Jika sampel berkemampuan tinggi, maka soal
akan sangat mudah (TK= >0,90). Jika sampel berkemampuan rendah, maka soal akan sangat
sulit (TK = < 0,40). Oleh karena itu memang merupakan kelebihan analisis secara IRT,
karena IRT dapat mengestimasi tingkat kesukaran soal tanpa menentukan siapa peserta
tesnya (invariance). Dalam IRT, komposisi sampel dapat mengestimasi parameter dan tingkat
Soal dikatakan baik apabila soal tersebut tidak terlalu sukar atau terlalu mudah. Soal yang
terlalu mudah, yakni semua anak dapat mengerjakan dengan benar, adalah tidak baik.
Demikian juga soal yang terlalu sukar, yaitu semua anak tidak dapat mengerjakan soal
dengan benar, juga merupakan soal yang tidak baik. Hal itu disebabkan karena soal yang
terlalu mudah tidak merangsang peserta didik untuk mempertinggi usaha memecahkannya.
Dan soal yang terlalu sukar menyebabkan peserta didik putus asa serta menjadi tidak
mempunyai semangat untuk mencoba lagi karena diluar jangkauannya.
Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal kategori mudah,
sedang, dan sukar. Pertimbangan pertama adalah adanya keseimbangan, yakni jumlah soal
sama untuk ketiga kategori tersebut. Artinya, soal mudah, sedang, dan sukar jumlahnya
seimbang. Persoalan lain adalah menentukan kriteria soal, yaitu ukuran untuk menentukan
apakah soal tersebut termasuk mudah, sedang atau sukar. Dalam menentukan kriteria ini
digunakan judgment dari guru berdasarkan pertimbangan-pertimbangan tertentu.
Pertimbangan tersebut antara lain adalah:
3. Isi bahan yang ditanyakan sesuai dengan bidang keilmunya, baik luasnya maupun
kedalamnya.
※ Contoh I:
Guru SKI memberikan 10 pertanyaan piihan berganda denga komposisi 3 soal mudah , 4 soal
sedang , dan 3 soal sukar. Jika di lukiskan susunan soalnya adalah sebagai berikut :
1 Pengetahuan Mudah
2 Aplikasi Sedang
3 Pemahaman Mudah
4 Analisis Sedang
5 Evaluasi Sukar
6 Sitesis Sukar
7 Pemahaman Mudah
8 Aplikasi Sedang
9 Analisis Sedang
10 Sitesis Sukar
Kemudian soal tersebut di berikan kepada 10 orang siswa dan tidak seorang pun yang tidak
mengisi seluruh pertanyaan tersebut. Setelah di periksa hasilnya adalah sebagai berikut.
Dari sebaran di atas ternyata ada tiga soal yang meleset, yakni soal nomor 3 yang semula di
proyeksikan kedalam kategori mudah, setelah di coba ternyata termasuk kedalam kadegori
sedang. Demikian,juga soal nomor 4 yang semula di proyeksikan sedang ternyata termasuk
kedalam kategori mudah. Nomor 9 semula di kategorikan sedang ternyata termasuk kedalam
kategori mudah. Sedangkan tujuh soal yang lainya sesuai dengan proyeksi semula atas dasar
tersebut ketiga soal diatas harus diperbaiki kembali.
Guru SKI memberikan 10 pertanyaan piihan berganda denga komposisi 3 soal mudah , 4 soal
sedang , dan 3 soal sukar. Jika di lukiskan susunan soalnya adalah sebagai berikut :
Dari sebaran di atas ternyata ada tiga soal yang meleset, yakni soal nomor 3 yang semula di
proyeksikan kedalam kategori mudah, setelah di coba ternyata termasuk kedalam kadegori
sedang. Demikian,juga soal nomor 4 yang semula di proyeksikan sedang ternyata termasuk
kedalam kategori mudah. Nomor 9 semula di kategorikan sedang ternyata termasuk kedalam
kategori mudah. Sedangkan tujuh soal yang lainya sesuai dengan proyeksi semula atas dasar
tersebut ketiga soal diatas harus diperbaiki kembali.
Daya pembeda (item discriminination) adalah untuk menentukan dapat tidaknya suatu soal
membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam
kelompok itu. Indeks yang digunakan dalam membedakan antara peserta tes yang
berkemampuan tinggi dengan peserta tes yang berkemampuan rendah. Indeks ini
menunjukkan kesesuaian antara fungsi soal dengan fungsi tes secara keseluruhan. Jadi Daya
pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara warga
belajar/siswa yang telah menguasai materi yang ditanyakan dan warga belajar/siswa yang
tidak/kurang/belum menguasai materi yang ditanyakan.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, disingkat D.
Seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00
sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada
indeks diskriminasi ada tanda negatif
Daya pembeda item itu dapat diketahui melalui atau dengan melihat besar kecilnya angka
indeks diskriminasi item. Angka indeks diskriminasi item adalah sebuah angka yang
menunjukkan besar kecilnya daya pembeda yang dimiliki oleh sebutir item. Daya pembeda
pada dasarnya dihitung atas dasar pembagian siswa ke dalam dua kelompok, yaitu kelompok
atas yakni kelompok yang tergolong pandai, dan kelompok bawah, yaitu kelompok siswa
yang tergolong bodoh. Dalam hubungan ini, jika sebutir item memiliki angka indeks
diskriminasi item dengan tanda positif, hal ini merupakanm petunjuk bahwa butir item
tersebut telah memiliki daya pembeda, dalam arti bahwa siswa yang termasuk kategori
pandai lebih banyak yang dapat menjawab dengan betul terhadap butir item yang
bersangkutan, sedangkan siswa yang termasuk kategori bodoh lebih banyak yang menjawab
salah.
Jika sebutir item angka indeks diskriminasinya = 0,00 (nihil), maka hal ini menunjukkan
bahwa butir item yang bersangkutan tidak memiliki daya pembeda sama sekali, dalam arti
bahwa jumlah siswa kelompok atas yang jawabannya betul (atau salah) sama dengan jumlah
siswa kelompok bawah yang jawabannya betul. Jadi diantara kedua kelompok siswa tersebut
tidak ada perbedaannya sama sekali, atau perbedaannya sama dengan nol. Adapun apabila
angka indeks diskriminasi item dari sebutir item bertanda negatif, maka pengertian yang
terkandung didalamnya adalah, bahwa butir item yang bersangkutan lebih banyak dijawab
betul oleh siswa kelompok bawah ketimbang siswa kelompok atas. Dengan demikian ada tiga
titik pada daya pembeda yaitu:.
Untuk mengetahui daya pembeda soal bentuk uraian adalah dengan menggunakan rumus
berikut ini.
IA : Jumlah skor maksimum salah satu kelompok pada butir soal yang diolah
Setelah indeks daya pembeda diketahui, maka harga tersebut diinterpretasikan pada kriteria
daya pembeda sesuai dengan tabel berikut.
1) Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks
daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau
ditolak.
• Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar
• Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang menebak
• Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah
informasi dalam butir soalnya
contoh :
Semua siswa kelompok atas dapat menjawab benar dan semua siswa kelompok bawah
menjawab salah, maka DB akan + 1,00. DB dapat di tentukan besarnya dengan rumus
sebagai berikut : PA – PB
Kembali pada tingkat kesukaran yang di tunjukkan pada tabel dapat kita lihat soal no 9
merupakan soal yang sukar bagi kelompok atas tetapi sangat mudah bagi kelompok bawah
soal no 10 merupakan soal yang sangat sukar baik bagi kelompok atas maupun kelompok
bawah. soal nomor 2 dan nomor 6 merupakan soal yang sangat sukar dagi kelompok bawah
tetapi relatif mudah untuk kelompok atas. Perhitungan daya beda sangatlah sederhana dan
menyajikan informasi yang dapat membedakan masing – masing kelompok berdasarkan
kemampuan mereka. (engelhart, 1965) . soal nomor 1 dan nomor 10 tidak menujukkan
perbedaan antar kelompok. Tidak adanya perbedaan tingkat kesukaran pada soal nomor 1 dan
nomor 10 yang juga menujukkan bahwa soal tidak dapat menujukkan perbedaan antar
kelompok. Soal no 5 dan no 9 mempunyai indeks dayabeda yang baik, tetapi terbalik. Tanda
negatif no 5 dan no 9 menujukkan bahwa peserta tes yang kemampuanya tinggi tidak dapat
menjawab soal dengan benar , tetapi peserta tes yang kemampuanya rendah menjawab
dengan benar , data setatistik diatas menunjukkan bahwa soal nomor 5 dan 9 merupakan soal
yang tidak baik, data setatistik menujukkan bahwa soal nomer 2,3,4,6,7 dan 8 merupakan soal
yang baik ditinjau dari daya pembeda.
Bagaimana cara menentukan daya pembeda soal uraian? Langkah yang di lakukan untuk
menghitung daya pembeda sama seperti yang dilakukan pada soal pilihan ganda. Urutkan
seluruh peserta tes berdasarkan perolehan sekor total dari yang tinggi keperolehan skor yang
rendah.
Dari contoh diatas dapat disimpulkan bahwa cara menghitung daya pembeda adalah dengan
menempuh langkah sebagai berikut :
2.Membuat daftar peringkat atau urutan hasil tes berdasarkan sekor yang di capainya.
4.Menghitung selisi tingkat kesukaran menjawab soal antara kelompok atas dan kelompok
bawah.
6.Menentukan ada tidaknya daya pembeda pada setiap nomor soal dengan kriteria “memiliki
daya pembeda”.
Daftar pustaka
Mahmud. 2012. Kumpulan makalah tingkat kesukaran dan daya beda.[online]. Tersedia di :
http://mahmud09-kumpulanmakalah.blogspot.co.id/2012/06/tingkat-kesukaran-dan-daya-
beda. html