Suatu tes tidakk boleh terlalu mudah, dan juga tidak boleh terlalu sukar. Sebuah item yang terlalu mudah sehingga dapat dijawab dengan benar oleh semua siswa bukanlah merupakan item yang baik . begitu pula item yang terlalu sukar sehingga tidak dapat dijawab oleh semua siswa juga bukan merupakan item yang baik. Jadi item yang baik adalah item yang mempunyai derajat kesukaran tertentu.[5] Menurut Witherington dalam bukunya berjudul psychological Education, mengatakan bahwa sudah atau belum memadainya derajat kesukaran item tes hasil belajar dapat diketahui dari besar kecilnya angka yang melambangkan tingkat kesulitan dari item tersebut. Angka yang dapat memberikan petunjuk mengenai tingkat kesukaran item itu dikenal dengan istilah difficulty index ( angka index kesukaran item), yang dalam dunia evaluasi hasil belajar umumnya dilambangkan dengan huruf P, yaitu singkatan dari kata proportion( proporsi =proposa). Dan angka indek kesukaran item itu besarnya berkisar antara 0,00 sampai dengan 1,00. Artinya, angka indek kesukaran itu paling rendah adalah 0,00 dan paling tinggi adalah 1,00. Angka indek kesukaran sebesar 0,00 ( P= 0,00) merupakan petunjuk bagi tester bahwa butir item tersebut termasuk dalam katagori item yang terlalu sukar, sebab di sini seluruh testee tidak dapat menjawab item dengan betul ( yang dapat menjawab dengan betul =0). Sebaliknya, apabila angka indek kesukaran item itu adalah 1,00 ( P= 1,00) hal ini mengandung makna bahwa butir item yang bersangkutan adalah termasuk dalam katagori item yang terlalu mudah, sebab di sini seluruh testee dapat menjawab dengan betul butir item yang bersangkutan ( yang dapat menjawab dengan butir = 100%= 100= 1,00 Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut: Soal dengan P 0,00 sampai 0,30 adalah soal sukar Soal dengan P 0,30 sampai 0,70 adalah soal sedang Soal dengan P 0,70 sampai 1,00 adalah soal mudah
C. Teknik Analisis Daya Pembeda Item
Daya pembeda (item discriminination) adalah untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam kelomppok itu. Indeks yang digunakan dalam membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah. Indeks ini menunjukkan kesesuaian antara fungsi soal dengan fungsi tes secara keseluruhan.[9] Mengetahui daya pembeda item itu penting sekali, sebab salah satu dasar yang dipegang untuk menyusun butir-butir item tes hasil belajar adalah adanya anggapan, bahwa kemampuan antara siswa yang satu dengan siswa yang lain itu berbeda-beda, dan bahwa butir-butir tes hasil belajar itu haruslah mampu memberikan hasil tes yang mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat di kalangan siswa tersebut.[10] Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, disingkat D. Seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada tanda negatif.[11] Daya pembeda item itu dapat diketahui melalui atau dengan melihat besar kecilnya angka indeks diskriminasi item. Angka indeks diskriminasi item adalah sebuah angka yang menunjukkan besar kecilnya daya pembeda yang dimiliki oleh sebutir item. Daya pembeda pada dasarnya dihitung atas dasar pembagian siswa ke dalam dua kelompok, yaitu kelompok atas yakni kelompok yang tergolong pandai, dan kelompok bawah, yaitu kelompok siswa yang tergolong bodoh. Dalam hubungan ini, jika sebutir item memiliki angka indeks diskriminasi item dengan tanda positif, hal ini merupakanmpetunjuk bahwa butir item tersebut telah memiliki daya pembeda, dalam arti bahwa siswa yang termasuk kategori pandai lebih banyak yang dapat menjawab dengan betul terhadap butir item yang bersangkutan, sedangkan siswa yang termasuk kategori bodoh lebih banyak yang menjawab salah. Jika sebutir item angka indeks diskriminasinya = 0,00 (nihil), maka hal ini menunjukkan bahwa butir item yang bersangkutan tidak memiliki daya pembeda sama sekali, dalam arti bahwa jumlah siswa kelompok atas yang jawabannya betul (atau salah) sama dengan jumlah siswa kelompok bawah yang jawabannya betul. Jadi diantara kedua kelompok siswa tersebut tidak ada perbedaannya sama sekali, atau perbedaannya sama dengan nol. Adapun apabila angka indeks diskriminasi item dari sebutir item bertanda negatif, maka pengertian yang terkandung didalamnya adalah, bahwa butir item yang bersangkutan lebih banyak dijawab betul oleh siswa kelompok bawah ketimbang siswa kelompok atas.[12] Dengan demikian ada tiga titik pada daya pembeda yaitu: Adapun klasifikasi daya pembeda adalah:
daya pembedanya lemah sekali, Kurang dari 0,20 Poor (jelek) dianggap tidak memiliki daya pembeda yang baik
Butir item yang bersangkutan
0,20 0.40 Satisfactory (cukup) telah memiliki daya pembeda yang cukup (sedang) Butir item yang bersangkutan 0,40 0,70 Good (baik) telah memiliki daya pembeda yang baik Butir item yang bersangkutan Excellent (sangat 0,70 1,00 telah memiliki daya pembeda baik) yang baik sekali
Butir item yang bersangkutan
Bertanda negatif - daya pembedanya negatif (jelek sekali)[16]
D. Teknik Analisis Fungsi Distraktor
Pada saat membicarakan tentang objektif bentuk multiple choice item telah dikemukakan bahwa pada tes objektif bentuk multiple choice item tesebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan beberapa kemungkinan jawab, atau yang sering dikenal dengan istilah option atau alternatif. Option atau alternatif itu jumlahnya berkisar antara tiga sampai dengan lima buah, dan dari kemungkinan-kemungkinan jawab yang terpasang pada setiap butir item itu, salah satu diantaranya adalah merupakan jawaban betul, sedangkan sisanya adalah merupakan jawaban salah. Jawaban-jawaban salah itulah yang biasa dikenal dengan istilah distraktor (pengecoh). Tujuan utama dari pemasangan distraktor pada setiap butir item itu adalah, agar dari sekian banyak testee yang mengikuti tes hasil belajar ada yang tertarik untuk memilihnya, sebab mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban betul. Jadi mereka terkecoh, menganggap bahwa distraktor yang terpasang pada item itu sebagai kunci jawaban item, padahal bukan. Semakin banyak testee yang terkecoh, maka dapat dinyatakan bahwa distraktor yang dipasang itu makin dapat menjalankan fungsinya dengan sebaik-baiknya. Sebaliknya, apabila distraktor yang dipasang pada setiap butir item itu tidak laku(maksudnya: tidak ada seoangpun dari sekian banyak testee yang merasa tertarik untuk memilih distraktor tersebut sebagai jawaban betul), maka hal ini mengandung makna bahwa distraktor tersebut tidak menjalankan fungsinya dengan baik. Dengan kata lain, distraktor baru dapat dikatakan telah dapat menjalankan fungsinya dengan baik, apabila distraktor tersebut telah memiliki daya tarik demikian rupa, sehingga para testee (khususnya yang termasuk kategori kemampuan rendah) merasa bimbang, dan ragu-ragu sehingga pada akhirnya mereka menjadi terkecoh untuk memilih distraktor sebagai jawaban betul, sebab mereka mengira bahwa yang mereka pilih itu kunci jawaban item, padahal bukan. Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu: menganalisis pola penyebaran jawaban item. Adapun yang dimaksud pola penyebaran item ialah suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabnya terhadap kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir item. Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif yang dipasang pada butir item tertentu, samasekali tidak dipilih oleh testee. Dengan kata lain, testee menyatakan blangko. Pernyataan blangko ini sering dikenal dengan istilah Oniet dfan biasa diberi lambang dengan huruf O.[17] Sesuatu distraktor dapat diperlakukan dengan tiga cara: a. Diterima, karena sudah baik b. Ditolak, karena tidak baik c. Ditulis kembali, karena kurang baik Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu ditulis kembali, dengan perubahan seperlunya. Menulis soal adalah suatu pekerjaan sulit, sehingga apabila masih dapat diperbaiki saja, tidak dibuang. Suatu distraktor dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh 5% pengikut tes.[18]