Anda di halaman 1dari 22

ANALISIS KUALITAS SOAL

(DAYA BEDA DAN TINGKAT KESUKARAN SOAL)

Afifah Fatihah

20200120032
A. Daya Beda

1. Pengertian

Analisis kualitas daya beda soal adalah proses


evaluasi yang dilakukan untuk menentukan sejauh
mana suatu soal dapat membedakan antara siswa
yang memiliki pemahaman yang tinggi dengan siswa
yang memiliki pemahaman yang rendah terhadap
materi yang diuji. Daya beda adalah ukuran statistik
yang menggambarkan seberapa baik suatu soal
dalam membedakan antara siswa yang memiliki
kemampuan yang berbeda.

Daya pembeda soal adalah kemampuan sesuatu soal


untuk membedakan antara siswa yang pandai
(berkemampuan tinggi) dengan siswa yang tidak
pandai (berkemampuan rendah). Angka yang
menunjukkan besarnya beda pembeda disebut
indeks Diskriminasi, disingkat D. Seperti halnya
indeks kesukaraan, indeks diskriminasi (daya
pembeda) ini berkisar antara 0,00 sampai 1,00 hanya
bedanya indeks kesukaraan tidak mengenal tanda
negatif. Tanda negatif pada indeks diskriminasi
digunakan jika sesuatu soal “terbalik” menunjukkan
kualitas tester yaitu anak pandai disebut tidak pandai
2

dan anak tidak pandai disebut pandai. Dengan


demikian ada tiga titik pada daya pembeda yaitu :1

Gambar 1. Daya Pembeda

Bagi sesuatu soal dapat dijawab benar oleh siswa pandai


maupun siswa tidak pandai, maka soal itu tidak baik karena
tidak mempunyai daya pembeda. Demikian pula jika semua baik
yang pandai maupun yang tidak pandai tidak dapat menjawab
dengan benar, soal tersebut tidak baik, juga karena tidak
mempunyai daya pembeda. Soal yang baik adalah soal yang
dijawab benar oleh siswa-siswa yang pandai saja. Seluruh
pengikut tes dikelompokkan menjadi 2 kelompok yaitu
kelompok pandai atau kelompok atas (upper group) dan
kelompok tidak pandai atau kelompok bawah (lower group).

2. Faktor yang Mempengaruhi Daya Beda Soal

Ada beberapa faktor yang perlu diperhatikan dalam


analisis kualitas daya beda soal:

1 Arief Aulia Rahman. Evaluasi Pembelajaran.


(Ponorogo: Uwais Inspirasi Indonesia, 2019),h.130
1. Pemahaman Materi: Pertama-tama, penting
untuk memastikan bahwa soal tersebut menguji
pemahaman yang relevan terhadap materi yang
diajarkan. Soal yang baik harus memerlukan
pemahaman konsep yang diperlukan dan dapat
menguji tingkat pengetahuan yang diharapkan
dari siswa.
2. Tingkat Kesulitan: Tingkat kesulitan soal juga
merupakan faktor penting dalam analisis daya
beda. Soal-soal yang terlalu mudah atau terlalu
sulit tidak akan memberikan informasi yang
berguna tentang perbedaan antara siswa yang
memiliki pemahaman yang berbeda. Oleh karena
itu, penting untuk memastikan adanya variasi
tingkat kesulitan dalam kumpulan soal yang
diberikan.
3. Indeks Daya Beda (Difficulty Index): Indeks daya
beda adalah ukuran statistik yang
menggambarkan seberapa sulit atau mudah
suatu soal bagi siswa secara keseluruhan. Indeks
daya beda berkisar antara -1 hingga +1. Jika
indeks daya beda berada di atas 0,5, berarti soal
tersebut cenderung mudah. Jika indeks daya
beda berada di bawah 0,5, berarti soal tersebut
cenderung sulit. Idealnya, sebaiknya terdapat
variasi indeks daya beda dalam kumpulan soal,
sehingga dapat membedakan antara siswa yang
memiliki pemahaman yang berbeda.
4. Indeks Daya Pisah (Discrimination Index): Indeks
daya pisah mengukur sejauh mana suatu soal
dapat membedakan antara siswa yang memiliki
kinerja tinggi dengan siswa yang memiliki kinerja
4

rendah. Indeks daya pisah berkisar antara -1


hingga +1. Jika indeks daya pisah mendekati +1,
berarti soal tersebut memiliki daya beda yang
tinggi dan dapat membedakan antara siswa yang
berkinerja tinggi dengan siswa yang berkinerja
rendah.
5. Analisis Statistik: Selain indeks daya beda dan
indeks daya pisah, analisis statistik lainnya seperti
analisis reliabilitas dan validitas juga penting
dalam mengevaluasi kualitas daya beda soal.
Reliabilitas mengukur sejauh mana soal dapat
memberikan hasil yang konsisten, sedangkan
validitas mengukur sejauh mana soal tersebut
dapat mengukur apa yang seharusnya diukur.

3. Cara Menentukan Daya Pembeda (Nilai D)

Untuk ini perlu dibedakan antara kelompok kecil


(kurang dari 100) dan kelompok besar (100 orang ke
atas).

a. Untuk Kelompok Kecil Seluruh kelompok


tester dibagi dua sama besar, 50%
kelompok atas dan 50% kelompok
bawah. Contoh :
Seluruh pengikut tes, dideretkan mulai dari
skor teratas sampai terbawah, lalu dibagi dua.

b. Untuk Kelompok Besar Mengingat biaya


dan waktu untuk menganalisa, maka
untuk kelompok besar biasanya hanya
diambil kedua kutubnya saja, yaitu 27%
skor teratas sebagai kelompok atas (JA)
dan 27% skor terbawah sebagai
kelompok bawah (JB).
JA = Jumlah kelompok atas
JB = Jumlah kelompok bawah
6

Rumus Mencari D Rumus untuk


menentukan indeks diskriminasi adalah:

Dimana
J = Jumlah Peserta tes
JA = Banyaknya peserta kelompok atas
JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas
yang menjawab soal benar
BB = Banyaknya peserta kelompok bawah
menjawab soal benar
𝐵𝐴
PA = = banyaknya peserta kelompok
𝐽𝐴
atas yang menjawab benar (ingat p
sebagai simbol indeks kesukaran).
𝐵𝐵
PB = 𝐽𝐵 = proporsi peserta kelompok
bawah yang menjawab benar
Contoh Perhitungan : Dari hasil analisa tes yang terdiri dari 10
butir soal yang dikerjakan oleh 20 orang siswa, terdapat dalam
tabel sebagai berikut:
8

Berdasarkan nama-nama siswa tersebut dapat kita peroleh skor-


skor sebagai berikut :
A=5 F=6 K=7 P=3 B=7 G=6 L=5 Q=8 C=8 H=6 M=3 R=8 D=5
I=8 N=7 S=6 E=10 J=7 O=0 T=6

Dari angka-angka yang belum teratur kemudian dibuat array


(uraian penyebaran), dari skor yang paling tinggi ke skor yang
paling rendah.
Array ini sekaligus menunjukkan adanya kelompok atas (JA) dan
kelompok bawah (JB) dengan pemilikannya sebagai berikut :

Mari kita perhatikan lagi tabel analisa, khusus untuk butir soal
nomor

1.  Dari kelompok atas yang menjawab betul 8 orang.

 Dari kelompok bawah yang menjawab betul 3 orang


Kita terapkan dalam rumus indeks diskriminasi :

JA = 10

JB = 10

P = 0,8

PB = 0,3

BA = 8
10

BB = 3

Maka D = PA – PB = 0,8 – 0,3 = 0,5

Butir soal ini jelek karena lebih banyak dijawab benar


oleh kelompok bawah dibandingkan dengan jawaban
kelompok atas. Ini berarti bahwa untuk menjawab soal
dengan benar dapat dilakukan dengan menebak: Butir-
butir soal yang baik adalah butir-butir soal yang mempunyai
indeks diskriminasi 0,4 sampai 0,7

Klasifikasi Daya Pembeda

D : 0,00 – 0,20 : jelek (poor)

D : 0,20 – 0,40 : cukup (satisfactory)

D : 0,40 – 0,70 : baik (good)

D : 0,70 – 1,00 : baik sekali (excellent)

D : Negatif, semuanya tidak wajib, jadi semua butir soal


yang mempunyai nilai D negatif sebaiknya dibuang saja
B. Tingkat Kesukaran Soal

1. Pengertian

Analisis tingkat kesukaran soal merupakan proses


untuk mengevaluasi seberapa sulit atau mudah
suatu soal ujian atau tes bagi siswa. Hal ini penting
untuk memahami tingkat kesulitan soal dalam
rangka mengukur kemampuan siswa secara akurat
dan membuat keputusan yang tepat terkait dengan
penilaian.

Analisis butir soal atau analisis item adalah


pengkajian pertanyaan-pertanyaan tes agar
diperoleh perangkat pertanyaan yang memiliki
kualitas yang memadai. Ada dua jenis analisis butir
soal, yakni analisis tingkat kesukaran soal dan
analisis daya pembeda, disamping validitas dan
reliabilitas. Menganalisis tingkat kesukaran soal
artinya mengkaji soal-soal tes dari segi kesulitannya
sehingga dapat diperoleh soal-soal mana yarg
termasuk mudah, sedang, dan sukar.2

Butir tes harus diketahui tingkat kesukarannya,


karena setiap pembuat tes perlu mengetahui apakah
soal itu sukar, sedang atau mudah. Tingkat
kesukaran soal dapat dilihat dari jawaban siswa.
Semakin sedikit jumlah siswa yang dapat menjawab

2 Dr. H. Abdul Qadir. Evaluasi dan Penilaian

Pembelajaran. (Yogyakarta: K-Media, 2017),h. 142


12

soal itu dengan benar, berarti soal itu termasuk sukar


dan sebaliknya semakin banyak siswa yang dapat
menjawab soal itu dengan benar, berarti itu
mengindikasikan soal itu tidak sukar atau soal itu
mudah.

Menurut Thomdike dan Hagen (1997), anaiisis


terhadap soal-soal (items) tes yang telah dijawab
oleh murid-murid mempunyai dua tujuan penting,
yaitu:
a. Jawaban-jawaban soal itu merupakan informasi
diagnostik untuk meneliti pelajaran dari kelas itu dan
kegagalan-kegagalan belajamya, serta selanjutnya
untuk membimbing ke arah cara belajar yang lebih
baik.
b. Jawaban-jawaban terhadap soal-soal yang
terpisah dan perbaikan (review) soal-soal yang di
dasarkan atas jawaban-jawaban itu merupakan basis
bagi penlapan tes-tes yang lebih baik untuk tahun
berikutnya

Soal yang baik adalah soal yang tidak terlalu mudah


atau tidak terlalu sukar. Soal yang terlalu mudah
tidak merangsang siswa untuk mempertinggi usaha
memecahkannya. Sebaliknya soal yang terlalu sukar
akan menyebabkan siswa menjadi putus asa dan
tidak mempunyai semangat untuk mencoba lagi,
karena diluar jangkauannya. Misalnya saja guru A
memberikan ulangan soalnya, mudah-mudah,
sebaliknya guru B kalau memberikan ulangan soal-
soalnya sukar-sukar. Dengan pengetahuannya
dengan kebiasaan ini maka siswa akan belajar giat
jika menghadapi ulangan dari guru B dan sebaliknya
jika akan mendapat ulangan dari guru A tidak mau
belajar giat atau bahkan mungkin tidak mau belajar
sama sekali.

Bilangan yang menunjukkan sukar dan mudahnya


suatu soal disebut indeks kesuakaran (Diffuculty
index). Besarnya indeks kesukaran antara 0,00
sampai dengan 1,0. Indeks kesukaran ini
menunjukkan taraf kesukaran soal. Soal dengan
indeks kesukaran 0,0 menunjukkan bahwa soal itu
terlalu sukar, sebaliknya indeks 1,0 menunjukkan
bahwa soalnya terlalu mudah.

Di dalam istilah evaluasi, indeks kesukaran ini diberi


simbol P (P besar), singkatan dari kata “Proporsi”.
Dengan demikian maka soal dengan P = 0,20.
Sebaliknya soal dengan P = 0,30 lebih sukar dari
pada soal dengan P = 0,80.
14

Adapun rumus mencari P adalah

Dimana:

P = indeks kesukaran

B = banyaknya siswa yang menjawab soal itu dengan


betul

JS = jumlah seluruh siswa peserta tes

Misalnya :

Ada 20 orang dengan nama kode A-T yang


mengajarkan tes yang terdiri dari 20 soal. Jawaban
tesnya dianalisa dan jawabannya tertera seperti
dibawah ini.

(1= jawaban benar, 0= jawaban salah)


Dari tabel yang disajikan di atas dapat ditafsirkan bahwa :
10
 Soal nomor 1 mempunyai taraf kesukaraan 20 = 0,5

 Soal nomor 13 adalah soal yang paling mudah karena seluruh


siswa peserta tes dapat menjawab :
20
Indeks kesukarannya =20 = 1,0
16

Menurut ketentuan yang sering diikuti, indeks kesukaraan


sering diklasifikasikan sebagai berikut:

 Soal dengan P 0,00 sampai 0,30 adalah soal sukar


 Soal dengan P 0,30 sampai 0,70 adalah soal sedang
 Soal dengan P 0,70 sampai 1,00 adalah soal mudah

Walaupun demikian itu yang berpendapat bahwa: soal-soal


yang dianggap baik, yaitu soal-soal sedang, adalah soal-soal
yang mempunyai indeks kesukaraan 0,30 sampai dengan 0,70.

2. Langkah-Langkah Analisis Tingkat Kesukaran Soal

Berikut adalah beberapa langkah yang dapat


dilakukan dalam analisis tingkat kesukaran soal:

1. Mengumpulkan Data: Kumpulkan data berupa


jawaban siswa pada setiap soal yang diberikan
dalam ujian atau tes. Data ini dapat berupa
jumlah siswa yang menjawab benar dan yang
menjawab salah untuk setiap soal.
2. Menghitung Persentase Kebenaran: Hitung
persentase siswa yang menjawab benar untuk
setiap soal dengan membagi jumlah siswa yang
menjawab benar dengan total jumlah siswa yang
mengerjakan soal tersebut. Persentase ini akan
memberikan gambaran awal tentang tingkat
kesukaran soal.
3. Menggunakan Indeks Kesukaran: Gunakan
indeks kesukaran, juga dikenal sebagai Difficulty
Index (DI), untuk mengukur secara lebih
kuantitatif tingkat kesulitan soal. Indeks
kesukaran dihitung dengan rumus DI = (Jumlah
siswa yang menjawab benar) / (Total jumlah
siswa). Indeks kesukaran memiliki rentang nilai
antara 0 hingga 1. Semakin tinggi nilai indeks
kesukaran, semakin mudah soal tersebut,
sedangkan semakin rendah nilainya, semakin
sulit soal tersebut.
4. Interpretasi Indeks Kesukaran: Interpretasikan
nilai indeks kesukaran untuk menilai tingkat
kesukaran soal. Umumnya, jika indeks kesukaran
berada di rentang 0,8-1,0, maka soal tersebut
dianggap sangat mudah. Jika indeks kesukaran
berada di rentang 0,6-0,8, maka soal tersebut
dianggap mudah. Jika indeks kesukaran berada
di rentang 0,4-0,6, maka soal tersebut dianggap
sedang. Jika indeks kesukaran berada di rentang
0,2-0,4, maka soal tersebut dianggap sulit. Jika
indeks kesukaran berada di rentang 0-0,2, maka
soal tersebut dianggap sangat sulit.
5. Evaluasi Kesulitan Soal: Evaluasi tingkat kesulitan
soal ini perlu dilakukan secara kontekstual
dengan mempertimbangkan karakteristik siswa
yang mengikuti ujian atau tes tersebut. Soal yang
dianggap sulit oleh siswa dengan kemampuan
rendah mungkin dianggap mudah oleh siswa
dengan kemampuan tinggi. Oleh karena itu,
penting untuk mempertimbangkan konteks
18

penggunaan soal saat mengevaluasi tingkat


kesukarannya.

C. Daya Beda dan Tingkat Kesukaran Soal

Daya beda dan tingkat kesukaran soal adalah dua


konsep terkait dalam analisis soal evaluasi pendidikan.
Meskipun keduanya terkait dengan tingkat kesulitan
soal, mereka memiliki perbedaan dalam konteks
evaluasi.

Tingkat Kesukaran Soal: Tingkat kesukaran soal mengacu


pada seberapa sulit atau mudah soal tersebut bagi
siswa. Hal ini dapat diukur menggunakan metode
persentase kebenaran atau indeks kesukaran. Soal yang
mudah memiliki persentase jawaban benar yang tinggi
atau indeks kesukaran yang tinggi (mendekati 1),
sementara soal yang sulit memiliki persentase jawaban
benar yang rendah atau indeks kesukaran yang rendah
(mendekati 0).

Daya Beda Soal: Daya beda soal mengacu pada sejauh


mana suatu soal mampu membedakan antara siswa
yang memiliki kemampuan tinggi dan siswa yang
memiliki kemampuan rendah. Ini mencerminkan
kemampuan soal untuk membedakan antara siswa
berkinerja tinggi dan siswa berkinerja rendah dalam
menguasai materi yang diuji. Daya beda dapat diukur
menggunakan indeks daya pisah. Jika indeks daya pisah
mendekati +1, berarti soal tersebut memiliki daya beda
yang tinggi dan mampu membedakan antara siswa
dengan kinerja tinggi dan rendah. Jika indeks daya pisah
mendekati 0, artinya soal tersebut tidak efektif dalam
membedakan siswa dengan kinerja yang berbeda.

Perbedaan Utama:
 Tingkat kesukaran soal berkaitan dengan seberapa sulit
atau mudah soal itu sendiri, sedangkan daya beda soal
berkaitan dengan kemampuan soal untuk membedakan
antara siswa dengan kinerja tinggi dan rendah.
 Tingkat kesukaran soal diukur dengan menggunakan
persentase kebenaran atau indeks kesukaran, sedangkan
daya beda soal diukur dengan menggunakan indeks
daya pisah.
 Tingkat kesukaran soal berkaitan dengan karakteristik
soal itu sendiri, sedangkan daya beda soal berkaitan
dengan kemampuan soal untuk memberikan informasi
tentang kinerja siswa.
Kedua konsep ini penting dalam analisis kualitas soal
evaluasi pendidikan. Soal yang baik harus memiliki
variasi tingkat kesukaran yang tepat sehingga dapat
mengukur kemampuan siswa secara akurat. Selain itu,
soal yang memiliki daya beda yang baik dapat
memberikan informasi yang berguna dalam
membedakan kemampuan siswa yang berbeda.

Asumsi yang digunakan untuk memperoleh kwalitas


yang baik disamping memenuhi validitas dan reliabilitas
adalah daya keseimbangan dari tingkat kesulitan soal
tersebut. Keseimbangan yang dimaksudkan adalah
20

adanya soal-soal yang termasuk mudah sedang dan


sukar secara porposional Tingkat kesukaran soal
dipandang dari kesanggupan atau kemampuan siswa
dalam menjawabnya, bukan dilihat dari segi guru dalam
melakukan analisis pembuat soal.

Ada beberapa dasar pertimbangan dalam menentukan


proporsi jumlah soal kategori mudah sedang dan sukar.
Pertimbangan pertarna adalah adanya keseimbangan,
yakni jumlah soal sama untuk ke tiga kategori tersebut.
dan ke dua proposi jumlah soal untuk ke tiga kategori
tersebut artinya sebagian besar soal berada dalam
kategori sedang sebagian lagi termasuk kategori mudah
dan sukar dengan proporsi yang seimbang.

Perbandingan antara soal mudah sedang sukar bisa di


buat 3-4-3. Artinya, 30% soal kategori mudah 40% soal
kategori sedang dan 30% lagi soal kategori sukar. Di
samping itu oleh karena suatu tes dimaksudkan untuk
memisahkan antara murid-murid yang betul-betul
mempelajari suatu pelajaran dengar murid-murid yang
tidak mempelajari pelajaran itu, maka tes atau item yang
baik adalah tes atau item yang betul-betul dapat
memisahkan ke dua golongan murid tadi. Jadi setiap
item disamping harus mempunyai derajat kesukaran
tertentu juga harus mampu membedakan antara murid
yang pandai dengan murid yang kurang pandai.

Anda mungkin juga menyukai