Anda di halaman 1dari 28

Taraf Kesukaran, Daya Beda,

dan Efektivitas Pengecoh

Oleh:
Putu Gede Widhy Adnyana
1823011023

Dosen Pengampu:
Prof. Dr. I Made Ardana, M.Pd.

MATA PELAJARAN STUDI PENDIDIKAN MATEMATIKA


MATA PELAJARAN PASCA SARJANA
UNIVERSITAS PENDIDIKAN GANESHA
2019
ABSTRAK
Taraf kesukaran butir yang dinyatakan dengan indeks kesukaran butir
didefinisikan sebagai proporsi peserta tes yang menjawab butir tersebut dengan
benar. Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat
diketahui dari indeks kesukaran atau taraf kesulitan yang dimiliki oleh masing –
masing butir item tersebut. Rumus/Formula yang dapat digunakan untuk
menghitung Indeks Kesukaran urain dapat menggunakan (Candiasa, 2010) dan
Kusaeri (2012). Untuk menghitung indeks kesukaran tiap butir soal pilihan ganda
dapat digunakan formula (Candiasa, 2010). Daya pembeda adalah pengkajian
butir-butir soal yang dimaksudkan untuk mengetahui kesanggupan butir-butir tes
untuk membedakan siswa yang tergolong mampu dengan siswa yang tergolong
tidak mampu. Untuk menentukan nilai indeks diskriminasi pada butir soal uraian
dapat dilakukan dengan menggunakan rumus Kusaeri (2012). Untuk mengetahui
besar kecilnya indeks diskriminasi butir soal pilihan ganda. dapat digunakan tiga
macam rumus (Arikunto, 2005), (Sudijono, 2011) dan (Candiasa, 2010). Analisis
efektivitas pengecoh (distractor) atau analisis jawaban yang dilakukan dengan
menghitung peserta tes yang memilih tiap alternative jawaban pada masing-
masing butir. Kriteria pengecoh yang baik adalah apabila pengecoh tersebut
dipilih oleh paling sedikit 5% dari peserta tes.

A. PENDAHULUAN
Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran.
Untuk mengukur keberhasilan proses pembelajaran diperlukan evaluasi dan
proses analisis dari evaluasi. Manfaat dari analisis evaluasi untuk mengetahui
kekuatan dan kelemahan pembelajaran dalam rangka meningkatkan proses
pembelajaran. Karena itu begitu pentingnya guru mengadakan analisis butir soal
(tingkat kesukaran, daya pembeda, dan efektifitas pengecoh), validasi dan
reliabilitas instrument. Tes atau instrument merupakan alat evaluasi yang sering
digunakan untuk mengukur keberhasilan proses pembelajaran. Oleh karena itu, tes
harus dibuat dengan benar, sehingga tes yang disusun memiliki kualitas yang
tinggi agar berfungsi dengan baik.
Hasil dari proses penilaian perlu dilakukan analisis, untuk melihat validitas
dan efektivitas instrument, serta untuk mengetahui kelemahan dan kekuatan
proses pembelajaran. Ada tiga sasaran pokok ketika guru melakukan analisis
terhadap hasil belajar, yaitu terhadap guru, siswa dan prosedur pembelajaran.
Fungsi analisis untuk guru terutama untuk mendiagnosis keberhasilan
pembelajaran dan sebagai bahan untuk merevisi dan mengembangkan
pembelajaran dan tes. Bagi siswa, analisis diharapkan berfungsi mengetahui

1
keberhasilan belajar, mendiagnosa mengoreksi kesalahan belajar, serta
Memotivasi siswa belajar lebih baik.
Pada dasarnya tujuan umum penyusunan tes adalah untuk memperoleh tes
dengan jumlah item minimum, namun dapat menghasilkan skor pengukuran
dengan tingkat reliabilitas dan validitas yang tinggi. Oleh karena itu, diperlukan
analisis untuk mengetahui kualitas soal yang disusun tersebut. Analisis yang
dilakukan antara lain tingkat kesukarannya, daya pembedanya, pola jawaban soal,
dan hubungan tiap butir soal dengan skor keseluruhan. Dalam makalah ini akan
dibahas mengenai taraf kesukaran, daya pembeda, dan efektivitas pengecoh.

B. IDENTIFIKASI MASALAH
Berdasarkan paparan di atas, maka dapat dirumuskan beberapa
permasalahan yaitu sebagai berikut.
1. Apakah yang dimaksud dengan taraf kesukaran butir soal dan bagaimana
metode menilainya?
2. Apakah yang dimaksud dengan daya beda butir soal dan bagaimana metode
menilainya?
3. Apakah yang dimaksud dengan efektivitas pengecoh butir soal dan
bagaimana metode menilainya?

C. PEMBAHASAN
1. Taraf Kesukaran Butir
Taraf kesukaran butir yang dinyatakan dengan indeks kesukaran butir
didefinisikan sebagai proporsi peserta tes yang menjawab butir tersebut dengan
benar. Analisis butir soal yang dilakukan antara lain adalah analisis indeks
kesukaran butir soal. Berikut ini merupakan penjelasan mengenai analisis indeks
kesukaran butir soal yang meliputi pengertian indeks kesukaran, indeks kesukaran
untuk butir soal uraian dan soal pilihan ganda.

1.1 Pengertian Indeks Kesukaran


Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama
dapat diketahui dari indeks kesukaran atau taraf kesulitan yang dimiliki oleh
masing – masing butir item tersebut. Butir-butir item tes hasil belajar dapat

2
dinyatakan sebagai butir-butir item yang baik, apabila butir-butir item tersebut
tidak terlalu sukar tidak pula terlalu mudah dengan kata lain derajat kesukaran
item tersebut adalah sedang atau cukup sehingga dapat dikatakan bahwa analisis
tingkat kesukaran dimaksudkan untuk mengetahui apakah soal tersebut tergolong
mudah atau sukar. Tingkat kesukaran itu sendiri memiliki pengertian sebagai
bilangan yang menunjukan sukar atau mudahnya sesuatu soal.
Hasil evaluasi dari suatu perangkat tes yang baik akan menghasilkan skor
atau nilai yang membentuk distribusi normal. Hal ini mempunyai implikasi bahwa
soal yang baik akan menghasilkan skor yang berdistribusi normal pula. Jika soal
tersebut terlalu sukar, maka frekuensi distribusi yang paling banyak terletak pada
skor yang rendah karena sebagian besar siswa mendapat nilai yang jelek.
Distribusinya berbentuk condong kearah kanan (skewness positive) seperti tampak
pada gambar 1 di bawah ini.

Gambar 1. Distribusi Normal dan Distribusi Skweness Possitive

Jika soal seperti ini sering kali diberikan, akan mengakibatkan siswa menjadi
putus asa. Hal ini bukan berarti soal tersebut tidak boleh sukar, karena jika
sewaktu-waktu atau dalam seperangkat diberikan beberapa soal yang sukar akan
melatih siswa untuk berpikir lebih tinggi. Sebaliknya jika soal yang diberikan
terlalu mudah, maka frekuensi distribusi yang paling banyak berada pada skor
yang tinggi, karena sebagian besar siswa mendapat nilai baik. Distribusinya
berbentuk condong ke kiri (skewness negatif) sepert tampak pada gambar 2
berikut.

Gambar 2. Distribusi Normal dan Distribusi Skweness Negative

3
Jika terlalu sering hal ini dialami, soal seperti ini kurang merangsang siswa
untuk berpikir tingkat tinggi sehingga kurang merangsang siswa untuk
meningkatkan motivasi belajarnya. Kedua kondisi tersebut diatas, pada
kenyataannya kadang-kadang terjadi di sekolah. Ada guru yang bangga jika soal
tes yang dibuatnya dianggap sukar oleh siswanya, sehingga nilai rata-rata yang
dicapai sangat rendah. Guru tersebut menganggap dirinya pandai, murid tidak
mungkin menyamainya. Sebaliknya ada pula guru yang bangga jika soal tes yang
dibuatnya dapat dengan mudah dikerjakan oleh siswa, sehingga rata-rata nilai
siswa kebanyakan baik. Ia bangga bahwa ia “pandai” mengajar, padahal soal-soal
yang diberikan hanya menuntut kemampuan berfikir siswa yang rendah. Kondisi
ini membuat siswa hafal terhadap karakter dan kebiasaan gurunya, sehingga
seringkali muncul guru favorit dan guru yang tidak disukai oleh siswanya.
Akibatnya, bukan mata pelajaran yang menjadi hal utama, tetapi gurunya. Istilah
lain yang muncul adalah bahwa seorang siswa yang mendapat nilai baik atau
buruk, lulus atau tidak lulus, bukanlah dari suatu mata pelajaran tertentu tetapi
dikarenakan tenaga pendidiknya. Jadi bukan baik atau jelek, lulus atau tidak lulus,
yang mencerminkan penguasaan suatu materi pelajaran tetapi lebih mencerminkan
berkenaan atau tidak berkenaan dari tenaga pendidik yang bersangkutan.
Tingkat kesukaran butir soal memiliki dua kegunaan, yaitu untuk guru dan
untuk pengujian dan pengajaran. Kegunaan bagi guru diantaranya :
a. Sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi
masukan kepada siswa tentang hasil belajar mereka.
b. Memperoleh informasi tentang penekanan kurikulum atau mencurigai
terhadap butir soal yang bias.

Adapun kegunaan bagi penguji dan pengajaran adalah sebagai berikut:


a. Pengenalan konsep yang diperlukan untuk diajarkan ulang.
b. Tanda – tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah
c. Memberi masukan kepada siswa
d. Tanda – tanda kemungkinan adanya soal yang bias.

Whiterington (dalam Sudijono, 2009) mengatakan bahwa sudah atau


belum memadainya derajat kesukaran item tes hasil belajar dapat diketahui dari

4
besar kecilnya angka yang melambangkan tingkat kesulitan dari item tersebut.
Angka yang dapat memberikan petunjuk tentang tingkat kesulitan tersebut disebut
dengan istilah difficulty index atau indeks kesukaran, yang dalam dunia evaluasi
hasi belajar umumnya dilambangkan dengan P, yaitu singkatan dari kata
proportion (proporsi = proposa). Nilai dari difficulty index dinyatakan dalam
bilangan real pada interval 0,00 sampai dengan 1,00. Soal dengan indeks
kesukaran mendekati 0,00 berarti butir soal tersebut terlalu sukar, sebaliknya soal
dengan indeks kesukaran 1,00 berarti soal tersebut terlalu mudah. Kontinum
indeks kesukaran adalah seperti gambar 3 di bawah ini.

0,00 1,00
sukar - mudah

Gambar 3. Interval Indeks Kesukaran

Guna mengetahui besar kecilnya nilai dari tingkat kesukaran suatu butir soal, pada
bagian selanjutnya dijelaskan mengenai cara menghitung tingkat kesukaran suatu
butir soal uraian dan pilihan ganda. Makna dari besar kecilnya nilai tingkat
kesukaran suatu butir soal diintepretasikan sesuai dengan tabel 1.

Tabel 1. Intepretasi Tingkat Kesukaran


Interpretasi Tingkat Kesukaran Butir Soal
IK = 0,00 soal terlalu sukar
0,00 < IK ≤ 0,30 soal sukar
0,30 < IK ≤ 0,70 soal sedang
0,70 < IK < 1,00 soal mudah
IK = 1,00 soal terlalu mudah
(Sumber: Candiasa, 2010)
Tabel tersebut dapat digunakan untuk mengintepretasikan nilai dari indeks
kesukaran yang dimiliki oleh soal uraian ataupun pilihan ganda.

1.2 Indeks Kesukaran Butir Soal Uraian


Untuk kepentingan evaluasi hasil belajar siswa, tidak jarang seorang guru
akan menggunakan bentuk tes berupa soal uraian. Analisis tingkat kesukaran soal
uraian dapat dilakukan dengan langkah-langkah dan rumus berikut ini.

5
Langkah-langkah yang patut diikuti adalah sebagai berikut.
1. Susunlah lembar jawaban siswa berurutan, mulai dari yang mendapat skor
tertinggi sampai kepada yang mendapat skor terendah.
2. Membuat dua kelompok dari lembar jawaban itu, yakni satu kelompok mulai
dari skor tertinggi dan satu kelompok lagi dimulai dari skor terendah.
Rumus/Formula yang dapat digunakan untuk menghitung Indeks Kesukaran :
a. Formula yang digunakan untuk menghitung Indeks Kesukaran Butir (IK) tes
uraian adalah sebagai berikut.

IK 
 U   L  2 N  S  (Candiasa, 2010)
min

2 N S max  S min 
Keterangan :

U : jumlah skor Kelompok Atas (KA)

L : jumlah skor Kelompok Bawah (KB)

N : jumlah peserta tes


S max : skor tertinggi butir

Smin : skor terendah butir


Secara umum, kelompok atas dan kelompok bawah ditentukan berdasarkan
skor total dengan rentangan 10 samapi 33 persen. Apabila skor berdistribusi
normal, maka 27 persen skor tertinggi dan 27 persen skor terendah masing –
masing akan menjadi kelompo atas dan kelompok bawah.

b. Kusaeri (2012) menyatakan rumus yang digunakan untuk menghitung tingkat


kesukaran soal uraian yaitu
Mean
IK 
Skor maksimum yang ditetapkan
Dengan
Jumlah skor siswa peserta tes pada suatu soal
Mean 
jumlah peserta didik yang mengikuti tes

Contoh untuk menentukan tingkat kesukaran soal uraian disajikan pada contoh 1.

6
Contoh 1. Menentukan Indeks kesukaran Soal Uraian
Berikut ini disajikan contoh penerapan rumus (a) dan (b) pada uji coba sebuah tes
urain yang terdiri dari 10 butir yang diujicobakan terhadap 15 orang responden.
Skor maksimum masing – masing butir adalah 10 dan skor minimum adalah 0.
Hasil uji coba tampak pada tabel 2 di bawah ini. Pada table 2 disajikan hasil uji
coba untuk butir nomor 1. Skor responden untuk butir nomor 1 sudah diranking
dari yang terbesar sampai terkecil. Kelompok atas dan kelompo bawah masing-
masing terdiri dari 4 orang responden.
Tabel 2. Hasil Uji
Responden/siswa Skor Butir No.1 Kelompok Total
A 9 Atas
B 8 Atas
ΣU= 31
C 7 Atas
D 7 Atas
E 7 Tidak Terambil
F 6 Tidak Terambil
G 6 Tidak Terambil
H 6 Tidak Terambil
I 6 Tidak Terambil
J 5 Tidak Terambil
K 5 Tidak Terambil
L 5 Bawah
M 4 Bawah
ΣL = 17
N 4 Bawah
O 4 Bawah
Berdasarkan data pada tabel 2 dihitung indeks kesukaran butir tersebut

a. Dengan menggunakan rumus IK 


 U   L  2 N  S  min

2 N S max  S min 

31  17  24  0 48
IK    0.60
2410  0 80
Jadi indeks kesukaran butir nomor 1 pada hasil uji coba di atas sama dengan
0.60. Karena indeks kesukaran untuk soal nomor 1 = 0.60 maka butir soal
tersebut termasuk soal yang sedang.
Mean
b. Dengan menggunakan rumus IK 
Skor maksimum yang ditetapkan

7
Jumlah skor siswa peserta tes pada suatu soal
Mean 
jumlah peserta didik yang mengikuti tes
48
Mean  6
8

6
IK   0.6
10
Jadi indeks kesukaran butir nomor 1 pada hasil uji coba di atas dengan rumus
(b) sama dengan 0.60. Karena indeks kesukaran untuk soal nomor 1 = 0.60
maka butir soal tersebut termasuk soal yang sedang. Jika diamati hasil yang
diperoleh oleh kedua rumus tersebut tidak jauh berbeda, namun rumus yang
pertama lebih teliti jika digunakan untuk menghitung tingkat kesukaran butir
soal uraian.

1.3 Indeks Kesukaran Butir Soal Pilihan Ganda


Untuk menghitung indeks kesukaran tiap butir soal pilihan ganda dapat
digunakan formula :

B
I , (Candiasa, 2010)
N
Keterangan :
I : Indeks Kesukaran Butir
B : Banyaknya siswa yang menjawab butir tersebut dengan benar
N : jumlah peserta tes
Contoh 2. Menentukan Tingkat Kesukaran Soal Pilihan Ganda
Misalnya, untuk butir tes nomor 1, siswa yang menjawab benar 19 orang dari 30
orang peserta tes. Dengan demikian dapat dihitung indeks kesukaran yaitu :
19
I  0.63
30
Karena indeks kesukaran sama dengan 0.63 maka butir soal tersebut termasuk
soal yang sedang.
Indeks kesukaran butir tidak mampu menampilkan informasi tentang
perbedaan kemampuan peserta tes. Apabila butir tes tidak memenuhi kriteria,
maka hanya ada dua pilihan untuk butir tersebut, yakni direvisi atau digugurkan.

8
2. Daya Beda
Menganalisis daya pembeda butir soal merupakan salah satu hal yang
dilakukan terkait dengan analisis butir soal. Berikut ini dijelaskan mengenai daya
pembeda soal yang meliputi pengertian daya pembeda, menentukan daya
pembeda butir soal uraian dan menentukan daya pembeda butir soal pilihan
ganda.

2.1 Penertian Daya Beda


Ada butir soal yang memiliki ciri-ciri dapat dijawab dengan betul oleh
kebanyakan responden berkemampuan tinggi, tidak dapat dijawab dengan betul
oleh kebanyakan responden dengan kemampuan rendah. Butir soal yang demikian
memiliki daya untuk membedakan responden berdasarkan kemampuan mereka.
Dan butir soal yang demikian memiliki parameter yang disebut sebagai daya
pembeda. Seperti yang telah dipaparkan daya pembeda menyatakan seberapa jauh
kemampuan butir soal tersebut mampu membedakan antar testi yang mengetahui
jawabannya dengan benar dengan testi yang tidak dapat menjawab soal tersebut
(atau testi yang menjawab salah).
Suatu perangkat alat tes yang baik harus bisa membedakan antara siswa
yang pandai, rata-rata, dan yang berkemampuan rendah. Karena dalam suatu kelas
biasanya terdiri dari ketiga kelompok tersebut, sehingga hasil evaluasinya tidak
baik semua atau sebaliknya, tidak buruk semua. Juga tidak sebagian besar baik
atau sebaliknya sebagian besar buruk, tetapi haruslah berdistribusi normal. Siswa
yang mendapat nilai baik dan siswa yang mendapat nilai buruk ada (terwakili)
meskipun sedikit, namun bagian terbesar berada pada hasil yang cukup. Idealnya
adalah seperti gambar di bawah ini.

9
Gambar 4. Distribusi Kelompok siswa berdasarkan kemampuannya

Manfaat daya pembeda butir soal adalah seperti berikut ini.


1. Untuk meningkatkan mutu setiap butir soal melalui data empiriknya.
Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah
butir soal itu baik, direvisi, atau ditolak.
2. Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi atau
membedakan kemampuan siswa, yaitu siswa yang telah memahami atau
belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak
dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat
dicurigai "kemungkinannya" seperti berikut ini.
a. Kunci jawaban butir soal itu tidak tepat.
b. Butir soal itu memiliki dua atau lebih kunci jawaban yang benar
c. Kompetensi yang diukur tidak jelas
d. Pengecoh tidak berfungsi
e. Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang
menebak
f. Sebagian besar siswa yang memahami materi yang ditanyakan berpikir
ada yang salah informasi dalam butir soalnya.
Daya pembeda suatu butir soal dapat diketahui dengan cara melihat besar
kecilnya nilai indeks diskriminasi item. Indeks diskriminasi (DP) pada dasarnya
dihitung atas dasar pembagian testee ke dalam dua kelompok yakni kelompok atas
(the higher group) adalah kelompok testee yang tergolong memiliki kemampuan
tinggi dan kelompok bawah (the lower group) yaitu kelompok testee yang

10
tergolong memiliki kemampuan rendah.
Adapun cara untuk menentukan dua kelompok tersebut biasanya
bervariasi, misalnya dapat menggunakan median sehingga pembagian menjadi
dua kelompok terdiri atas 50% testee kelompok atas dan 50% testee kelompok
bawah; dapat juga dengan hanya mengambil 20% dari testee yang termasuk dalam
kelompok atas dan 20% lainnya diambil dari testee yang termasuk dalam
kelompok bawah; dapat juga menggunakan angka presentase lainnya. Namun
pada umumnya para pakar di bidang evaluasi pendidikan lebih banyak
menggunakan presentase sebesar 27% dari testee dalam kelompok atas dan 27%
lainnya diambil dari testee kelompok bawah telah menunjukkan kesensitifannya
atau dengan kata lain cukup dapat diandalkan.
Nilai dari indeks diskriminasi berkisar antara -1.00 sampai +1,00. Bagi
suatu soal yang dapat dijawab benar oleh siswa dengan kemampuan tinggi
maupun siswa dengan kemampuan rendah, maka soal itu tidak baik, demikian
pula jika semua siswa, baik pandai maupun bodoh tidak dapat menjawab dengan
benar, soal tersebut tidak baik karena keduanya tidak mempunyai daya pembeda.
Nilai indeks diskriminasi terbesar adalah 1,00. Indeks diskriminasi ini
tercapai jika seluruh kelompok atas dapat menjawab soal dengan
benar, sedangkan seluruh kelompok bawah menjawab dengan salah. Namun
sebaliknya, jika seluruh kelompok atas menjawab soal dengan salah, dan seluruh
kelompok bawah menjawab soal dengan benar maka indeks diskriminasi akan
memiliki nilai -1,00. Tetapi jika siswa kelompok atas dan siswa kelompok bawah
sama-sama menjawab benar atau sama-sama menjawab salah, maka soal tersebut
mempunyai nilai diskriminasi 0,00 karena tidak mempunyai daya pembeda sama
sekali. Berdasarkan pada hal tersebut, berikut ini diberikan tabel yang
merupakan patokan untuk nilai indeks diskriminasi yang pada umumnya
digunakan untuk menentukan suatu butir soal memiliki daya pembeda yang baik
atau tidak.

11
Tabel 4. Interpretasi Nilai Indeks Diskriminasi

Besarnya Nilai Indeks


Klasifikasi Interpelasi
Diskriminasi (DP)
Butir item yang bersangkutan daya
pembedanya lemah sekali (jelek),
Kurang dari 0,20 Poor
dianggap tidak memiliki daya pembeda
yang baik.
Butir item yang bersangkutan telah
0,20 ≤ DP < 0,40 Satisfactory memiliki daya pembeda yang cukup
(sedang).
Butir item yang bersangkutan telah
0,40 ≤ DP < 0,70 Good
memiliki daya pembeda yang baik.
Butir item yang bersangkutan telah
0,70 ≤ DP < 1,00 Excellent memiliki daya pembeda yang baik
sekali.
Butir item yang bersangkutan daya
Bertanda negatif -
pembedanya negatif (jelek sekali).

2.2 Daya Pembeda Butir Soal Uraian


Dalam menentukan daya pembeda hal pertama yang dilakukan adalah
menentuka siswa yang termasuk kelompok atas dan siswa yang termasuk
kelompok bawah. Dalam menentukan kelompok atas dan kelompok bawah antara
lain dapat dilakukan dengan cara menggunakan median sehingga pembagian
menjadi dua kelompok terdiri atas 50% testee kelompok atas dan 50% testee
kelompok bawah; dapat juga dengan hanya mengambil 20% dari testee yang
termasuk dalam kelompok atas dan 20% lainnya diambil dari testee yang
termasuk dalam kelompok bawah; dapat juga menggunakan angka presentase
lainnya.
Untuk menentukan nilai indeks diskriminasi pada butir soal uraian dapat
dilakukan dengan menggunakan rumus sebagai berikut.

a. DP 
H L
N S max  S min 
Keterangan :

H : jumlah skor Kelompok Atas (KA)

L : jumlah skor Kelompok Bawah (KB)

N : jumlah peserta tes pada kelompok atas dan kelompok bawah

12
S max : skor tertinggi butir

Smin : skor terendah butir


b. Dalam menghitung nilai indeks diskriminasi (daya pembeda) dapat pula
digunakan rumus berikut ini
Mean kelompok atas - Mean kelompok bawah
DP 
Skor maksimum yang ditetapkan
(Kusaeri, 2012: 17)

Berikut ini merupakan contoh menentukan daya pembeda butir soal uraian
Contoh 3. Menentukan daya pembeda butir soal uraian.
Diketahui 10 orang testee mengikuti tes hasil belajar dalam bidang matematika
yang tertuang dalam bentuk soal uraian. Dalam tes tersebut dikeluarkan 4 butir
soal dengan skor maksimal untuk masing-masing butir soal adalah 25. Hasil tes
matematika siswa dituangkan pada tabel 5.
Tabel 5. Hasil Tes Matematika Siswa
Nomor Soal
Siswa 1 2 3 4
Skor max 25 Skor max 25 Skor max 25 Skor max 25
A 25 25 22 15
Kel. B 25 23 20 10
C 25 20 19 10
atas
D 25 22 15 8
E 25 19 18 5
ΣH 125 109 94 48
F 25 15 15 0
Kel. G 25 20 10 5
H 25 22 5 7
Bawah
I 25 23 18 4
J 25 19 10 0
ΣL 125 58 58 16
ΣH+ΣL 250 208 152 64
mean 25 20.8 15.2 6.4

Berdasarkan data pada tabel di atas akan dihitung indeks diskriminasi (daya beda)
butir soal.

13
1. Dengan menggunakan rumus DP 
H L
N S max  S min 
Untuk soal nomor 4
48  16 48  16
DP    0.427
515  0 5(15  0)
Daya pembeda sebesar 0,427 menunjukkan bahwa soal tersebut sudah
memiliki daya pembeda yang baik.
2. Dengan menggunakan rumus
Mean kelompok atas - Mean kelompok bawah
DP 
Skor maksimum yang ditetapkan
Untuk soal nomor 4
48 16

DP  5 5  0.427
15
Dengan menggunakan rumus yang kedua diperoleh pula besarnya nilai daya
pembeda adalah 0,427 yang menunjukkan bahwa soal tersebut telah memiliki
daya pembeda yang baik.

2.3 Daya Pembeda Butir Soal Pilihan Ganda


Untuk mengetahui besar kecilnya indeks diskriminasi butir soal pilihan
ganda. dapat digunakan tiga macam rumus berikut ini.
a. Rumus Pertama
Dalam menentukan daya pembeda suatu butir soal pilihan ganda dapat
dihitung dengan menggunakan persaman:
B A BB
DP    PA  PB
jA J B (Arikunto, 2005: 213)
Dengan
DP : merupakan indeks daya pembeda
BA : banyaknya peserta tes kelompok atas yang menjawab soal dengan benar
BB : banyaknya peserta tes kelompok bawah yang menjawab soal dengan benar,
JA : banyaknya peserta tes kelompok atas
JB : banyaknya peserta tes kelompok bawah.
PA : proporsi peserta kelompok atas yang menjawab benar.

14
PB : proporsi peserta kelompok bawah yang menjawab benar.
Beriku ini merupakan contoh penggunaan rumus pertama untuk
menentukan daya pembeda butir soal pilihan ganda.
Contoh 4. Menentukan indeks diskriminasi suatu butir soal dengan menggunakan
rumus pertama.
Diketahui 10 orang testee mengikuti tes hasil belajar dalam bidang
matematika yang tertuang dalam bentuk pilihan ganda. Dalam tes tersebut
dikeluarkan 12 butir soal dengan catatan bahwa untuk setiap butir item yang
dijawab betul diberi bobot 1 sedangkan untuk setiap butir item yang dijawab salah
diberi bobot 0.
Setelah tes hasil belajar tersebut berakhir dan dilakukan pengoreksian serta
diberi skor, maka dari tes tersebut diperoleh data mengenai skor jawaban item
sebagaimana tertera pada Tabel 6
Tabel 6. Hasil Tes Matematika Tipe Objektif

Nomor Soal Total


No. Subjek Y2
1 2 3 4 5 6 7 8 9 10 11 12 Y

1. A 1 1 1 1 1 1 1 1 1 1 0 0 10 100
2. B 1 1 1 1 1 0 1 1 1 1 0 0 9 81
3. C 1 1 1 1 1 0 1 1 0 0 1 1 9 81
4. D 1 1 1 0 1 0 1 1 0 1 1 0 8 64
5. E 1 1 1 1 1 1 0 0 1 1 0 0 8 64
6. F 1 0 1 1 1 0 1 0 0 0 1 1 7 49
7. G 1 1 1 0 0 1 0 0 1 0 0 0 5 25
8. H 1 1 0 0 0 0 1 0 0 1 0 0 4 20
9. I 1 1 0 0 0 1 0 0 0 1 0 0 4 20
10. J 1 0 1 0 0 1 0 0 0 0 0 0 3 9
Jumlah 10 8 8 5 6 6 5 4 4 6 3 2 67 505

Langkah pertama : karena terdiri dari 10 subjek, maka data ini termasuk ke
dalam kelompok kecil. Oleh karena itu, untuk menentukan kelompok atas dan
kelompok bawah, masing-masing 50% dari populasi yaitu 5 subjek untuk

15
kelompok atas dan 5 subjek untuk kelompok bawah, maka keadaannya adalah
sebagai berikut
Tabel 7. Kelompok Atas dan Kelompok Bawah

Kelompok Atas Kelompok Bawah


Subjek Skor Subjek Skor
A 10 F 7
B 9 G 5
C 9 H 4
D 8 I 4
E 8 J 3
JA = 5 JB = 5

Langkah kedua, dilakukan pemberian kode-kode terhadap hasil pengelompokan


testee atas dua kategori tersebut di atas seperti yang ditunjukkan pada Tabel 8.
Skor 1 yang berada pada tanda kurung merupakan skor jawaban betul yang
dimiliki oleh kelompok kelas atas, sedangkan skor 1 yang tidak dibubuhi oleh
tanda kurung merupakan jawaban betul dari kelompok bawah.
Tabel 8. Pengkodean hasil pengelompokkan testee
Nomor Soal
Ket.
Subjek 1 2 3 4 5 6 7 8 9 10 11 12 Total
A (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) 0 0 1 Atas
B (1) (1) (1) (1) (1) 0 (1) (1) (1) (1) 0 0 9 Atas
C (1) (1) (1) (1) (1) 0 (1) (1) 0 0 (1) (1) 9 Atas
D (1) (1) (1) 0 (1) 0 (1) (1) 0 (1) (1) 0 8 Atas
E (1) (1) (1) (1) (1) (1) 0 0 (1) (1) 0 0 8 Atas
F 1 0 1 1 1 0 1 0 0 0 1 1 7 Bawah
G 1 1 1 0 0 1 0 0 1 0 0 0 5 Bawah
H 1 1 0 0 0 0 1 0 0 1 0 0 4 Bawah
I 1 1 0 0 0 1 0 0 0 1 0 0 4 Bawah
J 1 0 1 0 0 1 0 0 0 0 0 0 3 Bawah
Jumlah 10 8 8 5 6 6 5 4 4 6 3 2 6

16
Langkah ketiga, mencari atau menghitung BA ; BB ; PA ; PA dan DP untuk 12 butir
B A BB
soal di atas. Untuk mencari DP digunakan rumus DP    PA  PB
jA J B
Untuk hal ini perhatikanlah dengan cermat skor-skor jawaban betul yang dimiliki
oleh kelompok atas dan skor-skor jawaban betul yang dimiliki oleh kelompok
bawah. Setelah memperoleh nilai DP kita dapat mengetahui bagaimana daya
pembeda suatu butir soal dengan cara mengintrepretasikan besar kecilnya nilai
indeks diskriminan, sesuai dengan Tabel 9. Adapun hasilnya dapat dilihat pada
Tabel 9.
Tabel 9. Intrepretasi daya pembeda butir soal pilihan ganda

Nomor
BA BB JA JB BA/JA BB/JB DP Intrepretasi
Butir Soal

1 5 5 5 5 1,00 1,00 0,00 Poor


2 5 3 5 5 1,00 0,60 0,40 Good
3 5 3 5 5 1,00 0,60 0,40 Good
4 4 1 5 5 0,80 0,20 0,60 Good
5 5 1 5 5 1,00 0,20 0,80 Excellent
6 2 2 5 5 0,40 0,40 0,00 Poor
7 4 2 5 5 0,80 0,40 0,40 Good
8 4 0 5 5 0,80 0,00 0,80 Excellent
9 3 1 5 5 0,60 0,20 0,40 Good
10 4 2 5 5 0,80 0,40 0,40 Good
11 2 1 5 5 0,40 0,20 0,20 Satisfactory
12 1 1 5 5 0,20 0,20 0,00 Poor

Bertitik tolak dari hasil di atas sebanyak 9 butir soal dari 12 butir soal yang ada
telah memiliki daya pembeda yang memadai, sedangkan 3 soal belum memiliki
daya pembeda seperti yang diharapkan.

17
b. Rumus Kedua (Korelasi Phi)
Dengan rumus kedua ini maka angka indeks diskriminasi item diperoleh
dengan menggunakan teknik korelasi Phi (ø) dengan rumus sebagai berikut:
PH  PL

2 pq (Sudijono, 2011)
Keterangan :
 : angka indeks korelasi Phi, yang pada hal ini dianggap sebagai angka
indeks diskriminasi item
PH : proportion of the higher group

PL : proportion of the lower group


p : proporsi seluruh testee yang jawabannya betul
q : proporsi seluruh testee yang jawabannya salah, dimana q  1  p
Berikut ini merupakan contoh bagaimana cara mencari angka indeks diskriminasi
item dengan menggunakan kedua rumus di atas.
Contoh 5. Menentukan nilai DP dengan rumus teknik korelasi Phi.
Masih dengan menggunakan data yang sama seperti pada contoh 4, kita akan
menentukan nilai DP dengan menggunakan rumus korelasi Phi yakni
PH  PL
 .
2 pq

BA
Dalam menentukan nilai phi kita harus memperhatikan bahwa nilai PH   PA
jA
BB
sedangkan nilai PL   PB , kemudian kita juga harus menentukan nilai p dan
jB
q. Analisis untuk menentukan indeks diskriminasi dengan menggunakan korelasi
phi disajikan pada Tabel 10

Tabel 10. Daya Pembeda berdasarkan korelasi Phi


Nomor
Subjek T Ket
1 2 3 4 5 6 7 8 9 10 11 12
A (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) 0 0 10 Atas
B (1) (1) (1) (1) (1) 0 (1) (1) (1) (1) 0 0 9 Atas
C (1) (1) (1) (1) (1) 0 (1) (1) 0 0 (1) (1) 9 Atas

18
Nomor
Subjek T Ket
1 2 3 4 5 6 7 8 9 10 11 12
D (1) (1) (1) 0 (1) 0 (1) (1) 0 (1) (1) 0 8 Atas
E (1) (1) (1) (1) (1) (1) 0 0 (1) (1) 0 0 8 Atas
F 1 0 1 1 1 0 1 0 0 0 0 1 7 Bawah
G 1 1 1 0 0 1 0 0 1 0 1 0 5 Bawah
H 1 1 0 0 0 0 1 0 0 1 0 0 4 Bawah
I 1 1 0 0 0 1 0 0 0 1 0 0 4 Bawah
J 1 0 1 0 0 1 0 0 0 0 0 0 3 Bawah
Jumlah 10 8 8 5 6 6 5 4 4 6 3 2 67
BA 5 5 5 4 5 2 4 4 3 4 2 1
BB 5 3 3 1 1 2 2 0 1 2 1 1
JA 5 5 5 5 5 5 5 5 5 5 5 5
JB 5 5 5 5 5 5 5 5 5 5 5 5
PH 1,0 1,0 1,0 0,8 1,0 0,4 0,8 0,8 0,6 0,8 0,4 0,2
PB 1,0 0,6 0,6 0,2 0,2 0,4 0,4 0,0 0,2 0,4 0,2 0,2
p 1,0 0,8 0,8 0,5 0,6 0,6 0,5 0,4 0,4 0,6 0,3 0,2
q 0,0 0,2 0,2 0,5 0,4 0,4 0,5 0,6 0,6 0,4 0,7 0,8

Adapun besarnya nilai phi ditunjukkan pada Tabel 11.


Tabel 11. Klasifikasi daya pembeda soal berdasarkan korelasi phi

Nomor PH PL p q Phi Klasifikasi


1 1,00 1,00 1,00 0,00 - Poor
2 1,00 0,60 0,80 0,20 0,50 Good
3 1,00 0,60 0,80 0,20 0,50 Good
4 0,80 0,20 0,50 0,50 0,60 Good
5 1,00 0,20 0,60 0,40 0,82 Excellent
6 0,40 0,40 0,60 0,40 0,00 Poor
7 0,80 0,40 0,50 0,50 0,40 Good
8 0,80 0,00 0,40 0,60 0,82 Excellent
9 0,60 0,20 0,40 0,60 0,41 Good
10 0,80 0,40 0,60 0,40 0,41 Good
11 0,40 0,20 0,30 0,70 0,22 Satisfactory
12 0,20 0,20 0,20 0,80 0,00 Poor

19
Dengan menggunakan teknik korelasi phi, ternyata angka indeks diskriminasi
itemnya sedikit berbeda dengan angka indeks diskriminasi item yang dihitung
dengan menggunakan rumus pertama. Hal ini memang dapat dipahami sebab
menurut para ahli di bidang evaluasi pendidikan angka indeks diskriminasi item
yang diperoleh dengan menggunakan teknik korelasi Phi itu sifatnya lebih teliti.

c. Rumus Ketiga
Dalam menentukan indeks diskriminasi ada kalanya kita akan
dipertemukan pada suatu keadaan dimana jumlah testee yang menjawab butir soal
yang diberikan cukup besar (100 orang atau lebih). Daya pembeda butir soal
tersebut cukup dihitung berdasarkan 27% testee kelompok atas dan 27% dari
kelompok bawah. Sementara testee yang terletak diantara kedua ujung ekstrem itu
tidak perlu diikutsertakan dalam perhitungan analisis. Secara ringkas ditunjukkan
oleh gambar di bawah ini.

Gambar 5. Pembagian Testee menjadi Kelompok Atas dan Kelompok Bawah


Jika kita bekerja secara cermat, perhitungan daya pembeda dengan menggunakan
kelompok atas dan kelompok bawah sebagai sampel, mempunyai kelemahan.
Kelemahannya adalah karena cara ini tidak melibatkan kelompok tengah (middle
group) sebanyak 46%. Tidak dilibatkannya kelompok tengah setidaknya akan

20
mencemari hasil analisis (bias). Untuk mengatasi kelemahan itu, beberapa pakar
evaluasi mengemukakan cara lain yaitu dengan menggunakan teknik korelasi
biserial titik (point biserial correlation). Rumus yang digunakan untuk menghitung
daya pembeda butir soal tes pilihan ganda dengan teknik tersebut adalah:
M p  M t  N1 N 0 
 bis    (Candiasa, 2010)
 UN 
2
St
Keterangan :
M p : Rerata skor total dari subjek yang menjawab benar butir yang dicari

validitasnya
M t : Rerata skor total

S t : Standar deviasi skor total

N1 : Banyak responden yang menjawab benar


N 0 : Banyak responden yang menjawab salah
N : Banyak responden semua
U : Ordinat dari unit distribusi normal di p
p : Proposisi siswa yang menjwab benar pada butir bersangkutan

Koefisien korelasi biserial  bis memiliki rentanagn nilai dari -1 sampai dengan 1.
apabila koefisien korelasi biserial satu butir bernilai positif dan cukup besar, maka
butir tersebut banyak di pilih dengan benar oleh siswa yang memperoleh skor
tinggi. Artinya daya pembeda butir tersebut tinggi, karena mampu membedakan
siswa yang mampu dan siswa yang tidak mampu. Sebaliknya apabila koefisien
korelasi bisrial kecil atau bahkan negative, maka butir tersebut banyak dijawab
oleh kebanyakan siswa yang mendaat skor tinggi. Artinya, daya pembeda butir
tersebut rendah, karena tidak mampu membedakan siswa yang mampu dan siswa
yang tidak mampu.

Contoh 6. Menghitung koefisien korelasi biserial


Berikut ini dilakukan perhitungan koefisien biserial skor butir nomor 1 dengan
skor total untuk menggambarkan daya beda butir nomor 1. Table kerja untuk
menghitung koefisien point biserial untuk butir nomor 1 adala sebagai berikut.

21
Reponden Skor butir (x) Skor Total (Y) Y jika X=1 Y2
R01 1 14 14 196
R02 1 6 6 36
R03 1 8 8 64
R04 1 10 10 100
R05 1 13 13 169
R06 0 7 7 49
R07 1 12 12 144
R08 0 5 5 25
R09 1 12 12 144
R10 1 9 9 81
R11 0 6 6 36
R12 1 12 12 144
R13 1 4 4 16
R14 1 14 14 196
R15 1 12 12 144
R16 0 8 8 64
R17 1 10 10 100
R18 1 14 14 196
R19 1 15 15 225
R20 1 13 13 169
N1 = 16
Total 204 178 2298
N0 = 4

Mp 
Y X 1

178
 11.125
N1 16

Mt 
 Y  204  10.2 :
N 20

N  Y 2   Y 
2
20  2298  204 2
St    3.38
N N  1 20 19

N1  16
N0  4
N  20
16
p  0.80
20
U diperoleh dari pada lampiran pada p  0.80 diperoleh U = 0.2799
Diperoleh nilai koefisien biserial
11.125  10.2  16  4 
 bis   2 
 0.475
3.38  0.2799  20 

22
nilai  bis positif dan cukup tinggi. apabila dilihat nilai r-tabel pada
dk  20  2  18 dengan taraf signifikan   0.05 , maka diperoleh nilai r-tabel=
0.444. Ternyata  bis > r-tabel, yang artinya  bis signifikan. Nilai  bis yang positif,
cukup besar, dan signifikan menunjukkan bahwa butir memiliki daya beda yang
baik.

2.4 Tindak Lanjut Terhadap Butir Soal Setelah Analisis Daya Beda
Akhirnya sebagai tindak lanjut hasil penganalisaan mengenai daya
pembeda item tes hasil belajar adalah:
a. Butir-butir item yang sudah memiliki daya pembeda item yang baik
(satisfactory, good, excellent) hendaknya dimasukkan dalam buku bank soal
tes hasil belajar. Butir-butir item tersebut pada tes hasil belajar yang akan
datang dapat dikeluarkan lagi, karena kualitasnya sudah cukup memadai.
b. Butir-butir item yang daya pembedanya masih rendah (poor), ada dua
kemungkinan tindak lanjut, yaitu:
1. Ditelusuri untuk selanjutnya diperbaiki, dan setelah diperbaiki dapat
diajukan lagi dalam tes hasil belajar yang akan datang; kelak item
tersebut dianalisis lagi apakah daya pembedanya meningkat ataukah
tidak.
2. Dibuang (didrop) dan untuk tes hasil belajar yang akan datang butir item
tersebut tidak akan dikeluarkan lagi.
c. Khusus butir-butir item yang angka indek diskriminasi itemnya bertanda
negatif, sebaiknya pada tes hasil belajar yang akan datang tidak usah
dikeluarkan lagi., sebab butir item yang demikian itu kualitasnya sangat jelek.

3. Efektivitas Pengecoh (Distractor)


Analisis efektivitas pengecoh (distractor) atau analisis jawaban yang
dilakukan dengan menghitung peserta tes yang memilih tiap alternative jawaban
pada masing-masing butir. Kriteria pengecoh yang baik adalah apabila pengecoh
tersebut dipilih oleh paling sedikit 5% dari peserta tes. Sebagai ilustrasi, berikut
ini disajikan hasil uji coba instrument hasil belajar yang terdiri dari 7 butir tes
objektif yang terdiri dari 4 pilihan diujicobakan terhadap 100 orang peserta tes.

23
Mengingat banyak peserta tes 100 orang, pengecoh dikatakan baik jika dipiih oleh
minimal 5% dari 100 orang, atau minimal dipilih oleh 5 orang peserta tes. Data
tentang banyaknya peserta tes yang memilih tiap – tiap pilihan pada masing –
masing butir, beserta keterangan baik – tidaknya pengecoh adalah seperti
tercantum pada table berikut ini.
Frekuensi Pilihan
Nomor Kunci Keterangan
Jawaban
Butir Jawaban
A B C D
1 70 10 11 9 A Semua Pengecoh baik

2 14 56 20 10 B Semua Pengecoh baik

3 4 2 11 83 D Pengecoh A dan B kurang baik

4 6 14 69 6 C Semua Pengecoh baik

5 3 90 3 4 B Semua Pengecoh kurang baik

6 14 11 58 17 C Semua Pengecoh baik

7 6 1 0 93 D Pengecoh B dan C kurang baik

D. PENUTUP
1. Simpulan
Adapun simpulan yang dapat diberikan penulis dari penulisan artikel ini
yaitu sebagai berikut.
Taraf kesukaran butir yang dinyatakan dengan indeks kesukaran butir
didefinisikan sebagai proporsi peserta tes yang menjawab butir tersebut dengan
benar. Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat
diketahui dari indeks kesukaran atau taraf kesulitan yang dimiliki oleh masing –
masing butir item tersebut.
Rumus/Formula yang dapat digunakan untuk menghitung Indeks Kesukaran urain
dapat menggunakan

IK 
 U   L  2 N  S  min
atau
2 N S max  S min 

Mean
IK 
Skor maksimum yang ditetapkan

24
Dengan
Jumlah skor siswa peserta tes pada suatu soal
Mean 
jumlah peserta didik yang mengikuti tes

Sedanglan untuk menghitung indeks kesukaran tiap butir soal pilihan ganda dapat
B
digunakan formula I  , (Candiasa, 2010)
N

Daya pembeda adalah pengkajian butir-butir soal yang dimaksudkan untuk


mengetahui kesanggupan butir-butir tes untuk membedakan siswa yang tergolong
mampu dengan siswa yang tergolong tidak mampu.
Untuk menentukan nilai indeks diskriminasi pada butir soal uraian dapat
dilakukan dengan menggunakan rumus

DP 
H L atau DP 
Mean kelompok atas - Mean kelompok bawah
N S max  S min  Skor maksimum yang ditetapkan
Untuk mengetahui besar kecilnya indeks diskriminasi butir soal pilihan ganda.
dapat digunakan tiga macam rumus
B A BB
DP    PA  PB (Arikunto, 2005),
jA J B
PH  PL
 (Sudijono, 2011)
2 pq

M p  M t  N1 N 0 
 bis    (Candiasa, 2010).
 UN 
2
St

Analisis efektivitas pengecoh (distractor) atau analisis jawaban yang


dilakukan dengan menghitung peserta tes yang memilih tiap alternative jawaban
pada masing-masing butir. Kriteria pengecoh yang baik adalah apabila pengecoh
tersebut dipilih oleh paling sedikit 5% dari peserta tes.
2. Saran
Adapun saran yang dapat diberikan dalam penulisan makalah ini yaitu
guru diharapkan untuk menganalisis tes yang diberikan kepada siswanya baik itu
dari segi indeks kesukaran, daya pembeda, maupun efektifitas optionnya,
sehingga tes yang diberikan kepada siswa memang memuat butir-butir soal yang
baik dan mampu mengevaluasi siswa dengan baik pula.

25
DAFTAR PUSTAKA
Arikunto, Suharsimi. 2005. Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi
Aksara.

Candiasa, I. M. 2010. Pengujian Instrumen Penelitian Disertai Aplikasi ITEMAN


dan BIGSTEPS. Singaraja : Universitas Pendidikan Ganesha.

Kusaeri, Suprananto. 2012. Pengukuran dan Penilaian Pendidikan. Yogyakarta :


Graha Ilmu.

Sudijono, Anas. 2011. Pengantar Evaluasi Pendidikan. Yogyakarta : PT Raja


Grafindo Persada.

Suherman, Erman. 1993. Evaluasi Proses dan Hasil Belajar Matematika. Jakarta:
Universitas Terbuka, Depdikbud.

26