Oleh:
A. Latar Belakang
Analisis butir soal merupakan satu langkah penting yang harus dilakukan seorang
pendidik setelah memberikan evaluasi tes hasil belajar kepada peserta didik. Kegiatan evaluasi
erat hubungannya dengan pengukuran dan penilaian, karenanya ketiganya memiliki keterkaitan
yang tidak bisa dipisahkan. Pengukuran pada umumnya berkenaan dengan masalah kuantitatif
yang bertujuan untuk mendapatkan informasi yang diukur.
Proses belajar mengajar tidak hanya dilaksanakan sebagai kesenangan (bersifat mekanis)
tetapi juga harus mempunyai misi atau tujuan secara bersama untuk mengetahui apakah tujuan
pendidikan telah tercapai dengan sebaik-baiknya. Dalam menganalisis butir soal dalam tes,
pendidik harus memperhatikan beberapa hal diantaranya adalah daya serap, tingkat kesukaran,
daya beda, fungsi pengecoh, validitas dan realibitas. Hal tersebut dilakukan agar tes yang
diberikan dapat tercapai.
Adapun tujuan dari pelaksanaan analisis butir soal adalah untuk mengetahui butir soal
mana yang baik dan butir soal mana yang tidak baik (buruk). Selanjutnya, pendidik dapat
mencari kemungkinan sebab-sebab butir soal tersebut tidak baik (buruk). Berdasarkan hal
tersebut, setidaknya pendidik dapat mengetahui taraf kesukaran soal dengan memfungsikan
beberapa soal pengecoh, dapat menentukan daya pembeda soal yang dapat membedakan antara
kelompok tinggi dan kelompok rendah, dan dapat mengetahui penyebaran pola jawaban soal
baik sebagai kunci jawaban maupun sebagao pengercoh serta dapat mengetahui kondisi tiap
butir soal terhadap skor keseluruhan.
B. Rumusan Masalah
Berdasarkan latar belakang di atas, rumusan masalah dalam makalah ini adalah sebagai
berikut:
1. Apakah yang dimaksud dengan analisis butir soal?
2. Bagaimana analisis butir soal pilihan ganda dan soal uraian?
3. Bagaimana cara mengaplikasikan analisis butir soal berdasarkan daya serap, tingkat
kesukaran, daya beda, fungsi pengecoh, validitas dan realibilitas.
C. Tujuan
Berdasarkan rumusan masalah di atas, tujuan yang hendak dicapai adalah sebagai
berikut:
1. Mendeskripsikan pengertian analisis butir soal.
2. Mendeskripsikan dan menjelaskan analisis butir soal pilihan ganda dan soal uraian.
3. Mengaplikasikan analisis butir soal berdasarkan tingkat kesukaran, daya beda, fungsi
pengecoh, validitas dan realibilitas.
BAB II
PEMBAHASAN
Dengan demikian maka indeks tingkat kesulitan termasuk dalam kategori mudah. Karena
ITK 0,20-0,40 adalah butir soal yang berkategori sulit, 0,41-0,60 berkategori sedang, dan 0,61-
0,80 berkategori mudah.
Kelompok Rendah
Nomor Nomor Butir Soal Jumlah
Peserta Tes 1 2 3 4 5 6 7 8 ... 40 Skor
1 1 1 0 1 0 0 1 1 ... 1 20
2 0 0 1 1 1 0 1 1 ... 0 19
3 0 1 1 0 0 1 0 1 ... 1 18
4 1 1 1 0 0 1 1 0 ... 0 17
5 0 1 0 0 1 1 1 0 ... 0 16
6 0 0 0 1 1 0 1 1 1 15
Jumlah 2 4 3 3 3 3 5 4 3
Namun, jika peserta uji relatif kecil, dapat dilakukan dengan membagi menjadi dua kelompok
yaitu masing-masing sebesar 50% saja. Penggunaan tabel persiapan analisis ini untuk
mempermudah penghitungan IDB. Jika hanya bermaksud menghitung ITK saja, bisa
membedakan peserta uji tidak dalam dua kelompok. Jika ditulis dengan rumus, ITK yang
dimaksud adalah sebagai berikut:
𝐹𝐾𝑇 + 𝐹𝐾𝑅
ITK =
𝑛
Keterangan :
IDB : Indeks tingkat kesulitan yang dicari
FKT : Jumlah jawaban benar kelompok tinggi
FKR : Jumlah jawaban benar kelompok rendah
n : Jumlah peserta tes kedua kelompok
Contoh:
5+2
Butir nomor 1 = = 0,58
12
Sementara itu, untuk menghitung besarnya IDB butir soal, secara sederhana dapat
dilakukan dengan cara berikut: jumlah jawaban benar kelompok tinggi dikurangi jumlah
jawaban benar kelompok rendah dan kemudian dibagi separuh dari jumlah keduanya. Jika
dituliskan dengan rumus sebagai berikut:
𝐹𝐾𝑇 − 𝐹𝐾𝑅
IDB =
𝑛
Keterangan :
IDB : Indeks daya beda yang dicari
FKT : Jumlah jawaban benar kelompok tinggi
FKR : Jumlah jawaban benar kelompok rendah
n : Jumlah peserta kelompok tinggi atau rendah (27,5%)
Contoh:
5−2
Butir nomor 1 = = 0,50
12
Jadi, untuk butir soal nomor 1 dalam contoh penghitungan di atas telah diketahui bahwa:
ITK = 0,70 dan IDB 0,30 yang dapat dinyatakan layak. Hal yang tidak layak jika IDB <0,20,
maka butir soal dinyatakan tidak layak. Berikut ini adalah hasil penghitugan indeks tingkat
kesulitan dan indeks daya beda.
P = B/N
Dengan P adalah indeks tingkat kesulitan soal, B adalah banyaknya pesrta tes yang
menjawab benar soal tersebut, dan N adalah banyaknya selurug peserta tes.
Berdasarkan rumus yang ditulis pada persamaan 5.1 tersebut dapat dibuktikan bahwa
rentang nilai indeks tingkat kesulitan adalah :
0≤P≤1
Pada suatu butir tertentu, nilai P = 0 diperoleh ketika tidak ada satupun peserta tes yang
menjawab benar butir soal itu dan nilai P = 1 diperoleh ketika semua peserta tes menjawab
benar butir itu.
Berdasarkan rumus itu pula dapat disimpulkan bahwa semakin tinggi nilai P, maka
semakin mudah suatu butir soal dan semakin rendah nilai P maka semakin sukar butir soal
tersebut. Tentu saja, nilai tingkat kesulitan suatu butit tergantung kepada kelmpok peserta tes
yang dikenai uji coba. Jika kelompok itu merupakan kelompok yang terdiri dari siswa-siswa
pandai, maka suatu butir soal cenderung mempunyai tingkat kesulitan yang tinggi dalam arti
butir soal tidak mudah. Di sisi lain, jika kelompok peserta tes yang dikenai uji coba terdiri dari
siswa-siswa yang tidak pandai, maka suatu butir soal cenderung mempunyai tingkat kesulitan
yang rendah. Oleh karena itu lah, untuk memperoleh parameter butir soal yang stabil diperlukan
sampel uji coba yang cukup besar. Semakin besar ukuran sampel uji coba semakin baik.
Keterangan : 1 = butir soal dijawab benar, 0 = butir soal yang dijawab salah.
Perhatikan tabel trsebut,untuk butir soal nomor 1, banyaknya yang menjawab benar butir
itu adalah 6, sehingga B = 6. Banyaknya seluruh peserta tes adalah 10, sehingga N = 10, dengan
demikian untuk butir soal nomor 1 diperoleh P1 = 6/10 = 0,6.
Berdasarkan tabel tersebut maka dapat diperoleh indeks tingkat kesulitan untuk butir lain
sebagai berikut.
Misalnya diberikan batasan bahwa butir soal yang baik dari sisi ti dstngkat kesulitan
adalah 0,30 ≤ P ≤ 0,70, maka butir soal yang tidak baik adalah butir soal nomor 3, 5, 7, 8, 9,
11, 12, dan 15.
Misalnya diberikan batasan bahwa butir soal yang baik dari sisi tingkat kesulitan adalah
0,20 ≤ P ≤ 0,80, maka butir yang tidak baik adalah butir soal nomor 3 dan 9.
Daya Pembeda
Suatu butir soal mmpunyai daya pembeda baik jika kelompok siswa pandai menjawab
benar butir soal lebih banyak daripada kelompok siswa tidak pandai. Dengan demikian, daya
pembeda suatu butir soal dapat dipakai untuk membedakan siswa yang pandai dan tidak pandai.
Sebagai tolak ukur pandai atau tidak pandai adalah skor total dari sekumpulan butir yang
dianalisis. Ada beberapa cara untuk mengukur daya pembeda, yaitu sebagai berikut.
Contoh 5.2
Suatu tes pilihan ganda terdiri dari 15 butir dikenakan kepada 10 siswa. Sebaran skor
untuk masing-masing butir dan skor total peserta tes tampak pada Tabel 5.1 di depan.
Untuk mencari indeks daya pembeda dengan cara pertama, peserta tes diurutkan dari skor
total tertinggi ke terendah. Kemudian, berdasarkan mediannya, peserta tes dikelompokkan
menjadi kelompok atas dan kelompok bawah seperti pada Tabel 5.2.
Tabel 5.2 Skor 10 Siswa setelah Diurutkan
Nomor Nomor Butir Soal Skor Kelompok
Urut 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total
Siswa
8 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 15 Atas
3 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 14 Atas
10 1 0 1 1 1 1 1 1 1 0 1 1 1 1 1 13 Atas
9 1 1 1 1 1 1 1 1 1 1 0 1 0 0 1 12 Atas
6 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 12 Atas
4 0 1 1 1 1 1 1 1 1 1 1 1 0 0 0 11 Bawah
1 1 1 1 0 1 0 0 1 1 1 0 1 1 0 1 10 Bawah
5 0 1 0 0 0 1 1 1 1 1 1 1 1 0 1 9 Bawah
7 0 0 1 0 1 0 0 0 1 1 1 1 1 0 1 7 Bawah
2 0 0 1 1 0 0 0 1 1 0 1 0 0 1 0 6 Bawah
Perhatikan Tabel 5.2 Untuk butir soal nomor 1, misalnya, indeks daya pembeda dapat
dicari dengan cara berikut. Banyaknya siswa kelompok atas yang menjawab benar ada orang,
sehingga Ba = 5 dan banyaknya siswa kelompok bawah yang menjawab benar ada 2, sehingga
Bb = 2. Berdasarkan ini diperoleh:
𝐵𝑎 𝐵𝑏 5 1
D1 = - = - = 0,8
𝑁𝑎 𝑁𝑏 5 5
Dengan cara yang sama, diperoleh:
D2 = 0, D3 = 0,2, D4 = 0,6, D5 = 0,2, D6 = 0,6,
D7 = 0,4, D8 = 0, D9 = -0,2, D10 = 0,2, D11 = 0,
D12 = 0,4 D13= 0,2, D14 = 0,6, D15 = 0,4
𝐵𝑎 𝐵𝑏
D= -
𝑁𝑎 𝑁𝑏
𝐵𝑎
Perhatikan bahwa merupakan tingkat kesulitan butir pada siswa-siswa kelompok atas,
𝑁𝑎
𝐵𝑏
sedangkan merupakan tingkat kesulitan pada siswa-siswa kelompok bawah. Dengan
𝑁𝑏
demikian, indeks daya beda suatu butir dapat dicari formula berikut.
D = Pa - Pb
Dengan Pa adalah tingkat kesulitan butir soal pada kelompok atas dan Pb adalah tingkat
kesulitan butir soal pada kelompok bawah.
Dengan demikian, indeks daya pembeda suatu butir dapat dirumuskan seperti pada
persamaan 5.3
Jika Ba = 0 dan Bb = Nb (yang berarti tidak ada peserta tes pada kelompok atas yang
menjawab benar dan semua peserta tes pada kelompok bawah menjawab benar), maka D = -1.
Sebaliknya, Jika Ba = Na dan Bb = 0 (yang berarti semua peserta tes pada kelompok atas
menjawab benar dan semua peserta tes pada kelompok bawah tidak ada yang menjawab benar)
maka D = 1. Dengan demikian, rentang indeks daya pembeda adalah -1 ≤ D ≤ 1
Perhatikan sebaran skor butir soal nomor 1 dan nomor 4 dan skor totalnya. Terdapat
kecenderungan bahwa kelompok atas cenderung menjawab benar dan kelompok bawah
cenderung menjawab salah. Ini berarti pada butir yang indeks daya pembedanya positif,
terdapat korelasi positif antara skor butir dengan skor totalnya. Di sisi lain, perhatikan sebaran
skor butir nomor 9 di mana semua peserta tes kelompok bawah menjawab benar dan tidak
semua peserta tes kelompok atas menjawab benar. Ini berarti terdapat korelasi negatif antara
skor butir nomor 9 dengan skor totalnya. Indeks daya pembeda butir nomor 9 negatif.
Dengan demikian, ada cara lain untuk mencari indeks daya pembeda, yaitu dengan
mencari koefisien korelasi antara skor butir dan skor total. Pada cara kedua ini, indeks daya
pembeda suatu butir dicari dengan mencari koefisien korelasi antara skor butir tersebut dengan
skor total peserta tes. Dengan demikian, indeks daya pembeda dirumuskan sebagai berikut.
𝑛 ∑ 𝑋𝑌−(∑ 𝑋) ∑ 𝑌
D = rpbis =
√(𝑛 ∑ 𝑋²−(∑ 𝑋)² (𝑛 ∑ 𝑌²−(∑ 𝑌)²)
𝑛 ∑ 𝑋𝑌−(∑ 𝑋) ∑ 𝑌
D1 = rpbis =
√(𝑛 ∑ 𝑋²−(∑ 𝑋)² (𝑛 ∑ 𝑌²−(∑ 𝑌)²)
(10)(76)−(6)(109)
= ((10)(6)−6²)((10)(1265)−109²) = 0,78
Jadi, dihitung dengan koefisien biserial titik, maka indeks daya pembeda butir soal nomor
1 adalah D1= 0,78. Dengan cara yang sama diperoleh:
D2=0,27 D3= 0,23 D4= 0,53 D5= 0,61
D6= 0,76 D7= 0,52 D8= 0,25 D9= 0,135
D10= 0,54 D11= 0,02 D12= 0,79 D13= 0,29
D14= 0,40, dan D15= 0,43.
1265 109 2
y = √ -( ) = 2,733;
10 10
6
x = = 0,6
10
𝑌1−𝑌 𝑃𝑋 12,667−10,900
D1= ( ) √(1−𝑃𝑋) = ( )
𝛿 2,733
Dengan X adalah skor butir, y adalah skor total , Y1 adalah rerata skor Y dengan X=1, Y
adalah rerata. Untuk skor total untuk y, y adalah deviasi baku dari skor total (dianggap
2 𝑌
populasi) dengan 𝜎 =
𝑌 𝑁
N adalah banyaknya siswa, Px adalah proporsi peserta tes dengan X=1, z adalah nilai
pada distribusi normal baku demikian hingga luas di bawah kurva normal baku dan di sebelah
1 1
kanan z adalah Px, dan f(z) = e- − z2
√2𝜋 2
Contoh 5.5
Dengan rumus koefisien korelasi biserial, indeks daya pembeda butir soal nomor 1
dihitung sebagai berikut.
Y1 =12,667; Y=10,900; y = 2,733; Px= 0,6; z= -0,25 (diperoleh daritabel distribusi
1 1 1
normal baku); f(-0,25)= e- − z2 = ( ) (2,714 − 1)
√2𝜋 2 √(2)(3,143)
Diantara empat cara di atas, dulu ketika alat kalkulasi belum banyak tersedia,orang
menggunakan cara pertama. Bahkan, pengambilan 27% urutan teratas untuk kelompok atas dan
27% urutan terbawah untuk kelompok bawah adalah menyederhanakan perhitungan. Namun
sekarang ini, dengan telahtersedianya paket pengolah data , misalnya MS Exel. Atau paket
program statistic, misalnya SPSS, maka cara kedua, yaitu dengan koefisien korelasi biserial
titik yang dianjurkan. Cara ini dianjurkan karena disamping dapat untuk tes pilihan ganda,
dapat juga digunakan untuk tes uraian.
Berfungsinya pengecoh
Pengecoh yang baikharus dipilih oleh peserta tes. Untuk menentukan apakah pengecoh
berfungsi atau tidak, biasanya, diambil nilai ambang 5%. Artinya, salah satu syarat agar
pengecoh dikatakan berfungsi baik adalah jika pengecoh tersebut dipilih olhe paling sedikit 5%
peserta tes.
Agar dapat mengecoh peserta tes, maka pengecoh-pengecoh yang ada pada suatu butir
soal harus sama kuat daya tariknya. Suatu pengecoh yang sangat berbeda dengan pengecoh
lainnya tentu saja tidak dianjurkan.
Contoh 5.6
1. Perhatikan ciri kebahasaan teks cerita moral/fabel dan teks cerita biografi di bawah ini!
(1) Menggunakan kata sandang si dan sang
(2) Tokoh cerita berupa hewan
(3) Memberikan inspirasi kepada pembaca
(4) Menjadi pengalaman pribadi
(5) Terdapat pesan moral
Yang termasuk ciri kebahasaan pada teks cerita moral/fabel adalah ....
a. (1)-(3)-(4)
b. (1)-(2)-(5)
c. (2)-(3)-(4)
d. (3)-(4)-(5)
Pengecoh (B) tidak mempunyai daya tarik sama kuat dengan pengecoh lainnya, karena
pengecoh (B) termasuk dalam ciri kebahasaan pada teks cerita moral/fabel. Pada mata pelajaran
tertentu, seperti misalnya matematika, pengecoh disusun berdasarkan atas kesalahan yang
mungkin dilakukan oleh peserta tes.
Contoh 5.7
Misalnya stemnya adalah “Himpunan penyelesaian persamaan kuadrat 4x2-1=0
adalah…..”
Kunci jawaban dari butir soal tersebut dapat dicari dari pengerjaan berikut.
4x2-1=0
(2x+1)(2x-1)=0
2x+1=0 atau 2x-1=0
X=-1/2 atau x=1/2
HP = (1/2,-1/2)
Untuk menentukan pengecoh dari stem tersebut, dipikirkan kesalahan yang mungkin
dilakukan oleh siswa. Diduga ada siswa yang mengerjakan soal tersebut dengan cara-cara
seperti berikut.
4x2-1=0
(4x=1)(4x-1)=0
4x=1=0 atau 4x-1=0
X=-1/4 atau x=1/4
HP= {1/4, -1/4}
4x2-1=0
4x2=1
X2= ¼
X= ½
HP = {1/2}
4x2 – 1 = 0 4x2 – 1 = 0
4x2 – 1 3x2 = 0
1 x2 = 0
x2 =
4
1 x=0
x= HP = {0}
4
1
HP = { }
4
Dengan pemikiran seperti itu, maka butir soal tersebut dapat disusun seperti berikut.
Himpunan penyelesaian persamaan kuadrat 4x2 – 1 = 0 adalah ....
a. {0}
1
b. { }
4
1
c. { }
2
1 1
d. { , − 4 }
4
1 1
e. { , − }
2 2
Kecuali dipilih oleh paling sedikit 5% dari seluruh peserta tes, pengecoh yang baik harus lebih
mengecoh kelompok bawah daripada kelompok atas. Artinya, supaya pengecoh berfungsi,
peserta tes kelompok bawah yang memilih pengecoh tersebut harus lebih banyak daripada
peserta tes kelompok atas. Perhatikan contoh berikut.
Contoh 5.8
Berikut ini terdapat sebaran jawaban sekelompok peserta tes untuk butir soal tertentu.
Tabel 5.5 Sebaran Jawaban Peserta Tes untuk Butir Soal Tertentu
Jawaban
Kelompok
A B C D E
Kelompok Atas 1 5 42 4 0
Kelompok Bawah 9 5 26 3 9
Keterangan : Kunci Jawaban C
68 42 26
Butir soal tersebut mempunyai indeks tingkat kesulitan P =
104
= 0,65 dan D = − = 0,31
52 52
yang berarti merupakan butir soal yang cukup baik untuk mengambil data prestasi belajar pada
suatu penelitian, sebab 0,30 ≤ P ≤ 0,70 dan D ≥ 0,30. Namun demikian, pengecoh B dan
pengecoh D tidak berfungsi dengan baik, sebab kelompok bawah tidak lebih banyak yang
memilih pengecoh-pengecoh tersebut dibandingkan dengan kelompok atas.
Perhatikan baik-baik bahwa semakin baik pengecoh berfungsi, butir soal tersebut semakin
mempunyai daya pembeda yang baik, namun demikian, indeks tingkat kesulitannya cenderung
menurun (berarti butir soal semakin sulit).
Contoh 5.9
Misalnya terdapat perangkat tes yang terdiri dari 20 butir soal yang diberikan kepada 10 peserta
tes. Misalnya sebaran jawaban siswa adalah sebagai berikut.
Misalnya, file input datanya diberi nama data.dat dan ditulis sebagai berikut.
020 O N 4
CC
BDBDEEEBCADCAABACE
555555555555555555
YYYYYYYYYYYYYYYYYY
001 ACBEEDCEBDCCDCAABAAC
002 AABDBBCEEDCBDCAABACD
003 CABDBBCEEBCEDCAABABD
004 CABEBBCEEBCEDCAAOADO
005 CBAEBCDEEABCDAAABACD
006 DABDBEDECBDCDCAACBEE
007 CACDBBBEEBCEDCAABADC
008 CABDBBBEEDCEDCBCCBAA
009 BDCDCCBCDADBBDCCCACD
010 ABCBEDEEAACDABAABACC
Setelah program dieksekusi, maka hasilnya dapat dilihat pada file output. Misalnya file
tersebut disebut output, maka pada file tersebut dilihat karakteristik masing-masing butir.
Untuk butir soal nomor 1, misalnya, diperoleh keluaran berikut.
Pada akhir file output untuk hasil analisis butir juga dimunculkan ringkasan analisis
seperti berikut.
N of Items 20
N of Examinees 10
Mean 10.400
Variance 8.840
Std. Dev. 2.973
Skew -1.235
Kurtosis 1.188
Minimum 3.000
Maximum 14.000
Median 10.000
Alpha 0.638
SEM 1.788
Mean p 0.520
Mean Item-Tot. 0.362
Mean Biserial 0.468
Dari keluaran itu dapat dilihat, misalnya, koefisien reliabilitas tes, yang dihitung dengan
teknik nalpha adalah sebesar 0,638.
2. Analisis Butir Soal Uraian
Berdasarkan dengan analisis butir untuk soalpilihan ganda, tidak banyak buku yang
membicarakan analisis butir untuk soal bentuk uraian. Pada buku ini, analisis butir untuk soal
bentuk uraian dikembangkan dari analisis butir untuk soal bentuk pilihan ganda.
Tingkat Kesulitan
Indeks tingkat kesulitan untuk tes uraian dirumuskan sebagai berikut.
P = S
Smaks
Dengan P adalah indeks tingkat kesulitan. S adalah rerata untukskor butir, dan Smaks
adakah skor maksimum untuk butir tersebut.
Contoh 5.10
Misalnya terdapat 5 butir soal bentuk uraian yang dikenakan pada 10 orang siswa. Setiap
butir diskor dengan skala 10 (skor minimal 1 dan skor maksimal10). Sebaran skor mereka
adalah sebagai berikut.
Tabel 5.7. Sebaran Skor untuk 10 Peserta Tes pada 5 Butir Uraian
No Nama Siswa
Butir Aa Bb Cc Dd Ee Ff Gg Hh Ii Jj
1 6 9 7 9 7 4 7 6 5 5
2 7 8 7 9 7 5 8 7 7 3
3 6 9 6 9 7 5 7 6 8 4
4 5 7 8 10 8 4 8 6 6 4
5 8 9 7 9 7 6 7 8 7 6
Skor 32 42 35 46 36 24 37 33 33 22
Total
Dalam kasus ini,skor maksimal untukn masing-masing butir soal adalah 10, sehingga
indeks tingkat kesulitan untuk butir soal nomor 1 dicari sebagai berikut.
65
P = S = 10 = 6,5 = 0,65
Smaks 10 10
Daya Pembeda
Indeks daya pembeda dicari dengan mencarikoefisien korelasi antara skor butir dengan
skor total sebagai berikut.
D = r pbis = n ΣXY - (ΣX) (ΣY)
(nΣX2 - (ΣX)2) (nΣY2 - (ΣY)2)
Contoh 5.11
Untuk menghitung indeks daya pembeda untuk butir soal pertama, dicari koefisien
korelasi antara skor butir pertama dengan skor total, sebagai berikut.
Tabel 5.8. Tabel Kerja untuk Mencari Daya Pembeda Soal Nomor 1
Nomor 1 2 3 4 5 6 7 8 9 10 Total
Urut
Siswa
Skor 6 9 7 9 7 4 7 6 5 5 65
Butir ke-
1 (X)
Skor 32 42 35 46 36 24 37 33 33 22 340
Total
Siswa
(Y)
XY 192 378 245 414 252 96 259 198 165 110 2309
X2 36 81 49 81 49 16 49 36 25 25 447
Y2 1024 1764 1225 2116 1296 576 1369 1089 1089 484 12032
Indeks daya pembeda untuk butir soal nomor 1 dicari sebagai berikut.
Dengan cara yang sama, diperoleh D2 = 0,94; D3 = 0,91; D4 = 0,90; dan D5 = 0,84.
C. Pengaplikasian Analisis Butir Soal
Berikut ini merupakan pengaplikasian analisis butir soal pilihan ganda yang terdiri dari
30 butir yang dikenakan pada 10 siswa. Sebaran skor untuk masing-masing butir dan skor total
peserta tes tampak pada tabel berikut.
Kelompok Tinggi
Nomor Nama Peserta Tes
Butir Jumlah
Hendra Yuling Lathif Ajeng Nurhadi
Soal
1 1 1 1 1 1 5
2 1 1 1 1 1 5
3 1 1 1 1 1 5
4 1 0 0 1 0 2
5 0 1 1 1 1 4
6 1 0 1 1 0 3
7 1 0 1 1 1 4
8 0 1 1 1 1 4
9 0 1 0 1 1 2
10 1 1 1 0 1 4
11 1 1 0 0 0 2
12 1 1 1 1 0 4
13 1 1 1 1 1 5
14 1 1 0 0 0 2
15 1 1 1 1 1 5
16 1 1 1 0 1 4
17 1 1 1 1 1 5
18 1 1 1 0 1 4
19 1 0 0 0 0 1
20 0 1 1 0 1 3
21 1 1 1 1 1 5
22 1 1 1 0 1 4
23 1 1 1 1 1 5
24 1 1 1 0 1 4
25 0 1 1 1 1 4
26 1 1 1 1 1 5
27 1 1 0 1 0 3
28 1 1 1 1 0 4
29 1 0 1 1 0 3
30 1 1 0 1 0 3
Jumlah 25 25 23 21 20
Kelompok Rendah
Nomor Nama Peserta Tes
Butir Tri Jumlah
Aldi Erni Edi Sekar
Soal Budi
1. 1 0 1 1 1 4
2. 0 0 1 1 0 2
3. 1 0 1 1 0 3
4. 0 1 0 0 0 1
5. 1 1 0 0 0 2
6. 1 1 0 0 0 2
7. 1 1 1 0 0 3
8. 1 1 1 0 0 3
9. 1 1 1 0 0 3
10. 1 0 1 0 1 3
11. 0 0 1 0 0 1
12. 0 0 1 0 0 1
13. 0 0 1 1 0 2
14. 0 0 0 0 0 0
15. 0 1 1 1 1 4
16. 1 1 1 1 1 5
17. 1 1 0 0 0 2
18. 1 0 0 0 0 1
19. 0 0 0 0 0 0
20. 1 1 0 1 1 4
21. 0 1 0 1 1 3
22. 1 1 0 1 1 4
23. 1 1 0 1 1 4
24. 1 1 0 1 1 4
25. 0 0 0 1 1 2
26. 0 0 0 1 1 2
27. 0 0 0 0 1 1
28. 0 1 0 0 0 1
29. 0 0 1 0 0 1
30. 0 0 1 0 0 1
Jumlah 15 15 14 13 11
Tabel Indeks Tingkat Kesulitan
No Hasil
FKT FKR N Keterangan Kelayakan Analisis
Soal IF=((FH+FL)/N)
1 5 4 10 0.9 Sangat Tidak Layak >0,80
Mudah maka soal
ini tidak
layak
2 5 2 10 0.7 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
3 5 3 10 0.8 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
4 2 1 10 0.3 Sulit Layak berkisar
antara
0,20-0,40
maka soal
5 4 2 10 0.6 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
6 3 2 10 0.5 Sedang Layak berkisar
antara
0,40-0,60
maka soal
layak
7 4 3 10 0.7 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
8 4 3 10 0.7 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
9 2 3 10 0.6 Sedang Layak berkisar
antara
0,40-0,60
maka soal
layak
10 4 3 10 0.7 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
11 2 1 10 0.3 Sulit Layak berkisar
antara
0,20-0,40
maka soal
12 4 1 10 0.5 Sedang Layak berkisar
antara
0,40-0,60
maka soal
layak
13 5 2 10 0.7 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
14 2 0 10 0.2 Sulit Layak berkisar
antara
0,20-0,40
maka soal
layak
15 5 4 10 0.9 Sangat Tidak Layak > 0,80
Mudah maka soal
ini tidak
layak
16 4 5 10 0.9 Sangat Tidak Layak > 0,80
Mudah maka soal
ini tidak
layak
17 5 2 10 0.7 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
18 4 1 10 0.5 Sedang Layak berkisar
antara
0,40-0,60
maka soal
layak
19 1 0 10 0.1 Sangat Sulit Tidak Layak <0,20
maka soal
ini tidak
layak
20 3 4 10 0.7 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
21 5 3 10 0.8 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
22 4 4 10 0.8 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
23 5 4 10 0.9 Sangat Tidak Layak > 0,80
Mudah maka soal
ini tidak
layak
24 4 4 10 0.8 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
25 4 2 10 0.8 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
26 5 2 10 0.7 Mudah Layak berkisar
antara
0,61-0,80
maka soal
layak
27 3 1 10 0.4 Sedang Layak berkisar
antara
0,40-0,60
maka soal
layak
28 4 1 10 0.5 Sedang Layak berkisar
antara
0,40-0,60
maka soal
layak
29 3 1 10 0.4 Sedang Layak berkisar
antara
0,40-0,60
maka soal
layak
30 3 1 10 0.4 Sedang Layak berkisar
antara
0,40-0,60
maka soal
layak
Berdasarkan tabel indeks tingkat kesulitan di atas, dapat disimpulkan bahwa butir soal
ini dinyatakan layak karena berkisar antara 0,20-0,80 dengan rincian 3 butir soal kategori sulit
dengan hasil 0,20 dan 0,30 atau berkisar antara (0,20-0,40), 8 butir soal kategori sedang dengan
hasil 0,40; 0,50; dan 0,60 atau berkisar (0,41-0,60), dan 14 butir soal kategori mudah dengan
hasil 0,70 dan 0.80 atau berkisar antara (0,61-0,80).
Berdasarkan tabel indeks daya beda di atas, dapat disimpulkan bahwa butir soal ini
berkategori baik karena 26 butir soal berkategori baik dengan perincian 15 butir soal dinyatakan
baik karena memenuhi minimum >0,25-0,35.
BAB III
PENUTUP
A. Simpulan
1. Analisis butir soal adalah identifikasi jawaban benar dan salah tiap butir soal yang diujikan
oleh peserta didik. Melalui kerja analisis itu akan diketahui butir-butir soal mana saja yang
banyak dijawab benar oleh peserta tes dan sebaliknya, butir-butir mana saja yang banyak
dijawab salah.
2. Ada dua teori pengukuran yang terkait dengan analisis butir soal yaitu teori pengukuran
klasik dan teori respon butir. Analisis butir soal dalam teori pengukuran klasik dimaksudkan
untuk menghitung indeks tingkat kesulitan, indeks daya beda, dan efektivitas distraktor.
3. Tingkat kesulitan (item difficulty) adalah pernyataan tentang seberapa mudah atau sulit butir
soal bagi peserta didik yang dikenai pengukuran. Sedangkan indeks daya beda adalah indeks
yang menunjukkan seberapa besar daya sebuah butir soal kemampuan antara peserta
kelompok tinggi dan kelompok rendah.
B. Saran
Sebaiknya dalam penyusunan instrument tes, seperti soal tes hendaknya disesuaikan dengan
kriteria penyusunan soal yang baik dan benar. Hal ini untuk mengetahui tingkat kesukaran, daya
pembeda, pengecoh soal sehingga dapat berfungsi dengan baik.
DAFTAR PUSTAKA