PENDAHULUAN
B. Rumusan Masalah
Dari uraian latar belakang di atas maka dapat kita rumuskan masalah sebagai berikut:
1. Apa pengertian analisis butir soal?
2. Apa Tujuannya?
3. Bagaimana penganalisisan terhadap butir soal?
C. Tujuan Penulisan
1. Mengetahui pengertian analisis butir soal
2. Mengetahui tujuan penganalisisan
3. Mengetahui bagaimana penganalisisan terhadap butir soal
BAB II
PEMBAHASAN
B. Tujuan Analisis
Analisis butir tes merupakan kegiatan penting dalam upaya memperoleh instrument yang berkategori
baik. Analisis ini meliputi:
1. Menentukan validitas dan reliabilitas tes, dan
2. Analisis butir tes.
Menurut Thorndike & Hagen, analisis terhadap butir tes yang telah dijawab siswa suatu kelas
mempunyai dua tujuan, yakni:
1. Jawaban-jawaban soal-soal tersebut merupakan informasi diagnosis untuk meneliti pelajaran dari kelas itu dan
kegagalan-kegagalan belajarnya, serta selanjutnya untuk membimbing kea rah cara belajar yang baik, dan
2. Jawaban terhadap soal-soal dan perbaikan soal-soal yang didasarkan atas jawaban-jawaban tersebut merupakan
dasar bagi penyiapan tes-tes yang lebih baik.
Analisis butir tes bertujuan untuk mengidentifikasi butir-butir manakah yang termasuk dalam kategori
baik, kurang baik, dan jelek. Analisis butir tes memungkinkan kita memperoleh informasi mengenai baik tidaknya
suatu butir, sekaligus memperoleh petunjuk untuk melakukan perbaikan. Dengan melakukan analisis butir setidaknya
kita dapat mengetahui empat hal penting, yaitu:
1. Bagaimana taraf kesukaran setiap butir tes?
2. Apakah setiap soal memiliki daya pembeda baik?
3. Apakah semua alternative jawaban dapat berfungsi secara baik?
4. Sejauh mana tiap butir tes dapat mengukur hasil pembelajaran?
Sedangkan menurut Witherington dalam bukunya berjudul Psychology Education adalah sebagai
berikut:
Besarnya P Interpretasi
Kurang dari 0,25 Terlalu sukar
0,25 – 0,70 Cukup (Sedang)
Lebih dari 0,70 Terlalu Mudah
Soal dikatakan baik apabila soal tersebut tidak terlalu sukar atau terlalu mudah. Soal yang terlalu
mudah, yakni semua anak dapat mengerjakan dengan benar, adalah tidak baik. Demikian juga soal yang terlalu
sukar, yaitu semua anak tidak dapat mengerjakan soal dengan benar, juga merupakan soal yang tidak baik. Hal itu
disebabkan karena soal yang terlalu mudah tidak merangsang peserta didik untuk mempertinggi usaha
memecahkannya. Dan soal yang terlalu sukar menyebabkan peserta didik putus asa serta menjadi tidak mempunyai
semangat untuk mencoba lagi karena diluar jangkauannya.
Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal kategori mudah, sedang,
dan sukar. Pertimbangan pertama adalah adanya keseimbangan, yakni jumlah soal sama untuk ketiga kategori
tersebut. Artinya, soal mudah, sedang, dan sukar jumlahnya seimbang. Persoalan lain adalah menentukan kriteria
soal, yaitu ukuran untuk menentukan apakah soal tersebut termasuk mudah, sedang atau sukar. Dalam menentukan
kriteria ini digunakan judgment dari guru berdasarkan pertimbangan-pertimbangan tertentu. Pertimbangan tersebut
antara lain adalah :
a. Abilitas yang diukur dalam pertanyaan tersebut
b. Sifat materi yang diujikan atau ditanyakan
c. Isi bahan yang ditanyakan sesuai dengan bidang keilmuannya, baik luasnya maupun kedalamannya
d. Bentuk soal
Dalam kaitannya dengan hasil analisis item dari segi derajat kesukarannya seperti telah dikemukakan
di atas, maka tindak lanjut yang perlu dikemukakan oleh tester adalah sebagai berikut:
Pertama, untuk butir-butir item yang berdasarkan hasil analisis termasuk dalam kategori baik (dalam
arti derajat kesukaran itemnya cukup atau sedang), seyogyanya butir item tersebut segera dicatat dalam buku bank
soal.
Kedua, untuk butir-butir item yang termasuk dalam kategori terlalu sukar, ada tiga kemungkinan tindak
lanjut, (1) butir soal tersebut dibuang/didrop, (2) diteliti ulang, dilacak dan ditelusuri sehingga dapat diketahui faktor
yang menyebabkan butir item yang bersangkutan sulit dijawab oleh testee, (3) Haruslah dipahami bahwa tidak setiap
butir item yang termasuk dalam kategori terlalu sukar itu sama sekali tidak memiliki kegunaan.
Ketiga, untuk butir-butir item yang termasuk dalam kategori terlalu mudah, juga ada tiga kemungkinan
tindak lanjutnya. Yaitu (1) butir soal tersebut dibuang/didrop, (2) diteliti ulang, dilacak dan ditelusuri sehingga dapat
diketahui faktor yang menyebabkan butir item yang bersangkutan mudah dijawab oleh testee, (3) Seperti halnya
butir-butir yang terlalu sukar, butir-butir item yang terlalu mudah juga masih mengandung manfaat, yaitu bahwa butir-
butir item yang termasuk dalam kategori ini dapat dimanfaatkan pada tes-tes (terutama tes seleksi) yang sifatnya
longgar.
Tes dikatakan tidak memiliki daya pembeda apabila tes tersebut, jika diujikan kepada anak berprestasi
tinggi, hasilnya rendah tetapi bila diberikan kepada anak yang lemah hasilnya lebih tinggi. Atau bila diberikan kepada
kedua kategori siswa tersebut hasilnya sama saja.
Dengan demikian, tes yang tidak memiliki daya pembeda, tidak akan menghasilkan gambaran hasil
yang sesuai dengan kemampuan siswa yang sebenarnya. Akan terlihat aneh apabila anak pandai tidak lulus tetapi
anak bodoh lulus dengan baik tanpa dilakukan manipulasi oleh tester (si penilai) atau di luar faktor kebetulan.
Angka yang menunjukkan besarnya daya pembeda disebut indeks daya pembeda (item discrimination)
disingkat D (d besar). Indeks daya pembeda didefinisikan sebagai selisih antara proporsi jawaban benar pada
kelompok atas (peserta didik tes yang mampu/pandai) dengan proporsi jawaban benar pada kelompok bawah
(peserta didik tes yang kurang mampu/pandai). Umumnya, para ahli tes membagi kelompok ini menjadi 27% atau
33% kelompok atas dan 27% atau 33% kelompok bawah (Cureton, 1957).
Contoh: Pembagian Kelompok 27%
Responden SKOR BUTIR SOAL SETIAP NOMOR SOAL Total Skor
1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 0 1 1 1 1 1 9
2 1 1 1 1 1 0 1 1 1 1 9
3 1 1 1 1 1 1 0 0 1 1 8
4 1 1 0 1 1 1 0 1 1 0 7
5 0 1 1 1 1 1 0 1 0 1 7
6 0 1 1 1 1 1 0 1 1 0 7
7 1 0 1 0 1 1 0 1 0 1 6
8 1 1 1 1 1 0 0 1 0 0 6
9 0 1 1 1 1 0 0 0 1 1 6
10 0 1 0 1 1 1 0 0 1 1 6
11 0 1 0 1 1 1 0 1 0 1 6
12 0 1 1 0 1 1 0 1 0 0 5
13 1 1 0 1 0 1 1 0 0 0 5
14 0 0 1 0 1 0 0 1 1 1 5
15 0 1 0 1 0 1 0 1 1 0 5
16 1 1 0 1 0 1 0 0 0 1 5
17 1 0 0 1 0 1 0 1 0 1 5
18 0 0 1 0 0 1 0 1 0 1 4
19 1 0 1 0 0 0 0 1 0 0 3
20 0 0 1 0 1 0 0 0 1 0 3
Indeks daya pembeda berkisar antara -1,00 sampai 1,00. Tanda negatif menunjukkan bahwa peserta
didik tes yang kemampuannya rendah dapat menjawab benar sedangkan peserta didik tes yang kemampuannya
tinggi menjawab salah. Dengan demikian, soal yang indeks daya pembedanya negatif menunjukkan terbaliknya
kualitas peserta didik tes. Indeks daya pembeda dapat dicari dengan menggunakan rumus sebagai berikut ini.
D = indeks daya pembeda
A = jumlah peserta didik tes yang menjawab benar pada kelompok atas
B = jumlah peserta didik tes yang menjawab benar pada kelompok bawah
nA = jumlah peserta didik tes kelompok atas
nB = jumlah peserta didik tes kelompok bawah
Pada kebanyakan kasus, jumlah peserta didik tes kelompok atas sama dengan jumlah peserta didik
tes kelompok bawah, nA = nB = n. Dengan demikian maka rumus daya pembeda menjadi:
Kriteria indeks daya pembeda berdasarkan Crocker dan Algina (1986) adalah sebagai berikut :
Daya Pembeda Kualifikasi
0,00 – 0,19 soal tidak dipakai/dibuang
0,20 – 0,29 soal diperbaiki
0,30 – 0,39 soal diterima tapi perlu diperbaiki
0,40 – 1,00 soal diterima/baik
Contoh:
Tingkat Kesukaran 27% kelompok atas (5 orang dari 20 peserta didik tes)
Responden SKOR BUTIR SOAL SETIAP NOMOR SOAL Total
1 2 3 4 5 6 7 8 9 10 Skor
1 1 1 1 1 0 1 1 1 1 1 9
2 1 1 1 1 1 0 1 1 1 1 9
3 1 1 1 1 1 1 0 0 1 1 8
4 1 1 0 1 1 1 0 1 1 0 7
5 0 1 1 1 1 1 0 1 0 1 7
Xatas 4 5 4 5 4 4 2 4 4 4
Skor maks 1 1 1 1 1 1 1 1 1 1
Kel. Atas 5 5 5 5 5 5 5 5 5 5
(P) kel. Atas 0.8 1.0 0.8 1.0 0.8 0.8 0.4 0.8 0.8 0.8
Tingkat Kesukaran 27% kelompok bawah (5 orang dari 20 peserta didik tes)
Responden SKOR BUTIR SOAL SETIAP NOMOR SOAL Total
1 2 3 4 5 6 7 8 9 10 Skor
16 1 1 0 1 0 1 0 0 0 1 5
17 1 0 0 1 0 1 0 1 0 1 5
18 0 0 1 0 0 1 0 1 0 1 4
19 1 0 1 0 0 0 0 1 0 0 3
20 0 0 1 0 1 0 0 0 1 0 3
Xatas 3 1 3 2 1 3 0 3 1 3
Skor maks 1 1 1 1 1 1 1 1 1 1
Kel. Bawah 5 5 5 5 5 5 5 5 5 5
(P) kel. bawah 0.6 0.2 0.6 0.4 0.2 0.6 0 0.6 0.2 0.6
Untuk mengetahui besar kecilnya angka indeks diskriminasi item dapat dipergunakan rumus berikut ini:
D = Discriminatory power (angka indeks diskriminasi item)
PA = Proporsi testee kelompok atas yang dapat menjawab dengan betul butir item yang bersangkutan
PB = Proporsi testee kelompok bawah yang dapat menjawab dengan betul butir item yang bersangkutan
Tabel berikut menunjukkan daya pembeda soal nomor 1 sampai dengan nomor 10 berdasarkan perbedaan
27% kelompok atas dan 27% kelompok bawah.
Daya Pembeda Soal
Soal Tingkat kesukaran Tingkat kesukaran Daya pembeda Soal (D)
kelompok atas kelompok bawah
1 0.80 0.60 0.20
2 1.00 0.20 0.80
3 0.80 0.60 0.20
4 1.00 0.40 0.60
5 0.80 0.20 0.60
6 0.80 0.60 0.20
7 0.40 0 0.40
8 0.80 0.60 0.20
9 0.80 0.20 0.60
10 0.80 0.60 0.20
Soal nomor 1, 3, 6, 8, dan 10 berdaya pembeda 0.20. Hal ini berarti kelompok lima soal tersebut
mempunyai kualifikasi soal yang harus diperbaiki. Hal ini sesuai dengan pengklasifikasian daya pembeda oleh
Crocker dan Algina yang telah dijelaskan di atas.
Dalam hubungan ini, patokan yang pada umumnya dipegangi adalah sebagai berikut:
Besarnya Angka Indeks
Klasifikasi Interpretasi
Diskriminasi Item
Butir item yang bersangkutan daya
Kurang dari 0,20 Poor pembedanya lemah sekali (jelek), dianggap
tidak memiliki daya pembeda yang baik
Butir yang bersangkutan telah memiliki daya
0,20-0,40 Satisfactory
pembeda yang cukup (sedang)
Butir yang bersangkutan telah memiliki daya
0,40-0,70 Good
pembeda yang baik
Butir item yang bersangkutan telah memiliki
0,70-1,00 Excellent
daya pembeda yang baik sekali
Butir item yang bersangkutan daya
Bertanda negatif -
pembedanya negative (jelek sekali)
BAB III
PENUTUP
A. Simpulan
Analisis butir soal merupakan suatu prosedur yang sistematis, yang akan memberikan informasi-
informasi yang sangat khusus terhadap butir tes yang akan kita susun. Analisis butir soal pada dasarnya bertujuan
untuk mengetahui apakah setiap item soal benar-benar baik, sehingga diperlukan analisis terhadapnya.
Analisis butir tes bertujuan untuk mengidentifikasi butir-butir manakah yang termasuk dalam kategori
baik, kurang baik, dan jelek. Analisis butir tes memungkinkan kita memperoleh informasi mengenai baik tidaknya
suatu butir, sekaligus memperoleh petunjuk untuk melakukan perbaikan.
Penganalisisan terhadap butir-butir soal dapat dilakukan dari tiga segi yaitu:
1. Teknik analisis kesukaran item soal
Analisis tingkat kesukaran soal yaitu mengkaji soal-soal tes dari segi kesulitannya sehingga dapat
diperoleh soal-soal mana yang termasuk mudah, sedang, dan sukar. Tingkat kesukaran soal dipandang dari
kesanggupan atau kemampuan siswa dalam menjawab, bukan dilihat dari sudut guru sebagai pembuat soal.
Angka indeks kesukaran item ini dapat diperoleh dengan menggunakan rumus yang dikemukakan oleh
Dubois yaitu:
2. Teknik analisis daya pembeda
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan
(mendiskriminasi) antara kemampuan tinggi dan rendah. Daya pembeda item itu penting sekali bagi salah satu dasar
untuk menyusun butir item tes hasil belajar.
Rumus untuk menentukan indeks diskriminasi adalah:
B. Saran
Analisis butir soal hendaknya kita lakukan untuk dapat mengidentifikasi butir-butir tes secara baik dan
tepat dan dapat memahami informasi yang diperoleh untuk melakukan perbaikan.
DAFTAR PUSTAKA