Anda di halaman 1dari 3

ANALISIS BUTIR SOAL

Analisis butir adalah proses menguji respon-respon siswa untuk masing-masing butir tes dalam
upaya menjustifikasi kualitas item. Kualitas item, khususnya direpresentasi oleh tingkat kesukaran, daya
pembeda, validitas dan reliabilitas, dan khusus untuk tes pilihan ganda tidak kalah pentingnya adalah
keefektifan pengecoh dan omit. Tujuan analisis butir soal yaitu untuk mengadakan identifikasi soal-soal
yang baik, kurang baik, dan soal yang buruk.
1. Menghitung Indeks Kesukaran
Dalam menghitung indeks kesukaran tiap butir soal digunakan rumus:

a) 0,00-0,30 tergolong sukar.


b) 0,31-0,70 tergolong sedang
c) 0,71-1,00 tergolong mudah. (Arikunto, 2009)
Dari hasil perhitungan indeks kesukaran maka kemungkinan tidak semua soal dapat terambil. Soal
yang mempunyai indeks kesukaran sedang yang dapat diambil.
2. Menghitung Daya Pembeda
Untuk menghitung daya pembeda digunakan rumus:

Di mana A = jumlah kelompok atas yang menjawab benar,


B = jumlah kelompok bawah yang menjawab benar,
N =jumlah peserta tes
Klasifikasi daya pembeda:
0,00 - 0,20 : jelek (poor)
0,20 0,40 : cukup (satisfactory)
0,40 0,70 : baik (good)
0,70 1,00 : baik sekali (excellent), diterima
negatif : tidak baik, sebaiknya dibuang (Arikunto, 2009)
Setelah diadakan perhitungan daya beda maka dari sejumlah soal yang disusun kemungkinan tidak
semuanya dapat terambil. Soal yang dapat terambil adalah soal yang mempunyai daya beda cukup, baik
dan baik sekali.
3. Keberfungsian Pengecoh (Distraktor)
Distraktor adalah suatu pola yang menggambarkan bagaimana peserta tes menentukan pilihan
jawabannya terhadap kemungkinan-kemungkinan jawaban yang telah dipasangkan pada setiap butir
item. Pengecoh (distractor), bertujuan untuk mengecoh mereka yang kurang mampu (tidak tahu) untuk
dibedakan dengan yang mampu (lebih tahu).
Pada tes pilihan ganda, tiap butir soal menggunakan beberapa pengecoh (distraktor / penyesat /
option). Tiap pengecoh hendaknya bermanfaat atau berfungsi, yakni ada sejumlah siswa yang
memilihnya. Pengecoh yang tidak dipilih sama sekali oleh siswa berarti tidak berfungsi mengecohkan
siswa, sebaliknya pengecoh yang dipilih oleh hampir semua siswa berarti terlalu mirip dengan jawaban
yang benar.
Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif yang dipasang pada butir
item tertentu, sama sekali tidak dipilih oleh testee. Dengan kata lain, testee menyatakan blangko.
Pernyataan blangko ini sering dikenal dengan istilah omiet dan biasa diberi lambang dengan huruf O.
Distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor tersebut
sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta tes.
Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka distraktor
yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai lagi pada tes-tes yang akan datang,
sedangkan distraktor yang belum dapat berfungsi dengan baik sebaiknya diperbaiki atau diganti dengan
distraktor yang lain.
4. Validitas Item
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila
instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud
dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan
data yang tidak relevan dengan tujuan pengukuran. Untuk mencari validitas menggunakan rumus:

Mp = rerata skor dari subjek yang menjawab benar bagi item yang dicari validitasnya
Mt = rerata skor total
Sd = standar deviasi dari skor total
p = proporsi siswa yang menjawab benar (indeks kesukaran)
q = proporsi yang menjawab salah (q = 1-p)
Interpretasi validitas:
0,800 1,00 : sangat tinggi
0,600 0,800 : tinggi
0,400 0,600 : cukup
0,200 0,400 : rendah
0,00 0,200 : sangat rendah
Kriteria validitas:
>0,29 maka VALID, <0,29 maka INVALID (Sumarna. 2004)
5. Reliabilitas
Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui tingkat ketepatan (precision)
dan keajegan (consistency) skor tes.

Untuk mencari nilai reliabilitas, digunakan rumus:


x = skor butir soal ganjil
y = skor butir soal genap
n = jumlah peserta tes
Setelah itu nilai dari rxy dimasukkan ke dalam rumus: r11= 2 (rxy) dibagi 1+ rxy

Kriteria reliabilitas:
1,00 : tinggi
> 0,700: cukup
< 0,700: rendah (Sumarna. 2004)