Anda di halaman 1dari 18

Analisis Perbaikan Butir Soal

A. Mengapa Analisis Butir Soal Penting?

Dengan melakukan analisis butir soal dapat diperoleh banyak informasi yang bermanfaat, baik untuk
guru, siswa maupun proses pembelajaran itu sendiri. Menganalisis butir soal dilakukan dengan harapan
dapat meningkatkan kualitas butir soal tersebut. Menurut Nitko (1983), analisis butir soal
menggambarkan suatu proses pengambilan data dan penggunaan informasi tentang butir-butir soal,
terutama informasi tentang respon siswa terhadap setiap butir soal. Lebih lanjut penggunaan analisis
butir soal adalah sebagai berikut:
1. Untuk mengetahui apakah butir-butir soal yang disusun sudah berfungsi sesuai dengan apa yang
dikehendaki oleh penyusun soal. Untuk itu perlu diperhatikan hal-hal sebagai berikut:

a. Apakah soal-soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku seperti
telah dirumuskan dalam tujuan pembelajaran khusus?
b. Apakah tingkat kesukaran soal sudah diperhitungkan?
c. Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang
kurang pandai?
d. Apakah kunci soal sudah sesuai dengan maksud soal?
e. Jika digunakan tes pilihan ganda, apakah pengecoh (distractor) yang dipilih sudah berfungsi
dengan baik?
f. Apakah soal tersebut masih dapat ditafsirkan ganda atau tidak?

2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu
materi.
3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan-kesulitan yang dialami siswa dalam
memahami suatu materi.
4. Sebagai acuan untuk merevisi soal.
5. Untuk memperbaiki (meningkatkan) kemampuan guru dalam menulis soal.

B. Kapan Analisis Butir Soal Dilakukan?


Pada saat guru mengujikan suatu set soal untuk mengambil keputusan penting tentang hasil belajar
siswa, maka idealnya guru harus yakin bahwa set soal tersebut adalah valid dan reliabel. Validitas set
soal dapat diketahui dari kisi-kisi soal sedangkan reliabilitas soal baru dapat diketahui setelah uji coba.
Sehingga untuk mengetahui reliabilitas set soal dilakukanlah analisis butir soal.
1. Tingkat Kesukaran (P)
Tingkat kesukaran suatu butir soal merupakan salah satu yang dapat menunjukkan kualitas butir soal
tersebut (mudah, sedang, sukar). Suatu butir soal dikatakan mudah jika sebagian besar siswa dapat
menjawab dengan benar dan dikatakan sukar jika sebagian besar siswa tidak dapat menjawab dengan
benar. Besarnya tingkat kesukaran butir soal dapat dihitung dengan memperhatikan proporsi peserta tes
yang menjawab benar terhadap setiap butir soal, dalam hal ini dapat dihitung dengan menggunakan
rumus:
P=B/N
Keterangan:
P adalah indeks tingkat kesukaran butir soal
B adalah jumlah peserta tes yang menjawab benar
N adalah jumlah seluruh peserta tes
Contoh:
Jika butir soal nomor 1 yang Anda ujikan dapat dijawab dengan benar oleh 10 dari 40 siswa, maka indeks
tingkat kesukaran butir soal tersebut adalah:
P = 10 / 40 = 0,25
Indeks tingkat kesukaran butir soal bergerak antara 0,00 sampai dengan 1,00. Indeks tingkat
kesukaran suatu butir soal (P) = 0,00 akan tercapai apabila seluruh peserta tes tidak ada yang menjawab
dengan benar dan indeks tingkat kesukaran suatu butir soal (P) = 1,00 akan tercapai apabila seluruh
peserta tes dapat menjawab dengan benar. Jadi butir soal yang mudah akan mempunyai P mendekati
1,00 dan butir soal yang sukar akan mempunyai P mendekati 0,00.
Menurut Fernandes (1984) kategori indeks tingkat kesukaran butir soal adalah sebagai berikut:
P >= 0,76 : mudah
0,25 P 0,75 : sedang
P 0,24 : sukar
Butir soal yang dianggap sangat bermanfaat (useful) adalah butir soal yang mempunyai indeks
tingkat kesukaran dalam kategori sedang.
2. Daya Pembeda (D)
Daya pembeda butir soal memiliki pengertian seberapa jauh butir soal tersebut dapat membedakan
kemampuan individu peserta tes. Butir soal yang didukung oleh potensi daya pembeda yang baik akan
mampu membedakan peserta tes (peserta didik) yang memiliki kemampuan tinggi (pandai) dengan
peserta didik yang memiliki kemampuan rendah (kurang pandai).
Indeks daya pembeda butir soal dapat dihitung dengan menggunakan rumus:
D = PA PB
Keterangan:
D adalah indeks daya pembeda butir soal
PA adalah proporsi kelompok atas yang menjawab benar
PB adalah proporsi kelompok bawah yang menjawab benar
Contoh:
Dalam menjawab butir soal nomor 2, diperoleh 6 dari 10 siswa yang termasuk dalam kelompok atas
dapat menjawab benar dan 2 dari 10 siswa yang termasuk kelompok bawah dapat menjawab benar,
maka indeks daya pembeda butir soal tersebut adalah:
D = (6/10) (2/10) = 4/10 = 0,4
Yang dimaksud siswa kelompok atas adalah kelompok siswa yang memperoleh skor tinggi
sedangkan yang dimaksud dengan siswa kelompok bawah adalah kelompok siswa yang memperoleh
skor rendah setelah mengerjakan satu set suatu mata pelajaran.
Nilai indeks daya pembeda butir soal bergerak dari 1 sampai 1. Semakin tinggi indeks daya
pembeda menunjukkan bahwa butir soal tersebut semakin dapat membedakan antara siswa yang pandai
dengan siswa yang kurang pandai.
Secara teoritis indeks daya pembeda soal (D) = 1 akan tercapai apabila semua siswa kelompok atas
dapat menjawab benar dan semua siswa kelompok bawah menjawab salah. Indeks daya pembeda soal
(D) = 1 akan tercapai apabila semua siswa dalam kelompok atas menjawab salah dan semua siswa
kelompok bawah dapat menjawab benar.
Sedangkan indeks daya pembeda soal (D) = 0 tercapai apabila proporsi siswa yang menjawab benar
dalam kelompok atas dan kelompok bawah adalah sama.
Butir soal yang mempunyai indeks daya pembeda negatif adalah butir soal yang kurang baik karena
soal tersebut tidak bisa membedakan siswa yang pandai dengan siswa yang kurang pandai, di mana
siswa yang kurang pandai justru lebih banyak menjawab benar daripada siswa yang pandai.
Butir soal mempunyai daya pembeda yang baik jika kunci (jawaban soal) mempunyai daya pembeda
positif dan pengecohnya mempunyai daya pembeda negatif. Menurut Fernandes (1984) kategori indeks
daya pembeda butir soal adalah sebagai berikut:
D 0,40 : sangat baik
0,30 D 0,39 : baik
0,20 D 0,29 : sedang
D <= 0,19 : tidak baik

C. Bagaimana Cara Melakukan Analisis Secara Sederhana?


Untuk melakukan analisis butir soal secara sederhana, berikut ini disajikan langkah-langkah yang
diperlukan:
1. Hitunglah jumlah jawaban yang benar untuk seluruh siswa.
2. Berdasarkan jumlah jawaban yang benar dari seluruh siswa tersebut susunlah skor siswa mulai skor
tertinggi ke skor terendah.
3. Berdasarkan urutan skor tersebut tentukan siswa yang termasuk dalam kelompok atas dan siswa
dalam kelompok bawah. Untuk menentukan berapa persen siswa yang termasuk kelompok atas dan
berapa persen yang masuk kelompok bawah gunakan rambu-rambu sebagai berikut:

a. Jika jumlah siswa <= 20, maka jumlah kelompok atas dan kelompok bawah masing-masing 50%.
b. Jika jumlah siswa 21 40 , maka jumlah kelompok atas dan kelompok bawah masing-masing
33,3%.
c. Jika jumlah siswa 41, maka jumlah kelompok atas dan kelompok bawah masing-masing 27%.

4. Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap-tiap alternatif jawaban yang
disediakan.
5. Dengan cara yang sama hitunglah jumlah siswa dalam kelompok bawah yang memilih tiap-tiap
alternatif jawaban yang disediakan.
6. Hitung jumlah seluruh peserta tes (kelompok atas, tengah, bawah) yang menjawab benar.
7. Tentukanlah tingkat kesukaran dan daya pembeda butir soal dengan menggunakan rumus yang telah
disediakan.
Contoh:
Perhatikan jawaban 100 siswa terhadap butir soal nomor 1 berikut:
Kelompok Alternatif Jawaban Jumlah
A B* C D E
Atas 5 15 0 0 7 27
Tengah 3 25 12 0 5 27
Bawah 7
Catatan: * (kunci jawaban)
Indeks tingkat kesukaran butir soal di atas adalah:
P = B / N = (15 + 25 + 7)/100 = 47/100 = 0,47
Indeks daya pembeda butir soal di atas adalah :
D = PA PB = (15/27) (7/27) = 0,30

D. Bagaimana Memperbaiki Butir Tes?


Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal adalah sebagai berikut:
1. Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika mempunyai indeks tingkat
kesukaran (P) antara 0,25 sampai dengan 0,75 atau yang mendekati angka tersebut.
2. Perhatikan daya pembeda butir soal. Butir soal dianggap baik jika kunci (jawaban soal) mempunyai
indeks daya pembeda positif tinggi dan pengecohnya mempunyai indeks daya pembeda negatif.
3. Perhatikan stem atau pokok soalnya sebab stem yang ambigius akan membingungkan peserta ujian
untuk menentukan jawabannya

FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN, PILIHAN GANDA,


INSTRUMEN PERBUATAN DAN INSTRUMEN NON-TES

A. Analisis Butir Soal Secara Kualitatif dan Kuantitatif


Menurut Kamus Besar Bahasa Indonesia (2002) analisis adalah penguraian suatu pokok
atas berbagai bagiannya dan penelaahan bagian itu sendiri serta hubungan antar bagian untuk
memperoleh pengertian yang tepat dan pemahaman arti keseluruhan.Analisis butir soal yang
dalam bahasa inggris disebut item analiysis dilakukan terhadap empirik. Maksudnya, analisis itu
baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir
soal telah kita peroleh. Analisis butir soal adalah suatu kegiatan analisis untuk menentukan tingkat
kebaikan butir-butir soal yang terdapat dalam suatu tes sehingga informasi yang dihasilkan dapat
kita pergunakan untuk memperbaiki butir soal dan tes tersebut.
Identifikasi terhadap setiap butir item soal dilakukan dengan harapan akan menghasilkan
berbagai informasi berharga, yang pada dasarnya akan merupakan umpan balik (feed back) guna
melakukan perbaikan, pembenahan, dan penyempurnaan kembali terhadap butir-butir soal,
sehingga pada masa-masa yang akan yang akan dating tes hasil belajar yang disusun atau dirancang
oleh guru itu betul-betul dapat menjalankan fungsinya sebagai alat pengukur hasil belajar yang
memiliki kualitas yang tinggi.
Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan analisis butir soal merupakan
kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu. Tujuan kegiatan
ini adalah:
1. Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan,
2. meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif,
3. mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah
diajarkan.
Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya tentang
siswa mana yang telah menguasai materi dan siswa mana yang belum menguasai materi.
Selanjutnya menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal
dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya) dan kuantitatif (berkaitan
dengan ciri-ciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan
konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validitas dan reliabilitas butir
soal, kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-masing memiliki
keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah menggunakan atau memadukan
keduanya.
Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaida
penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan sebelum soal
digunakan atau diujikan. Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah
setiap soal ditelaah dari segi materi, konstruksi, bahasa atau budaya, dan kunci jawaban atau
pedoman penskorannya. Dalam menganalisis butir soal, terdapat dua teknik. Yaitu teknik
kualitatifdan teknik kuantitatif.
1.Teknik Analisis Secara Kualitatif
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif,
diantaranya adalah teknik moderator dan teknik panel.
a. Teknik moderator
Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama
dengan beberapa ahli seperti guru yang mengajarkan materi, ahli materi, penyusun atau
pengembangkurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi.Teknik ini sangat
baik karena setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya. Di
samping itu, para penelaah dipersilakan mengomentari berdasarkan kompetensinya masing-
masing. Setiap komentar atau masukan dari peserta diskusi dicatat. Setiap butir soa ldapat
dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini
memiliki kelemahan karena memerlukan waktu lama untuk rnendiskusikan setiap satu butir
soal.Teknik berikutnya adalah
b. Teknik Panel
Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya
ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi,
bahasa/budaya, kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh beberapa
penelaah. Caranya adalah beberapa penelaah diberikan: butir-butir soal yang akan
ditelaah, format penelaahan, dan pedoman penilaian/ penelaahannya. Pada tahap awal para
penelaah diberikan pengarahan, kemudian tahap berikutnya para penelaah berkerja sendiri-
sendiri di tempat yang tidak sama. Penalaah dipersilakan memperbaiki langsung pada teks soal
dan memberikan nilai pada setiap butir soalnya yang kriterianya adalah : baik, diperbaiki, atau di
ganti. Secara ideal penelaah butiran soal di samping memiliki latar belakang materi yang diujikan,
beberapa penelaah yang diminta untuk menelaah butir soal memiliki ketrampilan, seperti guru
yang mengajarkan materi itu,
ahlimateri, ahli pengembang kurikulum, ahli penilaian, psikolog, ahli bahasa, ahli kebijakan
pendidikan, atau lainnya.
2. Analisis Butir Soal Secara Kuantitatif
Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan pada bukti
empirik. Salah satu tujuan utama pengujian butir-butir soal secara emperik adalah untuk
mengetahui sejauh mana masing-masing butir soal membedakan antara mereka yang tinggi
kemampuannya dalam hal yang didefinisikan oleh kriteria dari mereka yang rendah
kemampuannya.
Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam analisis secara
kuantitatif yaitu pendekatan secara klasik dan modern.
a. Analisis butir soal secara klasik
Analisa butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari
jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan
teori tes klasik. Pada teori tes klasik, analisis item tes dilakukan dengan memperhitungkan
kedudukan item dalam suatu kelas atau kelompok. Karakteristik atau kualitas item sangat
tergantung pada kelompok dimana diujicobakan sehingga kualitas item terikat pada sampel
responden atau peserta tes yang memberikan respons (sample bounded).
Ada beberapa kelebihan analisis butir soal secara klasik adalah murah, sederhana, familiar,
dapat dilaksanakan sehari-hari dengan cepat menggunakan komputer dan dapat menggunakan
beberapa data dari peserta tes.
b. Analisis butir soal secara moderen
Analisa butir soal secara moderen adalah penelaahan butir soal dengan menggunakan teori
respon butir atau item response theory. Teori ini merupakan suatu teori yang menggunakan fungsi
matematika untuk menghubungkan antara peluang menjawab benar suatu butir dengan
kemampuan siswa.
Teori ini muncul karena adanya beberapa keterbatasan pada analisis secara klasik, yaitu:
1) Tingkat kemampuan dalam teori klasik adalah true score. Artinya, jika suatu tes sulit maka tingkat
kemampuan peserta tes akan rendah. sebaliknya, jika suatu tes mudah maka tingkat kemampuan
peserta tes tinggi.
2) Tingkat kesukaran butir soal didefinisikan sebagai proporsi peserta tes yang menjawab benar.
Mudah atau sulitnya butir soal tergantung pada kemampuan peserta tes. Daya pembeda,
reliabilitas, dan validitas tes tergantung pada kondisi peserta tes.
A. Analisis Butir Soal
Pedoman penskoran. Caranya beberapa penelaah diberikan butir-butir soal yang akan
ditelaah, format penelaahan, dan pedoman penilaian atau penelaahan. Pada tahap awal, semua
orang yang terlibat dalam kegiatan penelaahan disamakan persepsinya, kemudian
mereka terlibat berkerja sendiri-sendiri di tempat berbeda. Para penelaah dipersilakan
memperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pada
setiap butir soal dengan kriteria: soal baik, perlu diperbaiki, atau diganti.Dalam menganalisis butir
soal secara kualitatif, penggunaan format penelaahan soal akan sangat membantu dan
mempermudah prosedur pelaksanaannya. Format penelaahan soal digunaka sebagai dasar untuk
menganalisis setiap butir soal. Format penelaahan soal yang dimaksud adalah format penelaahan
butir soal: uraian, pilihan ganda, tes perbuatan dan instrumen non-tes. Berikut disajikan keempat
format penelaahan butir soal.
a. Format Penelaahan Butir Soal Bentuk Uraian
FORMAT PENELAAHAN SOAL BENTUK URAIAN
Mata pelajaran :
Kelas/semester :
Penelaah :
NomorSoal
No. Aspek yang ditelaah 1 2 3 4 5 6 7 8 9 ...
A.
1
Materi
Soal sesuai dengan indikator(menuntuttes tertulis untuk
2 bentuk Uraian)
Batasan pertanyaandan jawaban yang diharapkan sudah
3 sesuai
Materi yang ditanyakan sesuai dengankompetensi (urgensi,
relevasi, kontinyuitas, keterpakaian sehari- hari tinggi)
Isi materi yang ditanyakan sesuai dengan jenjang jenis
4 sekolah atau tingkatkelas
Konstruksi
B Menggunakan kata tanya atau perintahyang menuntut
5 jawaban uraian
Ada petunjukyang jelas tentangcara mengerjakan soal
Ada pedoman penskorannya
6 Tabel, gambar, grafik, peta,atau yang sejenisnya disajikan
dengan jelas dan terbaca
7
8

NomorSoal
No. Aspek yang ditelaah 1 2 3 4 5 6 7 8 9 ...
C.
9
Bahasa/Budaya
10 Rumusan kalimat coal komunikatif
Butir soal menggunakan bahasa
11 Indonesia yang baku
Tidak menggunakan kata/ungkapan yang menimbulkan
12 penafsiran ganda atau salah pengertian
Tidak menggunakan bahasa yang berlaku setempat/tabu
13 Rumusan soal tidak mengandung

Keterangan : Berilah tanda (V) bila tidak sesuai dengan aspek yangditelaah !

b. Format Penelaahan untuk Instrumen pilihan ganda


FORMAT PENELAAHAN SOAL BENTUK PILIHAN GANDA
Mata Pelajaran :.................................
Kelas/semester:.................................
Penelaah:.................................
Nomor S
oal
N ..
o. Aspek yang ditelaah 1 2 3 4 5.
A.
1

2.

3.
4.

B.
5.

6.

7. Materi
Soal sesuai dengan indikator (menuntuttes tertulis untuk bentuk pilihan
8 ganda
Materi yang ditanyakan sesuai dengan kompetensi
9. (urgensi,relevasi, kontinyuitas, keterpakaian sehari- hari tinggi)
Pilihan jawaban homogen dan logis
10 Hanya ada satu kunci jawaban
. Konstruksi
Pokok soal dirumuskan dengansingkat,jelas,dan tegas
Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang
11 diperlukan saja
. Pokok soal tidak memberi petunjuk kunci jawaban
12 Pokok soal bebas dan pernyataan yang bersifat negatif ganda
. Pilihan jawaban homogen dan logis ditinjau dari segi materi
Gambar, grafik, tabel, diagram, atausejenisnya
jelas dan berfungsi
13 Panjang pilihan jawaban relatif sama
. Pilihan jawaban tidak menggunakan pernyataan "semua jawaban di atas
salah/benar"dan sejenisnya
Pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan
14 besar kecilnya angka atau kronologisnya
. Butir soal tidak bergantung pada jawaban soal sebelumnya
C.
15
.

16 Bahasa/Budaya
. Menggunakan bahasa yang sesuai dengankaidah bahasa Indonesia
17 Menggunakan bahasa yang komunikatif
. Tidak menggunakan bahasa yangberlakusetempat/tabu
18 Pilihan jawaban tidak mengulangkata/kelompok kata yang sama,kecualimerup
. akan satu kesatuan pengertian
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

c. Format Penelaahan untuk Instrumen Perbuatan


FORMAT PENELAAHAN SOAL TES PERBUATAN
Mata Pelajaran:.................................
Kelas/semester: .................................
Penelaah :.................................
Nomor Soal
No. Aspek yang ditelaah 1 2 3 ...
. Materi
1. Soal sudah sesuai dengan indikator (menuntut tes
perbuatan: kinerja, hasil karya, atau penugasan)
2. Pertanyaan dan jawaban yang diharapkan sudah sesuai
3. Materi sesuai dengan tuntutan kompetensi (urgensi,
relevansi, kontinyuitas, keterpakaian sehari-hari tinggi)
4. Isi materi yang ditanyakan sesuai dengan jenjang jenis
sekolah taua tingkat kelas
B. Konstruksi
5. Menggunakan kata tanya atau perintah yang menuntut
jawaban perbuatan/praktik
6. Ada petunjuk yang jelas tentang cara mengejakan soal
7. Ada pedoman penskorannya
8. Tabel, peta, gambar, grafik, atau sejenisnya disajkian
dengan jelas dan terbaca
C. Bahasa/Budaya
9. Rumussan soal komunikatif
10. Butir soal menggunakan bahasa Indonesia yang baku
11. Tidak menggunakan kata /ungkapan yang menimbulkan
penafsiran ganda atau salah pengertian
12. Tidak menggunakan bahasa yang berlaku setempat/tabu
13. Rumusan soal tidak mengandung kata/ungkatpan yang
dapat menyinggung perasaan siswa
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
d. Format Penelaahan untuk Instrumen Non-Tes
FORMAT PENELAAHAN SOAL NON-TES
Nama Tes :.................................
Kelas/semester: .................................
Penelaah :.................................
Nomor Soal
No. Aspek yang ditelaah 1 2 3 ...
A. Materi
1. Pernyataan/soal sudah sesuai dengan rumusan indikator
dalam kisi-kisi.
2. Aspek yang diukur pada setiap pernyataan sudah sesuai
dengan tuntutan dalam kisi-kisi (misal untuk tes sikap:
aspek koginisi, afeksi, atau konasinya dan pernyataan
positif atau negatifnya).
Konstruksi
B. Pernyataan dirumuskan dengan singkat (tidak melebihi
3. 20 kata ) dan jelas.
Kalimatnya bebas dari pernyaatn yang tidak relevan
4. objek yang dipersoalkan atau kalimatnya merupakan
pernyataan yang diperlukan saja.
Kalimatnya bebas dari pernyataan yang bersifat negatif
5. ganda.
Kalimatnya bebas dari pernyataan yang mengacu pada
6. masa lalu.
Kalimatnya bebas dari pernyataan faktual atau dapat
7. diinterpretasikan sebagai fakta.
Kalimatnya bebas dari pernyataan dapat
diinterpretasikan lebih
8. Kalimatnya bebas dari pernyataan yang
mungkin disetujui atau dikosongkan oleh hampir semua
9. responden.
Setiap pernyataan hanya berisi satu gagasan secara
lengkap.
10. Kalimatnya bebas dari pernyatan yang tidak pasti pasti
seperti semua, selalu, kadang-kadang, tidak satupun,
11. tidak pernah.
Jangan banyak menggunakan kata hanya, sekedar,
semata-mata gunakan seperlunya.
12. Bahasa/Budaya
Bahsa soa harus komunikatif dan sesuai dengan jenjang
C. pendidikan siswa atau responden.
13. Soal harus menggunakan bahasa Indonesia baku. Soal
tidak menggunakan bahasa yang berlaku
14. setempat/tabu.
15.
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

B. Parameter Item Tes yang Baik


Sebagaimana telah disebut sebelumnya, bahwa item tes yang baik adalah item yang
memenuhi syarat sebagaimana kriteria atau karakteristik item tes yang baik. Karakteristik item
yang dimaksud adalah tingkat kesulitan atau kesukaran, daya pembeda, dan efektivitas pengecoh.

1. Tingkat Kesulitan atau Kesukaran (Difficulty level)


Tingkat kesukaran soal adalah peluang menjawab benar suatu soal pada tingkat
kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Tingkat kesukaran
dinyatakan dalam indeks kesukaran (dificulty index), yaitu angka yang menunjukkan proporsi
siswa yang menjawab benar soal tersebut. Semakin besar indeks tingkat kesukaran yang diperoleh
dan hasil hitungan, berarti semakin mudah soal itu.
Dalam hal ini, item yang baik adalah item yang tingkat kesukarannya dapat
diketahui, tidak terlalu sukar dan tidak terlalu mudah. Sebab, tingkat kesukaran item itu memiliki
korelasi dengan daya pembeda. Bilamana item memiliki tingkat kesukaran yang maksimal, maka
daya pembedanya akan rendah, demikian pula bila item itu terlalu mudah maka tidak akan
memiliki daya pembeda.
Oleh karena itu, sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas yang
mampu memberikan daya pembeda. Namun, jika terdapat tujuan khusus dalam penyusunan tes,
maka tingkat kesukaran itu bisa dipertimbangkan. Misalnya, tingkat kesukaran item untuk tes
sumatif berbeda dengan tingkat kesukaran pada tes diagnostik.
Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan rumus sebagai berikut:
TK = U + L
T
Keterangan:
U = jumlah siswa yang termasuk kelompok pandai (upper group)yang menjawab benar untuk tiap soal.
L = jumlah siswa yang termasuk kurang (lower group) yang menjawab benar untuk tiap soal.
T = jumlah siswa dari kelompok pandai dan kelompok kurang(jumlah upper group dan lower group)
Misalkan suatu tes yang terdiri atas N soal yang diberikan kepada 40 siswa. Dari hasil tes
tersebut, tiap-tiap soal dianalisis taraf kesukarannya. mula-mula hasil tes itu kita susun kedalam
peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa kelompok pandai), dan 10 lembar
jawaban siswa dari kelompok yang kurang pandai. Kemudian kita tabulasikan. Misalkan dari
tabulasi soal kita peroleh hasil sebagai berikut: yang menjawab benar dari kelompok pandai ada 9
siswa, dan yang menjawab benar dari kelompok kurang pandai ada 4 siswa.
Dengan menggunakan rumus diatas, maka taraf kesukaran atau TK dari soal adalah:
TK = U + L = 9 + 4 = 0,65 atau 65%
T 20
Jadi dapat disimpilkan bahwa nilai dari TK atau tingkat kesukarannya adalah 65%.
Sedangkan dalam bukunya Drs. H. Daryanto, rumus untuk mencari taraf kesukaran atau indeks
kesukaran adalah:
P= B
JS
Keterangan:
P = indeks kesukaran.
B = banyaknya siswa yang menjawab soal itu dengan benar.
JS = jumlah seluruh siswa peserta tes.
Contoh:
Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40 siswa tersebut terdapat 12 siswa
yang mampu mengerjakan soal no. 1 dengan benar. Maka berapa indeks kesukarannya?
Jawab:
P = B
JS
= 12
40
= 0,30
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut:
a. Soal dengan P 0,00 sampai 0,30 adalah soal sukar.
b. Soal dengan P 0,30 sampai 0,70 adalah soal sedang.
c. Soal dengan P 0,70 sampai 1,00 adalah soal mudah.
2. Daya Pembeda
Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal mampu
membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang belum
atau kurang menguasai kompetensi berdasarkan kriteria tertentu. Semakin tinggi koofisien daya
pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan antara peerta didik
yang menguasai kompetensi dengan pesertan didik yang kurang menguasai kompetensi.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi. Daya pembeda
suatu soal tes dapat dihitung dengan menggunakan rumus sebagai berikut:
DP = U L
T
Keterangan:
DP = indeks DP atau daya pembeda yang dicari.
U = jumlah siswa yang termasuk dalam kelompok pandai yang mampu menjawab benar untuk tiap
soal.
L = jumlah siswa yang termasuk kurang yang menjawab benar untuk tiap soal.
T = jumlah siswa keseluruhan.
Contoh:
Dari hasil tes lomba olimpiade IPS, jumlah siswa yang dites adalah 40 siswa, sedangkan tes
tersebut terdiri dari 20 soal. Setelah hasil tes tersebut diperiksa, kemudian disusun kedalam
peringkat untuk menentukan 25% siswa yang termasuk kelompok pandai (upper group) dan 25%
siswa yang termasuk kelompok kurang (lower group).
Kemudian hasil tes tersebut ditabulasikan dengan menggunakan format tabulasi jawaban tes,
kemudian hasil tabulasi dari kedua kelompok tersebut dimasukkan kedalam format analisis soal
tes, sehingga kita dapat menghitung tingkat kesukaran dan daya pembeda tiap soal yang kita
analisis.
Misalkan dari tabulasi soal no. 1 kita peroleh hasil sebagai berikut: yang menjawab benar dari
kelompok pandai ada 10 siswa, dan yang menjawab benar dari kelompok kurang ada 9 siswa.
Maka daya pembedanya adalah:
DP = U L
T
= 10 9
x (20)
= 1
10
= 0,10
Jadi dapat disimpulkan bahwa indeks pembedanya adalah 0,10.
Dalam bukunya Prof. Dr. Suharsimi Arikunto, dijelaskan mengenai klasifikasi daya pembeda,
yaitu:
D = 0,00 0,20 = jelek (poor).
D = 0,20 0,40 = cukup (satisfactory).
D = 0,40 0,70 = baik (good).
D = 0,70 1,00 = baik sekali (excellent).
3. Analisis pengecoh (Efektifitas Distraktor )
Instrumen evaluasi yang berbentuk tes dan objektif, selain harus memenuhi syarat-syarat yang
telah disebutkan terdahulu, harus mempunyai distraktor yang efektif. Yang disebut dengan
distraktor atau pengecoh adalah opsi-opsi yang bukan merupakan kunci jawaban (jawaban benar).
Butir soal yang baik pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab
salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata.
Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau mendekati
jumlah ideal. Indeks pengecoh dihitung dengan rumus:
IP = P x 100%
(N - B) (n - 1)
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban
1= bilangan tetap
Catatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci jawaban), maka IP
= 0 yang berarti soal tersebut jelek. Dengan demikian pengecoh tidak berfungsi.
Contoh:
50 orang peserta didik dites dengan 10 soal bentuk pilihan ganda. Tiap soal memiliki alternatif
jawaban (a, b, c, d, e). Kunci jawaban (jawaban yang benar) no. 8 adalah c. Setelah soal no.8
diperiksa untuk semua peserta didik, ternyata dari 50 orang peserta didik, 20 peserta didik
menjawab benar dan 30 peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata.

Berikut ini adalah contoh soal no.8.


Alternatif jawaban A B C D E
Distribusi jawaban peserta 7 8 20 7 8
didik
IP 93% 107% ** 93% 107%
Kualitas pengecoh ++ ++ ++ ++ ++

Keterangan:
** = kunci jawaban
++ = sangat baik
+ = baik
= kurang baik
_ = jelek
_ _ = sangat jelek
Pada contoh diatas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan 107%. Semuanya dekat
dengan angka 100%, sehingga digolongkan sangat baik sebab semua pengecoh itu berfungsi. Jika
pilihan jawaban peserta didik menumpuk pada satu alternatif jawaban, misalnya seperti berikut:
Alternatif jawaban A B C D E
Distribusi jawaban peserta didik 20 2 20 8 0
IP 267% 27% ** 107% 0%
Kualitas pengecoh _ - ** ++ _
Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan (b) tidak
berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu diganti karena termasuk
jelek, danpengecoh (b) perlu direvisikarena kurang baik. adapun kualitas pengecoh berdasar indeks
pengecoh adalah:
1) Sangat baik IP = 76% - 125%
2) Baik IP = 51% - 75% atau 126% - 150%
3) Kurang baik IP = 26% - 50% atau 151% - 175%
4) Jelek IP = 0% - 25% atau 176% - 200%
5) Sangat jelek IP = lebih dari 200%

D. Manfaat Kegiatan Menganalisis Butir Soal


Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina (1997) dalam Suprananto
(2012), analisis butir soal memiliki banyak manfaat, diantaranya yakni:
1) Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan.
2) Relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa dikelas.
3) Mendukung penulisan butir soal yang efektif.
4) Secara materi dapat memperbaiki tes di kelas.
5) Meningkatkan validitas soal dan reliabilitas.
Linn dan Gronlund (1995) dalam Suprananto (2012: 163), menambahkan bahwa pelaksanaan
kegiatan analisis butir soal, biasanya didesain untuk menjawab pertanyaan-pertanyaan berikut:
1) Apakah fungsi soal sudah tepat?
2) Apakah soal telah memiliki tingkat kesukaran yang tepat?
3) Apakah soal bebas dari hal-hal yang tidak relevan?
4) Apakah pilihan jawabannya efektif?
Selain itu, data hasil analisis butir soal juga sangat bermanfaat sebagai dasar untuk:
1) Diskusi tentang efisien hasil tes,
2) Kerja remedial
3) Peningkatan secara umum pembelajaran di kelas,
4) Peningkatan keterampilan pada kontruksi tes.
Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal memberikan manfaat:
1) Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik,
2) Meningkatkan butir soal melalui tiga komponen analisis yaitu, tingkat kesukaran, daya pembeda
dan pengecoh soal,
3) Merevisi soal yang tidak relevan degan materi yang diajarkan, ditandai dengan banyaknya anak
yang tidak dapat menjawab butir soal tertentu.

E. Kriteria Kualitas Butir Soal


Berdasarkan uraian di atas, menurut pandangan teori tes klasik secara empiris mutu butir
soal ditentukan oleh statistik butir soal yang meliputi : tingkat kesukaran, daya beda dan efektifitas
distraktor. Menurut statistik butir, kualitas butir soal secara keseluruhan dapat dikategorikan
sebagai berikut :
Klasifikasi Kualitas Butir Soal
Kategori Kriteria Penilaian
Baik Apabila
(1). Tingkat kesukaran 0,25 p 0,75.
(2). Korelasi biserial butir soal 0,40 dan
(3). Korelasi biserial alternatif jawaban (distraktor) bernialai negatif.
Revisi Apabila
(1). Tingkat kesukaran p < 0,25 atau p > 0,75 tetapi korelasi biserial butir 0,40 dan korelasi biserial
distraktor bernilai negatif.
(2). Tingkat kesukaran 0,25 p 0,75 dan korelasi biserial butir soal 0,40 tetapi ada korelasi biserial
pada distraktor yang bernilai positif
(3). Tingkat kesukaran 0,25 p 0,75 dan korelasi biserial butir soal antara 0,20 sampai 0,30 tetapi
korelasi distraktor bernilai negatif selain kunci atau tidak ada yang lebih besar nilainya dari kunci
jawaban.
Tidak baik Apabila
(1). Tingkat kesukaran p < 0,25 atau p > 0,75 dan ada korelasi biserial pada distraktor bernilai positif
(2). Korelasi biserial butir soal < 0,20, (3). Korelasi biserial butir soal < 0,30 dan korelasi biserial
distraktor bernilai positif.10

F . Reliabilitas
Reliabilitas adalah suatu hal yang sangat penting pada alat pengukuran standar. Reliabilitas
dihubungkan dengan pengertian adanya ketepatan tes dalam pengukurannya. Reliabilitas adalah
kestabilan skor yang diperoleh peserta tes yang sama ketika diuji ulang dengan tes yang sama pada
situasi yang berbeda atau dari suatu pengukuran ke pengukuran lainnya. Dengan kata lain
reliabilitas merupakan tingkat konsistensi atau kemantapan hasil terhadap hasil dua pengukuran
hal yang sama. Dapat juga diartikan sebagai tingkat kepercayaan dari
suatu alat ukur (Depdikbud : 1997). Hasil pengukuran diharapkan akan sama apabila pengukuran
itu diulangi. Dengan perangkat tes yang reliabel, apabila tes itu diberikan dua kali pada peserta
yang sama tetapi dalam selang waktu yang berbeda sepanjang tidak ada perubahan dalam
kemampuan maka skor yang diperoleh akan konstan. Kriteria untuk menentukan tinggi rendahnya
reliabilitas sebuah perangkat tes, menurut (Suharsimi Arikunto : 2001) dilihat pada
rentangan koefesien korelasi sebagai berikut :
Klasifikasi Tingkat Reliabilitas Tes
Kategori Reliabilitas Tes Nilai Koefesien Korelasi
1) Sangat Tinggi 0,800 1,000
2) Tinggi 0,600 0,799
3) Cukup 0,400 0,599
4) Rendah 0,200 0,399
5) Sangat Rendah 0,000 0,199

Anda mungkin juga menyukai