Kegiatan analisis butir soal memiliki banyak manfaat, di antaranya (1) dapat membantu
pengguna tes dalam mengevaluasi kualitas tes yang digunakan, (2) relevan bagi penyusunan tes
informal seperti tes yaitu, disiapkan guru untuk siswa di kelas, (3) mendukung penulisan butir
soal yang efektif, (4) secara materi dapat memperbaiki tes di kelas, (5) meningkatkan validitas
soal dan reliabilitas (Anastasi & Urbina, 1997:1-72).
Nitko (1996:308-309) juga menguraikan manfaat kegiatan analisis butir soal, di antaranya untuk:
(1) menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan, (2) memberi
masukan kepada siswa tentang kemampuan dan sebagai dasar untuk bahan diskusi di kelas, (3)
memberi masukan kepada guru tentang kesulitan siswa, (4) memberi masukan pada aspek
tertentu untuk pengembangan kurikulum, (5) merevisi materi yang diukur, (6) meningkatkan
keterampilan penulisan soal.
Analisis butir soal merupakan suatu kegiatan yang dilakukan untuk meyakinkan bahwa butir-
butir soal tersebut bermutu dan memenuhi kriteria yang ditentukan. Analisis butir soal dapat
dilakukan baik secara kualitatif maupun kuantitatif
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif, yaitu
teknik moderator dan teknik panel.
1. Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-
sama dengan beberapa ahli, seperti guru yang mengajarkan materi, ahli materi, penyusun
atau pengembang kurikulum, ahli penilaian, ahli bahasa, dan orang yang memiliki latar
belakang psikologi.
2. Teknik panel yakni suatu teknik menelaah butir soal berdasarkan kaidah penulisan butir
soal. Kaidah itu di antaranya materi, konstruksi, bahasa atau budaya, kebenaran kunci
jawaban atau pedoman penskoran. Caranya beberapa penelaah diberikan butir-butir soal
yang akan ditelaah, format penelaahan, dan pedoman penilaian atau penelaahan.
Analisis butir soal secara kualitatif dilakukan dalam rangka meningkatkan validitas, baik
validitas tampak (face validity), validitas isi (content validity), maupun validitas konstruk
(construct validity). Analisis ini melibatkan ahli bidang studi atau ahli materi dengan pendekatan
expert judgment. Dengan menggunakan kaidah penulisan soal, setiap butir soal ditelaah
apakah telah memenuhi kaidah, baik dari aspek materi, konstruksi, maupun bahasa. Pada
prinsipnya, teknik analisis ini dapat diterapkan pada tes constructed response, selected response,
tes perbuatan , maupun instrumen non tes.
Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan pada data empirik.
Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam analisis
secara kuantitatif, yaitu pendekatan secara klasik dan modern,
Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari
jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan
teori tes klasik. Analisis butir secara modern adalah penelaahan butir soal dengan menggunakan
teori respons butir atau Item Response Theory (IRT). Teori ini merupakan suatu teori yang
menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu
butir dengan kemampuan siswa.
Aspek yang diperhatikan dalam butir analisis soal secara klasik adalah setiap butir soal ditelaah
dari segi: tingkat kesukaran butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk
soal bentuk selected response item) atau frekuensi pada setiap pilihan jawaban. Berikut ini
disajikan penjelasan lebih lanjut mengenai beberapa aspek di atas.
Tingkat kesukaran soal adalah peluang menjawab benar suatu soal pada tingkat kemampuan
tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini umumnya
dinyatakan dalam bentuk proporsi yang besarnya berkisar dari 0 sampai 1 (Aiken, 1994: 66).
Semakin besar indeks tingkat kesukaran yang diperoleh dan hasil hitungan, berarti semakin
mudah soal itu. Suatu soal memiliki TK= 0 berarti tidak ada siswa yang mampu menjawab benar
dan bila memiliki TK= 1 berarti semua siswa menjawab benar. Perhitungan indeks tingkat
kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh
peserta tes pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus
ini dipergunakan untuk soal selected response item, yaitu (Nitko, 1996: 310):
Tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya, untuk keperluan
ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan
seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi atau sukar, dan untuk
keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah atau
mudah.
Untuk mengetahui tingkat kesukaran soal bentuk constructed response digunakan rumus berikut
ini.
Mean = Jumlah skor siswa tes pada suatu soal/ jumlah peserta didik
Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor tes. Untuk tes yang
sangat sukar (TK <_ 0,25) distribusinya berbentuk positif skewed, sedangkan tes yang mudah
(TK _> 0,80) distribusinya berbentuk negatif skewed.
Tingkat kesukaran butir soal memiliki dua kegunaan, yaitu untuk guru dan untuk pengujian dan
pengajaran (Nitko, 1996: 310313). Kegunaan bagi guru di antaranya: (a) sebagai pengenalan
konsep terhadap pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar
mereka, (b) memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir
soal yang bias. Adapun kegunaannya bagi pengujian dan pengajaran adalah: (a) pengenalan
konsep yang diperlukan untuk diajarkan ulang, (b) tanda-tanda terhadap kelebihan dan
kelemahan pada kurikulum sekolah, (c) memberi masukan kepada siswa, (d) tanda-tanda
kemungkinan adanya butir soal yang bias, (e) merakit tes yang memiliki ketepatan data soal.
Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara siswa yang
telah menguasai materi yang ditanyakan dan siswa yang belum menguasai materi yang diujikan.
Daya pembeda butir soal memiliki manfaat berikut. Pertama, untuk meningkatkan mutu setiap
butir soal melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal dapat
diketahui apakah butir soal itu baik, direvisi, atau ditolak. Kedua, untuk mengetahui seberapa
jauh masing-masing butir soal dapat mendeteksi atau membedakan kemampuan siswa, yaitu
siswa yang telah memahami atau belum memahami materi yang diajarkan guru. Apabila suatu
butir soal tidak dapat membedakan kedua kemampuan siswa itu maka butir soal itu dapat
dicurigai kemungkinannya: (a) kunci jawaban butir soal itu tidak tepat, (b) butir soal itu memiliki
dua atau lebih kunci jawaban yang benar, (c) kompetensi yang diukur tidak jelas, (d) pengecoh
tidak berfungsi, (e) materi yang ditanyakan terlalu sulit sehingga banyak siswa yang menebak,
dan (f) sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah
informasi dalam butir soalnya. Indeks daya pembeda setiap butir soal biasanya dinyatakan dalam
bentuk proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin tinggi kemampuan
soal yang bersangkutan membedakan siswa yang telah memahami materi dengan siswa yang
belum memahami materi. Indeks daya pembeda berkisar antara -1,0Q sampai dengan + 1,00.
Jika daya pembeda negatif (kurang dari 0) berarti lebih banyak kelompok bawah (peserta tes
yang tidak memahami materi) menjawab benar soal dibanding dengan kelompok atas (peserta tes
yang memahami materi yang diajarkan). Hasil perhitungan dengan menggunakan rumus di atas
dapat menggambarkan tingkat kemampuan soal dalam membedakan antar peserta tes yang telah
memahami materi yang diujikan dan peserta tes yang belum memahami materi yang diujikan.
Adapun kriteria yang dapat digunakan adalah sebagai berikut (Cracker & Algina, 1986: 315).
Analisis Pengecoh
Indeks pengecoh:
Keterangan:
IP = Indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar
n = jumlah opsi
1 = bilangan tetap
Adapun kualitas pengecoh berdasarkan indeksnya adalah:
76% - 125% = sangat baik
51% -75% atau 126% - 150% = baik
26%- 50% atau 151% - 175% = kurang baik
0% - 25% atau 176% - 200% = jelek
Lebih dari 200% = sangat jelek
SPESIFIKASI TES
Langkah awal dalam mengembangkan tes adalah menetapkan spesifikasi tes yang berisi
tentang uraian yang menunjukkan keseluruhan karakteristik yang harus dimiliki suatu tes.
Spesifikasi tes akan mempermudah dalam menulis soal dan siapa saja yang menulis soal akan
menghasilkan tingkat kesulitan yang relatif sama. Tabel spesifikasi yang juga dikenal dengan
kisi-kisi adalah sebuah tabel yang didalamnya dimuat rincian materi tes dan tingkah laku beserta
proporsi yang dikehendaki oleh penilai, dimana pada tiap petak dari tabel tersebut diisi dengan
angka-angka yang menunjukan banyaknya butir soal yang akan dikeluarkan dalam tes hasil
belajar. Penyusunan spesifikasi tes mencakup beberapa kegiatan, yaitu :
a. Menentukan Tujuan Tes
Terdapat empat macam tes yang digunakan lembaga pendidikan, yaitu tes penempatan,
tes diagnostik, tes formatif, dan tes sumatif.
b. Menyusun Kisi- Kisi
Kisi-kisi merupakan tabel matrik yang berisi spesifikasi soal-soal yang akan dibuat.
Kisi- kisi ini merupakan acuan bagi pembuat soal sehingga siapapun yang menulis
soal akan menghasilkan soal yang isi dan tingkat kesulitannya relatif sama.
Terdapat empat langkah dalam mengembangkan kisi-kisi tes, yaitu :
1. Menulis tujuan umum
2. Membuat daftar pokok bahasan dan sub pokok bahasan yang akan diujikan
3. Membuat indikator
4. Menentukan jumlah soal tiap pokok bahasan dan subpokok bahasan
c. Menentukan Bentuk Tes
Sebagai alat pengukur perkembangan dan kemajuan belajar peserta didik, apabila
ditinjau dari segi bentuk soal-soal, dapat dibedakan menjadi dua macam, yaitu tes belajar
bentuk uraian (tes subjektif), dan tes hasil belajar bentuk obyektif. Bentuk tes objektif
yang sering digunakan adalah bentuk pilihan ganda, benar-salah, menjodohkan, dan
uraian objektif.
Tes obyektif bentuk true-false adalah salah satu bentuk tes obyektif dimana butir-
butir soal yang diajukan dalam tes hasil belajar itu berupa pernyataan, pernyataan ada
yang benar dan ada yang salah.
Multiple choice test terdiri atas suatu keterangan atau pemberitahuan tentang
suatu pengertian yang belum lengkap. Dan untuk melengkapinya harus memllilih satu
dari beberapa kemungkinan jawaban yang telah disediakan.
Matching test dapat diganti dapat diganti dengan istilah mempertandingan,
mencocokkan, memasangkan, atau menjodohkan. Matching test terdiri atas satu seri
pertanyaan dan satu seri jawaban. Masing-masing pertanyaan mempunyai tercantum
dalam seri jawaban
Complection test biasa kita sebut dengan istilah tes isian, tes menyempurnakan,
atau tes melengkapi. complection test terdiri atas kalimat-kalimat yang ada bagian-
bagiannya yang dihilangkan. Bagian yang dihilangkan atau yang diisi oleh murid ini
adalah merupakan pengertian yang kita minta dari murid
Soal bentuk pilihan ganda adalah soal bentuk benar salah juga, tetapi dalam
bentuk jamak. Test ini diminta membenarkan atau menyalahkan setiap item dengan tiap
pilihan jawaban. Kemungkinan jawaban itu biasanya sebanyak tiga atau empat buah,
tetapi adakalanya dapat juga lebih banyak (untuk tes yang akan diolah dengan komputer
banyaknya option diusahakan 4 buah).
Tes uraian dapat dikategorikan uraian objektif dan non-objektif. Tes uraian yang
objektif sering digunakan pada sains dan teknologi atau bidang sosial yang jawaban
soalnya sudah pasti, dan hanya satu jawaban yang benar. Tes uraian non-objektif sering
digunakan pada bidang ilmu sosial, yaitu yang jawabannya luas dan tidak hanya satu
jawaban yang benar, tergantung argumentasi peserta tes. Bentuk tes dikatakan non-
objektif apabila penilaian yang dilakukan cenderung dipengaruhi subjektivitas dari
penilai. Tes uraian pada umumnya berbentuk esai (uraian). Tes bentuk esai adalah
sejenis tes kemampuan belajar yang memerlukan jawaban yang bersifat pembahasan atau
uraian kata-kata. Ciri-ciri pertanyaannya didahului dengan kata-kata seperti uraikan,
jelaskan, mengapa, bagaimana, bandingkan, simpulkan, dan sebagainya. Soal-soal bentuk
esai menuntut kemampuan siswa untuk dapat mengorganisir, menginterpretasi,
menghubungkan pengertian-pengertian yang telah dimiliki. Dengan singkat dapat
dikatakan bahwa tes esai menuntut siswa untuk dapat mengingat-ingat dan mengenal
kembali, dan terutama harus mempunyai daya kreativitas yang tinggi.
Fungsi tes tidak semata-mata sebagai alat ukur saja, melainkan memiliki fungsi motivasi
dan pembentukan sikap bagi peserta didik. Oleh karena itu penulisan soal hendaknya memahami
nilai-nilai yang mendasari pendidikan, seperti tujuan pendidikan, filsafat pendidikan, sistem
pendidikan, psikologi, garis-garis besarnya saja. Dalam menulis soal diperlukan kemampuan
untuk membahas gagasan dalam bahasa verbal yang jelas dan mudah dipahami maksudnya,
sebab soal merupakan wakil dari pendidik yang hadir dihadapan peserta didikoleh karena itu
penulisan soal membutuhkan bahasa yang lugas dan tidak berbelit-belit.
Dalam penulisan butir-butir soal, baik dalam bentuk tes objektif maupun tes essai
(uraian), terdapat syarat-syarat penyusunannya. Syarat penyusunan tes objektif terdiri dua bagian
yaitu:
1. Syarat-syarat umum
Berikut ini beberapa syarat yang perlu diperhatikan dalam menyusun objective test :
1. Tiap bentuk dari tes objektif harus didahului dengan penjelasan atau anjuran bagaimana
cara mengerjakannya.
2. Penjelasan atau anjuran itu harus diusahakan jangan terlalu panjang, tetapi jelas bagi
yang menjawabnya (disesuaikan dengan tingkat sekolah dan kecakapan bahasa anak).
3. Hindarkan pertanyaan yang mempunyai lebih dari satu pengertian atau yang dapat
diartikan atau ditafsirkan bermacam-macam.
4. Tiap-tiap butir soal haruslah tetap, gramatikanya baik sehingga tidak membingungkan
dan menimbulkan salah tangkap.
5. Jangan menyusun item secara langsung menjiplak dari buku, karena item yang demikian
hanya memaksa siswa untuk menghafal dan kurang merangsang siswa untuk berfikir.
6. Harus diteliti jangan sampai item yang satu mempermudah atau mempersukar item yang
lain (terutama dalam menyusun true-false dan multiple choice).
7. Janganlah item yang satu bergantung pada item yang lain atau item yang terdahulu
2. Syarat-syarat Khusus
a) Untuk completion atau fill-in
1. Bahasa hendaknya jelas, kalimat jangan terlalu panjang sehingga mudah dipahami.
2. Yang dihilangkan atau harus diisi (titik-titik) janganlah mengenai satu hal saja, tetapi harus
beberapa hal. Misalnya dalam sejarah, yang dihilangkan jangan hanya tanggal dan
tahunnya atau nama tokoh-tokoh atau peristiwa, tetapi harus mencakup semua hal
tersebut.
3. Jawaban (isi titik-titik) jangan merupakan kalimat panjang. Sebab kalau demikian, bukan tes
objektif lagi, melainkan menyerupai tes essay.
4. Jumlah jawaban (titik-titik) harus tertentu supaya memudahkan pengetes untuk menskornya
(10, 20, 25 dan sebagainya)
b) Untuk true-false
1. Hindarkan item yang dapat dinilai benar dan salah secara meragukan.
2. Soal-soal atau item tidak boleh mengandung kata-kata yang merupakan atau terlalu
menunjukkan jawabannya. Misalnya dengan digunakannya kata-kata: kadang-kadang,
mungkin, sudah pasti, barangkali, selalu, dan sebagainya.
3. Sedapat mungkin hindarkanlah statement yang negatif, yang mengandung kata tidak atau
bukan.
4. Hindarkanlah kalimat yang terlalu panjang atau kalimat majemuk yang meragukan.
c) Untuk multiple choice
1. Statement harus jelas merumuskan suatu masalah. Tentukanlah sebelumnya bahwa hanya
ada satu jawaban yang paling benar dan tepat.
2. Baik statement maupun option sedapat mungkin jangan merupakan suatu kalimat yang
terlalu panjang.
3. Hindarkanlah option yang tidak ada sangkut-pautnya satu sama lain. Dengan kata lain,
option (pilihan jawaban) hendaknya homogen.
Sedangkan dalam penulisan butir-butir soal esai, perlu kiranya guru atau pembuat tes
memperhatikan hal-hal berikut ini:
1. Sebelum memulai menulis soal yang dimaksud, hendaknya jelas dalam pikiran kita
proses mental manakah yang kita harapkan dari mudrid untuk menjawab soal tersebut.
Guru atau penyusun tes harus benar-benar memahami macam-macam jenis respons stimulus
(jenis soal) yang diperlukan untuk menimbulkan atau memancing keluarnya respons-respons
tersebut.
2. Gunakanlah bahan-bahan atau himpunan bahan-bahan dalam menyusun soal-soal essay
tersebut.
3. Mulailah pertanyaan atau soal essay itu dengan kata-kata seperti : Bandingkan,
Berilah alasan, Berilah contoh-contoh yang sesuai, Terangkan bagaimana....,
Jelaskan/ramalkan apa yang terjadi jika...., dan Jelaskan bagaimana pendapat
Anda. Janganlah memulai soal essay dengan kata-kata: Apa, Siapa, Kapan, atau
Bilamana dan Berapa
4. Tulislah pertanyaan atau soal essay itu sedemikian rupa sehingga tugas apa yang harus
dilakukan siswa jelas dan tidak mempunyai arti ganda (ambiguous) bagi setiap murid.
5. Soal essay berhubungan dengan hal-hal yang merupakan controversial issue dalam
masayarakat. Penyusunannya hendaklah diarahkan untuk menilai bagaimana pendapat
dan pengertian siswa terhadap issue yang ditanyakan, dan bukan untuk menuntut siswa
agar menerima suatu kesimpulan atau cara pemecahan tertentu. Kita menegetahui bahwa
banyak issue yang dialami individu dan masyarakat tidak ada jawaban atau kesimpulann
yang bersifat umum atau yang dianggap benar oleh semua orang.
6. Usahakan agar soal essay yang kita susun itu benar-benar dapat menimbulkan perilaku
yang kita kehendaki untuk dilakukan oleh siswa. Soal-soal essay buatan guru seringkali
bersifat kurang menuntut kemampuan skill atau aplikasi seperti:
Wawancara atau interview merupakan salah satu alat penilaian nontes yang
dipergunakan untuk mendapatkan informasi tertentu tentang keadaan responden dengan jalan
tanya jawab sepihak. Dikatakan sepihak karena pertanyaan-pertanyaan yang diajukan dalam
kegiatan wawancara hanya berasal dari pihak pewawancara, sementara responden hanya
bertugas sebagai penjawab. Maksud diadakan wawancara sebagaimana dikutip Moleong dari
Lincoln dan Guba (1985:266), antara lain mengonstruksi orang, kejadian, organisasi,
perasaan, motivasi, tuntutan, kepedulian, dan sebagainya.
Ada banyak pembagian wawancara yang dilakukan para ahli. salah satu diantaranya
adalah membagi wawancara kedalam dua bentuk, yaitu wawancara bebas dan wawancara
terpimpin. Wawancara terpimpin adalah kegiatan wawancara yang pertanyaan-pertanyaan
serta kemungkinan-kemungkinan jawabannya telah dipersiapkan pihak pewawancara,
sehingga responden tinggal memilih jawaban yang sudah dipersiapkan pewawancara. Adapun
dalam Wawancara bebs, responden diberi kebebasan untuk menjawab pertanyaan-pertanyaan
pewawancara sesuai dengan pendapatnya tanpa terikat oleh ketentuan-ketentuan yang telah
dibuat pewawancaranya. ( Hamdani, 2011: 318).
Adapun menurut Zainal Arifin (2012:158) Wawancara merupakan salah satu bentuk
alat evaluasi jenis non-tes yang dilakukan melalui percakapan dan tanya jawab, baik langsung
maupun tidak langsung dengan peserta didik. Pengertian wawancara langsung adalah
wawancara yang dilakukan secara langsung antara pewawancara (interviewer) atau guru
dengan orang yang diwawancarai (interviewee) atau peserta didik tanpa melalui perantara,
sedangkan wawancara tidak langsung artinya pewawancara atau guru menanyakan sesuatu
kepada peserta didik melalui perantaraan orang lain atau media. jadi, tidak menemui langsung
kepada sumbernya.
Tujuan wawancara adalah sebagai berikut:
1. Untuk memperoleh informasi secara langsung guna menjelaskan suatu hal atau situasi dan
kondisi tertentu .
2. Untuk melengkapi suatu penyelidikan ilmiah
3. Untuk memperoleh data agar dapat mempengaruhi situasi atau orang tertentu.
Wawancara juga dapat dilengkapi dengan alat bantu berupa tape recorder (alat
perekam suara), sehingga jawaban atas pertanyaan-pertanyaan yang diajukan dapat dicatat
secara lebih lengkap. Penggunaan pedoman wawancara dan alat bantu perekam suara itu akan
sangat membantu kepada pewawancara dalam mengategorikan dan menganalisis jawaban-
jawaban yang diberikan oleh peserta didik atau orang tua peserta didik untuk pada akhirnya
dapat ditarik kesimpulan