Kualitas butir soal menjadi bahan pertimbangan dalam penilaian akreditasi sekolah pada standar penilaian, yang dilihat dari segi kualitatif dan kuantitatif. Segi kualitatif dinilai dari kesusaian indikator tes terhadap materi, konstruksi serta bahasa atau budaya yang digunakan, sedangkan dari segi kuantitatif diukur dari tingkat kesukaran soal, daya beda, efektivitas pengecoh, validitas dan reliabilitas soal tersebut. Untuk itu penting dilakukan uji coba dan analisis butir soal oleh guru sebelum mengujikan soal tersebut kepada peserta didik untuk penilaian evaluasi hasil belajar agar diperoleh soal yang bermutu sebelum digunakan. Namun pada kenyataannya yang terjadi di lapangan, berdasarkan hasil wawancara terbuka dengan guru mata pelajaran Akuntasi Keuangan jenjang SMK Swasta di Kota Surakarta masih banyak guru yang belum melakukan analisis atau menindaklanjuti hasil analisis tersebut untuk meningkatkan kualitas butir soal yang diujikan kepada peserta didik dan mengasah kemampuan guru dalam membuat soal yang berkualitas baik di sekolah yang terakreditasi A ataupun di sekolah yang terakreditasi B. Tan Wee Kiat. 1981. Test-Item Analysis. Singapore Journal of Education. Volume 4, Issue 1. Analisis tes dan item memiliki dua tujuan utama: untuk meningkatkan pengajaran dan meningkatkan klasifikasi siswa. Ketika hasil tes telah dianalisis, adalah mungkin bagi guru atau dosen untuk mengetahui bidang kelemahan dan kekuatan murid-muridnya dan mengambil langkah yang tepat untuk pengajaran lebih lanjut. Juga, analisis item dapat membantu meningkatkan konstruksi tes yang akan digunakan untuk klasifikasi siswa. S. Maria Josephine Arokia Marie, Sreekala Edannur. 2015. Relevance of Item Analysis in Standardizing an Achievement Test in Teaching of Physical Science in B.Ed Syllabus. Journal of Educational Technology. Volume. 12, issue 3, page 30-36. Tujuan utamanya pada analisis item tes yang dibangun dalam makalah pengajaran Ilmu Fisika untuk B.Ed. Colleges. Ini melibatkan analisis tingkat kesulitan dan kekuatan diskriminasi dari setiap item tes. Item analisis memungkinkan memilih atau menghilangkan item dari tes, tetapi yang lebih penting item alysis adalah alat untuk membantu penulis item meningkatkan item. Ada 100 jenis pertanyaan obyektif dalam tes prestasi dan diberikan kepada sampel dari 100 siswa dari B.Ed. Colleges. Hasil pekerjaan menunjukkan bahwa sebagian besar item tes jatuh dalam kisaran indeks kesulitan dan indeks diskriminasi yang dapat diterima. Namun, 17 dari item tes dikeluarkan karena tingkat kesulitan yang sangat tinggi atau sangat rendah dan kekuatan diskriminasi yang buruk. Purposive sampling diadopsi untuk penelitian ini dan 100 B.Ed. Siswa Ilmu Fisika diambil dari B.Ed. swasta Perguruan tinggi di Pondicherry, India. Tes 100 item digunakan untuk pengumpulan data. Menggunakan hubungan temuan antara indeks kesulitan setiap item dan indeks diskriminasi yang sesuai dilakukan menggunakan rumus korelasi Pearson. Dari analisis, ditemukan bahwa kekuatan diskriminasi item meningkat dengan peningkatan nilai kesulitan tetapi mengalami penurunan untuk item tes yang sangat mudah dan sangat sulit. Pekerjaan ini penting bagi peneliti dalam membingkai item tes dengan kesulitan optimal dan kekuatan diskriminasi. Temuan-temuan juga menunjukkan bahwa, sebagian besar barang-barang jatuh dalam tingkat kesulitan dan diskriminasi yang dapat diterima, namun, beberapa item ditolak karena indeks diskriminasi yang buruk. Kandace Fleming, Margaret Ross, Nona Tollefson &Samuel B. Green. 1998. Teachers' Choices of Test-Item Formats for Classes With Diverse Achievement Levels. The Journal of Educational Research. Volume 91, Issue 4 Guru SMP dan SMA di bidang mata pelajaran inti (n = 102) secara acak ditugaskan untuk membaca 1 dari 3 skenario yang menggambarkan ruang kelas yang terdiri dari siswa dengan tingkat kemampuan yang berbeda: semua kemampuan rendah, semua kemampuan tinggi, atau keduanya tinggi dan rendah mahasiswa kemampuan. Setelah membaca skenario yang ditetapkan, guru menunjukkan bagaimana mereka akan menetapkan item tes atas dimensi jenis item dan kompleksitas kognitif untuk siswa yang dijelaskan. Guru juga memberikan perkiraan tingkat kesulitan dan kelulusan untuk berbagai jenis item. Guru yang membaca skenario tentang kelas yang berprestasi tinggi melaporkan bahwa mereka akan membuat tes dengan pengakuan yang jauh lebih sedikit daripada esai, sedangkan guru yang membaca skenario tentang kelas berprestasi rendah atau kelas campuran melaporkan bahwa mereka akan membuat tes dengan lebih banyak item pengenalan. dari esai. Guru yang membaca skenario yang menggambarkan ruang kelas rendah dan kelas campuran termasuk item penghafal dan aplikasi yang jauh lebih banyak daripada item pesanan yang lebih tinggi. Jeanne Tunks. 2001. The Effect of Training in Test Item Writing on Test Performance of Junior High Students. Educational Studies. Volume 27, Issue 2. Dalam pngujian memiliki taruhan tinggi, sebuah fenomena yang lahir dari akuntabilitas yang kuat di seluruh Amerika Serikat, menghasilkan pengaturan instruksional yang memarjinalisasi baik kurikulum maupun pengajaran. Guru dan personil sekolah lainnya telah meminimalkan instruksi untuk mengebor dan berlatih dalam upaya untuk meningkatkan skor tes standar dan kriteria yang direferensikan. Penelitian ini menyajikan alternatif untuk praktik saat ini yang melibatkan siswa dalam pembelajaran dan meningkatkan kesadaran mereka tentang aspek internal tes standar. The Test Item Construction Model (TICM) memandu siswa melalui proses mempelajari batang uji dan kemudian menciptakan item menggunakan proses 12 minggu peningkatan pemahaman untuk membuat item tes. Siswa tumbuh dalam pemahaman mereka tentang batang barang uji dan generasi ini. ANOVA tidak menghasilkan perbedaan signifikan antara kelompok acak penulis tes terlatih dan tidak terlatih. Namun, siswa dalam kelompok eksperimen menunjukkan keuntungan dalam memahami soal-soal ujian. Kennedy Quaigrain and Ato Kwamina Arhin. 2007. Using reliability and item analysis to evaluate a teacher-developed test in educational measurement and evaluation. Educational Assessment & Evaluation. Vol. 4, Issue. 13. analisis Item sangat penting dalam meningkatkan item yang akan digunakan lagi dalam tes nanti; itu juga dapat digunakan untuk menghilangkan item yang menyesatkan dalam tes. Penelitian difokuskan pada item dan kualitas tes dan mengeksplorasi hubungan antara indeks kesulitan (p-value) dan indeks diskriminasi (DI) dengan efisiensi distraktor (DE). Penelitian dilakukan di antara 247 mahasiswa tahun pertama yang mengejar Diploma Pendidikan di Cape Coast Polytechnic. Lima puluh pertanyaan pilihan ganda diberikan sebagai ujian akhir semester dalam kursus Pengukuran Pendidikan. Keandalan konsistensi internal dari tes adalah 0,77 menggunakan koefisien Kuder- Richardson 20 (KR-20). Skor rata-rata adalah 29,23 dengan standar deviasi 6,36. Berarti indeks kesulitan (p) nilai dan DI adalah 58,46% (SD 21,23%) dan 0,22 (SD 0,17), masing-masing. DI tercatat sebagai maksimum pada kisaran p-nilai antara 40 dan 60%. Berarti DE adalah 55,04% (SD 24,09%). Item yang memiliki kesulitan rata-rata dan kekuatan diskriminatif yang tinggi dengan distraktor fungsional harus diintegrasikan ke dalam tes masa depan untuk meningkatkan kualitas penilaian. Dengan menggunakan DI, teramati bahwa 30 (60%) dari item tes jatuh ke dalam rentang nilai yang cukup baik atau dapat diterima