Anda di halaman 1dari 12

MAKALAH

ANALISIS KUALITAS TES DAN BUTIR SOAL

Disusun guna memenuhi tugas mata kuliah Evaluasi Pembelajaran PAI

Dosen Pengampu:
Dr. Moch. Iskarim, S.Pd.I, M.S.I.

Oleh:

Disusun oleh :
ANI KHANAH
NIM 5221003

Kelas: A

MAGISTER PENDIDIKAN AGAMA ISLAM


UNIVERSITAS ISLAM NEGERI K.H. ABDURRAHMAN WAHID
PEKALONGAN
2022
ANALISIS KUALITAS TES DAN BUTIR SOAL
A. PENDAHULUAN
Analisis kualitas tes merupakan salah satu tahapan yang harus dilakukan
ketika kita ingin mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan
ataupun butir soal dari bagian tes tersebut. Kegiatan tes dilakukan untuk mengetahui
kemampuan peserta didik terkait materi yang diujikan. 1 Dalam evaluasi atau
penilaian dari hasil belajar, tes diharapkan bisa membuat sampel perilaku yang
kemudian menghasilkan nilai yang obyektif serta akurat. 2 Akurasi tes sendiri akan
mempengaruhi kualitas tes, oleh karena itu tes yang digunakan guru harus
mempunyai kualitas yang baik. Hendaknya disusun sesuai dengan prinsip dan
prosedur penyusunan tes. Selanjutnya setelah dilaksanakan perlu diketahui apakah
tes tersebut berkualitas baik atau masih kurang baik.3
Menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru
untuk meningkatkan mutu soal yang dilaksanakan. Kegiatan ini merupakan proses
pengumpulan, peringkasan dan penggunaan informasi dari jawaban siswa untuk
membuat keputusan tentang setiap penilaian.4 Idealnya, instrumen tes hasil belajar
yang disusun oleh guru dapat memberikan informasi mengenai kemampuan siswa.
Akan tetapi persolan yang muncul saat guru menyusun instrument tes ini, ternyata
masih banyak ditemukan kelemahan dalam proses penyusunannya, sehingga
menghasilkan tes yang tidak memiliki daya ukur yang valid.5
Dari latar belakang tersebut, maka makalah ini akan membahas tentang
analisis kualitas tes dan butir soal dengan perumusan pembahasan adalah sebagai
berikut :
1. Apa saja karakteristik dari tes dan butir soal?
2. Bagaimana teknik menganalisis item tes dan butir soal?

1
Adhetia Sukmafitriani dkk, Analisis Butir Soal Penilaian Ketrampilan Apresiasi Sastra pada
Soal UAS Materi Puisi Kelas VII Tahun Pelajaran 2019/2020 Di SMP N 1 Kandanghaur, Jurnal Sastra,
Vol. 10, No. 2, Juli 2021, hlm. 114.
2
Zainal Arifin, Evaluasi Pembelajaran Prinsip, Teknik dan Prosedur, (Bandung: PT Remaja
Rosdakarya, 2019), hlm. 246.
3
Hastuti Diah Ikawati, Agus Jayadi, Hermansyah, Analisis Kualitas Tes dan Butir Soal Sejarah
di SMAN 1 Praya Timur, Jurnal Pendidikan dan Konseling, Vol. 4, No. 4, 2022, hlm. 2
4
Ardilah Muluki, Patta Bundu, I Sukmawati, Analisis Kualitas Butir Tes Semester Ganjil Mata
Pelajaran IPA Kelas IV MI Radhiatul Adawiyah, Jurnal Ilmiah Sekolah Dasar, Vol. 4, No. 1, 2022,
hlm.88.
5
Dinar Pratama, Analisis Kualitas Tes Buatan Guru Melalui Pendekatan Item Response Theary
(IRT) Model Rasch, Jurnal Pendidikan Islam, Vol. 7, No. 1, 2020, hlm. 61.

1
B. PEMBAHASAN
1. Karakteristik Tes dan Butir Soal
Tidak dapat dipungkiri bahwa angka-angka sebagai hasil pengukuran dan
penilaian pendidikan mempunyai arti penting, yaitu berfungsi memberi
kesaksian tentang orang yang telah berhasil mencapai, dan sebagai kesaksian
yang diperlukan dari banyak peristiwa penting, seperti kenaikan kelas,
meneruskan sekolah yang lebih tinggi, menyelesaikan pendidikan, bahkan dalam
memperoleh pekerjaan. Demikianlah pentingnya nilai-nilai yang menjadi tanda
simbolik yang harus diperjuangkan dan direbut dengan berbagai usaha. Dan di
sini peran penting pengukuran dan penilaian dalam suatu evaluasi pendidikan
diterapkan.6 Pentingnya instrumen penilaian yang valid dan reliabel untuk
memperoleh tes yang bermutu sebelum tes/ujian dilaksanakan, maka seorang
guru harus melaksanakan analisis butir soal untuk menelaah setiap butir soal
yang memiliki kriteria baik, kurang baik, dan jelek.
Adapun diantara karakteristik tes dan butir soal adalah sebagai berikut :
a. Validitas, adalah sejauhmana tes itu mengukur apa yang dimaksudkan
untuk diukur. Validitas adalah alat ukur tidak tergganggu. 7 Sebelum guru
menggunakan suatu tes, hendaknya guru mengukur terlebih dahulu derajat
validitasnya berdasarkan ktriteria tertentu. Dengan kata lain, untuk melihat
apakah tes tersebut valid (sahih), harus dibandingkan antara skor peserta
didik yang diperoleh dari tes dengan skor yang dianggap sebagai nilai baku.8
Ada dua unsur penting dalam validitas ini. Pertama, validitas
menunjukkan suatu derajat, ada yang sempurna, sedang, dan yang rendah.
Kedua, validitas selalu dihubungkan dengan suatu putusan atau tujuan yang
spesifik. Gronlund mengatakan ada tiga faktor yang memengaruhi validitas
hasil tes, yaitu faktor instrumen evaluasi, faktor administrasi evaluasi dan
penskoran, dan faktor dari jawaban peserta didik.
Menurut Suharsimi Arikunto, secara garis besar ada dua macam validitas,
yaitu validitas logis dan validitas empiris. 9
6
Raka Joni, Pengukuran dan Penilaian Pendidikan, (Malang: YP2LPM, 1984), hlm. 82.
7
Helli Ihsan, Validitas Isi Alat Ukur Penelitian Konsep dan Panduan Penilaiannya, Pedagogia:
Jurnal Ilmu Pendidikan, Vol. 13, No. 2, 2015, hlm. 266.
8
Zainal Arifin, Evaluasi Pembelajaran …, hlm. 247.
9
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Jakarta: Bumi Aksara, 2018), hlm. 184-
187.

2
1) Validitas Logis
Istilah “validitas logis” mengandung kata “logis” yang berasal dari
kata "logika", yang artinya penalaran. Ini berati validitas logis untuk
sebuah instrumen evaluasi menunjukkan pada kondisi bagi sebuah
instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen, yaitu validitas isi dan validitas konstruk (construct validity).
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi dimana
sebuah instrumen disusun berdasarkan isi materi pelajaran yang
dievaluasi. Sebuah tes dikatakan memiliki validitas isi apabila mengukur
tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang
diberikan. Oleh karena materi yang ajarkan terdapat dalam kurikulum
maka validitas isi ini sering disebut validitas kurikuler.
Sedangkan validitas konstruk adalah sebuah instrumen menunjuk
pada suatu kondisi sebuah instrumen yang disusun berdasrkan konstruk
aspek-aspek kejiwaan yang seharusnya dievaluasi. Sebuah tes dikatakan
memiliki validitas konstruksi apabila butir-butir soal yang membangun
tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan
dalam Tujuan Instruksional Khusus.
2) Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang berarti
“pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas
empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari,
seseorang dapat diukur jujur oleh masyarakat apabila dalam pengalaman
dibuktikan bahwa orang tersebut memang jujur. Oleh karena itu validitas
empiris tidak dapat diperoleh hanya dengan menyusun instrumen
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus
dibuktikan melalui pengalaman.
Validitas empiris biasanya menggunakan teknik statistik, yaitu
10
analisis korelasi. Ada tiga macam validitas empiris, yaitu : Validitas
prediktif (predictive validity), Validitas kongkuren, dan Validitas sejenis.

10
Zainal Arifin, Evaluasi Pembelajaran …, hlm. 249.

3
Validitas prediktif adalah jika kreiteria standar yang digunakan untuk
meramalkan prestasi belajar peserta didik masa yang akan datang.
Dengan kata lain validitas prediktif bermaksud melihat hingga mana
suatu tes dapat memprakirakan prilaku peserta didik pada masa yang
akan datang, sedangkan validitas kongkuren adalah jika kriteria
standarnya berlainan. Misalnya skor tes dalam mata pelajaran Fikih
dikorelasikan dengan skor tes Akidah Akhlak. Sebaliknya, jika kriteria
standarnya sejenis, maka veliditas tersebut disebut validitas sejenis.
Dalam mengukur validitas suatu tes hendaknya yang menjadi
kriteria sudah betul-betul valid sehingga dapat diandalkan keampuhannya
dan dapat dianggap sebagai tes standar. Sebaliknya, jika kriterianya tidak
valid, maka tes-tes lain yang akan divalidasi menjadi kurang atau tidak
meyakinkan. Suatu tes akan mempunyai koefisien validitas yang tinggi
jika tes itu betul-betul dapat mengukur apa yang hendak diukur dari
peserta didik tertentu.
Adapun faktor-faktor yang memengaruhi validitas adalah 1) faktor
yang berasal dari dalam tes, 2) faktor yang berasal dari administrasi dan
skor, 3) faktor-faktor yang berasal dari jawaban siswa.11
b. Reliabilitas, berasal dari kata reliability berarti sejauhmana hasil suatu
pengukuran dapat dipercaya.12 Suatu tes dikatakan reliabel jika selalu
memberikan hasil yang sama bila diteskan pada kelompok yang sama pada
waktu atau kesempatan yang berbeda.13 Banyak hal yang memengaruhi hasil
tes, namun secara garis besar dapat dikelompokkan menjadi 3 hal, yaitu 1)
panjang tes dan kualitas butir-butir soalnya, 2) hal yang berhubungan
dengan tercoba (tertes), 3) hal yang berhubungan dengan penyelenggaraan
tes.14
Reliabilitas suatu instrumen dapat diukur konsistensinya melalui
metode-metode tertentu. Konsistensi reliabilitas tes yang diukur, antara lain
11
Sukardi, Evaluasi Pendidikan Prinsip & Operasionalnya, (Jakarta: Bumi Aksara, 2008), hlm.
38-39.
12
Farida, Anna Musyarofah, Validitas dan Reabilitas dalam Analisis Butir Soal, Jurnal Pendidikan
Bahasa Arab Al-Mu’arrib, Vol. 1, No. 1, 2021, hlm. 41.
13
Zulkifli Matondang, Validitas Dan Reliabilitas Suatu Instrumen Penelitian, Jurnal Tabularasa
PPS UNIMED, Vol. 6, No. 1, Juni 2009.
14
Suharsimi Arikunto, Dasar-Dasar Evaluasi …, hlm. 204.

4
konsistensi eksternal dan konsistensi internal. Konsistensi eksternal dapat
diuji melalui prosedur teknik ulang uji (tes-retes) dan metode bentuk
pararel. Pada konsistensi internal, teknik yang dapat digunakan adalah
teknik belah dua (split-half), pengukuran dengan rumus koefisien alpha,
rumus Kuder Richardson atau K-R 20 dan K-R 21. Penghitungan
konsistensi reabilitas dapat dilakukan dengan menggunakan teknik statisk.15
Menurut perhitungan product-moment dari Pearson, ada tiga macam
reliabilitas, yaitu :
a) Koefisien Stabilitas (Coefficient of Stability)
Adalah jenis reliabilitas yang menggunakan teknik test and retest, yaitu
memberikan tes kepada sekelompok individu, kemudian diadakan
pengulangan tes pada kelompok yang sama dengan waktu yang berbeda.
Cara memperoleh koefisien stabilitas adalah dengan mengorelasikan
hasil tes pertama dengan hasil tes kedua dari kelompok yang sama, pada
waktu yang berbeda. Jika antara tes pertama dengan tes kedua cukup
lama, kemudian diadakan latihan-latihan tambahan, maka bisa jadi tes
kedua akan lebih besar nilainya dari pada tes pertama.16
b) Koefisien Ekuivalen (Coeffisient of internal consistency)
Adalah juka mengorelasikan dua buah tes yang pararel pada kelompok
dan waktu yang sama. Metode yang digunakan untuk memperoleh
koefisien ekuivalen adalah metode dengan menggunakan dua buah
bentuk tes yang pararel. Syarat-syarat yang harus dipenuhi kedua tes
pararel adalah kriteria yang dipakai pada kedua tes sama, masing-masing
tes dikonstruksikan sendiri, jumlah item, isi, dan corak sama, tingkat
kesukaran sama, petunjuk waktu yang disediakan untuk mengerjakan tes,
dan contoh-contoh juga sama.17
c) Koefisien Konsistensi Internal (Coefficient of internal consisitency)
Adalah reliabilitas yang didapat dengan jalan mengorelasikan dua buah
tes dari kelompok yang sama, tetapi diambil dari butir-butir yang

15
Sunarti, Selly Rahmawati, Penilaian Dalam Kurikulum 13, (Yogyakarta: C.V. Andi Offset,
2014), hlm. 98-99.
16
Zainal Arifin, Evaluasi Pembelajaran …, hlm. 259.
17
Zainal Arifin, Evaluasi Pembelajaran …, hlm. 260.

5
bernomor genap untuk tes yang pertama dan butir-butir bernomor ganjil
untuk tes yang kedua.
Untuk menghitung koefisien stabilitas, koefisien ekuivalen, dan koefisien
konsistensi internal dapat digunakan analisis kolerasi seperti pada
pengujian veliditas.18
c. Kepraktisan, dalam kenyataannya banyak tes yang dibuat tapi tidak
menunjukkan kepraktisan. Padahal kepraktisan merupakan syarat suatu tes
dikatakan standar. Kebanyakan orang membuat tes hanya untuk kepentingan
dirinya sendiri, tidak berfikir untuk orang lain. Sehingga orang lain akan
merasa kesulitan ketika menggunakannya.
Kepraktisan mengandung arti kemudahan suatu tes, baik dalam
mempersiapkan, menggunakan, mengolah dan menafsirkan maupun
mengadministrasikannya.19 Dimyati dan Mudjiono (1994) mengemukakan
faktor-faktor yang memengaruhi kepraktisan instrumen evaluasi meliputi
1) kemudahan mengadministrasi, 2) waktu yang disediakan untuk
melancarkan evaluasi, 3) kemudahan menskor, 4) kemudahan interpretasi
dan aplikasi, 5) tersedianya bentuk instrument evaluasi yang ekuivalen atau
sebanding.
2. Teknik Analisis Item Tes dan Butir Soal
Kegiatan analisis butir soal merupakan kegiatan yang harus dilakukan
oleh guru dalam mengembangkan instrumen penilaian/assesment. Analisis butir
soal merupakan proses mengkaji terhadap kualitas soal pada setiap butirnya. 20
Tujuan analisis butir soal adalah untuk mengkaji dan menelaah soal, agar
diperoleh soal yang berkualitas sebelum soal tersebut digunakan. 21 Analisis butir
soal atau item-item dapat digunakan secara kualitatif dan kuantitatif yang
masing-masing mempunyai keunggulan dan kelemahan. Oleh karenanya teknik
terbaik adalah menggabungkan keduanya.22
a. Teknik Analisis Secara Kualitatif
18
Zainal Arifin, Evaluasi Pembelajaran …, hlm. 260-261.
19
Zainal Arifin, Evaluasi Pembelajaran …, hlm. 264.
20
Ahmad Subari, Lutfi, dan Syamsul, Analisis Butir Soal Ujian Akhir Semester Ganjil Biologi
Kelas XI MAN 2 Kota Jambi, Jurnal Ilmiah Biologi, Vol. 9, No. 1, June 2021, hlm. 46.
21
Sunarti, Selly Rahmawati, Penilaian Dalam …, hlm. 135.
22
Laela Umi Fatimah, Khaeruddin Alfath, Analisis Kesukaran Soal, Daya Pembeda dan Fungsi
Distraktor, Jurnal Komunikasi dan Pendidikan Islam, Vol. 8, No. 2, Desember 2018, hlm. 39.

6
Ada beberapa teknik yang digunakan untuk menganalisis secara
kualitatif, yaitu dengan teknik moderator dan teknik panel. Teknik moderator
yaitu menganalisis dengan cara berdiskusi yang mana ada satu orang sebagai
pencegah. Dengan teknik ini setiap butir soal didiskusikan secara bersama-
sama dengan beberapa ahli seperti guru yang mengajarkan materi, ahli materi,
penyusun atau pengembang kurikulum.
Teknik panel yaitu satu teknik menelaah butir soal berdasarkan kaidah
penulisan isi butir soal. Kaidah tersebut diantaranya adalah materi,
konstruksi, bahasa atau budaya, kebenaran kunci jawaban atau pedoman
penskoran. Dalam penganalisisan butir soal dengan teknik kualitatif,
penggunaan format penelaahan soal akan sangat membantu dan
mempermudah prosedur pelaksanaannya.
b. Teknik Analisis Secara Kuantitatif
Analisis soal dengan kuantitatif adalah penelaahan butir soal
didasarkan pada data empirik. Dimana data empirik ini didapatkan dari soal
yang sudah diujikan. Ada 2 pendekatan secara kuantitatif, yaitu pendekatan
secara klasik dan dan moderen.
Analisis soal secara klasik adalah proses penelaahan butir soal melalui
informasi dari jawaban peserta didik guna meningkatkan mutu burit soal yang
bersangkutan dengan menggunakan teori tes klasik. Aspek yang sangat
penting untuk ditelaah secara klasik ini terlihat dari segi, tingkat kesukaran,
daya pembeda butir, fungsi pengecoh pada setiap pilihan jawaban.
a. Tingkat Kesukaran Soal (Difficulty Index)
Perhitungan tingkat kesukaran soal adalah pengukuran seberapa besar
derajat kesukaran suatu soal. Jika suatu soal memiliki tingkat kesukaran
seimbang (proporsional), maka dapat dikatakan bahwa soal tersebut baik.
suatu soal tes hendaknya tidak terlalu sukar dan tidak pula terlalu mudah.
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada
suatu tingkat kemampuan atau bisa dikatakan untuk mengetahui sebuah soal
itu tergolong mudah atau sukar.
b. Daya Pembeda (Discriminating Power)

7
Perhitungan tingkat pembeda adalah pengukuran sejauhmana suatu
butir soal mampu membedakan peserta didik yang susah menguasai
kompetensi dengan yang belum/kurang menguasai berdasarkan kriteria
tertentu. Semakin tinggi koefisien daya pembeda suatu butir soal, semakin
mampu butir soal tersebut membedakan anatara peserta didik yang menguasai
dan yang belum/kurang.
c. Fungsi Pengecoh
Butir soal yang baik, pengecohnya akan dipilih secara merata oleh
peserta didik yang menjawab salah. Sebaliknya, butir soal yang kurang
baik, pengecohnya akan dipilih secara tidak merata.23 Efektivitas pengecoh
soal adalah alternatif jawaban yang mengandung unsur penyesat. Tujuan
adanya soal pengecoh ini adalah untuk mengecoh peserta didik agar
terlihat siapa yang mampu dan tidak menguasai materi pembelajaran. Soal
pengecoh ini dapat dikatakan berhasil apabila dipilih oleh paling
sedikitnya 5% dari seluruh peserta tes.24
Sedangkan analisis secara modern yaitu penelaahan butir soal dengan
menggunakan Item Response Theory (IRT). Tujuan utama IRT adalah
memberiakn kesamaan antara statistik soal dan estimasi kemampuan. 25 Teori
ini merupakan suatu teori yang menggunakan fungsi matematika untuk
menghubungkan antara peluang menjawab benar suatu butir dengan
kemampuan siswa.

C. PENUTUP
Menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan
guru untuk meningkatkan mutu soal yang dilaksanakan. Kegiatan ini merupakan
proses pengumpulan, peringkasan dan penggunaan informasi dari jawaban
peserta didik untuk membuat keputusan tentang setiap penilaian. Diantara
karakteristik tes dan butir soal adalah validitas, reliabilitas, dan kepraktisan.

23
Zainal Arifin, Evaluasi Pembelajaran …, hlm. 266-279.
24
Santi Wahdianti, Analisis Butir Soal Ujian Akhir Semester Gasal Mata Pelajaran Hitung
Dagang, Kajian Pendidikan Indonesia, Vol. 7, No. 1, 2018, hlm. 6.
25
M. Chatib Thoha, Teknik Evaluasi Pendidikan, (Jakarta: CV. Rajawali, 1991), hlm. 145.

8
Ada dua unsur penting dalam validitas. Pertama, validitas menunjukkan
suatu derajat, ada yang sempurna, sedang, dan yang rendah. Kedua, validitas
selalu dihubungkan dengan suatu putusan atau tujuan yang spesifik. Secara garis
besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
Adapun faktor-faktor yang memengaruhi validitas adalah 1) faktor yang berasal
dari dalam tes, 2) faktor yang berasal dari administrasi dan skor, 3) faktor-faktor
yang berasal dari jawaban siswa.
Reliabilitas suatu instrumen dapat diukur konsistensinya melalui metode-
metode tertentu. Konsistensi reliabilitas tes yang diukur, antara lain konsistensi
eksternal dan konsistensi internal. Menurut perhitungan product-moment dari
Pearson, ada tiga macam reliabilitas, yaitu koefisien stabilitas, koefisien
ekuivalen, dan koefisien konsistensi internal.
Kepraktisan mengandung arti kemudahan suatu tes, baik dalam
mempersiapkan, menggunakan, mengolah dan menafsirkan maupun
mengadministrasikannya. Faktor-faktor yang memengaruhi kepraktisan
instrumen evaluasi meliputi 1) kemudahan mengadministrasi, 2) waktu yang
disediakan untuk melancarkan evaluasi, 3) kemudahan menskor, 4) kemudahan
interpretasi dan aplikasi, 5) tersedianya bentuk instrument evaluasi yang
ekuivalen atau sebanding.
Analisis butir soal merupakan proses mengkaji terhadap kualitas soal
pada setiap butirnya. Tujuan analisis butir soal adalah untuk mengkaji dan
menelaah soal, agar diperoleh soal yang berkualitas sebelum soal tersebut
digunakan. Analisis butir soal atau item-item dapat digunakan secara kualitatif
dan kuantitatif yang masing-masing mempunyai keunggulan dan kelemahan.
Oleh karenanya teknik terbaik adalah menggabungkan keduanya.

9
DAFTAR PUSTAKA
Arifin, Zainal. 2022. Evaluasi Pembelajaran. Bandung: PT.Remaja Rosdakarya.
Arikunto, Suharsimi. 2018. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Chabib, M Thoha, 1991, Teknik Evaluasi Pendidikan, Jakarta: CV. Rajawali.
Diah, Hastuti Ikawati, Agus Jayadi Hermansyah, 2022, Analisis Kualitas Tes dan Butir
Soal Sejarah di SMAN 1 Praya Timur, Jurnal Pendidikan dan Konseling, Vol. 4,
No. 4.
Dimyati & Mudjiono, 1994, Belajar dan Pembelajaran, Jakarta: P3MTK-Ditjen Diksi-
Depdikbud.
Farida, Anna Musyarofah, 2021, Validitas dan Reliabilitas dalam Analisis Butir Soal,
Jurnal Pendidikan Bahasa Arab Al-Mu’arrib, Vol.1, No.1.
Ihsan, Helli, 2015, Validasi Isi Alat Ukur Penelitian Konsep dan Panduan Penilaiannya,
Paedagogik, Jurnal Ilmu Pendidikan, Vol.13, No. 2.
Joni, Raka, 1984, Pengukuran dan Penilian Pendidikan, Malang: YP2LPM.
Matondang, Zulkifli, Juni 2009, Validitas dan Reliabilitas Suatu Instrumen Penelitian,
Jurnal Tabularasa PPS UNIMED, Vol. 6, No. 1.
Muluki, Ardilah, Patta Bundu, I Sukmawati, 2020, Analisis Kualitas Butir Soal Tes
Semester Ganjil Mata Pelajaran IPA Kelas IV MI Radhiatul Adawiyah, Jurnal
Ilmiah Sedolah Dasar, Vol. 4, No. 1.
Pratama, Dinar, 2020, Analisis Kualitas Tes Buatan Guru Melalui Pendekatan Item
Response Theary (IRT) Model Rasch, Jurnal Pendidikan Islam, Vol.7, No. 1.
Subari, Ahmad, Lutfi & Syamsul, Juni 2021, Analisis Butir Soal Ujian Akhir Semester
Ganjil Biologi Kelas XI MAN 2 Kota Jambi, Jurnal Ilmiah Biologi, Vol. 9, No.
1.
Sukardi, 2008, Evaluasi Pendidikan Prinsip dan Operasionalnya, Jakarta: Bumi
Aksara.
Sukmawati, Adhetia, dkk, Juli 2021, Analisis Butir Soal Penilaian Ketrampilan
Apresiasi Sastra pada Soal UAS Materi Puisi Kelas VII Tahun Pelajaran
2019/2020 Di SMP N 1 Kandanghaur, Jurnal Sastra, Vol. 10, No. 2.
Sunarti, Selly Rahmawati, 2014, Penilaian Dalam Kurikulum 13, Yogyakarta: CV.
Andi Offset.

10
Umi, Laela Fatimah, Kaheruddin Alfath, Desember 2018, Analisis Kesukaran Soal,
Daya Pembeda dan Fungsi Distraktor, Jurnal Komunikasi dan Pendidikan Islam,
Vol. 8, No. 2.
Wahdianti, Santi, 2018, Analisis Butir Soal Ujian Akhir Semester Gasal Mata Pelajaran
Hitung Dagang, Kajian Pendidikan Indonesia, Vol. 7, No. 1.

11

Anda mungkin juga menyukai