SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Meraih Gelar
Sarjana Pendidikan Jurusan Pendidikan Matematika
pada Fakultas Tarbiyah Dan Keguruan
UIN Alauddin Makassar
Oleh:
TARMIZI RAMLI
NIM.20700114048
yang Maha pengasih dan penyayang atas segala limpahan rahmat dan petunjuk-Nya
sehingga penulis dapat menyelesaikan skripsi ini. Shalawat dan salam senantiasa
tercurah kepada Rasulullah Muhammad saw Sang Murabbi segala zaman, dan para
jalanNya.
Ayahanda Muh Ramli dan Ibunda Sahriah yang sangat kusayangi yang telah
membesarkan penulis dengan berlimpah kasih dan sayang dan membiayai penulis
tanpa rasa lelah sehingga penulis bisa menyelesaikan pendidikan sampai perguruan
tinggi. Serta semua keluarga besar. Terima kasih atas semua yang kalian berikan
selama ini.
• Prof. Dr. H. Musafir Pababbari, M.Si.. selaku rektor UIN Alauddin Makassar
Keguruan beserta seluruh stafnya atas segala pelayanan yang diberikan kepada
penulis.
• Ibunda Dra. Andi Halimah, M.Pd. dan Sri Sulasteri, S.Si.,M.Si. selaku ketua
kesempatan dan fasilitas yang diberikan sehingga skripsi ini dapat terselesaikan.
v
• Ibunda Dr. Sitti Mania, M.Ag., selaku pembimbing I dan Ibunda Andi Ika
Pendidikan Matematika.
Penulis berharap semoga amal baik semua pihak yang ikhlas memberikan
bantuan dalam penyusunan skripsi ini mendapatkan pahala dari Allah swt. Penulis
menyadari bahwa skripsi ini masih jauh dari kesempurnaan, oleh karena itu penulis
Penulis
Tarmizi Ramli
NIM.20700114048
vi
DAFTAR ISI
HALAMAN JUDUL ......................................................................................... i
PERSETUJUAN PEMBIMBING.....................................................................iii
DAFTAR TABEL.............................................................................................. ix
ABSTRAK ......................................................................................................... x
A. Kajian Teori....................................................................................... 7
B. Kajian Penelitian yang Relevan ........................................................ 26
A. Kesimpulan........................................................................................ 59
B. Implikasi Penelitian ........................................................................... 60
C. Saran .................................................................................................. 60
LAMPIRAN
RIWAYAT HIDUP
viii
DAFTAR TABEL
Tabel 4.1 Distribusi Frekuensi dan Persentase Tingkat Kesulitan Soal USBN
mata pelajaran matematika di MTs Madani Alauddin Pao-pao
Kabupaten Gowa tahun ajaran 2017/2018 ......................................... 43
Tabel 4.2 Distribusi Frekuensi dan Persentase Daya Pembeda Kesukaran Soal
USBN mata pelajaran matematika di MTs Madani Alauddin Pao-pao
Kabupaten Gowa tahun ajaran 2017/2018 ......................................... 44
Tabel 4.3 Distribusi Frekuensi dan Persentase efektifitas pengecoh Soal Soal
USBN mata pelajaran matematika di MTs Madani Alauddin Pao-pao
Kabupaten Gowa tahun ajaran 2017/2018 ......................................... 45
Tabel 4.4 Hasil Analisis Butir Soal USBN Mata Pelajaran Matematika di MTs
Madani Alauddin Pao-pao Kabupaten Gowa Tahun Ajaran
2017/2018 ........................................................................................... 46
Tabel 4.5 Distribusi Frekuensi dan Persentase Kualitas Butir Soal USBN mata
pelajaran matematika di MTs Madani Alauddin Pao-pao Kabupaten
Gowa tahun ajaran 2017/2018 ............................................................ 49
ix
ABSTRAK
Penelitian ini bertujuan untuk mengetahui kualitas butir soal USBN mata
pelajaran matematika di MTs Madani Alauddin Pao-pao Kabupaten Gowa tahun
ajaran 2017/2018 dilihat dari segi tingkat kesulitan, daya pembeda dan efektivitas
pengecoh soal.
Penelitian ini merupakan penelitian yang bersifat evaluasi dengan
pendekatan deskriptif kuantitatif. Penelitian dilakukan di MTs Madani Alauddin
Pao-pao dengan 113 lembar jawaban siswa. Teknik pengumpulan data yang
digunakan adalah teknik dokumentasi. Data yang diperoleh dianalisis dengan
bantuan aplikasi AnatesV4.
Hasil penelitian menggunakan aplikasi Anates versi 4.09 menunjukkan
bahwa: (1) Berdasarkan kriteria tingkat kesulitan soal diperoleh soal sulit
16 butir (45,71%), sedang 19 butir (54,29%) dan tidak ada soal yang mudah. (2)
Berdasarkan kriteria daya beda soal diperoleh soal dengan daya beda buruk 12 butir
(34,29%), sedang 7 butir (20%), cukup baik 6 butir (17,14%), dan sangat baik 10
butir (28,57%). (3) Berdasarkan keefektifan pengecoh diperoleh 10 butir (33,33%)
dalam kategori sangat baik, 9 butir (30%) dalam kategori baik, 3 butir (7,5%) dalam
kategori kurang baik, 8 butir (26,67%) dalam kategori buruk dan tidak ada dalam
kategori sangat buruk
Berdasarkan hasil analisis dapat disimpulkan bahwa sebanyak 9 butir
(25,71%) soal berkualitas baik, 11 butir (31,43%) soal berkualitas kurang baik, dan
15 butir (42,86%) soal berkulitas jelek. Butir soal yang berkualitas baik dapat
dimaksukkan ke bank soal, butir soal yang kurang baik dapat direvisi, dan butir soal
yang jelek diganti dengan membuat soal yang baru.
Kata Kunci : Analisis Butir Soal, Tingkat Kesulitan, Daya Pembeda, Efektivitas
Pengecoh, AnatesV4
x
BAB I
PENDAHULUAN
peserta didik untuk menimbulkan suatu hasil yang diinginkan sesuai tujuan yang
dievaluasi untuk mengetahui hasil belajar peserta didik disamping mengetahui mutu
proses pendidikan secara umum dan mutu proses balajar-mengajar secara khusus.2
komponen dan sistem kerjanya. Evaluasi pendidikan adalah kegiatan atau proses
fisik, manusia dan sebagainya. Oleh karenanya evaluasi pendidikan dilakukan atas
kepada pihak pihak yang berkepentingan.4 Hasil yang diperoleh dari evaluasi dapat
1
Purwanto, Evaluasi Hasil Belajar (Yogyakarta: Pustaka Pelajar, 2011), h. 18.
2
Baego Ishak dan Syamsuduha, Evaluasi Pendidikan (Makassar: Aluddin Press, 2010), h.
8.
3
Anas Sudijono, Pengantar Evaluasi Pendidikan (Jakarta: Rajawali Pers, 2009), h. 2.
4
www.pendis.kemenag.go.id/file/dokumen/uuno20th2003ttgsisdiknas.pdf (3 oktober 2017)
1
2
Ankabut/29: 2-3,
Berdasarkan ayat di atas Allah swt. mengadakan ujian atau evaluasi kepada
bahwa evaluasi dilakukan terhadap peserta didik, lembaga dan program pendidikan
jalur formal dan nonformal untuk semua jenjang, satuan dan jenis pendidikan.6
5
Departemen Agama RI, Al-Quran dan Terjemahannya (Bandung: CV.Penerbit J-Art,
2005), h. 543.
6
www.pendis.kemenag.go.id/file/dokumen/uuno20th2003ttgsisdiknas.pdf (3 oktober 2017)
3
memantau proses, kemajuan, dan perbaikan hasil dalam bentuk ulangan harian,
ulangan tengah semester, ulangan akhir semester, ulangan kenaikan kelas, ujian
pendidikan untuk mata pelajaran tertentu dengan mengacu pada standar kompetensi
lulusan untuk memperoleh pengakuan atas prestasi belajar. USBN pada penelitian
ini khusus mata pelajaran matematika. Pada mata pelajaran matematika, USBN
dilakukan dengan teknik tes. Suatu tes atau soal merupakan alat pengukur
keberhasilan belajar. Soal sebagai alat ukur dikatakan baik apabila mampu
memenuhi beberapa persyaratan yang dapat diuji dengan melakukan analisis butir
Analisis butir soal secara kualitatif merupakan suatu tahap yang harus
ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan
maupun butir soal yang menjadi bagian dari tes tersebut. Dalam penilaian hasil
nilai yang objektif serta akurat. Jika tes yang digunakan guru kurang baik, maka
hasil yang diperoleh pun tentunya kurang baik. Hal ini dapat merugikan peserta
didik itu sendiri. Artinya, hasil yang diperoleh peserta didik menjadi tidak objektif
dan tidak adil. Oleh sebab itu, tes yang digunakan guru harus memiliki kualitas
yang lebih baik dilihat dari berbagai segi. Tes hendaknya disusun sesuai dengan
prinsip dan prosedur penyusunan tes. Setelah digunakan perlu diketahui apakah tes
tersebut berkualitas baik atau kurang baik. Untuk mengetahui apakah suatu tes yang
4
digunakan termasuk baik atau kurang baik, maka perlu dilakukan analisis kualitas
tes.
karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik
maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir
soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah diujikan.
kurikulum di MTs Madani Alauddin Pao-pao Kabupaten Gowa bahwa soal USBN
mata pelajaran matematika yang telah diujikan kepada peserta didik tersebut dibuat
tersebut belum dianalisis. Selain itu, peneliti juga menemukan informasi bahwa
hasil USBN yang diperoleh siswa, banyak yang tidak memenuhi KKM yaitu hanya
10 dari 113 peserta didik yag memenuhi KKM atau hanya sekitar 9% padahal di
sekolah tersebut telah diadakan les tiap sorenya. Dari sinilah timbul pertanyaan
apakah soal-soal USBN tersebut dapat dikatakan baik sebagai alat pengukur
Dari latar belakang tersebut, maka kiranya perlu adanya pembuktian dengan
7
Sumarna Surapranata, Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes
Implementasi Kurikulum 2004 (Bandung: PT Remaja Rosdakarya, 2006), h. 10.
5
USBN di MTs Madani Alauddin Pao-pao tersebut dapat dikatakan baik sebagai alat
judul “Analisis Butir Soal USBN Mata Pelajaran Matematika di MTs Madani
B. Rumusan Masalah
C. Tujuan Penelitian
Dari rumusan masalah diatas maka tujuan yang ingin dicapai dalam
D. Manfaat Penelitian
1. Manfaat Teoritis
langkah yang perlu dilakukan dalam bidang evaluasi yang meliputi analisis
butir soal.
2. Manfaat Praktis
a. Bagi peneliti
b. Bagi guru
khususnya, mengenai analisis butir soal pada mata pelajaran matematika untuk
c. Bagi siswa
Agar siswa mendapatkan penilaian yang lebih adil dan objektif dari guru
BAB II
TINJAUAN TEORITIK
A. Kajian Teori
Guru menyusun sebuah tes untuk melihat sejauh mana kemampuan peserta
tes, guru masih sulit untuk menyadari bahwa tesnya belum sempurna. Agar tes
yang disusun memiliki kualitas yang baik, maka sebaiknya setiap butir soal pada
tes dianalisis untuk mengetahui tingkat kualitas tes tersebut. Nana Sudjana
mengemukakan bahwa analisis butir soal adalah pengkajian pertanyaan dalam tes
tes.1 Daryanto menjelaskan bahwa analisis butir soal digunakan untuk mengetahui
kekurangan dalam butir tes sehingga dapat dilakukan upaya untuk memperbaiki
sebelum digunakan pada tes berikutnya.2 Jadi, dari kedua pendapat di atas dapat
ditarik kesimpulan bahwa analisis butir soal pada tes merupakan suatu metode atau
penyusunan butir soal pada suatu tes, sehingga diperoleh tes yang berkualitas baik.
Analisis pada umumnya dilakukan melalui dua cara, yaitu analisis kualitatif
kualitatif sering pula dinamakan sebagai validitas logis (logical validity) yang
1
Nana Sudjana, Penilaian Hasil Proses Belajar Mengajar (Bandung: PT Remaja
Rosdakarya, 2009), h. 135.
2
Daryanto, Evaluasi Pendidikan: Komponen MKDK (Jakarta: Rineka Cipta, 2012), h. 179.
7
8
sebuah soal. Analisis soal secara kuantitatif sering pula dinamakan sebagai validitas
empiris (empirical validity) yang dilakukan untuk melihat lebih berfungsi tidaknya
sebuah soal setelah soal itu diujicobakan kepada sampel yang representatif.3
suatu alat ukur benar-benar mengukur apa yang hendak dan seharusnya diukur?,
sampai mana tes tersebut dapat diandalkan dan berguna?. Kedua pertanyaan ini
a. Validitas
yang valid akan menghasilkan data yang valid pula. Atau dapat dikatakan bahwa
jika data yang dihasilkan dari sebuah instrumen valid, maka instrumen itu juga
valid.5
Istilah “valid” sangat sukar dicari penggantinya. Ada yang mengganti istilah
valid dengan “sahih”, sehingga validitas diganti dengan kesahihan. Ada juga yang
menerjemahkan istilah valid dengan kata “tepat”, walaupun istilah “tepat “ belum
Hijriah Enang, “Analisis Kualitas Soal Matematika Seleksi Penerimaan Peserta Didik
3
Baru di SMPN 32 Makassar Tahun Pelajaran 2013/2014”, Tesis (Makassar: Program Pascasarjana
Universitas Negeri Makassar, 2014), h. 27.
4
Zainal Arifin, Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur (Cet 5; Bandug: PT
Remaja Rosdakarya Offset, 2013), h. 246.
5
SEP Widoyoko, Evaluasi Program Pembelajaran (Cet, VI, Yogyakarta : Pustaka Pelajar,
2014), h. 128.
9
dapat mencangkup semua arti yang tersirat dalam kata “valid” sehingga istilah
Secara garis besar ada dua macam validitas, yaitu validitas logis dan
validitas empiris.6
1) Validitas Logis
Istilah “validitas logis” mengandung kata “logis” yang berasal dari kata
“logika”, yang berarti penalaran. Dengan makna demikian maka validitas logis
untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah instrumen
secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan
tugas lain misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan
instrumen, secara logis sudah valid. Dari penjelasan tersebut kita dapat memahami
bahwa validitas logis dapat dicapai apabila instrumen disusun mengikuti ketentuan
yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis tidak perlu
disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen,
yaitu validitas isi dan validitas konstrak (construct validity). Validitas isi bagi
6
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Cet. IV, Jakarta : Bumi Aksara,
2015), h. 80-84.
10
2) Validitas Empiris
apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari, seseorang dapat
diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang
tersebut memang jujur. Contoh lain, seseorang dapat dikatakan kreatif apabila dari
baru yang diakui berbeda dari hal-hal yang sudah ada. Dari penjelasan dan contoh-
contoh tersebut diketahui bahwa validitas empiris tidak dapat diperoleh hanya
Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan
instrumen dimaksud ada dua, yaitu : yang sudah tersedia dan yang belum ada tetapi
akan terjadi di waktu yang akan datang. Bagi instrumen yang kondisinya sesuai
dengan kriterium yang sudah tersedia, yang sudah ada, disebut memiliki validitas
“ada sekarang”, yang dalam istilah bahasa inggris disebut memiliki concurrent
11
diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi,
Dari uraian adanya dua jenis validitas, yakni validitas logis yang ada dua
macam, dan validitas empiris juga ada dua macam, maka secara keseluruhan kita
mengenal adanya empat validitas, yaitu : (1) validitas isi, (2) validitas konstruk, (3)
b. Reliabilitas
Data yang disajikan secara ajeg dan dapat dipercaya merupakan salah satu
ciri data yang baik. Data yang ajeg dan dapat dipercaya berarti memiliki tingkat
memiliki nilai reliabilitas yang tinggi apabila mempunyai hasil yang konsisten
kali. Hal ini sesuai dengan pendapat dari Widoyoko yang mengatakan bahwa
instrumen tes dikatakan dapat dipercaya (reliabel) jika memberikan hasil yang tetap
7
Sukardi, Evaluasi Pendidikan: Prinsip Dan Operasionalnya (Jakarta: Bumi aksara, 2008),
h. 43.
8
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan (Jakarta: Bumi Aksara, 2012), h.
100
12
atau ajeg (konsisten) apabila diteskan berkali-kali.9 Dari ketiga pendapat di atas
dapat disimpulkan bahwa reliabilitas menunjukkan bahwa alat ukur dikatakan dapat
dipercaya apabila menyajikan hasil pengukuran yang ajeg atau konsisten dan
soal. Tingkat reliabilitas butir soal tersebut disajikan pada tabel 2.1 sebagai
berikut. 10
Tabel 2.1 mengenai tingkat reliabilitas di atas terdiri dari dua kolom,
yaitu kolom koefisien reliabilitas dan kolom tingkat reliabilitas. Kolom pertama
adalah kolom koefisien reliabilitas. Pada kolom ini berisi angka kisaran atau range
tingkat reliabilitas. Pada kolom kedua ini berisi tingkatan reliabilitas yang
9
SEP Widoyoko, Evaluasi Program Pembelajaran: Panduan Praktis Bagi Pendidik Dan
Calon Pendidik (Yogyakarta: Pustaka Pelajar, 2009), h. 144.
10
Ismet Basuki dan Hariyanto, Asesmen Pembelajaran (Bandung: PT Remaja Rosdakarya
offiset, 2014), h. 119.
13
Dari tabel 2.1 dapat dilihat, bahwa apabila hasil perhitungan reliabilitas
berada di antara koefisien 0,00 – 0,19 maka termasuk ke dalam tingkat reliabilitas
0,20 – 0,39 maka termasuk ke dalam tingkat reliabilitas korelasi rendah. Hasil
antara koefisien 0,70 - 0,89 maka termasuk ke dalam tingkat reliabilitas korelasi
0,90 - 1,09 maka dapat dinyatakan ke dalam tingkat reliabilitas korelasi sangat
tinggi. Dari pedoman tersebut, maka peneliti dapat mengetahui tingkat reliabilitas
berdasarkan koefisiennya.
dan untuk mengetahui tingkat kesulitan soal. Khusus untuk pilihan ganda, analisis
diperoleh informasi mengenai soal baik, soal yang perlu diperbaiki, dan soal yang
gugur.11
a. Tingkat Kesulitan
Dalam penyusunan tes, guru juga harus memperhatikan aspek penyusunan
tes, sehingga tes yang disusun memiliki kualitas yang baik. Salah satu ciri atau
11
Nursalam, Evaluasi Pembelajaran Matematika (Gowa: Pustaka Almaida, 2017), h. 151.
14
kriteria agar tes dapat dikatakan memiliki kualitas yang baik adalah yang tidak
terlalu mudah atau tidak terlalu sulit. Suharsimi Arikunto mengatakan bahwa soal
yang berkualitas baik adalah soal yang tidak terlalu mudah atau tidak terlalu sulit.12
Pendapat tersebut diperkuat oleh Nana Sudjana yang mengemukakan bahwa tingkat
kesulitan soal adalah penentuan kriteria soal yang termasuk ke dalam kategori
mudah, sedang, atau sulit. Soal yang terlalu mudah tidak membuat peserta didik
untuk mempertinggi usahanya dalam memecahkan suatu soal dalam tes. Soal yang
terlalu sulit juga akan membuat peserta didik putus asa untuk mencoba lagi
mudah, sedang, dan sukar secara proporsional.14 Jadi, dari keempat pendapat di atas
dapat ditarik kesimpulan bahwa analisis tingkat kesulitan butir soal adalah suatu
cara yang digunakan untuk mengetahui seberapa mudah atau sulit soal yang
diujikan, serta dapat digunakan untuk mengetahui kualitas soal tersebut baik atau
tidak untuk diberikan kepada peserta didik.
12
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan (Jakarta: Bumi Aksara, 2012), h.
222.
13
Nana Sudjana, Penilaian Hasil Proses Belajar Mengajar (Bandung: PT Remaja
Rosdakarya, 2009), h. 135.
14
Sitti Mania, Pengantar Evaluasi Pengaajaran (Makassar: Alauddin University Press,
2012), h.186-187.
15
Tingkat kesulitan disebut juga indeks kesulitan. Indeks kesulitan ini diberi
a) Susunlah lembar jawaban berurutan mulai yang mendapat skor paling tinggi
b) Membuat dua kelompok dari lembar jawaban itu yakni satu kelompok mulai
dari skor tertinggi dan satu kelompok mulai dari skor terendah. Ini dilakukan
bila jumlah lembar jawaban tidak lebih dari 100 buah. Kalau jumlah lembar
jawaban lebih dari 100 buah maka diambil 27% kelompok atas dan 27%
kelompok bawah.
c) Untuk setiap soal hitunglah jumlah siswa yang memilih tiap alternatif jawaban
yang ada. Dengan demikian, untuk soal bentuk benar salah atau soal bentuk
15
Ali Hamzah, Evaluasi Pembelajaran Matematika, h. 244-245.
39
16
Sepintas terdapat kesan bahwa pengisian format ini tidak perlu untuk
menghitung tingkat kesulitan soal. Namun, data dalam format ini akan sangat
diperlukan pada waktu meneliti pola jawaban soal untuk menemukan kualitas
tiap option.
e) Untuk setiap soal hitunglah jumlah siswa dalam tiap kelompok yang menjawab
betul soal tersebut. Caranya ialah menjumlahkan kedua angka di bawah kunci
Keterangan :
P=𝐵
𝐽𝑆
Keterangan:
P = indeks kesulitan
B = banyaknya peserta didik yang menjawab soal itu dengan benar
Difficulty index can range between 0.0 and 1.0. The higher value indicates
thata greater proportion of examinees responded to the quetion correctly,
or in the other words the higher the value the easier the question is.17
Tabel 2.3 mengenai kriteria tingkat kesulitan butir soal ini terdiri dari empat
kolom. Kolom pertama adalah nomor urut. Kolom kedua adalah range tingkat
kesulitan. Pada kolom kedua ini berisi ukuran tingkat kesulitan butir soal yang
dinyatakan ke dalam angka kisaran atau range. Kolom ketiga adalah kategori.
Pada kolom ini berisi kategori tingkat kesulitan butir soal yang dinyatakan ke
dalam tiga kategori, yaitu mudah, sedang, dan sulit. Kolom keempat adalah
keputusan. Pada kolom ini berisi keputusan mengenai hasil analisis butir soal
Dari tabel 2.3 dapat dilihat, bahwa apabila hasil perhitungan terhadap
tingkat kesulitan menunjukkan range 0,00 sampai 0,30 maka butir soal yang
Helena Borozova dan Jan Rydval, “Analysis Of Exam Result Of The Subject ‘Applied
17
Mathematics For IT’”, Journal on Efficiency and Responsibility in Education and Science 7, no. 3-
4 (2014): h. 60
18
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan (Jakarta: Bumi Aksara, 2012), h.
225.
18
diujikan termasuk ke dalam kategori sulit, sehingga akan ditolak atau harus
menunjukkan range 0,31 sampai 0,70 maka butir soal yang diujikan termasuk ke
dalam kategori sedang, sehingga akan diterima. Apabila hasil perhitungan terhadap
tingkat kesulitan menunjukkan range 0,71 sampai 1,00 maka butir soal yang
diujikan termasuk ke dalam kategori mudah, sehingga akan ditolak atau harus
direvisi. Dari uraian tersebut dapat disimpulkan bahwa, kriteria tingkat kesulitan
yang baik adalah apabila butir soal yang diujikan termasuk ke dalam kategori
sedang, yaitu berada pada range 0,31 sampai 0,70. Apabila butir soal memiliki
kategori mudah atau sulit, maka butir soal tersebut akan ditolak atau harus direvisi.
Perbaikan pada butir soal dengan kategori tingkat kesulitan mudah, sedang, dan
sulit dilakukan apabila proporsi tingkat kesulitan pada butir soal suatu tes belum
Dari tabel 2.4 mengenai proporsi tingkat kesulitan butir soal dapat
diketahui bahwa tingkat kesulitan butir soal suatu tes dapat dikatakan baik
19
Kunandar, Penilaian Autentik ( Jakarta : Rajawali press, 2014), h. 201.
19
apabila memiliki proporsi kategori mudah sebesar 30%, kategori sedang sebesar
50%, dan kategori sulit sebesar 20%. Oleh karena itu, perbaikan pada butir
soal suatu tes dapat dilakukan apabila proporsi tingkat kesulitan dengan kategori
mudah, sedang, dan sulit belum sesuai dengan proporsi tingkat kesulitan butir soal
b. Daya Pembeda
Kriteria atau ciri lainnya agar tes dapat dikatakan memiliki kualitas
yang baik adalah yang dapat membedakan antara peserta didik yang mampu
dan yang kurang mampu dalam menyelesaikan tes tersebut. Daryanto menjelaskan
Pendapat lainnya yang senada dikemukakan oleh Zainal Arifin yang mengatakan
bahwa daya pembeda adalah pengukuran sejauh mana butir soal mampu
membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik
20
Daryanto, Evaluasi Pendidikan: Komponen MKDK (Jakarta: Rineka Cipta, 2012), h. 183.
21
Anas Sudijono, Pengantar Evaluasi Pendidikan (Jakarta: Rajawali Pers, 2009), h. 385-
386
22
Zainal Arifin, Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur (Cet 5; Bandug: PT
Remaja Rosdakarya Offset, 2013), h. 273.
20
peserta didik yang berkemampuan tinggi dan yang berkemampuan rendah dalam
Analisis terhadap butir soal untuk membedakan peserta didik yang mampu
dan yang kurang mampu dalam mengerjakan suatu tes adalah dengan menggunakan
prestasi yang tinggi dan peserta didik yang memiliki prestasi yang rendah.23 Jadi,
dari keempat pendapat di atas dapat ditarik kesimpulan bahwa analisis daya
membedakan antara peserta didik yang memiliki kemampuan atau prestasi yang
tinggi dan yang memiliki kemampuan atau prestasi yang rendah, serta digunakan
untuk mengetahui peserta didik yang telah atau belum menguasai kompetensi
pembelajaran.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi,
disingkat D. 24
sebagai berikut.26
1) Menghitung jumlah skor total tiap peserta didik.
23
Nana Sudjana, Penilaian Hasil Proses Belajar Mengajar (Bandung: PT Remaja
Rosdakarya, 2009), h. 141.
24
Asrul, Rusydi Ananda, dan Rosnita, Evaluasi Pembelajaran (Bandung: Citapustaka
Media, 2014), h. 152
25
Evroro and Edhereveno Sylvanus, “Item Analysis of Test of Number Operations”, Asian
Journal of Educational Research 3, no. 1 (2015): h. 19
26
Zainal Arifin, Evaluasi Pembelajaran (Prinsip, Teknik, Prosedur), h. 133.
21
2) Mengurutkan skor total mulai dari skor terbesar sampai dengan skor terkecil.
di mana:
D = daya pembeda
27
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan (Jakarta: Bumi Aksara, 2012), h.
228.
28
Ismet Basuki dan Hariyanto, Asesmen Pembelajaran (Bandung: PT Remaja Rosdakarya
offiset, 2014), h. 141.
22
pembeda) dan kolom kriteria. Kolom pertama adalah kolom indeks diskriminasi
(daya pembeda). Pada kolom pertama ini berisi ukuran daya pembeda butir soal
yang dinyatakan ke dalam angka kisaran atau range. Kolom kedua adalah kolom
kriteria. Pada kolom kedua ini berisi kriteria daya pembeda butir soal.
Dari tabel 2.5 tersebut dapat dilihat, bahwa apabila hasil perhitungan
terhadap daya pembeda menunjukkan nilai 0,40 atau lebih maka butir soal dapat
dikategorikan ke dalam kriteria yang sangat baik sehingga, butir soal dapat
0,30 sampai 0,39 maka soal yang diujikan dapat dikategorikan ke dalam kriteria
yang cukup baik sehingga butir soal dapat diterima dengan perbaikan. Apabila hasil
perhitungan terhadap daya pembeda menunjukkan nilai 0,20 sampai 0,29 maka
soal dapat dikategorikan ke dalam kriteria sedang, sehingga butir soal perlu
dalam kriteria buruk, sehingga butir soal ditolak atau dibuang dan digantikan oleh
c. Efektivitas Pengecoh
model pilihan ganda (multiple choice item). Di dalam soal pilihan ganda dilengkapi
dengan beberapa alternatif jawaban yang disebut dengan option (opsi). Opsi biasa
berkisar antara 3 sampai dengan 5 buah. Dari opsi tersebut terdapat salah satu
jawaban yang benar dan itu yang disebut dengan kunci jawaban, sedangkan sisanya
kecuali kunci jawaban soal tersebut. Pengecoh digunakan untuk mengecoh peserta
didik dalam memilih jawaban soal. Pengecoh yang baik adalah yang mampu
jawaban yang benar.30 Hal ini sesuai dengan pendapat Djiwandono yang
yang dapat mengecoh peserta didik dalam memilih atau menentukan pilihan
jawabannya.
29
Elis Ratnawulan dan Rusdiana, Evaluasi Pembelajaran, dengan pengantar Sutaryat
Trisnamansyah (Bandung: Pustaka Setia, 2014), h. 218
30
Anas Sudijono, Pengantar Evaluasi Pendidikan (Jakarta: Rajawali Pers, 2009), h. 409.
31
Soenardi Djiwandono, Tes Bahasa: Pegangan Bagi Pengajar Bahasa (Jakarta: PT
Macanan Cermelang, 2008), h. 225.
24
Suatu tes dapat dikatakan memiliki kualitas yang baik, apabila melalui tahap
berfungsi sebagai pengecoh yang baik atau tidak.32 Jadi, dari keempat pendapat di
atas dapat ditarik kesimpulan bahwa analisis efektivitas pengecoh adalah suatu
metode atau cara yang dapat digunakan untuk mengetahui apakah pengecoh
dapat berfungsi dengan baik atau tidak dalam mempengaruhi peserta didik dalam
menjawab soal.
jika paling sedikit dipilih oleh 5% peserta tes.33 Hal senada diungkapkan
oleh Sudijono yang menjelaskan bahwa pengecoh dapat berfungsi dengan baik
seluruh peserta tes.34 Pendapat tersebut diperkuat oleh Basuki dan Hariyanto
apabila pengecoh tersebut minimal dipilih oleh 5% peserta tes, pengecoh yang
dikatakan berfungsi dengan baik apabila pengecoh tersebut telah dipilih oleh
32
Hamzah B. Uno dan Satria Koni, Assessment Pembelajaran (Jakarta: Bumi Aksara,
2012), h. 157.
33
Daryanto, Evaluasi Pendidikan: Komponen MKDK (Jakarta: Rineka Cipta, 2012), h. 193.
34
Anas Sudijono, Pengantar Evaluasi Pendidikan (Jakarta: Rajawali Pers, 2009), h. 411.
35
Ismet Basuki dan Hariyanto, Asesmen Pembelajaran (Bandung: PT Remaja Rosdakarya
offiset, 2014), h. 144.
25
pengecoh tidak berfungsi dengan baik maka pengecoh harus diganti atau
direvisi.
IP = 𝐏 x 100%
(𝐍−𝐁)/(𝐧−𝟏)
di mana:
IP = indeks pengecoh
1 = bilangan tetap
36
Zainal Arifin, Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur (Cet 5; Bandug: PT
Remaja Rosdakarya Offset, 2013), h. 279.
37
Zainal Arifin, Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur, h. 280
26
1) Butir soal dikatakan memiliki pengecoh yang sangat baik, apabila semua
pengecoh pada butir soal berfungsi.
2) Butir soal dikatakan memiliki pengecoh yang baik, apabila pada butir soal
3) Butir soal dikatakan memiliki pengecoh yang kurang baik, apabila pada butir
5) Butir soal dikatakan memiliki pengecoh yang sangat buruk, apabila pada butir
kesulitan, daya pembeda, dan efektivitas pengecoh pada setiap butir soal dalam
suatu tes. Namun peneliti hanya melakukan analisis kuantitatif yaitu analisis tingkat
kesulitan, daya pembeda dan efektivitas pengecoh.
Penelitian yang dilakukan oleh Hodiyanto pada tahun 2017 yang berjudul
Tujuan penelitian adalah untuk mengetahui baik atau tidaknya instrumen ditinjau
dari reabilitas soal, baik atau tidaknya butir-butir soal ditinjau dari daya pembeda
dan indeks kesulitan, serta befungsi dan tidaknya pengecoh dalam soal tersebut.
sebagai berikut: (1) realibilitas instrumen yang dibuat oleh guru tergolong kurang
baik. (2) jika dilihat dari daya pembeda butir soal, butir soal yang memiliki kriteria
baik hanya 8 soal dari 20 butir soal. (3) pengecoh tidak berfungsi dengan baik dari
20 butir soal.38
Penelitian yang dilakukan oleh Abdul Karim pada tahun 2018 yang berjudul
tingkat SMA sederajat berdasarkan analisis butir soal secara kuantitatif dan sebagai
bahan masukan untuk perbaikan soal perlombaan matematika yang akan datang
ini teknik menggumpulkan data adalah dokumen soal yang digunakan pada saat
kunci jawaban) dan lembar jawaban soal yang dikerjakan peserta. Populasi dan
sampel penelitian adalah seluruh soal dan jawaban pada kompetisi matematika yang
berjumlah 109 peserta. Hasil analisis butir soal secara kuantitatif terbagi menjadi
empat yaitu a) Ditinjau dari validitas, b) Ditinjau dari reliabilitas, c) Ditinjau dari
daya beda dan d) Ditinjau dari tingkat kesulitan. Hasil penelitian sebagai berikut
dari 50 soal yang diberikan kepada peserta lomba matematika terdapat 12% atau 6
soal yang tidak valid. Analisis butir soal kunatitatif ditinjau dari daya beda, dari 50
soal kompetisi matematika tingkat daya beda soal dapat dilihat cukup baik. Analisis
butir soal ditinjau dari tingkat kesulitan, dari 50 soal kompetisi matematika yang
38
Hodiyanto, “Analisis Butir Soal Pilihan Ganda Matematika Sekolah Menengah Pertama”,
Jurnal Buana Matematika 7, no. 2 (2017): h. 53
28
diberikan memiliki tingkat kesulitan memiliki tingkat sedang dan sukar. Analisis
butir soal ditinjau dari reliabilitas, dari 50 soal kompetisi matematika memiliki
reliabilitas yang sangat baik. Dengan demikian, soal lomba matematika yang
sudah baik walau pun ada beberapa soal yang perlu diperbaiki.39
Penelitian yang dilakukan oleh Aziz pada tahun 2016 yang berjudul
Tujuan penelitian ini adalah untuk mengetahui tingkat kesulitan, daya pembeda,
adalah jenis penelitian Terapan. Penelitian ini dilaksanakan pada Ulangan Semester
penelitian ini adalah semua siswa yang mengikuti ulangan semester II kelas Va
bidang studi matematika tahun ajaran 2013/2014. Sedangkan jumlah sampel yang
diambil dalam penelitian ini adalah sebanyak 30 siswa. Analisis data yang diajukan
analisis kuantitatif yang digunakan untuk mengolah data hasil penelitian, dalam hal
ini menganalisis data, meliputi tingkat kesulitan soal, daya pembeda soal, dan
pengecoh soal. Dari hasil penelitian analisis butir soal bidang studi matematika
dari 15% soal mudah, 85% soal sedang, dan tidak ada soal yang sukar, hal ini
menunjukkan bahwa tingkat kesulitan soal tes yang diselidiki ini termasuk kurang
Abdul Karim, “Analisis Kualitas Soal Perlombaan Matematika Tingkat SMA”, Jurnal
39
baik; 2) daya pembeda soal terdiri dari 10% soal dengan daya pembeda sangat
rendah, 20% soal dengan daya pembeda rendah, 55% soal dengan daya pembeda
cukup, 15% soal dengan daya pembeda tinggi, dan tidak ada soal yang mempunyai
daya pembeda tinggi; dan 3) pengecoh soal terdiri dari 60% memiliki pengecoh
40
Aziz, “Analisis Tes Buatan Guru Bidang Studi Matematika Kelas V SD 1 Katobengke”,
Jurnal Edumaticai 6, no. 1 (2016): h. 15
BAB III
METODE PENELITIAN
kuantitatif.
B. Lokasi Penelitian
Penelitian ini dilaksanakan di MTs Madani Alauddin Pao-pao Kabupaten
Gowa.
C. Subjek Penelitian
Subjek penelitiannya adalah semua butir soal dan lembar jawaban siswa
peserta USBN di MTs Madani Alauddin Pao-pao Kabupaten Gowa tahun ajaran
2017/2018, adapun jumlah butir soal tersebut sebanyak 35 dengan 30 butir bentuk
soal pilihan ganda dengan 4 opsi pilihan jawaban dan 5 butir bentuk soal uraian.
peneliti untuk mengumpulkan data.2 Teknik pengumpulan data dalam penelitian ini
penelitian yang berupa soal-soal beserta hasil USBN mata pelajaran matematika di
1
Suharsimi Arikunto, Prosedur Penelitian (Jakarta: Rineka Cipta, 2013), h.36
30
31
dilakukan terhadap butir soal USBN mata pelajaran matematika MTs Madani
Alauddin Pao-pao Kabupaten Gowa tahun ajaran 2017/2018 dengan teknik analisis
data kuantitatif. Peneliti menganalisis data untuk mencari tingkat kesulitan, daya
1. Tingkat Kesulitan
Tingkat kesulitan disebut juga sebagai indeks kesulitan. Soal yang memiliki
kualitas baik adalah yang tidak terlalu mudah atau tidak terlalu sulit. Daryanto
𝐵
P=
𝐽𝑆
di mana:
P = indeks kesulitan
2. Daya Pembeda
peserta didik yang berkemampuan tinggi dan yang berkemampuan rendah dalam
32
𝐵𝐴 𝐵𝐵
D= − = PA – PB
𝐽𝐴 𝐽𝐵
di mana:
D = daya pembeda
dengan benar
dengan benar
3. Efektivitas Pengecoh
tes.
3
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, h. 228.
33
IP = 𝑷 x 100%
(𝑵−𝑩)/(𝒏−𝟏)
di mana:
IP = indeks pengecoh
1 = bilangan tetap
a. Butir soal dikatakan memiliki pengecoh yang sangat baik, apabila semua
b. Butir soal dikatakan memiliki pengecoh yang baik, apabila pada butir soal
c. Butir soal dikatakan memiliki pengecoh yang kurang baik, apabila pada butir
d. Butir soal dikatakan memiliki pengecoh yang buruk, apabila pada butir soal
e. Butir soal dikatakan memiliki pengecoh yang sangat buruk, apabila pada butir
4
Zainal Arifin, Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur (Cet 5; Bandug: PT
Remaja Rosdakarya Offset, 2013), h. 279.
34
berikut:5
1) Klik “Jalankan Anates Pilihan Ganda” akan muncul tampilan berikut :
2) Pada kolom FILE, klik “Buat File Baru” untuk analisis baru, “Baca File yg
Ada” untuk membuka file tersimpan, “Keluar dari Anates” untuk keluar
program.
5
Panji Priatna, “Analisis Pilihan Ganda Menggunakan Program Anates”.
http://asyikbelajar-komputer.blogspot.com/2011/04/analisis-soal-pilihan-gandamenggunakan.html.
(2 juni 2018)
35
4) Pada Jumlah Subyek tuliskan jumlah peserta tes, jumlah soal dan jumlah
masing nama peserta tes dan jawaban peserta tes untuk masing-masing soal,
6) Entri data selesai. Kemudian pilih dan klik “Kembali Ke Menu Utama”,
36
8) Proses analisis selesai, pilih “ Cetak ke printer” jika mau langsung diprint,
10) Klik “ Keluar dari Anates” pada dialog box klik “Yes”
2) Pada kolom FILE, klik “Buat File Baru” untuk analisis baru, “Baca File yg
Ada” untuk membuka file tersimpan, “Keluar dari Anates” untuk keluar
program.
4) Pada Jumlah Subyek tuliskan jumlah peserta tes dan isi jumlah soal,
nama peserta tes dan skor yang didapatkan peserta tes tiap butirnya. Setelah
6) Entri data selesai. Kemudian pilih dan klik “Kembali Ke Menu Utama”,
39
8) Proses analisis selesai, pilih “ Cetak ke printer” jika mau langsung diprint,
10) Klik “ Keluar dari Anates” pada dialog box klik “Yes”
penentuan kualitas soal antara soal yang berkualitas baik, cukup baik, dan
1) Apabila butir soal memenuhi tiga kriteria soal yang baik yaitu tingkat
kesulitan, daya pembeda, dan efektivitas pengecoh, maka soal tersebut dapat
dikatakan soal yang baik dan dapat disimpan dalam bank soal.
2) Apabila butir soal memenuhi dua dari tiga kriteria soal yang baik yaitu tingkat
kesulitan, daya pembeda, dan efektivitas pengecoh, maka soal tersebut dapat
dikatakan soal yang cukup baik dan belum bisa disimpan dalam bank soal.
3) Apabila butir soal memenuhi satu atau bahkan tidak ada dari tiga kriteria soal
yang baik yaitu tingkat kesulitan, daya pembeda, dan efektivitas pengecoh,
maka soal tersebut dapat dikatakan soal yang tidak baik (jelek) dan tidak bisa
disimpan dalam bank soal. Soal tersebut harus direvisi sampai memenuhi tiga
kriteria atau soal tersebut dibuang dan diganti dengan soal yang baru.
BAB IV
Data pada penelitian ini diperoleh melalui penelitian yang dilakukan pada
tanggal 9 s.d. 16 Mei 2018 di MTs Madani Alauddin Pao-pao Kabupaten Gowa.
kunci jawaban soal, serta lembar jawaban siswa yang mengikuti USBN. Soal yang
digunakan adalah soal pilihan ganda berjumlah 30 butir dan 5 butir soal uraian.
Hasil yang diperoleh dari analisis butir soal USBN mata pelajaran
1. Tingkat Kesulitan
Tingkat kesulitan disebut juga sebagai indeks kesulitan. Soal yang memiliki
kualitas baik adalah yang tidak terlalu mudah atau tidak terlalu sulit. Adapun
kriteria interpretasi hasil perhitungan tingkat kesulitan soal yaitu 0,71 ≤ P ≤ 1,00
41
42
Tabel 4.1. Distribusi Frekuensi dan Persentase Tingkat Kesulitan Soal USBN
mata pelajaran matematika di MTs Madani Alauddin Pao-pao Kabupaten
Gowa tahun ajaran 2017/2018
Tabel 4.1 menunjukkan bahwa dari 35 butir soal, sebagian besar berada
pada kategori sedang karena dapat dilihat bahwa sebanyak 19 butir soal (54,29%)
dengan tingkat kesulitan soal dalam kategori sedang, 16 butir soal (45,71%) dalam
kategori sulit, dan tidak ada soal (0%) dalam kategori mudah.
2. Daya Pembeda
peserta didik yang berkemampuan tinggi dan yang berkemampuan rendah dalam
pembeda yaitu 0,40 ≤ D termasuk kategori sangat baik; 0,30 ≤ D ≤ 0,39 termasuk
kategori cukup baik; 0,20 ≤ D ≤ 0,29 termasuk kategori sedang; D ≤ 0,19 termasuk
kategori buruk.
Tabel 4.2. Distribusi Frekuensi dan Persentase Daya Pembeda Soal USBN
mata pelajaran matematika di MTs Madani Alauddin Pao-pao Kabupaten
Gowa tahun ajaran 2017/2018
Tabel 4.2 menunjukkan bahwa daya pembeda butir soal USBN mata
ajaran 2017/2018 yakni sebanyak 10 butir soal (28,57%) dengan daya pembeda soal
dalam kategori sangat baik, 6 butir soal (17,14%) dalam kategori cukup baik, 7 butir
soal (20%) dalam kategori sedang, dan 12 butir soal (34,29%) dalam kategori buruk
3. Efektivitas pengecoh
peserta tes.
sebanyak 4 opsi (4,44%) kategori buruk, dan tidak ada opsi dalam kategori sangat
buruk.
Tabel 4.3. Distribusi Frekuensi dan Persentase efektivitas pengecoh Soal Soal
USBN mata pelajaran matematika di MTs Madani Alauddin Pao-pao
Kabupaten Gowa tahun ajaran 2017/2018.
Tabel 4.3 menunjukkan bahwa dari 30 butir soal terdapat sebanyak 10 butir
(33,33%) memiliki kualitas pengecoh yang sangat baik dan tidak ada butir (0%)
yang memiliki kualitas opsi sangat buruk meskipun terdapat 9 butir (30%) soal
memiliki kualitas pengecoh yang baik, 3 butir (10%) memiliki kualitas pengecoh
yang telah diperoleh selanjutnya dianalisis untuk menentukan kualitas soal antara
soal yang berkualitas baik, cukup baik, dan tidak baik didasarkan pada beberapa
pertimbangan berikut:
45
a. Butir soal dikatakan baik jika memenuhi tiga kriteria yaitu tingkat kesulitan,
daya pembeda, dan efektivitas pengecoh, maka soal tersebut dapat dikatakan
b. Butir soal dikatakan cukup baik jika memenuhi dua dari tiga kriteria yaitu
tingkat kesulitan, daya pembeda, dan efektivitas pengecoh, maka soal tersebut
dapat dikatakan dan belum bisa disimpan dalam bank soal. Soal tersebut harus
c. Butir soal yang tidak baik (jelek) jika hanya memenuhi satu atau bahkan tidak
ada dari tiga kriteria yaitu tingkat kesulitan, daya pembeda, dan efektivitas
pengecoh, maka soal tersebut tidak bisa disimpan dalam bank soal atau
diganti dengan soal yang baru. Soal tersebut sebaiknya dibuang atau diganti
Deskripsi hasil analisis butir soal USBN mata pelajaran matematika di MTs
Tabel 4.4 Hasil Analisis Butir Soal USBN Mata Pelajaran Matematika di
MTs Madani Alauddin Pao-pao Kabupaten Gowa Tahun Ajaran 2017/2018
(25,71%) soal berkualitas baik yaitu soal nomor 1, 4, 9, 10, 14, 20, 21 dan 22 yang
berarti soal tersebut dapat dimasukkan ke bank soal untuk digunakan kembali.
Tabel di atas juga menunjukkan bahwa terdapat 11 butir (31,43%) soal berkualitas
cukup baik yaitu soal nomor 5, 7, 8, 12, 13, 19, 24, 26, 27, 28 dan 31 yang berarti
soal tersebut harus direvisi terlebih dahulu sampai memenuhi tiga kriteria kualitas
soal secara kuantitatif agar dapat digunakan kembali. Soal yang tidak baik sebanyak
15 butir (42,86%) yaitu soal nomor 2, 3, 6, 15, 16, 17, 18, 23, 25, 29, 30, 32, 33, 34
dan 35 yang berarti soal tersebut sebaiknya diganti dengan soal baru yang lebih
baik.
Tabel 4.5 Distribusi Frekuensi dan Persentase Kualitas Butir Soal USBN
mata pelajaran matematika di MTs Madani Alauddin Pao-pao Kabupaten
Gowa tahun ajaran 2017/2018
No Kategori Nomor Soal Jumlah Persentase
1 Baik 1, 4, 9, 10, 11, 14, 20, 21,22 9 25,71%
2 Cukup baik 5, 7, 8, 12, 13, 19, 24, 26, 27, 11 31,43%
28, 31
3 Tidak baik 2, 3, 6, 15, 16, 17, 18, 23, 25, 15 42,86%
(jelek) 29, 30, 32, 33, 34, 35
B. Pembahasan
2017/2018 dalam penelitian ini dengan jumlah lembar jawaban sebanyak 113
lembar dan jumlah butir soal sebanyak 35 butir soal dengan 30 butir bentuk soal
pilihan ganda dan 5 butir bentuk soal uraian memperoleh karakteristik butir soal
Mean P atau rata-rata tingkat kesulitan soal pada analisis butir soal dalam
penelitian ini adalah 36,39% atau 0,3639 yang berarti rata-rata tingkat kesulitan
soal berada pada kategori sedang. Berdasarkan pada penentuan tingkat kesulitan
soal jika 0,71 ≤ P ≤ 1,00 termasuk kategori mudah; 0,31 ≤ P ≤ 0,70 termasuk
Mean D atau rata-rata daya pembeda soal pada analisis butir soal dalam
penelitian ini adalah 30,38% atau 0,3038 yang berarti rata-rata daya pembeda soal
berada pada kategori cukup baik, artinya soal cukup mampu membedakan peserta
1
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan (Jakarta: Bumi Aksara, 2012), h.
225.
49
pada penentuan daya pembeda jika 0,40 ≤ D termasuk kategori sangat baik; 0,30 ≤
D ≤ 0,39 termasuk kategori cukup baik; 0,20 ≤ D ≤ 0,29 termasuk kategori sedang;
MTs Madani Alauddin Pao-pao Kabupaten Gowa tahun ajaran 2017/2018 sebanyak
sebanyak 27 opsi (30%) kategori baik, sebanyak 15 opsi (16,67%) kategori kurang
baik, sebanyak 4 opsi (4,44%) kategori buruk, dan tidak ada opsi dalam kategori
apabila pengecoh paling tidak dipilih oleh 5% peserta tes, pengecoh yang tidak
baik, 9 butir (30%) dalam kategori baik, dan 3 butir (10%) dalam kategori kurang
terdapat sebanyak 19 butir soal (54,29%) dengan tingkat kesulitan soal dalam
kategori sedang dan 16 butir soal (45,71%) dalam kategori sulit. Penelitian yang
2
Ismet Basuki dan Hariyanto, Asesmen Pembelajaran (Bandung: PT Remaja Rosdakarya
offiset, 2014), h. 141
3
Anas Sudijono, Pengantar Evaluasi Pendidikan (Jakarta: Rajawali Pers, 2009), h. 411.
50
dilakukan oleh Aziz pada tahun 2016 yang berjudul “Analisis Tes Buatan Guru
berdasarkan tingkat kesulitan soal terdapat 15% soal mudah, 85% soal sedang, dan
tidak ada soal yang sukar. Jika dibandingkan, kedua hasil analisis tingkat kesulitan
Salah satu analisis yang dilakukan untuk mengetahui kualitas soal adalah
analisis tingkat kesulitan soal. Soal yang baik adalah soal yang tidak terlalu sukar
dan tidak terlalu mudah.4 Selain itu, asumsi yang digunakan untuk memperoleh
kesulitan soal dapat dikatakan baik apabila memiliki proporsi kategori mudah
sebesar 30%, kategori sedang sebesar 50%, dan kategori sulit sebesar 20%.5
Ditinjau dari indeks tingkat kesulitan, soal yang baik adalah soal yang berkategori
kesulitan adalah soal yang tingkat kesulitannya sedang. Butir soal yang baik
berjumlah 19 butir yaitu nomor 1, 4, 5, 7, 8, 9, 10, 11, 12, 14, 19, 20, 21, 22, 26, 27,
28, 31 dan 35. Soal tersebut dapat dikatakan soal yang baik karena secara
keseluruhan soal-soal tersebut dijawab benar oleh 32% - 66% peserta didik dan
berada pada range tingkat kesulitan 0,31 ≤ P ≤ 0,70 yang artinya berkategori sedang.
Hal ini sesuai dengan teori bahwa soal yang baik adalah soal yang tidak terlalu
4
Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan (Jakarta: Bumi Aksara, 2012), h.
222.
5
Kunandar, Penilaian Autentik ( Jakarta : Rajawali press, 2014), h. 201.
51
mudah atau tidak terlalu sulit. Soal yang termasuk dalam kategori baik dapat
Kriteria kesimpulan kualitas butir soal yang tidak baik berdasarkan tingkat
kesulitan adalah soal yang tingkat kesulitannya berkategori sulit dan mudah. Butir
soal yang cukup baik berjumlah 16 butir (16 kategori sulit dan tidak ada kategori
mudah) yaitu nomor 2, 3, 6, 13, 15, 16, 17, 18, 23, 24, 25, 29, 32, 33 dan 34. Soal
tersebut dapat dikatakan soal yang tidak baik karena secara keseluruhan soal-soal
tersebut hanya dijawab benar oleh 11% - 28% peserta didik dan berada pada range
tingkat kesulitan 0,00 ≤ P ≤ 0,30 yang artinya berkategori sulit. Soal yang termasuk
dalam kategori tidak baik dapat dimasukkan ke bank soal dengan syarat soal
kualitas butir soal USBN mata pelajaran matematika di MTs Madani Alauddin Pao-
termasuk soal yang kurang baik karena dari 35 butir soal sebanyak 16 butir
(45,29%) sulit, 19 butir (54,29%) kategori sedang dan tidak ada kategori mudah.
2. Daya Pembeda
Berdasarkan hasil analisis daya pembeda butir soal USBN mata pelajaran
terdapat sebanyak 10 butir soal (28,57%) dengan daya pembeda soal dalam kategori
sangat baik, 6 butir soal (17,14%) dalam kategori cukup baik, 7 butir soal (20%)
52
dalam kategori sedang, dan 12 butir soal (34,29%) dalam kategori buruk. Penelitian
yang dilakukan oleh Abdul Karim pada tahun 2018 yang berjudul “Analisis
soal kompetisi matematika tingkat daya beda soal dapat dilihat cukup baik. Jika
Analisis terhadap butir soal untuk membedakan peserta didik yang mampu
dan yang kurang mampu dalam mengerjakan suatu tes adalah dengan menggunakan
prestasi yang tinggi dan peserta didik yang memiliki prestasi yang rendah.6 Jadi
dapat dikatakan bahwa soal yang memiliki daya pembeda cukup sebaiknya direvisi,
dan soal yang daya pembedanya buruk haruslah diganti agar dapat membedakan
adalah soal dengan daya pembeda baik atau sangat baik. Butir soal yang baik
berjumlah 10 butir yaitu nomor 1, 8, 19, 21, 22, 27, 31, 32, 33 dan 34. Soal tersebut
dikatakan berkategori baik karena berada pada indeks diskriminan D ≥ 0,40 yang
artinya memiliki daya pembeda baik. Soal tersebut dapat membedakan peserta didik
yang memilik kemampuan rendah dan yang memiliki kemampuan tinggi. Soal yang
6
Nana Sudjana, Penilaian Hasil Proses Belajar Mengajar (Bandung: PT Remaja
Rosdakarya, 2009), h. 141.
53
pembeda adalah soal dengan daya pembeda cukup baik atau sedang. Butir soal yang
cukup baik berjumlah 13 butir ( 6 butir kategori cukup baik dan 7 butir kategori
sedang) yaitu nomor 2, 4, 5, 7, 9, 10, 11, 12, 13, 14, 20, 24 dan 35. Soal tersebut
dikatakan berkategori baik karena berada pada indeks diskriminan 0,20 ≤ D ≤ 0,39
yang artinya memiliki daya pembeda cukup baik. Soal yang termasuk kategori
cukup baik dapat dimasukkan ke bank soal dengan syarat soal tersebut sudah
direvisi.
Kriteria kesimpulan kualitas soal yang tidak baik (jelek) berdasarkan daya
pembeda adalah soal dengan daya pembeda buruk. Butir soal yang tidak baik (jelek)
berjumlah 12 butir yaitu nomor 3, 6, 15, 16, 17, 18, 23, 25, 26, 28, 29 dan 30. Soal
tersebut dikatakan berkategori baik karena berada pada indeks diskriminan D ≤ 0,19
yang artinya memiliki daya pembeda buruk. Soal tersebut tidak dapat membedakan
peserta didik yang memilik kemampuan rendah dan yang memiliki kemampuan
tinggi. Soal yang termasuk dalam kategori jelek sebaiknya dibuang dan diganti
kualitas butir soal USBN mata pelajaran matematika di MTs Madani Alauddin Pao-
termasuk soal yang cukup baik karena dari 35 butir soal sebanyak 10 butir (25,57%)
berkategori baik, 13 butir (37,14%) berkategori cukup baik dan 12 butir (34,29)
3. Efektivitas Pengecoh
Berdasarkan hasil analisis efektivitas pengecoh butir soal soal USBN mata
butir soal terdapat sebanyak 10 butir (33,33%) dalam kategori sangat baik, 9 butir
(30%) dalam kategori baik, dan 3 butir (10%) dalam kategori kurang baik dan 8
butir (26,67%) kategori buruk. Penelitian yang dilakukan oleh Aziz pada tahun
2016 yang berjudul “Analisis Tes Buatan Guru Bidang Studi Matematika Kelas V
60% memiliki pengecoh yang baik dan 30% tidak memilikih pengecoh yang baik.
soal yang memiliki pengecoh baik lebih banyak daripada soal yang memiliki
pengecoh buruk.
Suatu tes dapat dikatakan memiliki kualitas yang baik, apabila melalui tahap
pengecoh adalah soal yang dalam kategori baik atau sangat baik. Butir soal yang
baik berjumlah 19 butir (10 butir sangat baik dan 9 butir baik) yaitu nomor 1, 3, 4,
7
Hamzah B. Uno dan Satria Koni, Assessment Pembelajaran (Jakarta: Bumi Aksara,
2012), h. 157.
55
6, 9, 10, 11, 13, 14, 15, 16, 20, 21, 22, 23, 24, 25, 26 dan 28. Soal tersebut dapat
dikatakan baik karena semua pengecohnya berfungsi dengan baik. Soal yang
pengecoh adalah soal yang dalam kategori kurang baik. Butir soal yang cukup baik
berjumlah 3 butir yaitu nomor 5, 12, dan 27. Soal tersebut dapat dikatakan cukup
baik karena memiliki dua pengecohnya yang berfungsi. Soal yang termasuk dalam
kategori cukup baik dapat dimasukkan ke bank soal dengan syarat soal tersebut
sudah direvisi.
efektivitas pengecoh adalah soal dengan efektivitas pengecoh buruk atau sangat
buruk. Butir soal yang tidak baik berjumlah 8 butir yaitu nomor 2, 7, 8, 17, 18, 19,
29 dan 30. Soal tersebut dapat dikatakan tidak baik karena semua pengecohnya
tidak berfungsi. Soal yang termasuk dalam kategori jelek sebaiknya dibuang dan
butir soal USBN mata pelajaran matematika di MTs Madani Alauddin Pao-pao
termasuk soal yang baik karena dari 30 butir soal sebanyak 19 butir (63.33%)
berkategori baik, 3 butir (10%) berkategori cukup baik dan 8 butir (26,67%)
4. Kualitas Soal
a. Kualitas baik
Kabupaten Gowa tahun ajaran 2017/2018 yang berkualitas baik sebanyak 9 soal
yaitu soal nomor 1, 4, 9, 10, 11, 14, 20, 21 dan 22. Sebagai sampel, peneliti
mengambil contoh soal nomor 1 di bawah ini:
A. 346 C. -334
B. 334 D. -346
Soal ini memiliki tingkat kesulitan 0,6637 dan daya pembeda 0,5806.
Dimana 0,6637 termasuk dalam kategori kesulitan soal sedang yaitu berada pada
0,31 ≤ P ≤ 0,70 dan 0,5806 termasuk dalam kategori daya pembeda sangat baik
yaitu berada pada D ≥ 40. Berdasarkan teori bahwa soal yang berkualitas baik
adalah soal yang tidak terlalu mudah atau tidak terlalu sulit. Berarti, soal ini
memiliki tingkat kesulitan yang baik. Soal ini juga memiliki pengecoh yang
berfungsi dengan baik. Berdasarkan uraian di atas dapat disimpulkan bahwa soal
nomor 1 berkualitas baik karena telah memenuhi tiga kriteria yaitu tingkat kesulitan
sedang, daya pembeda sangat baik dan pengecoh yang berfungsi dengan baik.
soal yaitu soal nomor 5, 7, 8, 12, 13, 19, 24, 26, 27, 28 dan 31. Sebagai sampel,
A. (x -5) (x – 7) C. (x – 7) (x + 2)
B. (x -5) (x – 2) D. (x + 7) (x – 2)
Soal ini memiliki tingkat kesulitan 0,3628 dan daya pembeda 0,6774.
Dimana 0,3628 termasuk dalam kategori kesulitan soal sedang yaitu berada pada
0,31 ≤ P ≤ 0,70 dan 0,6774 termasuk dalam kategori daya pembeda sangat baik
yaitu berada pada D ≥ 40. Berdasarkan teori bahwa soal yang berkualitas baik
adalah soal yang tidak terlalu mudah atau tidak terlalu sulit. Berarti, soal ini
memiliki tingkat kesulitan yang baik. Namun soal nomor 8 ini memiliki dua
bahwa soal nomor 8 berkualitas cukup baik karena telah memenuhi dua kriteria
yaitu tingkat kesulitan sedang, daya pembeda sangat baik. Sehingga soal nomor 8
belum bisa disimpan di bank soal. Soal tersebut harus direvisi sampai memenuhi
Kabupaten Gowa tahun ajaran 2017/2018 yang berkualitas tidak baik sebanyak 15
58
soal yaitu soal nomor 2, 3, 6, 15, 16, 17, 18, 23, 25, 29, 30, 32, 33, 34 dan 35.
d.
Sebuah benda berbentuk belahan bola, dengan panjang diameter 18
e. Volume benda tersebut adalah….
cm.
f.
A. 162 π cm3 C. 486 π cm3
g.
B. 324 π cm3 D. 972 π cm3
Soal ini memiliki tingkat kesulitan 0,22 dan daya pembeda 0,19. Dimana
0,22 termasuk dalam kategori kesulitan soal sulit yaitu berada pada 0,00 ≤ P ≤ 0,30
dan 0,19 termasuk dalam kategori daya pembeda buruk yaitu berada pada 0,19 ≥ D.
Berdasarkan teori bahwa soal yang berkualitas baik adalah soal yang tidak terlalu
mudah atau tidak terlalu sulit. Berarti, soal tersebut termasuk soal yang kurang baik.
Soal nomor 18 ini juga memiliki dua pengecoh yang tidak berfungsi. Berdasarkan
uraian di atas dapat disimpulkan bahwa soal tersebut berkualitas tidak baik karena
tidak memenuhi kriteria soal baik. Sehingga harus direvisi sampai memenuhi
PENUTUP
A. Kesimpulan
Berdasarkan hasil analisis dan pembahasan yang telah diutarakan pada bab
adalah:
yang kurang baik karena dari 35 butir soal sebanyak 16 butir (45,29%)
kategori sulit, 19 butir (54,29%) kategori sedang dan tidak ada kategori
mudah. Hal ini tidak sesuai dengan proporsi tingkat kesulitan soal.
yang cukup baik karena dari 35 butir soal sebanyak 10 butir (25,57%)
yang baik karena dari 30 butir soal sebanyak 19 butir (63.33%) berkategori
baik, 3 butir (10%) berkategori cukup baik dan 8 butir (26,67%) berkategori
59
60
B. Implikasi Penelitian
1. Sebagai bahan rujukan kepada pihak sekolah maupun guru (tim pembuat soal
2. Sebagai gambaran kepada pihak sekolah maupun guru bahwa sangat penting
melakukan evaluasi terhadap soal yang akan atau yang sudah digunakan
belajarnya.
C. Saran
melalui pelaksanaan penelitian ini, maka terdapat beberapa saran yang dapat
a. Butir soal yang berkualitas baik dapat dimasukkan ke bank soal untuk dapat
digunakan kembali, butir soal yang kurang baik sebaiknya direvisi dan
kuantitatif maupun kualitatif. Sedangkan soal yang tidak baik sebaiknya diganti
seperti melakukan uji coba dan analisis soal baik sebelum maupun sesudah
membuat soal dengan benar, belajar menganalisis soal sesuai dengan prosedur
pembuatan soal agar di masa yang akan datang kualitas soal yang dibuat lebih
baik lagi.
dalam membuat soal ujian akhir sekolah, sehingga soal yang dihasilkan akan
lebih baik.
guru-guru
serta pelatihan analisis butir soal dengan benar agar guru-guru dalam
mengembangkan soal di masa yang akan datang dapat lebih mudah lagi.
penelitian yang berkaitan dengan evaluasi butir soal agar tinjauan teoritis
DAFTAR PUSTAKA
Priatna, Panji “Analisis Pilihan Ganda Menggunakan Program Anates”, Blog Panji
Priatna. http://asyikbelajar-komputer.blogspot.com/2011/04/analisissoal-
pilihanganda menggu nakan.html.(2 juni 2018)
Purwanto. Evaluasi Hasil Belajar. Yogyakarta: Pustaka Pelajar, 2011.
Ratnawulan, Elis dan Rusdiana. Evaluasi Pembelajaran, dengan pengantar
Sutaryat Trisnamansyah. Bandung: Pustaka Setia, 2014.
Sudijono, Anas. Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Pers, 2009.
Sudjana, Nana. Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja
Rosdakarya, 2009.
Surapranata, Sumarna. Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes
Implementasi Kurikulum 2004. Bandung: PT Remaja Rosdakarya, 2006.
Widoyoko, SEP. Evaluasi Program Pembelajaran: Panduan Praktis Bagi Pendidik
Dan Calon Pendidik. Yogyakarta: Pustaka Pelajar, 2009.
www.pendis.kemenag.go.id/file/dokumen/uuno20th2003ttgsisdiknas.pdf (3 oktober
2017)
64
LAMPIRAN
65
TINGKAT KESUKARAN
No Btir Baru No Btir Asli Kel. Atas Kel.Bawah Beda Indeks DP (%)
1 1 28 10 18 58.06
2 2 12 1 11 35.48
3 3 7 9 -2 -6.45
4 4 22 13 9 29.03
5 5 16 7 9 29.03
6 6 2 3 -1 -3.23
7 7 14 6 8 25.81
8 8 23 2 21 67.74
9 9 14 5 9 29.03
10 10 18 8 10 32.26
11 11 19 7 12 38.71
12 12 14 6 8 25.81
13 13 15 6 9 29.03
14 14 24 12 12 38.71
15 15 6 6 0 0.00
16 16 4 0 4 12.90
17 17 5 5 0 0.00
18 18 10 4 6 19.35
19 19 25 10 15 48.39
20 20 24 13 11 35.48
21 21 24 6 18 58.06
22 22 24 5 19 61.29
23 23 7 2 5 16.13
24 24 11 4 7 22.58
25 25 9 4 5 16.13
26 26 22 18 4 12.90
27 27 30 15 15 48.39
28 28 10 5 5 16.13
29 29 10 6 4 12.90
30 30 5 3 2 6.45
Keterangan:
** : Kunci Jawaban
++ : Sangat Baik
+ : Baik
- : Kurang Baik
-- : Buruk
---: Sangat Buruk
68
RIWAYAT HIDUP
menyandang gelar Sarjana Pendidikan. Selama kuliah pernah menjadi bagian dari
2015/2016, dan 2016/2017. Selain itu, pernah bergabung di salah satu Lembaga
Dakwah Fakultas Tarbiyah dan Keguruan LDF Al Uswah dan bergabung juga di