296 1064 2 PB
296 1064 2 PB
Abstract
This research aimes to describe the characteristic of UAS items theme 1 at
the fourth grade of Primary School in Paramasan bawah village according
to the item difficulties and discrimination. The sample of this research was
37 students who took the final examination year academic 2018/2019. The
objects of this research were question items and the answer sheet of the
final exam that obtained from 3 different schools in Paramasan Bawah
village. The data analysis technique used in this research was empirical
analysis helped by Bilog and Iteman program application. This analysis
used to know the characteristic of items based on the Item Response Theory
and Classical Test Theory. The result of this research showed the
characteristic of UAS items, according to item response theory, 30 items
had a good discrimination and 33 items had a good item difficulty, while
according to Classical Test Theory: 15 items had a good discrimination and
27 items had a good item difficulty.
PENDAHULUAN
Kegiatan evaluasi selalu menjadi bagian yang sangat krusial untuk menentukan
apakah aktivitas yang telah dilakukan berhasil atau tidak (Mansyur & Harun, 2015).
Evaluasi merupakan salah satu rangkaian kegiatan dalam meningkatkan kualitas, kinerja
atau produktivitas suatu lembaga dalam melaksanakan programnya (Mardapi, 2012).
Pengukuran merupakan suatu langkah atau tindakan yang harus diambil untuk
melaksanankan evaluasi. Dikatakan harus diambil karena semua tindakan evaluasi harus
didahului oleh kegiatan pengukuran. Pengukuran merupakan proses pemberian angka yang
1
Didaktika Jurnal Kependidikan, Fakultas Tarbiyah IAIN Bone, Vol. 13, No. 1, Juni 2019
diharapkan dapat menunjukkan kemampuan peserta didik mengenai suatu mata pelajaran
(Mardapi, 2012). Oleh karena itu didalam praktik, masalah pengukuran mempunyai
kedudukan sangat penting didalam proses evaluasi.
Pada proses pengukuran, dibutuhkan alat ukur. Alat ukur inilah yang memberikan
informasi tentang posisi seseorang dalam atribut yang diukur sehingga, untuk memperoleh
hasil pengukuran yang dapat menggambarkan hasil pengukuran sebenarnya dibutuhkan alat
ukur dengan tingkat validitas dan reliabilitas yang tinggi. Sejalan dengan itu, (Saifuddin,
2002) mengatakan bahwa instrumen yang baik adalah instrumen yang mampu menghasilkan
data dan memberikan informasi yang akurat agar informasi yang diperoleh dari hasil
pengukuran menggambarkan kemampuan peserta didik yang sebenarnya.
Secara umum dalam mengukur prestasi belajar siswa digunakan instrument tes.
(Allen & Yen, 1979) menyebut tes sebagai “a test is device for optaining a sample of an
indifidual’s behavior”. Hal yang hampir sama juga dikemukakan oleh (Mardapi, 2012)
mengatakan bahwa tes merupakan salah satu bentuk instrumen yang digunakan untuk
melakukan pengukuran, yaitu mengumpulkan informasi karakteristik suatu objek. Ahli
pengukuran yang lain, (Widoyoko, 2012) mengatakan bahwa tes dapat diartikan sebagai
sejumlah pertanyaan yang harus diberikan tanggapan dengan tujuan untuk mengukur tingkat
kemampuan seseorang atau mengungkap aspek tertentu dari orang yang dikenai tes”.
Soal ujian akhir semester merupakan salah satu bentuk instrument tes yang
mengukur pencapaian pembelajaran di sekolah baik terhadap peserta didik maupun terhadap
guru. Hasil ujian akhir semester menggambarkan pencapaian ketuntasan standar kompetensi
peserta didik dan kualitas pembelajaran yang diterapkan oleh guru sehingga instumen tes
yang digunakan harus memiliki karakteristik butir yang baik serta representatif dalam
mengukur setiap aspek pencapaian peserta didik yang sebenarnya.
Dalam membuat soal ujian akhir semester bukanlah perkara mudah bagi guru
mengingat tingkat pengetahuan guru dalam membuat dan mengembangkan soal sangat
beragam. Diperlukan analisis butir soal dengan tingkat validitas dan reliabilitas yang baik,
sehingga komposisi soal mudah, sedang dan sukar menyebar secara proporsional sesuai
dengan materi pelajaran yang diujikan.
Soal yang baik akan dapat menyeleksi secara alamiah peserta didik yang cerdas dan
peserta didik kurang cerdas melalui hasil evaluasi belajar peserta didik. Hasil Penelitian
yang dilakukan oleh (Sarea & Hadi, 2015) mengatakan bahwa terdapat sekolah dengan
kualitas soal ujian akhir semester (UAS) yang baik sebanyak 7,14%. Hal ini
menggambarkan bahwa dalam pembuatan soal ujian akhir semester (UAS) bukanlah hal
yang mudah sehingga perlu untuk diketahui karakteristiknya.
Karakteristik butir soal meliputi tingkat kesukaran butir soal yang baik dengan
komposisi soal mudah, sedang dan sukar menyebar secara proporsional sesuai dengan
materi pelajaran yang diujikan dan indeks daya beda butir soal yang baik mampu untuk
membedakan antara kelompok peserta didik berkemampuan tinggi dengan kelompok peserta
didik berkemampuan rendah, sehingga hasil evaluasi belajar peserta didik akan
menggambarkan hasil belajar peserta didik yang sebenarnya. Terdapat 2 pendekatan yang
dapat digunakan untuk melihat karakteristik butir soal yaitu Classical Test Teory (CTT) dan
Item Respon Teory (IRT).
Menurut (Hambleton & Jones, 1993) “Classical test models are often referred to
as "weak models" because the assumptions of these models are fairly easily met by test
data”. Teori tes klasik mempunyai bebarapa asumsi. Pertama, instrumen hanya satu
dimensi. Kedua, skor kesalahan pengukuran tidak berinteraksi dengan skor sebenarnya.
Ketiga, skor kesalahan tidak berkorelasi dengan skor sebenarnya dan skor-skor kesalahan
pada tes yang lain untuk peserta tes yang sama. Keempat, rata-rata skor kesalahan
sama dengan nol. Asumsi tersebut dijadikan dasar untuk mengembangkan rumus
yang digunakan untuk menghitung reliabilitas tes.
Reliabilitas dapat diartikan sebagai keajegan atau konsistensi hasil
pengukuran atau hasil tes yang dilakukan pada waktu yang berbeda pada subjek yang
sama. (Allen & Yen, 1979) menyatakan bahwa tes disebut reliabel jika skor amatan
mempunyai korelasi yang tinggi dengan skor yang sebenarnya. Reliabilitas merupakan
koefisien korelasi antara dua skor amatan yang diproleh dari hasil pengukuran
menggunakan tes yang paralel.
Penentuan harga reliabilitas suatu tes dapat digunakan beberapa cara dan
formula. Furmula yang sering digunakan adalah Formula belah dua, alpha Cronbach,
Guttman, Fl anagan, Raju, dan paralel. Nilai hasil perhitungan dari formula tersebut
sering dikatakan sebagai koefisien reliabilitas. Besarnya indeks keandalan yang diterima
adalah minimal 0,70. Besarnya indeks reliabilitas menyatakan besar kesalahan pengukuran.
Semakin besar indeks reliabilitas maka akan semakin kecil kesalahan pengukuran, demikian
sebaliknya (Mardapi, 2012)
Sayangnya, seperti diungkapkan (Saifuddin, 2002) bahwa teori tes klasik memiliki
keterbatasan yang mendasar yaitu hasil estimasi parameter tergantung pada karakteristik
peserta ujian (gruop dependent). Hal ini berimplikasi pada tingkat kesukaran soal akan
menjadi rendah jika tes diujikan pada kelompok peserta tes berkemampuan tinggi dan
sebaliknya jika tes diujikan pada peserta dengan kemampuan rendah maka tingkat kesukaran
tes itu akan tinggi. Kedua hasil estimasi kemampuan peserta tergantung pada karakterisktk
butir soal (item dependent). Keterbatasan ini menyebabkan estimasi kemampuan peserta
akan rendah jika soal yang diberikan berada di atas kemampuannya. Sebaliknya, estimasi
kemampuan peserta akan tinggi bila soal yang diujikan berada dibawah tingkat
kemampuannya.
Mengatasi kelemahan pada teori tes klasik, maka para ahli pengukuran
mengembangkan model yang tidak terikat dengan sampel (sample free). Model ini
selanjutnya dikenal tes modern atau tes respon butir. Menurut teori respon butir, perilaku
seseorang dapat dijelaskan oleh karakteristik orang yang bersangkutan sampai pada batas-
batas tertentu (Mardapi, 2012)
measurement instrumen have the same standing on the underlying construct that is
measured”. Kemampuan seseorang tidak akan berubah hanya karena mengerjakan tes
yang berbeda tingkat kesulitannya dan parameter butir tes tidak akan berubah hanya
karena diujikan pada kelompok peserta tes yang berbeda tingkat kemampuannya.
METODE PENELITIAN
Penelitian ini merupakan jenis penelitian deskriptif kuantitatif dengan data berupa
perangkat soal UAS dan lembar jawaban peserta didik Kelas IV Tema 1 Sekolah Dasar.
Penelitian ini bertujuan untuk mengetahui karakteristik soal UAS Kelas IV Tema 1 Sekolah
Dasar tahun pelajaran 2018/2019 di Desa Paramasan Bawah. Respon peserta didik dianalisis
secara empiris berdasarkan pendekatan teori tes klasik dan teori respon butir untuk menguji
kelayakan butir soal. Penelitian dilaksanakan pada bulan november sampai dengan Januari
2019 di desa paramasan bawah Kabupaten Banjar Provinsi Kalimantan Selatan
Subjek penelitian ini adalah 37 peserta didik yang mengikuti UAS semester gasal
tema satu tingkat sekolah dasar (SD) tahun pelajaran 2018/2019 di desa paramasan bawah.
Objek penelitian ini adalah perangkat soal dan seluruh lembar jawaban UAS yang diperoleh
dari 3 sekolah di desa paramasan bawah. Lembar jawaban peserta didik akan dianalisis
untuk melihat karakteristik soal UAS semester gasal tema satu kelas IV Sekolah dasar (SD)
di desa paramasan bawah tahun pelajaran 2018/2019 bedasarkan tabel 1
Berdasarkan kriteria di atas maka diperoleh data hasil analisis menggunakan program
Bilog pada model 2 parameter seperti pada tabel 3 berikut.
Tabel 3. Karakteristik butir Soal Berdasarkan Teori Respon Butir Model 2 Parameter
Berdasarkan tabel 3 di atas, diketahui bahwa untuk Tingkat kesukaran butir (b) dari
41 butir yang dianalisis, yang dikategorikan butir yang baik sebanyak 33, sedangkan yang
dikategorikan butir dengan tingkat kesukaran tidak baik sebanyak 8 butir dan indeks daya
beda (a) dari 41 butir yang dianalisis, yang dikategorikan butir yang baik sebanyak 30
sedangkan yang dikategorikan indeks daya beda tidak baik sebanyak 11 butir. Kesesuaian
butir (fit model) dari 41 butir yang dianalisis, yang dikategorikan butir yang fit dengan
model sebanyak 37, sedangkan yang dikategorikan butir tidak fit dengan model sebanyak 4
butir .
Berdasarkan pendekatan Teori Respon Butir, untuk menganalisis karakteristik soal
secara empiris digunakan bantuan program Bilog. Hasil analisis program bilog untuk soal
UAS Sekolah Dasar Kelas IV Tema 1 di Desa Paramasan Bawah sesuai dengan Tabel 4
Tabel 4. Karakteristik Butir Soal berdasarkan Kriteria Tingat Kesukaran dan Daya
beda
Daya beda 30 11
Tingkat Kesukaran 33 8
Fit terhadap Model 37 4
Berdasarkan tabel 4 menunjukkan bahwa daya beda butir yang baik sebanyak 30
butir soal antara lain 1, 3, 8, 11, 15, 21, 22, 23, 24, 25, 26, 27, 30, 31, 32, 33, 34, 35, 36, 37,
39, 40, 41, 42, 43, 44, 45, 47, 49, 50 sedangkan butir tidak baik sebanyak 11 butir antara lain
5, 6, 9, 10, 14, 16, 18, 19, 28, 46, 48 dari 41 butir yang dianalisis. Tingkat kesukaran butir
yang baik sebanyak 33 antaralain 3, 5, 8, 11, 15,18, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32,
33, 34, 35, 36, 37, 39, 40, 41, 42, 43, 44, 45, 47, 48, 49, 50 Sedangakan butir dengan tingkat
kesukaran yang tidak baik antara lain 1, 6, 9, 10, 14, 16, 19, 46.
Adapun kemampuan peserta didik berdasarkan analisis menggunakan program Bilog
terdapat pada tabel 5.
Tabel 6 menunjukkan bahwa soal UAS Kelas IV Tema 1 Sekolah Dasar yang
dikategorikan baik menurut tingkat kesukarannya sebanyak 27 butir soal, sedangkan
menurut daya pembeda butir soal yang dikategorikan baik sebanyak 15 butir soal dari 50
butir soal yang di analisis.
Adapun indek daya beda butir yang dikategorikan baik antara lain: 3, 8, 22, 23, 24,
26, 27, 30, 31, 32, 40, 43, 44, 45, 47 sedangkan butir yang memiliki indeks daya beda yang
dikategorikan tidak baik antara lain: 1, 2, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19,
20, 21, 25, 28, 29, 33, 34, 35, 36, 37, 38, 39, 41, 42, 46, 48, 49, 50. Tingkat kesukaran butir
yang baik sebanyak 27 antaralain 5, 8, 11, 15, 18, 20, 21, 22, 23, 24, 25, 26, 27, 30, 31, 32,
34, 35, 36, 37, 39, 40, 41, 43, 44, 45, 50 Sedangakan butir dengan tingkat kesukaran yang
tidak baik antara lain 1, 2, 3, 4, 6, 7, 9, 10, 12, 13, 14, 16, 17, 19, 28, 29, 33, 38, 46, 47, 48,
49.
KESIMPULAN
Berdasarkan hasil dan pembahasan diatas, maka dapat disimpulkan:
1. Tingkat kesukaran butir soal yang dikategorikan baik berdasarkan teori respon butir
sebanyak, 33 butir soal. Indeks Daya beda yang dikategotikan baik berdasarkan Teori
Respon Butir Sebanyak 30 butir soal.
2. Tingkat kesukaran butir soa yang dikategorikan baik berdasarkan teori tes klasik
sebanyak 27 butir soal. Indeks Daya beda yang dikategotikan baik berdasarkan Teori
Tes Klasik sebanyakt 15 Butir.
DAFTAR PUSTAKA
Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. Belmont, CA:
Wadsworth. Inc.[Context Link].
Hambleton, R. K., & Jones, R. W. (1993). An NCME instructional module on: Comparison
of classical test theory and item response theory and their applications to test
development. Educational Measurement: Issues and Practice, 12(3), 38–47.
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response
theory. Sage.
Liang, T., Wells, C. S., & Hambleton, R. K. (2014). An assessment of the nonparametric
approach for evaluating the fit of item response models. Journal of Educational
Measurement, 51(1), 1–17.
Mansyur, S., & Harun, R. (2015). Asesmen pembelajaran di sekolah: Panduan bagi guru dan
calon guru. Yogyakarta: Pustaka Pelajar.
Mardapi, D. (2012). Pengukuran penilaian dan evaluasi pendidikan. Yogyakarta: Nuha
Medika.
Naga, D. S. (1992). Pengantar teori sekor pada pengukuran pendidikan. Jakarta:
Gunadarma.
Retnawati, H. (2014). Teori respons butir dan penerapannya: Untuk peneliti, praktisi
pengukuran dan pengujian, mahasiswa pascasarjana. Yogyakarta: Nuha Medika.
Saifuddin, A. (2002). TES PRESTASI fungsi dan pengembangan pengukuran prestasi
belajar. Yogyakarta: Pustaka Pelajar Offset.
Sarea, M. S. (2018). Karakteristik Soal Ujian Akhir Semester Pendidikan Agama Islam Dan
Budi Pekerti Tingkat Sekolah Dasar. An-Nahdhah, 11(2), 303–318.
Sarea, M. S., & Hadi, S. (2015). Analisis Kualitas Soal Ujian Akhir Semester Mata
Pelajaran Kimia SMA di Kabupaten Gowa. Jurnal Evaluasi Pendidikan, 3(1), 35–43.
Schulz, W., & Fraillon, J. (2011). The analysis of measurement equivalence in international
studies using the Rasch model. Educational Research and Evaluation, 17(6), 447–464.
Sumintono, B., & Widhiarso, W. (2014). Aplikasi model Rasch untuk penelitian ilmu-ilmu
sosial (edisi revisi). Trim Komunikata Publishing House.
van der Linden, W. J., & Hambleton, R. K. (2013). Handbook of modern item response
theory. Springer Science & Business Media.
Widoyoko, E. P. (2012). Teknik penyusunan instrumen penelitian. Yogyakarta: Pustaka
Pelajar, 15, 22.