Studi Komparasi antara Tes Testlet dan Uraian dalam Mengukur Hasil Belajar
Kognitif Siswa Kelas XI SMA Negeri 1 Gombong
Abstract
The purpose of the research is to find out does the testlet test can work as a essay test. This research is an
explorative research done to investigate a relatively new phenomenon. In accordance with the research itself,
research design used is the One Group Posttest Only Design. Sample is don randomly (Random Sampling).
The research is done in SMA Negeri 1 Gombong with the subject of the study is the students of XI MIPA 4
and XI MIPA 6. Based on the research’s result with the t-test analysis, showed that t-value= 1.85 for the XI
MIPA 4 students and t-value= 1.89 for the XI MIPA 6 students, with t-table= 1.99. Therefore, from both of
the research sample classes, the t-value is lesser that the t-table, so the conclusion is that there is no difference
in the students’ cognitive learning outcome evaluated using testlet test and essay test, so testlet test can work
as essay test.
testlet dapat berfungsi sebagaimana tes uraian. Instrumen yang digunakan berupa tes
apakah tes testlet mampu mengukur kemampuan bentuk testlet dan uraian. dalam hal ini soal
siswa seperti halnya tes uraian. Apakah bentuk testlet dirancang secara dependen
kemampuan siswa akan sama apabila diukur berdasarkan langkah pengerjaan pada jawaban
dengan tes testlet mampu tes uraian. soal uraian, sehingga antara soal pendukung
dalam satu bendel soal testlet saling berkaitan.
METODE PENELITIAN Kedua bentuk tes disusun dengan indikator yang
sama dan dihasilkan 7 butir soal dalam bentuk
Penelitian ini merupakan penelitian uraian. Dari 7 butir soal uraian tersebut disusun
eksploratif. Prasetya & Lina (2005: 41) dalam bentuk testlet yang menghasilkan 40 butir
menyatakan, penelitian eksploratif dilakukan soal pilihan ganda yang terbagi menjadi 7 bendel
untuk menggali suatu gejala yang relative masih soal testlet dengan 7 butir soal utama dan
baru. Rancangan penelitian yang digunakan beberapa soal pendukung tiap bendel testlet.
adalah One Group Posttest Only Design. Rincian butir soal pendukung tiap bendel soal
Pengambilan sampel dilakukan secara acak testlet adalah sebagai berikut: 4 soal pendukung
(Random Sampling) dimana seluruh anggota untuk bendel soal testlet nomor 1, 2, 4 dan 7.
populasi memiliki kesempatan yang sama untuk Sementara untuk bendel soal nomor testlet 3
terpilih menjadi subjek penelitian. Penelitian terdiri dari 3 soal pendukung, sedangkan bendel
dilakukan di SMA Negeri 1 Gombong dengan soal testlet nomor 5 terdiri dari 6 soal pendukung
subjek penelitian kelas XI MIPA 4 dan XI MIPA 6 dan 10 soal pendukung untuk bendel soal testlet
tahun ajaran 2016/2017. nomor 6. Contoh penyusunan butir soal uraian
dan butir soal testlet dapat dilihat pada Tabel 1.
Tabel 1. Contoh Penyusunan Testlet Berdasarkan JawabanPada Soal Uraian
Tes Uraian Jawaban TesTestlet
Sebuah piringan Memahami Masalah : Soal pokok
bermassa M = 100 kg Diketahui : Sebuah piringan bermassa M = 100 kg
dengan jari-jari R = 2,0 𝑀 = 100 kg, 𝑚 = 50 kg dengan jari-jari R = 2,0 m, berputar
m, berputar terhadap 𝑅 = 2 m, 𝜔1 = 2 rad/s terhadap pusat massanya dengan
pusat massanya Ditanyakan: kecepatan sudut konstan 2rad/s. Seorang
dengan kecepatan a. Momen inersia sistem anak dengan massa m 50 kg melompat
sudut konstan 2 rad/s. anak dan piringan kedalam piringan dan mendarat pada
Seorang anak dengan Melaksanakan posisi 1,0 m dari sumbu putar. Anggap anak
massa m 50 kg Penyelesaian Masalah sebagai benda titik.
melompat kedalam a. Momen inersia piringan Integrasi Testlet
piringan dan mendarat =
1
𝑀𝑅2 1.1. Perhatikan pernyataan berikut:
2
pada posisi 1,0 m dari 1 1. Massa anak adalah 50 kg
sumbu putar. Anggap = . 100 (2)2 2. Massa piringan adalah 100 kg
2
anak sebagai benda = 200 kgm2 3. Berat anak adalah 50 kg
titik. 4. Berat piringan 100 kg
a. Hitung momen inersia Momen inersia system 5. Jari-jari piringan adalah 2 m
sistem tersebut = 𝐼𝑝𝑖𝑟𝑖𝑛𝑔𝑎𝑛 + 𝐼𝑎𝑛𝑎𝑘 6. Kecepatan sudut awal piringan
(piringan dan anak) 1 (𝜔0 ) adalah 2 rad/s
b. . . . = 𝑀𝑅2 + 𝑀𝑅2 berdasarkan pernyataan di atas
2
1 besaran-besaran yang nilainya
= . 100 (2)2 + 50 (1)2
2 diketahui dalam soal adalah ....
= 200 + 50 a. 1,2,3 dan 4 d. 3,4, 5, dan 6
= 250 kgm2
25
Murti / Unnes Physics Education Journal 7 (1) (2018)
Dari soal terlihat bahwa antara soal Yamtinah et al. (2014: 9) melakukan penskoran
pendukung dalam satu set soal testlet adalah dengan menggunakan Graded Response Model
saling berkaitan, sehingga untuk dapat (GRM) yang menerapkan sistem grading untuk
menyelesaikan soal nomor 1.3 diperlukan menilai soal testlet yang terdiri dari 3 soal
jawaban yang benar pada soal 1.1 dan 1.2 Karena pendukung yang telah disusun secara hirarkis,
tingkat penyelesaian soal bertingkat maka jika peserta didik menjawab benar pada butir
diperlukan rubrik penilaian berjenjang, dimana nomor 1, 2, dan 3 maka akan mendapat skor
jawaban pada tahap sebelumnya mempengaruhi maksimalnamun jika nomor 1 menjawab salah,
pada tahap berikutnya (Susongko, 2010: 273). maka secara otomatis skor adalah 0 meskipun
Yamtinah et al. (2014: 9) melakukan penskoran nomor 2 dan 3 menjawab benar. Hal ini
dengan menggunakan Graded Response Model didasarkan bahwa butir soal no 1, 2, dan 3 telah
(GRM) yang menerapkan sistem grading untuk dibuat secara hirarkis, sehingga jika soal no 1
menilai soal testlet yang terdiri dari 3 soal salah seharusnya peserta didik tidak dapat
pendukung yang telah disusun secara hirarkis, menjawab benar untuk nomor 2 dan 3. Dalam
jika peserta didik menjawab benar pada butir GRM respon dalam item dikelompokan kedalam
nomor 1, 2, dan 3 maka akan mendapat skor kategori m_i+1, dimana m mewakili nilai
maksimalnamun jika Dari soal terlihat bahwa tertinggi dari item i. Nilai total yang mungkin
antara soal pendukung dalam satu set soal testlet pada item i didefinisikan sebagai (0, 1, . . . , m_i).
adalah saling berkaitan, sehingga untuk dapat Respon kategori diurutkan sedemikian rupa
menyelesaikan soal nomor 1.3 diperlukan sehingga skor kategori yang lebih tinggi mewakili
jawaban yang benar pada soal 1.1 dan 1.2 Karena lebih banyak sifat dari kategori yang lebih rendah
tingkat penyelesaian soal bertingkat maka (Cook et al., 1999: 3). Berdasarkan teori tersebut
diperlukan rubrik penilaian berjenjang, dimana maka aplikasi rubrik penilaian untuk soal pada
jawaban pada tahap sebelumnya mempengaruhi Tabel 1 dapat dilihat pada Tabel 2.
pada tahap berikutnya (Susongko, 2010: 273).
26
Murti / Unnes Physics Education Journal 7 (1) (2018)
Instrumen yang baik adalah yang Berdasarkan hasil uji coba, seluruh butir soal
memenuhi validitas isi maupun validitas dinyatakan valid dan memenuhi validitas konstruk
konstruk. Validitas isi diperoleh dari penilaian
sehingga soal dapat digunakan. Soal tersebut
ahli untuk naskah tes, sementara untuk validitas
konstruk diperoleh dari hasil uji coba. Hasil uji diujikan kepada sample penelitian yaitu kelas XI
coba akan dianalisis butir soal hingga MIPA 4 dan XI MIPA 6. Masing-masing kelas
memperoleh soal yang baik, yaitu soal yang valid memperoleh kedua bentuk tes yang sama dalam
dari segi validitas, reliabilitas, daya beda, serta
waktu yang berbeda. Tes pertama dilakukan
tingkat kesukaran soal.
Berdasarkan hasil analisis uji coba dengan memberikan tes bentuk tetslet pada kelas
instrumen tes testlet dan uraian didapatkan nilai XI MIPA 4 dan tes uraian pada kelas XI MIPA 6.
r_hitung lebih besar daripada nilai r_tabel untuk Setelah selang waktu 2 minggu kembali dilakukan
seluruh butir soal, sehingga seluruh butir soal
tes yang kedua, yaitu dengan memberikan tes
dinyatakan valid. Sementara hasil uji reliabilitas
soal didapatkan nilai sebesar 0,921 untuk tes testlet kepada kelas XI MIPA 6 dan tes uraian
testlet dan 0,906 untuk tes uraian. Nilai tersebut kepada kelas XI MIPA 4. Untuk memperoleh skor
masuk kedalam kategori sangat reliabel. Hasil uji akhir, masing- masing jawaban dari subjek
tingkat kesukaran soal dapat dilihat pada Tabel 3,
penelitian diskor sesuai dengan rubrik penilaian
sedangkan hasil uji daya beda soal dapat dilihat
pada Tabel 4. yang telah ditetapkan.
Tabel 3. Persentase Jumlah Soal Berdasarkan
Tingkat Kesukaran Soal Testlet dan Uraian HASIL DAN PEMBAHASAN
Persentase Jumlah Soal
Bentuk
dengan Tingkat Kesukaran Analisis data hasil penelitian ini ditunjukan
Tes
Mudah Sedang Sukar
untuk mengetahui ada tidaknya perbedaan
Testlet 20 62,5 12,5
Uraian 0 86 14 bentuk evaluasi terhadap hasil belajar kognitif
siswa. Penelitian ini mengomparasikan evaluasi
Tabel 4. Persentase Jumlah Soal Berdasarkan bentuk tes uraian dengan tes testlet yang disusun
Daya Beda Soal Testlet dan Uraian secara dependen sesuai dengan langkah
Persentase Jumlah Soal pengerjaan pada soal uraian dalam mengukur
Bentuk
dengan Daya Beda
Tes kemampuan kognitif siswa. Setelah siswa
jelek Cukup Baik
Testlet 0 37,5 62,5 diberikan soal testlet dan uraian, dengan
Uraian 0 43 57 demikian peneliti dapat melakukan perhitungan
dan analisis data. Setelah dilakukan penskoran
27
Murti / Unnes Physics Education Journal 7 (1) (2018)
dan dilakukan analisis butir soal untuk kedua Tabel 5 untuk kedua kelas subjek penelitian,
bentuk tes diperoleh persentase rata-rata nilai sedangkan Gambar 1 untuk kelas XI MIPA 4
setiap bendel soal testlet dan uraian seperti pada sementara Gambar 2 untuk kelas XI MIPA 6.
Tabel 5. Persentase Rata-Rata Nilai Setiap Bendel Soal Testlet dan Uraian
Persentase Rata-Rata Nilai Setiap Bendel Soal Total
Kelas Jenis Tes
1 2 3 4 5 6 7 (%)
XI MIPA Testlet 73,1 93,1 85,2 69,4 60,9 30,9 87,5 65,78
4 Uraian 73,8 91,3 85,2 65,6 55,2 29,4 83,8 63,43
XI MIPA Testlet 70,9 93,9 94,7 64,2 59,6 26,6 99,4 65,90
6 Uraian 81,2 93,9 91,67 64,2 53,1 23,6 85,5 63,93
Gambar 1. Persentase Rata-Rata Nilai Setiap Bendel Testlet dan Uraian Kelas XI MIPA 4
120
99.4
100 93.9 94.7
91,67 85.5
81.2
80
Rata-Rata Nilai
70.9
64.2 59.6
60 53.1
testlet
40
26.6
23.6
uraian
20
0
1 2 3 4 5 6 7
Soal
Gambar 2. Persentase Rata-Rata Nilai Setiap Bendel Testlet dan Uraian Kelas XI MIPA 6
28
Murti / Unnes Physics Education Journal 7 (1) (2018)
Pada Penelitian ini Testlet yang disusun menanyakan kembali butir soal yang jawabannya
berdasarkan langkah pengerjaan pada soal tidak sesuai. Dari hasil wawancara ada sebagian
uraian ternyata tidak memberikan hasil yang siswa yang berpendapat bahwa soal testlet dirasa
sama persis dengan soal uraian. Apabila dilihat lebih mudah daripada soal uraian karena siswa
tiap bendel soal, hasil yang sama persis antara tes merasa terbantu dengan opsi jawaban serta
testlet dan uraian hanya pada bendel nomor 2 siswa seperti dibimbing dalam menjawab satu
dan 4 sedangkan untuk bendel testlet 1 soal integrasi testlet dari butir pertama hingga
persentase rata-rata nilai testlet sedikit lebih butir terakhir. Hal ini dikarenakan jawaban soal
rendah daripada soal uraian, hal ini disebabkan sebelumnya mempengaruhi jawaban soal
banyaknya siswa yang salah dalam menjawab berikutnya. Siswa lain menyampaikan bahwa
butir 1.4 dimana tidak sedikit siswa terkecoh mereka merasa waktu yang disediakan kurang
untuk memilih jawaban yang disebabkan oleh untuk mengerjakan soal dalam bentuk uraian
tidak adanya tanda negarif atau positif pada apabila harus menulis runtun dengan langkah
pilihan jawaban yang tersedia dalam hal untuk pengerjaan, namun tidak untuk soal testle yang
menunjukan besar torsi, sehingga ketika ditanya berbentuk pilihan ganda dimana siswa hanya
besar torsi total tidak sedikit siswa yang hanya memilih jawaban dari opsi yang tersedia tanpa
menambahkan kedua torsi tanpa mempedulikan harus menuliskan langkah-langkah bagaimana
arah dari masing-masing torsi, sehingga siswa siswa mendapatkan jawaban tersebut. Tidak
tidak mampu menjawab secara utuh untuk soal semua siswa memilih mengerjakantes testlet, ada
testlet 1 dan siswa hanya mampu menjawab beberapa siswa yang lebih memilih mengerjakan
benar sampai langkah ketiga sehingga skor yang soal uraian dengan harapan ketika jawaban yang
diperoleh siswa adalah 3. Sedangkan pada soal mereka berikan salah mereka tetap
uraian yang disusun menjadi satu soal uraian mendapatkan skor. Dari hasil wawancara tentang
tanpa ada bagian-bagian soal layaknya soal soal yang dirasa tidak bisa untuk di kerjakan oleh
testlet, dalam pengerjaannya tidak ada pengecoh siswa hampir semua siswa menjawab soal nomor
bagi siswa, dan siswa memperhatikan tanda 6 yaitu soal tentang kesetimbangan benda tegar.
positif dan negatif untuk menunjukan torsi Dan ketika soal tersebut ditanyakan ulang secara
masing-masing anak sehingga siswa mampu lisan tidak ada siswa yang mampu menjawab
menjawab secara utuh langkah pengerjaan pada dengan utuh. Dengan demikian dapat
soal tersebut dan mendapatkan skor maksimal. disimpulkan adanya ketidak sesuaian antara
Sementara sisanya yaitu bendel 3, 5, 6, dan 7 soal jawaban yang diberikan siswa dikarenakan siswa
tes testlet memiliki persentase sedikit lebih tinggi belum paham betul akan materi tersebut,
daripada tes uraian. Hal ini terjadi karena adanya sehingga masih terdapat unsur menduga-duga
beberapa penempuh tes yang memberikan dan menebak jawaban.
jawaban yang tidak sesuai (gambling) antara Setelah dilakukan analisis data tentang
jawaban pada tes testlet dan tes uraian. Pada perbedaan hasil tes testlet dan uraian dengan
testlet adanya peluang penempuh tes untuk menggunakan uji “t” dengan taraf signifikansi 5%
menebak jawaban dengan benar. Pada kelas XI dan dk = 62 didapatkan nilai t_tabel sebesar 1,99.
MIPA 4 terdapat lima siswa memberikan jawaban Dan t_hitung sebesar 1,85 untuk kelas XI MIPA 4,
gambling. Sementara kelas XI MIPA 6 terdapat dan 1,89 untuk kelas XI MIPA 6. Dengan demikian
enam siswa. Menindaklanjuti ketidaksesuain baik untuk kelas XI MIPA 4 maupun XI MIPA 6
jawaban ini, maka dilakukan wawancara didapatkan nilai 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 < 𝑡𝑡𝑎𝑏𝑒𝑙 sehingga Ho
terhadap siswa yang bersangkutan. Wawancara diterima. Artinya tidak terdapat perbedaan hasil
terkait dengan pendapat mereka mengenai dua belajar siswa yang diberi evaluasi dalam bentuk
bentuk tes yang telah mereka kerjakan testlet dan siswa yang diberi evaluasi dalam
sebelumnya yaitu testlet dan uraian, serta dengan bentuk uraian. hasil penelitian ini sesuai dengan
29
Murti / Unnes Physics Education Journal 7 (1) (2018)
penelitian yang dilakukan oleh Slepkov & Ralph Context of Testlet Scoring. Journal of
(2014; 01) yang menyimpulkan bahwa Integrasi Outcome Measurement, 03(01): 1-
Testlet adalah pengganti yang layak untuk 20.
pertanyaan uraian dalam tes formal dimana
mampu menilai konsep dan pengetahuan serta Nasution, S. 2013. Berbagai Pendekatan Dalam
efisien dalam hal penskoran. Proses Belajar Mengajar. Jakarta:
Bumi Aksara.
SIMPULAN
Nicol, D. 2007. E-assessment by Design: Using
Berdasarkan hasil penelitian dapat Multiple-Choice Tests to Good
disimpulkan tes testlet dapat berfungsi Effect. Journal of Further and Higher
sebagaimana tes uraian dalam hal mengukur Education, 31(01): 53-64.
hasil belajar kognitif siswa kelas XI SMA Negeri 1
Gombong, hal ini dapat dilihat dari hasil analisis Scalise, K. & Wilson, M. .2007. Bundle Models for
menggunakan uji t yang menunjukan bahwa Computerized Adaptive Testing in
tidak ada perbedaan hasil belajar kognitif siswa E-Learning Assessment. InD. J.
antara yang dievaluasi dengan menggunakan tes Weiss (Ed.). Proceedings of the
bentuk testlet dan tes bentuk uraian. Dengan 2007 GMAC Conference on
demikian, tes bentuk testlet dapat digunakan Computerized Adaptive Testing.
sebagai alternatif bentuk tes pilihan ganda dan
uraian selama soal pada tes testlet tersusun Simkin, M. F. & Kuechler, W. L., 2005. Multiple-
secara dependen, yaitu saling berkaitan antara Choice Testt and Student
soal-soal pendukung dan pengoreksiannya Understanding: What Is The
secara berjenjang, dimana jawaban butir soal Connection? Decision Sciences
pendukung sebelumnya mempengaruhi jawaban Journal of Innovation Education,
terhadap butir soal pendukung selanjutnya. 03(01): 73-96.
Berdasarkan hasil penelitian maka penulis
Slepkov, D. A. & Ralph, C. S. 2014 Comparisin of
menyarankan: (1) Mengusahakan kalimat yang
Integrated Testlet and Constructed-
digunakan pada soal testlet tidak terlalu panjang
Response Question Formats.
supaya tidak memakan waktu dan menyulitkan
Physics Education Researc,.
dalam mengerjakan. (2) Pokok bahasan yang
10(02): 1-15.
digunakan pada soal hendaknya pokok bahasan
yang memerlukan penyelesaian bertingkat.
Stankous, N. V. 2016. Constructive Response Vs.
Multiple-Choice Tests In Math:
DAFTAR PUSTAKA
American Experience And
Discussion. European Scientific
Effiong, U. U., Nkwol, N., & Nsungo N. U. 2014. Test
Journal, ISSN 1857-7881.
Types Students’ Achievement in
Senior Secondary School Physics
Sudijono, A. 2006. Pengantar Evaluasi
and Eradication of Poverty and
Pendidikan. Jakarta: Raja Gafindo
Hunger In Nigeria. Journal of
Persada.
Research & Method in Education,
(04(01): 01-05. Sukardi. 2009. Evaluasi Pendididikan Prinsip dan
Operasionalnya. Jakarta: Bumi
Cook, K. F., Barbara, G. D., & Steven J. F., 1999. A
Aksara.
Comparison of Three Polytomous
Item Response Theory Model in The
30
Murti / Unnes Physics Education Journal 7 (1) (2018)
Susongko, P. 2014. Perbandingan Keefektifan Yamtinah, S., Haryono, & Martini, K. S. 2014. Profil
Bentuk Tes Uraian Dan Testlet Individu Peserta Didik Pelengkap
Dengan Penerapan Graded Tes Jenis Testlet sebagai Alternatif
Response Model (GRM). Jurnal Pendeteksi Kesulitan Belajar Kimia.
Pendidikan dan Evaluasi Pendidikan, Jurnal Profesi Pendidikan, 01(01): 1-
14(02): 269-288. 10.
Prasetya, B. & Lina, M. J. 2012. Metode Penulisan Zeidner, M. 1987. Essay Versus Multiple Choice
Kuantitatif Teori Dan Aplikasi. Type Classroom Exams: The
Jakarta: Raja Gafindo Persada. Student’s Perpective. Journal of
Educational Research, 80(06): 352-
Wang, S., He, W., & Jiao, H. 2013. Estimation 35.
Methode for One-Parameter Testlet
Models. Journal of Education
Measurement, 50(02): 186-203.
31