http://ojs.umrah.ac.id/index.php/kiprah
1,2,3
Magister Pendidikan Kimia, Sekolah Pascasarjana UPI, Bandung, Indonesia
email: anggundaj@gmail.com
Pengiriman: tgl/bln/thn; Diterima: tgl/bln/thn; Publikasi: tgl/bln/thn (diketik oleh editor, tinggalkan!)
DOI: https://doi.org/10.31629/jg.v3i2.xxx (diketik oleh editor, tinggalkan!)
Abstrak
Penelitian ini bertujuan untuk mendapatkan virtual test yang sudah valid dan reliabel untuk mengukur
kemampuan berpikir kritis siswa pada materi kesetimbangan kimia. Metode yang digunakan dalam penelitian
ini adalah metode pengembangan dan validasi untuk mengetahui kualitas tes yang dikembangkan dengan uji
validitas konten, validitas konkuren, da reliabilitas. Responden dalam penelitian ini adalah 136 orang siswa
kelas XI MIA dan 3 orang guru kimia di SMA Negeri yang ada di Kota Bengkulu. Hasil dari penelitian ini
yaitu: (1) berdasarkan hasil validasi konten virtual test kemampuan berpikir diperoleh 23 butir soal yang valid
dengan CVI sebesar 0,93; (2) koefisien korelasi nilai virtual test dan tes berpikir kritis yang baku sebesar 0,74
dengan kategori cukup; (3) reliabilitas virtual test yang dikembangkan termasuk dalam kategori tinggi dengan
Cronbach’s alpha sebesar 0,73; (4) butir soal virtual test memiliki daya pembeda sebesar 0,44 dengan kategori
baik dan tingkat kesukaran sebesar 0,64 dengan kategori sedang; (5) dari hasil wawancara, guru-guru dan siswa
memberikan respon positif terhadap virtual test kemampuan berpikir kritis yang dikembangkan dilihat dari segi
tampilan, tata bahasa soal, kemudahan akses dan pengoprasian, multimedia yang terdapat pada soal, manfaat,
dan waktu pengerjaan tes.
Kata kunci: pengembangan dan validasi tes, berpikir kritis, validitas konten, validitas konkuren, reliabilitas.
Keywords: development and validation test, critical thinking, content validation, concurrent validation,
reliability.
1
*Penulis Korespondensi
Email Address: anggundaj@gmail.com
A. Jati, Firmansyah, Nahadi / Jurnal Kiprah 8 (1) (2020) 1-10
2
E. Kuntarto, Alirmansyah, A. R. Kurniawan / Jurnal Kiprah 8 (1) (2020) 1-10
3
A. Jati, Firmansyah, Nahadi / Jurnal Kiprah 8 (1) (2020) 1-10
signifikasi 0,05 (one tail) untuk tujuh orang test kemampuan berpikir kritis pada materi
validator nilai kritisnya sebesar 0,622. Artinya kesetimbangan kimia yang didapat sebesar
jika nilai CVR yang diperoleh lebih dari 0,622 0,731.
maka dapat dinyatakan valid, sedangkan jika Berdasarkan kriteria penafsiran reliabilitas
berada di bawah 0,622 dinyatakan tidak valid. menurut George & Mallery (dalam Gliem &
Dari 24 soal yang divalidasi oleh para ahli Gliem, 2003) maka virtual test kemampuan
terdapat 23 butir soal yang memiliki nilai CVR berpikir kritis yang dikembangkan termasuk
lebih dari 0,622 dengan nilai CVI sebesar 0,93. dalam kategori reliabilitas tinggi. Hal ini
Terdapat satu soal yang ditolak (tidak valid) sejalan dengan kriteria menurut Suherman
yaitu soal pada nomor 22 dengan nilai CVR (1990) butir soal yang terdapat pada virtual
bernilai 0,429. Nilai tersebut berada di bawah test termasuk kategori reliabilitas tinggi karena
nilai kritis, maka butir soal yang tidak valid ini berada pada rentang 0,70 < r11 ≤ 0,90.
tidak dapat dipergunakan atau diikutsertakan Reliabilitas dengan kategori “tinggi” artinya
untuk diujicobakan sedangkan untuk butir soal virtual tes yang telah dikembangkan
yang diterima (valid) dapat digunakan untuk mempunyai konsistensi (keajegan) yang tinggi
diujicobakan. Dalam penelitian ini jumlah soal dalam mengukur kemampuan berpikir kritis
yang diujicobakan dalam virtual test sebanyak siswa, sehingga apabila diujikan kepada siswa
17 soal pilihan ganda bertingkat dengan yang lain dengan kondisi dan keadaan yang
tingkat pertama terdiri dari lima option pilihan sama maka akan dihasilkan informasi yang
jawaban dan tingkat kedua dengan empat sama atau mendekati sama. Hal ini
option pilihan jawaban. menunjukkan bahwa dari segi reliabilitas, soal
virtual test yang dikembangkan dapat diterima
Validitas Konkuren Virtual Test dengan Tes atau telah layak digunakan untuk mengukur
Tertulis Kemampuan Berpikir Kritis kemampuan berpikir kritis siswa pada materi
Validitas konkuren virtual test berpikir kesetimbangan.
kritis dengan tes tertulis berpikir kritis
didapatkan dari uji korelasi. Validitas Analisis Butir Soal
konkuren ditentukan dari besarnya koefisien Selain melihat keberfungsian tes secara
korelasi nilai virtual tes yang dikembangkan keseluruhan dari validitas konten, validitas
dengan tes tertulis kemampuan berpikir kritis. konkuren, dan reliabilitasnya, untuk
Hasil pengujian korelasi kedua variabel dapat mengetahui kualitas soal yang dikembangkan
dilihat pada tabel berikut. dilakukan juga analisis butir soal yang
Berdasarkan data pada Tabel 2 meliputi tingkat kesukaran dan daya pembeda
menunjukkan bahwa data variabel virtual test soal. Berdasarkan hasil yang didapatkan pada
dan tes baku mempunyai nilai sig hitung uji coba virtual test kemampuan berpikir kritis,
0,000 < 0,05 maka dapat disimpulkan bahwa Dari hasil penelitian terdapat satu soal yang
terdapat hubungan yang signifikan antara memiliki daya pembeda dengan kategori jelek
virtual tes dengan tes baku. Besarnya korelasi yaitu pada soal nomor 8 dengan proporsi 5,8
antara virtual tes dengan tes tertulis % dari total keseluruhan soal, artinya soal
kemampuan berpikir kritis ditunjukkan oleh tersebut tidak bisa membedakan antara
nilai kolerasi sebesar 0,742. Nilai korelasi kelompok tinggi dan kelompok rendah.
sebesar ini termasuk kategori baik. Sehingga Terdapat 6 soal yang termasuk kritieria cukup
dapat disimpulkan bahwa virtual test yang yaitu pada soal nomor 5, 10, 11, dan 12
dikembangkan memiliki keterukuran fungsi dengan proporsi 23,6 %, artinya soal tersebut
yang baik dengan tes tertulis kemampuan cukup baik dalam membedakan kelompok
berpikir kritis yang baku dalam mengukur tinggi dan kelompok rendah. Terdapat 12 soal
kemampuan berpikir kritis siswa. dengan proporsi 70,6% yang termasuk dalam
kategori baik, artinya soal-soal tersebut baik
Reliabilitas Virtual Test Kemampuan dalam membedakan kelompok tinggi dan
Berpikir Kritis kelompok rendah.
Penentuan reliabilitas dilakukan dengan Rata-rata daya pembeda butir soal pada
menentukan nilai Cronbach’s alpha virtual test berpikir kritis yang dikembangkan
menggunakan SPSS 16. Nilai reliabilitas pada materi kesetimbangan kimia yaitu
ditentukan dari hasil pengumpulan data pada sebesar 0,44. Menurut Suherman (2002) daya
tahap uji coba. Nilai Cronbach’s alpha virtual pembeda butir soal pada virtual test termasuk
4
E. Kuntarto, Alirmansyah, A. R. Kurniawan / Jurnal Kiprah 8 (1) (2020) 1-10
Indeks kesukaran
35.3
kelompok peserta tes yang berprestasi tinggi 40 11.8
dengan kelompok peserta tes yang berprestasi 0
rendah. Hal ini sesuai dengan pernyataan Mudah Sedang Sukar
Firman (2013) menyatakan bahwa butir soal Kategori soal
yang baik harus memiliki daya pembeda lebih
besar atau sama dengan 0,25 (DP ≥ 0,25). Hal
ini menunjukkan bahwa secara keseluruhan
butir soal yang terdapat pada virtual test telah Gambar 2. Persentase Indeks Kesukaran
memenuhi syarat sebagai butir soal yang baik. Soal Virtual Test Berpkir Kritis pada
Perbandingan persentase daya pembeda butir Materi Kesetimbangan Kimia
soal dalam virtual test ditunjukkan pada
gambar berikut. Berdasarkan validitas konten, validitas
konkuren, reliabilitas dan analisis butir soal
Daya Pembeda
100 70.6
50 23.6 (tingkat kesukaran dan daya pemebeda) yang
5.8
0 diperoleh maka dapat disimpulkan bahwa
Jelek Cukup Baik virtual test yang telah dikembangkan telah
Kategori soal memenuhi kriteria untuk mengukur
kemampuan berpikir kritis pada materi
Gambar 1. Persentase Daya Pembeda Butir kesetimbangan kimia.
Soal Virtual Test Berpikir Kritis pada
Materi Kesetimbangan Kimia Keunggulan Virtual Test Kemampuan
Berpikir Kritis
Indeks kesukaran virtual test kemampuan Melalui Hasil uji coba virtual tes
berpikir kritis sebesar 0,64 termasuk dalam kemampuan berpikir kritis ditemukan
kategori sedang. Menurut Firman (2013) keunggulan dari software virtual tes
bahwa pokok uji dengan 0,25 ≤ F ≥ 0,75 kemampuan berpikir kritis yang telah
tergolong sedang. Hal ini sejalan dengan dikembangkan jika dibandingkan dengan tes
Kusaeri (2012) yang menyebutkan kategori kemampuan tertulis yang biasa dilakukan di
sedang berada pada rentang antara 0,30 – 0,70. sekolah. Menurut Santoso et al. (2010)
Sehingga secara keseluruhan pokok uji dalam kelemahan paper and pencil test adalah
virtual test kemampuan berpikir kritis kerahasiaan tes tidak dapat dijamin karena
tergolong sedang dan dapat diartikan bahwa dapat saja dibaca oleh orang yang tidak
pokok uji virtual test kemampuan berpikir berwenang dan pengolahan hasil memerlukan
kritis yang dikembangkan termasuk kategori waktu yang relatif lama. Selain itu, karena
baik. Hal tersebut sesuai dengan pandangan harus memberikan semua butir soal, maka
Firman (2013) bahwa bila semua pokok uji diperlukan waktu penyelenggaraan yang lebih
tergolong taraf kesukaran sedang maka pokok lama. Penggunaan kertas menjadi masalah
uji itu termasuk pokok uji yang baik. tersendiri, misalnya dibutuhkan ruang untuk
Berdasarkan Tabel 3 indeks kesukaran dari penyimpanan data perangkat tes. Keterbatasan
virtual test sebesar terdapat 8 soal yang informasi pada soal juga menjadi
termasuk dalam kategori mudah yaitu soal pertimbangan tersendiri dalam pelaksanaan
pada nomor 1, 8, 10, 11, 12, dan 16. Soal ujian dengan paper and pencil test.
dengan kategori sukar sebanyak dua soal yaitu Keunggulan virtual test ini yang mendukung
pada soal nomor 3 dan 6. Selebihnya sebanyak pengukuran dan peningkatan kemampuan
9 soal yang tergolong dalam kategori sedang. berpikir kritis siswa diantaranya:
Persentase soal yang mudah yaitu 35,3 %, 1. Mudah diakses dan dioperasikan karena
kategori sedang sebesar 52,9 % dan soal tidak perlu menginstal program terlebih
dengan kategori sukar memiliki persentase dahulu dan penggunaan virtual test yang
11,8%. Menurut Sudjana (2005) pokok uji tidak menyulitkan penggunakan. Hal ini
yang baik sebaiknya memiliki taraf kesukaran dapat dilihat dari hasil wawancara guru
yang sedang paling banyak. Perbandingan dan siswa mengenai kemudahan akses
persentase indeks kesukaran soal yang terdapat dari virtual tes dengan kesimpulan bahwa
dalam virtual test ditunjukkan pada gambar semua siswa tidak merasa kesulitan dalam
5
A. Jati, Firmansyah, Nahadi / Jurnal Kiprah 8 (1) (2020) 1-10
6
E. Kuntarto, Alirmansyah, A. R. Kurniawan / Jurnal Kiprah 8 (1) (2020) 1-10
Tim penulis mengucapkan terima kasih Kusaeri. (2012). Pengukuran dan Penilaian
kepada Kepala Sekolah, guru dan staf sekolah, Pendidikan. Yogyakarta: Graha Ilmu
dan siswa-siswi kelas XII tahun ajaran
2015/2016 yang ada di Kota Bengkulu atas Liliasari (2009). Berpikir Kritis dalam
Pembelajaran Kimia Menuju
kesediaan meluangkan waktu dan tempat
Profesionalitas Guru [Online]. Tersedia
dalam pelaksanaan kegiatan ini. di http://file.upi.edu/ai.php. Diakses
pada 14 Februari 2015
REFERENSI
Adams, W. K. & Wieman, C. E. (2010). Mushonev, K. (2014). Pengembangan gambar
Development and Validation of konsep sebagai alat evalaluasi pada
Instruments to Measure Learning of konsep ekosistem. Tesis Magister pada
Expert-Like Thinking. International SPs UPI Bandung: tidak diterbitkan
Journal of Science Education, 33(9), 1-
24 Rustaman, N. (1995). Pengembangan Butir
Soal Keterampilan Proses Sains.
Anderson, L. W. & Krathwohl. (2010). Makalah Disampaikan dan Dilatihkan
Kerangka Landasan Untuk Kepada Guru-Guru Dalam Rangka
Pembelajaran, Pengajaran, dan Pengabsian Kepada Masyarakat. IKIP:
Asesmen (Revisi Taksonomi Bloom). Bandung
Yogyakarta: Pustaka Pelajar
Santoso, A., Aprijani, D.A., Sufandi, U.U., &
Firman, H. (2013). Evaluasi Pembelajaran Maalik, I. (2010). Pengembangan Model
Kimia. Bandung : Jurusan Pendidikan Sistem Ujian Berdasarkan Computerized
Kimia FPMIPA Universitas Pendidikan Adative Testing Sebagai Upaya Efisiensi
Indonesia Penyelenggaraan Ujian Universitas
terbuka (Laporan Penelitian Lanjut
Firman, H & Rusyati, L. (2014). Virtual Test: Bidang Kelembagaan dan
Sebuah Student Centre Software Sebagai Pengembangan Sistem. Jakarta:
Alat Ukur Berpikir Kritir Siswa SMP Universitas Terbuka
Pada Tema Penyakit Manusia (Laporan
PPKBK). Bandung: Universitas Satrisman, A. (2013). Analisis Soal Ujian
Pendidikan Indonesia Nasional Kimia SMA Tahun 2013
Berdasarkan Taksonomi Bloom Dua
Gliem, J. A & Gliem, R.R. (2003). Calculating Dimensi. (Skripsi). Universitas
and Reporting Cronbach’s Alpha Pendidikan Indonesia Bandung: tidak
Reliability Coefficient for Likert-Type diterbitkan
Scales. Research to Practice Conference
in Adult, Continuing, and Comunity Sudjana, N. (2005). Penilaian Hasil Proses
Education, Ohio, 82-88 Belajar Mengajar. Bandung: PT Rosda
Karya
Jacobs, L.C & Chase, C. I. (1992).
Development and using test effectively. Suherman. (2003). Petunjuk Praktis Untuk
San Fransisco: Jossey-bass Publisher Melaksanakan Evaluasi Pendidikan
Matematika. Bandung: Wijaya Kusuma
King, T & Duke-William, E. (2001). Using
Computer Aided Assessment To Test Tuysuz, C. (2009) Development of
Higher Level Learning Outcomes Two-tier Diagnostic Instrumen and
[Online]. Proceedings of 5th Assess Students’ Understanding
International Computere Assisted in Chemistry. Scientific
Assessment Conference, Univ. of research and essay, 4(6), 626-
Loughborough, 177-178.
631