2352 4999 1 PB PDF
2352 4999 1 PB PDF
Cicylia T. Kereh
Program Studi Pendidikan Fisika, FKIP - Universitas Pattimurah Ambon.
cicyliatk@yahoo.com
Liliasari
Program Studi Pendidikan IPA, SPS – UPI Bandung.
Paulus C. Tjiang
Jurusan Fisika, FTIS –Universitas Katolik Parahyangan Bandung
Jozua Sabandar
Program Studi Pendidikan Matematika, SPS - UPI Bandung.
Abstract: Development research test instrument math base on introduction nuclear physics
lecture has been done. The method used is quantitative descriptive stages as follows: (1)
Review basic math content that is relevant to the related nuclear physics through the study of
literature; (2) Prepare draft test instruments with reference to the objectives, competence
standard, basic competence, and indicators of achievement of design lectures were arranged;
(3) Ask the expert assessment (validation construction and content); (4) To test the test
instrument in a limited scope, evaluate and improve the existing deficiencies. The amount of
matter that is developed in this test is 30 grains form the description. Data analysis test results
of this test instruments in the group of students showed that the validity criteria are high, which
is equal to 0.77. The instrument reliability was 0.87 which included a very high category. This
means the resulting product meets the decent criteria, because validan reliable, but there are
still items that need revision based on suggestions and feedback from the validator.
Abstrak :Penelitian pengembangan instrumen tes Matematika Dasar yang berkaitan dengan
materi perkuliahan Pendahuluan Fisika Inti telah dilakukan. Metode yang digunakan adalah
deskriptif kuantitatif dengan tahap-tahap sebagai berikut: (1) Mengkaji konten matematika
dasar yang relevan dengan fisika inti terkait melalui studi literatur; (2) Menyusun rancangan
instrumen tes dengan mengacu pada tujuan, standar kompetensi, kompetensi dasar, dan
indikator pencapaian dari rancangan perkuliahan yang disusun; (3) Meminta penilaian dari para
ahli (validasi konstruksi dan konten); (4) Melakukan uji coba instrumen tes dalam lingkup
terbatas, mengevaluasi dan memperbaiki kekurangan yang ada. Jumlah soal yang
dikembangkan dalam tes ini adalah 30 butir berbentuk uraian. Analisis data hasil uji coba
instrumen tes ini pada kelompok mahasiswa menunjukkan bahwa validitas kriterianya tinggi,
yakni sebesar 0,77. Reliabilitas instrumen ini adalah 0,87 yang termasuk kategori sangat tinggi.
Ini berartiproduk yang dihasilkan sudah memenuhi kriteria layak, karena validdan reliabel,
namun masih ada item yang perlu revisi berdasarkan saran dan tanggapan dari validator.
36
Validitas dan Reliabilitas Instrumen Tes Matematika. 37
tes yang mengacu pada domain yang harus dilakukan pada kelompok lain tapi
ditentukan. Tes yang berbasis tujuan adalah memiliki karakteristik yang serupa dengan
tes yang item-itemnya dikonstruksi untuk yang kelompok yang akan diteliti. Hasil uji
mengukur tujuan instruksional sedangkan tes coba tersebut harus dianalisis validitas dan
berbasis domain adalah pengukuran yang reliabilitasnya untuk mendeteksi kekurangan
dilakukan mengacu pada domain perilaku tes tersebut sebelum digunakan.
pebelajar. Tes berbasis tujuan biasanya Sebuah tes dapat berbentuk essay
dilakukan oleh guru pada tes formatif ataupun soal (masalah). Tes uraian/essay
sedangkan tes berbasis domain pada ujian adalah tes yang berbentuk pertanyaan ataupun
sumatif. perintah yang menghendaki paparan kalimat
Tes formatif adalah tes yang biasanya yang memuat penjelasan, penilaian,
dilakukan pada akhir pembelajaran suatu penafsiran, dan sebagainya yang umumnya
topik. Tes ini sangat berguna untuk cukup panjang.Tes ini merupakan suatu
mengetahui perkembangan peserta didik dan metode yang standar yang dapat digunakan
bagaimana kurikulum dijalankan dari hari ke untuk mengukur pemahaman, dan ketrampilan
hari.Hasil kajian suatu tes formatif berguna sintesis dan evaluasi seseorang. Pembuatan tes
bagi guru dan siswa dalam refleksi ini relatif mudah, akan tetapi pemeriksaan
pembelajaran yang sudah dilakukan. hasilnya membutuhkan waktu yang panjang.
Sebaliknya, tes sumatif dilakukan setelah Hasil pemeriksaan dari dua orang atau lebih
suatu periode (mid semester, semester, akan bervariasi. Oleh karena itu tes ini sering
ataupun akhir tahun ajaran) yang pula disebut tes subjektif. Selain essay, tes
dimaksudkan untuk mengukur apa yang telah juga dapat berbentuk soal-soal (masalah).
dipelajari peserta didik setelah suatu Bentuk soal ini sangat potensial untuk
keseluruhan pembelajaran (menyangkut mengukur ketrampilan aplikasi, analisis, dan
beberapa topik sekaligus). Hasil tes sumatif pemecahan masalah. Soal yang kompleks
digunakan untuk banyak hal antara lain: untuk relatif sulit untuk dibuat, begitu pula
pemberian nilai siswa, evaluasi efektivitas pemeriksaannya (Brown, Bull, dan Pedlebury,
kurikulum, menilai pencapaian akademik 1997).
siswa, sekolah, ataupun daerah secara umum Berbagai penelitian pengembangan
selama tahun akademik berjalan (Kubiszyn instrumen tes telah dilakukan oleh para ahli,
dan Borich, 2013). salah satunya oleh Indrawati (2009) dalam
Dalam mengukur pencapaian bidang psikologi. Kajian khusus
mahasiswa, tidak selalu tersedia instrumen tes tentangreliabilitas dan validitas tes, dilakukan
standar yang sesuai dengan tujuan penelitian, oleh banyak pihak, antara lain: Wass et al.
oleh karena itu peneliti harus mengkonstruksi (2001) meneliti tentang asesmen kompetensi
sendiri instrumen tes tersebut. Menurut Ary, klinik; Golafshani (2003) yang
Jacobs, dan Razavieh (2010), tes yang dibuat mengklarifikasi tentang kedua hal tersebut
sendiri tersebut dapat dibuat sedemikian rupa dalam penelitian kualitatif; danVan Saane et
yang kontennya mencakup kajian yang akan al. (2003) yang meneliti kedua hal tersebut
dibahas, ataupun ketrampilan-ketrampilan untuk beberapa instrumen yang digunakan
tertentu yang akan diukur. Akan tetapi, dalam dalam mengevaluasi kepuasan kerja. Dalam
pembuatan suatu tes harus diperhatikan bidang pendidikan fisika, Maloney et al.
reliabilitas dan validitas intrumen tersebut (2011) melakukan penelitian pengembangan
atau dengan kata lain, soal tersebut harus diuji instrumen tes penguasaan listrik magnet,
coba terlebih dahulu sebelum digunakan pada sedangkanJandaghi (2011) meneliti tentang
penelitian yang sebenarnya. Uji coba tersebut
40 JURNAL INOVASI DAN PEMBELAJARAN FISIKA, VOLUME 2, NOMOR 1, MEI 2015.
validitas dan reliabilitas tes ketrampilan guru dengan ID merupakan daya pembeda, RU
dalam mendisain soal ujian fisika. adalah banyaknya peserta tes kelompok atas
Sebelum digunakan, suatu tes harus yang menjawab soal dengan benar. RLadalah
dianalisis sebelumnya untuk mengetahui banyaknya peserta tes kelompok bawah yang
kualitasnya. Analisis yang dilakukan biasanya menjawab soal dengan benar, dan T
mencakup tingkat kesukaran, daya pembeda, merupakan banyaknya peserta tes. Kriteria
validitas dan reliabilitas. Item soal yang pembeda soal dilakukan dengan merujuk pada
memiliki kualitas rendah harus direvisi. Untuk tabel klasifikasi ID dari Ebel dan Frisbie
mengetahui suatu butir soal tergolong sukar, (1991)berikut:
sedang, atau mudah dilakukan pengujian
dengan menggunakan persamaan: Tabel 2. Klasifikasi Daya Pembeda Soal
Indeks Evaluasi Item
Diskriminasi
R
P 100% (1)
T 0,40 Item yang sangat baik
0,30 – 0,39 Baik tapi mungkin perlu
diperbaiki
dengan P adalah indeks kesukaran, R adalah 0,20 – 0,29 Item yang biasanya perlu
banyaknya mahasiswa yang menjawab soal untuk diperbaiki
benar dan T adalah jumlah seluruh mahasiswa 0,19 Item perlu ditolak atau
peserta tes (Mehrens dan Lehmann, 1991). direvisi
Hasil perhitungan indeks kesukaran tersebut
selanjutnya diklasifikasikan sesuai dengan Validitas suatu tes berkenaan
tabel berikut: konsistensi atau akurasi skor yang ada
mengukur suatu kemampuan kognitif yang
terkait. Ada empat macam validitas, yaitu
validitas prediktif, validitas konkuren,
Tabel 1. Klasifikasi Tingkat validitas konstruksi dan validitas konten.
Kesukaran Soal Validitas prediktif adalah validitas yang
P Klasifikasi berkaitan dengan apakah tes tersebut secara
0,00-0,30 Soal sukar akurat dapat meramalkan performans
0,31-0,70 Soal sedang seseorang di masa depan. Validitas konkuren
0,71-1,00 Soal mudah berkaitan apakah uji yang dilakukan
berkorelasi atau secara substansial
Untuk mengetahui apakah suatu butir memberikan hasil yang sama dengan tes lain
soal mampu membedakan antara mahasiswa yang menguji ketrampilan yang sama, dengan
kelompok atas dengan mahasiswa kelompok catatan tes yang lain tersebut haruslah valid.
bawah dilakukan Uji Daya Pembeda Soal. Validitas konstruksi berkaitan dengan apakah
Dalam penelitian ini, daya pembeda butir soal tes tersebut konstruksinya memadai untuk
dihitung dengan menggunakan persamaan mengukur ketrampilan yang akan dinilai,
yang diberikan oleh Mehrens dan Lehmann, sedangkan validitas konten berkaitan dengan
(1991): ketercukupan, kesesuaian dengan konten yang
RU RL diajarkan atau domain yang akan diukur.
ID 1
(2) Validitas konten ini didasarkan pada penilaian
2T dari orang yang professional/pakar atas aspek
yang akan dinilai. Validitas konkuren dan
Validitas dan Reliabilitas Instrumen Tes Matematika. 41
validitas prediktif biasanya digabungkan korelasi antara dua bagian suatu tes pada
menjadi validitas kriteria karena keduanya penggunaan metode belah dua sering berbeda
berkaitan dengan peramalan performans pada dan bergantung pada pembagian/pemisahan
beberapa kriteria pada waktu yang sama atau yang dibuat. Begitu juga penggunaan metode
masa yang akan datang (Gipps, 1994). tes dan re-tes (pengulangan) pada dasarnya
Pengujian validitas instrumen bermasalah karena pengalaman pada tes yang
Matematika Dasar yang akan digunakan pertama akan mempengaruhi penampilan
adalah uji validitas isi (content validity) dan mahasiswa pada tes yang kedua. Di sisi lain,
uji validitas kriteria(criteria related validity). ada klaim sebelumnya dari Charles (1995)
Uji validitas harus dilakukan karena dengan yang mengatakan bahwa ada konsistensi dari
ini dapat dilihat kesahihan suatu instrumen jawaban individual atas item kuesioner/tes
dalam mengukur apa yang hendak diukur. pada metode tes dan re-tes. Pada penelitian
Untuk mengetahui validitas konten, soal ini, reliabilitas tes dihitung dengan
divalidasi oleh pakar – dalam hal ini dosen menggunakan rumus metode belah dua seperti
yang memiliki kompetensi di bidang persamaan yang diberikan oleh persamaan
matematika sedangkan untuk validitas kriteria berikut:
digunakan uji statistik dengan 2 x r1 1 (4)
mengkorelasikan tiap ítem dengan skor r1 1 2 2
totalnya dengan rumus korelasi Pearson: 1 r1 1
2 2
𝑟𝑥𝑦 =
𝑛 ∑ 𝑋𝑌−(∑ 𝑋)(∑ 𝑌)
(3) dengan: r11 = reliabilitas instrumen dan r1 1
2 2
√[𝑛(∑ 𝑋 2 −(∑ 𝑋) )][𝑛(∑ 𝑌 2 −(∑ 𝑌) )] 22
kerja ujian tengah semester mahasiswa; (3) untuk digunakan dalam mengkonversi satuan
Mengkaji konten matematika dasar dan fisika yang diminta. Begitu pula soal grafik yang
inti yang terkait melalui studi literatur; (4) yang ada, intinya mencakup fungsi
Mengembangkan rancangan instrumen eksponensial dan mahasiswa diminta untuk
penilaian berdasarkan hasil yang diperoleh merepresentasinya dalam grafik.
pada langkah-langkah sebelumnya yang Subyek penelitian adalah mahasiswa
meliputi: merumuskan tujuan perkuliahan, calon guru fisika semester delapan pada
standar kompetensi, kompetensi dasar, Program Studi Pendidikan Fisika di FKIPdi
indikator penguasaan, memilih instrumen suatu perguruan tinggi di Indonesia bagian
evaluasi yang sesuai dengan tujuan yang telah timur. Telah dikemukan sebelumnya bahwa
dirumuskan; (5) Menulis soal tes pengukuran penelitian ini merupakan bagian dari
penguasaan materi matematika dasar, (6) penelitian pengembangan program
Meminta penilaian para ahli atas draft perkuliahan untuk mahasiswa yang
instrumen tes yang disusun (validasi berkemampuan matematika rendah. Ini
konstruksi dan konten); (7) Melakukan uji didasarkan pada hasil tes entry behaviour
coba instrumen tes tersebut dalam lingkup (TEB) yang diadakan di FKIP di mana nilai
terbatas, dievaluasi dan diperbaiki kekurangan rata-rata mahasiswa maupun nilai maksimum
yang ada. Langkah pertama sampai ketiga yang diperoleh mahasiswa dalam tes tersebut
telah dilakukan dan hasilnya telah dipaparkan selama beberapa tahun sejak dilakukan selalu
pada artikel berbeda oleh Kereh, Sabandar, kurang dari 50 (dari skala nilai 0-100).
dan Tjiang, (2013). Dalam artikel ini akan
dideskripsikan hasil dari langkah keempat HASIL DAN PEMBAHASAN
sampai langkah ketujuh. Telah dikemukakan sebelumnya, konten
Pengembangan instrumen tes ini matematika dasar yang terkait dengan materi
dilakukan berbasis kriteria, yakni item tes dasar-dasar fisika inti baik konseptual maupun
yang dibuat berdasarkan tujuan/indikator prosedural meliputi: Operasi Hitung Bilangan
pencapaian yang ingin dicapai. Hal ini karena Bulat (penambahan, pengurangan, perkalian,
peneliti akan mengkaji kemampuan sekaligus dan pembagian), Operasi Hitung Bilangan
kesulitan mahasiswa dalam berbagai Berpangkat, Logaritma, Fungsi Eksponensial,
keterampilan matematika. Karena alasan itu Konversi Satuan, Persamaan Linear, Grafik
jugates yang dibuat berbentuk uraian dan (Membaca, Membuat, dan Menginterpretasi),
masalah. Instrumen penguasaan untuk materi Tabel (Membuat dan Menginterpretasi).
matematika dasar ini disusun oleh peneliti dan Semua konten matematik yang disebutkan di
divalidasi oleh pakar terkait. Ada 30 soal atas, diakomodasikan dalam penyusunan soal
dalam konten matematika dasar yang fisika inti. Sebenarnya, materi dasar-dasar
mencakup topik:Operasi Bilangan Bulat (4 kalkulus seperti limit dan persamaan
soal) , Operasi Bilangan Pecahan (8 soal), diferensial orde 1 linier juga termasuk dalam
Operasi Bilangan Berpangkat (4 soal), cakupan matematika yang terkait dengan
Konversi Satuan (1 soal), Persamaan Linier (3 materi fisika inti, akan tetapi karena rancangan
soal), Fungsi Eksponensial (3 soal), kuliah yang disusun berbasiskan aljabar
Logaritma (5 soal), Tabel (1 soal), dan Grafik tingkat sekolah dasar sampai sekolah
(1 soal). Soal konversi satuan pada dasarnya menengah maka materi-materi tersebut tidak
melibatkan operasi bilangan berpangkat juga dimasukkan dalam kajian ini.
akan tetapi fokus dalam soal tersebut adalah Pembuatan kisi-kisi soal tes biasanya
bagaimana mahasiswa menghubungkan mengacu langsung pada pembobotan materi,
informasi yang telah disediakan dalam soal tetapi dalam hal ini karena soal-soal yang
Validitas dan Reliabilitas Instrumen Tes Matematika. 43
Inti perma- Kalimat mudah Tidak me-ngan- Butir tes berada Kesesu-aian butir
salahan terletak dime-ngerti dung pembo- dalam lingkup tes dengan jenis
di stem rosan kata-kata konsep yang ketram-pilan
didefini-sikan generik sains
Kriteria B C J B C J B C J B C J B C J
Jumlah
30 0 0 30 0 0 30 0 0 30 0 0 30 0 0
Soal
Tabel 4 tersebut merupakan adaptasi dari tabel validasi instrumen yang dibuat oleh Widodo (2010),
dengan B adalah Baik; C adalah Cukup; dan J adalah Jelek. Pada tabel 4 tersebut terlihat
bahwa hasil validasi dari validator eksternal untuk seluruh soal dikategorikan baik (B).
mudah bagi mereka. Padahal, soal yang dibuat “Rasio berat benda di bulan dan di bumi
mencakup pengetahuan konseptual dan adalah 1:6. Hitunglah berat seseorang di
prosedural yang seharusnya sudah dikuasai di bulan, jika beratnya di bumi adalah 72 kg”.
jenjang pendidikan dasar dan menengah. Hasil Soal ini mendapat penilaian baik dari
uji coba ini menegaskan kondisi mahasiswa validator internal maupun eksternal karena
yang menjadi subyek penelitian ini termasuk berbentuk baku dalam bahasa matematika.
dalam kelompok mahasiswa berkemampuan Akan tetapi, soal ini menjadi bermasalah bagi
matematika rendah. mahasiswa fisika karena dalam konsep massa
dan berat dalam fisika bukanlah hal yang
Tabel 6. Tingkat Kesukaran
sama. Oleh karena itu, struktur soal
Instrumen Tes Matematika Dasar
selanjutnya dirubah dengan memuat konsep
P Klasifikasi Jumlah
fisika yang sesuai mengenai massa benda,
Soal
menjadi: “Rasio massa benda di bulan dan di
0,00-0,30 Soal sukar 19
bumi adalah 1:6. Hitunglah massa seseorang
0,31-0,70 Soal sedang 7
di bulan, jika massanya di bumi adalah 72
0,71-1,00 Soal mudah 4
kg”. Meskipun demikian, beberapa
Dengan melakukan perhitungan mahasiswa menjawab benar sebagaimana
menggunakan persamaan (2) dan merujuk yang diharapkan dalam penyelesaian soal
pada tabel 3, diperoleh hasil daya pembeda matematika. Beberapa soal lain yang
ketiga puluh soal yang disusun seperti pada meskipun indeks diskriminasinya rendah,
tabel 7 berikut: tetap digunakan. Keputusan ini diambil atas
Tabel 7. Hasil Evaluasi Item Soal dasarempat pertimbangan mendasar berikut,
Berdasarkan Daya Pembeda yaitu: (1) soal-soal tersebut dibuat dengan
berorientasi tujuan dan indikator yang
Indeks Evaluasi Jumlah disusun; (2) bahasa yang digunakan adalah
Diskriminasi Soal baku dalam soal matematika; (2) hasil
Item
validitas dan reliabilitas yang diperoleh tinggi,
0,40 Item yang 10 dan (3) penilaian pakar pada 30 butir soal
sangat baik 7 yang disusun berkategori baik.
0,30 – 0,39 Baik tapi
PENUTUP
mungkin perlu 3
Kesimpulan
diperbaiki
Hasil yang ada menunjukkan bahwa
Item yang 10
instrumen tes yang disusun dapat digunakan
0,20 – 0,29 biasanya perlu
untuk mengukur penguasaan matematika
untuk
dasar yang berkaitan dengan Fisika Inti. Ini
diperbaiki
dibuktikan oleh hasil analisis validitasnya
Item perlu
sebesar 0,77 yang dikategorikan tinggi dan
0,19 ditolak atau
reliabilitasnya sangat tinggi, yaitu sebesar
direvisi
0,87.
Pada tabel 7 terlihat bahwa ada 10 soal
dikategorikan baik, 7soal dikategorikan cukup DAFTAR PUSTAKA
dan sebanyak 10 soal harus diperbaiki karena Ary, D., Jacobs, L. C., & Razavieh, A. (2010).
masuk dalam kategori jelek. Perbaikan yang Introduction to Research in Education
dilakukan antara lain pada soal ke delapan (8th Ed). Belmont: Wadsworth, Cengage
yang strukturnya awalnya sebagai berikut: Learning.
Validitas dan Reliabilitas Instrumen Tes Matematika. 45