Anda di halaman 1dari 11

VALIDITAS DAN RELIABILITAS INSTRUMEN TES

MATEMATIKA DASAR YANG BERKAITAN DENGAN


PENDAHULUAN FISIKA INTI

Cicylia T. Kereh
Program Studi Pendidikan Fisika, FKIP - Universitas Pattimurah Ambon.
cicyliatk@yahoo.com
Liliasari
Program Studi Pendidikan IPA, SPS – UPI Bandung.
Paulus C. Tjiang
Jurusan Fisika, FTIS –Universitas Katolik Parahyangan Bandung
Jozua Sabandar
Program Studi Pendidikan Matematika, SPS - UPI Bandung.

Abstract: Development research test instrument math base on introduction nuclear physics
lecture has been done. The method used is quantitative descriptive stages as follows: (1)
Review basic math content that is relevant to the related nuclear physics through the study of
literature; (2) Prepare draft test instruments with reference to the objectives, competence
standard, basic competence, and indicators of achievement of design lectures were arranged;
(3) Ask the expert assessment (validation construction and content); (4) To test the test
instrument in a limited scope, evaluate and improve the existing deficiencies. The amount of
matter that is developed in this test is 30 grains form the description. Data analysis test results
of this test instruments in the group of students showed that the validity criteria are high, which
is equal to 0.77. The instrument reliability was 0.87 which included a very high category. This
means the resulting product meets the decent criteria, because validan reliable, but there are
still items that need revision based on suggestions and feedback from the validator.

Key words: introduction nuclear physics, validity, reliability.

Abstrak :Penelitian pengembangan instrumen tes Matematika Dasar yang berkaitan dengan
materi perkuliahan Pendahuluan Fisika Inti telah dilakukan. Metode yang digunakan adalah
deskriptif kuantitatif dengan tahap-tahap sebagai berikut: (1) Mengkaji konten matematika
dasar yang relevan dengan fisika inti terkait melalui studi literatur; (2) Menyusun rancangan
instrumen tes dengan mengacu pada tujuan, standar kompetensi, kompetensi dasar, dan
indikator pencapaian dari rancangan perkuliahan yang disusun; (3) Meminta penilaian dari para
ahli (validasi konstruksi dan konten); (4) Melakukan uji coba instrumen tes dalam lingkup
terbatas, mengevaluasi dan memperbaiki kekurangan yang ada. Jumlah soal yang
dikembangkan dalam tes ini adalah 30 butir berbentuk uraian. Analisis data hasil uji coba
instrumen tes ini pada kelompok mahasiswa menunjukkan bahwa validitas kriterianya tinggi,
yakni sebesar 0,77. Reliabilitas instrumen ini adalah 0,87 yang termasuk kategori sangat tinggi.
Ini berartiproduk yang dihasilkan sudah memenuhi kriteria layak, karena validdan reliabel,
namun masih ada item yang perlu revisi berdasarkan saran dan tanggapan dari validator.

Kata kunci: instrumen tes matematika dasar, validitas, reliabilitas.

36
Validitas dan Reliabilitas Instrumen Tes Matematika. 37

PENDAHULUAN mempraktekkan dan meningkatkan


Banyak penelitian tentang kaitan Fisika ketrampilan-ketrampilan matematikanya
dan Matematika yang telah dilakukan, antara terlebih dahulu. Oleh karena itu, dia
lain oleh Thorndike (1946) yang melakukan penelitian yang bertujuan untuk
menunjukkan adanya korelasi yang positif melihat hubungan kausal antara matematika
antara nilai matematika dan fisika di tahap dan fisika, secara khusus tentang kaitan antara
persiapan perguruan tinggi; dan antara nilai keterampilan matematika mahasiswa dan
fisika yang diperoleh di bangku kuliah dengan pengetahuan awal konseptual fisika sebagai
nilai pre tes matematika – yang mencakup faktor-faktor yang bisa mempengaruhi variasi
materi aljabar dan trigonometri (Hudson & pembelajaran mahasiswa. Dalam
McIntire,1977; Hudson & Rottmann, 1981). penelitiannya tersebut, ada empat kelompok
Selain itu, ada pula penelitian serupa yang yang diambil sebagai sampel. Hasil
menemukan adanya korelasi yang positif penelitiannya menunjukkan bahwa terdapat
antara nilai-nilai kuliah fisika dengan nilai tes korelasi yang signifikan antara keterampilan
matematika pada ujian masuk perguruan matematika mahasiswa dengan kenaikan nilai
tinggi seperti yang dilakukan oleh Blumental konseptual Fisika pada ketiga kelompok
(1961); Cohen et al.(1978); dan Halloun & mahasiswa dari keempat sampel tersebut.
Hestenes (1985). Motivasi di balik penelitian- Mata kuliah Pendahuluan Fisika Inti
penelitian tersebut adalah karena adanya adalah mata kuliah lanjut di Program Studi
asumsi bahwa salah satu faktor yang Pendidikan Fisika di Universitas Pattimura.
mempengaruhi proses dan hasil belajar fisika Materi kuliah tersebut bersifat abstrak karena
adalah penguasaan matematika oleh peserta substansi mata kuliah ini adalah pengkajian
didik. Anggapan dasar ini timbul karena bagian mikroskopik bahan yang gejala
esensi matematika sebagai “bahasa” ataupun fisisnya tidak teramati oleh indera manusia.
“alat” dalam berbagai disiplin ilmu, termasuk Oleh karena itu, untuk memahami sejumlah
dalam merepresentasikan gejala fisis dan model matematis di dalamnya, dibutuhkan
pemecahan masalah fisika. Hal ini diakui oleh kemahiran matematika. Keadaan inilah yang
Quale (2011) yang mengatakan bahwa untuk menyebabkan materi Pendahuluan Fisika Inti
merepresentasikan hukum-hukum ilmiah yang sulit diserap oleh mahasiswa terutama yang
digunakan dan penyelidikan konsekuensi memiliki kemampuan matematika yang
hukum-hukum dalam fisika dan berbagai rendah. Materi Fisika Inti dipilih sebagai
cabang ilmunya, sangat dibutuhkan formulasi kajian dalam penelitian ini karena pada
matematika. Pemecahan masalah dapat perkuliahan di tahun-tahun sebelumnya
dilakukan dengan menggunakan model ditemukan beberapa fakta berikut: (1) dalam
matematika yang sesuai, antara lain untuk pengkajian lembar kerja ujian tengah semester
meramalkan waktu evolusi dari suatu sistem (UTS) terlihat beberapa mahasiswa
fisis, ataupun memperkirakan keadaan awal mengalami kesulitan dalam penyelesaian soal
suatu kejadian fisis di masa yang lampau. yang berkaitan dengan operasi hitung yang
Semua korelasi dalam penelitian- menggunakan bilangan terutama bilangan
penelitian tersebut di atas tidak menunjukkan yang sangat kecil (berpangkat negatif); (2) ada
bukti langsung adanya hubungan sebab akibat indikasi mahasiswa kurang menguasai
antara matematika dan fisika sehingga penggunaan kalkulator dalam perhitungan.
menurut Meltzer (2002) tidak bisa Keadaan yang serupa terlihat pada dua
disimpulkan bahwa agar performans seorang angkatan mahasiswa (tahun akademik 2007-
mahasiswa pada mata kuliah Fisika Dasar 2008 dan 2008-2009) yang dikaji lembar
menjadi baik, maka yang bersangkutan perlu kerjanya. Situasi yang telah dijelaskan di atas
38 JURNAL INOVASI DAN PEMBELAJARAN FISIKA, VOLUME 2, NOMOR 1, MEI 2015.

mengindikasikan kurangnya penguasaan Untuk menilai penguasaan Matematika


matematika dasar oleh mahasiswa, termasuk Dasar mahasiswa, dibutuhkan suatu instrumen
ketrampilan prosedural perhitungan yang pengukur hal tersebut.Padadasarnya, untuk
sangat mendasar. penelitian penilaian hasil proses suatu
Meskipun banyak penelitian yang pembelajaran, instrumennya dapat berupa tes
mengkaji hubungan antara matematika dan ataupun non tes. Mehrens dan Lehmann
fisika seperti yang telah diungkapkan di atas, (1991) mendefinisikan tes sebagai
akan tetapi sejauh yang diketahui penulis, seperangkat pertanyaan yang harus dijawab
belum pernah dilakukan penelitian yang seseorang yang digunakan untuk mengukur
secara khusus mengkaji hubungan antara karakteristik seseorang yang menjawab
penguasaan materi Matematika Dasar yang deretan pertanyaan tersebut. Crocker dan
relevan dengan materi Pendahuluan Fisika Algina (2008) mengatakan bahwa suatu tes
Inti. Oleh karena itu, tujuan penelitian ini dapat didefinisikan sebagai suatu prosedur
adalah untuk mengembangkan satu set standar untuk mendapatkan suatu sampel
instrumen tes penguasaan Matematika Dasar kelakuan dari domain yang spesifik.Menurut
yang berkaitan dengan konten dasar-dasar Haladyna (2004), tes adalah suatu alat ukur
fisika inti. Rumusan pertanyaan penelitian ini yang dimaksudkan untuk mendeskripsikan
adalah: (1) bagaimana reliabilitas instrumen secara numerik derajat atau banyaknya
tes Matematika Dasar yang disusun? (2) pembelajaran dalam keseragaman, kondisi
bagaimana validitas instrumen tes matematika yang terstandar. Adapun Ary, Jacobs, dan
dasar tersebut? Razavieh (2010) mengatakan bahwa suatu tes
Fisika adalah ilmu pengetahuan tentang adalah sekumpulan rangsangan yang
alam sekitar dan bagaimana segala sesuatu di diberikan pada seseorang yang bertujuan
dalamnya bekerja (Lang, 2009). Dalam Fisika untuk memperoleh tanggapan yang kemudian
dipelajari berbagai gejala/fenomena alam diskor. Skor inilah yang merepresentasikan
yang mencakup materi, gerak, serta energi kelakuan/karakteristik individu tersebut. Dari
yang menyertainya. Menurut Halliday, semua definisi di atas dapat disimpulkan
Resnick, dan Walker (2007), untuk bahwa dalam dunia pendidikantes digunakan
menemukan hukum-hukum mendasar tentang sebagai salah satu alat atau teknik atau
alam, dalam fisika dilakukan eksperimen dan prosedur yang standar digunakan
pengukuran kuantitatif. Hukum-hukum dasar dalammengevaluasi hasil dan proses
tersebut selanjutnya digunakan dalam pembelajaran untuk mengukur pengetahuan,
pengembangan teori untuk meramalkan hasil kemampuan kognitif, dan/atau ketrampilan
eksperimen-eksperimen berikutnya. Pemerian peserta didik.
hukum-hukum dasar dalam teori fisika Tes pencapaian disebut juga tes
dinyatakan dalam bahasa matematika. Dengan penguasaan, biasa digunakan di semua jenjang
kata lain, matematika memegang peranan pendidikan formal dan digunakan untuk
yang sangat penting dalam menjelaskan dan mengukur apa yang sudah dipelajari oleh
menjabarkan gejala fisika. Penggunaan peserta didik dalam domain tertentu. Menurut
representasi matematis dalam pemerian Popham (1990), ada dua alternatif pendekatan
konsep fisika dapat membantu pebelajar dalam tes pendidikan, yaitu tes acuan normal
dalam memahami gejala fisika terkait. Oleh dan tes acuan kriteria. Tes acuan kriteria
sebab itu, matematika merupakan materi yang digunakan untuk menentukan kedudukan
sangat esensial untuk dipelajari dalam individu dalam domain asesmen yang
pendidikan calon pendidik fisika. didefinisikan. Tes ini dapat berupa tes
berbasis tujuan yang telah ditetapkan ataupun
Validitas dan Reliabilitas Instrumen Tes Matematika. 39

tes yang mengacu pada domain yang harus dilakukan pada kelompok lain tapi
ditentukan. Tes yang berbasis tujuan adalah memiliki karakteristik yang serupa dengan
tes yang item-itemnya dikonstruksi untuk yang kelompok yang akan diteliti. Hasil uji
mengukur tujuan instruksional sedangkan tes coba tersebut harus dianalisis validitas dan
berbasis domain adalah pengukuran yang reliabilitasnya untuk mendeteksi kekurangan
dilakukan mengacu pada domain perilaku tes tersebut sebelum digunakan.
pebelajar. Tes berbasis tujuan biasanya Sebuah tes dapat berbentuk essay
dilakukan oleh guru pada tes formatif ataupun soal (masalah). Tes uraian/essay
sedangkan tes berbasis domain pada ujian adalah tes yang berbentuk pertanyaan ataupun
sumatif. perintah yang menghendaki paparan kalimat
Tes formatif adalah tes yang biasanya yang memuat penjelasan, penilaian,
dilakukan pada akhir pembelajaran suatu penafsiran, dan sebagainya yang umumnya
topik. Tes ini sangat berguna untuk cukup panjang.Tes ini merupakan suatu
mengetahui perkembangan peserta didik dan metode yang standar yang dapat digunakan
bagaimana kurikulum dijalankan dari hari ke untuk mengukur pemahaman, dan ketrampilan
hari.Hasil kajian suatu tes formatif berguna sintesis dan evaluasi seseorang. Pembuatan tes
bagi guru dan siswa dalam refleksi ini relatif mudah, akan tetapi pemeriksaan
pembelajaran yang sudah dilakukan. hasilnya membutuhkan waktu yang panjang.
Sebaliknya, tes sumatif dilakukan setelah Hasil pemeriksaan dari dua orang atau lebih
suatu periode (mid semester, semester, akan bervariasi. Oleh karena itu tes ini sering
ataupun akhir tahun ajaran) yang pula disebut tes subjektif. Selain essay, tes
dimaksudkan untuk mengukur apa yang telah juga dapat berbentuk soal-soal (masalah).
dipelajari peserta didik setelah suatu Bentuk soal ini sangat potensial untuk
keseluruhan pembelajaran (menyangkut mengukur ketrampilan aplikasi, analisis, dan
beberapa topik sekaligus). Hasil tes sumatif pemecahan masalah. Soal yang kompleks
digunakan untuk banyak hal antara lain: untuk relatif sulit untuk dibuat, begitu pula
pemberian nilai siswa, evaluasi efektivitas pemeriksaannya (Brown, Bull, dan Pedlebury,
kurikulum, menilai pencapaian akademik 1997).
siswa, sekolah, ataupun daerah secara umum Berbagai penelitian pengembangan
selama tahun akademik berjalan (Kubiszyn instrumen tes telah dilakukan oleh para ahli,
dan Borich, 2013). salah satunya oleh Indrawati (2009) dalam
Dalam mengukur pencapaian bidang psikologi. Kajian khusus
mahasiswa, tidak selalu tersedia instrumen tes tentangreliabilitas dan validitas tes, dilakukan
standar yang sesuai dengan tujuan penelitian, oleh banyak pihak, antara lain: Wass et al.
oleh karena itu peneliti harus mengkonstruksi (2001) meneliti tentang asesmen kompetensi
sendiri instrumen tes tersebut. Menurut Ary, klinik; Golafshani (2003) yang
Jacobs, dan Razavieh (2010), tes yang dibuat mengklarifikasi tentang kedua hal tersebut
sendiri tersebut dapat dibuat sedemikian rupa dalam penelitian kualitatif; danVan Saane et
yang kontennya mencakup kajian yang akan al. (2003) yang meneliti kedua hal tersebut
dibahas, ataupun ketrampilan-ketrampilan untuk beberapa instrumen yang digunakan
tertentu yang akan diukur. Akan tetapi, dalam dalam mengevaluasi kepuasan kerja. Dalam
pembuatan suatu tes harus diperhatikan bidang pendidikan fisika, Maloney et al.
reliabilitas dan validitas intrumen tersebut (2011) melakukan penelitian pengembangan
atau dengan kata lain, soal tersebut harus diuji instrumen tes penguasaan listrik magnet,
coba terlebih dahulu sebelum digunakan pada sedangkanJandaghi (2011) meneliti tentang
penelitian yang sebenarnya. Uji coba tersebut
40 JURNAL INOVASI DAN PEMBELAJARAN FISIKA, VOLUME 2, NOMOR 1, MEI 2015.

validitas dan reliabilitas tes ketrampilan guru dengan ID merupakan daya pembeda, RU
dalam mendisain soal ujian fisika. adalah banyaknya peserta tes kelompok atas
Sebelum digunakan, suatu tes harus yang menjawab soal dengan benar. RLadalah
dianalisis sebelumnya untuk mengetahui banyaknya peserta tes kelompok bawah yang
kualitasnya. Analisis yang dilakukan biasanya menjawab soal dengan benar, dan T
mencakup tingkat kesukaran, daya pembeda, merupakan banyaknya peserta tes. Kriteria
validitas dan reliabilitas. Item soal yang pembeda soal dilakukan dengan merujuk pada
memiliki kualitas rendah harus direvisi. Untuk tabel klasifikasi ID dari Ebel dan Frisbie
mengetahui suatu butir soal tergolong sukar, (1991)berikut:
sedang, atau mudah dilakukan pengujian
dengan menggunakan persamaan: Tabel 2. Klasifikasi Daya Pembeda Soal
Indeks Evaluasi Item
Diskriminasi
R
P  100% (1)
T  0,40 Item yang sangat baik
0,30 – 0,39 Baik tapi mungkin perlu
diperbaiki
dengan P adalah indeks kesukaran, R adalah 0,20 – 0,29 Item yang biasanya perlu
banyaknya mahasiswa yang menjawab soal untuk diperbaiki
benar dan T adalah jumlah seluruh mahasiswa  0,19 Item perlu ditolak atau
peserta tes (Mehrens dan Lehmann, 1991). direvisi
Hasil perhitungan indeks kesukaran tersebut
selanjutnya diklasifikasikan sesuai dengan Validitas suatu tes berkenaan
tabel berikut: konsistensi atau akurasi skor yang ada
mengukur suatu kemampuan kognitif yang
terkait. Ada empat macam validitas, yaitu
validitas prediktif, validitas konkuren,
Tabel 1. Klasifikasi Tingkat validitas konstruksi dan validitas konten.
Kesukaran Soal Validitas prediktif adalah validitas yang
P Klasifikasi berkaitan dengan apakah tes tersebut secara
0,00-0,30 Soal sukar akurat dapat meramalkan performans
0,31-0,70 Soal sedang seseorang di masa depan. Validitas konkuren
0,71-1,00 Soal mudah berkaitan apakah uji yang dilakukan
berkorelasi atau secara substansial
Untuk mengetahui apakah suatu butir memberikan hasil yang sama dengan tes lain
soal mampu membedakan antara mahasiswa yang menguji ketrampilan yang sama, dengan
kelompok atas dengan mahasiswa kelompok catatan tes yang lain tersebut haruslah valid.
bawah dilakukan Uji Daya Pembeda Soal. Validitas konstruksi berkaitan dengan apakah
Dalam penelitian ini, daya pembeda butir soal tes tersebut konstruksinya memadai untuk
dihitung dengan menggunakan persamaan mengukur ketrampilan yang akan dinilai,
yang diberikan oleh Mehrens dan Lehmann, sedangkan validitas konten berkaitan dengan
(1991): ketercukupan, kesesuaian dengan konten yang
RU  RL diajarkan atau domain yang akan diukur.
ID  1
(2) Validitas konten ini didasarkan pada penilaian
2T dari orang yang professional/pakar atas aspek
yang akan dinilai. Validitas konkuren dan
Validitas dan Reliabilitas Instrumen Tes Matematika. 41

validitas prediktif biasanya digabungkan korelasi antara dua bagian suatu tes pada
menjadi validitas kriteria karena keduanya penggunaan metode belah dua sering berbeda
berkaitan dengan peramalan performans pada dan bergantung pada pembagian/pemisahan
beberapa kriteria pada waktu yang sama atau yang dibuat. Begitu juga penggunaan metode
masa yang akan datang (Gipps, 1994). tes dan re-tes (pengulangan) pada dasarnya
Pengujian validitas instrumen bermasalah karena pengalaman pada tes yang
Matematika Dasar yang akan digunakan pertama akan mempengaruhi penampilan
adalah uji validitas isi (content validity) dan mahasiswa pada tes yang kedua. Di sisi lain,
uji validitas kriteria(criteria related validity). ada klaim sebelumnya dari Charles (1995)
Uji validitas harus dilakukan karena dengan yang mengatakan bahwa ada konsistensi dari
ini dapat dilihat kesahihan suatu instrumen jawaban individual atas item kuesioner/tes
dalam mengukur apa yang hendak diukur. pada metode tes dan re-tes. Pada penelitian
Untuk mengetahui validitas konten, soal ini, reliabilitas tes dihitung dengan
divalidasi oleh pakar – dalam hal ini dosen menggunakan rumus metode belah dua seperti
yang memiliki kompetensi di bidang persamaan yang diberikan oleh persamaan
matematika sedangkan untuk validitas kriteria berikut:
digunakan uji statistik dengan 2 x r1 1 (4)
mengkorelasikan tiap ítem dengan skor r1 1  2 2

 
totalnya dengan rumus korelasi Pearson: 1  r1 1 
 
 2 2 

𝑟𝑥𝑦 =
𝑛 ∑ 𝑋𝑌−(∑ 𝑋)(∑ 𝑌)
(3) dengan: r11 = reliabilitas instrumen dan r1 1
2 2
√[𝑛(∑ 𝑋 2 −(∑ 𝑋) )][𝑛(∑ 𝑌 2 −(∑ 𝑌) )] 22

indeks korelasi antara dua belahan instrumen.


Harga rxy pada α =0,005 (Ebel dan Frisbie, Kriteria koefisien korelasi yang digunakan
1991). seperti dikatakan oleh David (2011) yang
Reliabilitas suatu tes berkaitan dengan ditunjukkan pada Tabel 3 berikut:
keakuratannya untuk mengukur ketrampilan Tabel 3. Klasifikasi Korelasi
atau pencapaian atas apa yang mau diukur.
Dengan kata lain, reliabilitas berhubungan Koefisien Korelasi Keterangan
dengan konsistensi performans pebelajar 0,00 -0,20 Sangat rendah
(Gipps, 1994). Uji reliabilitas tes dilakukan 0,21 -0,40 Rendah
untuk menguji tingkat keajegan soal yang 0,41 -0,60 Cukup
digunakan. Carmines & Zeller (1979) 0,61 -0,80 Tinggi
menyatakan bahwa reliabilitas suatu 0,81 -1,00 Sangat tinggi
instrumen dapat ditaksir dengan melakukan
perhitungan indeks korelasi menggunakan
METODE
salah satu pendekatan yang standar berikut:
Penelitian ini adalah penelitian
(1) tes dan re-tes, (2) bentuk-bentuk alternatif,
deskriptif kuantitatif dan merupakan bagian
dan dengan (3) membagi suatu tes menjadi
dari penelitian pengembangan program
dua bagian. Pendapat yang serupa juga
perkuliahan Pendahuluan Fisika Inti bagi
dinyatakan oleh Kirk dan Miller (1986). Brito,
mahasiswa berkemampuan matematika
Sharma, dan Bernas (2004) berargumen,
rendah. Prosedur yang dilakukan adalah
peneliti dapat menggunakan berbagai cara
sebagai berikut: (1) Melakukan refleksi atas
tersebut di atas akan tetapi harus sadar dengan
program perkuliahan yang sudah berjalan; (2)
kekuatan dan kelemahannya. Contohnya, hasil
Mengumpulkan dan menganalisis lembar
42 JURNAL INOVASI DAN PEMBELAJARAN FISIKA, VOLUME 2, NOMOR 1, MEI 2015.

kerja ujian tengah semester mahasiswa; (3) untuk digunakan dalam mengkonversi satuan
Mengkaji konten matematika dasar dan fisika yang diminta. Begitu pula soal grafik yang
inti yang terkait melalui studi literatur; (4) yang ada, intinya mencakup fungsi
Mengembangkan rancangan instrumen eksponensial dan mahasiswa diminta untuk
penilaian berdasarkan hasil yang diperoleh merepresentasinya dalam grafik.
pada langkah-langkah sebelumnya yang Subyek penelitian adalah mahasiswa
meliputi: merumuskan tujuan perkuliahan, calon guru fisika semester delapan pada
standar kompetensi, kompetensi dasar, Program Studi Pendidikan Fisika di FKIPdi
indikator penguasaan, memilih instrumen suatu perguruan tinggi di Indonesia bagian
evaluasi yang sesuai dengan tujuan yang telah timur. Telah dikemukan sebelumnya bahwa
dirumuskan; (5) Menulis soal tes pengukuran penelitian ini merupakan bagian dari
penguasaan materi matematika dasar, (6) penelitian pengembangan program
Meminta penilaian para ahli atas draft perkuliahan untuk mahasiswa yang
instrumen tes yang disusun (validasi berkemampuan matematika rendah. Ini
konstruksi dan konten); (7) Melakukan uji didasarkan pada hasil tes entry behaviour
coba instrumen tes tersebut dalam lingkup (TEB) yang diadakan di FKIP di mana nilai
terbatas, dievaluasi dan diperbaiki kekurangan rata-rata mahasiswa maupun nilai maksimum
yang ada. Langkah pertama sampai ketiga yang diperoleh mahasiswa dalam tes tersebut
telah dilakukan dan hasilnya telah dipaparkan selama beberapa tahun sejak dilakukan selalu
pada artikel berbeda oleh Kereh, Sabandar, kurang dari 50 (dari skala nilai 0-100).
dan Tjiang, (2013). Dalam artikel ini akan
dideskripsikan hasil dari langkah keempat HASIL DAN PEMBAHASAN
sampai langkah ketujuh. Telah dikemukakan sebelumnya, konten
Pengembangan instrumen tes ini matematika dasar yang terkait dengan materi
dilakukan berbasis kriteria, yakni item tes dasar-dasar fisika inti baik konseptual maupun
yang dibuat berdasarkan tujuan/indikator prosedural meliputi: Operasi Hitung Bilangan
pencapaian yang ingin dicapai. Hal ini karena Bulat (penambahan, pengurangan, perkalian,
peneliti akan mengkaji kemampuan sekaligus dan pembagian), Operasi Hitung Bilangan
kesulitan mahasiswa dalam berbagai Berpangkat, Logaritma, Fungsi Eksponensial,
keterampilan matematika. Karena alasan itu Konversi Satuan, Persamaan Linear, Grafik
jugates yang dibuat berbentuk uraian dan (Membaca, Membuat, dan Menginterpretasi),
masalah. Instrumen penguasaan untuk materi Tabel (Membuat dan Menginterpretasi).
matematika dasar ini disusun oleh peneliti dan Semua konten matematik yang disebutkan di
divalidasi oleh pakar terkait. Ada 30 soal atas, diakomodasikan dalam penyusunan soal
dalam konten matematika dasar yang fisika inti. Sebenarnya, materi dasar-dasar
mencakup topik:Operasi Bilangan Bulat (4 kalkulus seperti limit dan persamaan
soal) , Operasi Bilangan Pecahan (8 soal), diferensial orde 1 linier juga termasuk dalam
Operasi Bilangan Berpangkat (4 soal), cakupan matematika yang terkait dengan
Konversi Satuan (1 soal), Persamaan Linier (3 materi fisika inti, akan tetapi karena rancangan
soal), Fungsi Eksponensial (3 soal), kuliah yang disusun berbasiskan aljabar
Logaritma (5 soal), Tabel (1 soal), dan Grafik tingkat sekolah dasar sampai sekolah
(1 soal). Soal konversi satuan pada dasarnya menengah maka materi-materi tersebut tidak
melibatkan operasi bilangan berpangkat juga dimasukkan dalam kajian ini.
akan tetapi fokus dalam soal tersebut adalah Pembuatan kisi-kisi soal tes biasanya
bagaimana mahasiswa menghubungkan mengacu langsung pada pembobotan materi,
informasi yang telah disediakan dalam soal tetapi dalam hal ini karena soal-soal yang
Validitas dan Reliabilitas Instrumen Tes Matematika. 43

disusun mengacu pada indikator pencapaian


yang telah dirumuskan, maka distribusi soal
dalam tiap ranah kognitif tidak merata seperti
yang biasa dilakukan dalam proses
penyusunan soal umumnya untuk ujian/tes
sumatif. Instrumen tes tersebut divalidasi oleh
pakar internal terlebih dahulu dan setelah
mendapat persetujuan dari validator internal
baru kemudian divalidasi oleh pakar eksternal.
Oleh karena itu, yang disajikan di sini
hanyalah hasil validasi dari validator
eksternal, yang dapat dilihat pada tabel 4.

Tabel 4. Hasil Validasi Instrumen Tes dari Pakar Eksternal

Inti perma- Kalimat mudah Tidak me-ngan- Butir tes berada Kesesu-aian butir
salahan terletak dime-ngerti dung pembo- dalam lingkup tes dengan jenis
di stem rosan kata-kata konsep yang ketram-pilan
didefini-sikan generik sains
Kriteria B C J B C J B C J B C J B C J
Jumlah
30 0 0 30 0 0 30 0 0 30 0 0 30 0 0
Soal

Tabel 4 tersebut merupakan adaptasi dari tabel validasi instrumen yang dibuat oleh Widodo (2010),
dengan B adalah Baik; C adalah Cukup; dan J adalah Jelek. Pada tabel 4 tersebut terlihat
bahwa hasil validasi dari validator eksternal untuk seluruh soal dikategorikan baik (B).

Ketiga puluh soal dikerjakan mahasiswa digunakan seterusnya karena kualifikasinya


dalam waktu 2 jam. Deskripsi hasil uji coba baik.
instrumen tes matematika dasar tersebut dapat
Tabel 5. Deskripsi Hasil Uji Coba
dilihat pada tabel 5.Pada tabel tersebut terlihat
Instrumen Matematika
bahwa indeks korelasi yang diperoleh dengan
Komponen Nilai
perhitungan menggunakan rumus Pearson
Nilai maximum 69,3
seperti pada persamaan (3) adalah 0,77. Ini
Nilai minimum 2,3
menunjukkan bahwa soal tes yang dibuat
Rerata 25,2
validitasnya tinggi, begitu juga reliabilitasnya
Simpang baku 16,8
sangat tinggi karena bernilai 0,87. Mengacu
pada pendapat Carmines & Zeller (1979) yang Korelasi 0,77
menyatakan bahwa setidaknya ada dua sifat Reliabilitas tes 0,87
dasar yang dapat dijadikan acuan kualitas dari Hasil analisis tingkat kesukaran soal
suatu instrumen pengukuran empirik, yaitu yang dibuat ditunjukkan oleh tabel 6. Pada
reliabilitas dan validitasnya, maka instrumen tabel tersebut terlihat bahwa ada 19 soal yang
tes Matematika Dasar yang dibuat dapat tergolong sukar bagi mahasiswa, 11 soal
dikategorikan sedang, dan hanya 4 soal yang
44 JURNAL INOVASI DAN PEMBELAJARAN FISIKA, VOLUME 2, NOMOR 1, MEI 2015.

mudah bagi mereka. Padahal, soal yang dibuat “Rasio berat benda di bulan dan di bumi
mencakup pengetahuan konseptual dan adalah 1:6. Hitunglah berat seseorang di
prosedural yang seharusnya sudah dikuasai di bulan, jika beratnya di bumi adalah 72 kg”.
jenjang pendidikan dasar dan menengah. Hasil Soal ini mendapat penilaian baik dari
uji coba ini menegaskan kondisi mahasiswa validator internal maupun eksternal karena
yang menjadi subyek penelitian ini termasuk berbentuk baku dalam bahasa matematika.
dalam kelompok mahasiswa berkemampuan Akan tetapi, soal ini menjadi bermasalah bagi
matematika rendah. mahasiswa fisika karena dalam konsep massa
dan berat dalam fisika bukanlah hal yang
Tabel 6. Tingkat Kesukaran
sama. Oleh karena itu, struktur soal
Instrumen Tes Matematika Dasar
selanjutnya dirubah dengan memuat konsep
P Klasifikasi Jumlah
fisika yang sesuai mengenai massa benda,
Soal
menjadi: “Rasio massa benda di bulan dan di
0,00-0,30 Soal sukar 19
bumi adalah 1:6. Hitunglah massa seseorang
0,31-0,70 Soal sedang 7
di bulan, jika massanya di bumi adalah 72
0,71-1,00 Soal mudah 4
kg”. Meskipun demikian, beberapa
Dengan melakukan perhitungan mahasiswa menjawab benar sebagaimana
menggunakan persamaan (2) dan merujuk yang diharapkan dalam penyelesaian soal
pada tabel 3, diperoleh hasil daya pembeda matematika. Beberapa soal lain yang
ketiga puluh soal yang disusun seperti pada meskipun indeks diskriminasinya rendah,
tabel 7 berikut: tetap digunakan. Keputusan ini diambil atas
Tabel 7. Hasil Evaluasi Item Soal dasarempat pertimbangan mendasar berikut,
Berdasarkan Daya Pembeda yaitu: (1) soal-soal tersebut dibuat dengan
berorientasi tujuan dan indikator yang
Indeks Evaluasi Jumlah disusun; (2) bahasa yang digunakan adalah
Diskriminasi Soal baku dalam soal matematika; (2) hasil
Item
validitas dan reliabilitas yang diperoleh tinggi,
 0,40 Item yang 10 dan (3) penilaian pakar pada 30 butir soal
sangat baik 7 yang disusun berkategori baik.
0,30 – 0,39 Baik tapi
PENUTUP
mungkin perlu 3
Kesimpulan
diperbaiki
Hasil yang ada menunjukkan bahwa
Item yang 10
instrumen tes yang disusun dapat digunakan
0,20 – 0,29 biasanya perlu
untuk mengukur penguasaan matematika
untuk
dasar yang berkaitan dengan Fisika Inti. Ini
diperbaiki
dibuktikan oleh hasil analisis validitasnya
Item perlu
sebesar 0,77 yang dikategorikan tinggi dan
 0,19 ditolak atau
reliabilitasnya sangat tinggi, yaitu sebesar
direvisi
0,87.
Pada tabel 7 terlihat bahwa ada 10 soal
dikategorikan baik, 7soal dikategorikan cukup DAFTAR PUSTAKA
dan sebanyak 10 soal harus diperbaiki karena Ary, D., Jacobs, L. C., & Razavieh, A. (2010).
masuk dalam kategori jelek. Perbaikan yang Introduction to Research in Education
dilakukan antara lain pada soal ke delapan (8th Ed). Belmont: Wadsworth, Cengage
yang strukturnya awalnya sebagai berikut: Learning.
Validitas dan Reliabilitas Instrumen Tes Matematika. 45

Blumenthal, R. H. (1961). Multiple Haladyna, T, M. (2004). Developing And


instruction and other factors related to Validating Multiple-Choice Test Items 3rd
achievement in college physics. Science Edition. New Jersey London: Mahwah
Education, 45, 336–342. Halliday, D., Resnick, R., & Walker, J.
Brito, C. F. Sharma, A., & Bernas, R. S. (2007). Fundamentals of Physics 8th Ed.
(2004). Assessing Student Learning Canada: John Wiley & Sons Canada.
Using A Local Comprehensive Exam: Halloun, I. A. & Hestenes, D. (1985). The
Insights From Eastern Illinois University. initial knowledge state of college physics
Measuring Up Educational Assessment students. American Journal of Physics,
Challenges and Practices for 53, 1043–1055.
Psychology. Edited by Dunn, D. S., Hudson, H. T., & McIntire, W. R. (1977).
Mehrotra, C. M., & Halonen, J. S. American Journal of Physics, 45, 470-
Washington, DC: American 471.
Psychological Association Hudson, H. T. & Rottmann, R. M. (1981).
Brown, G., Bull, J., & Pedlebury, M. (1997). Correlation Between Performance In
Assessing Student in Higher Eduation. Physics And Prior Mathematics
London dan New York: Routledge. Knowledge. Journal Of Research In
Carmines, E. G., & Zeller, R. A. (1979). Science Teaching, 18 (4), 291-294
Reliability and Validity Assessment. Iowa Indrawati, S. W. (2009). Pengembangan
City: Sage Publications, Inc. Instrumen Tes Psikologis Berbasis Tik.
Charles, C. M. (1995). Introduction to Jurnal Penelitian, 9 (1)
educational research (2ndEd.). San Jandaghi, G. (2011). Assessment of Validity,
Diego, Longman. Reliability and Difficulty Indices for
Cohen H. D., Hillman, D. F., & Agne, R. M. Teacher-built Physics Exam Questions in
(1978). Cognitive level and college First Year High School. Arts and Social
physics achievement. American Journal Sciences Journal, 2011, ASSJ-16
of Physics, 46, 1026–1029. Kereh, C. T., Sabandar, J, & Tjiang, P. C.
Crocker, L., & Algina, J. (1986). Introduction (2013). Identifikasi Kesulitan Belajar
to Classical and Modern Test Theory. Mahasiswa dalam Konten Matematika
Toronto: Holt, Rine Hart, and Winston, pada Materi Pendahuluan Fisika Inti.
Inc. Prosiding Seminar Nasional Sains dan
David, Ruth. (2011). Practical Statistics for Pendidikan Sains VIII UKSW, 9 – 15.
Educators. Lanham, Maryland – USA: Kirk, J., & Miller, M. L. (1986). Reliability
Rowman & Littlefield Publishers, Inc and Validity in Qualitative Research.
Ebel, R. L. & Frisbie, D. A. (1991). Beverly Hills: Sage Publications.
Essensials Of Educational Measurement, Kubiszyn, T., dan Borich, G. (2013).
5th Ed. New Delhi: Prentice Hall. Educational Testing and Measurement:
Gipps, C. V. (1994). Beyond Testing: Classroom Application and Practice 10th
Towards a Theory of Educational Ed. Jefferson City: John Wiley & Sons.
Assessment. Washington DC: The Falmer Lang, H. (2009). Head First Physics.
Press. Sebastopol: O’Reilly Media,
Golafshani, N. (2003). Understanding Inc.,Maloney, D. P., O’Kuma, T. L.,
Reliability and Validity in Qualitative Hieggelke, C. J., & Van Heuvelen, A. (2001).
Research. The Qualitative Report, 8, Surveying Students’ Conceptual
597– 607. Knowledge Of Electricity And
46 JURNAL INOVASI DAN PEMBELAJARAN FISIKA, VOLUME 2, NOMOR 1, MEI 2015.

Magnetism. American Journal of School Science and Mathematics, 46 (7),


Physics,69 (S1). 593–690
Mehren, A. M., & Lehmann, I. J. (1991). Van Saane, N., Sluiter, J. K., Verbeek, J. H.,
Measurement and Evaluation in & Frings-Dresen, M. H. (2003).
Education and Psychology. USA: Ted Reliability and validity of instruments
Buchholz measuring job satisfaction - a systematic
Meltzer, D. E. (2002). The relationship review. Occupational Medicine, 53(3),
between mathematics preparation and 191-200
conceptual learning gains in physics: A Wass, V., Van der Vleuten, C., Shatzer, J., &
possible ‘‘hidden variable’’ in diagnostic Jones, R. (2001). Assessment of
pretest scores. American Journal of clinicalcompetence. The Lancet
Physics 70 ~12. 357(9260), 945-949
Popham, W. J. (1990). Modern Educational
Measurement: A Practitioner’s Widodo, W. (2010). Pengembangan Model
Perspective 2 nd Ed. Needham Heights: Pembelajaran “Mikir” Pada Perkuliahan
Allyn and Bacon. Fisika Dasar Untuk Meningkatkan
Quale, A. (2011). On the Role of Mathematics Keterampilan Generik Sains Dan
in Physics: A Constructivist Epistemic Pemecahan Masalah Calon Guru Smk
Perspective. Science & Education (2011) Program Keahlian Tata Boga. Disertasi.
20:609–624 Tidak dipublikasikan.
Thorndike, A. (1946). Correlation Between
Physics And Mathematics Grades.

Anda mungkin juga menyukai