MODUL 5
KEGIATAN BELAJAR I
KUALITAS ALAT UKUR (INSTRUMEN)
PENDAHULUAN
Baca Juga
Untuk mengukur sesuatu kita harus dapat memilih alat ukur yang sesuai agar kita
dapat memperoleh hasil pengukuran yang tepat. Sebagai contoh, seorang pemanah
akan dinyatakan sebagai pemenang jika hasil bidikannya dapat dengan tepat
mengenai sasaran yaitu daerah lingkaran yang paling dalam atau yang paling
mendekati lingkaran yang paling dalam. Jika hasil bidikan peserta didik dapat
mengenai daerah di lingkaran paling dalam maka ia akan memperoleh skor tertinggi
dan perolehan skor tersebut semakin berkurang jika hasil bidikannya jauh dari
sasaran. Karena anak panah yang harus dilepaskan tidak hanya satu maka
pemanah dituntut untuk tetap dapat melepaskan anak panahnya tepat mengenai
sasaran.
Hasil bidikan dari peserta bisa tepat mengenai sasaran atau juga melesat dari
sasaran. Hasil yang sama dapat terjadi pada saat anda mengukur hasil belajar
siswa. Jika alat ukur yang anda gunakan tidak anda persiapkan dengan cermat
maka skor yang anda peroleh tidak dapat menggambarkan dengan tepat tingkat
kemampuan siswa.Dari penjelasan tersebut terdapat dua masalah pokok yang harus
diperhatikan dalam menyusun alat ukur hasil belajar yang baik yaitu masalah yang
berhubungan dengan ketepatan hasil pengukuran dan ketetapanhasil
pengukuran.Masalah yang berhubungan dengan ketepatan hasil pengukuran inilah
yang dikenal dengan istilah validitas sedangkan maslah – masalah yang
berhubungan dengan ketetapan hasil pengukuran dikenal dengan istilah reliabilitas.
A. Validitas
Alat ukur yang baik adalah alat ukur yang dapat dengan tepat mengukur apa
yang ingin diukur. Jika kita ingin mengukur panjang sebuah meja maka kita harus
dapat memilih alat ukur yang tepat untuk mengukur panjang meja tersebut.Untuk
menghitung waktu tempuh pelari cepat dalam perlombaan lari cepat 100 meter maka
kita juga harus dapat memilih alat ukur yang tepat untuk digunakan. Demikian juga
jika kita ingin mengukur hasil belajar siswa maka kita juga dituntut untuk
menggunakan alat ukur ( dalam hal ini tes ) yang dapat dengan tepat mengukur hasil
belajar yang kita harapkan.
Pengertian validitas mengacu pada ketepatan interpretasi yang dibuat dari
hasil pengukuran atau evaluasi ( Gronlund dan Linn, 1990). Secra umum validitas
ada tiga jenis :
a. Validitas isi ( concent validity ).
b. Validitas konstrak ( construct validity ).
c. Validitas yang dikaitkan dengan kriteria tertentu ( criterion related validity ).
Validitas isi diperlukan untuk menjawab pertanyaan “ sejauh mana item – item
yang ada dalam tes dapat mengukur keseluruhan materi yang telah diajarkan “.
Tinggi rendahnya validitas isi dapat ditetapkan berdasarkan analisis rasional atau
pertimbangan ahli terhadap isi tes tersebut.Hal ini merupakan tuntutan yang harus
dipenuhi oleh tes hasil belajar. Tinggi rendahnya validitas isi suatu tes dapat dilihat
pada perencanaan atau kisi – kisi tes. Semakin representatif materi yang dapat
ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya.
Validitas konstrak mengacu pada sejauh mana alat ukur tersebut dapat
mengungkap keseluruhan konstrak yang digunakan sebagai dasar dalam
penyusunan tes tersebut.Yang dimaksud dengan konstrak disini adalah konsep
hipotesis (hipotetical concept) yang digunakan sebagai dasar dalam penyusunan
alat ukur.Validitas konstrak ini banyak digunakan terutama dalam pengukuran –
pengukuran psikologi seperti pengukuran sikap, minat, tingkah laku dan
sebagainya.Campbell dan Fiske (Demari Mardapi, 2004) mengembangkan satu
pendekatan untuk menentukan validitas konstrak dengan menggunakan teknik multi
trait-multi method.Validasi dengan multi trait – multi method dilakukan dengan
menggunakan lebih dari satu metode untuk mengukur lebih dari satu
acam trait ( sifat ). Dengan menggunakan matrik korelasi sehingga interkorelasi
antara trait dan metode dapat dilihat dengan jelas.
Jika suatu tes dimaksudkan untuk memprediksi keberhasilan seseorang di
masa yang akan datang atau dimaksudkan untuk mengetahui kesesuaian anatar
pengetahuan dengan keterampilan yang dimiliki maka alat ukur yang digunakan
harus mempunyai criterion related validity yang tinggi.
B.. Reliabilitas
Hasil – hasil pengukuran yang berhubungan dengan aspek – aspek fisik
seperti mengukur panjang meja, tinggi almari, berat badan dan tinggi badan
biasanya menghasilkan reliabilitas yang sangat tinggi.Artinya walaupun pengukuran
dilakukan lebih dari sekali tetapi tetap memberikan hasil yang ridak jauh berbeda.
Hasil pengukuran yenag berbeda akan sering kita temukan jika kita melakukan
pengukuran terhadap hal – hal yang berhubungan dengan aspek – aspek psikologi
dan sosial seperti dalam pengukuran mewakili intelegensi, sikap, dan konsep diri.
Aspek – aspek sosial-psikologi seperti itu tidak dapat diukur dengan ketepatan dan
konsistensi yang tinggi.Hal ini disebabkan karena hasil pengukuran yang diperoleh
tidak dapat lepas dari pengaruh hal - hal diluar maksud pengukuran tersebut
misalnya alat ukur itu sendiri bukan merupakan alat ukur yang tepat untuk mengukur
aspek yang diinginkan. Disamping itu karena subjek pengukurannya adalah manusia
maka cara – cara penyajian tes, emosi, motivasi. Kondisi fisik dan keadaan ruangan
tes akan mempengaruhi hasil pengukuran walaupun sebenarnya aspek – aspek
yang ingin kita ukur tersebut tidak berubah. Dengan demikian hasil pengukuran yang
diperoleh menjadi kurang reliabel.
Pengertian reliabilitas mengacu pada ketetapan hasil yang diperoleh dari
suatu Pengukuran ( Grondlund dan Linn, 1990 ). Salah satu cara untuk mengetahui
ketetapan atau reliabilitas suatu pengukuran, dapat diperoleh dengan cara
melakukan pengukuran dua kali. Hasil pengukuran dikatakan mempunyai reliabilitas
yang tinggi jika hasil pengukuran pertama hampir sama dengan hasil pengukuran
kedua. Dan sebaliknya hasil pengukuran dikatakan mempunyai reliabilitas yang
rendah jika hasil pengukuran pertama jauh berbeda dengan hasil pengukuran
kedua. Hubungan antar skor yang diperoleh pada pengukuran pertama dengan
kedua akan menghasilkan angka korelasi bergerak antara -1 sampai dengan +1.
Semakin tinggi angka koefisien reliabilitas (mendekati 1) maka semakin tinggi
reliabilitas tersebut. Suatu perangkat tes dinyatakan cukup reliabel jika mempunyai
reliabilitas lebih besar 0,5 (Fernandes, 1984).
Konsep reliabilitas dalam arti equivalent tes dimaksudkan untuk mengetahui
apakah dua set tes yang digunakan paralel atau tidak. Keparalelan dua set tes ini
diperoleh dengan cara mengembangkan dua set tes yang paralel dari kisi - kisi tes
yang sama kemudian masing - masing tes tersebut diujikan pada dua kelas yang
mempunyai tingkat kemampuan yang sama. Hasil kedua tes tersebut dikorelasikan,
jika hasil korelasinya tinggi, hal ini menunjukan kedua tes paralel.koefisien
korelasinya dapat dihitung dengan menggunakan formula product-moment.
konsep reliabilitas dalam arti konsistensi internal dimaksudkan untuk
mengetahui apakah kumpulan butir soal yang ada dalam satu set tes tersebut
mengukur dimensi hasil belajar yang sama atau tidak. Konsep reliabilitas dalam asrti
konsistensi dapat dihitung menggunakan formula Kuder-Richardson (KR-20 atau
KR-21). Jika hasil korelasinya tinggi, hal ni menunjukan bahwa antara butir soal
dalam satu set tes tersebut adalah konsisten dengan yang lain.
KEGIATAN BELAJAR 2
ANALISIS DAN PERBAIKAN INSTRUMEN
2) Daya beda
Daya beda butir soal memiliki pengertian seberapa jauh butir soal tersebut dapat
membedakan kemampuan individu peserta tes. Daya beda butir soal dapat dihitung
dengan menggunakan rumus :
D=PA – PB
dimana,
D = indeks daya beda butir soal
PA = proporsi kelompok atas yang menjawab benar
PB = proporsi kelompok bawah yang menjawab salah
Secara teoritis indeks beda soal (D) = 1 akan tercapai apabila semua siswa
dalam kelompok atas menjawab benar dan semua siswa dalam kelompok bawah
menjawab salah. Indeks daya beda soal (D) = -1 jika semua sisa dalam kelompok
atas menjawab salah dan semua siswa dalam kelopok bawah justru menjawab
benar. Sedangkan indeks daya beda soal (D) = 0 apabila proporsi siswa yang
menjawab benar dalam kelompok atas dan kelompok bawah adalah sama. Menurut
Fernandes (1984) kategori indeks daya beda butir soal adalah :
D ≥ 0,40 = sangat baik
0,30 ≤ D ≤ 0,40 = baik
0,20 ≤ D < 0,30 = sedang
D < 0,20 = tidak baik
Butir soal yang perlu diperbaiki adalah butir soal yang terlalu sukar atau terlalu
mudah dan butir soal yang pengecohnya mempunyai daya beda positif atau
kuncinya mempunyai daya beda negatif. Perbaikan butir soal dapat dilakukan pada
pokok soal atau pada alternatif jawaban.
E. Memperbaiki Non-Tes
Prosedur memperbaiki instrument non-tes sama dengan prosedur memperbaiki tes.
Penyempurnaan butir yang lemah dapat dilaksanakan dengan memperbaiki butir
yang kurang baik atau mengganti butir yang lama dengan butir yang baru. Penyebab
butir soal kurang baik, antara lain: a) penggunaan bahasa kurang komunikatif, b)
kalimat dapat ditafsirkan ambiguous (dapat ditafsirkan ganda), c) pertanyaan /
pernyataan yang dibuat menyimpang dari indikator, dan d) pertanyaan / pernyataan
tidak mengukur tarif (sifat) yang akan diukur.