Untuk mengukur sesuatu kita harus dapat memilih alat ukur yang sesuai
agar kita dapat memperoleh hasil pengukuran yang tepat. Sebagai contoh,
seorang pemanah akan dinyatakan sebagai pemenang jika hasil bidikannya
dapat dengan tepat mengenai sasaran yaitu daerah lingkaran yang paling
dalam atau yang paling mendekati lingkaran yang paling dalam. Jika hasil
bidikan peserta didik dapat mengenai daerah di lingkaran paling dalam maka
ia akan memperoleh skor tertinggi dan perolehan skor tersebut semakin
berkurang jika hasil bidikannya jauh dari sasaran. Karena anak panah yang
harus dilepaskan tidak hanya satu maka pemanah dituntut untuk tetap
dapat melepaskan anak panahnya tepat mengenai sasaran.
Hasil bidikan dari peserta bisa tepat mengenai sasaran atau juga melesat
dari sasaran. Hasil yang sama dapat terjadi pada saat anda mengukur hasil
belajar siswa. Jika alat ukur yang anda gunakan tidak anda persiapkan
dengan cermat maka skor yang anda peroleh tidak dapat menggambarkan
Kualitas
dengan tepat tingkat kemampuan siswa.Dari penjelasan tersebut terdapat
dua masalah pokok yang harus diperhatikan dalam menyusun alat ukur hasil
belajar yang baik yaitu masalah yang berhubungan dengan ketepatan hasil
pengukuran dan ketetapan hasil pengukuran.Masalah yang berhubungan
Alat Ukur
Kegiatan Belajar 1
dengan ketepatan hasil pengukuran inilah yang dikenal dengan istilah
validitas sedangkan maslah – masalah yang berhubungan dengan ketetapan
hasil pengukuran dikenal dengan istilah reliabilitas.
A. Validitas
Alat ukur yang baik adalah alat ukur yang dapat dengan tepat mengukur apa yang ingin diukur.
Jika kita ingin mengukur panjang sebuah meja maka kita harus dapat memilih alat ukur yang
tepat untuk mengukur panjang meja tersebut.Untuk menghitung waktu tempuh pelari cepat
dalam perlombaan lari cepat 100 meter maka kita juga harus dapat memilih alat ukur yang tepat
untuk digunakan. Demikian juga jika kita ingin mengukur hasil belajar siswa maka kita juga
dituntut untuk menggunakan alat ukur ( dalam hal ini tes ) yang dapat dengan tepat mengukur
hasil belajar yang kita harapkan.
Presentation c. Validitas yang dikaitkan dengan kriteria tertentu ( criterion related validity ).
Validitas isi diperlukan untuk menjawab pertanyaan “ sejauh mana item – item yang ada dalam tes
dapat mengukur keseluruhan materi yang telah diajarkan “. Tinggi rendahnya validitas isi dapat
ditetapkan berdasarkan analisis rasional atau pertimbangan ahli terhadap isi tes tersebut.Hal ini
merupakan tuntutan yang harus dipenuhi oleh tes hasil belajar. Tinggi rendahnya validitas isi suatu
tes dapat dilihat pada perencanaan atau kisi – kisi tes. Semakin representatif materi yang dapat
ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya.
Validitas Kelompok 6
Hasil – hasil pengukuran yang berhubungan dengan aspek – aspek fisik seperti
mengukur panjang meja, tinggi almari, berat badan dan tinggi badan biasanya
menghasilkan reliabilitas yang sangat tinggi.Artinya walaupun pengukuran
dilakukan lebih dari sekali tetapi tetap memberikan hasil yang ridak jauh
berbeda. Hasil pengukuran yenag berbeda akan sering kita temukan jika kita
melakukan pengukuran terhadap hal – hal yang berhubungan dengan aspek –
aspek psikologi dan sosial seperti dalam pengukuran mewakili intelegensi,
sikap, dan konsep diri. Aspek – aspek sosial-psikologi seperti itu tidak dapat
diukur dengan ketepatan dan konsistensi yang tinggi.Hal ini disebabkan karena
hasil pengukuran yang diperoleh tidak dapat lepas dari pengaruh hal - hal
diluar maksud pengukuran tersebut misalnya alat ukur itu sendiri bukan
merupakan alat ukur yang tepat untuk mengukur aspek yang diinginkan.
Disamping itu karena subjek pengukurannya adalah manusia maka cara – cara
penyajian tes, emosi, motivasi. Kondisi fisik dan keadaan ruangan tes akan
mempengaruhi hasil pengukuran walaupun sebenarnya aspek – aspek yang
ingin kita ukur tersebut tidak berubah. Dengan demikian hasil pengukuran
yang diperoleh menjadi kurang reliabel.
Reliabilitas
Apakah soal – soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku seperti telah
A dirumuskan dalam tujuan instruksional khusus ?
C Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang
kurang pandai ?
D Apakah kunci soal yang kita buat sudah benar sesuai dengan maksud soa ?
E Jika menggunakan tes pilihan berganda, apakah pengecoh yang kita pilih sudah berfungsi dengan baik ?
5
05 Untuk memperbaiki kemapuan kita dalam
menulis soal.
.
ANALISIS
Butiran soal
Pada saat kita engujikan suatu set soal untuk
mengambil keputusan penting tentang hasil belajar
siswa maka idealnya kita harus yakin bahwa set soal
tersebut adalah valid dan reliabel. Validitas set soal
dapat diketahui dari kisi – kisi soal sedangkan
reliabelitas soala baru dapat diketahui setelah uji
coba. Dalam rangka memperoleh reliabilitas set soal
inilah analisis butir soal dilakukan. Dalam
menganalisis butir soal paling tidak ada dua
karakteristik butir soal yang perlu diperhatikan yaitu
tingkat kesukaran dan daya beda butir – butir soal.
B. Kapan Analisis Butiran soal dilakukan?
1 Tingkat kesukaran butir soal
Besarnya tingkat kesukaran butir soal, dapat dihitung dengan memperhatikan
proporsi peserta tes yang menjawab benar terhadap setiap butir soal. Secara
matematis tingkat kesukaran butir soal dapat dihitung dengan rumus :
P=
Keterangan
P adalah indeks kesukaran butir soal
B adalah jumlah peserta tes yang menjawab benar
N adalah jumlah peserta tes
Menurut Fernandes (1984), kategori kesukaran butir soal adalah sebagai berikut :
P > 0,75 : mudah
0,25 ≤ P ≤ 0,75 : sedang
P < 0,24 : sukar
Butir soal yang baik adalah butir soal yang memiliki tingkat kesukaran dalam kategori sedang.
2. Beda daya
Daya beda butir soal memiliki pengertian seberapa jauh butir soal tersebut
dapat membedakan kemampuan individu peserta tes. Daya beda butir soal
dapat dihitung dengan menggunakan rumus :
D=PA – PB
E. Memperbaiki Non-Tes
Prosedur memperbaiki instrument non-tes sama dengan
prosedur memperbaiki tes. Penyempurnaan butir yang
lemah dapat dilaksanakan dengan memperbaiki butir
yang kurang baik atau mengganti butir yang lama dengan
butir yang baru. Penyebab butir soal kurang baik, antara
lain: a) penggunaan bahasa kurang komunikatif, b)
kalimat dapat ditafsirkan ambiguous (dapat ditafsirkan
ganda), c) pertanyaan / pernyataan yang dibuat
menyimpang dari indikator, dan d) pertanyaan /
pernyataan tidak mengukur tarif (sifat) yang akan diukur.
PowerPoint Presentation kelompok 6
Kesimpulan