Oleh:
Nama : Desy Dwi Wulansari
NIM : 1710211024
Dosen Pengampu :
Dra. Sawitri Komarayanti M.S.
(Sumber : file:///E:/evaluasi%20pembelajaran%20iologi/
PENGUKURAN_DAYA_PEMBEDA_TARAF_KESUKARAN.pdf)
a. Cara mencari Daya Pembeda
Untuk menentukan daya beda soal dapat digunakan menggunakan rumus
sebagai berikut :
Keterangan :
D = Indek diskriminasi (daya beda)
JA = Banyaknya peserta kelompok atas
JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab soal dengan benar
BB = Banyaknya peserta kelompok bawah yang menjawab soal dengan benar
Klasifikasi daya pembeda ditentukan berdasarkan angka indeks diskriminasi (D) butir
soal. Dengan kata lainnya, apabila suatu butir soal mempunyai daya pembeda yang baik
maka dapat diartikan bahwa butir soal itu mampu membedakan antara peserta pelatihan
yang berkemampuan tinggi dengan peserta pelatihan yang berkemampuan rendah.
b. Cara menentukan Daya Pembeda Berdasarkan Kelompok
Langkah pertama adalah membedakan menjadi kelompok kecil (kurang dari
100) dan kelompok besar (100 ke atas).
1. Kelompok kecil (kurang 100)
Seluruh kelompok tes terbagi dua sama besar, separuh kelompok atas (upper
group) dan separuh kelompok bawah (lower group) sebagai berikut :
(Sumber:file:///E:/evaluasi%20pembelajaran%20iologi/PENGUKURAN_
DAYA_PEMBEDA_TARAF_KESUKARAN.pdf
2. Kelompok besar (100 ke atas)
Untuk memudahkan analisis cukup diambil kedua kutub atas dan bawahnya
saja, masing-masing 27% sebagai JA dan JB nya. Contohnya sebagai berikut:
(Sumber:file:///E:/evaluasi%20pembelajaran%20iologi/PENGUKURAN_
DAYA_PEMBEDA_TARAF_KESUKARAN.pdf
Dari tabel kelompok atas dan kelompok bawah itu dicari menggunakan rumus:
Keterangan :
D = Indek diskriminasi (daya beda)
JA = Banyaknya peserta kelompok atas
JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab soal dengan benar
BB = Banyaknya peserta kelompok bawah yang menjawab soal dengan benar
PA = Proporsi peserta kelompok atas yang menjawab benar
PB = Proporsi peserta kelompok bawah yang menjawab benar
c. Contoh Perhitungan Daya Beda Soal
Terdapat sebuah table hasil kerja siswa dalam mengerjakan soal dengan skor
yang diperoleh.
Berdasarkan nama-nama siswa dapat diperoleh skor-skor sebagai berikut:
A = 4, B = 7, C = 8, D = 6, E = 10, F = 6, G = 6, H = 6, I = 8, J = 7, K = 7, L =
5, M = 3, N =7, O = 8, P = 4, Q = 8, R = 8, S = 6, T = 6
Dari angka-angka yang belum teratur lalu disusun menjadi array (urutan penyebaran),
dari skor yang paling tinggi ke skor yang paling rendah.
Array ini sekaligus menunjukkan adanya kelompok atas (JA) dan kelompok
bawah (JB) dengan pemiliknya sebagai berikut:
Selanjutnya dilihat tabel analisa lagi khusus soal nomor satu.
a. Dari kelompok atas yang menjawab benar 8 murid.
b. Dari kelompok bawah yang menjawab benar 4 orang.
Ditetapkan dalam rumus indeks diskriminasi sebagai berikut:
JA = 10
BA = 8
PA = 0.8
JB = 10
BB = 4
PB = 0,4
Maka D soal nomor 1 = PA –PB = 0,8 -0,4 = 0,4
Klasifikasi Daya Pembeda dan Hubungannya dengan Taraf Kesulitan
Semester : ....................
Kelas : ....................
dengan kurikulum
seterusnya
……………… ganda
dan
2 ………………
seterusnya
2 ………………
2.2 3 soal
………………
3 ………………
3.2 2 soal
………………
dan seterusnya
Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum
(materi dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes
dapat meminta bantuan ahli bidang studi untuk menelaah apakah konsep
materi yang diajukan telah memadai atau tidak, sebagai sampel tes. Dengan
demikian validitas isi tidak memerlukan uji coba dan analisis statistik atau
dinyatakan dalam bentuk angka-angka.
b) Validitas bangun pengertian (Construct validity)
Validitas bangun pengertian (Construct validity) berkenaan dengan
kesanggupan alat ukur mengukur pengertian-pengertian yang terkandung dalam
materi yang diukurnya. Pengertian-pengertian yang terkandung dalam konsep
kemampuan, minat, sebagai variabel penelitian dalam berbagai bidang kajian
harus jelas apa yang hendak diukurnya. Konsep-konsep tersebut masih abstrak,
memerlukan penjabaran yang lebih spesifik, sehingga mudah diukur. Ini berarti
setiap konsep harus dikembangkan indikator-indikatomya. Dengan adanya
indikator dari setiap konsep maka bangun pengertian akan nampak dan
memudahkan dalam menetapkan cara pengukuran. Untuk variabel tertentu,
dimungkinkan penggunaan alat ukur yang beraneka ragam dengan cara
mengukurnya yang berlainan.
Menetapkan indikator suatu konsep dapat dilakukan dalam dua cara, yakni
(a) menggunakan pemahaman atau logika berpikir atas dasar teori pengetahuan
ilmiah dan
(b) menggunakan pengalaman empiris, yakni apa yang terjadi dalam kehidupan
nyata.
Contoh: Konsep mengenai “Hubungan Sosial”, dilihat dari pengalaman,
indikatornya empiris adalah keterkaitan dari
- bisa bergaul dengan orang lain
- disenangi atau banyak teman-temannya
- menerima pendapat orang lain
- tidak memaksakan pendapatnya
- bisa bekerja sama dengan siapa pun
- dan lain-lain.
Mengukur indikator-indikator tersebut, berarti mengukur bangun pengertian
yang terdapat dalam konsep hubungan sosial. Contoh lain: Konsep sikap dapat
dilihat dari indikatornya secara teoretik (deduksi teori) antara lain keterkaitan
dari
- kesediaan menerima stimulus objek sikap
- kemauan mereaksi stimulus objek sikap
- menilai stimulus objek sikap
- menyusun/mengorganisasi objek sikap
- internalisasi nilai yang ada dalam objek sikap.
Apabila hasil tes menunjukkan indikator-indikator tes yang tidak
berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak
memiliki validitas bangun pengertian. Atas dasar itu indikatornya perlu ditinjau
atau diperbaiki kembali. Cara lain untuk menetapkan validitas bangun
pengertian suatu alat ukur adalah menghubungkan (korelasi) antara alat ukur
yang dibuat dengan alat ukur yang sudah baku/standardized, seandainya telah
ada yang baku. Bila menunjukkan koefisien korelasi yang tinggi maka alat ukur
tersebut memenuhi validitasnya.
c) Validitas ramalan (predictive validity)
Validitas ramalan artinya dikaitkan dengan kriteria tertentu. Dalam validitas ini
yang diutamakan bukan isi tes tapi kriterianya, apakah alat ukur tersebut dapat
digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau kriteria
tertentu yang diinginkan. Misalnya alat ukur motivasi belajar, apakah dapat
digunakan untuk meramal prestasi belajar yang dicapai. Artinya terdapat
hubungan yang positif antara motivasi dengan prestasi. Dengan kata lain dalam
validitas ini mengandung ciri adanya relevansi dan keajegan atau ketetapan
(reliability). Motivasi dapat digunakan meramal prestasi bila skor-skor yang
diperoleh dari ukuran motivasi berkorelasi positif dengan skor prestasi.
Validitas ramalan ini mengandung dua makna. Pertama validitas jangka pendek
dan kedua jangka panjang. Validitas jangka pendek, artinya daya ramal alat
ukur tersebut hanya untuk masa yang tidak lama. Artinya, skor tersebut
berkorelasi pada waktu yang sama. Misalnya, ketetapan (reliability) terjadi
pada semester dua artinya daya ramal berlaku pada semester dua, dan belum
tentu terjadi pada semester berikutnya. Sedangkan validitas jangka panjang
mengandung makna skor tersebut akan berkorelasi juga di kemudian hari.
Mengingat validitas ini lebih menekankan pada adanya korelasi, maka faktor
yang berkenaan dongan persyaratan terjadinya korelasi harus dipenuhi. Faktor
tersebut antara lain hubungan dari konsep dan variabel dapat dijelaskan
berdasarkan pengetahuan ilmiah, minimal masuk akal sehat dan tidak mengada-
ada. Faktor lain adalah skor yang dikorelasikan memenuhi linieritas. Ketiga
validitas yang dijelaskan di atas idealnya dapat digunakan dalam menyusun
instrumen penelitian, minimal dua validitas, yakni validitas isi dan validitas
bangun pengertian. Validitas isi dan bangun pengertian mutlak diperlukan dan
bisa diupayakan tanpa melakukan pengujian secara statistika.
d) Validitas ramalan (predictive validity)
Validitas ramalan artinya dikaitkan dengan kriteria tertentu. Dalam validitas ini
yang diutamakan bukan isi tes tapi kriterianya, apakah alat ukur tersebut dapat
digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau kriteria
tertentu yang diinginkan. Misalnya alat ukur motivasi belajar, apakah dapat
digunakan untuk meramal prestasi belajar yang dicapai. Artinya terdapat
hubungan yang positif antara motivasi dengan prestasi. Dengan kata lain dalam
validitas ini mengandung ciri adanya relevansi dan keajegan atau ketetapan
(reliability). Motivasi dapat digunakan meramal prestasi bila skor-skor yang
diperoleh dari ukuran motivasi berkorelasi positif dengan skor prestasi.
Validitas ramalan ini mengandung dua makna. Pertama validitas jangka pendek
dan kedua jangka panjang. Validitas jangka pendek, artinya daya ramal alat
ukur tersebut hanya untuk masa yang tidak lama. Artinya, skor tersebut
berkorelasi pada waktu yang sama. Misalnya, ketetapan (reliability) terjadi
pada semester dua artinya daya ramal berlaku pada semester dua, dan belum
tentu terjadi pada semester berikutnya. Sedangkan validitas jangka panjang
mengandung makna skor tersebut akan berkorelasi juga di kemudian hari.
Mengingat validitas ini lebih menekankan pada adanya korelasi, maka faktor
yang berkenaan dongan persyaratan terjadinya korelasi harus dipenuhi. Faktor
tersebut antara lain hubungan dari konsep dan variabel dapat dijelaskan
berdasarkan pengetahuan ilmiah, minimal masuk akal sehat dan tidak mengada-
ada. Faktor lain adalah skor yang dikorelasikan memenuhi linieritas. Ketiga
validitas yang dijelaskan di atas idealnya dapat digunakan dalam menyusun
instrumen penelitian, minimal dua validitas, yakni validitas isi dan validitas
bangun pengertian. Validitas isi dan bangun pengertian mutlak diperlukan dan
bisa diupayakan tanpa melakukan pengujian secara statistika.
b. Cara Menentukan Validitas
a) Cara Menentukan Validitas dengan Menggunakan Rumus
Perhitungan validitas dari sebuah instrumen dapat menggunakan
rumus korelasi product moment atau dikenal juga dengan korelasi
pearson. Adapun rumusnya adalah sebagai berikut :
∑ (∑ )(∑ )
rxy =
{ ∑ (∑ )}{ ∑ (∑ )}
Keterangan :
Rxy = koefisien korelasi
N = jumlah responden uji coba
X = skor tiap item
Y = skor seluruh item responden uji coba
Untuk menginterpretasikan tingkat validitas, maka koefisien korelasi
dikategorikan pada criteria sebagai berikut:
Setelah harga koefisien validitas tiap butir soal diperoleh, kemudian hasil
diatas dibandingkan dengan nilai r dari tabel pada taraf signifikansi 5% dan taraf
signifikansi 1% dengan df= N-2. Jika r hitung r tabel maka koefisien validitas butir
soal pada taraf signifikansi yang dipakai.
c. Contoh Soal
Diketahui data hasil angket motivasi belajar sebagai berikut:
Langkah-langkahnya dapat kita lakukan sebagai berikut:
Masing-masing soal item 1-10 yang akan diuji validitas dimasukan pada rumus
dibawah ini:
Dari perhitungan diatas, diperoleh hasil r hitung = 0,203. Selanjutnya nilai tersebut
dikonsultasikan dengan r tabel product moment pada taraf significant dengan df =
8, taraf signifikansi 5% = 0,632 dan taraf signifikansi 1% = 0,765. Jika r hitung > r
tabel taraf sig 1% > r tabel taraf sig 5% maka dapat dinyatakan valid dan
sebaliknya, maka pada perhitungan item no 1 dinyatakan tidak valid r hitung < r
tabel (0,203<0,632<0,765).