Anda di halaman 1dari 14

DAYA PEMBEDA SOAL DAN VALIDITAS TES

Disusun sebagai tugas Matakuliah Evaluasi Pembelajarn Biologi


Pada Prodi Pendidikan Biologi FKIP UNMUH Jember

Oleh:
Nama : Desy Dwi Wulansari
NIM : 1710211024

Dosen Pengampu :
Dra. Sawitri Komarayanti M.S.

PRODI PENDIDIKAN BIOLOGI


FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS MUHAMMADIYAH JEMBER
2019
1. Daya Pembeda
Daya pembeda soal merupakan kemampuan sesuatu soal untuk membedakan antara
siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang pintar
(berkemampuan rendah). Daya pembeda butir soal adalah kemampuan suatu butir soal
untuk membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada
dalam kelompok itu. Salah satu tujuan analisis daya pembeda butir soal adalah untuk
menentukan mampu tidaknya suatu butir soal membedakan antara peserta pelatihan yang
berkemampuan tinggi dengan peserta pelatihan yang berkemampuan rendah.
Menurut Dali S. Naga (2002:67) mengatakan bahwa daya pembeda soal adalah
kemampuan soal dengan skornya dapat membedakan peserta tes dari kelompok tinggi dan
kelompok rendah. Dengan kata lain makin tinggi daya pembeda soal makin banyak peserta
dari kelompok tinggi yang dapat menjawab soal dengan benar dan makin sedikit peserta
tes dari kelompok rendah yang dapat menjawab soal dengan benar. Agar dapat diterima
maka nilai D (discrimination: daya pembeda soal) adalah 0,30 atau lebih. Sedangkan
untuk dapat dinyatakan cukup memuaskan adalah 0,40 ke atas.
Daya pembeda pada dasarnya dihitung atas dasar pembagian peserta pelatihan ke
dalam dua kelompok, yaitu kelompok Atas yaitu kelompok yang tergolong pandai, dan
kelompok Bawah, yaitu kelompok siswa yang tergolong tidak pandai. Dalam hubungan
ini, jika sebuah butir soal memiliki angka indeks diskriminasi butir soal dengan tanda
positif, hal ini merupakan petunjuk bahwa butir soal tersebut telah memiliki daya
pembeda, dalam arti bahwa peserta yang termasuk kategori pandai lebih banyak yang
dapat menjawab dengan benar terhadap butir soal yang bersangkutan, sedangkan peserta
yang termasuk kategori tidak pandai lebih banyak yang menjawab salah. [2, 4].
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi,
disingkat D. Indeks deskriminasi berkisar antara 0,00 sampai 1,00. Pada indeks ini
terdapat kemungkinan adanya tanda negatif manakala suatu tes terbalik menunjukkan
kualitas tes yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai. Dengan
demikian ada tiga titik daya pembeda yaitu:

(Sumber : file:///E:/evaluasi%20pembelajaran%20iologi/
PENGUKURAN_DAYA_PEMBEDA_TARAF_KESUKARAN.pdf)
a. Cara mencari Daya Pembeda
Untuk menentukan daya beda soal dapat digunakan menggunakan rumus
sebagai berikut :

Keterangan :
D = Indek diskriminasi (daya beda)
JA = Banyaknya peserta kelompok atas
JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab soal dengan benar
BB = Banyaknya peserta kelompok bawah yang menjawab soal dengan benar
Klasifikasi daya pembeda ditentukan berdasarkan angka indeks diskriminasi (D) butir
soal. Dengan kata lainnya, apabila suatu butir soal mempunyai daya pembeda yang baik
maka dapat diartikan bahwa butir soal itu mampu membedakan antara peserta pelatihan
yang berkemampuan tinggi dengan peserta pelatihan yang berkemampuan rendah.
b. Cara menentukan Daya Pembeda Berdasarkan Kelompok
Langkah pertama adalah membedakan menjadi kelompok kecil (kurang dari
100) dan kelompok besar (100 ke atas).
1. Kelompok kecil (kurang 100)
Seluruh kelompok tes terbagi dua sama besar, separuh kelompok atas (upper
group) dan separuh kelompok bawah (lower group) sebagai berikut :

(Sumber:file:///E:/evaluasi%20pembelajaran%20iologi/PENGUKURAN_
DAYA_PEMBEDA_TARAF_KESUKARAN.pdf
2. Kelompok besar (100 ke atas)
Untuk memudahkan analisis cukup diambil kedua kutub atas dan bawahnya
saja, masing-masing 27% sebagai JA dan JB nya. Contohnya sebagai berikut:
(Sumber:file:///E:/evaluasi%20pembelajaran%20iologi/PENGUKURAN_
DAYA_PEMBEDA_TARAF_KESUKARAN.pdf
Dari tabel kelompok atas dan kelompok bawah itu dicari menggunakan rumus:

Keterangan :
D = Indek diskriminasi (daya beda)
JA = Banyaknya peserta kelompok atas
JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab soal dengan benar
BB = Banyaknya peserta kelompok bawah yang menjawab soal dengan benar
PA = Proporsi peserta kelompok atas yang menjawab benar
PB = Proporsi peserta kelompok bawah yang menjawab benar
c. Contoh Perhitungan Daya Beda Soal
Terdapat sebuah table hasil kerja siswa dalam mengerjakan soal dengan skor
yang diperoleh.
Berdasarkan nama-nama siswa dapat diperoleh skor-skor sebagai berikut:

A = 4, B = 7, C = 8, D = 6, E = 10, F = 6, G = 6, H = 6, I = 8, J = 7, K = 7, L =
5, M = 3, N =7, O = 8, P = 4, Q = 8, R = 8, S = 6, T = 6

Dari angka-angka yang belum teratur lalu disusun menjadi array (urutan penyebaran),
dari skor yang paling tinggi ke skor yang paling rendah.

Array ini sekaligus menunjukkan adanya kelompok atas (JA) dan kelompok
bawah (JB) dengan pemiliknya sebagai berikut:
Selanjutnya dilihat tabel analisa lagi khusus soal nomor satu.
a. Dari kelompok atas yang menjawab benar 8 murid.
b. Dari kelompok bawah yang menjawab benar 4 orang.
Ditetapkan dalam rumus indeks diskriminasi sebagai berikut:

JA = 10
BA = 8
PA = 0.8
JB = 10
BB = 4
PB = 0,4
Maka D soal nomor 1 = PA –PB = 0,8 -0,4 = 0,4
Klasifikasi Daya Pembeda dan Hubungannya dengan Taraf Kesulitan

D = 0,00 -0,20 jelek (poor)


D = 0,20-0,40 cukup (satisfactory)
D = 0,4-0,70 baik (good)
D = 0,70-1,00 Baik sekali (Excellent)
D = Negatif, semuanya tidak baik, “semua soal yang mempunyai nilai D negatif
dibuang saja

II. Validitas Tes


Validitas merupakan suatu ukuran yang menunjukkan kevalidan atau kesahihan
suatu instrument. Jadi pengujian validitas itu mengacu pada sejauh mana suatu instrument
dalam menjalankan fungsi. Instrument dikatakan valid jika instrument tersebut dapat
digunakan untuk mengukur apa yang hendak diukur (Menurut Sugiyono (2008:363).
Sebagai contoh, ingin mengukur kemampuan siswa dalam matematika. Kemudian
diberikan soal dengan kalimat yang panjang dan yang berbelit-belit sehingga sukar
ditangkap maknanya. Akhimya siswa tidak dapat menjawab, akibat tidak memahami
pertanyaannya. Contoh lain, peneliti ingin mengukur kemampuan berbicara, tapi ditanya
mengenai tata bahasa atau kesusastraan seperti puisi atau sajak. Pengukur tersebut tidak
tepat (valid). Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan
penelitian. Instrumen yang telah valid untuk suatu tujuan tertentu belum otomatis akan
valid untuk tujuan yang lain.
a. Macam-macam Validitas
Ada tiga jenis validitas yang sering digunakan dalam penyusunan instrumen, yaitu:
a) Validitas isi
Validitas isi berkenaan dengan kesanggupan instrumen mengukur isi yang
harus diukur. Artinya, alat ukur tersebut mampu mengungkap isi suatu konsep atau
variabel yang hendak diukur. Misalnya tes hasil belajar bidang studi IPS, harus
bisa mengungkap isi bidang studi tersebut. Hal ini bisa dilakukan dengan cara
menyusun tes yang bersumber dari kurikulum bidang studi yang hendak diukur. Di
samping kurikulum dapat juga diperkaya dengan melihat/mengkaji buku sumber.
Sehingga tes hasil belajar tidak mungkin dapat mengungkap semua materi yang
ada dalam bidang studi tertentu sekalipun hanya untuk satu semester. Oleh sebab
itu harus diambil sebagian dari materi dalam bentuk sampel tes. Sebagai sampel
maka harus dapat mencerminkan materi yang terkandung dari seluruh materi
bidang studi. Cara Yang ditempuh dalam menetapkan sampel tes adalah memilih
konsep-konsep yang esensial dari materi yang di dalamnya. Misalnya menetapkan
sejumlah konsep dari setiap pokok bahasan yang ada. Dari setiap konsep
dikembangkan beberapa pertanyaan tes (lihat bagan). Di sinilah pentingnya
peranan kisi-kisi sebagai alat untuk memenuhi validitas isi.
TES HASIL BELAJAR

Bidang studi : ....................

Semester : ....................

Kelas : ....................

Pokok bahasan Konsep atau Jumlah abilitas

untuk satu materi perta- Jenis tes yang

semester sesuai esensial nyaan diakui

dengan kurikulum

Pokok bahasan 1 1.1 3 soal pilihan Aplikasi dan

seterusnya
……………… ganda

Pokok bahasan 1.2 2 soal Aplikasi

dan
2 ………………
seterusnya

Pokok bahasan 2.1 2 soal

2 ………………

2.2 3 soal

………………

Pokok bahasan 3.1 3 soal

3 ………………

3.2 2 soal

………………

dan seterusnya
Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum
(materi dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes
dapat meminta bantuan ahli bidang studi untuk menelaah apakah konsep
materi yang diajukan telah memadai atau tidak, sebagai sampel tes. Dengan
demikian validitas isi tidak memerlukan uji coba dan analisis statistik atau
dinyatakan dalam bentuk angka-angka.
b) Validitas bangun pengertian (Construct validity)
Validitas bangun pengertian (Construct validity) berkenaan dengan
kesanggupan alat ukur mengukur pengertian-pengertian yang terkandung dalam
materi yang diukurnya. Pengertian-pengertian yang terkandung dalam konsep
kemampuan, minat, sebagai variabel penelitian dalam berbagai bidang kajian
harus jelas apa yang hendak diukurnya. Konsep-konsep tersebut masih abstrak,
memerlukan penjabaran yang lebih spesifik, sehingga mudah diukur. Ini berarti
setiap konsep harus dikembangkan indikator-indikatomya. Dengan adanya
indikator dari setiap konsep maka bangun pengertian akan nampak dan
memudahkan dalam menetapkan cara pengukuran. Untuk variabel tertentu,
dimungkinkan penggunaan alat ukur yang beraneka ragam dengan cara
mengukurnya yang berlainan.
Menetapkan indikator suatu konsep dapat dilakukan dalam dua cara, yakni
(a) menggunakan pemahaman atau logika berpikir atas dasar teori pengetahuan
ilmiah dan
(b) menggunakan pengalaman empiris, yakni apa yang terjadi dalam kehidupan
nyata.
Contoh: Konsep mengenai “Hubungan Sosial”, dilihat dari pengalaman,
indikatornya empiris adalah keterkaitan dari
- bisa bergaul dengan orang lain
- disenangi atau banyak teman-temannya
- menerima pendapat orang lain
- tidak memaksakan pendapatnya
- bisa bekerja sama dengan siapa pun
- dan lain-lain.
Mengukur indikator-indikator tersebut, berarti mengukur bangun pengertian
yang terdapat dalam konsep hubungan sosial. Contoh lain: Konsep sikap dapat
dilihat dari indikatornya secara teoretik (deduksi teori) antara lain keterkaitan
dari
- kesediaan menerima stimulus objek sikap
- kemauan mereaksi stimulus objek sikap
- menilai stimulus objek sikap
- menyusun/mengorganisasi objek sikap
- internalisasi nilai yang ada dalam objek sikap.
Apabila hasil tes menunjukkan indikator-indikator tes yang tidak
berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak
memiliki validitas bangun pengertian. Atas dasar itu indikatornya perlu ditinjau
atau diperbaiki kembali. Cara lain untuk menetapkan validitas bangun
pengertian suatu alat ukur adalah menghubungkan (korelasi) antara alat ukur
yang dibuat dengan alat ukur yang sudah baku/standardized, seandainya telah
ada yang baku. Bila menunjukkan koefisien korelasi yang tinggi maka alat ukur
tersebut memenuhi validitasnya.
c) Validitas ramalan (predictive validity)
Validitas ramalan artinya dikaitkan dengan kriteria tertentu. Dalam validitas ini
yang diutamakan bukan isi tes tapi kriterianya, apakah alat ukur tersebut dapat
digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau kriteria
tertentu yang diinginkan. Misalnya alat ukur motivasi belajar, apakah dapat
digunakan untuk meramal prestasi belajar yang dicapai. Artinya terdapat
hubungan yang positif antara motivasi dengan prestasi. Dengan kata lain dalam
validitas ini mengandung ciri adanya relevansi dan keajegan atau ketetapan
(reliability). Motivasi dapat digunakan meramal prestasi bila skor-skor yang
diperoleh dari ukuran motivasi berkorelasi positif dengan skor prestasi.
Validitas ramalan ini mengandung dua makna. Pertama validitas jangka pendek
dan kedua jangka panjang. Validitas jangka pendek, artinya daya ramal alat
ukur tersebut hanya untuk masa yang tidak lama. Artinya, skor tersebut
berkorelasi pada waktu yang sama. Misalnya, ketetapan (reliability) terjadi
pada semester dua artinya daya ramal berlaku pada semester dua, dan belum
tentu terjadi pada semester berikutnya. Sedangkan validitas jangka panjang
mengandung makna skor tersebut akan berkorelasi juga di kemudian hari.
Mengingat validitas ini lebih menekankan pada adanya korelasi, maka faktor
yang berkenaan dongan persyaratan terjadinya korelasi harus dipenuhi. Faktor
tersebut antara lain hubungan dari konsep dan variabel dapat dijelaskan
berdasarkan pengetahuan ilmiah, minimal masuk akal sehat dan tidak mengada-
ada. Faktor lain adalah skor yang dikorelasikan memenuhi linieritas. Ketiga
validitas yang dijelaskan di atas idealnya dapat digunakan dalam menyusun
instrumen penelitian, minimal dua validitas, yakni validitas isi dan validitas
bangun pengertian. Validitas isi dan bangun pengertian mutlak diperlukan dan
bisa diupayakan tanpa melakukan pengujian secara statistika.
d) Validitas ramalan (predictive validity)
Validitas ramalan artinya dikaitkan dengan kriteria tertentu. Dalam validitas ini
yang diutamakan bukan isi tes tapi kriterianya, apakah alat ukur tersebut dapat
digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau kriteria
tertentu yang diinginkan. Misalnya alat ukur motivasi belajar, apakah dapat
digunakan untuk meramal prestasi belajar yang dicapai. Artinya terdapat
hubungan yang positif antara motivasi dengan prestasi. Dengan kata lain dalam
validitas ini mengandung ciri adanya relevansi dan keajegan atau ketetapan
(reliability). Motivasi dapat digunakan meramal prestasi bila skor-skor yang
diperoleh dari ukuran motivasi berkorelasi positif dengan skor prestasi.
Validitas ramalan ini mengandung dua makna. Pertama validitas jangka pendek
dan kedua jangka panjang. Validitas jangka pendek, artinya daya ramal alat
ukur tersebut hanya untuk masa yang tidak lama. Artinya, skor tersebut
berkorelasi pada waktu yang sama. Misalnya, ketetapan (reliability) terjadi
pada semester dua artinya daya ramal berlaku pada semester dua, dan belum
tentu terjadi pada semester berikutnya. Sedangkan validitas jangka panjang
mengandung makna skor tersebut akan berkorelasi juga di kemudian hari.
Mengingat validitas ini lebih menekankan pada adanya korelasi, maka faktor
yang berkenaan dongan persyaratan terjadinya korelasi harus dipenuhi. Faktor
tersebut antara lain hubungan dari konsep dan variabel dapat dijelaskan
berdasarkan pengetahuan ilmiah, minimal masuk akal sehat dan tidak mengada-
ada. Faktor lain adalah skor yang dikorelasikan memenuhi linieritas. Ketiga
validitas yang dijelaskan di atas idealnya dapat digunakan dalam menyusun
instrumen penelitian, minimal dua validitas, yakni validitas isi dan validitas
bangun pengertian. Validitas isi dan bangun pengertian mutlak diperlukan dan
bisa diupayakan tanpa melakukan pengujian secara statistika.
b. Cara Menentukan Validitas
a) Cara Menentukan Validitas dengan Menggunakan Rumus
Perhitungan validitas dari sebuah instrumen dapat menggunakan
rumus korelasi product moment atau dikenal juga dengan korelasi
pearson. Adapun rumusnya adalah sebagai berikut :
∑ (∑ )(∑ )
rxy =

{ ∑ (∑ )}{ ∑ (∑ )}

Keterangan :
Rxy = koefisien korelasi
N = jumlah responden uji coba
X = skor tiap item
Y = skor seluruh item responden uji coba
Untuk menginterpretasikan tingkat validitas, maka koefisien korelasi
dikategorikan pada criteria sebagai berikut:

Setelah harga koefisien validitas tiap butir soal diperoleh, kemudian hasil
diatas dibandingkan dengan nilai r dari tabel pada taraf signifikansi 5% dan taraf
signifikansi 1% dengan df= N-2. Jika r hitung r tabel maka koefisien validitas butir
soal pada taraf signifikansi yang dipakai.
c. Contoh Soal
Diketahui data hasil angket motivasi belajar sebagai berikut:
Langkah-langkahnya dapat kita lakukan sebagai berikut:
Masing-masing soal item 1-10 yang akan diuji validitas dimasukan pada rumus
dibawah ini:
Dari perhitungan diatas, diperoleh hasil r hitung = 0,203. Selanjutnya nilai tersebut
dikonsultasikan dengan r tabel product moment pada taraf significant dengan df =
8, taraf signifikansi 5% = 0,632 dan taraf signifikansi 1% = 0,765. Jika r hitung > r
tabel taraf sig 1% > r tabel taraf sig 5% maka dapat dinyatakan valid dan
sebaliknya, maka pada perhitungan item no 1 dinyatakan tidak valid r hitung < r
tabel (0,203<0,632<0,765).

Anda mungkin juga menyukai