Anda di halaman 1dari 26

BAB V

PENGUJIAN VALIDITAS, RELIABILITAS, TINGKAT


KESUKARAN DAN DAYA PEMBEDA

A. PENDAHULUAN
Dalam masalah sosial, persoalan penentuan alat ukur yang dibuat dengan
asal jadi, tanpa memperhitungkan validitas dan reliabilitasnya, akan menyebabkan
interpretasi yang bermacam-macam dan bisa memberikan alternatif jawaban yang
berbeda-beda sesuai dengan kondisi, kapan dan dimana suatu alat ukur itu akan
digunakan. Jika salah dalam penerapan, jawaban yang diperoleh bukan akan
memberikan informasi yang baik dan benar, akan tetapi justru akan memberikan
informasi yang keliru dan akan berdampak terhadap kesimpulan yang dibuat.
Persoalan alat ukur yang digunakan evaluator ketika melakukan kegiatan
evaluasi sering dihadapkan pada persoalan akurasi, konsisten dan stabilitas
sehingga hasil pengukuran yang diperoleh bisa mengukur dengan akurat sesuatu
yang sedang diukur. Instrumen ini memang harus memiliki akurasi ketika
digunakan. Konsisten dan stabil dalam arti tidak mengalami perubahan dari waktu
pengukuran satu ke pengukuran yang lain.
Keandalan (reliabilitas) merupaka sesuatu yang dibutuhkan tetapi buakn
persyaratan mutlak untuk validitas suatu instrument. Dalam penilaian formatif,
batasan-batasan keandalan ditangani dengan cara yang berbeda meskipun tetap
penting untuk dipertimbangkan.
Sifat reliabel ( keandalan) dari sebuah alat ukur berkenaan dengan
kemampuan alat ukur tersebut memberikan hasil yang konsisten dan stabil. Dalam
konsep reliabilitas

suatu instrument, suatu instrument yang memiliki sifat

kesahihan dan keandalan maka instrument itu harus memeberikan hasil yang
konsisten atau stabil jika digunakan beberapa kali pada objek yang sama,
sepanjang materi yang diukur tidak berubah.

108

Prinsip reliabilitas itu sendiri adalah menunjukkan sejauh mana


pengukuran atau penilaian itu memberikan hasil yang relatif sama jika dilakukan
pngukuran terhadap subjek yang sama pada waktu yang berbeda.

B. UJI VALIDITAS
Validitas merupakan suatu ukuran yang menunjukkan kevalidan atau
kesahihan suatu instrument. Jadi pengujian validitas itu mengacu pada sejauh
mana suatu instrument dalam menjalankan fungsi. Instrument dikatakan valid jika
instrument tersebut dapat digunakan untuk mengukur apa yang hendak diukur.
Sebagai contoh, ingin mengukur kemampuan siswa dalam matematika. Kemudian
diberikan soal dengan kalimat yang panjang dan yang berbelit-belit sehingga
sukar ditangkap maknanya. Akhimya siswa tidak dapat menjawab, akibat tidak
memahami pertanyaannya. Contoh lain, peneliti ingin mengukur kemampuan
berbicara, tapi ditanya mengenai tata bahasa atau kesusastraan seperti puisi atau
sajak.
Pengukur tersebut tidak tepat (valid). Validitas tidak berlaku universal
sebab bergantung pada situasi dan tujuan penelitian. Instrumen yang telah valid
untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang lain.
1. Macam-macam Validitas
Ada tiga jenis validitas yang sering digunakan dalam penyusunan
instrumen, yaitu:
a. Validitas isi
Validitas isi berkenaan dengan kesanggupan instrumen mengukur isi yang
harus diukur. Artinya, alat ukur tersebut mampu mengungkap isi suatu konsep
atau variabel yang hendak diukur. Misalnya tes hasil belajar bidang studi IPS,
harus bisa mengungkap isi bidang studi tersebut. Hal ini bisa dilakukan dengan
cara menyusun tes yang bersumber dari kurikulum bidang studi yang hendak
diukur. Di samping kurikulum dapat juga diperkaya dengan melihat/mengkaji
buku sumber. Sehingga tes hasil belajar tidak mungkin dapat mengungkap semua
109

materi yang ada dalam bidang studi tertentu sekalipun hanya untuk satu semester.
Oleh sebab itu harus diambil sebagian dari materi dalam bentuk sampel tes.
Sebagai sampel maka harus dapat mencerminkan materi yang terkandung dari
seluruh materi bidang studi. Cara yang ditempuh dalam menetapkan sampel tes
adalah memilih konsep-konsep yang esensial dari materi yang di dalamnya.
Misalnya menetapkan sejumlah konsep dari setiap pokok bahasan yang ada. Dari
setiap konsep dikembangkan beberapa pertanyaan tes (lihat bagan). Di sinilah
pentingnya peranan kisi-kisi sebagai alat untuk memenuhi validitas isi.
Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi
dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat
meminta bantuan ahli bidang studi untuk menelaah apakah konsep materi yang
diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian validitas
isi tidak memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk
angka-angka.
b. Validitas bangun pengertian (Construct validity)
Validitas bangun pengertian (Construct validity) berkenaan dengan
kesanggupan alat ukur mengukur pengertian-pengertian yang terkandung dalam
materi yang diukurnya. Pengertian-pengertian yang terkandung dalam konsep
kemampuan, minat, sebagai variabel penelitian dalam berbagai bidang kajian
harus jelas apa yang hendak diukurnya. Konsep-konsep tersebut masih abstrak,
memerlukan penjabaran yang lebih spesifik, sehingga mudah diukur. Ini berarti
setiap konsep harus dikembangkan indikator-indikatomya. Dengan adanya
indikator dari setiap konsep maka bangun pengertian akan nampak dan
memudahkan dalam menetapkan cara pengukuran. Untuk variabel tertentu,
dimungkinkan penggunaan alat ukur yang beraneka ragam dengan cara
mengukurnya yang berlainan. Menetapkan indikator suatu konsep dapat dilakukan
dalam dua cara, yakni (a) menggunakan pemahaman atau logika berpikir atas
dasar teori pengetahuan ilmiah dan (b) menggunakan pengalaman empiris, yakni
apa yang terjadi dalam kehidupan nyata.

110

Contoh: Konsep mengenai Hubungan Sosial, dilihat dari pengalaman,


indikatornya empiris adalah keterkaitan dari
- bisa bergaul dengan orang lain
- disenangi atau banyak teman-temannya
- menerima pendapat orang lain
- tidak memaksakan pendapatnya
- bisa bekerja sama dengan siapa pun
- dan lain-lain.
Mengukur

indikator-indikator

tersebut,

berarti

mengukur

bangun

pengertian yang terdapat dalam konsep hubungan sosial. Contoh lain: Konsep
sikap dapat dilihat dari indikatornya secara teoretik (deduksi teori) antara lain
keterkaitan dari
- kesediaan menerima stimulus objek sikap
- kemauan mereaksi stimulus objek sikap
- menilai stimulus objek sikap
- menyusun/mengorganisasi objek sikap
- internalisasi nilai yang ada dalam objek sikap.
Apabila hasil tes menunjukkan indikator-indikator tes yang tidak
berhubungan secara positif satu sama lain, berarti ukuran tersebut tidak memiliki
validitas bangun pengertian. Atas dasar itu indikatornya perlu ditinjau atau
diperbaiki kembali. Cara lain untuk menetapkan validitas bangun pengertian
suatu alat ukur adalah menghubungkan (korelasi) antara alat ukur yang dibuat
dengan alat ukur yang sudah baku/standardized, seandainya telah ada yang baku.
Bila menunjukkan koefisien korelasi yang tinggi maka alat ukur tersebut
memenuhi validitasnya.

111

c.

Validitas ramalan (predictive validity)


Validitas ramalan artinya dikaitkan dengan kriteria tertentu. Dalam

validitas ini yang diutamakan bukan isi tes tapi kriterianya, apakah alat ukur
tersebut dapat digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau
kriteria tertentu yang diinginkan. Misalnya alat ukur motivasi belajar, apakah
dapat digunakan untuk meramal prestasi belajar yang dicapai. Artinya terdapat
hubungan yang positif antara motivasi dengan prestasi. Dengan kata lain dalam
validitas ini mengandung ciri adanya relevansi dan keajegan atau ketetapan
(reliability). Motivasi dapat digunakan meramal prestasi bila skor-skor yang
diperoleh dari ukuran motivasi berkorelasi positif dengan skor prestasi. Validitas
ramalan ini mengandung dua makna. Pertama validitas jangka pendek dan kedua
jangka panjang.
Validitas jangka pendek, artinya daya ramal alat ukur tersebut hanya untuk
masa yang tidak lama. Artinya, skor tersebut berkorelasi pada waktu yang sama.
Misalnya, ketetapan (reliability) terjadi pada semester dua artinya daya ramal
berlaku pada semester dua, dan belum tentu terjadi pada semester berikutnya.
Sedangkan validitas jangka panjang mengandung makna skor tersebut akan
berkorelasi juga di kemudian hari. Mengingat validitas ini lebih menekankan pada
adanya korelasi, maka faktor yang berkenaan dongan persyaratan terjadinya
korelasi harus dipenuhi. Faktor tersebut antara lain hubungan dari konsep dan
variabel dapat dijelaskan berdasarkan pengetahuan ilmiah, minimal masuk akal
sehat dan tidak mengada-ada. Faktor lain adalah skor yang dikorelasikan
memenuhi linieritas. Ketiga validitas yang dijelaskan di atas idealnya dapat
digunakan dalam menyusun instrumen penelitian, minimal dua validitas, yakni
validitas isi dan validitas bangun pengertian. Validitas isi dan bangun pengertian
mutlak diperlukan dan bisa diupayakan tanpa melakukan pengujian secara
statistika.

112

2. Cara Menentukan Validitas


a) Cara Menentukan Validitas dengan Menggunakan Rumus
Perhitungan validitas dari sebuah instrumen dapat menggunakan rumus
korelasi product moment atau dikenal juga dengan korelasi pearson.
Adapun rumusnya adalah sebagai berikut :
X Y

XY
N
r xy =

rxy = koefisien korelasi


N = jumlah responden uji coba
X = skor tiap item
Y = skor seluruh item responden uji coba
Contoh soal:
Responde

Nomor Pertanyaan
Tot

al
1

10

45

45

39

38

35

113

21

26

16

40

24

Tabel Perhitungan Korelasi


Responde

XY

n
A

45

25

2025

235

45

14

2025

180

39

1521

117

38

25

1444

190

35

1156

102

21

441

42

26

676

52

16

256

16

40

16

1600

160

24

576

72

N=10

X=32

Y=328

X=118

Y=11720

XY=116
6

114

Uji Validitas dengan product moment

Hasil penghitungan tersebut, selanjutnya dikonsultasikan dengan tabel korelasi


nilai r dengan terlebih dahulu mencari derajat kebebasan (db), yaitu N-2 ( 10-2
= 8). Pada taraf signifikansi 5% diperoleh angka 0,632, dan 1% adalah 0,765.
Apabila nilai rhitung > rtabel, maka soal/ pertanyaan tersebut memiliki validitas
konstruk yang baik.
Berdasarkan rumus tersebut diperoleh nilai r sebagai berikut
Perny

Nilai r

ataan

Cara Interpretasi pada Keterangan


taraf sig. r 5%

0.884

0.884>0.632

Valid

0.893

0.893>0.632

Valid

0.931

0.931>0.632

Valid

0.811

0.811>0.632

Valid

0.920

0.920>0.632

Valid

0.705

0.705>0.632

Valid

0.827

0.827>0.632

Valid

0.893

0.893>0.632

Valid

115

0.867

0.867>0.632

Valid

10

0.564

0.564<0.632

Tidak Valid

C. UJI RELIABILITAS
Uji reliabilitas adalah proses pengukuran terhadap ketepatan (konsisten) dari
suatu instrumen. Pengujian ini dimaksudkan untuk menjamin instrumen yang
digunakan merupakan sebuah instrumen yang handal, konsistensi, stabil dan
dependibalitas, sehingga bila digunakan berkali-kali dapat menghasilkan data
yang sama. Sedangkan tujuan dari uji reliabilitas adalah menunjukkan konsistensi
skor-skor yang diberikan skorer satu dengan skorer lainnya.
1. Menganalisis / Menguji Reliabilitas butir soal
Suatu tes dapat dikatakan mempunyai kepercayaan yang tinggi jika tes
tersebut dapat memberikan hasil yang tetap. Maka pengertian realibilitas tes
berhubungan dengan masalah ketetapan hasil tes atau seandainya hasilnya
berubah-rubah, perubahan yang terjadi dapat dikatakan tidak berarti. Reliabilitas
alat penilaian adalah ketetapan atau keajegan alat dalam menilai apa yang
dinilainya.
1.

Kualitas butir-butir soal ditentukan oleh :

a.

Jelas tidaknya rumusan soal.

b.

Baik tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan


salah jawab.

c.

Petunjuknya jelas sehingga mudah dan cepat dikerjakan.

2.

Cara cara mencari besarnya reliabilitas yaitu :

a.Teknik test-retest ialah pengetesan dua kali dengan menggunakan suatu tes yang
sama pada waktu yang berbeda.
b.Teknik belah dua ialah pengetesan (pengukuran) yang dilakukan dengan dua
kelompok item yang setara pada saat yang sama.

116

c.Bentuk ekivalen ialah pengetesan (pengukuran) yang dilakukan dengan


menggunakan dua tes yang dibuat setara kemudian diberikan kepada responden
atau obyek tes dalam waktu yang bersamaan.
Berdasarkan rumus Alpha Cronbach sebuah soal dikatakan reliabel jika r

hitung

> r table. (Rasyid & Mansyur, 2007:134).


Kriteria pengujian reliabilitas soal tes yaitu setelah didapatkan harga r11 kemudian
harga r11 tersebut dikonsultasikan dengan harga r product moment pada tabel, jika
r11 > rtabel maka item tes yang diujicobakan reliabel (Arikunto, 2006: 109).
a.
b.

Jika r hitung positif dan r hitung > r tabel maka butir tersebut reliabel.
Jika r hitung negatif atau r hitung < r tabel maka butir tersebut tidak reliabel

2. Teknik untuk Menentukan data Releabilitas.


Ada
a.

beberapa

teknik

untuk

mengukur

reliabilitas,

antara

lain:

Teknik Pengukuran Ulang

Teknik ini dilakukan dengan cara

mengadakan pengkuran ulang kepada

responden, kita meminta responden yang sama agar menjawab semua pertanyaan
dalam alat pengukur sebanyak dua kali. Selang waktu antara pengukuran pertama
dan ke dua menurut Masri Singarimbun antara 15 s/d 30 hari, apa bila selang
waktunya terlalu dekat dikhawatirkan responden masih ingat jawaban yang
diberikan pada waktu yang pertama.
Hasil pengukuran pertama dan kedua kemudian dikorelasikan dengan teknik
korelasi product moment, kemudian dianalisa seperti dalam teknik validitas.
b.

Teknik Belah Dua, yaitu dengan membagi instrumen menjadi dua bagian

misal ganjil dan genap


c.

Teknik Bentuk paralel, yaitu dilakukan dengan menggunakan dua alat ukur

yang mengukur aspek yang sama.


Uji Reliabilitas dilakukan dengan uji Alpha Cronbach. Rumus Alpha
Cronbach sebagai berikut:

117

Note:

Jika nilai alpha > 0,7 artinya reliabilitas mencukupi (sufficient reliability)
sementara jika alpha > 0,80 ini mensugestikan seluruh item reliabel dan seluruh
tes secara konsisten secara internal karena memiliki reliabilitas yang kuat. Atau,
ada pula yang memaknakannya sebagai berikut:

Jika alpha > 0,90 maka reliabilitas sempurna

Jika alpha antara 0,70 0,90 maka reliabilitas tinggi

Jika alpha antara 0,50 0,70 maka reliabilitas moderat

Jika alpha < 0,50 maka reliabilitas rendah

Analisis Reliabilitas Butir Soal Dengan Metode Kuder-Richardson (KR20)


Adapun formula rumus KR20 adalah:

pq
2

s
)
K
r kr 20=

K 1

r KR20 = Koefisien korelasi dengan KR20


k

= jumlah butir soal


118

= proporsi jawaban benar pada butir tertentu

= proporsi jawaban salah pada butir tertentu ( q = 1 p )

s2

= varians skor total

Untuk menghitung harga p dan q sama dengan yang telah diuraikan pada
pembahasan validitas butir instrumen. Sedangkan s2 (varians ):

X
s=

X 2

Sebagai contoh data hasil penilaian:


Data Hasil Penilaian Bidang Studi Elektronika dasar
No
1
2
3
4
5
6
7
8
9
10

P
Q
p.q

Jumlah Soal
1
2
0
1
0
0
1
1
1
0
1
1
0
0
0
0
0
1
0
1
0
1
3
6
0,3
0,6
0,7
0,4
0,21 0,24

3
1
1
1
1
1
0
1
1
1
1
9
0,9
0,1
0,09

4
1
1
1
1
1
1
1
0
0
0
7
0,7
0,3
0,21

5
0
1
0
1
0
1
0
0
0
0
3
0,3
0,7
0,21

6
0
1
1
1
1
0
1
1
0
0
6
0,6
0,4
0,24

Skor rata-rata total.


Xt
X

56

= ----------- = ------N

= 5,6

10

Menghitung varians total.


X2

332

s2 = -------- - X2 = ---------- - ( 5,6 )2 = 1,84


N

10

119

7
0
1
0
1
0
0
1
1
1
1
6
0,6
0,4
0,24

8
1
0
0
0
0
0
1
0
0
0
2
0,2
0,8
0,16

9
0
1
1
1
0
1
0
1
1
1
8
0,8
0,2
0,16

10
1
1
1
1
1
1
0
0
0
0
6
0,6
0,4
0,24

Xt

Xt2

5
7
7
8
6
4
6
5
4
4
56

25
49
49
64
36
16
36
25
16
16
332

2,00

Menghitung reliabilitas dengan KR20:


k

pq

r KR20 = ----------- (1 - --------- )


k1
10

s2
2,00

r KR20 = ----------- (1 - --------- )


10 1

1,84

r KR20 = 1,11 (- 0,087) = - 0,097


Kesimpulan
Koefisien korelasi berada antara 0 1. Suatu instrumen penilaian
dikatakan reliabel jika koefisien korelasinya 0,6, makin tinggi koefisien korelasi
makin reliabel instrumen tersebut, dan sebaliknya. Instrumen penilaian yang kita
jadikan contoh termasuk kategori instrumen yang kurang baik karena tidak
reliabel. Untuk menjadikan instrumen tersebut reliabel maka validitas butir yang
tidak baik dibuang atau diganti. Instrumen yang valid pasti reliabel, tetapi
instrumen yang reliabel belum tentu valid.

D. TINGKAT KESUKARAN (DIFFICULTY LEVEL)


Tingkat kesukaran butir soal adalah proporsi peserta tes menjawab benar
terhadap butir soal tersebut. Tingkat kesukaran butir soal biasanya dilambangkan
dengan p. Makin besar nilai p yang berarti makin besar proporsi yang menjawab
benar terhadap butir soal tersebut, makin rendah tingkat kesukaran butir soal itu.
Hal ini mengandung arti bahwa soal itu makin mudah, demikian pula sebaliknya.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu
sukar. Soal yang terlalu mudah tidak merangsang mahasiswa untuk mempertinggi
usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan
mahasiswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi
karena di luar jangkauannya.
Tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal itu
baik atau tidak. Tingkat kesukaran butir hanya menunjukkan bahwa butir soal itu
sukar atau mudah untuk kelompok peserta tes tertentu. Butir soal hasil belajar

120

yang terlalu sukar atau terlalu mudah tidak banyak memberi informasi tentang
butir soal atau peserta tes.
Pada analisis butir soal secara klasikal, tingkat kesukaran dapat diperoleh
dengan beberapa cara antara lain : a) skala kesukaran linier; b) skala bivariat; c)
indeks davis; d) proporsi menjawab benar.
Cara yang paling umum digunakan adalah proporsi menjawab benar atau
proportion correct, yaitu jumlah peserta tes yang menjawab benar pada soal yang
dianalisis dibandingkan dengan peserta tes seluruhnya. Dalam analisis item ini
digunakan proportion correct (p), untuk menilai tingkat kesukaran butir soal, yang
dapat dilihat berdasarkan hasil analisis iteman pada lampiran 6.
Besarnya tingkat kesukaran berkisar antara 0,00 sampai 1,00. Untuk
sederhananya, tingkat kesukaran butir dan perangkat soal dapat dibagi menjadi
tiga kelompok, yaitu mudah, sedang dan sukar. Sebagai patokan dapat digunakan
tabel sebagai berikut:
Tabel V.1: Klasifikasi Tingkat Kesukaran
P-P
0,00 0,29
0,30 0,69
0,70 1,00
Untuk menyusun

KLASIFIKASI
Soal Mudah
Soal Sedang
Soal Sukar
suatu naskah ujian sebaiknya digunakan butir soal yang

mempunyai tingkat kesukaran berimbang, yaitu : soal berkategori sukar sebanyak


25%, kategori sedang 50% dan kategori mudah 25%.
Dalam penggunaan butir soal dengan komposisi seperti di atas, maka
dapat diterapkan penilaian berdasar acuan norma atau acuan patokan. Bila
komposisi butir soal dalam suatu naskah ujian tidak berimbang, maka penggunaan
penilaian acuan norma tidaklah tepat, karena informasi kemampuan yang
dihasilkan tidaklah akan berdistribusi normal.
Walaupun demikian ada yang berpendapat bahwa soal-soal yang dianggap
baik adalah soal-soal yang sedang, yaitu soal-soal yang mempunyai indeks
kesukaran berkisar antara 0,26 0,75. Berbagai kriteria tersebut mempunyai
kecenderungan bahwa butir soal yang memiliki indeks kesukaran kurang dari 0,25
dan lebih dari 0,75 sebaiknya dihindari atau tidak digunakan, karena butir soal

121

yang demikian terlalu sukar atau terlalu mudah, sehingga kurang mencerminkan
alat ukur yang baik.
Namun demikian soal-soal yang terlalu mudah atau terlalu sukar tidak
berarti tidak boleh digunakan. Hal ini tergantung dari tujuan penggunaannya. Jika
dari peserta tes banyak, padahal yang dikehendaki lulus hanya sedikit maka
diambil peserta yang terbaik, untuk itu diambilkan butir soal tes yang sukar.
Demikian sebaliknya jika kekurangan peserta tes, maka dipilihkan soal-soal yang
mudah. Selain itu, soal-soal yang sukar akan menambah motivasi belajar bagi
siswa-siswa yang pandai, sedangkan soal-soal yang mudah akan membangkitkan
semangat kepada siswa yang lemah.
1. Cara Menentukan Tingkat Kesukaran Suatu Butir Tes
Untuk menghitung tingkat kesukaran tiap butir soal digunakan persamaan:

P=

B
Jx

Dengan:
P adalah indeks kesukaran,
B adalah banyaknya siswa yang menjawab soal dengan benar,
Jx adalah jumlah seluruh siswa peserta tes
Rumus lain yang digunakan untuk menentukan tingkat kesukaran soal
uraian sama dengan soal pilihan ganda yaitu :

Tk=

SA+ SB
IA+ IB

X 100%

Keterangan:
Tk : Indeks tingkat kesukaran butir soal
SA : jumlah skor kelompok atas

122

SB : jumlah skor kelompok bawah


IA : jumlah skor ideal kelompok atas
IB : jumlah skor ideal kelompok bawah
Setelah indeks tingkat kesukaran diperoleh, maka harga indeks kesukaran
tersebut diinterpretasikan pada kriteria sesuai tabel berikut:
Tabel V.2.:Interpretasi Tingkat Kesukaran
Indeks Tingkat Kesukaran

Kriteria

0 15 %

Sangat sukar, sebaiknya dibuang

16 % 30 %

Sukar

31 % 70 %

Sedang

71 % 85 %

Mudah

86 % 100 %

Sangat mudah, sebaiknya di buang

Contoh Soal:
Tentukan masing-masing soal apakah memiliki tingkat kesukaran soal yang
mudah, sedang, dan sukar?
Untuk soal No. 1
B
P= Jx
23
P= 30
P= 0,76

123

Dari hasi perhitungan diketahui bahwa skor tingkat kesukaran soal untuk
nomor soal 1 adalah 0,76 yang tergolong kategori mudah. Dengan menggunakan
cara yang sama, maka dapat dicari tingkat kesukaran tiap soal seperti terlampir
pada tabel di bawah:
No Soal
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

B
23
30
22
26
8
15
23
7
18
27
28
15
20
13
12
7
15
24
17
14
25
13
9
12
13

JS
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30
30

P
0,76
1
0,73
0,86
0,26
0,5
0,76
0,23
0,6
0,9
0,93
0,5
0,66
0,43
0,4
0,23
0,5
0,8
0,56
0,46
0,83
0,43
0,3
0,4
0,43

Kategori
Mudah
Mudah
Mudah
Mudah
Sukar
Sedang
Mudah
Sukar
Sedang
Mudah
Mudah
Sedang
Sedang
Sedang
Sedang
Sukar
Sedang
Mudah
Sedang
Sedang
Mudah
Sedang
Sedang
Sedang
Sedang

E. UJI DAYA PEMBEDA


Daya pembeda soal adalah kemampuan suatu butir soal dapat
membedakan antara warga belajar/siswa yang telah menguasai materi yang
ditanyakan dan warga belajar/siswa yang tidak/kurang/belum menguasai materi
yang ditanyakan. Manfaat daya pembeda butir soal adalah seperti berikut ini.
1)

Untuk meningkatkan mutu setiap butir soal melalui data empiriknya.

Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah butir
soal itu baik, direvisi, atau ditolak.
124

2)

Untuk

mengetahui

seberapa

jauh

setiap

butir

soal

dapat

mendeteksi/membedakan kemampuan siswa, yaitu siswa yang telah memahami


atau belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak
dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat
dicurigai "kemungkinannya" seperti berikut ini.

Kunci jawaban butir soal itu tidak tepat.

Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar

Kompetensi yang diukur tidak jelas

Pengecoh tidak berfungsi

Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang menebak

Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada
yang salah informasi dalam butir soalnya
Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam
bentuk proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin
mampu soal yang bersangkutan membedakan warga belajar/siswa yang telah
memahami materi dengan warga belajar/peserta didik yang belum memahami
materi. Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Semakin
tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika daya
pembeda negatif (<0) berarti lebih banyak kelompok bawah (warga belajar/peserta
didik yang tidak memahami materi) menjawab benar soal dibanding dengan
kelompok atas (warga belajar/peserta didik yang memahami materi yang diajarkan
guru).
Daya pembeda suatu soal tes dapat dihitung dengan menggunakan rumus
sebagai berikut :

D=

BA BB

JA JB

dimana :
D = indeks diskriminasi (daya pembeda)
JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
125

BA = banyaknya peserta kelompok atas yang menjawab benar


BB = banyaknya peserta kelompok bawah yang menjawab benar
Sebagai acuan untuk mengklasifikasikan data hasil penelitian dapat
digunakan kriteria seperti pada tabel berikut:
Tabel V.3 : Acuan klasifikasi daya pembeda
Klasifikasi

Daya Rentang Nilai D

Pembeda No.
1
2
3
4

D < 0,20
0,20 < D < 0,40
0,40 < D < 0,70
0,70 < D < 1,00

Klasifikasi
Jelek
Cukup
Baik
Baik sekali

Contoh :
Apakah setiap butir soal pada tabel dibawah ini memiliki daya pembeda yang
baik jika JA dan JB masing masing 15 orang ?
No

BA

BB

No

BA

BB

Soal
1

Soal
14

15

16

17

18

19

20

21

22

10

23

11

24

12

25

13

Jawab :

126

Membuat tabel penolongnya


No Soal

BA

BB

BA/JA

BB/JB

1
2
3

7
8
8

4
8
4

0.9
1
1

0.5
1
0.5

4
5
6
7

8
2
3
7

6
3
5
4

1
0.2
0.4
0.9

0.7
0.4
0.6
0.5

8
9
10

1
8
8

0
1
6

0.1
1
1

0
0.1
0.7

11
12
13
14

8
7
7
7

6
4
2
0

1
0.9
0.9
0.9

0.7
0.5
0.2
0

15
16
17
18

7
1
2
8

1
1
3
6

0.9
0.1
0.2
1

0.1
0.1
0.4
0.7

19
20
21
22

6
7
8
6

2
3
5
2

0.7
0.9
1
0.7

0.2
0.4
0.6
0.2

23

0.9

0.1

24
25

6
8

1
2

0.7
1

0.1
0.2

Kemudian menghitung daya pembedanya dengan menggunakan rumus :


D=

BA BB

JA JB

Sehingga :
untuk soal No. 1 :

127

D=

BA BB

JA JB

7 4

8 8

D = 0.9 0.5
D = 0.4
Untuk soal No.2 :
D=

D=

BA BB

JA JB
8 8

8 8

Untuk soal No.3


D=

D=

BA BB

JA JB
8 4

8 8

D= 1-1

D= 1- 0,5

D= 0

D= 0,5

Untuk soal No.4

Untuk soal No.5

D=

D=

BA BB

JA JB
8 6

8 8

D=

D=

BA BB

JA JB
2 3

8 8

D= 1- 0,7

D= 0,2 0,4

D= 0,3

D= - 0,2

Untuk soal No. 6

Untuk soal No. 7

128

D=

D=

BA BB

JA JB

3 5

8 8

D=

D=

BA BB

JA JB

7 4

8 8

D= 0,4 0,6

D= 0,9 0,5

D= - 0,2

D= 0,4

Untuk soal No. 8

Untuk soal No. 9

D=

D=

BA BB

JA JB
1 0

8 8

D=

D=

BA BB

JA JB
8 1

8 8

D= 0,1 0

D= 1- 0,1

D= 0,1

D= 0,9

Untuk soal No. 10

Untuk soal No. 11

D=

D=

BA BB

JA JB
8 6

8 8

D= 1 0,7

D=

D=

BA BB

JA JB
8 6

8 8

D= 1 0,7

129

D= 0,3

D= 0,3

Untuk soal No. 12

Untuk soal No. 13

D=

D=

BA BB

JA JB

7 4

8 8

D=

D=

BA BB

JA JB

7 2

8 8

D= 0,9 0,5

D= 0,9 0,2

D= 0,4

D= 0,7

Untuk soal No. 14

Untuk soal No. 15

D=

D=

BA BB

JA JB

7 0

8 8

D=

D=

BA BB

JA JB

7 1

8 8

D= 0,9 0

D= 0,9 0,1

D= 0,9

D= 0,8

Untuk soal No. 16

Untuk soal No. 17

D=

D=

BA BB

JA JB
1 1

8 8

D=

D=

BA BB

JA JB
2 3

8 8

D= 0,1 0,1

D= 0,2 0,4

D= 0

D= -0,2

Untuk soal No. 18

Untuk soal No. 19

130

D=

BA BB

JA JB
8 6

8 8

D=

D=

D=

BA BB

JA JB

6 2

8 8

D= 1 0,7

D= 0,7 0,2

D= 0,3

D= 0,5

Untuk soal No. 20

Untuk soal No. 21

D=

D=

BA BB

JA JB

7 3

8 8

D=

BA BB

JA JB
8 5

8 8

D=

D= 0,9 0,4

D= 1 0,6

D= 0,5

D= 0,4

Untuk soal No. 22

Untuk soal No. 23

D=

D=

BA BB

JA JB

6 2

8 8

D=

D=

BA BB

JA JB

7 1

8 8

D= 0,7 0,2

D= 0,9 0,1

D= 0,5

D= 0,8

Untuk soal No. 24

Untuk soal No. 25

D=

BA BB

JA JB

D=

BA BB

JA JB

131

D=

6 1

8 8

D=

8 2

8 8

D= 0,7 0,1

D= 1 0,2

D= 0,6

D= 0,8

Jadi didapat hasil sebagai berikut :


No

BA

BB

BA/JA

BB/JB

Kategori

Soal
1

0.9

0.5

0.4

Cukup

Sangat jelek

0.5

0.5

Baik

0.7

0.3

Cukup

0.2

0.4

-0.4

Sangat jelek

0.4

0.6

-0.2

Sangat jelek

0.9

0.5

0.4

Cukup

0.1

0.1

Jelek

0.1

0.9

Sangat baik

10

0.7

0.3

Cukup

11

0.7

0.3

Cukup

12

0.9

0.5

0.4

Cukup

13

0.9

0.2

0.7

Baik

14

0.9

0.9

Sangat baik

15

0.9

0.1

0.8

Sangat baik

16

0.1

0.1

Sangat jelek

17

0.2

0.4

-0.2

Sangat jelek

18

0.7

0.3

Cukup

19

0.7

0.2

0.5

Baik

20

0.9

0.4

0.5

Baik

21

0.6

0.4

Cukup

22

0.7

0.2

0.5

Baik

23

0.9

0.1

0.8

Sangat baik

24

0.7

0.1

0.6

Baik

25

0.2

0.8

Sangat baik

132

Kesimpulan : Tidak semua soal tersebut memiliki daya pembeda yang baik untuk
membedakan siswa yang menguasai materi dan yang belum menguasai materi.

F. RINGKASAN
Dalam uji validitas dilakukan untuk menguji apakah instrumen yang akan
diujikan tergolong data yang valid atau tidak. Sementara dalam uji reliabilitas
dilakukan untuk menjamin instrumen yang digunakan merupakan sebuah
instrumen yang handal, konsistensi, stabil dan dependibalitas, sehingga bila
digunakan berkali-kali dan dapat menghasilkan data yang sama. Dalam uji tingkat
kesukaran soal digunakan untuk proporsi peserta tes menjawab benar terhadap butir
soal tersebut. Dalam pengujian ini dapat diketahui apakah instrumen pengujian yang akan
diberikan tergolong soal yang mudah, sedang, atau sukar. Sementara dalam pengujian
daya pembeda yaitu menguji kemampuan suatu butir soal apakah dapat

membedakan antara warga belajar/siswa yang telah menguasai materi yang


ditanyakan dan warga belajar/siswa yang tidak/kurang/belum menguasai materi
yang ditanyakan.

133