Anda di halaman 1dari 35

A.

Perhitungan Reliabilitas
Terdapat beberapa formula untuk menghitung nilai koefisien reliabilitas
yang bergantung kepada metode atau teknik pengumpulan data reliabilitas yang
digunakan dan skor butir soal (dikotomi atau politomi). Berikut dijabarkan contoh
perhitungan koefisien reliabilitas menggunakan beberapa formula:
1) Formula Kuder Richardson (KR20)
Formula KR20 dapat diterapkan pada instrumen yang mempunyai data skor
dikotomi dari tes yang seolah-olah dibagi-bagi menjadi belahan sebanyak butir
yang dimiliki. Skor yang diperoleh adalah berupa iya/tidak atau benar/salah (1 dan
0). Hasil perhitungan dengan rumus KR20 lebih teliti, tetapi perhitungannya lebih
rumit.
Rumus:

Keterangan:
ri1 = koefisien reliabilitas
k = banyaknya butir soal
vt = varians skor total
p = proporsi subjek yang menjawab soal secara benar
q = proporsi subjek yang menjawab soal secara salah (q = 1 p)

Contoh perhitungan reliabilitas menggunakan formula KR20:


Dilakukan penelitian untuk mengetahui gambaran penggunaan bahan pada
perawatan luka di sebuah rumah sakit oleh perawat. Butir soal yang digunakan
sebanyak 13 butir dengan responden untuk uji realibilitas diambil sebanyak 10
orang. Hasil yang didapat adalah sebagai berikut.
No Nomor butir-butir pertanyaan dalam kuisioner
X X2
Subjek 1 2 3 4 5 6 7 8 9 10 11 12 13
1 1 0 1 0 1 1 0 1 1 0 0 1 0 7 49
2 0 0 1 0 1 1 0 1 1 1 0 1 0 7 49
3 1 0 1 0 1 1 0 1 1 1 1 1 0 9 81
4 0 0 1 0 1 1 0 0 1 0 0 1 1 6 36
5 1 0 1 0 1 1 0 1 1 1 0 1 0 8 64
6 1 0 1 0 1 1 0 1 1 0 0 1 0 7 49
7 1 0 0 0 1 1 0 0 1 0 0 0 0 4 16
8 0 0 1 0 1 1 0 0 1 0 0 1 0 5 25
9 1 0 1 0 1 1 0 1 1 0 0 1 0 7 49
10 0 0 1 0 1 1 0 0 1 1 0 1 0 6 36
Np 6 0 9 0 10 10 0 6 10 4 1 9 1 66 454
p 0,6 0 0,9 0 1 1 0 0,6 1 0,4 0,1 0,9 0,1
1-p 0,4 1 0,1 1 0 0 1 0,4 0 0,6 0,9 0,1 0,9
p(1-p) 0,24 0,00 0,09 0,00 0,00 0,00 0,00 0,24 0,00 0,24 0,09 0,09 0,09 1,08

454 66 / 10
=
10 1
= 4,31
13 1,08
= 1
13 1 4,31

= 0,812
Nilai koefisien reliabilitas yang didapat adalah 0,812 > 0,70. Kesimpulannya kuisioner dianggap masih reliabel (Sinaga, 2012)
2) Formula Kuder Richardson (KR21)
Formula KR21 lebih sederhana dalam perhitungannya dibandingkan dengan
formula KR20. Namun, formula KR21 juga memiliki kelemahan, yaitu kurang
teliti dibandingkan dengan KR20. Rumusnya adalah sebagai berikut:

Keterangan:
ri1 = koefisien reliabilitas
k = banyaknya butir soal
1 = bilangan konstan
M = mean total (rata-rata hitung dari skor total)
vt = varians skor total
N = jumlah responden

Contoh:
Dilakukan penelitian untuk mengetahui persepsi tentang hubungan suami-
istri selama kehamilan pada ibu hamil yang memeriksakan kandungan di sebuah
Puskesmas. Jumlah soal yang digunakan sebanyak 8 butir dengan responden
untuk uji realibilitas diambil sebanyak 10 orang. Hasil yang didapat adalah
sebagai berikut.

Nomor butir-butir pertanyaan dalam


No
kuisioner X X2
Subjek
1 2 3 4 5 6 7 8
1 1 1 1 1 1 1 0 1 7 49
2 0 1 1 1 1 1 1 1 7 49
3 0 1 1 1 1 1 1 1 7 49
4 1 0 0 0 0 1 0 0 2 4
5 0 0 0 1 0 0 0 0 1 1
6 1 1 1 1 1 1 0 1 7 49
Nomor butir-butir pertanyaan dalam
No
kuisioner X X2
Subjek
1 2 3 4 5 6 7 8
7 0 0 0 0 1 0 0 1 2 4
8 1 1 1 1 1 1 0 0 6 36
9 0 0 0 0 0 1 1 0 2 4
10 0 0 0 1 0 0 0 0 1 1
X 42
(X)2 1764
(X2) 246

X X / N
2 2

vt
N 1

42 246 1764 / 10
= =
10 10 1
= 4,2 = 7,73

8 4,2 8 4,2
= 1
8 1 8 7,73

= 0,724
Nilai koefisien reliabilitas yang didapat adalah 0,724 > 0,70. Kesimpulannya
kuisioner dianggap masih reliabel (Sari, 2012).

3) Formula Spearman-Brown
Formula Spearman-Brown hanya dapat diterapkan pada soal yang mempunyai
jumlah butir genap. Formula ini menggunakan teknik belah dua (split half
method), yaitu soal dibelah menjadi 2 bagian (belahan ganjil dan belahan genap
atau belahan kiri dengan belahan kanan). Kedua belahan tersebut sejajar.
Formulanya adalah sebagai berikut:

Keterangan:
r11 = koefisien reliabilitas
rhh = koefisien korelasi product moment antara skor belahan satu dengan skor
belahan yang lain
1 dan 2 = bilangan konstan

Rumus product moment:

Keterangan:
X = Jumlah skor item ganjil
Y = Jumlah skor item genap
N = jumah subjek

Contoh:
Dalam sebuah penelitian untuk menentukan strategi faktor eksternal dalam
pengembangan perikanan tangkap di sebuah Pangkalan Pendaratan Ikan (PPI).
Terdapat 16 butir soal yang dibagi menjadi 2 bagian, yakni ganjil dan genap.
Jumlah subyek adalah 10 dengan kriteria pembobotan skor sebagai berikut.

Kriteria Bobot
Sangat penting 5
Penting 4
Cukup penting 3
Kurang penting 2
Tidak penting 1
Hasil yang didapat dari pengisian kuisioner adalah sebagai berikut.
Nomor butir-butir pertanyaan dalam kuisioner Teknik Belah Dua
No Skor
Ganjil Genap
Subjek 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Total x2 y2 xy
(x) (y)
1 3 4 3 3 4 4 2 42 2 3 2 2 3 3 2 46 22 24 484 576 528
2 2 3 3 3 4 3 3 42 3 2 2 2 3 2 2 43 20 23 400 529 460
3 5 4 5 4 5 4 4 53 3 3 3 3 4 3 4 62 31 31 961 961 961
4 4 4 3 3 4 3 3 43 3 2 3 2 2 3 2 48 24 24 576 576 576
5 4 4 3 3 3 2 2 42 2 2 2 2 2 2 2 41 20 21 400 441 420
6 4 5 4 5 4 4 5 43 3 2 3 3 3 4 3 59 29 30 841 900 870
7 4 4 3 4 3 4 3 43 3 3 3 3 2 2 3 51 24 27 576 729 648
8 3 3 2 3 2 3 3 42 2 2 1 2 2 2 3 39 18 21 324 441 378
9 4 4 3 4 3 4 4 32 3 2 2 3 1 3 2 47 24 23 576 529 552
10 2 3 2 3 2 3 3 32 2 2 3 2 3 2 2 39 17 22 289 484 374
x 229
y 246
x2 5427
y2 6166
xy 5767
Dari hasil yang didapat kemudian dapat dihitung nilai product moment dan koefisien reliabilitasnya.
10 5767 229 246
=
10 5427 229 10 6166 246
2 2

57670 56334
= 54270 52441 61660 60516
1336 1336
= =
18291144 2092376
1336
= 1446,5 = 0,9236

2 0,9236 1,847211
= 1 0,9236 = 1,9236
= 0,9603

Pada tabel r product moment untuk N=10, nilai r untuk selang kepercayaan 95% ( = 0,05) adalah 0,632, sehingga nilai r hitung > nilai r
tabel (0,9603 > 0,632). Kesimpulannya kuisioner dianggap masih reliabel (Rahardjo, 2008).
4) Formula Rulon
Sama halnya dengan formula Spearman-Brown, formula Rulon ini juga dapat
diterapkan dengan teknik belah dua (split half method). Yang berbeda hanya cara
pandangnya terhadap reliabilitas. Menurut Rulon, reliabilitas dapat dipandang dari
adanya selisih skor (d) yang diperoleh oleh responden pada belahan pertama
dengan belahan kedua. Selisih tersebut yang menjadi sumber variasi error
sehingga bila dibandingkan dengan variasi skor akan dapat menjadi dasar untuk
melakukan estimasi tes reliabilitas. Formula Rulon mempunyai rumus adalah
sebagai berikut.

Keterangan:
r11 = koefisien reliabilitas

= varians perbedaan skor belahan

= varians skor total

1 = bilangan konstan
Contoh:
Kasus yang digunakan sama seperti pada formula Spearman-Brown, yakni:
Nomor butir-butir pertanyaan dalam kuisioner Teknik Belah Dua
No Skor
Ganjil Genap d
Subjek 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Total d2 xt xt2
(x) (y) = x-y
1 3 4 3 3 4 4 2 4 2 2 3 2 2 3 3 2 46 22 24 -2 4 46 2116
2 2 3 3 3 4 3 3 4 2 3 2 2 2 3 2 2 43 20 23 -3 9 43 1849
3 5 4 5 4 5 4 4 5 3 3 3 3 3 4 3 4 62 31 31 0 0 62 3844
4 4 4 3 3 4 3 3 4 3 3 2 3 2 2 3 2 48 24 24 0 0 48 2304
5 4 4 3 3 3 2 2 4 2 2 2 2 2 2 2 2 41 20 21 -1 1 41 1681
6 4 5 4 5 4 4 5 4 3 3 2 3 3 3 4 3 59 29 30 -1 1 59 3481
7 4 4 3 4 3 4 3 4 3 3 3 3 3 2 2 3 51 24 27 -3 9 51 2601
8 3 3 2 3 2 3 3 4 2 2 2 1 2 2 2 3 39 18 21 -3 9 39 1521
9 4 4 3 4 3 4 4 3 2 3 2 2 3 1 3 2 47 24 23 1 1 47 2209
10 2 3 2 3 2 3 3 3 2 2 2 3 2 3 2 2 39 17 22 -5 25 39 1521
x 229
y 246
d -17
(d2) 59
xt 475
xt2 23127
Dari hasil tersebut dapat dihitung varians perbedaan skor belahan dan varians total untuk menghitung koefisien reliabilitasnya.

59 23127
= 17 = 475
10 10
= -22,9 = -1837,7

22,9 1837,7
= =
10 10
= -2,29 = -183,77

2,29
= 1 183,77 = 0,9875

Nilai koefisien reliabilitas yang didapat adalah 0,9875 > 0,70. Kesimpulannya kuisioner dianggap masih reliabel.
5) Formula Flanagan
Formula Flanagan juga memakai teknik belah dua (split half method) seperti
halnya pada formula Spearman-Brown. Namun, koefisien reliabilitas pada
formula Flanagan tidak didasarkan ada tidaknya korelasi antara belahan I dengan
belahan II. Dasar dari formula Flanagan adalah jumlah kuadrat deviasi (varians)
pada tes belahan I, jumlah kuadrat (varians) deviasi pada tes belahan II, dan
jumlah kuadrat deviasi (varians) skor total. Formula yang digunakan adalah
sebagai berikut:
rumus :

Keterangan:
r11 = koefisien reliabilitas
= varians skor belahan 1
= varians skor belahan 2
= varians skor total
2 & 1 = bilangan konstan
Contoh:
Kasus yang digunakan serupa dengan kasus pada formula Spearman-Brown.

Nomor butir-butir pertanyaan dalam kuisioner Teknik Belah Dua


No Skor
Ganjil Genap
Subjek 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Total x2 y2 x+y (x+y)2
(x) (y)
1 3 4 3 3 4 4 2 4 2 2 3 2 2 3 3 2 46 22 24 484 576 46 2116
2 2 3 3 3 4 3 3 4 2 3 2 2 2 3 2 2 43 20 23 400 529 43 1849
3 5 4 5 4 5 4 4 5 3 3 3 3 3 4 3 4 62 31 31 961 961 62 3844
4 4 4 3 3 4 3 3 4 3 3 2 3 2 2 3 2 48 24 24 576 576 48 2304
5 4 4 3 3 3 2 2 4 2 2 2 2 2 2 2 2 41 20 21 400 441 41 1681
6 4 5 4 5 4 4 5 4 3 3 2 3 3 3 4 3 59 29 30 841 900 59 3481
7 4 4 3 4 3 4 3 4 3 3 3 3 3 2 2 3 51 24 27 576 729 51 2601
8 3 3 2 3 2 3 3 4 2 2 2 1 2 2 2 3 39 18 21 324 441 39 1521
9 4 4 3 4 3 4 4 3 2 3 2 2 3 1 3 2 47 24 23 576 529 47 2209
10 2 3 2 3 2 3 3 3 2 2 2 3 2 3 2 2 39 17 22 289 484 39 1521
x 229
y 246
(x2) 5427
(y2) 6166
(x+y) 475
(x+y)2 23127
Dari hasil di atas, kemudian dapat dihitung nilai koefisien reliabilitasnya dengan menghitung masing-masing varians belahan dan varians
skor total kedua belahan.

5427 6166 23127


= = =
10 10 10
= 542,7 = 616,6 = 2312,7

542,7 616,6
= 2 1
2312,7

= 0,9974

Nilai koefisien reliabilitas yang didapat adalah 0,9974 > 0,70. Kesimpulannya kuisioner dianggap masih reliabel.
6) Formula Alpha
Formula-formula di atas hanya berlaku untuk soal objektif yang mempunyai
kemungkinan jawaban benar dan salah (pilihan). Sedangkan untuk soal yang
mempunyai gradualitas skor jawaban misalnya pada soal uraian ataupun pada
angket (tes sikap), dapat digunakan Formula Alpha. Hal ini dikarenakan Formula
Alpha mampu mengakomodasi adanya variasi skor dalam setiap butir soal.
Rumus yang digunakan adalah sebagai berikut.

Keterangan:
r11 = koefisien reliabilitas
n = jumlah butir soal
Si2 = varians skor tiap-tiap butir soal
St2 = varians total
1 = bilangan konstan

Contoh perhitungan reliabilitas menggunakan formula Alpha:


Telah dilakukan penelitian untuk mengetahui reliabilitas skala konsep diri
pada mahasiswa jurusan Psikologi dari tiga universitas yang berbeda. Digunakan
sebanyak 13 komponen konsep diri yaitu matematika, verbal, kemampuan umum,
pemecahan masalah, kemampuan fisik, penampilan fisik, hubungan dengan
sesame jenis, hubungan dengan lain jenis, hubungan dengan orang tua, nilai
spiritual, kejujuran, stabilitas emosi, dan diri umum. Hasil yang didapat adalah
sebagai berikut.
No Nomor butir-butir pertanyaan dalam kuisioner y y2
Subjek 1 x2 2 x2 3 x2 4 x 2
5 x2 6 x2 7 x2 8 x2 9 x2 10 x2 11 x2 12 x2 13 x2
1
1 2 4 4 6 4 16 2 4 2 4 2 4 4 16 3 9 3 9 3 9 3 9 3 9 2 4 37 1369
2 3 9 2 4 3 9 2 4 2 4 2 4 2 4 2 4 3 9 3 9 3 9 3 9 2 4 32 1024
3 3 9 2 4 2 4 3 9 3 9 3 9 3 9 2 4 3 9 3 9 4 16 2 3 2 4 35 1225
4 2 4 2 4 2 4 4 16 2 4 2 4 2 4 2 4 3 9 4 16 4 16 3 9 4 16 36 1296
5 3 9 3 9 3 9 5 25 4 16 4 16 3 9 4 16 4 16 5 25 5 25 3 9 3 9 49 2401
1
6 3 9 4 6 3 9 4 16 3 9 4 16 4 16 3 9 4 16 2 4 2 4 2 4 3 9 41 1681
7 2 4 2 4 2 4 3 9 3 9 3 9 3 9 3 9 4 16 4 16 3 9 2 4 2 4 36 1296
8 2 4 2 4 2 4 3 9 2 4 2 4 3 9 3 9 3 9 5 25 3 9 3 9 3 9 36 1296
1
9 4 6 3 9 4 16 4 16 2 4 2 4 3 9 3 9 3 9 3 9 4 16 3 9 3 9 41 1681
10 2 4 2 4 2 4 4 16 4 16 3 9 2 4 2 4 4 16 3 9 3 9 2 4 2 4 35 1225
2 2 3 2 2 2 3 2
x 6 6 27 4 27 7 9 7 4 35 34 26 6
1 1
6 6 1 7 8 7 1 6
7 7 72 5 72 2 4 2 5 12 11 67 7
(x)2 6 6 9 6 9 9 1 9 6 25 56 6 6
No Nomor butir-butir pertanyaan dalam kuisioner y y2
Subjek 1 x2 2 x2 3 x2 4 x 2
5 x2 6 x2 7 x2 8 x2 9 x2 10 x2 11 x2 12 x2 13 x2
7 7 12 11 13 12
(x2) 2 4 79 4 79 79 89 77 8 1 2 69 72
y 378
1428
(y)2 84
(y2) 14494

Dari hasil nilai varians masing-masing komponen (soal) tersebut, maka dapat dihitung nilai varians setiap butir soal dan varians skor total.
Selanjutnya dapat dihitung nilai koefisien reliabilitasnya sebagai berikut.
Varians butir soal no. 1: Varians butir soal no. 2:

72 676 / 10 74 676 / 10
= =
10 10
= 0,44 = 0,64

Varians setiap butir soal dihitung hingga didapat nilai total varians tiap butir soal
sebagai berikut.

= 0,44+0,64+0,61+0,84 +0,61+0,61+0,49+0,41+0,24+0,85+0,64+0,14+0,44
= 6,96

Varians skor total dari seluruh butir soal adalah:

14494 142884 / 10
=
10
= 20,56

Nilai Koefisien Reabilitas:

13 6,96
= 1
13 1 20,56

= 0,717

Nilai koefisien reliabilitas yang didapat adalah 0,717 > 0,70. Kesimpulannya
kuisioner dianggap masih reliabel (Widodo, 2006).
B. Analisis Butir Soal
Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan
berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap).
Penelaahan ini biasanya dilakukan sebelum soal digunakan atau diujikan.
Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah
setiap soal ditelaah dari segi materi, konstruksi, bahasa atau budaya, dan
kunci jawaban atau pedoman penskorannya. Dalam menganalisis butir soal,
terdapat dua teknik. Yaitu teknik kualitatif dan teknik kuantitatif. Disini akan
dibahas tentang analisis butir soal secara kuantitatif.
Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan
pada data empirik. Data empirik ini diperoleh dari soal yang telah diujikan.
Ada dua pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara
klasik dan modern. Analisis butir soal secara klasik adalah proses
penelaahan butir soal melalui informasi dari jawaban peserta didik tes guna
meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori
tes klasik. Kelebihan analisis butir soal secara klasik adalah murah,
sederhana, familiar, dapat dilaksanakan sehari-hari dengan cepat
menggunakan komputer, dan dapat menggunakan data dari beberapa peserta
didik atau sampel kecil (Millman dan Greene, 1993: 358). Analisis jenis butir
ini yang lazim digunakan dalam praktik di lapangan, terutama oleh guru
disekolah.
Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik
adalah setiap butir soal ditelaah dari segi: tingkat kesukaran butir, daya
pembeda butir, dan penyebaran pilihan jawaban (untuk soal bentuk obyektif)
atau fungsi pengecoh pada setiap pilihan jawaban, reliabilitas dan validitas
soal.
1. Tingkat Kesukaran
Tingkat kesukaran soal adalah peluang untuk menjawab benar
suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan
dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya
dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 - 1,00
(Aiken (1994: 66). Semakin besar indeks tingkat kesukaran yang diperoleh
dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki
TK= 0,00 artinya bahwa tidak ada siswa yang menjawab benar dan bila
memiliki TK= 1,00 artinya bahwa siswa menjawab benar. Perhitungan
indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada
prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang
bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini
dipergunakan untuk soal selected response item, yaitu (Nitko, 1996: 310).
Tingkat Kesukaran (TK) =

Atau dengan menggunakan rumus:

P = proporsi (indeks kesukaran)


B = jumlah siswa yang menjawab benar
N = jumlah peserta tes
Tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes.
Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki
tingkat kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang
memiliki tingkat kesukaran tinggi atau sukar, dan untuk keperluan diagnostik
biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah atau
mudah.
Klasifikasi tingkat kesulitan soal dapat menggunakan kriteria berikut:
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan
bagi guru dan kegunaan bagi pengujian dan pengajaran (Nitko, 1996: 310-
313). Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep
terhadap pembelajaran ulang dan memberi masukan kepada siswa tentang
hasil belajar mereka, (2) memperoleh informasi tentang penekanan
kurikulum atau mencurigai terhadap butir soal yang bias. Adapun
kegunaannya bagi pengujian dan pengajaran adalah: (a) pengenalan
konsep yang diperlukan untuk diajarkan ulang, (b) tanda-tanda terhadap
kelebihan dan kelemahan pada kurikulum sekolah, (c) memberi masukan
kepada siswa, (d) tanda-tanda kemungkinan adanya butir soal yang bias,
(e) merakit tes yang memiliki ketepatan data soal.
Contoh :

Tes formatif IPA, 10 soal bentuk pilihan ganda, option 4, dengan proporsi
2 soal mudah, 6 soal sedang dan 2 soal sukar, jumlah siswa = 20 orang.

Dalam mencari indeks kesukaran menggunakan rumus yang telah ditulis


di atas: P = B/N = 18/20

P = 0,90

Dari contoh di atas diperoleh hasil, yaitu : soal nomor 1, 3, 4, 5, 8 dan 9,


terdapat kesesuaian antara judgement dengan hasil analisa, soal nomor 2
yang di judgement mudah ternyata termasuk soal sedang, soal nomor 6
yang di judgement sedang ternyata termasuk soal mudah, soal nomor 7
yang dijudgement sedang, ternyata termasuk sukar dan soal nomor 10
yang dijudgement sukar, ternyata termasuk soal sedang.
Atas dasar hasil di atas, soal yang harus diperbaiki adalah:
Soal nomor 2, diturunkan ke dalam kategori mudah,
Soal nomor 6, dinaikkan ke dalam kategori sedang,
Soal nomor 7 diturunkan ke dalam kategori sedang,
Soal nomor 10, dinaikkan ke dalam kategori sukar.
2. Daya Pembeda
Daya pembeda soal adalah kemampuan suatu butir soal dapat
membedakan antara siswa yang menguasai materi yang ditanyakan dan
siswa yang belum menguasai materi yang diujikan. Daya pembeda butir
soal memiliki manfaat berikut. Pertama untuk meningkatkan mutu setiap
butir soal melalui data empiriknya. Berdasarkan indeks daya pembeda,
setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi atau
ditolak. Kedua, untuk mengetahui seberapa jauh masing-masing soal dapat
mendeteksi atau membedakan kemampuan siswa, yaitu siswa yang telah
memahami atau belum memahami materi yang diajarkan guru. Apabila
suatu soal tidak dapat membedakan kedua kemampuan siswa itu maka
butir soal itu dapat dicurigai kemungkinannya: a) Kunci jawaban butir soal
itu tidak tepat. b) Butir soal itu memiliki 2 atau lebih kunci jawaban yang
benar. c) Kompetensi yang diukur tidak jelas. d)Pengecoh tidak berfungsi.
e)Materi yang ditanyakan terlalu sulit, sehingga banyak siswa yang
menebak dan f) Sebagian besar siswa yang memahami materi yang
ditanyakan berpikir ada yang salah informasi dalam butir soalnya.
Untuk menentukan daya pembeda dibedakan menjadi kelompok
kecil (kurang dari 100 orang) dan kelompok besar (100 orang ke atas).
a) Untuk kelompok kecil
seluruh kelompok testee dibagi dua sama besar, 50% kelompok atas dan
50% kelompok bawah.
Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah,
lalu dibagi 2.
b) Untuk kelompok besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok
besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas
sebagai kelompok atas (JA) dan 27% skor terbawah sebagai kelompok
bawah (JB).

JA = jumlah kelompok atas

JB = jumlah kelompok bawah


Rumus untuk menentukan daya pembeda (indeks diskriminasi) adalah:

Di mana,
J = jumlah peserta tes
JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab soal itu dengan
benar
BB = banyaknya peserta kelompok bawah yang menjawab soal itu
dengan benar
PA = proporsi peserta kelompok atas yang menjawab benar (ingat, P
sebagai indeks kesukaran)
PB = proporsi peserta kelompok bawah yang menjawab benar
Hasil perhitungan dengan menggunakan rumus di atas dapat
menggambarkan tingkat kemampuan soal dalam membedakan antar
peserta tes yang sudah memahami materi yang diujikan dengan peserta
tes yang belum atau tidak memahami materi yang diujikan. Adapun
klasifikasinya adalah seperti berikut:
D : 0,00 0,20 >> jelek

D : 0,20 0,40 >> cukup

D : 0,40 0,70 >> baik

D : 0,70 1,00 >> baik sekali

D : negatif, semuanya tidak baik. Jadi semua butir soal yang mempunyai
nilai D negatif sebaiknya dibuang saja.

Contoh Perhitungan
Dari hasil analisis tes yang terdiri dari 10 butir soal yang dikerjakan oleh
20 orang siswa, terdapat dalam tabel sebagai berikut:
Berdasarkan nama-nama siswa dapat kita peroleh skor-skor sebagai
berikut:

Dari angka-angka yang belum teratur kemudian dibuat array (urutan


penyebaran), dari skor yang paling tinggi ke skor yang paling rendah.

Array ini sekaligus menunjukkan adanya kelompok atas (JA) dan


kelompok bawah (JB) dengan pemiliknya sebagai berikut:
Perhatikan pada tabel analisis 10 butir soal 20 siswa.
Dibelakang nama siswa dituliskan huruf A atau B sebagai tanda kelompok.
Hal ini mempermudah menentukan BA dan BB.
BA = banyaknya siswa yang menjawab benar pada kelompok atas (A)
BB = banyaknya siswa yang menjawab benar pada kelompok bawah (B)
Sudah disebutkan di atas bahwa soal yang baik adalah soal yang dapat
membedakan antara anak pandai dengan anak bodoh, dilihat dari dapat dan
tidaknya mengerjakan soal itu. Marilah kita perhatikan tabel analisis lagi,
khusus untuk butir soal nomor 1.
Dari kelompok atas yang menjawab betul 8 orang
Dan kelompok bawah yang menjawab betul 3 orang
Kita terapkan dalam rumus indeks diskriminasi:

Dengan demikian, maka indeks diskriminasi untuk soal nomor 1 adalah


0,5 (Daya pembeda baik, soal diterima).

Sekarang kita perhatikan butir soal nomor 8:

Butir soal ini jelek karena lebih banyak dijawab benar oleh kelompok
bawah dibandingkan dengan jawaban benar dari kelompok atas. Ini berarti
bahwa untuk menjawab soal dengan benar, dapat dilakukan dengan
menebak.
3. Fungsi pengecoh (distracter function)
Pada saat membicarakan tes objektif bentuk multiple choice item
tersebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar
telah dilengkapi dengan beberapa kemungkinan jawab, atau yang sering
dikenal dengan istilah option atau alternatif. Option atau alternatif itu
jumlahnya berkisar antara 3 sampai dengan 5 buah, dan dari
kemungkinan-kemungkinan jawaban yang terpasang pada setiap butir item
itu, salah satu diantaranya adalah merupakan jawaban betul (kunci
jawaban), sedangkan sisanya adalah merupakan jawaban salah. Jawaban-
jawaban salah itulah yang biasa dikenal dengan istilah distractor
(pengecoh).
Fungsi pengecoh dimaksudkan untuk mengetahui seberapa besar
peserta yang tidak memiliki kunci jawaban (option) pada bentuk soal
pilihan ganda. Untuk soal pilihan ganda, alternatif jawaban menurut
kaidah harus homogen dan logis sehingga setiap pilihan jawaban (opition)
dapat berfungsi atau ada yang memilih. Setiap pengecoh dapat dikatakan
berfungsi apabila ada yang memilih. Setiap pengecoh dapat dikatakan
berfungsi apabila terpilih minimal sebanyak 5% dari jumlah peserta.untuk
menghitungnya dapat digunakan rumus sebagai berikut:

Menganalisis fungsi distraktor sering dikenal dengan istilah lain,


yaitu : menganalisis pola penyebaran jawaban item. Adapun yang
dimaksud dengan pola penyebaran jawaban item adalah suatu pola yang
dapat menggambarkan bagaimana testee menentukan pilihan jawabnya
terhadap kemungkinan-kemungkinan jawab yang telah dipasangkan pada
setiap butir item. Suatu kemungkinan dapat terjadi, yaitu bahwa dari
keseluruhan alternatif yang dipasang pada butir item tertentu, sama sekali
tidak dipilih oleh testee. Dengan kata lain, testee menyatakan blangko.
Pernyataan blangko ini sering dikenal dengan istilah omit dan biasa diberi
lambang dengan huruf O. Sebagai tindak lanjut atas hasil penganalisaan
terhadap fungsi distraktor tersebut maka distraktor yang sudah dapat
menjalankan fungsinya dengan baik dapat dipakai lagi pada tes-tes yang
akan datang, sedangkan distraktor yang belum dapat berfungsi dengan
baik sebaiknya diperbaiki atau diganti dengan distraktor yang lain (Anas,
2011:408).
Contoh perhitungan:
Dari analisis sebuah item, polanya diketahui sebagai berikut:
Dari pola jawaban soal ini dapat dicari:
1) P = 21/60 = 0,35
2) D = PA PB = 15/30 - 6/30 = 9/30 = 0,30
3) Distraktor : semua distraktornya sudah berfungsi dengan baik karena
sudah dipilih oleh lebih dari 5% pengikut tes.
4) Dilihat dari segi omit (kolom paling kanan) adalah baik. Sebuah item
dikatakan baik jika omitnya tidak lebih dari 10% pengikut tes.
(5% dari pengikut tes = 5% x 60 orang = 3 orang)
(10% dari pengikut tes = 10% x 60 orang = 6 orang)
Sebenarnya ketentuan ini hanya berlaku untuk tes pilihan ganda dengan 5
alternatif dan P = 0,80. Tetapi demi praktisnya diberlakukan semua.
DAFTAR PUSTAKA

Rahardjo, B. 2008. Evaluasi Daya Dukung Pangkalan Pendaratan Ikan Klidang


Lor Kabupaten Batang Untuk Pengembangan Perikanan Tangkap. Tesis
Program Studi Magister Manajemen Sumberdaya Pantai Universitas
Diponegoro, Semarang.

Sari, R.R. 2012. Hubungan Seksual selama Kehamilan pada Ibu yang
Memeriksakan Kehamilan di Puskesmas Sibande Pakpak Barat. Skripsi
Jurusan Keperawatan Universitas Sumatera Utara, Medan.

Sinaga, M. 2012. Gambaran Penggunaan Bahan pada Perawatan Luka di RSUD


dr. Djasamen Saragih Pematang Siantar. Skripsi Jurusan Keperawatan
Universitas Sumatera Utara, Medan.

Widodo, P.B. 2006. Reliabilitas dan Validitas Konstruk Skala Konsep Diri untuk
Mahasiswa Indonesia. Jurnal Psikologi Universitas Diponegoro Vol.3
No.1, Juni 2006, pp.1-9.

Anda mungkin juga menyukai