PENDAHULUAN
A. LATAR BELAKANG
Tes merupakan salah satu alat yang dapat digunakan untuk menaksir besarnya
kemampuan seseorang secara tidak langsung, yaitu melalui respon seseorang
terhadap pertanyaan yang diberikan. Hasil tes yang diperoleh akan menjadi cerminan
baik tidaknya tes yang digunakan. Oleh sebab itu, gambaran mengenai baik-
buruknya suatu perangkat tes dapat dilihat dari sejauh mana kualitas soal yang
digunakan. Tes dengan kualitas yang baik memiliki butir-butir soal yang baik pula.
Untuk mengetahui kualitas suatu tes dapat dilakukan dengan melakukan tindak lanjut
dan memperbaiki hasil yang telah diperoleh dari suatu tes. Dalam hal ini dapat
dilakukan analisis butir soal yang telah digunakan agar diperoleh perangkat
pertanyaan yang memiliki kualitas memadai. Dengan menganalisis butir soal dapat
diperoleh informasi kekurangan dari sebuah soal.
Item soal yang baik adalah item yang tingkat kesukarannya dapat diketahui
tidak terlalu sukar dan tidak terlalu mudah. Sebab tingkat kesukaran item itu
memiliki korelasi dengan daya pembeda. Bilamana item memiliki tingkat kesukaran
maksimal, maka daya pembedanya akan rendah, demikian pula bila item itu terlalu
mudah juga tidak akan memiliki daya pembeda.
Oleh karena itu sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas
yang mampu memberikan daya pembeda. Namun demikian bilamana terdapat tujuan
khusus penyusunan tes dapat pula pertimbangan tersebut dikesampingkan, seperti
tingkat kesukaran item untuk tes sumatif berbeda dengan tingkat kesukaran pada tes
diagnostic
1
B. RUMUSAN MASALAH
1. Bagaimana cara menentukan daya pembeda soal ?
2. Bagaimana cara menetukan tingkat kesukaran soal ?
3. Bagaimana menyelesaikan reliabilitas soal ?
C. TUJUAN
1. Untuk memahami cara menentukan daya pembeda soal
2. Untuk memahami cara menentukan tingkat kesukaran soal
3. Utnuk memahami cara penyelesaian reliabilitas soal
2
BAB II
PEMBAHASAN
A. DAYA PEMBEDA
Arikunto,(2013) menyatakan daya pembeda soal adalah kemampuan sesuatu
soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan
siswa yang bodoh (berkemampuan rendah). Selain itu, Sudaryono (2012) menyatakan
daya beda butir adalah kemampuan suatu butir soal yang dapat membedakan antara
siswa yang telah menguasai materi yang ditanyakan dan siswa yang belum menguasai
materi yang ditanyakan.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi
disingkat D (d besar). Indeks deskriminasi berkisar antara 0,00 sampai 1,00. Pada
indeks ini terdapat kemungkinan adanya tanda negatif manakala suatu tes terbalik
menunjukkan kualitas tes yaitu anak pandai disebut bodoh dan anak bodoh disebut
pandai. Dengan demikian ada tiga titik pada daya pembeda, yaitu (Arikunto, 2013) :
Bagi suatu soal yang dapt dijawab benar oleh siswa pandai maupun bodoh,
maka soal itu tidak baik karena tidak mempunyai daya pembeda. Demikian pula jika
semua siswa baik pandai maupun bodoh tidak dapat menjawab dengan benar. Soal
tersebut tidak baik juga karena tidak mempunyai daya pembeda. Soal yang baik
adalah soal yang dapat dijawab benar oleh siswa-siswa yang pandai saja.
Seluruh pengikut tes dikelompokkan menjadi 2 (dua) kelompok, yaitu
kelompok pandai atau kelompok atas (upper group) dan kelompok bodoh atau
kelompok bawah (lower group).
Jika seluruh kelompok atas dapat menjawab soal tersebut dnegan benar, sedang
seluruh kelompok bawah menjawab salah, maka soal tersebut mempunyai D paling
besar yaitu 1,00. Sebaliknya, jika semua kelompok atas menjawab salah, tetapi semua
kelompok bawah menjawab betul, maka nilai D nya, yaitu -1,00. Tetapi jika siswa
3
kelompok atas dan siswa kelompok bawah sama-sama menjawab benar atau sama-
sama menjawab salah, maka soal tersebut mempunyai nilai D 0,00. Karena tidak
mempunyai daya pembeda sama sekali (Arikunto, 2013).
a. Cara Menentukan Daya pembeda (nilai D)
Arikunto (2013) menyatakan untuk ini perlu dibedakan antara kelompok kecil
(kurang dari 100) dan kelompok besar (100 orang ke atas)
1. Untuk kelompok kecil
Seluruh kelompok tes terbagi dua sama besar, separuh kelompok atas
(upper group) dan separuh kelompok bawah (lower group) sebagai
berikut:
Siswa Skor
A 9
B 8
C 7 kelompok atas (JA)
D 7
E 6
F 5
G 5
H 4 kelompok bawah (JB)
I 4
J 3
Contoh :
9
9
8
4
8
8 27 % sebagai JA
.
.
.
-
.
.
.
-
.
.
.
2 27 % sebagai JB
1
1
1
0
Rumus mencari D
Rumus untuk menetukan indeks diskriminasi adalah :
D = (BA / JA – (BB/JB) = PA – PB
Arikunto, 2013
Keterangan :
J = jumlah peserta tes
JA = banyak peserta kelompok atas
JB = banyak peserta kelompok bawah
BA = banyak peserta kelompok atas yang menjawab soal itu dengan benar
BB = banyak peserta kelompok bawah yang menjawab soal itu dengan benar
PA = proporsi peserta kelompok atas yang menjawab benar ( ingat P, sebagai
tingakat kesukaran)
PB = proporsi peserta kelompok bawah yang menjawab benar
5
Daya pembeda soal ditentukan dengan mencari indeks pembeda soal. Untuk
menghitung daya pembeda soal essai, dapat dilakukan dengan cara sebagai berikut:
1) Data diurutkan dari nilai tertinggi sampai terendah.
2) Kemudian diambil 27% dari kelompok yang mendapat nilai
tinggi dan 27% dari kelompok yang mendapat nilai rendah
3) Cari indeks pembeda soal dengan rumus :
Mt Mr
Ip
X t
2
X r2
n(n 1)
Keterangan :
Ip = Indeks Pembeda Soal
Mt = Rata-rata skor kelompok tinggi
Mr = Rata-rata skor kelompok rendah
∑ Xt2 = Jumlah kuadrat deviasi skor kelompok tinggi
∑ Xr2 = Jumlah kuadrat deviasi skor kelompok rendah
n = 25 % x N
N = banyak peserta tes
6
Berdasarkan nama-nama siswa dapat diperoleh skor-skor sebagai berikut:
A = 4, B = 7, C = 8, D = 6, E = 10, F = 6, G = 6, H = 6, I = 8, J = 7, K =
7, L = 5, M = 3, N =7, O = 8, P = 4, Q = 8, R = 8, S = 6, T = 6
Dari angka-angka yang belum teratur lalu disusun menjadi array (urutan
penyebaran), dari skor yang paling tinggi ke skor yang paling rendah.
Array ini sekaligus menunjukkan adanya kelompok atas (JA) dan kelompok
bawah (JB) dengan pemiliknya sebagai berikut:
7
1. Dari kelompok atas yang menjawab benar 8 orang
2. Dari kelompok bawah yang menjawab benar 4 orang
Kita terapkan dalam rumus indeks diskriminasi :
JA = 10 JB = 10
PA = 0,8 PA = 0,4
BA = 8 BB = 4
Maka, D = PA – PB
= 0,8 – 0,4
= 0,4
Dengan demikian maka indeks diskriminasi untuk soal 1 adalah 0,4
Arikunto, 2013 menyatakan butir-butir soal yang baik adalah butir-butir soal
yang mempunyao indeks diskriminasi 0,4 sampai dengan 0,7.
B. TINGKAT KESUKARAN
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar.
Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha
memcahkannya. Sebaiknya soal yang terlalu sukar akan menyebabkan siswa menjadi
putus asa dan tidak mempunyai semangat untuk mencoba lagi karena diluar
8
jangkauunya. Sudaryono, 2012 menyatakan taraf sukaran adalah peluang untuk
menjawab benar suatu soal pada tingkat kempuan tertentu yang biasanya dinyatakan
dalam bentuk indeks.
Angka sebagai ukuran tingkat kesukaran item soal disebut indeks kesukaran
atau difficulty index, yang berada pada angka 0,00 s/d 1,00. Indeks kesukaran yang
populer disebut P (proporsi) 0,00 menunjukkan soal itu terlalu sukar ,sedangkan 1,0
menunjukkan soal terlalu mudah. Dengan demikian soal dengan P 0,50 lebih mudah
dari soal dengan P 0,25 ,begitu pula sebaliknya soal dengan P 0,10 lebih sukar
daripada soal dengan P 0,30. Adapun skemanya (Arikunto, 2013) :
0,0 1,00
Sukar mudah
Melihat besarnya bilangan indeks ini, maka lebih cocok jika bukan disebut
indeks kesukaran tetapi indeks kemudahan atau indeks fasilitas, karena semakin
mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati
bahwa walaupun semakin tinggi indeksnya menunjukkan soal yang semakin mudah,
tetapi tetap disebut indeks kesukaran.
Rumus mencari P :
P = B/JS
Arikunto, 2013
Keterangan :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes
9
Dt Dr
Ik = x100%
2mn
Ket :
I k : Indeks kesukaran soal
Dt : Jumlah skor dari kelompok tinggi
D r : Jumlah skor dari kelompok rendah
m : Skor setiap soal benar
N : Banyak peserta tes
n : 27% x N
Dengan kriteria :
I k < 27% Soal sukar
27 % I k 73% Soal sedang
I k > 73 % Soal mudah
Ada 20 orang dengan nama kode A – T yang mengejarkan tes yang terdiri dari 20
soal. Jawaban tesnya dianalisi dengan jawaban tertera seperti dibawah ini.
10
Dari tabel yang disajikan di atas, dapat ditafsirkan bahwa:
1. Soal nomor 1 memiliki terap kesukaran 10 : 20 = 0,50
2. Soal nomor 9 yang tersukar karena hanya dapat dijawab dengan betul oleh 3
orang saja, jadi 3 : 20 = 0,15
3. Soal nomor 13 yang paling mudah karena dijawab dengan benar oleh seluruh
murid .Indeks kesukarannya = 20 : 20 = 1,0
Walaupun demikian ada yang berpendapat bahwa soal-soal yang dianggap baik,
yaitu soal-soal sedang, adalah soal-soal yang mempunyai indeks kesukaran 0,30
sampai dengan 0,70. Perlu diketahui bahwa soal-soal yang terlalu mudah atau terlalu
sukar, lalu tidak berarti tidak boleh digunakan. Hal ini tergantung dan penggunaanya.
Jika drai pengikut yang banyak, kita menghendaki yang lulusnya hanya sedikit, kita
ambil siswa yang paling top. Untuk ini maka lebih baik diambilkan butir-utir tes yang
sukar.
Sebaliknya jika kekurangan pengikut ujian, kita pilihkan soal-soal yang mudah.
Selain itu, soal yang sukar akan menambah gairah belajar bagi siswa yang pandai,
11
sedangkan soal-soal terlalu mudah akan membangkitkan semangat kepada siswa yang
lemah.
Untuk melihat hubungan antara taraf kesulitan dan taraf daya pem-beda antara P
dan D perlu senantiasa diingat rumus mencari P dan juga D. Dari indeks kesukaran
(P) dan indeks di diskriminasi atau daya pem-beda (D) diperoleh hubungan sebagai
berikut:
Sebagai contoh
Soal dengan P = 0,20
Akan memberikan D max – 0,10
Soal dengan P = 0,80
Akan memberikan D =
Max = yang sama
Dari grafik terlihat bahwa soal-soal dengan nilai P = 0,50 memung-kinkan untuk
mendapat daya pembeda yang paling tinggi.
Contoh penggunaan Indeks Daya Beda Soal dan Indeks Kesukaran Soal Pada
Soal Essay
NASKAH SOAL TES UJI COBA AKHIR
1. Tuliskan 4 Fungsi darah…!
2. Sebutkan organ-organ penyusun darah pada manusia..!
3. Tuliskan perbedaan antara pembuluh nadi dengan pembuluh balik…!
4. Jelaskan 2 macam sistem peredaran darah pada manusia…!
5. Jelaskan proses pembekuan darah…!
6. Sebutkan kelainan/ gangguan pada sistem peredaran darah…!
1) Indeks Kesukaran Daya Beda
a) Analisis Item Uji Coba Kelompok Atas dan Kelompok Bawah
12
Analisis Item Uji Coba Kelompok Atas
Skor
No. Nomor Item
Siswa
Siswa
1 2 3 4 5 6 100
1 8 20 15 20 15 20 98
2 10 20 10 20 15 20 95
10
3 10 20 15 20 20 95
15
4 10 20 15 15 20 95
10
5 8 20 15 20 20 93
10
6 8 20 15 20 20 93
10
7 10 20 15 20 15 90
15
8 10 20 15 15 15 90
9 10 20 10 10 15 20 85
Untuk soal no 1
Skor Skor
X - Mt X – Mr
No Kelompok (Xt)2 kelompok (Xr)2
(Xt) (Xr)
Tertinggi rendah
1 10 0,6667 0,4444 8 2,1111 4,4567
2 10 0,6667 0,4444 8 2,1111 4,4567
3 10 0,6667 0,4444 8 2,1111 4,4567
4 10 0,6667 0,4444 8 2,1111 4,4567
5 10 0,6667 0,4444 8 2,1111 4,4567
6 10 0,6667 0,4444 6 0,1111 0,0123
7 8 -1,3333 1,7777 5 -0,8889 0,7901
8 8 -1,3333 1,7777 1 -4,8889 23,9013
9 8 -1,3333 1,7777 1 -4.8889 23,9013
x 84 0,3333 7,9995 53 -0,0001 70,8885
x Mr = r =
84 x 53
Mt = t
= 9,3333 5,8889
n 9 n 9
Mt Mr 9,3333 5,8889
X Xr
2 2
I p = t = 7,9995 70,8885 =
9(9 1)
n(n 1)
3,4444 3,4444 3,4444
3,2907
78,888 1,0957 1,0467
72
14
Soal nomor 3 Ip = 7,2864 berarti soalnya signifikan
Dr = x r = 53 n=9
Dt D r 84 53
Ik 100% = 100%
2mn 2 x (10) x(9)
137
= x100%
180
Soal nomor 2
N 32
n 27% N
n 27% 32 8,64 9
15
Dari data sebelumnya diperoleh:
Dt = x t = 180 m = 20
Dr = x r = 48 n=9
Dt D r 180 20
Ik 100% = 100%
2mn 2 x( 20) x(9)
200
= x100%
360
Soal nomor 3
N 32
n 27% N
n 27% 32 8,64 9
Dr = x r = 25 n=9
Dt D r 125 25
Ik 100% = 100%
2mn 2 x (15) x(9)
150
= x100%
270
Soal nomor 4
N 32
n 27% N
n 27% 32 8,64 9
16
Sehingga di ambil dari kelompok tinggi: 20,20,20,20,20,20,15,1510
Sehingga di ambil dari kelompok rendah : 20,20,10,10,1,1,1,1,0
Dari data sebelumnya diperoleh:
Dt = x t = 160 m = 20
Dr = x r = 64 n=9
Dt D r 160 64
Ik 100% = 100%
2mn 2 x( 20) x(9)
224
= x100%
360
Soal nomor 5
N 32
n 27% N
n 27% 32 8,64 9
Dr = x r = 20 n=9
Dt D r 120 20
Ik 100% = 100%
2mn 2 x (15) x(9)
140
= x100%
270
17
Soal nomor 6
N 32
n 27% N
n 27% 32 8,64 9
Dr = x r = 62 n=9
Dt D r 165 62
Ik 100% = 100%
2mn 2 x( 20) x(9)
227
= x100%
360
No
Ip Keterangan Ik Keterangan Klasifikasi
Soal
1 3,2907 Signifikan 76,1111% Mudah Dipakai
2 5,3333 Signifikan 55,5556% Sedang Dipakai
3 7,2864 Signifikan 55,5556% Sedang Dipakai
4 3,5379 Signifikan 62,2222% Sedang Dipakai
5 8,0978 Signifikan 51,8519% Sedang Dipakai
6 6,4053 Signifikan 60,0556% Sedang Dipakai
C. RELIABILITAS SOAL
Arikunto (2013) menyatakan untuk keperluan mencari reliabilitas soal
keseluruhan perlu juga dilakuakn analisis butir soal seperti halnya soal bentuk
18
objektif. Skor masing-masing butir soal dicantumkan pada kolom menurut apa
adanya.
Ada tiga cara mengetahui reliabilitas tes. Pada prinsipnya diperoleh
dengan menghitung koefisien korelasi antara dua kelompok skor tes. Tiga cara
itu sebagai berikut.
1. Test-retest method (metoda tes ulang).
Satu tes (yakni tes yang akan dihitung reliabilitasnya), diteskan
terhadap kelompok siswa tertentu dua kali dengan jangka waktu tertentu
(misalnya satu semester atau satu catur wulan). Skor hasil pengetesan
pertama dikorelasikan dengan skor hasil pengetesan kedua. Koefisien
korelasi yang diperoleh menunjukkan koefisien reliabilitas tes tersebut.
2. Paralel test method (metoda tes paralel)
Cara ini mengharuskan adanya dua tes yang paralel, yakni dua tes
yang disusun dengan tujuan yang sama (hanya sedikit berbedaan redaksi, isi
atau susunan kalimatnya). Dua tes tersebut diadministrasikan pada satu
kelompok siswa dengan perbedaan waktu beberapa hari saja. Skor dari kedua
macam tes tersebut dikorelasikan dengan teknik yang sama seperti pada
metode test- retest. Koefisien korelasi yang diperoleh menunjukkan tingkat
reliabilitas tes.
3. Split-half method (metode belah dua)
Cara ini paling mudah diterapkan oleh para guru pada semua tes
yang diberikan kepada siswanya. Tidak perlu mengulangi pelaksanaan tes
atau menyusun tes yang paralel. Cukup satu tes dan diadministrasikan satu
kali kepada sekelompok siswa (minimal 30 siswa).
Pada saat penyekoran, tes dibelah menjadi dua sehingga tiap siswa
memperoleh dua macam skor, yakni skor yang diperoleh dari soal-soal
bernomor ganjil dan skor dari soal-soal bernomor genap. Skor total
diperoleh dengan menjumlah skor ganjil dan genap. Selanjutnya sko ganjil
19
dikorelasikan dengan skor-genap, hasilnya adalah koefisien korelasi rgg, atau
koefisien korelasi ganjil-genap.
Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dillakuka
analisis butir soal. Skor untuk masing-masing soal dicantumkan pada kolom item
menurut apa adanya. Rumus yang digunakan adalah rumus Alpha sebagai berikut :
20
21
Kesimpulan :
Keputusan dengan membandingkan r11 dengan r tabel.
Kaidah keputusan: Jika r11 > r tabel berarti reliabel dan
Jika r11 < r tabel berarti tidak reliabel
Kesimpulan: karena r11 = 0,935 labih besar dari rtabel 0,666, maka semua data
yang dianalisis dengan metode alpha adalah Reliabel.
22
Contoh soal 2 :
Tentukan koefisien reliabilitas hasil uji coba instrument tes biologi yang terdiri dari 6
butir soal dengan jumlah sampel uji coba 10 siswa. Hasil tes dikotomi sebagai berikut
ini:
23
Hasil perhitungan menunjukkan bahwa nilai KR-20 sebesar 0,737. Hal ini
berarti bahwa nilai reliabilitas instrument di atas sebesar 0,737 lebih besar dari batas
minimal nilai reliabilitas yaitu 0,700 (0,737 > 0,700). Oleh karena itu maka dapat
disimpulkan bahwa instrument reliabel.
Contoh soal 3 :
Contoh perhitungan soal teknik belah dua
24
BAB III
PENUTUP
A. KESIMPULAN
Tes yang baik adalah tes yang mampu mengukur sesuatu sesuai tujuan dari tes
tersebut. Untuk mendapatkan instrumen tes yang baik, perlu dilakukan analisis
terhadap hasil suatu tes, yang mana hasil tersebut digunakan untuk menentukan
kualitas dari tes yang telah diberikan dan menentukan apakah tes tersebut dapat
digunakan pada tes berikutnya atau tidak. Diantara analisis butir soal yang dapat
dilakukan adalah analisis tingkat kesukaran soal dan analisis daya pembeda.
Analisis tingkat kesukaran dilakukan untuk melihat apakah butir soal tersebut
sukar, sedang atau mudah bagi peserta tes. Analisis daya pembeda dilakukan untuk
melihat kemampuan suatu butir soal dalam membedakan antara siswa yang telah
menguasai materi yang ditanyakan dan siswa yang tidak/kurang/belum menguasai
materi yang ditanyakan
B. SARAN
Makalah ini masih kurang lengkap, karena keterbatasan informasi yang penulis
dapatkan. Oleh karena itu, bagi penulis berikutnya yang ingin menulis tentang Daya
beda, Tingkat kesukaran, dan Reliabilitas Soal.
25
DAFTAR PUSTAKA
26