Bab I-3

BAB I
PENDAHULUAN
A. LATAR BELAKANG
Tes merupakan salah satu alat yang dapat digunakan untuk menaksir besarnya
kemampuan seseorang secara tidak langsung, yaitu melalui respon seseorang
terhadap pertanyaan yang diberikan. Hasil tes yang diperoleh akan menjadi cerminan
baik tidaknya tes yang digunakan. Oleh sebab itu, gambaran mengenai baik-
buruknya suatu perangkat tes dapat dilihat dari sejauh mana kualitas soal yang
digunakan. Tes dengan kualitas yang baik memiliki butir-butir soal yang baik pula.
Untuk mengetahui kualitas suatu tes dapat dilakukan dengan melakukan tindak lanjut
dan memperbaiki hasil yang telah diperoleh dari suatu tes. Dalam hal ini dapat
dilakukan analisis butir soal yang telah digunakan agar diperoleh perangkat
pertanyaan yang memiliki kualitas memadai. Dengan menganalisis butir soal dapat
diperoleh informasi kekurangan dari sebuah soal.
Item soal yang baik adalah item yang tingkat kesukarannya dapat diketahui
tidak terlalu sukar dan tidak terlalu mudah. Sebab tingkat kesukaran item itu
memiliki korelasi dengan daya pembeda. Bilamana item memiliki tingkat kesukaran
maksimal, maka daya pembedanya akan rendah, demikian pula bila item itu terlalu
mudah juga tidak akan memiliki daya pembeda.
Oleh karena itu sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas
yang mampu memberikan daya pembeda. Namun demikian bilamana terdapat tujuan
khusus penyusunan tes dapat pula pertimbangan tersebut dikesampingkan, seperti
tingkat kesukaran item untuk tes sumatif berbeda dengan tingkat kesukaran pada tes
diagnostic
1
B. RUMUSAN MASALAH
1. Bagaimana cara menentukan daya pembeda soal ?
2. Bagaimana cara menetukan tingkat kesukaran soal ?
3. Bagaimana menyelesaikan reliabilitas soal ?
C. TUJUAN
1. Untuk memahami cara menentukan daya pembeda soal
2. Untuk memahami cara menentukan tingkat kesukaran soal
3. Utnuk memahami cara penyelesaian reliabilitas soal
2
BAB II
PEMBAHASAN
A. DAYA PEMBEDA
Arikunto,(2013) menyatakan daya pembeda soal adalah kemampuan sesuatu
soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan
siswa yang bodoh (berkemampuan rendah). Selain itu, Sudaryono (2012) menyatakan
daya beda butir adalah kemampuan suatu butir soal yang dapat membedakan antara
siswa yang telah menguasai materi yang ditanyakan dan siswa yang belum menguasai
materi yang ditanyakan.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi
disingkat D (d besar). Indeks deskriminasi berkisar antara 0,00 sampai 1,00. Pada
indeks ini terdapat kemungkinan adanya tanda negatif manakala suatu tes terbalik
menunjukkan kualitas tes yaitu anak pandai disebut bodoh dan anak bodoh disebut
pandai. Dengan demikian ada tiga titik pada daya pembeda, yaitu (Arikunto, 2013) :
-1,00 0,00 1,00

daya pembeda daya pembeda daya pembeda
Negative rendah tinggi(positif)
Bagi suatu soal yang dapt dijawab benar oleh siswa pandai maupun bodoh,
maka soal itu tidak baik karena tidak mempunyai daya pembeda. Demikian pula jika
semua siswa baik pandai maupun bodoh tidak dapat menjawab dengan benar. Soal
tersebut tidak baik juga karena tidak mempunyai daya pembeda. Soal yang baik
adalah soal yang dapat dijawab benar oleh siswa-siswa yang pandai saja.
Seluruh pengikut tes dikelompokkan menjadi 2 (dua) kelompok, yaitu
kelompok pandai atau kelompok atas (upper group) dan kelompok bodoh atau
kelompok bawah (lower group).
Jika seluruh kelompok atas dapat menjawab soal tersebut dnegan benar, sedang
seluruh kelompok bawah menjawab salah, maka soal tersebut mempunyai D paling
besar yaitu 1,00. Sebaliknya, jika semua kelompok atas menjawab salah, tetapi semua
kelompok bawah menjawab betul, maka nilai D nya, yaitu -1,00. Tetapi jika siswa
3
kelompok atas dan siswa kelompok bawah sama-sama menjawab benar atau sama-
sama menjawab salah, maka soal tersebut mempunyai nilai D 0,00. Karena tidak
mempunyai daya pembeda sama sekali (Arikunto, 2013).
a. Cara Menentukan Daya pembeda (nilai D)
Arikunto (2013) menyatakan untuk ini perlu dibedakan antara kelompok kecil
(kurang dari 100) dan kelompok besar (100 orang ke atas)
1. Untuk kelompok kecil
Seluruh kelompok tes terbagi dua sama besar, separuh kelompok atas
(upper group) dan separuh kelompok bawah (lower group) sebagai
berikut:
Siswa Skor
A 9
B 8
C 7 kelompok atas (JA)
D 7
E 6
F 5
G 5
H 4 kelompok bawah (JB)
I 4
J 3
Seluruh pengikut tes, dideretkan mulai dari skor terats sampai

terbawah, lalu dibagi 2 (dua)
2. Untuk kelompok besar

Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok
besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas
sebagai kelompom atas (JA) dan 27% skor terbawah sebagai kelompok
bawah (JB).
JA = Jumlah kelompok atas
JB = Jumlah kelompok bawah
Contoh :
9
9
8
4
8
8 27 % sebagai JA
.
.
.
-
.
.
.
-
.
.
.
2 27 % sebagai JB
1
1
1
0
Rumus mencari D
Rumus untuk menetukan indeks diskriminasi adalah :
D = (BA / JA – (BB/JB) = PA – PB
Arikunto, 2013
Keterangan :
J = jumlah peserta tes
JA = banyak peserta kelompok atas
JB = banyak peserta kelompok bawah
BA = banyak peserta kelompok atas yang menjawab soal itu dengan benar
BB = banyak peserta kelompok bawah yang menjawab soal itu dengan benar
PA = proporsi peserta kelompok atas yang menjawab benar ( ingat P, sebagai
tingakat kesukaran)
PB = proporsi peserta kelompok bawah yang menjawab benar
5
Daya pembeda soal ditentukan dengan mencari indeks pembeda soal. Untuk
menghitung daya pembeda soal essai, dapat dilakukan dengan cara sebagai berikut:
1) Data diurutkan dari nilai tertinggi sampai terendah.
2) Kemudian diambil 27% dari kelompok yang mendapat nilai
tinggi dan 27% dari kelompok yang mendapat nilai rendah
3) Cari indeks pembeda soal dengan rumus :
Mt  Mr
Ip 
X t
2
  X r2
n(n  1)
Keterangan :
Ip = Indeks Pembeda Soal
Mt = Rata-rata skor kelompok tinggi
Mr = Rata-rata skor kelompok rendah
∑ Xt2 = Jumlah kuadrat deviasi skor kelompok tinggi
∑ Xr2 = Jumlah kuadrat deviasi skor kelompok rendah
n = 25 % x N
N = banyak peserta tes
Contoh perhitungan (Syamsudin, 2012):

Tabel Analisis 10 Butir Soal, 20 Siswa
6
Berdasarkan nama-nama siswa dapat diperoleh skor-skor sebagai berikut:
A = 4, B = 7, C = 8, D = 6, E = 10, F = 6, G = 6, H = 6, I = 8, J = 7, K =
7, L = 5, M = 3, N =7, O = 8, P = 4, Q = 8, R = 8, S = 6, T = 6
Dari angka-angka yang belum teratur lalu disusun menjadi array (urutan
penyebaran), dari skor yang paling tinggi ke skor yang paling rendah.
Array ini sekaligus menunjukkan adanya kelompok atas (JA) dan kelompok
bawah (JB) dengan pemiliknya sebagai berikut:
 Selanjutnya dilihat tabel analisa lagi khusus soal nomor satu.
7
1. Dari kelompok atas yang menjawab benar 8 orang
2. Dari kelompok bawah yang menjawab benar 4 orang
Kita terapkan dalam rumus indeks diskriminasi :
JA = 10 JB = 10
PA = 0,8 PA = 0,4
BA = 8 BB = 4
Maka, D = PA – PB
= 0,8 – 0,4
= 0,4
Dengan demikian maka indeks diskriminasi untuk soal 1 adalah 0,4
Arikunto, 2013 menyatakan butir-butir soal yang baik adalah butir-butir soal
yang mempunyao indeks diskriminasi 0,4 sampai dengan 0,7.
Klasifikasi daya pembeda :
D : 0,00 – 0,20 : jelek (poor)

D : 0,21 – 0,40 : cukup (satisticfactory)
D : 0,41 – 0,70 : baik (good)
D : 0,71 – 1,00 : baik sekali (excellent)
D : negative, semuanya tidak baik. Jadi semua butir soal yang mempunyai D
negative sebaiknya dibuang saja.
B. TINGKAT KESUKARAN
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar.
Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha
memcahkannya. Sebaiknya soal yang terlalu sukar akan menyebabkan siswa menjadi
putus asa dan tidak mempunyai semangat untuk mencoba lagi karena diluar
8
jangkauunya. Sudaryono, 2012 menyatakan taraf sukaran adalah peluang untuk
menjawab benar suatu soal pada tingkat kempuan tertentu yang biasanya dinyatakan
dalam bentuk indeks.
Angka sebagai ukuran tingkat kesukaran item soal disebut indeks kesukaran
atau difficulty index, yang berada pada angka 0,00 s/d 1,00. Indeks kesukaran yang
populer disebut P (proporsi) 0,00 menunjukkan soal itu terlalu sukar ,sedangkan 1,0
menunjukkan soal terlalu mudah. Dengan demikian soal dengan P 0,50 lebih mudah
dari soal dengan P 0,25 ,begitu pula sebaliknya soal dengan P 0,10 lebih sukar
daripada soal dengan P 0,30. Adapun skemanya (Arikunto, 2013) :
0,0 1,00
Sukar mudah
Melihat besarnya bilangan indeks ini, maka lebih cocok jika bukan disebut
indeks kesukaran tetapi indeks kemudahan atau indeks fasilitas, karena semakin
mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati
bahwa walaupun semakin tinggi indeksnya menunjukkan soal yang semakin mudah,
tetapi tetap disebut indeks kesukaran.
Rumus mencari P :
P = B/JS
Arikunto, 2013
Keterangan :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes
Untuk menentukan indeks kesukaran (I k ) soal essai dapat digunakan rumus

adalah sebagai berikut:
9
Dt  Dr
Ik = x100%
2mn
Ket :
I k : Indeks kesukaran soal
Dt : Jumlah skor dari kelompok tinggi
D r : Jumlah skor dari kelompok rendah
m : Skor setiap soal benar
N : Banyak peserta tes
n : 27% x N
Dengan kriteria :
I k < 27% Soal sukar
27 %  I k  73% Soal sedang
I k > 73 % Soal mudah
Contoh perhitungan (Syamsudin, 2012) :
Ada 20 orang dengan nama kode A – T yang mengejarkan tes yang terdiri dari 20
soal. Jawaban tesnya dianalisi dengan jawaban tertera seperti dibawah ini.
10
Dari tabel yang disajikan di atas, dapat ditafsirkan bahwa:
1. Soal nomor 1 memiliki terap kesukaran 10 : 20 = 0,50
2. Soal nomor 9 yang tersukar karena hanya dapat dijawab dengan betul oleh 3
orang saja, jadi 3 : 20 = 0,15
3. Soal nomor 13 yang paling mudah karena dijawab dengan benar oleh seluruh
murid .Indeks kesukarannya = 20 : 20 = 1,0
Menurut ketentuan yang berlaku indeks kesukaran diklasifikasi sebagai berikut

(Arikunto, 2013):
1. Soal dengan P 0,00 sampai 0,30 adalah soal sukar
2. Soal dengan P 0,30 sampai 0,70 adalah soal sedang
3. Soal dengan P 0,70 sampai 1,00 adalah soal mudah
Walaupun demikian ada yang berpendapat bahwa soal-soal yang dianggap baik,
yaitu soal-soal sedang, adalah soal-soal yang mempunyai indeks kesukaran 0,30
sampai dengan 0,70. Perlu diketahui bahwa soal-soal yang terlalu mudah atau terlalu
sukar, lalu tidak berarti tidak boleh digunakan. Hal ini tergantung dan penggunaanya.
Jika drai pengikut yang banyak, kita menghendaki yang lulusnya hanya sedikit, kita
ambil siswa yang paling top. Untuk ini maka lebih baik diambilkan butir-utir tes yang
sukar.
Sebaliknya jika kekurangan pengikut ujian, kita pilihkan soal-soal yang mudah.
Selain itu, soal yang sukar akan menambah gairah belajar bagi siswa yang pandai,
11
sedangkan soal-soal terlalu mudah akan membangkitkan semangat kepada siswa yang
lemah.
Untuk melihat hubungan antara taraf kesulitan dan taraf daya pem-beda antara P
dan D perlu senantiasa diingat rumus mencari P dan juga D. Dari indeks kesukaran
(P) dan indeks di diskriminasi atau daya pem-beda (D) diperoleh hubungan sebagai
berikut:
Sebagai contoh
Soal dengan P = 0,20
Akan memberikan D max – 0,10
Soal dengan P = 0,80
Akan memberikan D =
Max = yang sama
Dari grafik terlihat bahwa soal-soal dengan nilai P = 0,50 memung-kinkan untuk
mendapat daya pembeda yang paling tinggi.
Contoh penggunaan Indeks Daya Beda Soal dan Indeks Kesukaran Soal Pada
Soal Essay
NASKAH SOAL TES UJI COBA AKHIR
1. Tuliskan 4 Fungsi darah…!
2. Sebutkan organ-organ penyusun darah pada manusia..!
3. Tuliskan perbedaan antara pembuluh nadi dengan pembuluh balik…!
4. Jelaskan 2 macam sistem peredaran darah pada manusia…!
5. Jelaskan proses pembekuan darah…!
6. Sebutkan kelainan/ gangguan pada sistem peredaran darah…!
1) Indeks Kesukaran Daya Beda
a) Analisis Item Uji Coba Kelompok Atas dan Kelompok Bawah
12
Analisis Item Uji Coba Kelompok Atas
Skor
No. Nomor Item
Siswa
Siswa
1 2 3 4 5 6 100
1 8 20 15 20 15 20 98
2 10 20 10 20 15 20 95
10
3 10 20 15 20 20 95
15
4 10 20 15 15 20 95
10
5 8 20 15 20 20 93
10
6 8 20 15 20 20 93
10
7 10 20 15 20 15 90
15
8 10 20 15 15 15 90
9 10 20 10 10 15 20 85
ΣX 84 180 125 160 120 165
x 9,3333 20 13,8889 17,7778 13,3333 18,3333
Analisis Item Tes Uji Coba Kelompok Bawah

Skor
No. Nomor Item
Siswa
Siswa
1 2 3 4 5 6 100
0
1 5 10 5 20 10 50
5 10
2 8 10 5 10 48
0
3 8 5 13 10 6 42
1 10
4 8 2 1 20 42
0 10
5 8 5 1 1 25
1 10
6 6 6 1 1 25
1 10
7 8 5 1 0 25
1 5
8 1 1 1 1 10
1 1
9 1 5 1 1 10 13
ΣX 53 49 29 64 20 62
x 5,8889 5,4444 3,2222 7,1111 2,2222 6,8889

b) PERHITUNGAN INDEKS PEMBEDA SOAL UJI COBA TES AKHIR
n = 27 % x N df = (nt – 1) + (nr -1)
= 27 % x 32 = (9 – 1) + (9- 1)
= 8,64  9 = 16
Untuk soal no 1
Skor Skor
X - Mt X – Mr
No Kelompok (Xt)2 kelompok (Xr)2
(Xt) (Xr)
Tertinggi rendah
1 10 0,6667 0,4444 8 2,1111 4,4567
2 10 0,6667 0,4444 8 2,1111 4,4567
3 10 0,6667 0,4444 8 2,1111 4,4567
4 10 0,6667 0,4444 8 2,1111 4,4567
5 10 0,6667 0,4444 8 2,1111 4,4567
6 10 0,6667 0,4444 6 0,1111 0,0123
7 8 -1,3333 1,7777 5 -0,8889 0,7901
8 8 -1,3333 1,7777 1 -4,8889 23,9013
9 8 -1,3333 1,7777 1 -4.8889 23,9013
 x 84 0,3333 7,9995 53 -0,0001 70,8885
x Mr =  r =
84 x 53
Mt = t
=  9,3333  5,8889
n 9 n 9
Mt  Mr 9,3333  5,8889
X   Xr
2 2
I p = t = 7,9995  70,8885 =
9(9  1)
n(n  1)
3,4444 3,4444 3,4444
   3,2907
78,888 1,0957 1,0467
72
Pada df = 16 di peroleh Ip tabel = 2,12 dan Ip hitung = 3,2907 jika Ip hitung  Ip

tabel sehingga 3,2907 > 2,12, maka soal signifikan jadi soal nomor 1 signifikan.
Untuk soal nomor 2 sampai dengan 5 dengan langkah yang sama diperoleh I p sebagai
berikut:
Soal nomor 2 Ip = 14,4343 berarti soalnya signifikan
14
2) Perhitungan Indeks Kesukaran Soal

Soal nomor 1
N  32
n  27%  N
n  27%  32  8,64  9
Sehingga di ambil dari kelompok tinggi : 10,10,10,10,10,10,8,8,8

Sehingga di ambil dari kelompok rendah : 8,8,8,8,8,6,5,1,1
Dari data sebelumnya diperoleh:
Dt = x t = 84 m = 10
Dr =  x r = 53 n=9
Dt  D r 84  53
Ik   100% =  100%
2mn 2 x (10) x(9)
137
= x100%
180
= 76,1111% Berarti soalnya mudah
Soal nomor 2
N  32
n  27%  N
n  27%  32  8,64  9

Sehingga di ambil dari kelompok rendah : 10,10,6,5,5,5,2,1
15
Dt = x t = 180 m = 20
Dr =  x r = 48 n=9
Dt  D r 180  20
Ik   100% =  100%
2mn 2 x( 20) x(9)
200
= x100%
360
= 55,5556% Berarti soalnya sedang
Soal nomor 3
N  32
n  27%  N
n  27%  32  8,64  9

Dt = x t = 125 m = 15
Dr =  x r = 25 n=9
Dt  D r 125  25
Ik   100% =  100%
2mn 2 x (15) x(9)
150
= x100%
270
Soal nomor 4
N  32
n  27%  N
n  27%  32  8,64  9
16
Sehingga di ambil dari kelompok tinggi: 20,20,20,20,20,20,15,1510
Dt = x t = 160 m = 20
Dr =  x r = 64 n=9
Dt  D r 160  64
Ik   100% =  100%
2mn 2 x( 20) x(9)
224
= x100%
360
Soal nomor 5
N  32
n  27%  N
n  27%  32  8,64  9
Sehingga di ambil dari kelompok tinggi: 15,15,15,15,15,15,10,10,10

Sehingga di ambil dari kelompok rendah : 10, 5,1,1,1,1,1,0,0
Dt = x t = 120 m = 15
Dr =  x r = 20 n=9
Dt  D r 120  20
Ik   100% =  100%
2mn 2 x (15) x(9)
140
= x100%
270
17
Soal nomor 6
N  32
n  27%  N
n  27%  32  8,64  9

Dt = x t = 165 m = 20
Dr =  x r = 62 n=9
Dt  D r 165  62
Ik   100% =  100%
2mn 2 x( 20) x(9)
227
= x100%
360
3) Hasil Analisis Soal Uji Coba Tes Akhir
No
Ip Keterangan Ik Keterangan Klasifikasi
Soal
1 3,2907 Signifikan 76,1111% Mudah Dipakai
2 5,3333 Signifikan 55,5556% Sedang Dipakai
C. RELIABILITAS SOAL
Arikunto (2013) menyatakan untuk keperluan mencari reliabilitas soal
keseluruhan perlu juga dilakuakn analisis butir soal seperti halnya soal bentuk
18
objektif. Skor masing-masing butir soal dicantumkan pada kolom menurut apa
adanya.
Ada tiga cara mengetahui reliabilitas tes. Pada prinsipnya diperoleh
dengan menghitung koefisien korelasi antara dua kelompok skor tes. Tiga cara
itu sebagai berikut.
1. Test-retest method (metoda tes ulang).
Satu tes (yakni tes yang akan dihitung reliabilitasnya), diteskan
terhadap kelompok siswa tertentu dua kali dengan jangka waktu tertentu
(misalnya satu semester atau satu catur wulan). Skor hasil pengetesan
pertama dikorelasikan dengan skor hasil pengetesan kedua. Koefisien
korelasi yang diperoleh menunjukkan koefisien reliabilitas tes tersebut.
2. Paralel test method (metoda tes paralel)
Cara ini mengharuskan adanya dua tes yang paralel, yakni dua tes
yang disusun dengan tujuan yang sama (hanya sedikit berbedaan redaksi, isi
atau susunan kalimatnya). Dua tes tersebut diadministrasikan pada satu
kelompok siswa dengan perbedaan waktu beberapa hari saja. Skor dari kedua
macam tes tersebut dikorelasikan dengan teknik yang sama seperti pada
metode test- retest. Koefisien korelasi yang diperoleh menunjukkan tingkat
reliabilitas tes.
3. Split-half method (metode belah dua)
Cara ini paling mudah diterapkan oleh para guru pada semua tes
yang diberikan kepada siswanya. Tidak perlu mengulangi pelaksanaan tes
atau menyusun tes yang paralel. Cukup satu tes dan diadministrasikan satu
kali kepada sekelompok siswa (minimal 30 siswa).
Pada saat penyekoran, tes dibelah menjadi dua sehingga tiap siswa
memperoleh dua macam skor, yakni skor yang diperoleh dari soal-soal
bernomor ganjil dan skor dari soal-soal bernomor genap. Skor total
diperoleh dengan menjumlah skor ganjil dan genap. Selanjutnya sko ganjil
19
dikorelasikan dengan skor-genap, hasilnya adalah koefisien korelasi rgg, atau
koefisien korelasi ganjil-genap.
Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dillakuka
analisis butir soal. Skor untuk masing-masing soal dicantumkan pada kolom item
menurut apa adanya. Rumus yang digunakan adalah rumus Alpha sebagai berikut :
Contoh perhitungan mencari reliabilitas :

Contoh soal 1 :
20
21
Kesimpulan :
Keputusan dengan membandingkan r11 dengan r tabel.
Kaidah keputusan: Jika r11 > r tabel berarti reliabel dan
Jika r11 < r tabel berarti tidak reliabel
Kesimpulan: karena r11 = 0,935 labih besar dari rtabel 0,666, maka semua data
yang dianalisis dengan metode alpha adalah Reliabel.
22
Contoh soal 2 :
Tentukan koefisien reliabilitas hasil uji coba instrument tes biologi yang terdiri dari 6
butir soal dengan jumlah sampel uji coba 10 siswa. Hasil tes dikotomi sebagai berikut
ini:
Langkah pertama menghitung uji reliabilitas dengan KR-20.dengan

menentukan Varians Skor Total terlebih dahulu, selanjutnya menghitung nilai KR-20
23
Hasil perhitungan menunjukkan bahwa nilai KR-20 sebesar 0,737. Hal ini
berarti bahwa nilai reliabilitas instrument di atas sebesar 0,737 lebih besar dari batas
minimal nilai reliabilitas yaitu 0,700 (0,737 > 0,700). Oleh karena itu maka dapat
disimpulkan bahwa instrument reliabel.
Contoh soal 3 :
Contoh perhitungan soal teknik belah dua
24
BAB III
PENUTUP
A. KESIMPULAN
Tes yang baik adalah tes yang mampu mengukur sesuatu sesuai tujuan dari tes
tersebut. Untuk mendapatkan instrumen tes yang baik, perlu dilakukan analisis
terhadap hasil suatu tes, yang mana hasil tersebut digunakan untuk menentukan
kualitas dari tes yang telah diberikan dan menentukan apakah tes tersebut dapat
digunakan pada tes berikutnya atau tidak. Diantara analisis butir soal yang dapat
dilakukan adalah analisis tingkat kesukaran soal dan analisis daya pembeda.
Analisis tingkat kesukaran dilakukan untuk melihat apakah butir soal tersebut
sukar, sedang atau mudah bagi peserta tes. Analisis daya pembeda dilakukan untuk
melihat kemampuan suatu butir soal dalam membedakan antara siswa yang telah
menguasai materi yang ditanyakan dan siswa yang tidak/kurang/belum menguasai
materi yang ditanyakan
B. SARAN
Makalah ini masih kurang lengkap, karena keterbatasan informasi yang penulis
dapatkan. Oleh karena itu, bagi penulis berikutnya yang ingin menulis tentang Daya
beda, Tingkat kesukaran, dan Reliabilitas Soal.
25
DAFTAR PUSTAKA
Arikunto, S. 2013. Dasar – Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara

Sudaryono. 2012. Dasar-Dasar Evaluasi pembelajaran. Yogyakarta: Graha Ilmu
Syamsudin, S. (2012). PENGUKURAN DAYA PEMBEDA, TARAF KESUKARAN,
DAN POLA JAWABAN TEST (Analisis Butir Soal). At-Tajdid: Jurnal Ilmu
Tarbiyah, 1(2), 187-198.
26

Bab I-3

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab I-3

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB I

-1,00 0,00 1,00

Seluruh pengikut tes, dideretkan mulai dari skor terats sampai

2. Untuk kelompok besar

Contoh perhitungan (Syamsudin, 2012):

 Selanjutnya dilihat tabel analisa lagi khusus soal nomor satu.

Klasifikasi daya pembeda :

D : 0,00 – 0,20 : jelek (poor)

Untuk menentukan indeks kesukaran (I k ) soal essai dapat digunakan rumus

Contoh perhitungan (Syamsudin, 2012) :

Menurut ketentuan yang berlaku indeks kesukaran diklasifikasi sebagai berikut

ΣX 84 180 125 160 120 165

x 9,3333 20 13,8889 17,7778 13,3333 18,3333

Analisis Item Tes Uji Coba Kelompok Bawah

x 5,8889 5,4444 3,2222 7,1111 2,2222 6,8889

Pada df = 16 di peroleh Ip tabel = 2,12 dan Ip hitung = 3,2907 jika Ip hitung  Ip

Soal nomor 2 Ip = 14,4343 berarti soalnya signifikan

Soal nomor 4 Ip = 3,5379 berarti soalnya signifikan

Soal nomor 5 Ip = 8,0978 berarti soalnya signifikan

Soal nomor 6 Ip = 6,4053 berarti soalnya signifikan

2) Perhitungan Indeks Kesukaran Soal

Sehingga di ambil dari kelompok tinggi : 10,10,10,10,10,10,8,8,8

= 76,1111% Berarti soalnya mudah

Sehingga di ambil dari kelompok tinggi : 20,20,20,20,20,20,20,20,20

= 55,5556% Berarti soalnya sedang

Sehingga di ambil dari kelompok tinggi : 15,15,15,15,15,15,15,10,10

= 55,5556% Berarti soalnya sedang

= 62,2222% Berarti soalnya sedang

Sehingga di ambil dari kelompok tinggi: 15,15,15,15,15,15,10,10,10

= 51,8519% Berarti soalnya sedang

Sehingga di ambil dari kelompok tinggi : 20,20,20,20,20,20,20,15,10

= 60,0556% Berarti soalnya sedang

3) Hasil Analisis Soal Uji Coba Tes Akhir

Contoh perhitungan mencari reliabilitas :

Langkah pertama menghitung uji reliabilitas dengan KR-20.dengan

Arikunto, S. 2013. Dasar – Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara

Anda mungkin juga menyukai