Materi TRB Full
Materi TRB Full
Dosen Pengampu:
Didik Setyawarno, M.Pd
SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 1
ANALISIS VALIDITAS DAN RELIABILITAS BUTIR SECARA KLASIK
A. Tujuan
Mahasiswa mampu untuk menganalisis butir dari data politomi maupun dikotomi untuk menentukan nilai
validitas dan reliabilitasnya.
B. Dasar Teori
Validitas alat ukur adalah ketepatan alat ukur dengan hal yang diukur. Ada beberapa jenis
validitas alat ukur, yaitu: (1) Validitas isi (content validity), (2) validitas konstruksi (construct validity), (3)
validitas ramalan (predictive validity), dan (4) validitas sama saat (concurrent validity). Uji validitas secara
empiris dilakukan melalui uji coba instrument kepada responden.
Jika datanya berbentuk politomi misal data angket dan soal uraian, maka analisis validitas dilakukan
dengan menggunakan teknik korelasi Product Moment dengan rumus berikut.
𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
𝑟𝑥𝑦 =
√(𝑁 ∑ 𝑋 2 − (∑ 𝑋)2 )(𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 )
Keterangan:
N = banyaknya kasus atau sampel
X = skor butir tes
Y = skor total
Data yang berbentuk dikotomi misal data soal pilihan ganda dengan benar skor 1 dan salah skor 0,
maka analisis validitas dengan menggunakan teknik Korelasi Point Biserial, dengan rumus sebagai
berikut.
𝑀𝑝 − 𝑀𝑡 𝑝
𝑟𝑝𝑏𝑖 = √
𝑆𝑡 𝑞
Keterangan:
rpbi = koefisien korelasi point biserial
Mp = rerata skor dari subjek yang menjawab betul bagi butir yang dicari validitasnya
Mt = rerata skor total
st = standar deviasi dari skor total
p = proporsi peserta didik yang menjawab betul (banyaknya peserta didik yang
menjawab betul dibagi dengan jumlah seluruh peserta didik)
q = proporsi peserta didik yang menjawab salah (q = 1 – p)
Suatu butir tes dinyatakan valid jika nilai r hitung (rxy atau rpbi) lebih besar daripada r tabel dengan taraf
signifikansi atau taraf kekeliruan secara umum 5% (rhit > rtab dengan taraf signifikansi 5%), namun
beberapa ada yang menggunakan lebih ketat lagi yaitu 1%.
Reliabilitas alat ukur adalah keterandalan alat ukur atau keajegan alat ukur; artinya, kapanpun
alat ukur itu digunakan akan menghasilkan hasil ukur yang relatif tetap. Ada beberapa jenis reliabilitas,
yaitu: (1) konsistensi internal, (2) stabilitas, dan (3) ekuivalen. Reliabilitas konsistensi internal alat ukur dapat
dihitung dengan menggunakan rumus Koefisien Alpha-Cronbach, Kuder-Richardson (KR-20 atau KR-21),
dan Teknik Belah Dua.
KR-20 ini secara khusus untuk menghitung reliabilitas tes yang datanya dikotomi misalnya soal pilihan
ganda dengan skor benar 1 dan salah 0, dengan rumus sebagai berikut.
1
𝑘 𝑆𝐷𝑡2 − ∑ 𝑝𝑞
𝑟1.1 =( )( )
𝑘−1 𝑆𝐷𝑡2
Keterangan :
r1.1 = koefisien reliabilitas tes
p = proporsi testee yang menjawab betul
q = proporsi testee yang menjawab salah
n = banyaknya testee
SD2t = varian total tes
pq =pxq
k = banyak butir tes
Jika taraf kesulitan butir tes homogen, maka analisis yang digunakan adalah KR – 21, dengan rumus
sebagai berikut.
𝑘 𝑀(𝑘 − 𝑀)
𝑟1.1 = ( ) (1 − )
𝑘−1 𝑘. 𝑆𝐷𝑡2
Keterangan:
r1.1 = reliabilitas tes
M = rata-rata hitung
k = banyak butir
SD t2 = varian total tes
Varian merupakan kuadrat dari simpangan baku atau standar deviasi. Nilai standar deviasi dapat
dihitung dengan rumus sebagai berikut.
𝑛 ∑ 𝑋 2 − (∑ 𝑋)2
𝑆𝐷𝑡 = √
𝑛(𝑛 − 1)
Keterangan:
SDt = simpangan baku (standar deviasi)
n = jumlah responden
Jika datanya berbentuk politomi misal data angket atau soal uraian, maka digunakan rumus Alpha-
Cronbach, dengan rumus sebagai berikut.
𝑘 𝑆𝐷𝑡2 − ∑ 𝑆𝐷𝑖2
𝑟1.1 = ( )( )
𝑘−1 𝑆𝐷𝑡2
Keterangan :
r1.1 = koefisien reliabilitas perangkat tes
k = banyak butir tes
SDi2 = varians skor tiap butir (item)
2
SD =tot varian skor total
Untuk menentukan derajat reliabilitas tes, dapat digunakan kriteria sebagai berikut.
≤ 0,20 : sangat rendah
0,20 ≤ 0,40 : rendah
0,40 ≤ 0,60 : sedang
0,60 ≤ 0,80 : tinggi
0,80 ≤ 1,00 : sangat tinggi
2
C. Data Butir Soal dan Angket
1. Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 10 nomor dan
dikerjakan oleh 20 siswa
Nomor butir Tes Objektif
Responden 1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 1 1 1 1 1 1
2 0 0 0 0 0 0 0 1 0 0
3 0 0 0 0 0 0 0 0 0 0
4 1 0 1 1 1 1 1 1 0 1
5 0 1 1 1 0 0 0 0 0 0
6 1 1 1 1 1 1 1 1 1 0
7 0 1 0 0 1 0 0 1 1 0
8 1 1 0 0 1 1 1 1 1 1
9 0 1 1 0 0 0 0 0 0 0
10 1 1 1 0 1 1 1 0 0 1
11 1 1 1 1 0 1 1 1 1 1
12 0 1 0 0 1 1 0 0 0 0
13 0 0 0 0 0 0 0 0 0 0
14 1 1 0 1 1 1 1 0 1 1
15 1 1 1 1 1 1 1 1 1 1
16 0 1 1 1 0 0 1 1 1 1
17 0 1 1 1 0 0 0 1 0 1
18 1 1 1 1 1 1 1 1 1 1
19 0 0 1 1 0 0 1 0 0 1
20 0 1 1 0 1 1 0 0 1 1
2. Data jawaban dari angket (1 = sangat tidak setuju/ STS, 2 = tidak setuju/TS, 3 = netral/N, 4 =
setuju/S, dan 5 = sangat setuju/SS) yang terdiri dari 10 pernyataan dan diisi oleh 20 peserta
Nomor Butir Angket
Responden 1 2 3 4 5 6 7 8 9 10
1 3 4 3 2 4 3 3 3 3 3
2 2 4 3 4 4 3 4 4 4 3
3 4 4 4 3 4 4 4 4 4 4
4 3 4 4 3 3 3 3 3 3 3
5 2 3 2 4 3 4 2 4 2 3
6 4 3 4 4 4 4 5 5 5 5
7 3 3 4 4 4 3 3 4 3 4
8 4 4 3 4 4 4 4 4 3 5
9 3 4 3 4 5 4 3 3 4 4
10 2 4 4 2 3 3 2 3 4 3
11 2 3 4 3 2 4 2 2 4 2
12 3 2 1 4 5 4 3 3 4 4
13 4 3 2 5 4 4 4 3 2 4
14 4 4 3 4 4 4 4 4 3 4
15 3 4 4 3 3 4 3 4 4 4
16 4 4 4 4 4 4 3 4 5 3
17 3 3 4 4 4 4 2 4 4 4
18 4 4 5 4 5 3 2 4 5 4
19 3 5 4 5 5 4 2 5 4 3
20 3 5 4 5 5 4 2 5 4 3
3
D. Prosedur Kerja dan Alat Bantu
1. Gunakan rumus yang berlaku pada teori test klasik untuk menentukan tingkat validitas dan
reliabilitas yang sesuai dengan jenis data.
2. Gunakan bantuan aplikasi Ms. Excel untuk menghitungnya.
3. Buatlah tabel yang bisa membantu dalam menganalisisnya.
4. Bandingkan hasil hitungan dengan nilai tabel/ acuan untuk menentukan status butir.
F. Kesimpulan
Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.
6
LAMPIRAN 1.
TABEL NILAI-NILAI r PRODUCT MOMENT/POINT BISERIAL
7
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern
Dosen Pengampu:
Didik Setyawarno, M.Pd
SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 2
ANALISIS TARAF KESUKARAN DAN DAYA BEDA BUTIR SOAL DAN TES
A. Tujuan
Mahasiswa mampu untuk menganalisis butir soal pilihan ganda (data dikotomi) untuk menentukan indek
daya beda dan taraf kesukaran butir soal dan instrumen.
B. Dasar Teori
1. Taraf Kesukaran
Taraf kesukaran tes adalah kesulitan tes dipandang dari kemampuan peserta didik untuk menjawab soal
yang digunakan untuk tes; artinya, tes tersebut akan lebih banyak dapat dijawab benar oleh peserta
didik yang pandai dan lebih banyak dijawab salah oleh peserta didik yang bodoh. Tingkat kesukaran
butir tes merupakan bilangan yang menunjukkan proporsi peserta ujian (testee) yang dapat menjawab
betul butir soal tersebut. Sedangkan tingkat kesukaran perangkat tes adalah bilangan yang menunjukkan
rata-rata proporsi testee yang dapat menjawab seluruh (perangkat) tes tersebut. Rumus tingkat kesukaran
instrumen tes untuk soal bentuk pilihan ganda maupun uraian sebagai berikut.
∑ 𝑃𝑖
𝑃𝑝 =
𝑛
Keterangan :
Pp = tingkat kesukaran perangkat tes
P = tingkat kesukaran tiap butir
n = banyaknya butir tes
Tingkat kesukaran tiap butir soal berbentuk pilihan ganda, dihitung dengan rumus :
𝑛𝐵
𝑃𝑖 =
𝑛
Keterangan :
Pi = tingkat kesukaran butir tes pilihan ganda nomor i
nB = banyaknya subyek yang menjawab soal dengan betul
n = jumlah subyek (testee) seluruhnya
Pada tingkat kesukaran soal tes esai/uraian, dihitung dengan menggunakan rumus:
𝑥̅𝑖
𝑃𝑖 =
𝑠𝑚
Keterangan :
Pi = tingkat kesukaran butir tes uraian nomor i
𝑥̅𝑖 = rata-rata skor butir soal
sm = skor maksimal setiap butir yang ditetapkan
Referesni lain ada yang menyatakan bahwa tes yang baik adalah tes yang memiliki taraf kesukaran
antara 0,25 – 0,75.
1
2. Daya Beda
Daya pembeda tes adalah kemampuan tes untuk membedakan antara peserta didik yang pandai
(kelompok atas) dan bodoh (kelompok bawah); artinya, jika tes tersebut diberikan kepada anak yang
tergolong pandai akan lebih banyak dapat dijawab dengan benar, sedangkan jika diberikan kepada
peserta didik yang tergolong bodoh akan lebih banyak dijawab salah. Daya pembeda tes yang baik
adalah antara 20% - 80% atau antara 30% - 70%. Daya beda butir tes ialah kemampuan butir tes
tersebut membedakan antara testee kelompok atas (pinter) dan testee kelompok bawah (lemah). Daya
beda perangkat tes adalah rata-rata kemampuan tiap butir tes membedakan antara testee kelompok
atas (pinter) dan testee kelompok bawah (lemah). Rumus untuk menghitung tingkat daya beda tes
berbentuk pilihan ganda atau uraian sebagai berikut.
∑(𝑃𝐴 − 𝑃𝐵 ) ∑ 𝐷𝑖
𝐷𝑝 = =
𝑛 𝑛
Keterangan :
Dp = Daya beda instrumen tes
n = jumlah butir tes
Rumus untuk menghitung daya beda butir tes berbentuk pilihan ganda adalah sebagai berikut :
𝑛 𝑛
𝐷𝑖 = 𝑛𝐵𝐴 − 𝑛𝐵𝐵 atau 𝐷𝑖 = 𝑃𝐴 − 𝑃𝐵
𝐴 𝐵
Keterangan:
Di = Daya beda butir soal nomor i
nBA = jumlah subyek yang menjawab betul pada kelompok atas
nBB = jumlah subyek yang menjawab betul pada kelompok bawah
nA = jumlah subyek kelompok atas
nB = jumlah subyek kelompok bawah
Rumus untuk menghitung daya beda butir tes berbentuk uraian adalah sebagai berikut :
𝑥̅𝑖 − 𝑥̅𝑖 𝐵
𝐷𝑖 = 𝐴
𝑠𝑚
Keterangan:
Di = Daya beda butir soal nomor i
𝑥̅𝑖 𝐴 = rata-rata skor kelompok atas pada butir soal nomor i
𝑥̅𝑖 𝐵 = rata-rata skor kelompok bawah pada butir soal nomor i
sm = skor maksimal setiap butir yang ditetapkan
2
C. Data Butir Soal
1. Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 10 nomor dan
dikerjakan oleh 20 siswa
Nomor butir Tes Objektif
Responden 1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 1 1 1 1 1 1
2 0 0 0 0 0 0 0 1 0 0
3 0 0 0 0 0 0 0 0 0 0
4 1 0 1 1 1 1 1 1 0 1
5 0 1 1 1 0 0 0 0 0 0
6 1 1 1 1 1 1 1 1 1 0
7 0 1 0 0 1 0 0 1 1 0
8 1 1 0 0 1 1 1 1 1 1
9 0 1 1 0 0 0 0 0 0 0
10 1 1 1 0 1 1 1 0 0 1
11 1 1 1 1 0 1 1 1 1 1
12 0 1 0 0 1 1 0 0 0 0
13 0 0 0 0 0 0 0 0 0 0
14 1 1 0 1 1 1 1 0 1 1
15 1 1 1 1 1 1 1 1 1 1
16 0 1 1 1 0 0 1 1 1 1
17 0 1 1 1 0 0 0 1 0 1
18 1 1 1 1 1 1 1 1 1 1
19 0 0 1 1 0 0 1 0 0 1
20 0 1 1 0 1 1 0 0 1 1
2. Data jawaban dari soal uraian dengan skor maksimal seragam (minimal 0 dan maksimal 5) dari 10
butir soal uraian yang diisi oleh 20 peserta
Nomor Butir Uraian
Responden 1 2 3 4 5 6 7 8 9 10
1 3 4 3 2 4 3 3 3 3 3
2 2 4 3 4 4 3 4 4 4 3
3 4 4 4 3 4 4 4 4 4 4
4 3 4 4 3 3 3 3 3 3 3
5 2 3 2 4 3 4 2 4 2 3
6 4 3 4 4 4 4 5 5 5 5
7 3 3 4 4 4 3 3 4 3 4
8 4 4 3 4 4 4 4 4 3 5
9 3 4 3 4 5 4 3 3 4 4
10 2 4 4 2 3 3 2 3 4 3
11 2 3 4 3 2 4 2 2 4 2
12 3 2 1 4 5 4 3 3 4 4
13 4 3 2 5 4 4 4 3 2 4
14 4 4 3 4 4 4 4 4 3 4
15 3 4 4 3 3 4 3 4 4 4
16 4 4 4 4 4 4 3 4 5 3
17 3 3 4 4 4 4 2 4 4 4
18 4 4 5 4 5 3 2 4 5 4
19 3 5 4 5 5 4 2 5 4 3
20 3 5 4 5 5 4 2 5 4 3
3
D. Prosedur Kerja dan Alat Bantu
1. Gunakan rumus yang berlaku pada teori test klasik untuk menentukan tingkat kesukaran perangkat tes,
tingkat kesukaran butir tes, daya beda perangkat tes, dan daya beda butir tes yang sesuai dengan
jenis data.
2. Gunakan bantuan aplikasi Ms. Excel untuk menghitungnya.
3. Buatlah tabel yang bisa membantu dalam menganalisisnya.
4. Bandingkan hasil hitungan dengan nilai tabel/ acuan untuk menentukan status butir.
Kelompok
atas
menjawab
benar
Kelompok
bawah
menjawab
benar
Jumlah
benar pada
semua
kelompok
Tingkat
Kesukaran
Daya Beda
Kualitas
Butir Baik
4
1. Analisis tingkat kesukaran dan daya beda soal uraian
Nomor butir Tes Objektif
Responden 1 2 3 4 5 6 7 8 9 10 Total
Data
diurutkan
dari total
skor
tertinggi ke
terendah
(1-10 atau
setengah
dari jumlah
peserta tes
adalah
kelompok
atas)
11-20 atau
setengah
dari jumlah
peserta tes
berikutnya
adalah
kelompok
bawah
Rata-rata
kelompok
atas
menjawab
benar
Rata-rata
kelompok
bawah
menjawab
benar
Rata-rata
menjawab
benar pada
semua
kelompok
Tingkat
Kesukaran
Daya Beda
Kualitas
Butir Baik
F. Kesimpulan
Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.
5
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern
Dosen Pengampu:
Didik Setyawarno, M.Pd
SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 3
ANALISIS DISTRAKTOR/ KEBERFUNGSIAN PENGECOH DAN INDEK SENSITIVITAS BUTIR
A. Tujuan
Mahasiswa mampu untuk menganalisis distraktor atau keberfunsian pengecoh pada butir soal pilihan
ganda dan indek sensitivitas butir.
B. Dasar Teori
1. Distraktor atau Pengecoh
Pengecoh atau distractor yang baik adalah pengecoh yang dapat mengecoh peserta didik untuk memilih
jawaban pada butir soal; artinya, pengecoh tersebut dapat mengecoh peserta didik atau paling sedikit
pengecoh tersebut dipilih oleh 2% atau 3% dari peserta tes. Pengecoh yang baik (efektif) ialah pengecoh
yang dipilih oleh minimal 2-3% dari pengikut tes (ada beberapa referensi mengatakan minimal 5% sudah
dikatakan efektif). Berikut diberikan contoh cara menghitung efektifitas pengecoh untuk 1 butir tes objektif
yang memiliki 4 option a,b,c, dan d.
Pilihan A* B C D *kunci
Kelompok atas 2 6 0 1 10
Kelompok bawah 6 1 0 4 10
A
Jumlah 8 7 0 5 20
Jumlah (%) 40% 35% 0% 25% 100%
Kunci jawaban betul untuk soal di atas adalah pilihan jawaban (A). Pilihan jawaban b, c, dan d sebagai
pengecoh. Pada umumnya sebuah pengecoh yang baik dapat mengundang jawaban lebih besar
jumlahnya pada peserta didik kelompok lemah, dan lebih sedikit pada kelompok pandai. Pilihan jawaban
b, sebagai pengecoh tidak efektif, sebab menarik jawaban lebih banyak dari kelompok peserta didik
pandai. Kejadian itu disebabkan karena distractor (b) membingungkan. Pilihan jawaban c sama sekali
tidak efektif, karena tidak dapat menarik jawaban seorangpun. Pilihan jawaban d dipandang telah
memenuhi fungsinya, sebab dapat mengundang jawaban oleh peserta didik kelompok pandai yang lebih
stedikit.
2. Indek Sensitivitas Tes
Indeks sinsitivitas butir pada dasarnya merupakan ukuran seberapa baik butir soal atau perangkat tes
untuk membedakan antara siswa yang telah dan yang belum mengikuti kegiatan pembelajaran. Prosedur
penentuan sensitivitas pembelajaran dengan cara memberikan pre-test dan post-test kepada kelompok
siswa yang sama. Rumus untuk menghitung indek sensitivitas adalah selisih dari jumlah peserta didik yang
menjawab benar butir soal atau item sesudah proses pembelajaran (posttest) dengan jumlah peserta didik
yang menjawab benar butir soal atau item sebelum proses pembelajaran (pretest). Dengan demikian
sensitivtas instrumen tes merupakan rerata dari sensitivitas setiap butir soal yang ada di instrumen tes dan
dapat dihitung dengan rumus sebagai berikut.
∑ 𝑠𝑖
𝑠𝑝 =
𝑛
Keterangan
sp = indek sensitivitas perangkat tes
si = indek sensitivitas butir soal atau item
n = jumlah butir soal di perangkat tes
Indeks sensitivitas butir soal pilihan ganda dengan skor benar 1 dan salah 0 dapat dihitung dengan
menggunakan rumus berikut.
𝑟𝐴 − 𝑟𝐵
𝑠𝑖 =
𝑡
1
Keterangan
si = indek sensitivitas butir soal atau item nomor i
t = jumlah siswa yang mengikuti tes
rA = jumlah peserta didik yang menjawab benar butir soal atau item sesudah proses
pembelajaran (posttest)
rB = jumlah peserta didik yang menjawab benar butir soal atau item sebelum proses
pembelajaran (pretest)
Indeks sensitivitas butir soal uraian dengan skor maksimal sm dapat dihitung dengan menggunakan rumus
berikut.
𝑥𝐴 − ̅̅̅
̅̅̅ 𝑥𝐵
𝑠𝑖 =
𝑠𝑚
Keterangan
si = indek sensitivitas butir soal atau item nomor i
sm = jumlah skor maksimal butir
xA = jumlah peserta didik yang menjawab benar butir soal atau item sesudah proses
pembelajaran (posttest)
xB = jumlah peserta didik yang menjawab benar butir soal atau item sebelum proses
pembelajaran (pretest)
Indeks sensitivitas butir yang efektif berada di antara 0,00 – 1.00. Semakin besar indeks sensitivitas butir
menunjukkan semakin besar keberhasilan pembelajarannya.
2. Data pretest dan posttest dari soal berbentuk uraian dengan skor maksimal setiap item 3.
Jawaban Butir Soal Pretest Jawaban Butir Soal Postest
Siswa Siswa
1 2 3 4 5 1 2 3 4 5
1 1 2 1 0 0 1 1 2 2 2 2
2 2 2 1 0 1 2 1 2 2 2 0
3 1 1 2 2 1 3 1 1 0 2 2
4 1 1 1 1 1 4 2 2 2 0 2
5 1 1 2 2 1 5 1 2 2 2 1
6 1 2 1 1 2 6 2 2 1 2 2
7 1 0 2 0 2 7 1 0 2 2 2
8 1 2 0 2 2 8 1 2 2 2 2
9 1 2 1 1 0 9 1 2 0 2 2
10 1 1 2 2 1 10 1 2 2 2 1
11 1 2 1 1 2 11 2 0 1 2 2
12 1 2 1 0 0 12 0 2 2 0 2
13 1 1 2 2 1 13 2 2 2 2 1
14 1 2 1 1 1 14 2 1 1 2 2
15 1 0 2 2 2 15 2 2 2 1 2
16 1 2 1 2 2 16 0 2 2 2 1
17 1 2 1 1 0 17 2 1 0 2 2
18 1 2 1 0 0 18 2 2 2 0 0
19 1 1 0 1 1 19 2 2 0 2 2
20 1 2 0 1 1 20 2 2 2 2 2
3. Data pretest dan posttest dari soal berbentuk pilihan ganda dengan skor benar 1 dan salah 0.
Jawaban Butir Soal Pretest Jawaban Butir Soal Posttest
Siswa Siswa
1 2 3 4 5 1 2 3 4 5
1 0 1 1 0 1 1 1 1 1 1 1
2 1 1 1 0 1 2 1 1 1 1 1
3 0 1 0 1 0 3 1 1 1 1 1
4 1 0 1 1 1 4 1 1 1 1 1
5 1 1 1 1 1 5 0 1 1 0 1
6 0 1 0 1 0 6 1 1 0 1 1
7 1 1 0 1 1 7 1 1 1 1 1
8 0 1 1 0 1 8 1 1 1 1 1
9 1 1 0 1 1 9 0 1 0 1 0
10 1 1 0 1 1 10 1 1 1 1 1
11 1 1 1 1 0 11 1 1 1 1 1
3
12 0 1 0 1 0 12 1 0 1 1 1
13 1 0 1 1 1 13 0 1 1 0 1
14 1 1 0 1 1 14 1 1 1 1 1
15 1 1 1 1 0 15 1 1 1 1 1
16 0 1 1 0 1 16 1 1 1 1 1
17 1 0 1 1 1 17 1 1 1 0 1
18 1 1 1 1 0 18 1 1 1 1 1
19 0 1 1 0 1 19 1 1 1 1 0
20 0 1 0 1 0 20 1 0 1 1 1
4
Analisis keberfungsian pengecoh pada butir PG
No Butir Pilihan A B* C D *kunci
1 Kelompok atas
Kelompok bawah
Jumlah
Kesimpulan
2 Kelompok atas
Kelompok bawah
Jumlah
Kesimpulan
DAN SETERUSNYA
2. Data pretest dan posttest dari soal berbentuk uraian dengan skor maksimal setiap item 3.
Jawaban Butir Soal Pretest Jawaban Butir Soal Postest
Siswa Siswa
1 2 3 4 5 1 2 3 4 5
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
11 11
12 12
13 13
14 14
15 15
16 16
17 17
18 18
19 19
20 20
xB xA
si
sp
3. Data pretest dan posttest dari soal berbentuk pilihan ganda dengan skor benar 1 dan salah 0.
Jawaban Butir Soal Pretest Jawaban Butir Soal Posttest
Siswa Siswa
1 2 3 4 5 1 2 3 4 5
1 1
2 2
3 3
5
4 4
5 5
6 6
7 7
8 8
9 9
10 10
11 11
12 12
13 13
14 14
15 15
16 16
17 17
18 18
19 19
20 20
rB rA
rA-rB
si
sp
F. Kesimpulan
Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.
6
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern
Dosen Pengampu:
Didik Setyawarno, M.Pd
SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 4
PENENTUAN INDEKS PERSETUJUAN KAPPA
A. Tujuan
Mahasiswa mampu untuk menghitung indeks persetujuan dan indeks Kappa dalam menganalisis instrument
butir soal baik dengan dua kali pelaksanaan tes maupun dengan sekali pelaksanaan tes.
B. Dasar Teori
1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes
Indeks keandalan yang direkomendasikan untuk tes beracuan kriteria adalah (a) koefisien persetujuan
(agreement coefficient), (b) koefisien kappa. Dua koefisien ini mengukur konsistensi dari klasifikasi berhasil-
gagal (mastery-nonmastery) antarkedua pelaksanaan ujian atau pengadministrasian tes. Indeks tersebut
memerlukan interpretasi yang berbeda dibanding koefisien keterandalan tradisional KR 20, KR 21, atau
Alpha-Cronbach yang menggunakan koefisien korelasi skor butir dengan skor total. Pengklasifikasian
berhasil-gagal pada kedua pelaksanaan tes dan pengadministrasian tes dapat diringkas sebagaimana pada Tabel
1.
Tabel 1. Klasifikasi Penempuh Ujian di Dua Pelaksanaan Tes
Pelaksanaan Tes 2
Berhasil Gagal
Pelaksanaan Tes 1 Berhasil A B (A + B)
Gagal C D (C + D)
(A + C) (B + D) N
Koefisien persetujuan adalah proporsi penempuh tes yang secara konsisten tergolongkan ke dalam
kelompok yang berhasil dan yang gagal dari kedua-dua pengadministrasian pengujian tes. Koefisien
persetujuan menunjuk nilai po yang dihitung dengan rumus sebagai berikut.
( 𝑨 + 𝑫)
𝒑𝒐 =
𝑵
Keterangan:
A = jumlah penempuh tes kelompok yang berhasil di kedua pengadministrasi tes
D = jumlah penempuh tes kelompok yang gagal di kedua pengadministrasi tes
N = jumlah peserta tes di kedua pengadministrasian tes
Batas atas dari koefisien persetujuan adalah 1,00, yang tercapai jika klasifikasi-klasifikasi di kedua-dua
pengadministrasian tes bersifat konsisten untuk semua penempuh tes dimasing-masing kelompok. Batas
bawah dari koefisien persetujuan dapat dihitung dengan rumus sebagai berikut.
[( 𝑨 + 𝑩)(𝑨 + 𝑪) + ( 𝑪 + 𝑫)(𝑩 + 𝑫)]
𝒑𝒄𝒉𝒂𝒏𝒄𝒆 =
𝑵𝟐
Keterangan:
B = jumlah penempuh tes kelompok yang berhasil di pengadministrasi tes pertama tetapi
gagal di pengadministrasi tes kedua
C = jumlah penempuh tes kelompok yang gagal di kedua pengadministrasi tes pertama tetapi
berhasil di pengadministrasi tes kedua
Batas bawah (pchance) merupakan proporsi klasifikasi-klasifikasi yang konsisten secara kebetulan jika hasil
mastery-nonmastery pada pengadministrasian tes yang kedua dengan sepenuhnya tidak terikat pada
pengadministrasin tes yang pertama dimana besarnya pchance ≥ 0,50. Koefisien kappa (K) dapat dihitung
dengan rumus sebagai berikut.
1
𝒑𝒐 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆
𝑲 =
𝟏 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆
Koefisien kappa merupakan proporsi klasifikasi-klasifikasi yang konsisten yang sesuai dengan harapan
dan yang secara kebetulan. Batas atas dan batas bawah dari koeifisen kappa adalah 1,00 dan 0,00,
yang terjadi ketika hasil-hasil pada kedua pengadministrasian tes bertutur-turut di dalam persetujuan yang
sempurna atau bebas secara penuh.
2
1.10 .78 .79 .80 .81 .83 .85 .87 .89 .92
1.20 .80 .81 .62 .84 .85 .86 .88 .90 93
1.30 .83 .84 85 .86 .67 .88 .90 .91 .94
1.40 .86 .86 .87 .88 .89 .90 .91 .93 .95
1.50 .88 . 8 8 .89 .90 .90 .91 .97 .94 .95
1.60 .90 .90 .90 .91 .92 .93 .93 .95 .96
1.70 .92 .92 .92 .93 .93 .94 95 .95 .97
1.80 .93 .93 .94 .94 .94 .95 .95 .96 .97
1.90 .95 .95 .95 .95 .95 .96 .96 .97 .98
2.00 .96 .96 .96 .96 .96 .97 .97 .97 .98
3
Tabel 4. Interpretasi Koefisien Kappa
Indeks Kappa Agreement
<0,20 Rendah/Poor
0,21 – 0,40 Lumayan/ Fair
0,41 – 0,60 Cukup/ Moderate
0,61 – 0,80 Kuat/ Good
>0,80 Sangat Kuat/ Very good
Selain itu, suatu tes yang diterapkan dalam suatu kelas pada periode yang penuh (misalnya 1 semester)
dapat menggunakan nilai koefisien kappa sebesar 0,35 sampai 0,50 atau lebih dari itu.
4
E. Analisis Data dengan Aplikasi Excel
1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes
Siswa Butir Pengujian 1 Pengujian 2 Kategori
1 1 0 1 C
2 1 1 A
3
Dst
10
1 2
2
3
Dst
10
Dst
1 5
2
3
Dst
10
Hasil Akhir A=
B=
C=
D=
( 𝑨 + 𝑫)
𝒑𝒐 =
𝑵
[( 𝑨 + 𝑩)(𝑨 + 𝑪) + ( 𝑪 + 𝑫)(𝑩 + 𝑫)]
𝒑𝒄𝒉𝒂𝒏𝒄𝒆 =
𝑵𝟐
𝒑𝒐 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆
𝑲 =
𝟏 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆
F. Kesimpulan
Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.
5
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern
Dosen Pengampu:
Didik Setyawarno, M.Pd
SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN
ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 5
ANALISIS BUTIR DENGAN MENGGUNAKAN SPSS (PENDEKATAN KLASIK)
A. Tujuan
Mahasiswa mampu menganalisis butir soal (data dikotomi) dan angket (data politomi) serta menghiung
koefisien Kappa dengan menggunakan aplikasi SPSS untuk menentukan kualitas butir soal dan angket.
Penyelesaian
a. Buka aplikasi SPPS dan pilih variable view di bagian bawah kiri. Ketik A1 sampai dengan A6 pada
kolom name untuk pertanyaan kuisioner aspek motivasi belajar. Isikan pada kolom label yaitu
pertanyaan 1 sampai dengan pertanyaan 6.
b. Klik Data View dan masukkan data hasil kuisioner A1 sampai A6.
c. Klik menu Analyze, pilih Scale → Reliability Análisis.
d. Pindahkan seluruh Pertanyaan, mulai A1 sampai A6 ke kotak item melalui tombol tanda panah
diantaranya.
e. Klik tombol statistic, kemudian klik item, scale, dan scale if item deleted.
f. Selanjutnya klik continue dan Ok.
Hasil analisis dengan SPSS akan dihasilkan untuk validitas dapat di lihat di tabel item-total statistics
sebagai berikut.
Item-Total Statistics
Corrected Item- Cronbach's
Scale Mean if Scale Variance Total Alpha if Item
Item Deleted if Item Deleted Correlation Deleted
pertanyaan 1 16.00 3.310 .678 .437
pertanyaan 2 16.10 3.403 .700 .440
pertanyaan 3 15.97 3.689 .699 .470
pertanyaan 4 16.13 3.568 .606 .478
pertanyaan 5 16.20 3.476 .573 .480
pertanyaan 6 17.77 5.909 -.347 .900
g. Menentukan nilai r-tabel dengan melihat nilai df (degree of freedom) = n – k, dimana k adalah jumlah
butir pertanyaan dalam suatu variabel, dan n merupakan jumlah responden. Maka df = 30-6 = 24.
Tabel r product – moment (two tailed test) menunjukkan bahwa pada df 24 dengan alpha 5%, diperoleh
r table sebesar 0,404.
h. Membandingkan nilai r hitung dengan r tabel sebagai berikut.
1) r hitung A1 sebesar 0,678 > r table 0,404, kesimpulan valid.
2) r hitung A2 sebesar 0,700 > r table 0,404, kesimpulan valid.
3) r hitung A3 sebesar 0,699 > r table 0,404, kesimpulan valid.
4) r hitung A4 sebesar 0,606 > r table 0,404, kesimpulan valid.
5) r hitung A5 sebesar 0,573 > r table 0,404, kesimpulan valid.
6) r hitung A6 sebesar -0,347 < r table 0,404, kesimpulan tidak valid.
i. Menghapus pertanyaan yang tidak valid (nomor 6) dari variable view di SPSS (klik kanan pilih clear).
j. Melakukan uji validitas kembali untuk pertanyaan yang valid, seperti langkah langkah diatas. Hasil uji
validitas untuk Item Total Statistics sebagai berikut.
Item-Total Statistics
Corrected Item- Cronbach's
Scale Mean if Scale Variance Total Alpha if Item
Item Deleted if Item Deleted Correlation Deleted
pertanyaan 1 14.13 3.637 .808 .866
pertanyaan 2 14.23 3.702 .855 .855
pertanyaan 3 14.10 4.231 .734 .885
pertanyaan 4 14.27 3.995 .693 .891
pertanyaan 5 14.33 3.816 .695 .892
k. Menentukan nilai r-tabel dari pertanyaan yang valid melalui df (degree of freedom) = n – k, dimana
k merupakan jumlah butir pertanyaan dalam suatu variabel, dan n merupakan jumlah responden. Maka
df = 30-5 = 25. Tabel r product – moment (two tailed test) menunjukkan bahwa pada df 24 dengan
alpha 5%, diperoleh r table sebesar 0,396.
l. Membandingkan nilai r hitung dengan r tabel dari tabel hasil analisis terakhir sebagai berikut.
1) r hitung A2 sebesar 0,808 > r table 0,396, kesimpulan valid.
2) r hitung A5 sebesar 0,855 > r table 0,396, kesimpulan valid.
3) r hitung A6 sebesar 0,734 > r table 0,396, kesimpulan valid.
4) r hitung A7 sebesar 0,693 > r table 0,396, kesimpulan valid.
5) r hitung A8 sebesar 0,695 > r table 0,396, kesimpulan valid.
m. Menyimpulkan bahwa tujuh indikator pertanyaan variabel A yaitu motivasi dalam riset pembelajaran
IPA di SMP kelas 7 memiliki r hitung yang lebih besar dari nilai r table telah valid.
Langkah uji reliability sama dengan langkah uji validitas. Poin yang berbeda adalah output SPSS yang
menjadi dasar penilaian validitas dengan output SPSS yang menjadi dasar penilaian Reliabilitas. Uji validitas
dilakukan dengan memperhatikan output Item total statistik, sedangkan uji reliabilitas dengan memperhatikan
output Reliability Statistics pada kolom Cronbach’s Alpha. Reliabilitas suatu konstruk variabel dikatakan baik
jika memiliki nilai Cronbach’s Alpha > dari 0,60. Dengan menggunakan data pada contoh di atas maka
prosedur analisis reliabilitas instrumen sebagai berikut.
Penyelesaian
a. Buka aplikasi SPSS dan masukkan data variabel A yang sudah valid, seperti terdapat pada contoh di
atas.
c. Memindahkan seluruh pertanyaan ke kolom item dengan menggunakan tombol tanda panah yang
berada diantaranya.
d. Klik tombol statisitik, kemudian aktifkan item, scale, dan scale if item deleted.
Pengukuran yang reliabel akan menunjukkan instrumen yang dapat menghasilkan data yang dipercaya.
Reliabilitas suatu konstruk variabel dikatakan baik jika memiliki nilai Cronbach’s Alpha > dari 0,60. Maka
berdasarkan hasil ini dapat dilihat bahwa Cronbach’s Alpha 0.900 > dari 0,60. Hal ini berarti instrumen sudah
dapat dikatakan reliabel.
2. Data Dikotomi
Analisis butir soal tes berbentuk pilihan ganda (dengan benar skor 1 dan salah 0) merupakan cara untuk
mengetahui kualitas soal yang diujikan secara statistik. Analisis butir soal tes memiliki empat kriteria, yaitu:
a. Validitas
b. Reliabilitas
c. Tingkat Kesukaran
d. Daya Pembeda
Untuk mempermudah dalam analisis ini dapat dilakukan dengan menggunakan salah satu aplikasi komputer
SPSS for Windows. Berikut cara analisis menggunakan aplikasi SPSS tersebut.
a. Membuka aplikasi SPSS, klik Variable View dan isikan variable semua butir soal yang akan dianalisis.
b. Klik Data View, isikan hasil koreksian ke SPSS (Misal jawaban benar = 1, dan jawaban salah = 0,
jumlah = jumlah jawaban benar).
c. Uji Validitas:
1) Pilih menu Analyze --> Correlate --> Bivariate
2) Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, soal_8, dan jumlah ke Kotak
“Variables”.
3) Klik Pearson, Two-tailed, dan Flag significant correlation
4) Klik OK
Berikut hasil analisis validitas butir soal pilihan ganda.
Correlations
soal_1 soal_2 soal_3 soal_4 soal_5 soal_6 soal_7 soal_8 jumlah
soal_1 Pearson Correlation 1 .000 .102 .250 .408 .327 .500 -.408 .430
Sig. (2-tailed) 1.000 .779 .486 .242 .356 .141 .242 .215
N 10 10 10 10 10 10 10 10 10
soal_2 Pearson Correlation .000 1 .000 .500 .000 .218 -.200 .408 .407
Sig. (2-tailed) 1.000 1.000 .141 1.000 .545 .580 .242 .243
N 10 10 10 10 10 10 10 10 10
soal_3 Pearson Correlation .102 .000 1 .408 .667* .535 .816** -.250 .702*
Sig. (2-tailed) .779 1.000 .242 .035 .111 .004 .486 .024
N 10 10 10 10 10 10 10 10 10
soal_4 Pearson Correlation .250 .500 .408 1 .612 .764* .500 -.102 .814**
Sig. (2-tailed) .486 .141 .242 .060 .010 .141 .779 .004
N 10 10 10 10 10 10 10 10 10
soal_5 Pearson Correlation .408 .000 .667* .612 1 .802** .816** -.167 .868**
Sig. (2-tailed) .242 1.000 .035 .060 .005 .004 .645 .001
N 10 10 10 10 10 10 10 10 10
soal_6 Pearson Correlation .327 .218 .535 .764* .802** 1 .655* -.356 .819**
Sig. (2-tailed) .356 .545 .111 .010 .005 .040 .312 .004
N 10 10 10 10 10 10 10 10 10
soal_7 Pearson Correlation .500 -.200 .816** .500 .816** .655* 1 -.408 .769**
Sig. (2-tailed) .141 .580 .004 .141 .004 .040 .242 .009
N 10 10 10 10 10 10 10 10 10
soal_8 Pearson Correlation -.408 .408 -.250 -.102 -.167 -.356 -.408 1 -.037
Sig. (2-tailed) .242 .242 .486 .779 .645 .312 .242 .919
N 10 10 10 10 10 10 10 10 10
jumlah Pearson Correlation .430 .407 .702* .814** .868** .819** .769** -.037 1
Sig. (2-tailed) .215 .243 .024 .004 .001 .004 .009 .919
N 10 10 10 10 10 10 10 10 10
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).
Analisis: Hasil pada kolom "Jumlah" jika nilai sig. (2-tailed) < ½ 0,05 atau sig. (2-tailed) < 0,025 menyatakan butir soal tersebut Valid. Contoh untuk soal nomor
1, nilai sig = 0,215, dimana nilai tersebut > 0,025, maka soal nomor 1 dinyatakan tidak valid. Soal nomor 5, nilai sig. (2-tailed) = 0,001, dimana nilai tersebut
<0,05, maka soal nomor 5 dinyatakan valid.
d. Uji Reliabilitas:
1) Pilih menu Analyze --> Scale --> Reliability Analysis.
2) Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, dan soal_8, ke Kotak “Items”
3) Pada kolom Model pilih Alpha, klik Statistics, pilih Item, dan klik Continue.
4) Klik OK.
Hasil analisis uji reliabilitas dapat dilihat di tabel Reliability Statistic sebagai berikut.
Reliability Statistics
Cronbach's
Alpha N of Items
.734 8
Analisis: Berdasarkan nilai Cronbach's Alpha pada tabel Reliability Statistics diperoleh nilai 0,734
dimana nilai ini ditafsirkan dengan kriteria
0,800 - 1,000 = Sangat tinggi
0,600 - 0,799 = Tinggi
0,400 - 0,500 = Cukup
0,200 - 0,399 = Rendah
> 0,200 = Sangat rendah
Hasil analisis dapat disimpulkan tes ini memiliki tingkat reliabilitas tinggi.
e. Uji Tingkat Kesukaran
1) Pilih menu Analyze --> Descriptive Statistics --> Frequencies.
2) Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, dan soal_8, ke Kotak
“Variable(s)”
4) Klik OK
Hasil analisis tingkat kesukaran sebagai berikut.
Statistics
soal_1 soal_2 soal_3 soal_4 soal_5 soal_6 soal_7 soal_8
N Valid 10 10 10 10 10 10 10 10
Missing 0 0 0 0 0 0 0 0
Mean .8000 .5000 .6000 .2000 .4000 .3000 .5000 .6000
Analisis : dari hasil yang ditunjukkan nilai MEAN pada tabel statistcs ditafsirkan pada rentang tingkat
kesukaran, yaitu
0.00 – 0.20 => Sangat Sukar
0.21 – 0.40 => Sukar
0.41 – 0.60 => Sedang
0.61 – 0.80 => Mudah
0.81 – 1.00 => Sangat Mudah
Misal soal nomor satu, diperoleh nilai Mean = 0,8000 yang berarti tingkat kesukaran soal nomor satu
adalah mudah. Soal nomor empat, diperoleh nilai Mean = 0,2000 yang berarti tingkat kesukaran
soal nomor satu adalah sangat sukar.
R hitung dapat dilihat dari nilai Pearson Correlation pada uji validitas yang telah dilakukan sebelumnya.
Berikut tabel hasil analisis validitas butir soal untuk mengetahui daya beda butir soal pilihan ganda.
Correlations
soal_1 soal_2 soal_3 soal_4 soal_5 soal_6 soal_7 soal_8 jumlah
soal_1 Pearson Correlation 1 .000 .102 .250 .408 .327 .500 -.408 .430
Sig. (2-tailed) 1.000 .779 .486 .242 .356 .141 .242 .215
N 10 10 10 10 10 10 10 10 10
soal_2 Pearson Correlation .000 1 .000 .500 .000 .218 -.200 .408 .407
Sig. (2-tailed) 1.000 1.000 .141 1.000 .545 .580 .242 .243
N 10 10 10 10 10 10 10 10 10
soal_3 Pearson Correlation .102 .000 1 .408 .667* .535 .816** -.250 .702*
Sig. (2-tailed) .779 1.000 .242 .035 .111 .004 .486 .024
N 10 10 10 10 10 10 10 10 10
soal_4 Pearson Correlation .250 .500 .408 1 .612 .764* .500 -.102 .814**
Sig. (2-tailed) .486 .141 .242 .060 .010 .141 .779 .004
N 10 10 10 10 10 10 10 10 10
soal_5 Pearson Correlation .408 .000 .667* .612 1 .802** .816** -.167 .868**
Sig. (2-tailed) .242 1.000 .035 .060 .005 .004 .645 .001
N 10 10 10 10 10 10 10 10 10
soal_6 Pearson Correlation .327 .218 .535 .764* .802** 1 .655* -.356 .819**
Sig. (2-tailed) .356 .545 .111 .010 .005 .040 .312 .004
N 10 10 10 10 10 10 10 10 10
soal_7 Pearson Correlation .500 -.200 .816** .500 .816** .655* 1 -.408 .769**
Sig. (2-tailed) .141 .580 .004 .141 .004 .040 .242 .009
N 10 10 10 10 10 10 10 10 10
soal_8 Pearson Correlation -.408 .408 -.250 -.102 -.167 -.356 -.408 1 -.037
Sig. (2-tailed) .242 .242 .486 .779 .645 .312 .242 .919
N 10 10 10 10 10 10 10 10 10
jumlah Pearson Correlation .430 .407 .702* .814** .868** .819** .769** -.037 1
Sig. (2-tailed) .215 .243 .024 .004 .001 .004 .009 .919
N 10 10 10 10 10 10 10 10 10
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).
Analisis: Hasil yang diperoleh untuk soal nomor satu pada kolom jumlah adalah 0,430 yang berarti
soal baik.
3. Koefisien Kappa
Koefisien Kappa merupakan ukuran yang menyatakan konsistensi pengukuran yang dilakukan dua orang
penilai (Rater) atau konsistensi antar dua metode pengukuran atau dapat juga mengukur konsistensi antar dua
alat pengukuran.
Klasifikasi Penempuh Ujian di Dua Pelaksanaan Tes
Pelaksanaan Tes 2
Benar Salah
Pelaksanaan Tes 1 Benar A B (A + B)
Salah C D (C + D)
(A + C) (B + D) N
Langkah – langkah untuk mendapatkan koefisien Kappa dengan SPSS adalah sebagai berikut:
a. Definisikan data pada Variabel View. Disini akan dibuat tiga variabel, yaitu Tes 1 dan Tes 2. Skala data
untuk variabel Tes 1 dan Tes 2 adalah Scale. Berikan kode pada kolom Values.
Untuk variabel Tes 1 yang terdiri dari dua kategori
Benar = 2, Salah = 1
Untuk variabel Tes 2 yang terdiri dari dua kategori
Benar = 2, Salah = 1
Kategori ditetukan berdasarkan instrument yang digunakan oleh peneliti, memungkinkan terdiri dari tiga
atau lebih kategori.
Misal: Sangat Baik = 4, Baik = 3, Cukup = 2, Kurang = 1
b. Memasukan data kedalam SPSS
c. Pilih Anlyze, Descriptive Statistics, lalu klik Crosstabs
Kotak dialog Crosstabs, pindahkan Tes1 ke Row(s) dan Tes 2 ke Colum(s)
Klik Statistics, pada kotak dialog Crosstabs:Statistics yang muncul centang Kappa
d. Klik Cells, pada kotak dialog Crosstabs:Statistics yang muncul centang Total di bawah Percentages
tekan Continue
Dari output diatas diperoleh nilai koefisein cohen’s kappa sebesar 0,400. Ini berarti terdapat kesepakatan
yang lumayan/ fair Antara pelaksanaan Tes 1 dengan Tes 2 terhadap peserta. Nilai signfikansinya dapat
dilihat pada kolom Approx. Sig dengan nilai signifikansi sebesar 0,004. Karena nilai signifikansi kurang dari
taraf signifikansi yang digunakan 5 % (0,004<0,05), maka hipotesis awal dditerima sehingga dapat
disimpulkan terdapat kesepakatan yang signfikan antar pelaksanaan Tes 1 dan Tes 2 pada taraf signfikansi
5 %.
E. Kesimpulan
Buatlah interpretasi dari hasil keluaran Iteman dan berikan kesimpulan berdasarkan hasil analisis tersebut.
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern
Dosen Pengampu:
Didik Setyawarno, M.Pd
SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN
ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 6
ANALISIS BUTIR SOAL DENGAN MENGGUNAKAN ITEMAN 4.3
A. Tujuan
Mahasiswa mampu menganalisis butir soal dengan menggunakan aplikasi Iteman 4.3 untuk menentukan
kualitas butir soal
B. Iteman 4.3
ITEMAN (Item and Test Analysis) adalah perangkat lunak komputer (software) yang dibuat khusus untuk
menganalisa butir soal atau suatu tes yang dilakukan. ITEMAN merupakan analisis butir empirik dengan
model pendekatan klasik yang berguna untuk menentukan kualitas butir soal atau sebuah tes. Hasil dari
analisi butir soal meliputi tingkat kesukaran, daya beda, dan statistik penyebaran jawaban. Selain
menghasilkan statistik butir soal/tes, program ini juga menghasilkan statistik tes yang meliputi realibilitas
tes, kesalahan pengukuran atau standard error dan distribusi skor.
Beberapa istilah penting yang ada dihasil analisis dengan Iteman (Iteman 3) sebagai berikut.
a. Seq. No adalah nomor urut butir soal dalam file data.
b. Scala-item adalah nomor urut butir soal dalam skala (tes/subtes)
c. Prop. Correct adalah proporsi siswa( peserta tes) yang menjawab benar butir soal. Nilai ekstrim
(mendekati nol atau satu) menunjukan bahwa butir soal tersebut terlalu sukar atau terlalu mudah untuk
peserta tes. Indeks ini disebut juga indeks tigkat kesukaran soal secara klasikal.
d. Biser adalah indeks daya pembeda soal dengan menggunakan koefisien korelasi biserial. Nilai positif
menunjukan bahwa peserta tes yang menjawab benar butir soal, mempunyai skor yang relatif tinggi
dalam tes/skala tersebut. Sebaliknya nilai negatif menunjukan bahwa peserta tes yang menjawab
benar butir soal, memperoleh skor yang relatif rendah dalam tes/skala tersebut. Untuk statistik pilihan
jawaban (alternative) korelasi biserial negatif sangat tidak dikehendaki untuk kunci jawaban dan
sangat dikehendaki untuk pilihan jawaban yang lain (pengecoh).
e. Point-biser adalah juga indeks daya pembeda soal dan pilihan jawaban (alternatif) dengan
menggunakan koefisien korelasi point-biserial. Penafsirannya sama dengan statistik biserial.
f. Statistik pilihan jawaban (alternative) memberikan informasi yang sama dengan statistik butir soal.
Perbedaannya adalah bahwa statistik pilihan jawaban dihitung secara terpisah. Untuk setiap piihan
jawaban dan didasarkan pada dipilih tidaknya alternatif tersebut, bukan pada benarnya jawaban.
Tanda (*) yang muncul di sebelah kanan hasil analisis menunjukan kunci jawaban.
Istilah yang perlu dipahami untuk membaca hasil analisis sebagai berikut.
1. N of items adalah jumlah butir soal dalam tes.
2. N of examines adalah jumlah peserta tes yang digunakan dalam analisis.
3. Mean adalah skor rata-rata peserta tes.
4. Variance adalah varian dari distribusi skor peserta tes yang memberikan gambaran tentang sebaran
skor peserta tes.
5. Std. Dev adalah deviasi standar dari distribusi skor peserta tes.
6. Skew adalah kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk
distribusi skor peserta tes.
7. Kurtosis adalah puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding
dengan distribusi normal.
8. Minimun adalah skor terendah peserta tes dalam tes/skala tersebut.
9. Maximum adalah skor tertinggi peserta tes dalam tes/skala tersebut.
10. Median adalah skor tengah dimana 50% skor berada pada atau lebih rendah dari skor tersebut.
11. Alpha adalah koefisien reliabilitas alpha untuk tes/skala tersebut yang merupakan indeks homogenitas
tes/skala. Koefisien alpha bergerak dari 0,0 sampai 1,0.
12. SEM adalah kesalahan pengukuran standar untuk setiap tes/skala. SEM merupakan estimit dari deviasi
standar kesalahan pengukuran dalam skor tes.
13. Mean P adalah rata-rata tingat kesukaran semua butir soal dalam tes secara klasikal dihitung dengan
cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk semua butir soal dalam
tes/skala.
14. Mean item-Tot nilai rata-rata indeks daya pembeda dari semua soal dalam tes/skala yang diperoleh
dengan menghitung nilai rata-rata point biserial dari semua soal dalam tes/skala.
15. Mean-Biserial adalah juga nilai rata-rata indeks daya pembeda yang diperoleh dengan menghitung
nilai rata-rata korelasi biserial dari semua butir soal dalam tes/skala.
16. Scale intercorrelation adalah indeks korelasi antara skor-skor peserta tes yang diperoleh dari setiap
subtes/subskala.
Silahkan Entry hasil jawaban soal pilihan ganda siswa, pada microsoft excel. Model entry dibuat seperti pada
tampilan gambar 6.1
b. Buka aplikasi “notepad” di File Program anda, tampilan notepad seperti pada gambar 6.3 berikut,
d. Mengatur “spasi” butir soal yang di entry di lembar kerja “Notepad” dilakukan dengan cara
melakukan “block” pada “spasi” butir soal seperti pada gambar 6.5.
e. Selanjutnya arahkan cursor mouse pada area yang di “block”. Kemudian “klik” kanan mouse, dan pilih “copy”
Selanjutnya pada tool bar, terdapat menu “edit”, kemudian “klik” sehingga muncul pilihan menu “Replace”.
Pilihlah menu “Replace” tsb, sehingga muncul tampilan seperti pada gambar 6.6.
f. Jika sudah di “paste”, selanjutnya pilih dan klik menu “Replace All”, sehingga spasi pada notepad akan
berubah menjadi lebih rapat seperti pada gambar 6.8. Untuk menghilangkan menu “Replace” pilihlah
menu “Cancel” atau tanda silang (X) Selanjutnya akan tampil seperti pada gambar 6.9.
Gambar 6.8 dan 6.9 Mengganti Ukuran Spasi dan Meluruskan Butir Soal
g. Selanjutnya meluruskan butir soal dalam satu kolom
Item01 A 5 1 Y M
Keterangan:
Item01 = Nomor Butir Soal
A = Kunci Jawaban
5 = Alternatif opsi jawaban (A, B, C, D, E)
1 = Domain
Y = Ketentuan Perintah analisis masing-masing butir (Y= Yes; N=No)
M = Jenis analisis (M=multiple choice, R= Rating Scale, P= Partial Scale)
c. Pada menu “input format” terdapat opsi “fixed width data” di bawahnya terdapat 3 buah kolom. Masing-
masing kolom beridentitas “Number of examinee ID columns ” , “Examinee Ids begin in column” dan “Item
response begin in column”. Ketiga kolom tersebut harus disesuaikan “nama subyek (nama siswa)”. misalnya
nama siswa terpanjang adalah “Gunawan”. Nama terpanjang tersebut menjadi patokan untuk input
“Number of examinee ID columns ” Nama ǀGǀuǀnǀaǀwǀaǀnǀ memiliki jumlah spasi sebanyak 8 (hitung tanda warna
merah), sehingga “Number of examinee ID columns ” diisi 8. Seperti pada gambar 6.17.
Kemudian “Item response begin in column” merupakan spasi dimulainya input jawaban siswa, artinya “Item
response begin in column” merupakan jumlah dari “Number of examinee ID columns ”+ “Examinee Ids begin
in column”.
“Number of examinee ID columns ” + “Examinee Ids begin in column” = “Item response begin in column” atau (8+1= 9).
d. Pilih menu “File” pada software Iteman 4.3. seperti tampak pada gambar 6.20
e. Klik icon pada “Data matrix file” pilih file notepad “butir Jawaban” yang telah dibuat dan disimpan
sebelumnya. Kemudian klik “Open” Lihat gambar 6.21.
Gambar 6.21. Memasukan Butir Jawaban pada Data Matrix File
Kemudian masukan kunci jawaban dengan memilih icon pada “Item control file”. Pilih kunci jawaban
yang telah dibuat dan disimpan. Kemudian klik “Open” lihat gambar 6.22.
f. Langkah selanjutnya lihat menu “Output File”. Kemudian, beri nama identitas pada kolom “Output File”
sesuai dengan keinginan anda, nama output nantinya akan menjadi nama file. Lihat gambar 6.23.
Gambar 6.23 Pemberian Identitas Output File
g. Berikan identitas pada kolom “Run Title” (misalnya: Latihan analisis butir soal) Tampilanya seperti pada
gambar 6.24.
h. Jika semua data sukses terinput, maka siap dilakukan analisis. Dengan cara “Klik” icon “Run” Hasil yang
muncul pada folder, akan seperti pada gambar 6.25 berikut,
Keterangan:
Item = jumlah butir soal
Mean = rata-rata skor yang diperoleh oleh peserta tes
SD = standard deviasi menunjukkan simpangan baku dari nilai rata-rata.
Min Score = skor terendah dari nilai peserta tes
Max Score= skor tertinggi yang diperoleh peserta tes
Mean P = rata-rata tingkat kesukaran butir soal.
Mean Rpbis= rata-rata daya pembeda butir soal.
Mean P menunjukkan tingkat kesukaran dari tes tersebut. Nilai 0.571 berarti secara keseluruhan soal
tergolong sedang. Mean Rpbis menunjukkan daya pembeda dari tes ini. Nilai 0.097 berarti secara
keseluruhan soal memiliki daya pembeda yang buruk.
Reliability
Score Alpha SEM Split-Half Split-Half Split-Half S-B S-B First- S-B Odd-
(Random) (First-Last) (Odd-Even) Random Last Even
Scored items 0.399 2.298 0.273 0.018 0.054 0.429 0.035 0.102
Keterangan:
Alpha = nilai koefisien reliabilitas butir soal secara keseluruhan menurut KR-20.
SEM = kesalahan pengukuran standar untuk setiap tes/skala.
Split-Half = nilai koefisien reliabilitas butir soal secara keseluruhan menurut Belah Tengah
(random, first-last, dan odd-even).
S-B = kesalahan pengukuran standar untuk setiap tes/skala (random, first-last, dan odd-
even).
Mengacu pada kriteria di atas, “Alpha (KR – 20)” menunjukkan reliabilitas dari tes ini. SEM adalah
kesalahan pengukuran standar untuk setiap tes/skala. Nilai 0,399 berarti secara
keseluruhan soal memiliki reliabilitas yang rendah
Item statistics
N P Total Rpbis Total Rbis Alpha w/o
32 0.969 -0.043 -0.106 0.404
P menunjukkan tingkat kesukaran dengan nilai 0.969 berarti soal tersebut sangat mudah. Rpbis
menunjukkan daya pembeda dengan menggunakan koefisien korelasi point-biserial. Nilai -0.043
berarti soal tersebut memiliki daya pembeda yang buruk. Rbis juga menunjukkan indeks daya
pembeda soal dengan menggunakan koefisien korelasi biserial Alpha w/o menunjukkan reliabilitas
dengan nilai 0.404 berarti soal tersebut memiliki reliabilitas sedang.
Option statistics
Option N Prop. Rpbis Rbis Mean SD Color
A 0 0.000 -- -- -- -- Maroon
B 1 0.031 0.043 0.106 14.000 0.000 Green
C 31 0.969 -0.043 -0.106 14.290 3.180 Blue **KEY**
D 0 0.000 -- -- -- -- Olive
E 0 0.000 -- -- -- -- Gray
Omit 0
Not Admin 0
Prop menunjukkan keberfungsian distraktor. Distraktor A, B, D, dan E dengan nilai < 5% berarti
distraktor tersebut tidak baik (ditolak) maka perlu diganti. Daya pembeda Rbis=(-0,106) dan Rpbis=(-
0,043) menunjukkan keduanya bernilai negatif. Hal ini dapat diartikan bahwa siswa yang kurang
pintar (memperoleh skor rendah) cenderung menjawab benar soal ini dan siswa yang pintar cenderung
menjawab salah soal ini.
Kesimpulan Butir Soal No. 1
Tingkat kesukaran soal ini adalah 0,969. Soal ini masuk kategori sangat mudah, yakni sekitar 97%
siswa dapat menjawab soal dengan benar, sehingga masuk kategori buruk. Dengan daya pembeda
Rpbis=(-0,043) dan Rbis=(-0,106) menunjukkan keduanya bernilai negatif. Hal ini dapat diartikan
bahwa siswa yang kurang pintar (memperoleh skor rendah) cenderung menjawab benar soal ini dan
siswa yang pintar cenderung menjawab salah soal ini. Karena alternatif jawaban C merupakan kunci,
maka tanda negatif ini menunjukkan bahwa kunci jawaban belum berfungsi sebagaimana mestinya.
Kesimpulannya butir soal ini perlu ditinjau lagi dan sekiranya akan digunakan maka perlu direvisi.
Oleh karena itu yang perlu dilakukan guna merevisis soal ini anthra lain dengan memeriksa kembali
kunci jawaban. Jika ternyata kunci jawaban salah maka lakukan kembali analisis soal. Jika ternyata
kunci jawaban sudah benar maka kemungkinan kesalahan terletak padakesalahan penguasaan konsep
oleh peserta didik.
E. Kesimpulan
Buatlah interpretasi dari hasil keluaran Iteman dan berikan kesimpulan untuk masing-masing butir terkait
dengan kualitasnya.
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern
Dosen Pengampu:
Didik Setyawarno, M.Pd
SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN
ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 7
ANALISIS BUTIR SOAL DENGAN MENGGUNAKAN ANBUSO (APLIKASI BERBASIS EXCEL)
A. Tujuan
Mahasiswa mampu menganalisis butir soal dengan menggunakan aplikasi ANBUSO untuk
menentukan kualitas butir soal
B. Anbuso
Aplikasi AnBuso (Analisis Butir Soal) merupakan program analisis butir soal yang dikembangkan
secara sederhana untuk membantu dalam membuat administrasi guru, khususnya yang terkait
dengan analisis butir soal. AnBuso dikembangkan dengan program Microsoft Excel sehingga
mempermudah guru dalam menggunakannya. Program ini dapat dibuka secara langsung dengan
menggunakan Microsoft Excel 2007 ke atas. Ada beberapa alasan mengapa perlu menggunakan
AnBuso, di antaranya adalah:
• Sederhana programnya
• Mudah menggunakannya
• Compatible
• Praktis penggunaannya
• Tersedia untuk tes objektif dan essay
• Ada pengelompokan remedial
• Hasil analisis dalam format laporan
• Hasil analisis grafik tersedia
• Tidak berbayar (Free of Charge)
AnBuso pertama kali dibuat pada tahun 2011 dan terus dikembangkan sesuai dengan tuntutan
dan kebutuhan guru dalam melakukan analisis butir soal. Pada AnBuso versi 8 ini yang dikeluarkan
pada tahun 2017, ada perubahan yang dilakukan yakni
1. Jumlah peserta tes yang pada versi sebelumnya hanya terbatas pada maksimal 50 ditambah
menjadi maksimal 200 orang. Dengan demikian aplikasi ini dapat dimanfaatkan tidak hanya
untuk analisis per kelas melainkan juga untuk gabungan dari beberapa kelas sekaligus.
2. Menambahkan informasi tentang daya serap siswa untuk masing-masing tes dan daya serap
keseluruhan.
AnBuso yang dikembangkan dengan Microsoft Excel terdiri atas beberapa menu yang pada
prinsipnya dikelompokkan ke dalam empat bagian, yaitu:
1. Input data, yang meliputi:
a. Identitas, yang berisi identitas umum dan identitas tes.
b. Jawaban, yang berisi jawaban siswa.
2. Data dan Nilai, yang meliputi:
a. Objektif: Data Jawaban Soal Objektif
b. Isian: Data Jawaban Soal Isian Singkat
c. Essay: Skor Jawaban Soal Essay
d. Nilai: Daftar Nilai Siswa
3. Hasil Analisis Soal, yang meliputi:
a. Objektif: Hasil Analisis Soal Pilihan Ganda
b. Sebaran: Sebaran Jawaban Soal Pilihan Ganda
c. Isian: Hasil Analisis Soal Isian Singkat
d. Essay: Hasil Analisis Soal Essay
4. Remedial, yang meliputi:
a. Materi: Materi Remedial Klasikal dan Individual
b. Kelompok: Jadwal Pengelompokan Peserta Remedial
5. Grafik, yang meliputi:
a. Soal: Distribusi Nilai dan Ketuntasan Belajar
b. Peserta: Proporsi Ketuntasan Belajar
Input Data
Pengisian data dalam AnBuso dapat dilakukan pada Menu Input Data. Menu input data terdiri atas
Identitas dan Jawaban. Berikut penjelasannya.
Data yang perlu dimasukkan dalam menu Identitas meliputi:
Identitas Umum
Menu Identitas
1. Satuan Pendidikan
2. Mata Pelajaran
3. Kelas/Program
4. Nama Tes
5. Pokok Bahasan/Sub
6. Nama Guru
7. NIP
8. Semester
9. Tahun Pelajaran
10. Tanggal Tes.
Isikan tanggal pelaksanaan tes, misalnya 10 Agustus 2014
11. Tanggal Diperiksa
Isikan tanggal pemeriksaan tes (boleh dikosongkan), misalnya 15 Agustus 2014
12. Nama Kepala Sekolah
13. NIP Kepala Sekolah
14. Tempat Laporan.
Isikan kota lokasi sekolah, misalnya Yogyakarta
15. Tanggal Laporan
Isikan tanggal dibuatnya laporan tersebut, misalnya 20 Agustus 2014
16. Skala Penilaian (4, 10 atau 100).
Isikan 4 jika penilaian yang digunakan berkisar antara 0-4
Isikan 10 jika penilaian yang digunakan berkisar antara 0-10
Isikan 100 jika penilaian yang digunakan berkisar antara 0-100
17. Nilai KKM.
Pengisian nilai KKM harus menyesuaikan dengan skala penilaian yang diisikan.
Laporan Peserta
Jika semua data yang ada dalam menu Input Data sudah terisi maka output lainnya akan secara
otomatis terisi. Menu Laporan Peserta akan menghasilkan hal berikut ini.
Menu Laporan Objektif berisi Data Jawaban Soal Objektif yang siap dicetak. Data yang diberi
background warna merah menunjukkan jawaban siswa yang salah.
Menu Laporan Objektif
Menu Laporan Isian berisi Data Jawaban Soal Isian Singkat yang siap dicetak. Data yang diberi
background warna merah menunjukkan jawaban siswa yang salah.
Menu Laporan Essay, yang berisi Skor Jawaban Soal Essay (Gambar 6) yang siap dicetak.
Menu Laporan Nilai, berupa Daftar Nilai Siswa yang berisi tentang:
– Daftar peserta dan jenis kelaminnya
– Jumlah butir soal yang dijawab benar dan salah
– Skor dan nilai tes objektif dengan bobotnya
– Nilai tes essay dan bobotnya
– Nilai Akhir,
– Predikat. Penentuan predikat disesuaikan dengan nilai KKM yang ditentukan sekolah (Sesuai
dengan Permendikbud Nomor 53 Tahun 2015), sehingga rentangnya bisa berbeda-beda
tergantung nilai KKM. Contoh penentuan predikat dapat dilihat pada Tabel 1.
– Keterangan (Tuntas dan Tidak tuntas)
Tabel 1. Contoh Penentuan Predikat Penilaian
1. 86,7 – 100,0 A
2. 73,4 – 86,6 B
3. 60,0 – 73,3 C
4. < 60,0 D
Gambar 7. Tampilan Menu Laporan Nilai
– Keterangan lain yang terdiri dari jumlah peserta tes, Jumlah (persentase) peserta yang lulus
dan tidak lulus, serta nilai terendah, nilai tertinggi, nilai rata-rata dan standar deviasi
Menu Hasil Soal Objektif, berupa Hasil Analisis Butir Soal Pilihan Ganda yang berisi tentang:
– Daya Beda butir soal
Kriteria Daya Beda Butir Soal yang baik adalah jika koefisien daya beda melebihi 0,3 (Nunnally &
Bernstein, 2009: 304; Kaplan & Saccuzzo, 2005: 176; Azwar, 2003: 153). Sementara itu koefisien
antara 0,20 – 0,29 dianggap cukup baik (Alagumalai & Curtis, 2005: 8) dan koefisien di bawah 0,2
dianggap tidak baik sehingga perlu dibuang (Ebel & Frisbie, 1991: 232; Crocker & Algina, 2006:
315). Oleh karena itu kriteria daya beda yang digunakan seperti tertuang dalam Tabel 2.
Tabel 2. Kriteria Daya Beda Soal
Kategori Kriteria
Baik > 0,3
Cukup Baik 0,2 – 0,3
Tidak Baik < 0,2
– Tingkat Kesukaran
Kriteria tingkat kesukaran yang baik adalah berkisar antara 0,3 – 0,7 (Allen & Yen, 1979: 121;
Kaplan & Saccuzzo, 2005: 170; Sudjana, 2011: 137). Oleh karena itu dalam software ini digunakan
kriteria seperti pada Tabel 3.
Tabel 3. Kriteria Tingkat Kesulitan Soal
Kategori Kriteria
Mudah > 0,7
Sedang/baik 0,3 – 0,7
Sulit < 0,3
Menu Hasil Isian berupa Hasil Analisis Soal Isin Singkat yang berisi:
– Daya Beda butir soal
Kriteria sama dengan soal objektif
– Tingkat Kesukaran
Kriteria sama dengan soal objektif
– Kesimpulan Akhir:
Baik jika daya beda baik/cukup baik dan tingkat kesukaran sedang
Cukup Baik jika salah satu di antara daya beda dan tingkat kesukaran tidak memenuhi
syarat
Tidak baik jika daya beda dan tingkat kesukaran tidak memenuhi persyaratan
Menu Hasil Essay berupa Hasil Analisis Soal Essay yang berisi:
Menu Hasil Essay
– Daya Beda butir soal
Kriteria sama dengan soal objektif
– Tingkat Kesukaran
Kriteria sama dengan soal objektif
– Kesimpulan Akhir:
Kriteria sama dengan soal isian singkat
Gambar 11. Tampilan Menu Hasil Essay
Remedial
Menu ini menampilkan hasil analisis peserta tes yang belum tuntas. Materi apa saja yang perlu
diremidi dan pengelompokan remedial.
Menu Materi Remedial berupa Laporan Materi Remedial Individual dan Klasikal yang
menggambarkan materi apa saja yang perlu diremidi untuk setiap peserta didik. Menu ini berisi
tentang:
– Kompetensi dasar/materi yang tidak dikuasai secara individual. Remedial individual diberikan
jika peserta hanya mampu menjawab maksimal 55%.
– Kompetensi dasar/materi yang tidak dikuasai secara klasikal. KD dianggap tidak dikuasai
secara klasikal jika peserta tes yang mampu menjawab dengan benar kurang dari 15%.
Gambar 12. Tampilan Menu Materi Remedial
Menu Kelompok Remedial berupa Laporan Pengelompokan Peserta Remedial menurut kemampuan yang
diukur/materi. Dalam laporan tersebut terlihat daftar peserta yang belum menguasai untuk kemampuan
yang diukur tertentu.
Menu Grafik Soal ini berisi kualitas soal objektif dan essay dilihat dari daya beda, tingkat kesulitan dan kualitas
soal. Grafik ditampilkan dalam bentuk diagram lingkaran yang menggambarkan proporsi soal yang baik,
cukup baik dan tidak baik.
Menu Grafik Peserta ini berisi distribusi nilai menurut predikat dan ketuntasan belajar. Grafik ditampilkan
dalam bentuk diagram lingkaran, diagram batang dan diagram garis.