Anda di halaman 1dari 72

PANDUAN PRAKTIKUM TEORI RESPON BUTIR

Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu:
Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 1
ANALISIS VALIDITAS DAN RELIABILITAS BUTIR SECARA KLASIK

A. Tujuan
Mahasiswa mampu untuk menganalisis butir dari data politomi maupun dikotomi untuk menentukan nilai
validitas dan reliabilitasnya.

B. Dasar Teori
Validitas alat ukur adalah ketepatan alat ukur dengan hal yang diukur. Ada beberapa jenis
validitas alat ukur, yaitu: (1) Validitas isi (content validity), (2) validitas konstruksi (construct validity), (3)
validitas ramalan (predictive validity), dan (4) validitas sama saat (concurrent validity). Uji validitas secara
empiris dilakukan melalui uji coba instrument kepada responden.
Jika datanya berbentuk politomi misal data angket dan soal uraian, maka analisis validitas dilakukan
dengan menggunakan teknik korelasi Product Moment dengan rumus berikut.

𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
𝑟𝑥𝑦 =
√(𝑁 ∑ 𝑋 2 − (∑ 𝑋)2 )(𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 )

Keterangan:
N = banyaknya kasus atau sampel
X = skor butir tes
Y = skor total

Data yang berbentuk dikotomi misal data soal pilihan ganda dengan benar skor 1 dan salah skor 0,
maka analisis validitas dengan menggunakan teknik Korelasi Point Biserial, dengan rumus sebagai
berikut.
𝑀𝑝 − 𝑀𝑡 𝑝
𝑟𝑝𝑏𝑖 = √
𝑆𝑡 𝑞
Keterangan:
rpbi = koefisien korelasi point biserial
Mp = rerata skor dari subjek yang menjawab betul bagi butir yang dicari validitasnya
Mt = rerata skor total
st = standar deviasi dari skor total
p = proporsi peserta didik yang menjawab betul (banyaknya peserta didik yang
menjawab betul dibagi dengan jumlah seluruh peserta didik)
q = proporsi peserta didik yang menjawab salah (q = 1 – p)
Suatu butir tes dinyatakan valid jika nilai r hitung (rxy atau rpbi) lebih besar daripada r tabel dengan taraf
signifikansi atau taraf kekeliruan secara umum 5% (rhit > rtab dengan taraf signifikansi 5%), namun
beberapa ada yang menggunakan lebih ketat lagi yaitu 1%.

Reliabilitas alat ukur adalah keterandalan alat ukur atau keajegan alat ukur; artinya, kapanpun
alat ukur itu digunakan akan menghasilkan hasil ukur yang relatif tetap. Ada beberapa jenis reliabilitas,
yaitu: (1) konsistensi internal, (2) stabilitas, dan (3) ekuivalen. Reliabilitas konsistensi internal alat ukur dapat
dihitung dengan menggunakan rumus Koefisien Alpha-Cronbach, Kuder-Richardson (KR-20 atau KR-21),
dan Teknik Belah Dua.
KR-20 ini secara khusus untuk menghitung reliabilitas tes yang datanya dikotomi misalnya soal pilihan
ganda dengan skor benar 1 dan salah 0, dengan rumus sebagai berikut.

1
𝑘 𝑆𝐷𝑡2 − ∑ 𝑝𝑞
𝑟1.1 =( )( )
𝑘−1 𝑆𝐷𝑡2

Keterangan :
r1.1 = koefisien reliabilitas tes
p = proporsi testee yang menjawab betul
q = proporsi testee yang menjawab salah
n = banyaknya testee
SD2t = varian total tes
pq =pxq
k = banyak butir tes
Jika taraf kesulitan butir tes homogen, maka analisis yang digunakan adalah KR – 21, dengan rumus
sebagai berikut.
𝑘 𝑀(𝑘 − 𝑀)
𝑟1.1 = ( ) (1 − )
𝑘−1 𝑘. 𝑆𝐷𝑡2
Keterangan:
r1.1 = reliabilitas tes
M = rata-rata hitung
k = banyak butir
SD t2 = varian total tes
Varian merupakan kuadrat dari simpangan baku atau standar deviasi. Nilai standar deviasi dapat
dihitung dengan rumus sebagai berikut.
𝑛 ∑ 𝑋 2 − (∑ 𝑋)2
𝑆𝐷𝑡 = √
𝑛(𝑛 − 1)
Keterangan:
SDt = simpangan baku (standar deviasi)
n = jumlah responden

Jika datanya berbentuk politomi misal data angket atau soal uraian, maka digunakan rumus Alpha-
Cronbach, dengan rumus sebagai berikut.
𝑘 𝑆𝐷𝑡2 − ∑ 𝑆𝐷𝑖2
𝑟1.1 = ( )( )
𝑘−1 𝑆𝐷𝑡2
Keterangan :
r1.1 = koefisien reliabilitas perangkat tes
k = banyak butir tes
SDi2 = varians skor tiap butir (item)
2
SD =tot varian skor total
Untuk menentukan derajat reliabilitas tes, dapat digunakan kriteria sebagai berikut.
≤ 0,20 : sangat rendah
0,20 ≤ 0,40 : rendah
0,40 ≤ 0,60 : sedang
0,60 ≤ 0,80 : tinggi
0,80 ≤ 1,00 : sangat tinggi

2
C. Data Butir Soal dan Angket
1. Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 10 nomor dan
dikerjakan oleh 20 siswa
Nomor butir Tes Objektif
Responden 1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 1 1 1 1 1 1
2 0 0 0 0 0 0 0 1 0 0
3 0 0 0 0 0 0 0 0 0 0
4 1 0 1 1 1 1 1 1 0 1
5 0 1 1 1 0 0 0 0 0 0
6 1 1 1 1 1 1 1 1 1 0
7 0 1 0 0 1 0 0 1 1 0
8 1 1 0 0 1 1 1 1 1 1
9 0 1 1 0 0 0 0 0 0 0
10 1 1 1 0 1 1 1 0 0 1
11 1 1 1 1 0 1 1 1 1 1
12 0 1 0 0 1 1 0 0 0 0
13 0 0 0 0 0 0 0 0 0 0
14 1 1 0 1 1 1 1 0 1 1
15 1 1 1 1 1 1 1 1 1 1
16 0 1 1 1 0 0 1 1 1 1
17 0 1 1 1 0 0 0 1 0 1
18 1 1 1 1 1 1 1 1 1 1
19 0 0 1 1 0 0 1 0 0 1
20 0 1 1 0 1 1 0 0 1 1

2. Data jawaban dari angket (1 = sangat tidak setuju/ STS, 2 = tidak setuju/TS, 3 = netral/N, 4 =
setuju/S, dan 5 = sangat setuju/SS) yang terdiri dari 10 pernyataan dan diisi oleh 20 peserta
Nomor Butir Angket
Responden 1 2 3 4 5 6 7 8 9 10
1 3 4 3 2 4 3 3 3 3 3
2 2 4 3 4 4 3 4 4 4 3
3 4 4 4 3 4 4 4 4 4 4
4 3 4 4 3 3 3 3 3 3 3
5 2 3 2 4 3 4 2 4 2 3
6 4 3 4 4 4 4 5 5 5 5
7 3 3 4 4 4 3 3 4 3 4
8 4 4 3 4 4 4 4 4 3 5
9 3 4 3 4 5 4 3 3 4 4
10 2 4 4 2 3 3 2 3 4 3
11 2 3 4 3 2 4 2 2 4 2
12 3 2 1 4 5 4 3 3 4 4
13 4 3 2 5 4 4 4 3 2 4
14 4 4 3 4 4 4 4 4 3 4
15 3 4 4 3 3 4 3 4 4 4
16 4 4 4 4 4 4 3 4 5 3
17 3 3 4 4 4 4 2 4 4 4
18 4 4 5 4 5 3 2 4 5 4
19 3 5 4 5 5 4 2 5 4 3
20 3 5 4 5 5 4 2 5 4 3

3
D. Prosedur Kerja dan Alat Bantu
1. Gunakan rumus yang berlaku pada teori test klasik untuk menentukan tingkat validitas dan
reliabilitas yang sesuai dengan jenis data.
2. Gunakan bantuan aplikasi Ms. Excel untuk menghitungnya.
3. Buatlah tabel yang bisa membantu dalam menganalisisnya.
4. Bandingkan hasil hitungan dengan nilai tabel/ acuan untuk menentukan status butir.

E. Analisis Data dengan Aplikasi Excel


1. Analisis validitas butir objektif/ PG
Nomor butir Tes Objektif
Responden 1 2 3 4 5 6 7 8 9 10 Total
1 1 1 1 1 1 1 1 1 1 1
2 0 0 0 0 0 0 0 1 0 0
3 0 0 0 0 0 0 0 0 0 0
4 1 0 1 1 1 1 1 1 0 1
5 0 1 1 1 0 0 0 0 0 0
6 1 1 1 1 1 1 1 1 1 0
7 0 1 0 0 1 0 0 1 1 0
8 1 1 0 0 1 1 1 1 1 1
9 0 1 1 0 0 0 0 0 0 0
10 1 1 1 0 1 1 1 0 0 1
11 1 1 1 1 0 1 1 1 1 1
12 0 1 0 0 1 1 0 0 0 0
13 0 0 0 0 0 0 0 0 0 0
14 1 1 0 1 1 1 1 0 1 1
15 1 1 1 1 1 1 1 1 1 1
16 0 1 1 1 0 0 1 1 1 1
17 0 1 1 1 0 0 0 1 0 1
18 1 1 1 1 1 1 1 1 1 1
19 0 0 1 1 0 0 1 0 0 1
20 0 1 1 0 1 1 0 0 1 1
P
q
Rerata
Benar
Rerata
total
SD tot
rpbi
r tabel
Status Butir VALID

2. Analisis validitas butir angket


Nomor Butir Angket
Responden 1 2 3 4 5 6 7 8 9 10 Total
1 3 4 3 2 4 3 3 3 3 3
2 2 4 3 4 4 3 4 4 4 3
3 4 4 4 3 4 4 4 4 4 4
4 3 4 4 3 3 3 3 3 3 3
5 2 3 2 4 3 4 2 4 2 3
6 4 3 4 4 4 4 5 5 5 5
7 3 3 4 4 4 3 3 4 3 4
8 4 4 3 4 4 4 4 4 3 5
9 3 4 3 4 5 4 3 3 4 4
10 2 4 4 2 3 3 2 3 4 3
4
11 2 3 4 3 2 4 2 2 4 2
12 3 2 1 4 5 4 3 3 4 4
13 4 3 2 5 4 4 4 3 2 4
14 4 4 3 4 4 4 4 4 3 4
15 3 4 4 3 3 4 3 4 4 4
16 4 4 4 4 4 4 3 4 5 3
17 3 3 4 4 4 4 2 4 4 4
18 4 4 5 4 5 3 2 4 5 4
19 3 5 4 5 5 4 2 5 4 3
20 3 5 4 5 5 4 2 5 4 3
Kore-
lasi
r tabel
Status VALID

3. Analisis reliabilitas butir soal objektif/ PG


Nomor butir Tes Objektif (yang dimasukkan adalah butir yang valid)
Responden No. Soal No. Soal No. Soal No. Soal No. Soal No. Soal Total
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Banyak
butir k
P
q
pq
Sigma pq
Varians
total
KR-20

4. Analisis reliabilitas butir angket


Nomor butir angket (yang dimasukkan adalah butir yang valid)
Responden No.Butir No.Butir No.Butir No.Butir No.Butir No.Butir No.Butir Total
1
2
3
4
5
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
k
Var total
Var butir
Sigma
varbut
Alpha-
Cronbach

F. Kesimpulan
Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.

6
LAMPIRAN 1.
TABEL NILAI-NILAI r PRODUCT MOMENT/POINT BISERIAL

Taraf Signifikansi Taraf Signifikansi Taraf Signifikansi


N N N
5% 1% 5% 1% 5% 1%
3 0,997 0,999 27 0,381 0,487 55 0,266 0,345
4 0,950 0,990 28 0,374 0,478 60 0,254 0,330
5 0,878 0,959 29 0,367 0,470 65 0,244 0,317

6 0,811 0,917 30 0,361 0,463 70 0,235 0,306


7 0,754 0,874 31 0,355 0,456 75 0,227 0,296
8 0,707 0,834 32 0,349 0,449 80 0,220 0,286
9 0,666 0,798 33 0,344 0,442 85 0,213 0,278
10 0,632 0,765 34 0,339 0,436 90 0,207 0,270

11 0,602 0,735 35 0,334 0,430 95 0,202 0,263


12 0,576 0,708 36 0,329 0,424 100 0,195 0,250
13 0,553 0,684 37 0,325 0,418 125 0,176 0,230
14 0,532 0,661 38 0,320 0,413 150 0,159 0,210
15 0,514 0,641 39 0,316 0,408 175 0,148 0,194

16 0,497 0,623 40 0,312 0,403 200 0,138 0,181


17 0,482 0,606 41 0,308 0,398 300 0,113 0,148
18 0,468 0,590 42 0,304 0,393 400 0,098 0,128
19 0,456 0,575 43 0,301 0,389 500 0,088 0,115
20 0,444 0,561 44 0,297 0,384 600 0,080 0,105

21 0,433 0,549 45 0,294 0,380 700 0,074 0,097


22 0,423 0,537 46 0,291 0,376 800 0,070 0,091
23 0,413 0,526 47 0,288 0,372 900 0,065 0,086
24 0,404 0,515 48 0,284 0,368 1000 0,062 0,081
25 0,396 0,505 49 0,281 0,364
26 0,388 0,496 50 0,279 0,361

7
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu:
Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 2
ANALISIS TARAF KESUKARAN DAN DAYA BEDA BUTIR SOAL DAN TES

A. Tujuan
Mahasiswa mampu untuk menganalisis butir soal pilihan ganda (data dikotomi) untuk menentukan indek
daya beda dan taraf kesukaran butir soal dan instrumen.

B. Dasar Teori
1. Taraf Kesukaran
Taraf kesukaran tes adalah kesulitan tes dipandang dari kemampuan peserta didik untuk menjawab soal
yang digunakan untuk tes; artinya, tes tersebut akan lebih banyak dapat dijawab benar oleh peserta
didik yang pandai dan lebih banyak dijawab salah oleh peserta didik yang bodoh. Tingkat kesukaran
butir tes merupakan bilangan yang menunjukkan proporsi peserta ujian (testee) yang dapat menjawab
betul butir soal tersebut. Sedangkan tingkat kesukaran perangkat tes adalah bilangan yang menunjukkan
rata-rata proporsi testee yang dapat menjawab seluruh (perangkat) tes tersebut. Rumus tingkat kesukaran
instrumen tes untuk soal bentuk pilihan ganda maupun uraian sebagai berikut.
∑ 𝑃𝑖
𝑃𝑝 =
𝑛
Keterangan :
Pp = tingkat kesukaran perangkat tes
P = tingkat kesukaran tiap butir
n = banyaknya butir tes

Tingkat kesukaran tiap butir soal berbentuk pilihan ganda, dihitung dengan rumus :
𝑛𝐵
𝑃𝑖 =
𝑛
Keterangan :
Pi = tingkat kesukaran butir tes pilihan ganda nomor i
nB = banyaknya subyek yang menjawab soal dengan betul
n = jumlah subyek (testee) seluruhnya

Pada tingkat kesukaran soal tes esai/uraian, dihitung dengan menggunakan rumus:
𝑥̅𝑖
𝑃𝑖 =
𝑠𝑚

Keterangan :
Pi = tingkat kesukaran butir tes uraian nomor i
𝑥̅𝑖 = rata-rata skor butir soal
sm = skor maksimal setiap butir yang ditetapkan

Kriteria tingkat kesukaran (P) :


0,00 – 0,30 = sukar
0,31 – 0,70 = sedang*
0,71 – 1,00 = mudah

Referesni lain ada yang menyatakan bahwa tes yang baik adalah tes yang memiliki taraf kesukaran
antara 0,25 – 0,75.

1
2. Daya Beda
Daya pembeda tes adalah kemampuan tes untuk membedakan antara peserta didik yang pandai
(kelompok atas) dan bodoh (kelompok bawah); artinya, jika tes tersebut diberikan kepada anak yang
tergolong pandai akan lebih banyak dapat dijawab dengan benar, sedangkan jika diberikan kepada
peserta didik yang tergolong bodoh akan lebih banyak dijawab salah. Daya pembeda tes yang baik
adalah antara 20% - 80% atau antara 30% - 70%. Daya beda butir tes ialah kemampuan butir tes
tersebut membedakan antara testee kelompok atas (pinter) dan testee kelompok bawah (lemah). Daya
beda perangkat tes adalah rata-rata kemampuan tiap butir tes membedakan antara testee kelompok
atas (pinter) dan testee kelompok bawah (lemah). Rumus untuk menghitung tingkat daya beda tes
berbentuk pilihan ganda atau uraian sebagai berikut.
∑(𝑃𝐴 − 𝑃𝐵 ) ∑ 𝐷𝑖
𝐷𝑝 = =
𝑛 𝑛
Keterangan :
Dp = Daya beda instrumen tes
n = jumlah butir tes

Rumus untuk menghitung daya beda butir tes berbentuk pilihan ganda adalah sebagai berikut :
𝑛 𝑛
𝐷𝑖 = 𝑛𝐵𝐴 − 𝑛𝐵𝐵 atau 𝐷𝑖 = 𝑃𝐴 − 𝑃𝐵
𝐴 𝐵
Keterangan:
Di = Daya beda butir soal nomor i
nBA = jumlah subyek yang menjawab betul pada kelompok atas
nBB = jumlah subyek yang menjawab betul pada kelompok bawah
nA = jumlah subyek kelompok atas
nB = jumlah subyek kelompok bawah

Rumus untuk menghitung daya beda butir tes berbentuk uraian adalah sebagai berikut :
𝑥̅𝑖 − 𝑥̅𝑖 𝐵
𝐷𝑖 = 𝐴
𝑠𝑚
Keterangan:
Di = Daya beda butir soal nomor i
𝑥̅𝑖 𝐴 = rata-rata skor kelompok atas pada butir soal nomor i
𝑥̅𝑖 𝐵 = rata-rata skor kelompok bawah pada butir soal nomor i
sm = skor maksimal setiap butir yang ditetapkan

Kriteria Daya Beda (D) :


0,00 – 0,19 = kurang baik
0,20 – 0,39 = cukup baik
0,40 – 0,70 = baik
0,71 – 1,00 = sangat baik
* Jika “D” negatif, soal tersebut sangat buruk dan harus dibuang.

2
C. Data Butir Soal
1. Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 10 nomor dan
dikerjakan oleh 20 siswa
Nomor butir Tes Objektif
Responden 1 2 3 4 5 6 7 8 9 10
1 1 1 1 1 1 1 1 1 1 1
2 0 0 0 0 0 0 0 1 0 0
3 0 0 0 0 0 0 0 0 0 0
4 1 0 1 1 1 1 1 1 0 1
5 0 1 1 1 0 0 0 0 0 0
6 1 1 1 1 1 1 1 1 1 0
7 0 1 0 0 1 0 0 1 1 0
8 1 1 0 0 1 1 1 1 1 1
9 0 1 1 0 0 0 0 0 0 0
10 1 1 1 0 1 1 1 0 0 1
11 1 1 1 1 0 1 1 1 1 1
12 0 1 0 0 1 1 0 0 0 0
13 0 0 0 0 0 0 0 0 0 0
14 1 1 0 1 1 1 1 0 1 1
15 1 1 1 1 1 1 1 1 1 1
16 0 1 1 1 0 0 1 1 1 1
17 0 1 1 1 0 0 0 1 0 1
18 1 1 1 1 1 1 1 1 1 1
19 0 0 1 1 0 0 1 0 0 1
20 0 1 1 0 1 1 0 0 1 1

2. Data jawaban dari soal uraian dengan skor maksimal seragam (minimal 0 dan maksimal 5) dari 10
butir soal uraian yang diisi oleh 20 peserta
Nomor Butir Uraian
Responden 1 2 3 4 5 6 7 8 9 10
1 3 4 3 2 4 3 3 3 3 3
2 2 4 3 4 4 3 4 4 4 3
3 4 4 4 3 4 4 4 4 4 4
4 3 4 4 3 3 3 3 3 3 3
5 2 3 2 4 3 4 2 4 2 3
6 4 3 4 4 4 4 5 5 5 5
7 3 3 4 4 4 3 3 4 3 4
8 4 4 3 4 4 4 4 4 3 5
9 3 4 3 4 5 4 3 3 4 4
10 2 4 4 2 3 3 2 3 4 3
11 2 3 4 3 2 4 2 2 4 2
12 3 2 1 4 5 4 3 3 4 4
13 4 3 2 5 4 4 4 3 2 4
14 4 4 3 4 4 4 4 4 3 4
15 3 4 4 3 3 4 3 4 4 4
16 4 4 4 4 4 4 3 4 5 3
17 3 3 4 4 4 4 2 4 4 4
18 4 4 5 4 5 3 2 4 5 4
19 3 5 4 5 5 4 2 5 4 3
20 3 5 4 5 5 4 2 5 4 3

3
D. Prosedur Kerja dan Alat Bantu
1. Gunakan rumus yang berlaku pada teori test klasik untuk menentukan tingkat kesukaran perangkat tes,
tingkat kesukaran butir tes, daya beda perangkat tes, dan daya beda butir tes yang sesuai dengan
jenis data.
2. Gunakan bantuan aplikasi Ms. Excel untuk menghitungnya.
3. Buatlah tabel yang bisa membantu dalam menganalisisnya.
4. Bandingkan hasil hitungan dengan nilai tabel/ acuan untuk menentukan status butir.

E. Analisis Data dengan Aplikasi Excel


1. Analisis tingkat kesukaran dan daya beda butir objektif/ PG
Nomor butir Tes Objektif
Responden 1 2 3 4 5 6 7 8 9 10 Total
Data
diurutkan
dari total
skor
tertinggi ke
terendah
(1-10 atau
setengah
dari jumlah
peserta tes
adalah
kelompok
atas)
11-20 atau
setengah
dari jumlah
peserta tes
berikutnya
adalah
kelompok
bawah

Kelompok
atas
menjawab
benar
Kelompok
bawah
menjawab
benar
Jumlah
benar pada
semua
kelompok
Tingkat
Kesukaran
Daya Beda
Kualitas
Butir Baik

4
1. Analisis tingkat kesukaran dan daya beda soal uraian
Nomor butir Tes Objektif
Responden 1 2 3 4 5 6 7 8 9 10 Total
Data
diurutkan
dari total
skor
tertinggi ke
terendah
(1-10 atau
setengah
dari jumlah
peserta tes
adalah
kelompok
atas)
11-20 atau
setengah
dari jumlah
peserta tes
berikutnya
adalah
kelompok
bawah

Rata-rata
kelompok
atas
menjawab
benar
Rata-rata
kelompok
bawah
menjawab
benar
Rata-rata
menjawab
benar pada
semua
kelompok
Tingkat
Kesukaran
Daya Beda
Kualitas
Butir Baik

F. Kesimpulan
Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.

5
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu:
Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 3
ANALISIS DISTRAKTOR/ KEBERFUNGSIAN PENGECOH DAN INDEK SENSITIVITAS BUTIR

A. Tujuan
Mahasiswa mampu untuk menganalisis distraktor atau keberfunsian pengecoh pada butir soal pilihan
ganda dan indek sensitivitas butir.

B. Dasar Teori
1. Distraktor atau Pengecoh
Pengecoh atau distractor yang baik adalah pengecoh yang dapat mengecoh peserta didik untuk memilih
jawaban pada butir soal; artinya, pengecoh tersebut dapat mengecoh peserta didik atau paling sedikit
pengecoh tersebut dipilih oleh 2% atau 3% dari peserta tes. Pengecoh yang baik (efektif) ialah pengecoh
yang dipilih oleh minimal 2-3% dari pengikut tes (ada beberapa referensi mengatakan minimal 5% sudah
dikatakan efektif). Berikut diberikan contoh cara menghitung efektifitas pengecoh untuk 1 butir tes objektif
yang memiliki 4 option a,b,c, dan d.
Pilihan A* B C D *kunci
Kelompok atas 2 6 0 1 10
Kelompok bawah 6 1 0 4 10
A
Jumlah 8 7 0 5 20
Jumlah (%) 40% 35% 0% 25% 100%

Kunci jawaban betul untuk soal di atas adalah pilihan jawaban (A). Pilihan jawaban b, c, dan d sebagai
pengecoh. Pada umumnya sebuah pengecoh yang baik dapat mengundang jawaban lebih besar
jumlahnya pada peserta didik kelompok lemah, dan lebih sedikit pada kelompok pandai. Pilihan jawaban
b, sebagai pengecoh tidak efektif, sebab menarik jawaban lebih banyak dari kelompok peserta didik
pandai. Kejadian itu disebabkan karena distractor (b) membingungkan. Pilihan jawaban c sama sekali
tidak efektif, karena tidak dapat menarik jawaban seorangpun. Pilihan jawaban d dipandang telah
memenuhi fungsinya, sebab dapat mengundang jawaban oleh peserta didik kelompok pandai yang lebih
stedikit.
2. Indek Sensitivitas Tes
Indeks sinsitivitas butir pada dasarnya merupakan ukuran seberapa baik butir soal atau perangkat tes
untuk membedakan antara siswa yang telah dan yang belum mengikuti kegiatan pembelajaran. Prosedur
penentuan sensitivitas pembelajaran dengan cara memberikan pre-test dan post-test kepada kelompok
siswa yang sama. Rumus untuk menghitung indek sensitivitas adalah selisih dari jumlah peserta didik yang
menjawab benar butir soal atau item sesudah proses pembelajaran (posttest) dengan jumlah peserta didik
yang menjawab benar butir soal atau item sebelum proses pembelajaran (pretest). Dengan demikian
sensitivtas instrumen tes merupakan rerata dari sensitivitas setiap butir soal yang ada di instrumen tes dan
dapat dihitung dengan rumus sebagai berikut.
∑ 𝑠𝑖
𝑠𝑝 =
𝑛
Keterangan
sp = indek sensitivitas perangkat tes
si = indek sensitivitas butir soal atau item
n = jumlah butir soal di perangkat tes
Indeks sensitivitas butir soal pilihan ganda dengan skor benar 1 dan salah 0 dapat dihitung dengan
menggunakan rumus berikut.
𝑟𝐴 − 𝑟𝐵
𝑠𝑖 =
𝑡
1
Keterangan
si = indek sensitivitas butir soal atau item nomor i
t = jumlah siswa yang mengikuti tes
rA = jumlah peserta didik yang menjawab benar butir soal atau item sesudah proses
pembelajaran (posttest)
rB = jumlah peserta didik yang menjawab benar butir soal atau item sebelum proses
pembelajaran (pretest)
Indeks sensitivitas butir soal uraian dengan skor maksimal sm dapat dihitung dengan menggunakan rumus
berikut.
𝑥𝐴 − ̅̅̅
̅̅̅ 𝑥𝐵
𝑠𝑖 =
𝑠𝑚
Keterangan
si = indek sensitivitas butir soal atau item nomor i
sm = jumlah skor maksimal butir
xA = jumlah peserta didik yang menjawab benar butir soal atau item sesudah proses
pembelajaran (posttest)
xB = jumlah peserta didik yang menjawab benar butir soal atau item sebelum proses
pembelajaran (pretest)
Indeks sensitivitas butir yang efektif berada di antara 0,00 – 1.00. Semakin besar indeks sensitivitas butir
menunjukkan semakin besar keberhasilan pembelajarannya.

C. Data Butir Soal


1. Data jawaban dari soal objektif (pilihan ganda: benar 1, salah 0) yang terdiri dari 5 nomor dan
dikerjakan oleh 16 siswa.
NOMOR SOAL
SISWA
1 2 3 4 5
1 A B C A C
2 B C B C D
3 B A B C D
4 A B B C A
5 A B C A C
6 B B B C A
7 A B C A A
8 A C B D A
9 A C A C A
10 A B A C A
11 A B B C A
12 A B C A C
13 B B B C A
14 A B C A A
15 A C B D A
16 B C B C D

Adapun kunci jawaban untuk butir soal di atas sebagai berikut.


No Kunci
2
1 A
2 B
3 B
4 C
5 D

2. Data pretest dan posttest dari soal berbentuk uraian dengan skor maksimal setiap item 3.
Jawaban Butir Soal Pretest Jawaban Butir Soal Postest
Siswa Siswa
1 2 3 4 5 1 2 3 4 5
1 1 2 1 0 0 1 1 2 2 2 2
2 2 2 1 0 1 2 1 2 2 2 0
3 1 1 2 2 1 3 1 1 0 2 2
4 1 1 1 1 1 4 2 2 2 0 2
5 1 1 2 2 1 5 1 2 2 2 1
6 1 2 1 1 2 6 2 2 1 2 2
7 1 0 2 0 2 7 1 0 2 2 2
8 1 2 0 2 2 8 1 2 2 2 2
9 1 2 1 1 0 9 1 2 0 2 2
10 1 1 2 2 1 10 1 2 2 2 1
11 1 2 1 1 2 11 2 0 1 2 2
12 1 2 1 0 0 12 0 2 2 0 2
13 1 1 2 2 1 13 2 2 2 2 1
14 1 2 1 1 1 14 2 1 1 2 2
15 1 0 2 2 2 15 2 2 2 1 2
16 1 2 1 2 2 16 0 2 2 2 1
17 1 2 1 1 0 17 2 1 0 2 2
18 1 2 1 0 0 18 2 2 2 0 0
19 1 1 0 1 1 19 2 2 0 2 2
20 1 2 0 1 1 20 2 2 2 2 2

3. Data pretest dan posttest dari soal berbentuk pilihan ganda dengan skor benar 1 dan salah 0.
Jawaban Butir Soal Pretest Jawaban Butir Soal Posttest
Siswa Siswa
1 2 3 4 5 1 2 3 4 5
1 0 1 1 0 1 1 1 1 1 1 1
2 1 1 1 0 1 2 1 1 1 1 1
3 0 1 0 1 0 3 1 1 1 1 1
4 1 0 1 1 1 4 1 1 1 1 1
5 1 1 1 1 1 5 0 1 1 0 1
6 0 1 0 1 0 6 1 1 0 1 1
7 1 1 0 1 1 7 1 1 1 1 1
8 0 1 1 0 1 8 1 1 1 1 1
9 1 1 0 1 1 9 0 1 0 1 0
10 1 1 0 1 1 10 1 1 1 1 1
11 1 1 1 1 0 11 1 1 1 1 1
3
12 0 1 0 1 0 12 1 0 1 1 1
13 1 0 1 1 1 13 0 1 1 0 1
14 1 1 0 1 1 14 1 1 1 1 1
15 1 1 1 1 0 15 1 1 1 1 1
16 0 1 1 0 1 16 1 1 1 1 1
17 1 0 1 1 1 17 1 1 1 0 1
18 1 1 1 1 0 18 1 1 1 1 1
19 0 1 1 0 1 19 1 1 1 1 0
20 0 1 0 1 0 20 1 0 1 1 1

D. Prosedur Kerja dan Alat Bantu


1. Analisis Distraktor
a. Koreksilah jawaban siswa dengan kunci jawaban dan berilah skor yang benar 1 dan yang salah 0.
b. Buatlah tabel yang bisa membantu dalam menganalisisnya.
c. Jumlahkan skor yang diperoleh oleh setiap siswa dan bagilah menjadi dua kelompok atas dan bawah.
d. Hitunglah distribusi jawaban setiap siswa untuk setiap butir soal dan nyatakan dalam prosentase.
e. Bandingkan hasil hitungan dari distribusi jawaban dengan acuan untuk menentukan status
keberfungsian pengecoh.
2. Analisis Indek Sensitivitas Butir
a. Gunakan rumus yang berlaku untuk menghitung indek sensitivitas butir dan perangkat butir dengan
bantuan aplikasi excel
b. Buatlah tabel yang bisa membantu dalam menganalisisnya.
c. Hitunglah indek sensitivitas setiap butir dan perangkat instrument baik soal bentuk pilihan ganda
maupun uraian.
d. Bandingkan indeks sensitivitas butir yang telah dihitung dengan kriteria bahwa butir yang efektif
berada di antara 0,00 – 1.00. Semakin besar indeks sensitivitas butir menunjukkan semakin besar
keberhasilan pembelajarannya.

E. Analisis Data dengan Aplikasi Excel


1. Analisis kelompok atas dan bawah untuk butir objektif/ PG
Nomor butir Tes Objektif
Responden Total
1 2 3 4 5 6 7 8 9 10
Data diurutkan dari total
skor tertinggi ke
terendah (1-10 atau
setengah dari jumlah
peserta tes adalah
kelompok atas)

11-20 atau setengah


dari jumlah peserta tes
berikutnya adalah
kelompok bawah

4
Analisis keberfungsian pengecoh pada butir PG
No Butir Pilihan A B* C D *kunci
1 Kelompok atas
Kelompok bawah
Jumlah
Kesimpulan
2 Kelompok atas
Kelompok bawah
Jumlah
Kesimpulan
DAN SETERUSNYA

2. Data pretest dan posttest dari soal berbentuk uraian dengan skor maksimal setiap item 3.
Jawaban Butir Soal Pretest Jawaban Butir Soal Postest
Siswa Siswa
1 2 3 4 5 1 2 3 4 5
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
11 11
12 12
13 13
14 14
15 15
16 16
17 17
18 18
19 19
20 20
xB xA
si
sp

3. Data pretest dan posttest dari soal berbentuk pilihan ganda dengan skor benar 1 dan salah 0.
Jawaban Butir Soal Pretest Jawaban Butir Soal Posttest
Siswa Siswa
1 2 3 4 5 1 2 3 4 5
1 1
2 2
3 3
5
4 4
5 5
6 6
7 7
8 8
9 9
10 10
11 11
12 12
13 13
14 14
15 15
16 16
17 17
18 18
19 19
20 20
rB rA
rA-rB
si
sp

F. Kesimpulan
Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.

6
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu:
Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 4
PENENTUAN INDEKS PERSETUJUAN KAPPA

A. Tujuan
Mahasiswa mampu untuk menghitung indeks persetujuan dan indeks Kappa dalam menganalisis instrument
butir soal baik dengan dua kali pelaksanaan tes maupun dengan sekali pelaksanaan tes.

B. Dasar Teori
1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes
Indeks keandalan yang direkomendasikan untuk tes beracuan kriteria adalah (a) koefisien persetujuan
(agreement coefficient), (b) koefisien kappa. Dua koefisien ini mengukur konsistensi dari klasifikasi berhasil-
gagal (mastery-nonmastery) antarkedua pelaksanaan ujian atau pengadministrasian tes. Indeks tersebut
memerlukan interpretasi yang berbeda dibanding koefisien keterandalan tradisional KR 20, KR 21, atau
Alpha-Cronbach yang menggunakan koefisien korelasi skor butir dengan skor total. Pengklasifikasian
berhasil-gagal pada kedua pelaksanaan tes dan pengadministrasian tes dapat diringkas sebagaimana pada Tabel
1.
Tabel 1. Klasifikasi Penempuh Ujian di Dua Pelaksanaan Tes
Pelaksanaan Tes 2
Berhasil Gagal
Pelaksanaan Tes 1 Berhasil A B (A + B)
Gagal C D (C + D)
(A + C) (B + D) N

Koefisien persetujuan adalah proporsi penempuh tes yang secara konsisten tergolongkan ke dalam
kelompok yang berhasil dan yang gagal dari kedua-dua pengadministrasian pengujian tes. Koefisien
persetujuan menunjuk nilai po yang dihitung dengan rumus sebagai berikut.
( 𝑨 + 𝑫)
𝒑𝒐 =
𝑵
Keterangan:
A = jumlah penempuh tes kelompok yang berhasil di kedua pengadministrasi tes
D = jumlah penempuh tes kelompok yang gagal di kedua pengadministrasi tes
N = jumlah peserta tes di kedua pengadministrasian tes
Batas atas dari koefisien persetujuan adalah 1,00, yang tercapai jika klasifikasi-klasifikasi di kedua-dua
pengadministrasian tes bersifat konsisten untuk semua penempuh tes dimasing-masing kelompok. Batas
bawah dari koefisien persetujuan dapat dihitung dengan rumus sebagai berikut.
[( 𝑨 + 𝑩)(𝑨 + 𝑪) + ( 𝑪 + 𝑫)(𝑩 + 𝑫)]
𝒑𝒄𝒉𝒂𝒏𝒄𝒆 =
𝑵𝟐
Keterangan:
B = jumlah penempuh tes kelompok yang berhasil di pengadministrasi tes pertama tetapi
gagal di pengadministrasi tes kedua
C = jumlah penempuh tes kelompok yang gagal di kedua pengadministrasi tes pertama tetapi
berhasil di pengadministrasi tes kedua
Batas bawah (pchance) merupakan proporsi klasifikasi-klasifikasi yang konsisten secara kebetulan jika hasil
mastery-nonmastery pada pengadministrasian tes yang kedua dengan sepenuhnya tidak terikat pada
pengadministrasin tes yang pertama dimana besarnya pchance ≥ 0,50. Koefisien kappa (K) dapat dihitung
dengan rumus sebagai berikut.

1
𝒑𝒐 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆
𝑲 =
𝟏 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆
Koefisien kappa merupakan proporsi klasifikasi-klasifikasi yang konsisten yang sesuai dengan harapan
dan yang secara kebetulan. Batas atas dan batas bawah dari koeifisen kappa adalah 1,00 dan 0,00,
yang terjadi ketika hasil-hasil pada kedua pengadministrasian tes bertutur-turut di dalam persetujuan yang
sempurna atau bebas secara penuh.

2. Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes


Penentuan indeks persetujuan dan indeks Kappa dengan satu pengadministrasian tes dapat dilakukan
dengan menggunakan tabel nilai taksiran (Approximate Values) dari koefisien persetujuan (Agreement
Coefficient) dan nilai taksiran (Approximate Value) dari Koefisien Kappa (Kappa Coefficient)
sebagaimana Tabel 2 dan Tabel 3 terlampir. Prosedur yang harus dilakukan dengan metode ini yaitu:
a. menghitung nilai standard score atau z score (z) dari skor penggalan (cutoff score) dari tes yang
dinyatakan sebagai suatu skor patokan/ kriteria
b. menghitung nilai reliabilitas tradisional KR 20, KR 21, atau Alpha-Cronbach (r)
Nilai hitung dari standard score atau z score (z) dan r dapat dihitung dari data yang sudah diadministrasi
dalam satu kali pelaksanaan. Nilai (z) dapat dihitung dengan menggunakan persamaan berikut.
𝑐 − 0,5 − 𝑥̅
|𝑧| =
𝑆𝐷
Keterangan:
c = skor penggalan mentah dari tes
𝑥̅ = skor rata-rata yang diperoleh siswa
𝑆𝐷 = simpangan baku
Nilai 0,5 pada persamaan diatas merupakan suatu koreksi kekontinuan yang dibangun dari fakta dalam
tables nilai taksiran (Approximate Values) dari koefisien persetujuan (Agreement Coefficient) dan nilai
taksiran (Approximate Value) dari Koefisien Kappa (Kappa Coefficient) yang diperoleh dengan
memperkirakan skor tes mengikuti distribusi diskret untuk diubah menjadi distribusi normal yang kontinum.
Distribusi z hasil perhitungan berbentuk distribusi normal dan menggunakan tanda mutlak, sehingga
besarnya koefisien persetujuan atau koefisien kappa selalu bernilai positif. Jadi, dengan memberikan
tanda mutlak untuk z dapat menggunakan Tabel 3 dan 4. Keandalan skor tes r, yang muncul di
dalam Tabel 2 dan 3, dapat diperoleh dengan menggunakan indeks reliabilitas tradisional seperti
koefisien keandalan Kuder- Richardson (K-R) atau alfa-Cronbach.
Tabel 2. Nilai Taksiran dari Koefisien Persetujuan
Reliabilitas Tradisional (r)
IzI
.10 .20 . 3 0 .40 .50 .60 .70 80 .90
.00 .53 .56 .60 .63 .67 .70 .75 .80 .86
.10 .53 .57 .60 .63 .67 .71 .75 .80 . 8 6
.20 .54 .57 .61 .64 .67 .71 .75 .80 .86
.30 .56 .59 .62 .65 .68 .72 .76 . 8 0 .86
.40 .58 .60 .63 .66 .69 .73 .77 .81 . 8 7
.50 .60 .62 .65 .68 .71 .74 .78 .82 .87
.60 .62 .65 .67 .70 .73 .76 .79 .83 .88
.70 65 .67 .70 .72 .75 .77 .80 .84 .89
.80 .68 .70 .72 .74 .77 .79 .82 .85 .90
.90 .7I .73 .75 .77 .79 .81 .84 .87 .90
1.00 .75 .76 .77 .77 .81 .83 .85 .80 .91

2
1.10 .78 .79 .80 .81 .83 .85 .87 .89 .92
1.20 .80 .81 .62 .84 .85 .86 .88 .90 93
1.30 .83 .84 85 .86 .67 .88 .90 .91 .94
1.40 .86 .86 .87 .88 .89 .90 .91 .93 .95
1.50 .88 . 8 8 .89 .90 .90 .91 .97 .94 .95
1.60 .90 .90 .90 .91 .92 .93 .93 .95 .96
1.70 .92 .92 .92 .93 .93 .94 95 .95 .97
1.80 .93 .93 .94 .94 .94 .95 .95 .96 .97
1.90 .95 .95 .95 .95 .95 .96 .96 .97 .98
2.00 .96 .96 .96 .96 .96 .97 .97 .97 .98

Tabel 3. Nilai Taksiran dari Koefisien Kappa


Reliabilitas Tradisional (r)
|z|
.10 .20 .30 .40 .50 .60 .70 .8O .90
.00 .06 .13 .19 .26 .33 .41 .49 .59 .71
.10 .06 .13 .19 .26 .33 .41 .49 .59 .71
.20 .06 .13 .19 .26 .33 41 .49 .59 .71
.30 .06 .12 .19 .26 .33 .40 .49 .59 .71
.40 .06 .12 .19 .25 .32 .40 .48 .58 .71
.50 .06 .12 .18 .25 .32 .40 .48 .58 .70
.60 .06 .12 .18 .24 .31 .39 .47 .57 .70
.70 .05 .11 .17 .24 .31 .38 .47 .57 .70
.60 .05 .11 .17 .23 .30 .37 .46 .56 .69
.90 .05 .10 .16 .22 .29 .36 .45 .55 .68
1.00 .05 .10 .15 .21 .28 .35 .44 .54 .68
1.10 .04 .09 .14 .20 .27 .34 .43 .53 .67
1.20 .04 .08 .14 .19 .26 .33 .42 .52 .66
1.10 .04 .08 .13 .18 .25 .32 .41 .51 .65
1.40 .03 .07 .12 .17 .23 .31 .39 .50 .64
1.50 .03 .07 .11 .16 .22 .29 .30 .49 .63
1.60 .03 .06 .10 .15 .21 .28 .37 .47 .62
1.70 .02 .05 .09 .14 .20 .27 .35 .46 .61
1.90 .02 .05 .08 .13 .16 .25 .34 .45 .60
1.90 .02 .04 .08 .12 .17 .24 .32 .43 .59
2.00 .02 .04 .07 .11 .16 .22 .31 .42 .58

3. Interpretasi koefisien persetujuan (agreement coefficient) dan koefisien kappa


Suatu tes dikatakan memiliki keandalan yang baik adalah jika memiliki koefisien persetujuan po ≥ 0,86
meskipun demikian juga bergantung pada penempatan skor penggalan sebagai skor patokan dan skor
rata-rata yang diperoleh dari tes yang bersangkutan. Nilai po = 0,86 berpasangan dengan situasi di
mana harga |z| = 0,00, yang menyiratkan bahwa separuh dari penempuh ujian adalah menguasai dan
separuh lainnya tidak menguasai. Interpretasi koefisien kappa sebagaimana Tabel 4.

3
Tabel 4. Interpretasi Koefisien Kappa
Indeks Kappa Agreement
<0,20 Rendah/Poor
0,21 – 0,40 Lumayan/ Fair
0,41 – 0,60 Cukup/ Moderate
0,61 – 0,80 Kuat/ Good
>0,80 Sangat Kuat/ Very good

Selain itu, suatu tes yang diterapkan dalam suatu kelas pada periode yang penuh (misalnya 1 semester)
dapat menggunakan nilai koefisien kappa sebesar 0,35 sampai 0,50 atau lebih dari itu.

C. Data Butir Soal


1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes
Jawaban Butir Soal Pengujian 1 Jawaban Butir Soal Pengujian 2
Siswa Siswa
1 2 3 4 5 1 2 3 4 5
1 0 1 1 0 1 1 1 1 1 1 1
2 1 1 1 0 1 2 1 1 1 1 1
3 0 1 0 1 0 3 1 1 1 1 1
4 1 0 1 1 1 4 1 1 1 1 1
5 1 1 1 1 1 5 0 1 1 0 1
6 0 1 0 1 0 6 1 1 0 1 1
7 1 1 0 1 1 7 1 1 1 1 1
8 0 1 1 0 1 8 1 1 1 1 1
9 1 1 0 1 1 9 0 1 0 1 0
10 1 1 0 1 1 10 1 1 1 1 1

Keterangan: 0 = gagal, dan 1=berhasil.

2. Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes


Gunakan data praktikum 1 tentang penentuan validitas dan reliabilitas untuk data dikotomi. Skor penggalan
mentah dari tes tersebut adalah 7 di mana semua butir telah dinyatakan valid (taraf signifikansi 5%).

D. Prosedur Kerja dan Alat Bantu


1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes
a. Kelompokkan kategori jawaban siswa berhasil dan gagal
b. Hitung nilai koefisien persetujuan po dan batas bawah dari koefisien persetujuan pchance
c. Hitung nilai koefisien kappa (K)
d. Interpretasikan hasil hitungan Anda dengan acuan yang ada diteori

2. Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes


a. Hitung nilai z-score dengan menggunakan rumus yang berlaku dimana skor penggalan mentah dari tes
tersebut adalah 7.
b. Gunakan Tabel 2 dan 3.
c. Interpretasikan hasil hitungan Anda dari tabel tersebut dengan acuan yang ada diteori untuk menghitung
koefisien persetujuan po dan koefisien kappa (K)

4
E. Analisis Data dengan Aplikasi Excel
1. Indeks persetujuan dan indeks Kappa dengan Dua Pengadministrasian Tes
Siswa Butir Pengujian 1 Pengujian 2 Kategori
1 1 0 1 C
2 1 1 A
3
Dst
10
1 2
2
3
Dst
10
Dst
1 5
2
3
Dst
10
Hasil Akhir A=
B=
C=
D=

( 𝑨 + 𝑫)
𝒑𝒐 =
𝑵
[( 𝑨 + 𝑩)(𝑨 + 𝑪) + ( 𝑪 + 𝑫)(𝑩 + 𝑫)]
𝒑𝒄𝒉𝒂𝒏𝒄𝒆 =
𝑵𝟐
𝒑𝒐 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆
𝑲 =
𝟏 − 𝒑𝒄𝒉𝒂𝒏𝒄𝒆

2. Indeks persetujuan dan indeks Kappa dengan Satu Pengadministrasian Tes


𝑐 − 0,5 − 𝑥̅
|𝑧| =
𝑆𝐷

F. Kesimpulan
Berdasarkan hasil analisis tersebut, tuliskan kesimpulan yang dapat diperoleh.

5
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu:
Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN
ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 5
ANALISIS BUTIR DENGAN MENGGUNAKAN SPSS (PENDEKATAN KLASIK)

A. Tujuan
Mahasiswa mampu menganalisis butir soal (data dikotomi) dan angket (data politomi) serta menghiung
koefisien Kappa dengan menggunakan aplikasi SPSS untuk menentukan kualitas butir soal dan angket.

B. Aplikasi SPSS untuk Analisis Butir


Aplikasi statistika terapan dalam bidang evaluasi pembelajaran maupun penelitian yang dapat
digunakan sangatlah banyak, misalnya: SPSS, Iteman, AnBuso, Quest, dll. Aplikasi tersebut sangat familiar
dikalangan pendidik yang dapat digunakan untuk menganalisis butir soal, sehingga mengetahui kualitas butir
soal tersebut dan mampu meningkatkan mutu soal yang telah ditulis. Penelaahan soal secara kuantitatif
maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir soal yang bersangkutan.
Data empirik ini diperoleh dari soal yang telah diujikan. Aspek yang di analisis dalam butir soal meliputi:
tingkat kesukaran butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk soal bentuk obyektif)
atau frekuensi jawaban pada setiap pilihan jawaban.
SPSS adalah aplikasi untuk melakukan analisis statistik. SPSS adalah singkatan dari Statistical Package
for the Social Sciences. SPSS software pertama kali dibuat dan dimiliki oleh perusahaan SPSS Inc. Namun
dalam perjalanannya pada tahun 2009 hingga sekarang, SPSS telah diakuisisi oleh perusahaan IBM. Maka
versi terbaru dari SPSS, sejak SPSS versi 20, namanya telah berubah menjadi IBM SPSS. Dalam hal ini pada
tahun 2017, versi terbaru dari SPSS adalah IBM SPSS versi 25. Kegunaan SPSS dalam penelitian adalah untuk
olah dan analisis statistik. Banyak sekali analisis yang dapat dikerjakan dengan aplikasi tersebut, antara lain:
Uji deskriptive, Regresi Linear, Regresi Logistik, Analisis Faktor, Uji Normalitas, Uji F dan Uji T, Independent T
Test, ANOVA, MANOVA, ANCOVA, Uji Non Parametris yang banyak sekali macamnya seperti Mann Whitney
U Test, wilcoxon signed rank test, spearman, kendall tau, dll. Bahkan dapat juga digunakan untuk pembuatan
grafik, seperti Histogram, Normal PP, Detrend PP, Boxplot, dll. Untuk uji instrumen atau uji validitas dan uji
reliabilitas, SPSS juga dapat melakukannya dengan fitur yang lengkap.
SPSS mempunyai user interface atau antar muka yang sangat user friendly alias mudah dipahami
pengguna, mudah digunakan dan hasilnya atau output SPSS sangatlah menarik dengan tampilan yang luar
biasa apabila dibandingkan dengan aplikasi statistik lainnya. Kelebihan SPSS yang lainnya adalah database.
Dimana SPSS memiliki sistem database tersendiri dan dapat dijalankan atau dihubungkan dengan aplikasi
lainnya, semisal aplikasi excel. Hal ini sangat dimungkinkan bagi para pengguna, sebab database SPSS
termasuk dalam golongan ODBC, sehingga dapat dijalankan perintahnya atau dihubungkan dengan berbagai
macam aplikasi yang berbasil SQL.

C. Data Butir Soal


Analisislah butir soal pilihan ganda dan angket sebagaimana terlampir.

D. Prosedur Analisis dengan SPSS


1. Uji Instrumen Angket (Data Politomi)
Validitas suatu butir pertanyaan dapat dilihat pada hasil output SPSS pada tabel dengan judul Item-
Total Statistic. Kevalidan masing-masing butir pertanyaan dapat dinilai dari Correlated Item-Total Correlation
masing-masing butir pertanyaan. Suatu variabel dikatakan valid apabila nilai r-hitung yang merupakan nilai
dari Correlated Item-total Correlation > dari r-tabel. Nilai r-tabel dapat diperoleh melalui df (degree of freedom)
= n – k, dimana n merupakan jumlah responden, dan k merupakan jumlah butir pertanyaan dalam suatu
variabel. Alpha yang dipergunakan dalam penelitian adalah 5%. Perhatikan hasil rekap data kuisioner
berikut.
Tabel Hasil Rekap Data Kuisioner
Motivasi Belajar
Responden 1 2 3 4 5 6
1 4 4 4 4 4 1
2 3 3 3 3 3 3
3 4 4 4 4 4 1
4 4 4 4 3 4 1
5 3 3 3 3 3 3
6 3 3 4 3 3 2
7 4 4 4 4 4 1
8 5 4 4 4 4 2
9 3 4 3 3 4 1
10 4 4 4 4 4 1
11 4 4 4 4 4 1
12 3 3 3 3 3 3
13 4 4 4 3 4 4
14 4 4 4 4 4 1
15 3 3 3 4 3 1
16 3 3 3 3 3 1
17 4 4 4 4 4 3
18 3 3 3 3 3 3
19 3 3 3 3 3 2
20 4 3 4 3 3 1
21 4 3 3 3 3 1
22 4 4 4 4 4 1
23 3 3 4 4 3 3
24 4 3 4 4 3 3
25 4 4 4 4 4 2
26 4 4 4 4 4 2
27 4 4 4 4 4 2
28 2 2 3 2 2 3
29 4 4 4 4 2 2
30 4 4 4 3 3 1

Penyelesaian
a. Buka aplikasi SPPS dan pilih variable view di bagian bawah kiri. Ketik A1 sampai dengan A6 pada
kolom name untuk pertanyaan kuisioner aspek motivasi belajar. Isikan pada kolom label yaitu
pertanyaan 1 sampai dengan pertanyaan 6.

b. Klik Data View dan masukkan data hasil kuisioner A1 sampai A6.
c. Klik menu Analyze, pilih Scale → Reliability Análisis.

d. Pindahkan seluruh Pertanyaan, mulai A1 sampai A6 ke kotak item melalui tombol tanda panah
diantaranya.

e. Klik tombol statistic, kemudian klik item, scale, dan scale if item deleted.
f. Selanjutnya klik continue dan Ok.
Hasil analisis dengan SPSS akan dihasilkan untuk validitas dapat di lihat di tabel item-total statistics
sebagai berikut.
Item-Total Statistics
Corrected Item- Cronbach's
Scale Mean if Scale Variance Total Alpha if Item
Item Deleted if Item Deleted Correlation Deleted
pertanyaan 1 16.00 3.310 .678 .437
pertanyaan 2 16.10 3.403 .700 .440
pertanyaan 3 15.97 3.689 .699 .470
pertanyaan 4 16.13 3.568 .606 .478
pertanyaan 5 16.20 3.476 .573 .480
pertanyaan 6 17.77 5.909 -.347 .900

g. Menentukan nilai r-tabel dengan melihat nilai df (degree of freedom) = n – k, dimana k adalah jumlah
butir pertanyaan dalam suatu variabel, dan n merupakan jumlah responden. Maka df = 30-6 = 24.
Tabel r product – moment (two tailed test) menunjukkan bahwa pada df 24 dengan alpha 5%, diperoleh
r table sebesar 0,404.
h. Membandingkan nilai r hitung dengan r tabel sebagai berikut.
1) r hitung A1 sebesar 0,678 > r table 0,404, kesimpulan valid.
2) r hitung A2 sebesar 0,700 > r table 0,404, kesimpulan valid.
3) r hitung A3 sebesar 0,699 > r table 0,404, kesimpulan valid.
4) r hitung A4 sebesar 0,606 > r table 0,404, kesimpulan valid.
5) r hitung A5 sebesar 0,573 > r table 0,404, kesimpulan valid.
6) r hitung A6 sebesar -0,347 < r table 0,404, kesimpulan tidak valid.
i. Menghapus pertanyaan yang tidak valid (nomor 6) dari variable view di SPSS (klik kanan pilih clear).

j. Melakukan uji validitas kembali untuk pertanyaan yang valid, seperti langkah langkah diatas. Hasil uji
validitas untuk Item Total Statistics sebagai berikut.

Item-Total Statistics
Corrected Item- Cronbach's
Scale Mean if Scale Variance Total Alpha if Item
Item Deleted if Item Deleted Correlation Deleted
pertanyaan 1 14.13 3.637 .808 .866
pertanyaan 2 14.23 3.702 .855 .855
pertanyaan 3 14.10 4.231 .734 .885
pertanyaan 4 14.27 3.995 .693 .891
pertanyaan 5 14.33 3.816 .695 .892

k. Menentukan nilai r-tabel dari pertanyaan yang valid melalui df (degree of freedom) = n – k, dimana
k merupakan jumlah butir pertanyaan dalam suatu variabel, dan n merupakan jumlah responden. Maka
df = 30-5 = 25. Tabel r product – moment (two tailed test) menunjukkan bahwa pada df 24 dengan
alpha 5%, diperoleh r table sebesar 0,396.
l. Membandingkan nilai r hitung dengan r tabel dari tabel hasil analisis terakhir sebagai berikut.
1) r hitung A2 sebesar 0,808 > r table 0,396, kesimpulan valid.
2) r hitung A5 sebesar 0,855 > r table 0,396, kesimpulan valid.
3) r hitung A6 sebesar 0,734 > r table 0,396, kesimpulan valid.
4) r hitung A7 sebesar 0,693 > r table 0,396, kesimpulan valid.
5) r hitung A8 sebesar 0,695 > r table 0,396, kesimpulan valid.
m. Menyimpulkan bahwa tujuh indikator pertanyaan variabel A yaitu motivasi dalam riset pembelajaran
IPA di SMP kelas 7 memiliki r hitung yang lebih besar dari nilai r table telah valid.

Langkah uji reliability sama dengan langkah uji validitas. Poin yang berbeda adalah output SPSS yang
menjadi dasar penilaian validitas dengan output SPSS yang menjadi dasar penilaian Reliabilitas. Uji validitas
dilakukan dengan memperhatikan output Item total statistik, sedangkan uji reliabilitas dengan memperhatikan
output Reliability Statistics pada kolom Cronbach’s Alpha. Reliabilitas suatu konstruk variabel dikatakan baik
jika memiliki nilai Cronbach’s Alpha > dari 0,60. Dengan menggunakan data pada contoh di atas maka
prosedur analisis reliabilitas instrumen sebagai berikut.

Penyelesaian
a. Buka aplikasi SPSS dan masukkan data variabel A yang sudah valid, seperti terdapat pada contoh di
atas.

b. Klik menu analyze pilih scale, kemudian klik realiability analysis.

c. Memindahkan seluruh pertanyaan ke kolom item dengan menggunakan tombol tanda panah yang
berada diantaranya.
d. Klik tombol statisitik, kemudian aktifkan item, scale, dan scale if item deleted.

e. Klik continue dan OK.


Hasil output SPSS dapat dilihat di tabel realibility statistics sebagai berikut.
Reliability Statistics
Cronbach's
Alpha N of Items
.900 5

Pengukuran yang reliabel akan menunjukkan instrumen yang dapat menghasilkan data yang dipercaya.
Reliabilitas suatu konstruk variabel dikatakan baik jika memiliki nilai Cronbach’s Alpha > dari 0,60. Maka
berdasarkan hasil ini dapat dilihat bahwa Cronbach’s Alpha 0.900 > dari 0,60. Hal ini berarti instrumen sudah
dapat dikatakan reliabel.

2. Data Dikotomi
Analisis butir soal tes berbentuk pilihan ganda (dengan benar skor 1 dan salah 0) merupakan cara untuk
mengetahui kualitas soal yang diujikan secara statistik. Analisis butir soal tes memiliki empat kriteria, yaitu:
a. Validitas
b. Reliabilitas
c. Tingkat Kesukaran
d. Daya Pembeda
Untuk mempermudah dalam analisis ini dapat dilakukan dengan menggunakan salah satu aplikasi komputer
SPSS for Windows. Berikut cara analisis menggunakan aplikasi SPSS tersebut.
a. Membuka aplikasi SPSS, klik Variable View dan isikan variable semua butir soal yang akan dianalisis.
b. Klik Data View, isikan hasil koreksian ke SPSS (Misal jawaban benar = 1, dan jawaban salah = 0,
jumlah = jumlah jawaban benar).

c. Uji Validitas:
1) Pilih menu Analyze --> Correlate --> Bivariate

2) Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, soal_8, dan jumlah ke Kotak
“Variables”.
3) Klik Pearson, Two-tailed, dan Flag significant correlation

4) Klik OK
Berikut hasil analisis validitas butir soal pilihan ganda.
Correlations
soal_1 soal_2 soal_3 soal_4 soal_5 soal_6 soal_7 soal_8 jumlah
soal_1 Pearson Correlation 1 .000 .102 .250 .408 .327 .500 -.408 .430
Sig. (2-tailed) 1.000 .779 .486 .242 .356 .141 .242 .215
N 10 10 10 10 10 10 10 10 10
soal_2 Pearson Correlation .000 1 .000 .500 .000 .218 -.200 .408 .407
Sig. (2-tailed) 1.000 1.000 .141 1.000 .545 .580 .242 .243
N 10 10 10 10 10 10 10 10 10
soal_3 Pearson Correlation .102 .000 1 .408 .667* .535 .816** -.250 .702*
Sig. (2-tailed) .779 1.000 .242 .035 .111 .004 .486 .024
N 10 10 10 10 10 10 10 10 10
soal_4 Pearson Correlation .250 .500 .408 1 .612 .764* .500 -.102 .814**
Sig. (2-tailed) .486 .141 .242 .060 .010 .141 .779 .004
N 10 10 10 10 10 10 10 10 10
soal_5 Pearson Correlation .408 .000 .667* .612 1 .802** .816** -.167 .868**
Sig. (2-tailed) .242 1.000 .035 .060 .005 .004 .645 .001
N 10 10 10 10 10 10 10 10 10
soal_6 Pearson Correlation .327 .218 .535 .764* .802** 1 .655* -.356 .819**
Sig. (2-tailed) .356 .545 .111 .010 .005 .040 .312 .004
N 10 10 10 10 10 10 10 10 10
soal_7 Pearson Correlation .500 -.200 .816** .500 .816** .655* 1 -.408 .769**
Sig. (2-tailed) .141 .580 .004 .141 .004 .040 .242 .009
N 10 10 10 10 10 10 10 10 10
soal_8 Pearson Correlation -.408 .408 -.250 -.102 -.167 -.356 -.408 1 -.037
Sig. (2-tailed) .242 .242 .486 .779 .645 .312 .242 .919
N 10 10 10 10 10 10 10 10 10
jumlah Pearson Correlation .430 .407 .702* .814** .868** .819** .769** -.037 1
Sig. (2-tailed) .215 .243 .024 .004 .001 .004 .009 .919
N 10 10 10 10 10 10 10 10 10
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).

Analisis: Hasil pada kolom "Jumlah" jika nilai sig. (2-tailed) < ½ 0,05 atau sig. (2-tailed) < 0,025 menyatakan butir soal tersebut Valid. Contoh untuk soal nomor
1, nilai sig = 0,215, dimana nilai tersebut > 0,025, maka soal nomor 1 dinyatakan tidak valid. Soal nomor 5, nilai sig. (2-tailed) = 0,001, dimana nilai tersebut
<0,05, maka soal nomor 5 dinyatakan valid.
d. Uji Reliabilitas:
1) Pilih menu Analyze --> Scale --> Reliability Analysis.

2) Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, dan soal_8, ke Kotak “Items”

3) Pada kolom Model pilih Alpha, klik Statistics, pilih Item, dan klik Continue.

4) Klik OK.
Hasil analisis uji reliabilitas dapat dilihat di tabel Reliability Statistic sebagai berikut.
Reliability Statistics
Cronbach's
Alpha N of Items
.734 8

Analisis: Berdasarkan nilai Cronbach's Alpha pada tabel Reliability Statistics diperoleh nilai 0,734
dimana nilai ini ditafsirkan dengan kriteria
0,800 - 1,000 = Sangat tinggi
0,600 - 0,799 = Tinggi
0,400 - 0,500 = Cukup
0,200 - 0,399 = Rendah
> 0,200 = Sangat rendah
Hasil analisis dapat disimpulkan tes ini memiliki tingkat reliabilitas tinggi.
e. Uji Tingkat Kesukaran
1) Pilih menu Analyze --> Descriptive Statistics --> Frequencies.

2) Masukkan soal_1, soal_2, soal_3, soal_4, soal_5, soal_6, soal_7, dan soal_8, ke Kotak
“Variable(s)”

3) Klik Statistics, Klik Mean, dan Klik Continue

4) Klik OK
Hasil analisis tingkat kesukaran sebagai berikut.
Statistics
soal_1 soal_2 soal_3 soal_4 soal_5 soal_6 soal_7 soal_8
N Valid 10 10 10 10 10 10 10 10
Missing 0 0 0 0 0 0 0 0
Mean .8000 .5000 .6000 .2000 .4000 .3000 .5000 .6000

Analisis : dari hasil yang ditunjukkan nilai MEAN pada tabel statistcs ditafsirkan pada rentang tingkat
kesukaran, yaitu
0.00 – 0.20 => Sangat Sukar
0.21 – 0.40 => Sukar
0.41 – 0.60 => Sedang
0.61 – 0.80 => Mudah
0.81 – 1.00 => Sangat Mudah
Misal soal nomor satu, diperoleh nilai Mean = 0,8000 yang berarti tingkat kesukaran soal nomor satu
adalah mudah. Soal nomor empat, diperoleh nilai Mean = 0,2000 yang berarti tingkat kesukaran
soal nomor satu adalah sangat sukar.

f. Uji Daya Pembeda


Untuk menentukan daya pembeda, maka nilai perhitungan yang digunakan adalah rhitung pada SPSS
yang dibandingkan dengan kriteria :
0.40 – 1.00 = Soal baik
0.30 – 0.39 = Soal diterima dan diperbaiki
0.20 – 0.29 = Soal diperbaiki
0.00 – 0.19 = Soal ditolak

R hitung dapat dilihat dari nilai Pearson Correlation pada uji validitas yang telah dilakukan sebelumnya.
Berikut tabel hasil analisis validitas butir soal untuk mengetahui daya beda butir soal pilihan ganda.

Correlations
soal_1 soal_2 soal_3 soal_4 soal_5 soal_6 soal_7 soal_8 jumlah
soal_1 Pearson Correlation 1 .000 .102 .250 .408 .327 .500 -.408 .430
Sig. (2-tailed) 1.000 .779 .486 .242 .356 .141 .242 .215
N 10 10 10 10 10 10 10 10 10
soal_2 Pearson Correlation .000 1 .000 .500 .000 .218 -.200 .408 .407
Sig. (2-tailed) 1.000 1.000 .141 1.000 .545 .580 .242 .243
N 10 10 10 10 10 10 10 10 10
soal_3 Pearson Correlation .102 .000 1 .408 .667* .535 .816** -.250 .702*
Sig. (2-tailed) .779 1.000 .242 .035 .111 .004 .486 .024
N 10 10 10 10 10 10 10 10 10
soal_4 Pearson Correlation .250 .500 .408 1 .612 .764* .500 -.102 .814**
Sig. (2-tailed) .486 .141 .242 .060 .010 .141 .779 .004
N 10 10 10 10 10 10 10 10 10
soal_5 Pearson Correlation .408 .000 .667* .612 1 .802** .816** -.167 .868**
Sig. (2-tailed) .242 1.000 .035 .060 .005 .004 .645 .001
N 10 10 10 10 10 10 10 10 10
soal_6 Pearson Correlation .327 .218 .535 .764* .802** 1 .655* -.356 .819**
Sig. (2-tailed) .356 .545 .111 .010 .005 .040 .312 .004
N 10 10 10 10 10 10 10 10 10
soal_7 Pearson Correlation .500 -.200 .816** .500 .816** .655* 1 -.408 .769**
Sig. (2-tailed) .141 .580 .004 .141 .004 .040 .242 .009
N 10 10 10 10 10 10 10 10 10
soal_8 Pearson Correlation -.408 .408 -.250 -.102 -.167 -.356 -.408 1 -.037
Sig. (2-tailed) .242 .242 .486 .779 .645 .312 .242 .919
N 10 10 10 10 10 10 10 10 10
jumlah Pearson Correlation .430 .407 .702* .814** .868** .819** .769** -.037 1
Sig. (2-tailed) .215 .243 .024 .004 .001 .004 .009 .919
N 10 10 10 10 10 10 10 10 10
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).

Analisis: Hasil yang diperoleh untuk soal nomor satu pada kolom jumlah adalah 0,430 yang berarti
soal baik.

3. Koefisien Kappa
Koefisien Kappa merupakan ukuran yang menyatakan konsistensi pengukuran yang dilakukan dua orang
penilai (Rater) atau konsistensi antar dua metode pengukuran atau dapat juga mengukur konsistensi antar dua
alat pengukuran.
Klasifikasi Penempuh Ujian di Dua Pelaksanaan Tes
Pelaksanaan Tes 2
Benar Salah
Pelaksanaan Tes 1 Benar A B (A + B)
Salah C D (C + D)
(A + C) (B + D) N

Langkah – langkah untuk mendapatkan koefisien Kappa dengan SPSS adalah sebagai berikut:
a. Definisikan data pada Variabel View. Disini akan dibuat tiga variabel, yaitu Tes 1 dan Tes 2. Skala data
untuk variabel Tes 1 dan Tes 2 adalah Scale. Berikan kode pada kolom Values.
 Untuk variabel Tes 1 yang terdiri dari dua kategori
Benar = 2, Salah = 1
 Untuk variabel Tes 2 yang terdiri dari dua kategori
Benar = 2, Salah = 1

Kategori ditetukan berdasarkan instrument yang digunakan oleh peneliti, memungkinkan terdiri dari tiga
atau lebih kategori.
Misal: Sangat Baik = 4, Baik = 3, Cukup = 2, Kurang = 1
b. Memasukan data kedalam SPSS
c. Pilih Anlyze, Descriptive Statistics, lalu klik Crosstabs
Kotak dialog Crosstabs, pindahkan Tes1 ke Row(s) dan Tes 2 ke Colum(s)

Klik Statistics, pada kotak dialog Crosstabs:Statistics yang muncul centang Kappa

d. Klik Cells, pada kotak dialog Crosstabs:Statistics yang muncul centang Total di bawah Percentages
 tekan Continue

e. Klik Continue, lalu Ok


Output yang muncul sebagai berikut.

Tes_1 * Tes_2 Crosstabulation


Tes_2
Salah Benar Total
Tes_1 Salah Count 20 10 30
% of Total 40.0% 20.0% 60.0%
Benar Count 5 15 20
% of Total 10.0% 30.0% 40.0%
Total Count 25 25 50
% of Total 50.0% 50.0% 100.0%
Symmetric Measures
Asymptotic Approximate
Value Standard Errora Approximate Tb Significance
Measure of Agreement Kappa .400 .127 2.887 .004
N of Valid Cases 50
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.

Dari output diatas diperoleh nilai koefisein cohen’s kappa sebesar 0,400. Ini berarti terdapat kesepakatan
yang lumayan/ fair Antara pelaksanaan Tes 1 dengan Tes 2 terhadap peserta. Nilai signfikansinya dapat
dilihat pada kolom Approx. Sig dengan nilai signifikansi sebesar 0,004. Karena nilai signifikansi kurang dari
taraf signifikansi yang digunakan 5 % (0,004<0,05), maka hipotesis awal dditerima sehingga dapat
disimpulkan terdapat kesepakatan yang signfikan antar pelaksanaan Tes 1 dan Tes 2 pada taraf signfikansi
5 %.

E. Kesimpulan
Buatlah interpretasi dari hasil keluaran Iteman dan berikan kesimpulan berdasarkan hasil analisis tersebut.
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu:
Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN
ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 6
ANALISIS BUTIR SOAL DENGAN MENGGUNAKAN ITEMAN 4.3

A. Tujuan
Mahasiswa mampu menganalisis butir soal dengan menggunakan aplikasi Iteman 4.3 untuk menentukan
kualitas butir soal

B. Iteman 4.3
ITEMAN (Item and Test Analysis) adalah perangkat lunak komputer (software) yang dibuat khusus untuk
menganalisa butir soal atau suatu tes yang dilakukan. ITEMAN merupakan analisis butir empirik dengan
model pendekatan klasik yang berguna untuk menentukan kualitas butir soal atau sebuah tes. Hasil dari
analisi butir soal meliputi tingkat kesukaran, daya beda, dan statistik penyebaran jawaban. Selain
menghasilkan statistik butir soal/tes, program ini juga menghasilkan statistik tes yang meliputi realibilitas
tes, kesalahan pengukuran atau standard error dan distribusi skor.
Beberapa istilah penting yang ada dihasil analisis dengan Iteman (Iteman 3) sebagai berikut.
a. Seq. No adalah nomor urut butir soal dalam file data.
b. Scala-item adalah nomor urut butir soal dalam skala (tes/subtes)
c. Prop. Correct adalah proporsi siswa( peserta tes) yang menjawab benar butir soal. Nilai ekstrim
(mendekati nol atau satu) menunjukan bahwa butir soal tersebut terlalu sukar atau terlalu mudah untuk
peserta tes. Indeks ini disebut juga indeks tigkat kesukaran soal secara klasikal.
d. Biser adalah indeks daya pembeda soal dengan menggunakan koefisien korelasi biserial. Nilai positif
menunjukan bahwa peserta tes yang menjawab benar butir soal, mempunyai skor yang relatif tinggi
dalam tes/skala tersebut. Sebaliknya nilai negatif menunjukan bahwa peserta tes yang menjawab
benar butir soal, memperoleh skor yang relatif rendah dalam tes/skala tersebut. Untuk statistik pilihan
jawaban (alternative) korelasi biserial negatif sangat tidak dikehendaki untuk kunci jawaban dan
sangat dikehendaki untuk pilihan jawaban yang lain (pengecoh).
e. Point-biser adalah juga indeks daya pembeda soal dan pilihan jawaban (alternatif) dengan
menggunakan koefisien korelasi point-biserial. Penafsirannya sama dengan statistik biserial.
f. Statistik pilihan jawaban (alternative) memberikan informasi yang sama dengan statistik butir soal.
Perbedaannya adalah bahwa statistik pilihan jawaban dihitung secara terpisah. Untuk setiap piihan
jawaban dan didasarkan pada dipilih tidaknya alternatif tersebut, bukan pada benarnya jawaban.
Tanda (*) yang muncul di sebelah kanan hasil analisis menunjukan kunci jawaban.
Istilah yang perlu dipahami untuk membaca hasil analisis sebagai berikut.
1. N of items adalah jumlah butir soal dalam tes.
2. N of examines adalah jumlah peserta tes yang digunakan dalam analisis.
3. Mean adalah skor rata-rata peserta tes.
4. Variance adalah varian dari distribusi skor peserta tes yang memberikan gambaran tentang sebaran
skor peserta tes.
5. Std. Dev adalah deviasi standar dari distribusi skor peserta tes.
6. Skew adalah kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk
distribusi skor peserta tes.
7. Kurtosis adalah puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding
dengan distribusi normal.
8. Minimun adalah skor terendah peserta tes dalam tes/skala tersebut.
9. Maximum adalah skor tertinggi peserta tes dalam tes/skala tersebut.
10. Median adalah skor tengah dimana 50% skor berada pada atau lebih rendah dari skor tersebut.
11. Alpha adalah koefisien reliabilitas alpha untuk tes/skala tersebut yang merupakan indeks homogenitas
tes/skala. Koefisien alpha bergerak dari 0,0 sampai 1,0.
12. SEM adalah kesalahan pengukuran standar untuk setiap tes/skala. SEM merupakan estimit dari deviasi
standar kesalahan pengukuran dalam skor tes.
13. Mean P adalah rata-rata tingat kesukaran semua butir soal dalam tes secara klasikal dihitung dengan
cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk semua butir soal dalam
tes/skala.
14. Mean item-Tot nilai rata-rata indeks daya pembeda dari semua soal dalam tes/skala yang diperoleh
dengan menghitung nilai rata-rata point biserial dari semua soal dalam tes/skala.
15. Mean-Biserial adalah juga nilai rata-rata indeks daya pembeda yang diperoleh dengan menghitung
nilai rata-rata korelasi biserial dari semua butir soal dalam tes/skala.
16. Scale intercorrelation adalah indeks korelasi antara skor-skor peserta tes yang diperoleh dari setiap
subtes/subskala.

C. Data Butir Soal


Analisislah butir soal pilihan ganda sebagaimana terlampir.

D. Prosedur Analisis dengan Iteman 4.3


1. Memasukan Butir Soal Pada Ms. Excel

Gambar 6.1 Entry Butir Soal

Silahkan Entry hasil jawaban soal pilihan ganda siswa, pada microsoft excel. Model entry dibuat seperti pada
tampilan gambar 6.1

a. Memasukan Hasil Butir Soal dari Ms. Excel menuju Notepad

Gambar 6.2 Cara Copy Butir Soal Pada Ms.Excel Langkah 1


Block area seperti pada gambar 6.2, kemudian klik kanan pada mouse, pilih menu “copy”

b. Buka aplikasi “notepad” di File Program anda, tampilan notepad seperti pada gambar 6.3 berikut,

Gambar 6.3 Aplikasi Notepad


c. Setelah aplikasi “Notepad” aktif. Klik cursor mouse pada area “Notepad”, selanjutnya klik kanan mouse dan
pilih menu “paste”. Sehingga entry data yang sudah di inputkan pada Ms.Excel muncul pada lembar kerja
“Notepad” . Tampilan “notepad” setelah di “paste” seperti pada gambar 6.4 berikut.

Gambar 6.4 Copy Paste dari Excel di Notepad

d. Mengatur “spasi” butir soal yang di entry di lembar kerja “Notepad” dilakukan dengan cara
melakukan “block” pada “spasi” butir soal seperti pada gambar 6.5.

Gambar 6.5 Memblock spasi pada Notepad

e. Selanjutnya arahkan cursor mouse pada area yang di “block”. Kemudian “klik” kanan mouse, dan pilih “copy”
Selanjutnya pada tool bar, terdapat menu “edit”, kemudian “klik” sehingga muncul pilihan menu “Replace”.
Pilihlah menu “Replace” tsb, sehingga muncul tampilan seperti pada gambar 6.6.

Gambar 6.6 Membuka menu replace


Pada menu “Replace” terdapat 2 kolom yang beridentitas “find what” dan ”Replace with” . selanjutnya,
letak kan cursor mouse pada kolom “find what”. Kemudian “klik” kanan mouse dan pilih menu “paste” atau
pakai “Ctrl+V”. tampilannya seperti pada gambar 6.7 berikut.
Gambar 6.7 Mengganti Ukuran Spasi Pada Notepad

f. Jika sudah di “paste”, selanjutnya pilih dan klik menu “Replace All”, sehingga spasi pada notepad akan
berubah menjadi lebih rapat seperti pada gambar 6.8. Untuk menghilangkan menu “Replace” pilihlah
menu “Cancel” atau tanda silang (X) Selanjutnya akan tampil seperti pada gambar 6.9.

Gambar 6.8 dan 6.9 Mengganti Ukuran Spasi dan Meluruskan Butir Soal
g. Selanjutnya meluruskan butir soal dalam satu kolom

Gambar 6.10 Meluruskan Butir Soal


h. Jika hasil entry sudah lurus dan rapi, maka simpan file anda dengan cara pilih dan klik menu “file” dan
pilih “Save As”. Beri nama lembar kerja notepad tsb (contoh: Butir Jawaban). Kemudian klik “Save”
dengan format “txt”.
2. Memasukan Kunci Jawaban Butir Soal dari Ms. Excel menuju Notepad
Formula identitas kunci jawaban software iteman 4.3

Item01 A 5 1 Y M
Keterangan:
Item01 = Nomor Butir Soal
A = Kunci Jawaban
5 = Alternatif opsi jawaban (A, B, C, D, E)
1 = Domain
Y = Ketentuan Perintah analisis masing-masing butir (Y= Yes; N=No)
M = Jenis analisis (M=multiple choice, R= Rating Scale, P= Partial Scale)

Gambar 6.11. Formula Kunci Jawaban di Excel


a. Pada gambar 6.11 merupakan tampilan formula kunci jawaban pada Ms.Excel. Kemudian “block”
formula jawaban tersebut seperti pada gambar 6.12, selanjutnya “klik” kanan mouse, pilih “copy” atau
“Ctrl+C”

Gambar 6.12. Formula Kunci Jawaban di Excel yang di Copy


b. Setelah formula kunci sukses di copy, maka silahkan buka sofware “notepad”, kemudian letakkan cursor
pada area/lembar kerja notepad. Selanjutnya Kemudian “klik” kanan mouse dan pilih menu “paste”
atau pakai “Ctrl+V”. Tampilan lembar kerja notepad akan seperti gambar 6.13
Gambar 6.13 Hasil entry Formula kunci jawaban pada notepad
c. Jika langkah memasukan formula kunci jawaban di software notepad telah selesai. Maka langkah
selanjutnya simpan file anda dengan cara pilih dan klik menu “file” dan pilih “Save As”. Beri nama lembar
kerja notepad tersebut (contoh: Kunci Jawaban), kemudian klik “Save” dengan format “txt”.
d. Periksa data yang telah disimpan dalam folder anda, jika penyimpanan sukses, terdapat 2 macam “file
Notepad” yaitu (file butir jawaban dan Kunci Jawaban). Tampilkan seperti pada gambar 6.14

Gambar 6.14 Penyimpanan File Notepad


3. Menganalisis menggunakan Software Iteman 4.3
a. Buka sofware Iteman 4.3

Gambar 6.15. Software Iteman 4.3


b. Lihat toolbar pada sisi atas tedapat pilihan menu toolbar (file ; input format; scoring options; output options). Pilih menu “input format”.
Sehingga Tampilannya seperti pada gambar 6.16
Gambar 6.16 Tampilan menu input format

c. Pada menu “input format” terdapat opsi “fixed width data” di bawahnya terdapat 3 buah kolom. Masing-
masing kolom beridentitas “Number of examinee ID columns ” , “Examinee Ids begin in column” dan “Item
response begin in column”. Ketiga kolom tersebut harus disesuaikan “nama subyek (nama siswa)”. misalnya
nama siswa terpanjang adalah “Gunawan”. Nama terpanjang tersebut menjadi patokan untuk input
“Number of examinee ID columns ” Nama ǀGǀuǀnǀaǀwǀaǀnǀ memiliki jumlah spasi sebanyak 8 (hitung tanda warna
merah), sehingga “Number of examinee ID columns ” diisi 8. Seperti pada gambar 6.17.

Gambar 6.17 Menghitung Spasi Nama Terpanjang


Selanjutnya kolom “Examinee Ids begin in column” merupakan jeda antara nama dengan jawaban siswa.
seperti pada gambar 6.18 berikut.

Gambar 6.18 Spasi Nama Terpanjang dengan Jawaban Sehingga kolom


Sehingga “Examinee Ids begin in column” diisi dengan 1
Gambar 6.19. Examinee Ids begin in column

Kemudian “Item response begin in column” merupakan spasi dimulainya input jawaban siswa, artinya “Item
response begin in column” merupakan jumlah dari “Number of examinee ID columns ”+ “Examinee Ids begin
in column”.
“Number of examinee ID columns ” + “Examinee Ids begin in column” = “Item response begin in column” atau (8+1= 9).

d. Pilih menu “File” pada software Iteman 4.3. seperti tampak pada gambar 6.20

Gambar 6.20. Menu File Pada Iteman 4.3

e. Klik icon pada “Data matrix file” pilih file notepad “butir Jawaban” yang telah dibuat dan disimpan
sebelumnya. Kemudian klik “Open” Lihat gambar 6.21.
Gambar 6.21. Memasukan Butir Jawaban pada Data Matrix File

Kemudian masukan kunci jawaban dengan memilih icon pada “Item control file”. Pilih kunci jawaban
yang telah dibuat dan disimpan. Kemudian klik “Open” lihat gambar 6.22.

Gambar 6.22. Memasukan Butir Jawaban pada Item control file

f. Langkah selanjutnya lihat menu “Output File”. Kemudian, beri nama identitas pada kolom “Output File”
sesuai dengan keinginan anda, nama output nantinya akan menjadi nama file. Lihat gambar 6.23.
Gambar 6.23 Pemberian Identitas Output File

g. Berikan identitas pada kolom “Run Title” (misalnya: Latihan analisis butir soal) Tampilanya seperti pada
gambar 6.24.

Gambar 6.24 Pemberian Identitas Run title

h. Jika semua data sukses terinput, maka siap dilakukan analisis. Dengan cara “Klik” icon “Run” Hasil yang
muncul pada folder, akan seperti pada gambar 6.25 berikut,

Gambar 6.25 Hasil Output Analisis Iteman 4.3


Berikut cara membaca atau menafsirkan hasil analisis butir soal dengan aplikasi Iteman 4.3.
a. Buka file hasil analisis Iteman format ms. word.
b. Terdapat hasil analisis secara keseluruhan dan setiap butir soal.
c. Analisis butir soal secara keseluruhan:
Summary statistics
Score Items Mean SD Min Max Mean P Mean
Score Score Rpbis
Scored Items 25 14.281 2.965 7 23 0.571 0.097

Keterangan:
Item = jumlah butir soal
Mean = rata-rata skor yang diperoleh oleh peserta tes
SD = standard deviasi menunjukkan simpangan baku dari nilai rata-rata.
Min Score = skor terendah dari nilai peserta tes
Max Score= skor tertinggi yang diperoleh peserta tes
Mean P = rata-rata tingkat kesukaran butir soal.
Mean Rpbis= rata-rata daya pembeda butir soal.
Mean P menunjukkan tingkat kesukaran dari tes tersebut. Nilai 0.571 berarti secara keseluruhan soal
tergolong sedang. Mean Rpbis menunjukkan daya pembeda dari tes ini. Nilai 0.097 berarti secara
keseluruhan soal memiliki daya pembeda yang buruk.
Reliability
Score Alpha SEM Split-Half Split-Half Split-Half S-B S-B First- S-B Odd-
(Random) (First-Last) (Odd-Even) Random Last Even
Scored items 0.399 2.298 0.273 0.018 0.054 0.429 0.035 0.102

Keterangan:
Alpha = nilai koefisien reliabilitas butir soal secara keseluruhan menurut KR-20.
SEM = kesalahan pengukuran standar untuk setiap tes/skala.
Split-Half = nilai koefisien reliabilitas butir soal secara keseluruhan menurut Belah Tengah
(random, first-last, dan odd-even).
S-B = kesalahan pengukuran standar untuk setiap tes/skala (random, first-last, dan odd-
even).
Mengacu pada kriteria di atas, “Alpha (KR – 20)” menunjukkan reliabilitas dari tes ini. SEM adalah
kesalahan pengukuran standar untuk setiap tes/skala. Nilai 0,399 berarti secara
keseluruhan soal memiliki reliabilitas yang rendah

d. Analisis butir soal perbutir soal (misal butir nomor 1):

Item statistics
N P Total Rpbis Total Rbis Alpha w/o
32 0.969 -0.043 -0.106 0.404
P menunjukkan tingkat kesukaran dengan nilai 0.969 berarti soal tersebut sangat mudah. Rpbis
menunjukkan daya pembeda dengan menggunakan koefisien korelasi point-biserial. Nilai -0.043
berarti soal tersebut memiliki daya pembeda yang buruk. Rbis juga menunjukkan indeks daya
pembeda soal dengan menggunakan koefisien korelasi biserial Alpha w/o menunjukkan reliabilitas
dengan nilai 0.404 berarti soal tersebut memiliki reliabilitas sedang.
Option statistics
Option N Prop. Rpbis Rbis Mean SD Color
A 0 0.000 -- -- -- -- Maroon
B 1 0.031 0.043 0.106 14.000 0.000 Green
C 31 0.969 -0.043 -0.106 14.290 3.180 Blue **KEY**
D 0 0.000 -- -- -- -- Olive
E 0 0.000 -- -- -- -- Gray
Omit 0
Not Admin 0

Prop menunjukkan keberfungsian distraktor. Distraktor A, B, D, dan E dengan nilai < 5% berarti
distraktor tersebut tidak baik (ditolak) maka perlu diganti. Daya pembeda Rbis=(-0,106) dan Rpbis=(-
0,043) menunjukkan keduanya bernilai negatif. Hal ini dapat diartikan bahwa siswa yang kurang
pintar (memperoleh skor rendah) cenderung menjawab benar soal ini dan siswa yang pintar cenderung
menjawab salah soal ini.
Kesimpulan Butir Soal No. 1
Tingkat kesukaran soal ini adalah 0,969. Soal ini masuk kategori sangat mudah, yakni sekitar 97%
siswa dapat menjawab soal dengan benar, sehingga masuk kategori buruk. Dengan daya pembeda
Rpbis=(-0,043) dan Rbis=(-0,106) menunjukkan keduanya bernilai negatif. Hal ini dapat diartikan
bahwa siswa yang kurang pintar (memperoleh skor rendah) cenderung menjawab benar soal ini dan
siswa yang pintar cenderung menjawab salah soal ini. Karena alternatif jawaban C merupakan kunci,
maka tanda negatif ini menunjukkan bahwa kunci jawaban belum berfungsi sebagaimana mestinya.
Kesimpulannya butir soal ini perlu ditinjau lagi dan sekiranya akan digunakan maka perlu direvisi.
Oleh karena itu yang perlu dilakukan guna merevisis soal ini anthra lain dengan memeriksa kembali
kunci jawaban. Jika ternyata kunci jawaban salah maka lakukan kembali analisis soal. Jika ternyata
kunci jawaban sudah benar maka kemungkinan kesalahan terletak padakesalahan penguasaan konsep
oleh peserta didik.

E. Kesimpulan
Buatlah interpretasi dari hasil keluaran Iteman dan berikan kesimpulan untuk masing-masing butir terkait
dengan kualitasnya.
PANDUAN PRAKTIKUM TEORI RESPON BUTIR
Analisis Butir dengan Pendekatan Klasik dan Modern

Dosen Pengampu:
Didik Setyawarno, M.Pd

SEPTEMBER-DESEMBER, 2018
JURUSAN PENDIDIKAN IPA, FAKULTAS MATEMATIKA DAN
ILMU PENGETAHUAN ALAM
Kampus Pusat UNY, Jln Colombo No 1, Yogyakarta 55281
PRAKTIKUM 7
ANALISIS BUTIR SOAL DENGAN MENGGUNAKAN ANBUSO (APLIKASI BERBASIS EXCEL)

A. Tujuan
Mahasiswa mampu menganalisis butir soal dengan menggunakan aplikasi ANBUSO untuk
menentukan kualitas butir soal

B. Anbuso
Aplikasi AnBuso (Analisis Butir Soal) merupakan program analisis butir soal yang dikembangkan
secara sederhana untuk membantu dalam membuat administrasi guru, khususnya yang terkait
dengan analisis butir soal. AnBuso dikembangkan dengan program Microsoft Excel sehingga
mempermudah guru dalam menggunakannya. Program ini dapat dibuka secara langsung dengan
menggunakan Microsoft Excel 2007 ke atas. Ada beberapa alasan mengapa perlu menggunakan
AnBuso, di antaranya adalah:
• Sederhana programnya
• Mudah menggunakannya
• Compatible
• Praktis penggunaannya
• Tersedia untuk tes objektif dan essay
• Ada pengelompokan remedial
• Hasil analisis dalam format laporan
• Hasil analisis grafik tersedia
• Tidak berbayar (Free of Charge)
AnBuso pertama kali dibuat pada tahun 2011 dan terus dikembangkan sesuai dengan tuntutan
dan kebutuhan guru dalam melakukan analisis butir soal. Pada AnBuso versi 8 ini yang dikeluarkan
pada tahun 2017, ada perubahan yang dilakukan yakni
1. Jumlah peserta tes yang pada versi sebelumnya hanya terbatas pada maksimal 50 ditambah
menjadi maksimal 200 orang. Dengan demikian aplikasi ini dapat dimanfaatkan tidak hanya
untuk analisis per kelas melainkan juga untuk gabungan dari beberapa kelas sekaligus.
2. Menambahkan informasi tentang daya serap siswa untuk masing-masing tes dan daya serap
keseluruhan.
AnBuso yang dikembangkan dengan Microsoft Excel terdiri atas beberapa menu yang pada
prinsipnya dikelompokkan ke dalam empat bagian, yaitu:
1. Input data, yang meliputi:
a. Identitas, yang berisi identitas umum dan identitas tes.
b. Jawaban, yang berisi jawaban siswa.
2. Data dan Nilai, yang meliputi:
a. Objektif: Data Jawaban Soal Objektif
b. Isian: Data Jawaban Soal Isian Singkat
c. Essay: Skor Jawaban Soal Essay
d. Nilai: Daftar Nilai Siswa
3. Hasil Analisis Soal, yang meliputi:
a. Objektif: Hasil Analisis Soal Pilihan Ganda
b. Sebaran: Sebaran Jawaban Soal Pilihan Ganda
c. Isian: Hasil Analisis Soal Isian Singkat
d. Essay: Hasil Analisis Soal Essay
4. Remedial, yang meliputi:
a. Materi: Materi Remedial Klasikal dan Individual
b. Kelompok: Jadwal Pengelompokan Peserta Remedial
5. Grafik, yang meliputi:
a. Soal: Distribusi Nilai dan Ketuntasan Belajar
b. Peserta: Proporsi Ketuntasan Belajar

Gambar 1. Tampilan AnBuso

Input Data
Pengisian data dalam AnBuso dapat dilakukan pada Menu Input Data. Menu input data terdiri atas
Identitas dan Jawaban. Berikut penjelasannya.
Data yang perlu dimasukkan dalam menu Identitas meliputi:
Identitas Umum
Menu Identitas
1. Satuan Pendidikan
2. Mata Pelajaran
3. Kelas/Program
4. Nama Tes
5. Pokok Bahasan/Sub
6. Nama Guru
7. NIP
8. Semester
9. Tahun Pelajaran
10. Tanggal Tes.
Isikan tanggal pelaksanaan tes, misalnya 10 Agustus 2014
11. Tanggal Diperiksa
Isikan tanggal pemeriksaan tes (boleh dikosongkan), misalnya 15 Agustus 2014
12. Nama Kepala Sekolah
13. NIP Kepala Sekolah
14. Tempat Laporan.
Isikan kota lokasi sekolah, misalnya Yogyakarta
15. Tanggal Laporan
Isikan tanggal dibuatnya laporan tersebut, misalnya 20 Agustus 2014
16. Skala Penilaian (4, 10 atau 100).
 Isikan 4 jika penilaian yang digunakan berkisar antara 0-4
 Isikan 10 jika penilaian yang digunakan berkisar antara 0-10
 Isikan 100 jika penilaian yang digunakan berkisar antara 0-100
17. Nilai KKM.
Pengisian nilai KKM harus menyesuaikan dengan skala penilaian yang diisikan.

Gambar 2. Tampilan Menu Input Identitas

Jumlah dan Bobot Soal


• Jumlah soal pilihan ganda (Max 50)
Isikan jumlah soal pilihan ganda yang akan dianalisis. Jumlah maksimal soal yang disediakan adalah
50 soal. Jika soal yang dianalisis tidak terdapat soal pilihan ganda maka kolom ini tidak perlu diisi.
• Jumlah soal isian singkat (Max 20).
Isikan jumlah soal isian singkat yang akan dianalisis. Jumlah maksimal soal yang disediakan adalah
20 soal. Jika soal yang dianalisis tidak terdapat soal isian singkat maka kolom ini tidak perlu diisi.
• Jumlah soal essay (Max 10).
Isikan jumlah soal essay yang akan dianalisis. Jumlah maksimal soal yang disediakan adalah 10 soal.
Jika soal yang dianalisis tidak terdapat soal essay maka kolom ini tidak perlu diisi.
• Bobot soal pilihan ganda
Isikan bobot soal pilihan ganda yang akan diberikan pada analisis ini, misalnya 50%. Jika soal yang
dianalisis tidak terdapat soal pilihan ganda maka kolom ini tidak perlu diisi.
• Bobot soal isian singkat
Isikan bobot soal isian singkat yang akan diberikan pada analisis ini, misalnya 20%. Jika soal yang
dianalisis tidak terdapat soal essay maka kolom ini tidak perlu diisi.
• Bobot soal essay
Isikan bobot soal essay yang akan diberikan pada analisis ini, misalnya 30%. Jika soal yang dianalisis
tidak terdapat soal essay maka kolom ini tidak perlu diisi.
Keterangan:
Jumlah ketiga bobot tersebut harus 100%

Data Soal Pilihan Ganda dan Isian Singkat


• Jumlah Alternatif Jawaban:
– Isikan 4 jika alternatif jawabannya A, B, C, dan D
– Isikan 5 jika alternatif jawabannya A, B, C, D, dan E
– Dan sebagainya
• Skor Benar tiap Butir Soal
Isikan skor yang diperoleh peserta tes jika ia menjawab dengan benar pada setiap butir soal
tersebut
• Skor Salah tiap butir soal
Isikan skor yang diperoleh peserta tes jika ia menjawab salah pada setiap butir soal tersebut
• Kunci Jawaban
– Isikan kunci jawaban soal secara berurutan mulai nomor satu sampai yang terakhir dengan
format menggunakan huruf besar tanpa spasi. Misalnya DDADDCADBDDDBCBABDDD
– Jumlah soal maksimal 50 sehingga dalam penulisan kunci jawaban maksimal 50 karakter
• Kemampuan yang diukur untuk soal pilihan ganda dan isian singkat
– Isikan kompetensi yang diukur untuk masing-masing butir soal. Isian ini diperlukan untuk
menganalisis kompetensi mana yang belum dikuasai peserta tes guna merancang program
remedial baik klasikal maupun individual

Data Soal Essay


• Skor Maksimal Soal
Isikan skor maksimal yang dapat diperoleh peserta tes pada setiap butir soalnya. Skor tersebut bisa
berbeda-beda untuk setiap soalnya.
• Kemampuan yang diukur
Isikan kemampuan yang diukur untuk masing-masing butir soal essay.
Gambar 3. Tampilan Menu Input Jawaban

Menu Input Jawaban

Data yang perlu dimasukkan dalam menu Jawaban meliputi:


1. Nama Peserta Tes
2. Jenis Kelamin (L = Laki-laki, P = Perempuan)
3. Jawaban Soal Pilihan Ganda
• Isikan jawaban peserta tes secara berurutan mulai nomor satu sampai yang terakhir
dengan format menggunakan huruf besar.
• Untuk jawaban kosong atau butir pertanyaan yang tidak bisa dijawab peserta tes dapat
diisikan spasi atau karakter lain selain alternatif jawaban misalnya 0.
4. Skor Jawaban Isian Singkat
• Isikan 1 jika peserta tes mampu menjawab dengan benar dan 0 jika jawabannya salah
untuk masing-masing butir soal isian singkat.
5. Skor Jawaban Essay
• Isikan skor yang diperoleh peserta tes untuk masing-masing butir soal.

Laporan Peserta
Jika semua data yang ada dalam menu Input Data sudah terisi maka output lainnya akan secara
otomatis terisi. Menu Laporan Peserta akan menghasilkan hal berikut ini.
Menu Laporan Objektif berisi Data Jawaban Soal Objektif yang siap dicetak. Data yang diberi
background warna merah menunjukkan jawaban siswa yang salah.
Menu Laporan Objektif

Gambar 4. Tampilan Menu Laporan Objektif

Menu Laporan Isian

Menu Laporan Isian berisi Data Jawaban Soal Isian Singkat yang siap dicetak. Data yang diberi
background warna merah menunjukkan jawaban siswa yang salah.

Gambar 5. Tampilan Menu Laporan Isian


Menu Laporan Essay

Menu Laporan Essay, yang berisi Skor Jawaban Soal Essay (Gambar 6) yang siap dicetak.

Gambar 6. Tampilan Menu Laporan Essay

Menu Laporan Nilai

Menu Laporan Nilai, berupa Daftar Nilai Siswa yang berisi tentang:
– Daftar peserta dan jenis kelaminnya
– Jumlah butir soal yang dijawab benar dan salah
– Skor dan nilai tes objektif dengan bobotnya
– Nilai tes essay dan bobotnya
– Nilai Akhir,
– Predikat. Penentuan predikat disesuaikan dengan nilai KKM yang ditentukan sekolah (Sesuai
dengan Permendikbud Nomor 53 Tahun 2015), sehingga rentangnya bisa berbeda-beda
tergantung nilai KKM. Contoh penentuan predikat dapat dilihat pada Tabel 1.
– Keterangan (Tuntas dan Tidak tuntas)
Tabel 1. Contoh Penentuan Predikat Penilaian

No Rentang (Jika KKM = 60) Predikat

1. 86,7 – 100,0 A
2. 73,4 – 86,6 B
3. 60,0 – 73,3 C
4. < 60,0 D
Gambar 7. Tampilan Menu Laporan Nilai
– Keterangan lain yang terdiri dari jumlah peserta tes, Jumlah (persentase) peserta yang lulus
dan tidak lulus, serta nilai terendah, nilai tertinggi, nilai rata-rata dan standar deviasi

Hasil Analisis Soal


Menu ini menampilkan hasil analisis untuk kualitas soal objektif, sebaran jawaban peserta tes
dan kualitas soal essay.

Menu Hasil Soal Objektif

Menu Hasil Soal Objektif, berupa Hasil Analisis Butir Soal Pilihan Ganda yang berisi tentang:
– Daya Beda butir soal
Kriteria Daya Beda Butir Soal yang baik adalah jika koefisien daya beda melebihi 0,3 (Nunnally &
Bernstein, 2009: 304; Kaplan & Saccuzzo, 2005: 176; Azwar, 2003: 153). Sementara itu koefisien
antara 0,20 – 0,29 dianggap cukup baik (Alagumalai & Curtis, 2005: 8) dan koefisien di bawah 0,2
dianggap tidak baik sehingga perlu dibuang (Ebel & Frisbie, 1991: 232; Crocker & Algina, 2006:
315). Oleh karena itu kriteria daya beda yang digunakan seperti tertuang dalam Tabel 2.
Tabel 2. Kriteria Daya Beda Soal

Kategori Kriteria
Baik > 0,3
Cukup Baik 0,2 – 0,3
Tidak Baik < 0,2

– Tingkat Kesukaran
Kriteria tingkat kesukaran yang baik adalah berkisar antara 0,3 – 0,7 (Allen & Yen, 1979: 121;
Kaplan & Saccuzzo, 2005: 170; Sudjana, 2011: 137). Oleh karena itu dalam software ini digunakan
kriteria seperti pada Tabel 3.
Tabel 3. Kriteria Tingkat Kesulitan Soal

Kategori Kriteria
Mudah > 0,7
Sedang/baik 0,3 – 0,7
Sulit < 0,3

– Alternatif Jawaban tidak Efektif


Kriteria pengecoh alternatif butir soal yang baik adalah jika alternatif tersebut dijawab oleh
minimal 5% peserta tes, sehingga alternatif itu dianggap efektif.
– Kesimpulan Akhir
Kriteria yang digunakan adalah:
 Baik jika daya bedanya baik/cukup baik, tingkat kesukarannya sedang dan semua
alternatif jawaban efektif
 Revisi alternatif jawaban jika daya beda baik/cukup baik dan tingkat kesukarannya
sedang tetapi alternatif jawabannya ada yang tidak efektif
 Cukup Baik jika daya beda baik/cukup baik tetapi tingkat kesukarannya mudah/sulit,
 Tidak Baik jika daya beda tidak baik
Gambar 8. Tampilan Menu Hasil Soal Objektif

Menu Hasil Sebaran

Menu Hasil Sebaran, berupa Sebaran Jawaban Soal Pilihan Ganda


• Menu ini berisi tentang Sebaran Jawaban Soal Pilihan Ganda yang berupa persentase peserta
tes yang menjawab alternatif jawaban yang tersedia.

Gambar 9. Tampilan Menu Hasil Sebaran


Menu Hasil Isian

Menu Hasil Isian berupa Hasil Analisis Soal Isin Singkat yang berisi:
– Daya Beda butir soal
Kriteria sama dengan soal objektif
– Tingkat Kesukaran
Kriteria sama dengan soal objektif
– Kesimpulan Akhir:
 Baik jika daya beda baik/cukup baik dan tingkat kesukaran sedang
 Cukup Baik jika salah satu di antara daya beda dan tingkat kesukaran tidak memenuhi
syarat
 Tidak baik jika daya beda dan tingkat kesukaran tidak memenuhi persyaratan

Gambar 10. Tampilan Menu Hasil Essay

Menu Hasil Essay berupa Hasil Analisis Soal Essay yang berisi:
Menu Hasil Essay
– Daya Beda butir soal
Kriteria sama dengan soal objektif
– Tingkat Kesukaran
Kriteria sama dengan soal objektif
– Kesimpulan Akhir:
Kriteria sama dengan soal isian singkat
Gambar 11. Tampilan Menu Hasil Essay

Remedial
Menu ini menampilkan hasil analisis peserta tes yang belum tuntas. Materi apa saja yang perlu
diremidi dan pengelompokan remedial.

Menu Materi Remedial

Menu Materi Remedial berupa Laporan Materi Remedial Individual dan Klasikal yang
menggambarkan materi apa saja yang perlu diremidi untuk setiap peserta didik. Menu ini berisi
tentang:
– Kompetensi dasar/materi yang tidak dikuasai secara individual. Remedial individual diberikan
jika peserta hanya mampu menjawab maksimal 55%.
– Kompetensi dasar/materi yang tidak dikuasai secara klasikal. KD dianggap tidak dikuasai
secara klasikal jika peserta tes yang mampu menjawab dengan benar kurang dari 15%.
Gambar 12. Tampilan Menu Materi Remedial

Menu Kelompok Remedial

Menu Kelompok Remedial berupa Laporan Pengelompokan Peserta Remedial menurut kemampuan yang
diukur/materi. Dalam laporan tersebut terlihat daftar peserta yang belum menguasai untuk kemampuan
yang diukur tertentu.

Gambar 13. Tampilan Menu Kelompok Remedial


Grafik
Menu ini berisi tentang grafik yang menggambarkan tentang kualitas soal tes dan kondisi peserta tes.

Menu Grafik Soal

Menu Grafik Soal ini berisi kualitas soal objektif dan essay dilihat dari daya beda, tingkat kesulitan dan kualitas
soal. Grafik ditampilkan dalam bentuk diagram lingkaran yang menggambarkan proporsi soal yang baik,
cukup baik dan tidak baik.

Gambar 14. Tampilan Menu Grafik Soal

Menu Grafik Peserta

Menu Grafik Peserta ini berisi distribusi nilai menurut predikat dan ketuntasan belajar. Grafik ditampilkan
dalam bentuk diagram lingkaran, diagram batang dan diagram garis.

Gambar 15. Tampilan Menu Grafik Peserta

C. Data Butir Soal


Analisislah butir soal pilihan ganda sebagaimana terlampir.

D. Prosedur Analisis dengan Anbuso


Ikutilah panduan berdasarkan uraian diatas.
E. Kesimpulan
Buatlah interpretasi dari hasil keluaran Iteman dan berikan kesimpulan untuk masing-masing butir terkait
dengan kualitasnya.

Anda mungkin juga menyukai