Anda di halaman 1dari 25

ANALISIS BUTIR TES:

TEORI DAN PRAKTIK


Oleh: H.Sujati
PROSEDUR PENGEMBANGAN TES
(Azwar, 1996)
Menentukan
Menentukan Menyiapkan Menuliskan
Domain
Tujuan Tes Kisi-Kisi Butir-Butir Tes
Pengukuran

Uji Reliabilitas Uji Lapangan:


dan Validitas Uji Validitas Isi
Keefektifan
konstruk Revisi Butir secara Kualitatif
Pengecoh, IK,
(Konvergen dan dan Kuantitatif
IDB, rpbis
Diskriminan)

Menyeleksi
Butir dan Tes Siap
Finalisasi digunakan
Konstruksi Tes
Ukuran Sampel Faktor dan Butir Tes
• Gable (1993) menyarankan setiap variabel setidaknya terdiri dari tiga
faktor, sementara setiap faktor minimal terdiri dari tiga butir yang
valid (Griffin, Patterson dan West, 1991).
• Petunjuk di atas dapat dijadikan dasar pertimbangan untuk
menentukan banyaknya kebutuhan butir.
• Instrumen yang memiliki empat faktor kebutuhan minimal butirnya= 4
x3
• Azwar (2017) mengusulkan 2 sampai 3 kali lipat dari kebutuhan butir
dalam rangka menyiapkan blue print soal.
TEORI TES
• Alat ukur (termasuk tes) yang baik harus memiliki bukti validitas dan
reliabilitas. Data yang diperoleh dari penggunaan alat ukur yang belum
teruji validitas dan reliabilitasnya tidak boleh digunakan untuk
mengambil keputusan (Mardapi, 1998). Di sinilah pentingnya ANABUT.
• Menurut Zulaiha (2012) analisis butir tes memiliki tiga manfaat, yaitu
memberi kepastian kepada pengguna untuk menerima, memperbaiki
dan menolak butir-butir tes yang dianalisisnya.
• Analisis butir pada prinsipnya menaksir besarnya parameter butir.
Terdapat tiga parameter butir, yaitu indeks kesukaran, daya beda. dan
reliabilitas (Mardapi, 1998).
• Zulaiha (2012) menambahkan perlunya menganalisis keefektifan
pengecoh pada tes pilihan ganda
UKURAN SAMPEL UJICOBA INSTRUMEN
• Sudaryono (2011) menekankan perlunya standard minimal ukuran
sampel ujicoba instrument. Untuk mendapatkan hasil analisis yang
baik, seharusnya jumlah soal paling tidak 40 sampai dengan 50 dan
diujicobakan pada paling tidak 400 peserta tes, atau setidaknya 5X
banyaknya butir (Azwar, 2017).
• Jika ukuran sampel kurang dari standard minimal akan mengganggu
untuk analisis lebih lanjut, misalnya analisis faktor menggunakan SPSS
maupun LISREL.
EFEKTIVITAS PENGECOH
Anatomi Butir Tes PG

Pokok
Soal
Butir Kunci
Soal PG Jawaban

Pilihan
Jawaban
Pengecoh

• Suatu pengecoh dikatakan berfungsi secara efektif apabila memiliki indeks


keterpilihan ≥ 5% dari seluruh peserta tes.
• Idealnya peserta tes berkemampuan rendah lebih banyak memilih dari pada
peserta tes yang berkemampuan tinggi.
• Daya beda pengecoh yang baik seharusnya bernilai negatif (Zulaiha, 2012).
Rumus Kefektifan Pengecoh

𝐸𝑃 =
∑ 𝑃𝑖
𝑛
Keterangan:
= Jumlah peserta tes yg memilih pengecoh ke I
n= banyak peserta tes

Daya Beda Pengecoh


(𝐾 𝐴 −𝐾𝐵)
𝐷𝐵𝑃 =
𝑛
Keterangan:
= Banyak kelompok atas yg memilih pengecoh ke i
= Banyak kelompok bawah yang memilih pengecoh ke I
n= Banyak kelompok bawah atau atas
Pilihan Jawaban
NB A B C D
1 Atas 20 5 2 12 1
Bawah 20 3 6 2 9
EP 0,2 0,2 0,25
DBP 0,1 -0,2 -0,4
2 Atas 20 0 11 4 5
Bawah 20 1 2 14 3
EP 0,025 0,45
DBP -0,05 -0,5 0,1
INDEK KESUKARAN BUTIR

• Tingkat kesukaran butir adalah peluang untuk menjawab benar suatu


soal pada tingkat kemampuan tertentu yang umumnya dinyatakan
dalam bentuk indeks.
• Tingkat Kesukaran adalah jumlah siswa yang menjawab benar butir
soal dibagi dengan jumlah siswa yang mengikuti tes.
• Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk
proporsi yang besarnya berkisar 0,00 – 1,00. Soal yang memiliki
indeks 0,00 artinya tidak ada siswa yang menjawab benar, indeks 1,00
artinya siswa menjawab benar butir tes.
INDEKS KESUKARAN
• Indeks kesukaran merupakan proporsi antara peserta tes yang
menjawab butir tertentu benar dan seluruh peserta tes.
• Fungsi tingkat kesukaran butir soal pada umumnya dihubungkan
dengan tujuan tes (Aiken, 1988). Misalnya untuk ujian semester
digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk
keperluan seleksi digunakan butir soal yang memiliki tingkat
kesukaran tinggi, dan untuk keperluan diagnostik maka digunakan
butir soal yang memiliki tingkat kesukaran rendah atau mudah.
𝐽𝐵 Kriteria:
𝐼𝐾 =
𝐽𝑆 ≤ 0,25 = Sukar
Keterangan: 0, 26 - 0,75 = Sedang
JB= Jumlah peserta tes yang menjawab butir benar ≥ 0,76 = Mudah (Nurgiyantoro,
JS= Jumlah Siswa 2013)
DAYA BEDA BUTIR
• Indeks daya beda butir merupakan kemampuan suatu butir untuk membedakan antara
peserta tes yang berkemampuan tinggi dan peserta didik yang berkemampuan rendah.
• Butir tes yang baik idealnya lebih banyak dijawab benar oleh peserta tes yang
berkemampuan tinggi. Ini akan menghasilkan IDB positif.
• Jika butir lebih banyak dijawab benar oleh peserta tes yang berkemampuan rendah,
butir tersebut akan berdaya beda negatif.
• Suatu butir yang dijawab benar oleh seluruh peserta tes merupakan butir yang
berdaya beda nol alias butir gagal (Sudaryono, 2011).
• Indek daya beda sering dianggap sebagai validitas butir (Zulaiha, 2013), sementara
Kumaidi (2014) menyebut suatu kesalahkaprahan jika IDB disebut sebagai validitas.
• Nilai IDB berada pada kisaran -1,00 sd 1,00
• Nilai IDB ≥0,30 sudah dianggap baik (Azwar, 1996).
• Indeks daya beda butir dapat juga dilihat dari nilai point biserial butir (Untuk
analisisnya bisa dipermudah dengan software ITEMAN). Mahasiswa S2 disarankan
menggunakan ini.
IDB
Keterangan:
IDB= Indeks Daya Beda Butir
JBA= Jumlah peserta tes Kelompok Atas yang menjawab butir tsb benar
JBB= Jumlah peserta tes Kelompok Bawah yang menjawab butir tsb benar
n= Jumlah peserta tes kelompok atas atau bawah
Keterangan:
Mp= Skor rata-rata hitung dari subyek yang menjawab betul butir tersebut
Mt= Skor rata-rata dari skor total
Sdt= Standar deviasi skor total
p= Proporsi peserta tes yang menjawab betul pada butir yang dicari validitasnya
q= Poroporsi peserta tes yang menjawab salah pada butir yang dicari validitasnya
KRITERIA INDEKS DAYA BEDA

Indeks Daya Beda Keputusan


≥ 0,40 Bagus sekali
0,30 – 0,39 Bagus, masih perlu ditingkatkan
0,20 – 0,29 Belum bagus, perlu diperbaiki
< 0,20 Jelek, harus dibuang
Sumber Azwar, 1996
RELIABILITAS TES PILIHAN GANDA
• Reliabilitas merupakan keajegan atau konsistensi hasil pengukuran. Tes yang
reliabel akan memberikan hasil ukur yang kurang lebih konsisten dari waktu ke
waktu sekalipun yang melakukan pegujian orang yang berbeda (Retnawati,
2017).
• Terdapat berbagai formula penghitungan reliabilitas tes pilihan ganda, tiga
diantaranya adalah KR20, KR21, dan Alpha.
• Nilai koefisien reliabilitas berada pada kisaran -1,00 sd 1,00
• Nilai koefisien reliabilitas dipengaruhi oleh nilai daya beda butir.
• Nilai koefisien reliabilitas rendah bisa ditingkatkan dengan menggugurkan butir-
butir yang berdaya beda rendah dan menggantinya dengan butir yang berdaya
beda tinggi.
Reliabilitas dengan Rumus Kuder Richardson 20

Keterangan:
KR20= Koefisien Reliabilitas
k = Jumlah butir soal
p= proporsi jawaban bettul
q= proorsi jawaban salah
S2= Varian skor tes
Reliabilitas dengan Rumus Kuder Richardson 21

Keterangan:
KR21= Koefisien Reliabilitas
k = Jumlah butir soal
= Mean
S2= Varian
Reliabilitas dengan Rumus Alpha

Keterangan:
k= jumlah butir soal
= jumlah varian butir ke i
= Varian total
Kategori Reliabilitas
Nilai Keterangan
< 0,20 Sangat rendah
0,20 – 0,39 Rendah
0,40 – 0,69 Sedang
0,70 – 0,89 Tinggi
≥ 0,90 Sangat Tinggi
Sumber: Alen dan Yen, 1979

≥ 0,90 reliabel (Azwar, 1996)


≥ 0,85 reliabel (Retnawati, 2017)
v1
Prototype Konstruksi Tes V2

V3
C4
V4

V5

V6
V7
HOTS C5
V8
V9
V10
V11
V12
C6
V13

V14
V15
A B C
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 1 1 0 1 1 0 1 1 1 0 1 0 1 0 1
2 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0
3 1 1 0 1 0 0 0 1 1 1 0 1 1 1 1
4 0 1 0 1 0 0 1 1 1 0 1 1 0 1 1
5 0 1 0 0 1 1 1 0 0 1 0 1 0 1 0
6 1 0 1 1 1 1 1 1 1 1 1 1 0 0 1
7 1 0 1 1 0 1 1 1 1 1 1 0 1 1 1
8 0 1 1 1 1 0 1 1 1 1 0 1 1 0 1
9 0 1 1 1 0 1 0 1 0 0 0 1 1 1 0
10 0 1 1 1 1 0 0 1 1 1 1 0 1 1 0
11 0 0 1 1 0 1 1 0 1 0 0 0 1 0 0
12 0 0 0 1 0 1 1 0 0 0 0 0 1 1 0
13 0 0 1 1 0 0 0 1 0 1 0 1 1 0 0
14 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1
15 0 0 1 1 0 0 1 0 1 1 1 1 1 0 1
16 0 0 0 1 0 0 0 0 1 0 0 1 0 0 1
17 1 0 1 1 0 0 1 1 0 0 1 0 0 1 1
18 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
19 1 0 0 0 1 1 0 1 0 1 1 0 0 1 1
20 1 1 1 1 0 1 1 0 0 1 1 0 1 1 0
Hasil Analisis SPSS Siklus 1
Cronbach's
Alpha
0,638

Ite m-To tal S tatis tic s


Corrected Cronbach'
Item -Total s Alpha if
Correlatio Item
n Deleted
V1 0,520 0,577
V2 0,346 0,607
V3 0,306 0,614
V4 0,112 0,638
V5 0,414 0,595
V6 0,079 0,649
V7 -0,106 0,675
V8 0,449 0,592
V9 0,347 0,607
V10 0,432 0,594
V11 0,509 0,580
V12 0,036 0,655
V13 0,153 0,636
V14 0,109 0,643
V15 0,185 0,632
Has il Analis is S P S S S iklus 2
Re liabili
Cronbach'
s Alpha
0,721

Ite m-To tal S tatis tic s


Corrected
Item -Total Cronbach's
Correlatio Alpha if Item
n Deleted
V1 0,482 0,678
V2 0,282 0,720
V3 0,235 0,728
V5 0,530 0,668
V8 0,511 0,674
V9 0,288 0,718
V10 0,457 0,684
V11 0,532 0,668
Hasil Analisis SPSS Siklus 3
Re liabili
Cronbach'
s Alpha
0,742

Ite m-To tal S tatis tic s


Corrected Cronbach'
Item -Total s Alpha if
Correlatio Item
n Deleted
V1 0,590 0,663
V5 0,501 0,698
V8 0,471 0,709
V10 0,417 0,728
V11 0,546 0,681
TERIMA KASIH
SEMOGA BERMANFAAT

Anda mungkin juga menyukai