PENDAHULUAN
TINJAUAN PUSTAKA
Latar Belakang
Dalam bidang pendidikan, kegiatan
penilaian atau evaluasi hasil belajar peserta
didik merupakan salah satu tugas penting
yang harus dilakukan oleh pendidik. Evaluasi
hasil belajar peserta didik dilakukan untuk
mengetahui kemajuan peserta didik terhadap
kurikulum yang telah diajarkan. Salah satu
upaya evaluasi hasil belajar peserta didik
adalah memberikan ujian pada tengah
semester dan akhir semester. Namun,
terkadang pemberian soal yang terlalu susah
atau terlalu mudah menyebabkan pendidik
sulit membedakan kemampuan peserta didik.
Oleh karena itu, diperlukan analisis terhadap
soal ujian dengan harapan hasil ujian
merepresentasikan kemampuan peserta didik.
Banyak metode yang dikembangkan dalam
bidang psikometrika yang digunakan untuk
menganalisis butir soal dari pendekatan secara
klasik hingga modern. Pendekatan secara
klasik yang digunakan adalah teori uji klasik
(classical test theory) sedangkan pendekatan
modern dengan item response theory (IRT)
atau teori respon butir.
Teori uji klasik merupakan suatu teori
yang mudah dalam penerapannya namun
memiliki banyak kelemahan. Oleh karena itu,
banyak peneliti mencoba mengembangkan
metode modern. Aspek yang diperhatikan
dalam teori uji klasik adalah setiap butir soal
ditelaah menurut (1) tingkat kesukaran butir;
(2) daya pembeda butir; (3) penyebaran
pilihan jawaban, dan (4) reliabilitas skor tes
(Safari, 2000). Teori respon butir merupakan
teori pengukuran modern yang biasanya
digunakan dalam analisis butir soal. Dalam
teori ini digunakan model matematis untuk
menghubungkan karakteristik butir soal
dengan kemampuan responden. Hubungan
tersebut
digambarkan
melalui
kurva
karakteristik butir.
Tujuan
Tujuan yang ingin dicapai dalam
penelitian ini adalah :
1. Menerapkan teori uji klasik dan teori
respon butir untuk memeriksa butir soal
pada soal Ujian Akhir Semester Tingkat
Persiapan Bersama Institut Pertanian
Bogor (UAS TPB IPB) mata kuliah Fisika
tahun ajaran 2008/2009.
2. Mencari model yang sesuai untuk
menggambarkan butir-butir soal pada soal
UAS TPB IPB untuk mata kuliah Fisika.
p=
p
r pb
q
Keterangan :
rpb = koefisien point biserial,
+ = rata-rata skor peserta ujian yang
menjawab benar,
n 1
x2
Keterangan :
n
= jumlah butir soal,
i2 = ragam skor per butir soal,
x2 = ragam skor total.
Teori Respon Butir
Teori respon butir merupakan teori
pengukuran modern yang biasanya digunakan
dalam analisis butir soal. Nama lain teori
respon butir adalah latent trait theory (LTT)
atau characteristics curve theory (CCT).
Pengembangan
teori
respon
butir
didasarkan kepada dua postulat. Postulat
pertama adalah bahwa kemampuan subyek
(examinee) pada suatu butir dapat diprediksi
oleh seperangkat faktor yang disebut traits,
latent traits atau abilities. Trait adalah
dimensi kemampuan seseorang seperti
kemampuan verbal, kemampuan psikomotor,
kemampuan kognitif, dan sebagainya. Postulat
kedua adalah bahwa hubungan antara
kemampuan peserta tes pada suatu butir dan
perangkat
kemampuan
laten
yang
mendasarinya dapat digambarkan melalui
item
kurva
karakteristik
butir
atau
Pi ( )
e Da i ( b i )
1 e Da i ( b i )
e Da i ( b i )
1 e Da i ( b i )
Keterangan :
Pi() = peluang bahwa peserta tes dengan
kemampuan menjawab butir
soal ke-i dengan benar,
ai
= parameter daya pembeda soal
butir ke-i,
= parameter tingkat kesukaran, yaitu
bi
satu titik pada skala ability dimana
kemungkinan untuk menjawab
benar sebesar 0,5.
= peluang tebakan benar butir ke-i.
ci
L ( x1 , x 2 ,..., x n | )
Pij ij Q ij
x
1 xij
j 1 i 1
l ( X | ) ln L ( x1 , x 2 ,..., x n | )
N n x 1 x
l ( X | ) ln Pij ij Q ij ij
j 1 i 1
l ( X | ) x ij ln Pij (1 x ij ) ln Qij
N
j 1 i 1
dengan
l
0 , =(;a,b,c)
dengan
1
3
Peluang
Kemampuan
Keterangan :
soal 1 (b=-1;a=1)
soal 2 (b=-1;a=0,5)
soal 3 (b=1;a=1;c=0,25)
Gambar 1. Kurva karakteristik butir dengan
bermacam-macam
macam asimtot dan
kemiringan
pij E ( pij )
z ij
Z ij2 m2 k
Keterangan :
pij
= proporsi jawaban benar pada butir
ke-ii dalam kelompok kemampuan
ke-j,
E(pij) = nilai harapan ,
Nij
= banyaknya peserta tes yang
merespon butir ke-ii dalam
kelompok kemampuan ke-j,
ke
k
= banyaknya
yaknya parameter dalam model,
model
m
= banyaknya kategori kemampuan
yang bergantung pada pe
pendugaan
kemampuan peserta tes.
Hipotesis nol dalam pengujian ini
menyatakan bahwa kurva karakteristik sesuai
untuk data respon butir ke-i.
i. Kesesuaian
model untuk suatu butir ditunjukkan
tunjukkan oleh nilai
khi kuadrat empiris butir yang tidak melebihi
nilai khi kuadrat teoritis.
Pemilihan Model
Analisis yang digunakan untuk memilih
model adalah likelihood ratio test (LRT). LRT
merupakan suatu uji yang membandingkan
nilai fungsi likelihood untuk dua model yang
akan diuji. Statistik uji LRT didefinisikan
dalam Wiberg (2007) sebagai berikut :
l (a )
2 ln[ l ( a ) l ( c )] (2m )
G 2 ln
l (c)
2
Keterangan :
l(a) = nilai fungsi likelihood dari model
augmented,
l(c) = nilai fungsi likelihood dari model
compact,
m = selisih jumlah parameter antara
model augmented dan model
compact.
Selain menggunakan menggunakan LRT,
pemilihan model dapat dilihat dari indeks
reliabiltas. Semakin tinggi nilai reliabilitas
maka modelnya semakin baik.
Kriteria Butir Soal
Pemilihan kriteria butir soal dilihat
berdasarkan uji kesesuaian model dan
besarnya nilai parameter butir soal yaitu daya
pembeda, tingkat kesukaran dan peluang
menebak. Menurut Lord (1980) dalam teori
respon butir, soal yang ideal adalah soal yang
memiliki daya pembeda berkisar 1 (satu) dan
peluang menebak mendekati nol. Dalam
Hambleton et al. (1991), nilai b yang
mendekati -2,00 menandakan bahwa butir soal
mudah, dan nilai b yang mendekati +2,00
berarti butir soal tersebut tergolong sukar
untuk
kelompok
tersebut.
Sehingga
disimpulkan sebagai berikut (secara ringkas
disajikan pada Tabel 1) :
1. Soal yang baik adalah model setiap soal
yang sesuai dengan model jika nilai khi
kuadrat empiris butir yang tidak melebihi
nilai khi kuadrat teoritis (nilai p > 0,05),
memiliki nilai daya pembeda berkisar 1,
peluang menebak kecil, dan tingkat
kesukaran berada di antara nilai -2, 00
sampai dengan +2,00.
2. Soal yang cukup baik adalah soal yang
sesuai model jika nilai khi kuadrat empiris
butir yang tidak melebihi nilai khi kuadrat
teoritis (nilai p > 0,05) dan salah satu
kriteria soal yang baik tidak terpenuhi.
3. Soal yang belum dapat digambarkan
adalah soal yang tidak sesuai dengan
model yang digambarkan jika nilai khi
kuadrat empiris butir lebih besar nilai khi
kuadrat teoritis (nilai p <0,05).
Belum
dapat
digambarkan
Nilai
p < 0,05
(uji chisquare)
Baik
Cukup
Baik
IRT
1PL
Nilai
p>
0,05;
-2b2
Nilai
p > 0,05;
b<-2 atau
b>2
IRT
2PL
Nilai
p>
0,05;
a 0.5;
-2b2
Jika salah
satu
kriteria
soal baik
tidak
terpenuhi.
Nilai
p < 0,05
IRT
3PL
Nilai
Jika salah
p > 0,05;
satu
a 0,5;
kriteria
-2<b<2; soal baik
c0,2
tidak
terpenuhi.
Nilai
p <0,05