BAB II
CLASICAL TEST THEORY (CTT) dan
ITEM RESPONS THEORY (IRT)
5
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
6
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
Gambar 2.1
Kemampuan testee pada CTT
7
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
kan koefisien korelasi antara dua skor amatan yang diproleh dari hasil
pengukuran menggunakan tes paralel.
Nilai keandalan suatu tes dapat ditentukan dengan berbagai cara,
antara lain metodebelah dua, alfa (𝛼)Cronbach, Guttman, dan
metodeparalel. Nilai hasil perhitungan disebut sebagai koefisien
keandalan. Mehrens dan Lehmann (1973) seperti ditulis oleh Allen dan
Yen (1979:73) menyatakan bahwa meskipun tidak ada ketentuan umum,
tetapi secara luas dapat diterima bahwa tes yang digunakan untuk mem-
buat keputusan secara perorangan paling tidak harus memiliki koefisien
keandalan 0,85.
Kesahihan secara empirik dinyatakan oleh suatu koefisien yang
dinamakan koefisien kesahihan. Kesahihan dinyatakan oleh korelasi
antara distribusi skor tes yang berkaitan dengan distribusi skor kriteria
yang relevan. Kriteria dapat berupa skor tes lain yang mempunyai fungsi
ukur sama dengan tes yang bersangkutan dan dapat juga berupa ukuran
lain yang relevan, misalnya tampilan pada suatu pekerjaan, hasil rating
yang diperoleh fihak ketiga (Saifuddin Azwar, 2006: 10). Jika skor tes
diberi notasi (X) dan skor kriteria dinyatakan dengan (Y), maka
koefisien korelasi antara tes dan kriteria dinyatakan dengan
(rXY ).rXY menyatakan tinggi rendahnya kesahihan suatu alat ukur.
Nilaikesahihan paling rendahsamadengan 0, dan paling
tinggisamadengan 1. Pada kenyataannya sulit untuk mencapai nilai
kesahihan tertinggi (rXY = 1), sebabtidakadahasilpengukuran yang
sempurna.
2. Tingkat Kesukaran
Tingkat kesukaranitemyang disimbolkan dengan p merupakan
salah satu parameter item pada analisisitem. Tingkat kesukaranitem
dapat dihitung dengan berbagai cara, salah satunya adalah proporsi
jawaban benar (Bahrul Hayat, dkk., 1999). Secara matematis proporsi
menjawab benar item tertentu (p)dihitungdari banyak testee yang
menjawab benar(∑ B)untukjumlah testee (N)ditulis sebagai berikut:
∑B
p= (2.1)
N
Hasil hitung nilai p menyatakan bahwa, jika p mendekati 0,
makaitem terlalu sukar, dan jika nilai p mendekati 1, makaitem terlalu
mudah. Soal yang terlalu mudah atau terlalu sukar tidak memberi
8
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
3. Daya Beda
Daya beda merupakan parameter tes yang memberikan informasi
tentang seberapa besar soal mampumembedakan testee yang skornya
tinggi dan rendah. Daya beda dihitung dengan beberapa cara antara lain,
koefisien korelasi point biserial(rpbis ). dan koefisien korelasi
biserial(rpbis ).Korelasi point biserial dicari berdasarkan proporsi testee
yang menjawab benar pada item soal (p), mean skor pada tes dari
testee yang memiliki jawaban benar pada (Mp ) dan mean skor total
(Mt ). Ubahan tersebut dinyatakan dalam persamaan 2.2.
Mp − Mt p Mp − Mt p
rpbis = √ = √ (2.2)
ST 1−p sT q
4. Efektivitas Distraktor
Soal pilihan ganda memiliki pengecoh, yaitu jawaban yang tidak
bernilai benar. Setiap pengecoh dibuat sedemikian rupa sehingga
9
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
menarik perhatian testee yang belum memiliki konsep yang baik ter-
hadap materi yang diujikan.
Allen dan Yen (1979: 102), pengecoh yang baik minimum ber-
indeks 0,1 yang berupa koefisien korelasi point biserial, dan bernilai
negatif. Untuk
kuncijawabanbernilaipositif.Efektifitasdistraktordapatdilihatdarihasilhitu
ng point biserialsemuapilihanjawaban yang
disediakan.Jikapoilihanjawabanberindeks 0,1danbernilainegative,
makapilihanjawabantersebutcukupefektifsebagaipengecoh.
5. Kesalahan Pengukuran
Kesalahan pengukuran (Standard Error of Measurement: SEM)
membantu pemakai tes dalam memahami kesalahan yang bersifat acak.
SEM mempengaruhi skor testee. Allen dan Yen (1979: 246),
menyatakanbahwa, jilastandard deviasi dari skor total(σx ), koefisien
reliabilitas tes (ρxx′ )maka kesalahan
pengukuran(𝜎𝐸 )dituliskansepertipada persamaan 2.5.
σE = σx √1 − ρxx′ (2.5)
10
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
11
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
p(u1 , u2 , u3 … … un |θ)
= p(u1 |θ). p(u2 |θ) … … . . p(un |θ)
p(u1 , u2 , u3 … … un |θ)
n n 2.6
= ∏ p(u1 |θ) = ∏ Pi (θ)x iQ i (θ)1−x i
i=1 i=1
Gambar 2.2
DuaItem TesdenganIndeksKesulitanBerbeda
12
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
Gambar 2.3
ModelLogistik 1 Parameter
exp(𝜃𝑗 − 𝑏𝑖 )
𝑃𝑖𝑗 (𝜃𝑗 , 𝑏𝑖 ) = (2.7)
1 + exp(𝜃𝑗 − 𝑏𝑖 )
13
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
exp{𝑎𝑗 − 𝑏𝑖 ) (2.8)
𝑃𝑖𝑗 =
1 + exp{𝑎𝑖 (𝜃𝑗 − 𝑏𝑖 )}
Gambar 2.4
ModelLogistik 2 Parameter
3. ModelLogistik 3Parameter
Modellogistik3 parameter, selainmemilikiparameter ciri item yang
sama dengan pada modellogistik 1 dan 2 parameter, jugamemiliki
parameter tebakanatauguessing(c), yang tidak dimiliki oleh
modellogistik 1 dan 2 parameter. Model logistic3 parameter
digambarkan padaGambar 2.5.
exp{ai (θj − bi )}
Pij = ci + (1 − ci ) (2.9)
1 + exp{ai (θj − bi )}
14
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
Gambar 2.5
ModelLogistik 3 Parameter
15
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
tung pada taraf kesulitan tes. 3).Model tes dapat memberikan dasar
pencocokan antara item dan tingkat kemampuan. 4).Model tes yang
asumsi-asumsinya mempunyai dukungan kuat. 5).Model tes tidak
memerlukan asumsi paralel dalam pengujian reliabilitas.
16
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
Hasil kajian tentang Teori Tes Klasik dan Teori Respons Item
atauTeoriTes Modern ditinjau dari item statistik dapatdiringkas seperti
pada tabel 2.1.
17
Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
Tabel: 2.1.
StatistikItempada Teori Tes Klasik dan Teori Respons Item
Statistik Teori Tes Klasik Teori Respons Item
Indeks Kesukaran Nilaip,proporsi benar Parameter b, lokasi item pada
item(b) dari testee, tergantung skala indeks kesukaran, dapat
pada sampel. dideteksi dengan mengguna-
kan model logistik 1 para-
meter.
Indeks Daya Τ biserial dari atau r Parametera,merupakan garis
Bedaitem (a) pointbiserial, korelasi singgung pada titik b item ter-
antara skoritem dan tentu, dapat dideteksi meng-
skor total gunakan model logistik 2
parameter.
Kemampuan Skor mentah dari Estimasi parameter θ. Lokasi
Peserta (θ) subjek yang mengikuti pada indeks kesukaran atau
tes. kemampuan
Akurasi Skor Reliabilitas dan Standard error dari estimasi
standard error of kemampuan.
measurement (SEM)
dari rerata skor tes.
Tebakan (c) Tidak dapat terdeteksi Parameter c (guessing) , lokasi
pada probabilitas, hanya
dapat dideteksi jika
menggunakan modellogistik 3
parameter.
18