BAKIR HARYANTO
Review Classical Test Theory…
Keterbatasan Tes Teori Klasik
1) Sample Dependence
2) Terbatas untuk situasi tes tertentu; skor tes sulit dibandingkan
dengan skor tes yang lainnya yang memiliki tingkat kesulitan yang
berbeda
3) Konsep reliabilitas CTT yang bergantung kepada bentuk tes yang
paralel
4) Standar eror pengukuran yang sama untuk semua peserta tes
Review Classical Test Theory…
100
90
80
70
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100
SKOR TES 1
Ilustrasi pada CTT
Skor Total relatif antara dua orang berubah sesuai dengan sebaran butir soal pada
skala laten (dimensi)
Dif = 5 – 0 = 5
Dif = 5 – 5 = 0
Dif = 4 – 2 = 2
Dif = 3 – 3 = 0
CTT: Sukar menghubungkan TOTAL Skor Dengan Kisi-Kisi Soal
Tingkat Kesulitan SKOR Orang
Soal (Item Difficulty)
Person 1 1 1 1 1 Person 1 1 1 1 1
Person 2 1 1 1 0 Person 2 1 1 0 0
Person 3 1 1 0 0 Person 3 1 0 1 0
Person 4 1 0 0 0 Person 4 0 1 0 0
Person 5 0 0 0 0 Person 5 1 0 0 0
person-item contact
person ability = b Item difficulty = d
-∞ < b – d < +∞ 15
↓
0<e (b – d) < +∞ 10
↓
5
0< e(b-d) /{1+e(b-d)} <1
-3 -2 -1 1 2 3
The Probability
Raschof getting
model
the item correct
b−d
e
P{x = 1} = b−d
1+ e
Probability of getting the
item incorrect b−d
e
P{x = 0} = 1 − b−d
1+ e
b−d b−d
1+ e e 1
= b−d
− b−d
= b−d
1+ e 1+ e 1+ e
Jika seseorang dengan kemampuan b menjawab suatu soal
dengan kesulitan d, maka peluang menjawab benar (Prob (1))
adalah fungsi dari (b-d)
b-d -5 -4 -3 -2 -1 0 1 2 3 4
Prob(1) 0.01 0.02 0.05 0.12 0.27 0.50 0.73 0.88 0.95 0.98
1.0 0.98 0.97 0.95 0.92 0.88 0.82 0.73 0.62 0.50 0.38 0.27 0.18 0.12
0.5 0.97 0.95 0.92 0.88 0.82 0.73 0.62 0.50 0.38 0.27 0.18 0.12 0.08
0.0 0.95 0.92 0.88 0.82 0.73 0.62 0.50 0.38 0.27 0.18 0.12 0.08 0.05
-0.5 0.92 0.88 0.82 0.73 0.62 0.50 0.38 0.27 0.18 0.12 0.08 0.05 0.03
-1.0 0.88 0.82 0.73 0.62 0.50 0.38 0.27 0.18 0.12 0.08 0.05 0.03 0.02
-1.5 0.82 0.73 0.62 0.50 0.38 0.27 0.18 0.12 0.08 0.05 0.03 0.02 0.01
-2.0 0.73 0.50
0.62 0.38 0.27 0.18 0.12 0.08 0.05 0.03 0.02 0.01 0.01
-2.5 0.62 0.50 0.38 0.27 0.18 0.12 0.08 0.05 0.03 0.02 0.01 0.01 0.00
-3.0 0.50 0.38 0.27 0.18 0.12 0.08 0.05 0.03 0.02 0.01 0.01 0.00 0.00
Success Probabilities
1.00
0.80
0.60
0.40
0.20
0.00 - -2.
1.5 0
2.0 - 1
1.0 0.0-0.5 .0
0
0.0 1.0 .5
1 Item
-1.
0 2.0 .5
0
Person Ability -2. Difficulty
Item Characteristic Curves
1.00
Probability of correct response
0.80
0.60
0.40
Item 1
0.20 Item 2
Item 3
0.00
Person ability
ICC teoretik
dan Item
Difficulty
Logits
• Logits = log odds units = the natural log of the success odds
• If the success odds is 80:20 (=4.0), then the person is ln(4.0) =1.39 logits
above the item.
• If the person is 1.00 logits below the item, b-d = -1.00, so the success odds is
e-1 = 0.37
• “Person A’s ability is -1.37 logits” means that he is -1.37 logits below an item
of 0.00 logits, and that his/her odds of success on that item is e-1.37 = 0.254
Transformasi Skala Logit
• Nilai 0 pada skala logit bersifat “arbitrary” dan rentangnya bisa negatif
dan positif
• Transformasi linear bisa membuat skala logit menjadi positif,
contohnya pada skala PISA. PISA menetapkan mean 500 dan standar
deviasi 100 skor ability (Mathematics, Reading, Science)
Rasch Model - Specific Objectivity
• Specific Objectivity adalah persyaratan bahwa pengukuran yang
dihasilkan oleh model pengukuran harus bebas dari sampel bagi agen
(item tes) dan bebas dari tes bagi objek (peserta).
• Pengukuran yang bebas dari sampel berarti "estimasi kesulitan item
harus bebas (independent) dari individu mana pun, dan dari distribusi
kemampuan individu apa pun, yang mungkin termasuk dalam
sampel." Pengukuran yang bebas dari tes berarti "estimasi
kemampuan individu bebas dari item apa pun, dan dari distribusi
kesulitan item, yang mungkin termasuk dalam tes."
p
i =1
vi (1 − pvi )
UNDER FIT - Ketika ICC yang diamati “lebih datar” daripada ICC
yang diharapkan, nilai mean-square fitnya lebih besar dari satu.
Linacre (2002)
Advantages of Rasch Model
• Test-free person measurement
Dimungkinkan untuk membandingkan kemampuan dua orang yang mengambil
dua tes berbeda – satu tes mudah dan satu tes sulit.
• Sample-free item calibration
Dimungkinkan untuk membandingkan tingkat kesulitan dari dua soal yang
dicoba oleh dua kelompok yang berbeda – yang satu lebih mampu dari yang lain
–
• Memiliki estimasi reliability yang lebih akurat
Dalam CTT, SEM dihitung sama untuk seluruh peserta test, dalam Rasch Model,
setiap skor ability memiliki masing-masing SEM.
Advantages of Rasch Model
• Mudah untuk proses equating skor
Vertical Equating
Horizontal Equating
• Item Banking
• Computerized Adaptive Test
✓ Respons yang benar akan memberikan soal yang lebih sulit;
✓ Respons yang salah akan memberikan soal yang kurang sulit
✓ Peserta tes bisa mengambil set item yang berbeda;
✓ Peningkatan keamanan dan fleksibilitas
✓ Pengukuran yang lebih presisi dengan waktu pengerjaan tes yang lebih
singkat
RASCH ANALYSIS OUTPUTS