Model
George Rasch mengembangkan satu model analisis dari teori respon butir (atau Item
Response Theory, IRT) pada tahun 1960-an biasa disebut 1PL (satu parameter logistic) (Olsen,
2003). Model matematika ini kemudian dipopulerkan oleh Benjamin Wright (Linacre, 2011).
Dengan data mentah berupa data dikotomi (berbentuk benar dan salah) yang
mengindikasikan kemampuan siswa, Rasch memformulasikan hal ini menjadi satu model
yang menghubungan antara siswa dan aitem (Sumintono & Widhiarso, 2015).
Rasch mengembangkan model pengukuran data yang dapat menentukan hubungan antara
tingkat kemampuan siswa (person ability) dan tingkat kesukaran item (item difficulty) dengan
menggunakan fungsi logaritma untuk menghasilkan pengukuran nilai interval yang sama
(Sumintono, 2014). Rasch berpendapat bahwa, “Individu yang memiliki tingkat kemampuan
abilitas yang lebih besar dibanding individu lainnya seharusnya memiliki peluang yang lebih
besar untuk menjawab satu butir soal dengan benar. Dengan prinsip yang sama butir yang lebih
sulit menyebabkan peluang individu untuk mampu menjawabnya menjadi kecil” (Goh et al.,
2017)
Analisis di dalam Model Rasch menggunakan data skor mentah yang diperoleh langsung
dari penilaian terhadap soal yang diujikan kepada siswa dan dikonversi dalam
skala logit (Sumintono & Widhiarso, 2015). Skala logit (log odds unit) merupakan skala
dengan interval sama dan bersifat linear yang berasal dari data ratio (odds ratio) untuk
menunjukkan abilitas siswa dan kesulitan item. Skala logit yang dihasilkan tergantung dari
pola respon yang diberikan. Beberapa kelebihan model Rasch yaitu mampu memberikan
rincian hasil analisis data tes antara item dan person ability meliputi output peta wright, item
measure, person measure, Matriks Guttman, item fit, person fit, Reliabilitas, dan kurva fungsi
informasi
Pendekatan yang digunakan untuk memahami Permodelan Rasch yaitu melalui Scalogram
atau Matriks Guttman. Matriks Guttman menjadi dasar dari permodelan Rasch. Guttman
memperkenalkan pemeringkatan skala sikap dalam bentuk matriks yang diurutkan dari
tingkat terendah ke yang tertinggi. Hal ini bertujuan untuk memudahkan peneliti dalam
menganalisis dan memberikan prediksi akan kemampuan individu responden sekaligus
tingkat kesulitan soal atau butir item (Sumintono dan Widhiarso, 2015). Permodelan Rasch
menggunakan Matriks Guttman.
Kemampuan melakukan prediksi terhadap data yang hilang (missing data) yang didasarkan
pada pola respons sistematis (format skalogram). Hal ini menjadikan hasil analisis statistik
lebih akurat. Dalam model statistik lain, biasanya memperlakukan data hilang dengan nilai
nol, bahkan jika tingkat persentase data hilang tinggi, maka analisis tidak dapat memberikan
kesimpulan yang memuaskan. Namun dengan kemampuan prediksinya, pemodelan Rasch
menghasilkan kemungkinan nilai terbaik dari data yang hilang.
Nilai MNSQ selalu positif dan bergerak dari nol (0) hingga tak hingga (∞). Dalam
hal ini nilai MNSQ digunakan untuk memantau kesesuaian data dengan model.
Nilai mean square yang diharapkan adalah 1 (satu). Nilai mean-square pada infit atau
outfit yang lebih besar daripada satu, katakanlah 1,3 mengindikasikan bahwa data
yang diobservasi memiliki 30% variasi lebih banyak daripada yang diprediksi oleh
Rasch. Nilai infit atau outfit kurang dari 1, katakanlah 0,78 (1-0,22=0,78)
mengindikasikan bahwa data yang diobservasi memiliki 22% variasi lebih sedikit
daripada yang diprediksi oleh Rasch model (Bond & Fox, 2015).
Menurut Boone, et al. (2014), kriteria yang digunakan kriteria yang digunakan untuk
memeriksa butir soal yang sesuai adalah
1. Nilai Outfit Mean Square (MNSQ) yang diterima : 0,5 < MNSQ < 1,5
2. Nilai outfit Z-standard (ZSTD) yang diterima: -2,0 < ZSTD < +2,0
Jika butir soal pada kedua kriteria tersebut tidak terpenuhi, itu artinya butir soal
tersebut tidak bagus dan perlu direvisi atau diganti. Berbeda dengan tingkat
kesulitan item yang sifatnya konsisten, tingkat kesesuaian item ini sangat
dipengaruhi oleh besarnya ukuran sampel. Kesalahan kunci jawaban, banyaknya
individu yang asal-asalan dalam mengerjakan soal, dan soal yang memiliki daya
beda rendah dapat menurunkan nilai keseuaian item. Yang perlu dicermati lainnya
adalah, nilai ZSTD ini sangat sensitif terhadap jumlah sampel. Apabila sampel yang
digunakan jumlahnya besar (>500), ada kecenderungan untuk nilai ZSTD ini
memiliki nilai di atas 3. Oleh karena itu, beberapa ahli merekomendasikan untuk
tidak menggunakan kriteria ZSTD ini jika sampel yang digunakan cukup besar
(Suminto & Widhiarso, 2015).
Bias Butir
Bias butir sebenarnya bukanlah karakteristik yang dijadikan pertimbangan utama
dalam seleksi item. Meskipun demikian informasi mengenai adanya item yang bias
sangat berpengaruh terhadap akurasi pengukuran. Suati butir disebut bias jika
didapati bahwa individu dengan karakteristik tertentu lebih diuntungkan dalam
menjawab soal dibanding individu dengan karakteristik lain. misalnya, suatu soal
bisa lebih mudah dijawab oleh orang yang tinggal di kota daripada orang yang
tinggal di desa. Dalam model Rasch, bias butir dapat dideteksi dengan
DIF (differential item functioning). Item-item yang terdidentifikasi DIF (p<0,05)
disarankan untuk direview ulang dan jika dirasa perlu direvisi atau diganti.
Referensi
Alagumalai, S., Curtis, D. D., & Hungi, N. (2005). Applied Rasch Measurement: A Book
of Exemplars. Dordrecht: Springer
Benyamin, J. C. (1998). Analisis Kualitas Soal Ebtanas PPKn SMU Tahun Pelajaran
1996/1997 dengan Pendekatan Model Rasch di provinsi Nusa Tenggara
Timur. Yogyakarta: Universitas Gadjah Mada.
Bond, T. G., & Fox, M. C. (2015). Applying the Rasch Model Fundamental Measurement
in the Human Sciences Third Edition. New York: Routledge.
Boone, W. J., Staver, R. J., & Yale, S. M. (2014). Rasch Analysis in the Human
Sciences. London: Springer.
Smiley, J. (2015, April). Classical test theory or Rasch: A personal account from a
novice user. SHIKEN, hal. 16-31.
Sumintono, B., & Widhiarso, W. (2015). Aplikasi Pemodelan Rasch pada Assessment
Pendidikan. Cimahi: Trim Komunikata.