Halyadin
Nurmawaddah Rustam
PEP 2020
sukses dari teori respon butir bergantung pada adanya prosedur yang cukup
yang diketahui adalah respon dari peserta ujian terhadap butir yang diuji.
Masalah dari estimasi adalah untuk menentukan nilai θ untuk setiap peserta
ujian dan parameter butir dari respon butir. Masalah ini sama dengan yang
diperkirakan.
butir. Pertama tama, model regresi biasanya lınear sedangkan model respon
(independen) dalam analisis regresi dapat diamati Yaitu, Dalam model respon
butir " regressor variabel " θ tidak dapat diamati. Jika θ dapat diamati atau dikenal,
sederhana, meskipun kita masih akan berurusan dengan model regresi nonlinear.
sederhana.
yang tidak mungkin bahwa model cocok dengan data dengan tepat, dan ketika θ
digunakan. Dalam hal ini, hanya sebanyak poin yang ada parameter butir dalam
digunakan karena model tidak akan cocok data dengan tepat. Dalam kasus
ini, strategi kami adalah untuk menemukan nilai parameter yang akan
menghasilkan kurva "paling pas". Dalam regresi linear, ukuran terbaik sering
didefinisikan dalam hal kriteria kotak paling sedikit. Dalam model IRT
kriteria kotak tidak digunakan karena sulit untuk menentukan sifat dari
estimasi kotak paling sedikit dalam model nonlinear. Sebagai alternatif,
dikenal dalam sampel besar. Dan informasi ini dapat digunakan dalam
berbagai cara dalam aplikasi IRT. Kami pertama kali akan mennggambarkan
Estimasi kemampuan
kumpulan n butir dengan pola respon (U1,U2 ,..,UJ,…., Un) Dimana Uj adalah
1dari indenpendensi lokal (respon yang benar) atau θ (respon yang salah)
Atau sederhananya
dengan nilai parameter butir yang diketahui, yang diberikan dalam tabel 3.1.
bergantung pada parameter butir, dan parameter butir dikenal dalam contoh
ini, nilai yang tepat dari fungsi Kebolehjadian untuk θ tertentu dapat diatasi.
antara 0 dan 1, nilainya akan sangat kecil. Peningkatan yang lebih baik dari
Tabel 3.1 Parameter Butir dan Pola Respon untuk Lima Ujian pada Lima Butir
Test
Dan
seperti yang akan kita lihat, perhitungan dari turunan pertama). Dengan
ilustrasi dan tidak cocok bila banyak peserta ujian dan banyak butir yang
Kemiringan dari fungsi (turunan pertama) adalah nol. Oleh karena itu,
kebolehjadian sama dengan nol. Sekali lagi, persamaan ini tidak dapat
(l985).
menjawab semua butir dengan benar atau semua butir dengan tidak benar.
Dalam hal ini, estimasi Kebolehjadian maksimum adalah θ=+∞ atau θ=−∞
Beberapa pola respon yang aneh (yang tidak dapat dipahami seperti priori)
mungkin hasilnya juga dalam fungsi Kebolehjadian yang tidak memiliki batas
maksimum mutlak. Fungsi log-untuk dua peserta ujian pertama dari Tabel
3.1 diperlihatkan dalam gambar 3.2. Untuk peserta ujian 2, fungsi log-
memiliki nilai yang lebih tinggi pada θ = - ∞ (nilai dari fungsi ditampilkan
dalam gambar hanya untuk θ = -6). Untuk ujian I. juga, fungsi Kebolehjadian
situasi ini adalah bahwa pola respon dua peserta ujian ini menyimpang:
Peserta ujian menjawab beberapa hal yang relatif sulit dan
diskriminatif dengan butir benar dan menjawab salah beberapa hal yang
lebih mudah. Dalam kasus seperti ini prosedur numerik yang digunakan
atas dengan respon yang menyimpang terjadi hanya dengan model tiga
parameter dan tidak dengan model satu atau dua parameter. (lihat
Hambleton & Sykes swaminathan 1985. dan Yen, burket & Sykes, tekan untuk
diskusi tentang masalah ini), dan bahkan bisa muncul untuk tes yang
sebanyak 40 butir.
memiliki sifat yang dikenal sebagai asymptotik (yaitu, sampel besar). Karena
panjangnya ujian yang meningkat sebagai tes panjang yang meningkat, MLE
θ yang sebenarnya; Oleh karena itu, MLE θ^ tidak memihak dalam tes panjang.
Dimana SE (θ^ ) adalah standar kesalahan yang dievaluasi pada (θ^ ) dan
Z α /2 diatas dari (1- α /2) titik persentil dari distribusi normal . Untuk 95%
dalam beberapa situasi dapat diatasi jika prosedur estimasi Bayes digunakan.
normal dengan rata-rata μ dan standar deviasi σ ". Dalam hal ini, informasi
ditentukan B adalah
dan B adalah pola respon butir yang diamati, u. Teori Bayes' dapat ditulis:
karenanya,
f ( θ∨u ) ∝ L(u∨θ)
Dalam hal ini, estimasi Bayes identik secara numerik dengan estimasi
filosofis yang mendasari prosedur Bayes sangat berbeda dari gagasan klasik atau
relatif frekuensi peluang (lihat Kendall & Stuart [1961] untuk rincian mengenai
θ dapat diperoleh untuk nol butir yang benar dan pola respon yang sempurna, dan
Distribusi posterior dari θ dapat dijelaskan dalam banyak cara. Modus dari
dari distribusi itu, mungkin juga digunakan sebagai perkiraan. Maksudnya dapat
∑ θ j f ( θ j∨u )
j=1
μ ( θ∨u )= k [3.3]
∑ f ( θ j∨u )
j=1
Bock dan Mislevy (1982) menyebut estimasi ini sebagai perkiraan Posteriori
bahwa parameter butir sudah diketahui. Pada titik tertentu, kita harus menghadapi
kemampuan dari seorang peserta ujian ketika parameter butir diketahui, kita
untuk tanggapan dari peserta ujian ke n butir. Sebaliknya, jika kita ingin
mengestimasi parameter butir ketika θ diketahui untuk setiap peserta ujian, kami
memberikan butir dari yang menarik ke sejumlah peserta ujian dan mendapatkan
N
L ( u1 ,u2 , … , uN |θ , a , b , c ) =∏ P ui Q1−u
i
i
i
i=1
Perbedaan antara fungsi kebolehjadian dari peserta ujian dan dari sebuah butir
adalah bahwa, untuk sebuah butir, asumsi dari independen lokal tidak perlu
diajukan; Kami hanya berasumsi bahwa tanggapan dari N peserta ujian ke sebuah
butir yang independen, sebuah asumsi standar dalam statistik. Asumsi independen
lokal lebih ketat dalam hal bahwa kita harus memperkirakan bahwa respon dari
bahwa fungsi Kebolehjadian untuk sebuah butir, tidak seperti itu untuk peserta
ujian, adalah multidimensional untuk parameter butir; Artinya, itu adalah fungsi
dari tiga parameter. Jadi, untuk menemukan MLE dari parameter a, b, dan c, kita
harus menemukan nilai a, b, dan c yang sesuai dengan nilai maksimum dari
permukaan dalam tiga dimensi. Ini dicapai dengan menemukan turunan pertama
mengatur turunan ini ke nol, dan pnyelesaian secara bersamaan sistem yang
dihasilkan dari persamaan nonlinear dalam tiga hal yang tidak diketahui. Jelas,
kami menyelesaikan untuk dua hal yang tidak diketahui ketika dua model
parameter digunakan, dan memecahkan hanya untuk satu hal yang tidak diketahui
demikian, prosedur estimasi harus diulangi n kali, sekali untuk setiap butir.
Ini jelas bahwa pada titik tertentu tidak ada θ atau parameter butir yang akan
diketahui. Ini adalah situasi yang paling umum dan menyajikan masalah yang
paling sulit. Dalam hal ini respon dari semua peserta ujian untuk semua butir
N n
L ( u1 ,u2 , … , uN |θ , a , b , c ) =∏ ∏ Puij Q1−u
ij
ij
ij
i=1 j=1
Di mana ui , adalah pola respon dari peserta ujian i ke n butir; θ adalah vektor dari
N parameter kemampuan; a, b, dan c adalah vektor dari parameter butir untuk tes
n-butir. Jumlah parameter butir adalah 3n dalam tiga model parameter (2n untuk
dua - dan n untuk satu model parameter, berturut-turut). Independen lokal harus
kemampuan tidak ditentukan dengan unik. Dalam fungsi respon butir untuk,
katakanlah, model tiga-parameter (lihat untuk persamaan 2.3), jika kita mengganti
¿ ¿ ¿ a
θ dengan θ =αθ + β , b by b =αb+ β ,∧a by a = , kebolehjadian respon yang
α
P ( θ )=P(θ ¿ )
besar tidak akan memiliki keunikan maksimum. Setiap prosedur numerik yang
butir diketahui atau dalam situasi paralel di mana parameter butir yang diestimasi
simpangan baku dari nilai kemampuan N (atau n butir nilai yang sulit) ditetapkan
menjadi 0 dan 1, berturut-turut. Seperti yang akan kita lihat nanti, skala ini harus
penentuan ini hanya dilakukan dalam dua tahap. Pada tahap awal, nilai awal untuk
skor nomor-salah untuk masing-masing peserta ujian memberikan nilai awal yang
diestimasi. Prosedur ini diulangi sampai nilai estimasi tidak berubah antara dua
tiga parameter, dan di BICAL (Wright, Mead,& Bell, 1979) dan BIGSCALE
dan skor nol tidak ada. Kedua, estimasiparameter butir memperkirakan untuk butir
yang dijawab benar (atau tidak benar) oleh semua peserta ujian dihilangkan.
Butir dan peserta ujian menunjukkan pola ini harus dihilangkan sebelum estimasi
dapat diproses. Ketiga, dalam dua dan tiga model parameter, prosedur model
parameter butir dan kemampuan jika kedua angka dari peserta ujian dan angka
dari butir menjadi besar.) Keempat, dalam model tiga parameter, kecuali
prosedur Bayes untuk model satu, dua, dan tiga-parameter di mana distribusi
sebelumnya yang ditempatkan pada parameter butir dan kemampuan. Prosedur ini
bersama, yaitu estimasi yang tidak tepat untuk pola respon tertentu.
parameter butir dan kemampuan diestimasi secara simultan. Masalah ini hilang
jika parameter butir dapat diestimasi tanpa merujuk pada parameter kemampuan.
Jika kita membebani peserta ujian yang telah dipilih secara acak dari populasi,
kemampuan yang memiliki efek yang sama dengan "berjalan" melalui distribusi
distribusi dari kemampuan. Untuk perkiraan yang baik dari distribusi kemampuan,
peserta ujian dengan jumlah yang besar itu penting. Oleh karena itu, prosedur
Metode yang diuraikan di bab ini. Sekali lagi, semakin banyak jumlah butir,
semakin baik estimasi parameter kemampuan. Salah satu estimasi kebolehjadian
gagal; Artinya, prosedur numerik mungkin gagal untuk menghasilkan hasil yang
yang buruk, pada gilirannya, menurunkan estimasi parameter butir yang lain dan
Konsep dari fungsi informasi, yang diperkenalkan secara singkat di awal, adalah
diberikan sebagai invers matriks informasi dari estimasi parameter butir (karena,
dalam kasus model dua dan tiga parameter, masing-masing ditandai dengan dua
dan tiga parameter). Elemen dari matriks inforimasi untuk estimasi kebolehjadian
maksimum bersama untuk setiap butir diatur dalam cara berikut (karena matriks
Lord, 1980).
N
D2 Q
2∑
I aai = (θ i−bi )2 (Pij −c i)2 ij
(1−c i ) j =1 Pij
2 N
D ai Q
2∑
2 ij
I abi = (θ j−bi)(Pij −ci )
(1−c ) i j =1 P ij
D
N
Q
2∑
I aci= (θ j −bi )(Pij −c i) ij
(1−c i) j=1 Pij
D 2 ai2 N
Q
I bbi =
(1−c )
∑ (Pij −c i )2 ij
2
P
i j=1 ij
N
1 Qij
2∑
I cci =
(1−c i ) j=1 Pij
Pernyataan sederhana untuk matriks varians — kovarians kebolehjadian
memperolehnya diberikan dalam Mislevy dan Bock (1984) dan Mislevy (1986).
parameter butir dalam dua kelompok, masalah yang timbul dalam bias atau studi
marjinal, dan prosedur estimasi Bayes diuraikan. Ini adalah prosedur estimasi
untuk estimasi tidak diuraikan dalam bab ini. Daftar prosedur estimasi yang
untuk model satu - dua -, dan tiga parameter. Parameter kemampuan dan
Metode maksimum marginal (Bock & Aitkin, 1981), berlaku untuk model
& Gifford, 1982, 1985, 1986), berlaku untuk satu —. Model dua dan tiga
1967. 1989), dapat diterapkan pada dua parameter dan kasus yang
kasus prosedur Bayes, baik modus rata-rata atau dari fungsi kepadatan posterior e.
Prosedur yang dimusim panas di atas diterapkan dalam program komputer yang
Hingga sekarang ini, hanya sedikit program komputer yang tersedia untuk
estimasi parameter model IRT yang diperkenalkan sebelumnya. Pada tahun 1970-
an, program yang paling banyak dikenal dan digunakan adalah BICAL (Wright et
al., 1979) dan LOGIST (Wingersky, Barton, & Lord, 1982). BICAL cocok
dengan model satu parameter, Logist cocok dengan model satu, dua, dan tiga
maksimum, dan keduanya masih digunakan secara luas. LOGIST tetap menjadi
1980a) dan ANCILLES (Urry, 1974, 1978). PML cocok dengan model satu
ANCILLES tidak sering digunakan karena prosedur estimasi tidak baik berdasar
paling menonjol adalah BILOG (Mislevy & Bock, 1984) dan ASCAL (sistem
penilaian Corporalion, 1988). BILOG cocok dengan model satu, dua, dan tiga
dengan prosedur alternatif Bayes; ASCAL cocok dengan model tiga parameter
Yang juga tersedia pada awal tahun 1980-an adalah program NOHARM
(Fraser & McDonald, 1988), yang cocok dengan model dua dan tiga parameter
akan dirilis pada tahun 1991 atau 1992. RIDA (Glass, 1990) adalah program
desain yang tidak lengkap yang sering muncul dalam pengujian persamaan (lihat
chapter 9).
Yang terakhir, minat pada program IRT yang menangani data polytomous
(Thissen, 1986; Wright dan al.. 1989) dan data multidimensional (Carl. Son,
1987) telah dikembangkan, tetapi mengerjakan topik yang terakhir ini baru saja
dimulai dan perlu banyak riset sebelum program Carlson dapat digunakan.
kelebihannya serta fitur-fitur utamanya diberikan dalam tabel 3.2. Sumber untuk
Tabel 3,2 Program Estimasi Parameter IRT yang Tersedia Saat Ini
Pros (+)
Prosedur Persyaratan
Program Sumber Model Cons (-) dan
estimasi Komputer
Features (*)
(1989) baik
syarat
m digunakan di U.S
bersyarat
syarat
Maksimu lengkap
m + menggunakan desain
yang sesuai
Lanjutan Tabel 3.2
hilang/orang yang
diuji
berdasarkan teori
* Tidak digunakan
secara luas
Micro CAT
*Menggunakan prosedur
Bayes
+ Megizinkan
kelalaian/tak tercapai
- Spesifikasi penginputan
kompleks
- Sulit dikonversi ke
peralatan non-IBM
- Tempatkan banyak
kendala pada
parameter untuk
mendapatkan
konvergensi
an Version ekstrim
- Mahal dijalankan
dimainframe
- Masih ada
kebolehjadian
residual
yang pasti
* Tidak banyak
digunakan di U.S
multikategori data
3P an tanpa es PC sesuai
eror
+ Dilengkapi analisis
residual
yang pasti