TRB Kelompok 2

Kelompok 2
Halyadin
Nurmawaddah Rustam
PEP 2020
Estimasi Parameter Kemampuan dan Butir
Langkah pertama dan paling penting dalam menerapkan teori respon
butir untuk menguji data adalah dengan memperkirakan parameter yang
mencirikan model respon butir yang terpilih. Sebenarnya, penerapan yang
sukses dari teori respon butir bergantung pada adanya prosedur yang cukup
baik untuk memperkirakan parameter model.
Dalam model respon butir, kebolehjadian respon yang benar
tergantung pada kemampuan peserta ujian, θ , dan parameter yang
mencirikan butir. Parameter Kemampuan maupun butir tidak diketahui. Apa
yang diketahui adalah respon dari peserta ujian terhadap butir yang diuji.
Masalah dari estimasi adalah untuk menentukan nilai θ untuk setiap peserta
ujian dan parameter butir dari respon butir. Masalah ini sama dengan yang
dihadapi dalam analisis regresi dimana, dari pengamatan respon ke variabel,

parameter yang mencirikan model regresi -- Koefisien regresi -- harus
diperkirakan.
Dua perbedaan besar membedakan model regresi dan model respon
butir. Pertama tama, model regresi biasanya lınear sedangkan model respon
butir yang nonlinear. Kedua, dan sangat penting, variabel regressor
(independen) dalam analisis regresi dapat diamati Yaitu, Dalam model respon
butir " regressor variabel " θ tidak dapat diamati. Jika θ dapat diamati atau dikenal,
masalah estimasi paranmeter butir, atau "koefisien regresi," akan sangat
sederhana, meskipun kita masih akan berurusan dengan model regresi nonlinear.
Demikian pula, jika parameter butir diketahui, estimasi kemampuan cukup
sederhana.
Estimasi parameter dapat dicapai dalam beberapa cara. Dalam kejadian
yang tidak mungkin bahwa model cocok dengan data dengan tepat, dan ketika θ
diketahui, prosedur yang ditunjukkan di bagian pada persamaan parameter dapat
digunakan. Dalam hal ini, hanya sebanyak poin yang ada parameter butir dalam
model yang diperlukan untuk memecahkan Parameter yang tidak diketahui.
Apabila sebuah sampel diperoleh, prosedur di atas tidak dapat
digunakan karena model tidak akan cocok data dengan tepat. Dalam kasus
ini, strategi kami adalah untuk menemukan nilai parameter yang akan
menghasilkan kurva "paling pas". Dalam regresi linear, ukuran terbaik sering
didefinisikan dalam hal kriteria kotak paling sedikit. Dalam model IRT
kriteria kotak tidak digunakan karena sulit untuk menentukan sifat dari
estimasi kotak paling sedikit dalam model nonlinear. Sebagai alternatif,
parameter dapat diperkirakan menggunakan kriteria Kebolehjadian
maksimum. Contoh distribusi dari estimasi Kebolehjadian maksimum
dikenal dalam sampel besar. Dan informasi ini dapat digunakan dalam
berbagai cara dalam aplikasi IRT. Kami pertama kali akan mennggambarkan
prosedur Kebolehjadian maksimal untuk mengestimasi kemampuan ketika
parameter butir diketahui, dan kemudian mennggambarkan prosedur untuk
mengestimasi parameter butir.
Estimasi kemampuan
Misalkan bahwa secara acak dipilih peserta ujian menanggapi sebuah
kumpulan n butir dengan pola respon (U1,U2 ,..,UJ,…., Un) Dimana Uj adalah
1dari indenpendensi lokal (respon yang benar) atau θ (respon yang salah)
pada butir j. Dengan asumsi independensi lokal, probabilitas gabungan dari
mengamati pola respon adalah hasil dari probabilitas mengamati setiap
respon butir, yaitu.
P(U1,U2 ,..,UJ,…., Un |θ) =
P(U 1∨θ) P(U 2∨θ) … P(U j∨θ) … P (U n∨θ)
yang dapat dinyatakan dengan lebih ringkas seperti

Karena Uj adalah 1 atau 0. hal ini dapat diperhitungkan dengan menulis
fungsi kebolehjadian sebagai
Atau sederhananya
Dimana P j=P ( U j|θ ) DanQ j=1−P(U j ∨θ)
Persamaan 3.1 adalah pernyataan probabilitas gabungan dari pola
sebuah respon. Jika pola respon diamati, U j= u j, interpretasi probabilitas
tidak tepat; pernyataan untuk probabilitas gabungan sekarang disebut fungsi
Kebolehjadian dan ditandai sebagai L(U1,U2,…UJ,…,Un | θ) Dimana Uj adalah
respon diamati untuk butir j. Dengan demikian,"
Mengingat Pj dan Qj adalah fungsi dari θ dan parameter butir , fungsi
Kebolehjadian juga merupakan fungsi dari parameter ini. Sebagai contoh,

perhatikan tanggapan dari lima orang peserta ujian terhadap lima butir
dengan nilai parameter butir yang diketahui, yang diberikan dalam tabel 3.1.
fungsi Kebolehjadian untuk setiap peserta ujian mungkin ditulis dengan
menggunakan pernyataan umum di atas. Untuk 3 peserta ujian, misalny; u 1 =
0. U2 = 0, u3 = 0, u4 = 1, u5 = 1 Oleh karena itu, fungsi Kebolehjadian untuk
peserta ujian ini adalah
Karena P (dan karena Q) adalah fungsi respon butir yang bentuknya
bergantung pada parameter butir, dan parameter butir dikenal dalam contoh
ini, nilai yang tepat dari fungsi Kebolehjadian untuk θ tertentu dapat diatasi.
Khususnya, grafik fungsi Kebolehjadian sebagai variasi θ dapat digambarkan.
Karena fungsi Kebolehjadian adalah produk jumlah, masing-masing dibatasi
antara 0 dan 1, nilainya akan sangat kecil. Peningkatan yang lebih baik dari
fungsi Kebolehjadian dapat diperoleh dengan mengubahnya menggunakan
logaritma. Selain itu, karena sifat-sifat logaritma berikut,
Tabel 3.1 Parameter Butir dan Pola Respon untuk Lima Ujian pada Lima Butir
Test
Dan
Dengan menggunakan perhitungan logaritma yang sederhana (dan,
seperti yang akan kita lihat, perhitungan dari turunan pertama). Dengan
menggunakan dua sifat, pernyataan umum untuk logaritma dari fungsi
Kebolehjadian (log-, kebolehjadian, untuk pendeknya) dapat ditulis sebagai
Di sini, u adalah vektor respon butir. Grafik dari logaritma
kebolehjadian untuk peserta ujianan 3, 4, dan 5 diberikan dalam gambar 3.1.
Log-kebolehjadian untuk peserta ujian 3 memuncak pada θ = -0.5, sementara
untuk peserta ujian 4 log-kebolehjadian memuncak pada θ = 1. untuk peserta
ujian 5 memuncak pada θ = -1,5. Nilai dari θ yang membuat fungsi

Kebolehjadian (atau, sesuai, log-kebolehjadian) untuk peserta ujian
maksimum didefinisikan sebagai estimasi Kebolehjadian maksimum dari θ
untuk peserta ujian tersebut.
Masalah dari menemukan nilai maksimum suatu fungsi bukanlah
masalah sepele. Prosedur grafis yang digambarkan di atas digunakan sebagai
ilustrasi dan tidak cocok bila banyak peserta ujian dan banyak butir yang
digunakan. Nilai yang memaksimalkan fungsi didapatkan menggunakan
prosedur pencarian dengan sebuah computer. Prosedur yang lebih efisien
menggunakan fakta bahwa, pada titik di mana fungsi mencapai maksimal.
Kemiringan dari fungsi (turunan pertama) adalah nol. Oleh karena itu,
estimasi Kebolehjadian maksimum dapat ia ditentukan dengan
menyelesaikan persamaan yang diperoleh
Dasar-dasar teori respon BUTIR

Letak turunan pertama dari Kebolehjadian atau log-berfungsi
kebolehjadian sama dengan nol. Sekali lagi, persamaan ini tidak dapat
diselesaikan secara langsung, dan metode perkiraan harus digunakan.
Metode perkiraan yang paling populer adalah prosedur Newton-Raphson
yang diuraikan secara terperinci dalam bahasa Hambleton dan Swaminathan
(l985).
Sayangnya. Fungsi Kebolehjadian (atau Likelihooc log-) mungkin tidak
memiliki nilai terbatas sebagai maksimum. Seperti ketika peserta ujian
menjawab semua butir dengan benar atau semua butir dengan tidak benar.
Dalam hal ini, estimasi Kebolehjadian maksimum adalah θ=+∞ atau θ=−∞
Beberapa pola respon yang aneh (yang tidak dapat dipahami seperti priori)
mungkin hasilnya juga dalam fungsi Kebolehjadian yang tidak memiliki batas
maksimum mutlak. Fungsi log-untuk dua peserta ujian pertama dari Tabel
3.1 diperlihatkan dalam gambar 3.2. Untuk peserta ujian 2, fungsi log-
kebolehjadian memiliki maksimum pada titik θ = 0,9; Namun, fungsi ini
memiliki nilai yang lebih tinggi pada θ = - ∞ (nilai dari fungsi ditampilkan
dalam gambar hanya untuk θ = -6). Untuk ujian I. juga, fungsi Kebolehjadian
maksimum memiliki maksimum di θ =-∞ , oleh karena itu, untuk kedua
peserta ujianan, estimasi Kebolehjadian maksimum tidak ada. Alasan untuk
situasi ini adalah bahwa pola respon dua peserta ujian ini menyimpang:
Peserta ujian menjawab beberapa hal yang relatif sulit dan
diskriminatif dengan butir benar dan menjawab salah beberapa hal yang
lebih mudah. Dalam kasus seperti ini prosedur numerik yang digunakan
menemukan maksimum biasanya akan menyimpang. Masalah yang dicatat di
atas dengan respon yang menyimpang terjadi hanya dengan model tiga
parameter dan tidak dengan model satu atau dua parameter. (lihat
Hambleton & Sykes swaminathan 1985. dan Yen, burket & Sykes, tekan untuk
diskusi tentang masalah ini), dan bahkan bisa muncul untuk tes yang
sebanyak 40 butir.
Estimasi kebolehjadian maksimum (MLEs), jika memang ada,
memiliki sifat yang dikenal sebagai asymptotik (yaitu, sampel besar). Karena
kita tidak lagi berurusan dengan peserta ujian, asimptotik menunjukkan
panjangnya ujian yang meningkat sebagai tes panjang yang meningkat, MLE
dari θ, yang dinyatakan sebagai θ^ distribusikan secara normal dengan rata-

rata θ,. Hal ini menyiratkan bahwa distribusi asymptotik θ^ terpusat pada nilai
θ yang sebenarnya; Oleh karena itu, MLE θ^ tidak memihak dalam tes panjang.
Simpangan baku θ^ , atau kesalahan standar, yang disebut sebagai SE ( θ^ ),
adalah fungsi θ dan diberikan sebagai
Di mana I (θ) yang disebut dengan fungsi informasi. Sejak θ tidak
diketahui, fungsi informasi harus dihitung dengan mengganti θ^ untuk θ pada
pernyataan di atas. perhitungan fungsi informasi, sifatnya, dan perannya
dalam pembuatan tes, diuraikan secara terperinci di pasal 6.
Normalitas θ^ dapat digunakan untuk membangun interval
kepercayaan untuk θ. Interval kepercayaan (1- α ¿ % untuk θ diberikan oleh
Dimana SE (θ^ ) adalah standar kesalahan yang dievaluasi pada (θ^ ) dan
Z α /2 diatas dari (1- α /2) titik persentil dari distribusi normal . Untuk 95%
interval kepercayaan , α = 0,05 dan Z α /2 =¿ 1,96.
Masalah dari tidak menemukan estimasi kebolehjadian maksimum
dalam beberapa situasi dapat diatasi jika prosedur estimasi Bayes digunakan.
Ide dasarnya adalah mengubah fungsi kebolehjadian untuk memasukkan

setiap informasi sebelumnya yang mungkin kita miliki tentang parameter
kemampuan. Sebagai contoh, kita mungkin dapat mengatakan, berdasarkan
pada beberapa pengalaman sebelumnya, bahwa θ didistribusikan secara
normal dengan rata-rata μ dan standar deviasi σ ". Dalam hal ini, informasi
sebelumnya dapat dinyatakan dalam bentuk fungsi kepadatan dan
dinyatakan sebagai f(θ).
Teori Bayes menyatakan bahwa probabilitas dari suatu peristiwa A
ditentukan B adalah
Dimana P(A) adalah probabilitas prior dari peristiwa A yang terjadi.
Hubungan di atas juga berlaku untuk fungsi kepadatan, dimana A adalah θ
dan B adalah pola respon butir yang diamati, u. Teori Bayes' dapat ditulis:
Sekarang f (u∨θ) adalah, pada kenyataannya, fungsi kebolehjadian dan,
karenanya,
Fungsi Kebolehjadian direvisi f (u∨θ) disebut kepadatan posterior dan
modusnya adalah nilai "paling mungkin" untuk θ, dan dapat dianggap

sebagai Perkiraan dariθ . Catatan bahwa jika kita asumsikan sebuah keseragaman
distribusi sebelumnya untukθ ( yaitu, f ( θ )=k , konstan) maka
f ( θ∨u ) ∝ L(u∨θ)
Dalam hal ini, estimasi Bayes identik secara numerik dengan estimasi
Kebolehjadian maksimum. Kami menekankan secara numerik karena landasan
filosofis yang mendasari prosedur Bayes sangat berbeda dari gagasan klasik atau
relatif frekuensi peluang (lihat Kendall & Stuart [1961] untuk rincian mengenai
masalah ini). Menggunakan pendekatan Bayes memecahkan beberapa kesulitan
yang dihadapi dengan pendekatan Kebolehjadian maksimum. Estimasi Bayes dari
θ dapat diperoleh untuk nol butir yang benar dan pola respon yang sempurna, dan
untuk pola respon yang "menyimpang"
Distribusi posterior dari θ dapat dijelaskan dalam banyak cara. Modus dari
distribusi, perkiraan modal Bayes, hanya memberikan satu penjelasan. Maksud
dari distribusi itu, mungkin juga digunakan sebagai perkiraan. Maksudnya dapat
dihitung dengan mendekati distribusi posterior dalam interval terbatas dengan
sebuah histogram, yaitu, membentuk distribusi frekuensi dengan nilai k dariθ .
Frekuensi pada titik θ j ,( j=1 , … , k ) adalah f ( θ j∨u ). Maksudnya dapat kemudian
diperoleh dengan cara yang biasanya:
∑ θ j f ( θ j∨u )
j=1
μ ( θ∨u )= k [3.3]
∑ f ( θ j∨u )
j=1
Bock dan Mislevy (1982) menyebut estimasi ini sebagai perkiraan Posteriori
(EAP) yang diharapkan.
Estimasi Parameter Butir
Dalam menggambarkan prosedur untuk mengestimasi θ , kami berasumsi
bahwa parameter butir sudah diketahui. Pada titik tertentu, kita harus menghadapi
fakta bahwa parameter butir juga harus diestimasi! Untuk mengestimasi
kemampuan dari seorang peserta ujian ketika parameter butir diketahui, kita
memberikan banyak butir ke peserta ujian dan memperoleh fungsi kebolehjadian
untuk tanggapan dari peserta ujian ke n butir. Sebaliknya, jika kita ingin
mengestimasi parameter butir ketika θ diketahui untuk setiap peserta ujian, kami
memberikan butir dari yang menarik ke sejumlah peserta ujian dan mendapatkan
fungsi kebolehjadian untuk tanggapan dari N peserta ujian ke butir, yaitu,
N
L ( u1 ,u2 , … , uN |θ , a , b , c ) =∏ P ui Q1−u
i
i
i
i=1
Dimana a, b, dan c adalah parameter butir (asumsikan tiga model parameter).
Perbedaan antara fungsi kebolehjadian dari peserta ujian dan dari sebuah butir
adalah bahwa, untuk sebuah butir, asumsi dari independen lokal tidak perlu
diajukan; Kami hanya berasumsi bahwa tanggapan dari N peserta ujian ke sebuah
butir yang independen, sebuah asumsi standar dalam statistik. Asumsi independen
lokal lebih ketat dalam hal bahwa kita harus memperkirakan bahwa respon dari
seorang peserta ujian ke dua atau lebih butir bersifat independen.

Ketika nilai θ diketahui, estimasi parameter butir adalah lugas dan sebanding
dengan prosedur yang diuraikan di bagian sebelumnya. Perbedaannya adalah
bahwa fungsi Kebolehjadian untuk sebuah butir, tidak seperti itu untuk peserta
ujian, adalah multidimensional untuk parameter butir; Artinya, itu adalah fungsi
dari tiga parameter. Jadi, untuk menemukan MLE dari parameter a, b, dan c, kita
harus menemukan nilai a, b, dan c yang sesuai dengan nilai maksimum dari
permukaan dalam tiga dimensi. Ini dicapai dengan menemukan turunan pertama
dari fungsi kebolehjadian sehubungan dengan setiap parameter a, b, dan c,
mengatur turunan ini ke nol, dan pnyelesaian secara bersamaan sistem yang
dihasilkan dari persamaan nonlinear dalam tiga hal yang tidak diketahui. Jelas,
kami menyelesaikan untuk dua hal yang tidak diketahui ketika dua model
parameter digunakan, dan memecahkan hanya untuk satu hal yang tidak diketahui
ketika satu model parameter digunakan. Sekali lagi, prosedur Newton-Raphson,
dalam bentuk multivariat, digunakan umum untuk memecahkan persamaan ini.
Apabila kemampuan setiap peserta ujian diketahui, tiap-tiap butir dapat
dipertimbangkan secara terpisah tanpa merujuk pada butir lainnya. Dengan
demikian, prosedur estimasi harus diulangi n kali, sekali untuk setiap butir.
Estimasi Bersama dari Parameter Butir dan Kemampuan
Ini jelas bahwa pada titik tertentu tidak ada θ atau parameter butir yang akan
diketahui. Ini adalah situasi yang paling umum dan menyajikan masalah yang
paling sulit. Dalam hal ini respon dari semua peserta ujian untuk semua butir
harus dipertimbangkan secara simultan.

Fungsi kebolehjadian ketika N peserta ujian merespon ke n butir, menggunakan
asumsi dari independen lokal, adalah
N n
L ( u1 ,u2 , … , uN |θ , a , b , c ) =∏ ∏ Puij Q1−u
ij
ij
ij
i=1 j=1
Di mana ui , adalah pola respon dari peserta ujian i ke n butir; θ adalah vektor dari
N parameter kemampuan; a, b, dan c adalah vektor dari parameter butir untuk tes
n-butir. Jumlah parameter butir adalah 3n dalam tiga model parameter (2n untuk
dua - dan n untuk satu model parameter, berturut-turut). Independen lokal harus
diasumsikan sejak θ tidak diketahui. Jumlah parameter kemampuan adalah N dan,
karenanya, untuk tiga model parameter jumlah dari 3n + N parameter dapat
diestimasi. Sebelum estimasi dapat berlanjut, bagaimanapun, masalah dari
ketidakpastian harus ditangani.
Dalam fungsi kebolehjadian yang diberikan di atas, parameter butir dan
kemampuan tidak ditentukan dengan unik. Dalam fungsi respon butir untuk,
katakanlah, model tiga-parameter (lihat untuk persamaan 2.3), jika kita mengganti
¿ ¿ ¿ a
θ dengan θ =αθ + β , b by b =αb+ β ,∧a by a = , kebolehjadian respon yang
α
benar tidak berubah,
P ( θ )=P(θ ¿ )
Karena a dan β adalah konstanta skala yang berubah-ubah, fungsi Kebolehjadian
besar tidak akan memiliki keunikan maksimum. Setiap prosedur numerik yang
digunakan untuk menemukan maksimal fungsi Kebolehjadian akan gagal karena

ketidakpastian ini. Masalah ini tidak muncul dalam estimasi θ ketika parameter
butir diketahui atau dalam situasi paralel di mana parameter butir yang diestimasi
adanya parameter kemampuan yang diketahui, karena tidak ada ketidakpastian
dalam situasi ini.
Masalah dari ketidakpastian mungkin dieliminasi dengan memilih skala yang
berubah-ubah untuk nilai kemampuan (atau nilai b ); Biasanya, maksud dan
simpangan baku dari nilai kemampuan N (atau n butir nilai yang sulit) ditetapkan
menjadi 0 dan 1, berturut-turut. Seperti yang akan kita lihat nanti, skala ini harus
diperhitungkan ketika membandingkan estimasi dari dua atau lebih grup.
Setelah ketidakpastian dihilangkan, nilai dari parameter butir dan kemampuan
yang dimaksimalkan fungsi Kebolehjadian dapat ditentukan. Dalam prosedur
estimasi simultan atau prosedur estimasi kebolehjadian maksimum bersama,
penentuan ini hanya dilakukan dalam dua tahap. Pada tahap awal, nilai awal untuk
parameter kemampuan yang dipilih. Logaritma dari rasio skor nomor-benar ke
skor nomor-salah untuk masing-masing peserta ujian memberikan nilai awal yang
baik. Nilai-nilai ini kemudian distandarkan (untuk menghilangkan ketidakpastian)
dan, menganggap nilai kemampuan diketahui, parameter butir diestimasi. Pada
tahap kedua, menganggap parameter butir yang diketahui, parameter kemampuan
diestimasi. Prosedur ini diulangi sampai nilai estimasi tidak berubah antara dua
tahap estimasi berturut-turut. Prosedur estimasi Kebolehjadian maksimum
diimplementasikan dalam LOGIST (Wingersky. 1983) untuk model satu-dua, dan
tiga parameter, dan di BICAL (Wright, Mead,& Bell, 1979) dan BIGSCALE
(Wrighi, Sclulz, & Linacre, 1989) untuk model satu-parameter.

Prosedur Kebolehjadian maksimum bersama, walaupun konseptual menarik,
memiliki beberapa kekurangan. Pertama, estimasi kemampuan dengan sempurna
dan skor nol tidak ada. Kedua, estimasiparameter butir memperkirakan untuk butir
yang dijawab benar (atau tidak benar) oleh semua peserta ujian dihilangkan.
Butir dan peserta ujian menunjukkan pola ini harus dihilangkan sebelum estimasi
dapat diproses. Ketiga, dalam dua dan tiga model parameter, prosedur model
kebolehjadian maksimum bersama tidak menghasilkan estimasi yang konsisten
dari parameter butir dan kemampuan. (Swaminathan & Gifford[1983] telah
menunjukkan secara empiris bahwa estimasi konsisten mungkin didapatkan dari
parameter butir dan kemampuan jika kedua angka dari peserta ujian dan angka
dari butir menjadi besar.) Keempat, dalam model tiga parameter, kecuali
pembatasan butirpada nilai butir dan mengambil parameter kemampuan, prosedur
numerik untuk menemukan estimasi mungkin gagal.
Pendekatan alternatif untuk estimasi yang tersedia. Salah satu pendekatannya
adalah untuk mendapatkan estimasi Bayes dari parameter menggunakan distribusi
sebelumnya. Swaminathan dan Gifford (1982, 1985, 1986) telah mengembangkan
prosedur Bayes untuk model satu, dua, dan tiga-parameter di mana distribusi
sebelumnya yang ditempatkan pada parameter butir dan kemampuan. Prosedur ini
menghilangkan masalah yang dihadapi dalam prosedur kebolehjadian maksimum
bersama, yaitu estimasi yang tidak tepat untuk pola respon tertentu.
Masalah ketidakjelasan kebolehjadian maksimum bersama: terjadi karena kedua
parameter butir dan kemampuan diestimasi secara simultan. Masalah ini hilang
jika parameter butir dapat diestimasi tanpa merujuk pada parameter kemampuan.
Jika kita membebani peserta ujian yang telah dipilih secara acak dari populasi,
kemudian, dengan distribusi khusus untuk parameter kemampuan, kita dapat
mengintegrasikannya dari fungsi kebolehjadian (mengintegrasikan parameter
kemampuan yang memiliki efek yang sama dengan "berjalan" melalui distribusi
kemampuan untuk mendapatkan fungsi kebolehjadian marginal dalam hal
parameter butir). Menghasilkan "estimasi Kebolehjadian maksimal marginal"
yang dihasilkan memiliki sifat asimptotik yang diinginkan; Artinya, estimasi
parameter butir konsisten karena jumlah peserta ujian meningkat. Prosedur
perkiraan kebolehjadian maksimal marginal ini dikembangkan oleh Bock dan
Lieberman (1970), disempurnakan oleh Bock dan Aikin (1981), dan
diimplementasikan di Program Compuler Bilog oleh Mislevy and Bock (1984).
Prosedur kebolehjadian maksimal marginal adalah perhitungan secara lebih
intensif daripada prosedur Kebolehjadian maksimum bersama karena dengan
tujuan integrasi yang dibutuhkan. Selain, untuk mendapatkan fungsi
Kebolehjadian marginal dari parameter butir. Ini perlu untuk memperkirakan
distribusi dari kemampuan. Untuk perkiraan yang baik dari distribusi kemampuan,
peserta ujian dengan jumlah yang besar itu penting. Oleh karena itu, prosedur
maksimum kebolehjadian marginal harus dilakukan hanya dengan jumlah peserta
ujian yang cukup besar.
Pada parameter butir yang telah diestimasi menggunakan prosedur Kebolehjadian
maksimal marginal, estimasi parameter butir mungkin diperlakukan seperti yang
diketahui dan kemampuan peserta ujian dapat diestimasi dengan menggunakan
Metode yang diuraikan di bab ini. Sekali lagi, semakin banyak jumlah butir,
semakin baik estimasi parameter kemampuan. Salah satu estimasi kebolehjadian
maksimum dari kemampuan atau,jika dikehendaki, estimasi EAP dari kemampuan
mungkin dapat diperoleh.
Dalam beberapa situasi, bahkan prosedur maksimum marginal mungkin dapat
gagal; Artinya, prosedur numerik mungkin gagal untuk menghasilkan hasil yang
memuaskan bahkan setelah sejumlah besar perulangan. Kegagalan ini terutama
terjadi pada estimasi dari parameter c dalam model tiga-parameter. Estimasi c
yang buruk, pada gilirannya, menurunkan estimasi parameter butir yang lain dan
dari kemampuan (Swaminathan & Gifford, 1985). Estimasi Bayes (Mislevy,
1986) memecahkan masalah ini (sebenarnya, dalam program komputer BILOG,
distribusi sebelumnya ditempatkan pada nilai parameter c sebagai pilihan standar).
Kesalahan Standar dari Estimasi Parameter Butir
Konsep dari fungsi informasi, yang diperkenalkan secara singkat di awal, adalah
konsep umum yang berkaitan dengan variasi dari estimasi Kebolehjadian
maksimum. Ketika estimasi Kebolehjadian maksimum dari parameter
kemampuan diperoleh, variasinya diberikan sebagai timbal balik dari fungsi
informasi yang sesuai. Demikian pula, ketika estimasi kemampuan maksimum
dari parameter butir diperoleh, keragaman matriks kovarian dari estimasi
diberikan sebagai invers matriks informasi dari estimasi parameter butir (karena,
dalam kasus model dua dan tiga parameter, masing-masing ditandai dengan dua
dan tiga parameter). Elemen dari matriks inforimasi untuk estimasi kebolehjadian
maksimum bersama untuk setiap butir diatur dalam cara berikut (karena matriks
simetris, hanya elemen segitiga atas yang diberikan):

I i=
[ I aai I abi I aci
I bbi ¿ I cci ] i=1,2,…,n
Pernyataan dari elemen ditentukan di bawah (Hambleton&Swaminathan, 1985;
Lord, 1980).
N
D2 Q
2∑
I aai = (θ i−bi )2 (Pij −c i)2 ij
(1−c i ) j =1 Pij
2 N
D ai Q
2∑
2 ij
I abi = (θ j−bi)(Pij −ci )
(1−c ) i j =1 P ij
D
N
Q
2∑
I aci= (θ j −bi )(Pij −c i) ij
(1−c i) j=1 Pij
D 2 ai2 N
Q
I bbi =
(1−c )
∑ (Pij −c i )2 ij
2
P
i j=1 ij
N
1 Qij
2∑
I cci =
(1−c i ) j=1 Pij
Pernyataan sederhana untuk matriks varians — kovarians kebolehjadian
maksimum marjinal tidak tersedia, tetapi penjelasan tentang prosedur untuk
memperolehnya diberikan dalam Mislevy dan Bock (1984) dan Mislevy (1986).
Matriks variance-covariance dari parameter butir penting ketika membandingkan
parameter butir dalam dua kelompok, masalah yang timbul dalam bias atau studi
fungsi perbedaan butir (Lord, 1980).

Ringkasan metode penilaian Parameter
Dalam bagian sebelumnya, kebolehjadian maksimum, Kebolehjadian maksimum
marjinal, dan prosedur estimasi Bayes diuraikan. Ini adalah prosedur estimasi
yang paling banyak digunakan. Untuk tinjauan tentang prosedur terkini,
perhatikan Baker (1987) dan Swaminathan (1983). Beberapa pendekatan lain
untuk estimasi tidak diuraikan dalam bab ini. Daftar prosedur estimasi yang
tersedia penjelasan singkat diberikan di bawah ini:
 Metode maksimum kebolehjadian bersama (Lord, 1974, 1980), berlaku
untuk model satu - dua -, dan tiga parameter. Parameter kemampuan dan
butir diestimasi secara bersamaan.
 Metode maksimum marginal (Bock & Aitkin, 1981), berlaku untuk model
satu - dua -, dan tiga parameter. Parameter kemampuan terintegrasi, dan
parameter butir yang diestimasi. Dengan parameter butir yang ditentukan,
parameter kemampuan diestimasi.
 Prosedur kebolehjadian maksimum yang kondisional (Andersen, 1972,
1973: Rasch.1960), hanya berlaku untuk model satu-parameter. Disini,
fungsi kebolehjadian dikondisikan pada skor benar.
 Prosedur estimasi bersama dan estimasi Bayes (Mislevy. 1986 Swaminathan
& Gifford, 1982, 1985, 1986), berlaku untuk satu —. Model dua dan tiga
parameter. Distribusi sebelumnya ditempatkan pada parameter butir dan
kemampuan, menghilangkan beberapa masalah, seperti estimasi yang tidak
tepat dari parameter dan nonkonvergensi, yang dihadapi dengan prosedur
kebolehjadian maksimum bersama dan marjinal.

 Prosedur estimasi heuristik (Urry, 1974. 1978), terutama berlaku untuk
model dua dan tiga parameter.
 Metode berdasarkan pada prosedur analisis faktor nonlinear (McDonald,
1967. 1989), dapat diterapkan pada dua parameter dan kasus yang
dimodifikasi dari model tiga parameter, di mana nilai C tetap.
Selain itu, ketika parameter butir sudah diketahui, estimasi kemampuan
dapat dilaksanakan dengan memperoleh modus fungsi kebolehjadian, atau, dalam
kasus prosedur Bayes, baik modus rata-rata atau dari fungsi kepadatan posterior e.
Prosedur yang dimusim panas di atas diterapkan dalam program komputer yang
diuraikan di bagian berikut :
Program komputer untuk estimasi Parameter
Hingga sekarang ini, hanya sedikit program komputer yang tersedia untuk
estimasi parameter model IRT yang diperkenalkan sebelumnya. Pada tahun 1970-
an, program yang paling banyak dikenal dan digunakan adalah BICAL (Wright et
al., 1979) dan LOGIST (Wingersky, Barton, & Lord, 1982). BICAL cocok
dengan model satu parameter, Logist cocok dengan model satu, dua, dan tiga
parameter. Kedua program itu menggunakan prosedur estimasi kebolehjadian
maksimum, dan keduanya masih digunakan secara luas. LOGIST tetap menjadi
standar yang dengannya program estimasi baru dinilai.
Program lain yang tersedia di tahun 1970-an adalah PML (Gustafsson.,
1980a) dan ANCILLES (Urry, 1974, 1978). PML cocok dengan model satu
parameter menggunakan prosedur kebolehjadian maksimum kondisional,

sedangkan ANCILLES cocok dengan model tiga parameter menggunakan
prosedur heuristik. PML tidak banyak digunakan di Amerika Serikat, dan
ANCILLES tidak sering digunakan karena prosedur estimasi tidak baik berdasar
secara teoretis dan pemrograman lainnya telah terbukti menghasilkan perkiraan
yang lebih baik.
Pada tahun 1980-an beberapa program estimasi baru diperkenalkan. Yang
paling menonjol adalah BILOG (Mislevy & Bock, 1984) dan ASCAL (sistem
penilaian Corporalion, 1988). BILOG cocok dengan model satu, dua, dan tiga
Parameter dengan menggunakan prosedur kebolehjadian maksimum marginal
dengan prosedur alternatif Bayes; ASCAL cocok dengan model tiga parameter
menggunakan prosedur Bayes. BILOG tersedia dalam versi utama dan
mikrokomputer, sedangkan ASCAL merupakan program mikrokomputer.
Yang juga tersedia pada awal tahun 1980-an adalah program NOHARM
(Fraser & McDonald, 1988), yang cocok dengan model dua dan tiga parameter
(dengan nilai C yang tetap) menggunakan pendekatan analisis faktor nonlinear.
NOHARM tidak mendapat banyak perhatian di amerika serikat.
Perkembangan lainnya termasuk program mikrokomputer untuk
mencocokkan model satu-parameter. Skala mikro (Mediax Interactive
Technologies. 1986) dan RASCAL (Assessment Systems Corporation, 1988).
Sebuah versi mikrokomputer dari LOGIST telah dikembangkan dan diharapkan
akan dirilis pada tahun 1991 atau 1992. RIDA (Glass, 1990) adalah program
mikrokomputer baru untuk menganalisis data dikotomis menggunakan model
satu-parameter. Baik prosedur estimasi kebolehjadian maksimum marginal dan

kondisional tersedia. Fitur khususnya adalah kemampuan menganalisis berbagai
desain yang tidak lengkap yang sering muncul dalam pengujian persamaan (lihat
chapter 9).
Yang terakhir, minat pada program IRT yang menangani data polytomous
(Thissen, 1986; Wright dan al.. 1989) dan data multidimensional (Carl. Son,
1987) telah dikembangkan, tetapi mengerjakan topik yang terakhir ini baru saja
dimulai dan perlu banyak riset sebelum program Carlson dapat digunakan.
Ringkasan dari program-program yang terdaftar di atas dan kelebihan-
kelebihannya serta fitur-fitur utamanya diberikan dalam tabel 3.2. Sumber untuk
program yang terdaftar dalam lampiran B.
Tabel 3,2 Program Estimasi Parameter IRT yang Tersedia Saat Ini
Pros (+)
Prosedur Persyaratan
Program Sumber Model Cons (-) dan
estimasi Komputer
Features (*)
BICAL Wright dan 1P Kebolehja Kebanyakan + Murah
(Replaced al. dian mainframe + Memberikan kesalahan
by BIG- (1979): Maksimu standar
SCALE) Wright dan m tanpa +Memberikan Grafik/
al. syarat analisis statistik yang
(1989) baik
MICRO Mediax 1P Multi Kebolehja PC * PC versi untuk BICAL
SCALE Interactive kategori dian * Data dapat diinput di
Technologie Maksimu lembar kerja

s (1986) mtanpa elektronik
syarat
PML Gustafson 1P Kebolehja Unknown * Estimasinya konsisten
(1980) dian - Komputasi intesif
Maksimu + Tidak banyak
m digunakan di U.S
bersyarat
RASCAL Assesment 1P Kebolehja PC + Memiliki analisis yang
Systems dian sesuai
Corp. Maksimu * Disertakan dalam paket
(1988) m tanpa Micro CAT
syarat
RIDA Glas (1990) 1P Kebolehja PC + Menyediakan analisis
dian sampel dan data yang
Maksimu lengkap
m + menggunakan desain
bersyarat tidak lengkap untuk
atau tes equating.
marginal + Dilengkapi analasis
yang sesuai
Lanjutan Tabel 3.2
Computer Pros (+)

Prosedur
Program Sumber Model Requirem Cons (-) dan
estimasi
ents Features (*)
ANCILLES Urry 3P Heuristic Most + Murah
(1974, 1978) mainframe - Seringkali butir
hilang/orang yang
diuji
- Prosedur estimasi tidak
berdasarkan teori
* Tidak digunakan
secara luas
ASCAL Assesment 1P Modifikasi PC + Memiliki analisis yang
Systems Corp. 2P Bayes sesuai
(1988) 3P +Disertakan dalam paket
Micro CAT
*Menggunakan prosedur
Bayes
LOGIST Wingersky 1P Maksimum IMB/CDC + menghasilkan standar

(1983); 2P Kebolehjadi Mainfram kesalaha Logist V
Wingersky et 3P an tanpa e (Versi + Fleksibel, banyak
al. (1982) syarat IV) pilihan
+ Megizinkan
kelalaian/tak tercapai
- Spesifikasi penginputan
kompleks
- Mahal untuk dijalankan
- Sulit dikonversi ke
peralatan non-IBM
- Tempatkan banyak
kendala pada
parameter untuk
mendapatkan
konvergensi
Lanjutan Tabel 3.2
Program Sumber Model Prosedur Computer Pros (+)
estimasi Requirem Cons (-) dan

ents Features (*)
BILOG Mislevy & 1P Marginal IBM + Pilihan estimasi
Bock (1984) 2P Maksimum mainframe Baye’s
3P Kebolehjadi PC + Mencegah estimasi
an Version ekstrim
- Mahal dijalankan
dimainframe
- Masih ada
kebolehjadian
estimasi yang cacat
NOHARM Fraser dan 1P Least Most + Model multidimensi
McDonald 2P Square mainframe yang baik
(1988) 3P s PC + Dilengkapi analisis
residual
- Tidak ada parameter
yang pasti
* Tidak banyak
digunakan di U.S
MULTILOG Thissen Multi IBM * Merupakan
(1986) kategori Mainfram generalisasi BILOG
e yang dapat mencakup
multikategori data
MIRTE Carlson 1P Maksimum IBM + Model multi

(1987) 2P Kebolehjadi Mainfram dimensional yang
3P an tanpa es PC sesuai
syarat + Memberikan standar
eror
+ Dilengkapi analisis
residual
- Tidak ada parameter
yang pasti

TRB Kelompok 2

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

TRB Kelompok 2

Diunggah oleh

Hak Cipta:

Format Tersedia

Kelompok 2

Estimasi Parameter Kemampuan dan Butir

Langkah pertama dan paling penting dalam menerapkan teori respon

butir untuk menguji data adalah dengan memperkirakan parameter yang

mencirikan model respon butir yang terpilih. Sebenarnya, penerapan yang

baik untuk memperkirakan parameter model.

Dalam model respon butir, kebolehjadian respon yang benar

tergantung pada kemampuan peserta ujian, θ , dan parameter yang

mencirikan butir. Parameter Kemampuan maupun butir tidak diketahui. Apa

dihadapi dalam analisis regresi dimana, dari pengamatan respon ke variabel,

Dua perbedaan besar membedakan model regresi dan model respon

butir yang nonlinear. Kedua, dan sangat penting, variabel regressor

masalah estimasi paranmeter butir, atau "koefisien regresi," akan sangat

Demikian pula, jika parameter butir diketahui, estimasi kemampuan cukup

Estimasi parameter dapat dicapai dalam beberapa cara. Dalam kejadian

diketahui, prosedur yang ditunjukkan di bagian pada persamaan parameter dapat

model yang diperlukan untuk memecahkan Parameter yang tidak diketahui.

Apabila sebuah sampel diperoleh, prosedur di atas tidak dapat

parameter dapat diperkirakan menggunakan kriteria Kebolehjadian

maksimum. Contoh distribusi dari estimasi Kebolehjadian maksimum

prosedur Kebolehjadian maksimal untuk mengestimasi kemampuan ketika

parameter butir diketahui, dan kemudian mennggambarkan prosedur untuk

mengestimasi parameter butir.

Misalkan bahwa secara acak dipilih peserta ujian menanggapi sebuah

pada butir j. Dengan asumsi independensi lokal, probabilitas gabungan dari

mengamati pola respon adalah hasil dari probabilitas mengamati setiap

respon butir, yaitu.

P(U1,U2 ,..,UJ,…., Un |θ) =

P(U 1∨θ) P(U 2∨θ) … P(U j∨θ) … P (U n∨θ)

yang dapat dinyatakan dengan lebih ringkas seperti

fungsi kebolehjadian sebagai

Dimana P j=P ( U j|θ ) DanQ j=1−P(U j ∨θ)

Persamaan 3.1 adalah pernyataan probabilitas gabungan dari pola

sebuah respon. Jika pola respon diamati, U j= u j, interpretasi probabilitas

tidak tepat; pernyataan untuk probabilitas gabungan sekarang disebut fungsi

Kebolehjadian dan ditandai sebagai L(U1,U2,…UJ,…,Un | θ) Dimana Uj adalah

respon diamati untuk butir j. Dengan demikian,"

Mengingat Pj dan Qj adalah fungsi dari θ dan parameter butir , fungsi

Kebolehjadian juga merupakan fungsi dari parameter ini. Sebagai contoh,

fungsi Kebolehjadian untuk setiap peserta ujian mungkin ditulis dengan

menggunakan pernyataan umum di atas. Untuk 3 peserta ujian, misalny; u 1 =

0. U2 = 0, u3 = 0, u4 = 1, u5 = 1 Oleh karena itu, fungsi Kebolehjadian untuk

peserta ujian ini adalah

Karena P (dan karena Q) adalah fungsi respon butir yang bentuknya

Khususnya, grafik fungsi Kebolehjadian sebagai variasi θ dapat digambarkan.

Karena fungsi Kebolehjadian adalah produk jumlah, masing-masing dibatasi

fungsi Kebolehjadian dapat diperoleh dengan mengubahnya menggunakan

logaritma. Selain itu, karena sifat-sifat logaritma berikut,

Dengan menggunakan perhitungan logaritma yang sederhana (dan,

menggunakan dua sifat, pernyataan umum untuk logaritma dari fungsi

Kebolehjadian (log-, kebolehjadian, untuk pendeknya) dapat ditulis sebagai

Di sini, u adalah vektor respon butir. Grafik dari logaritma

kebolehjadian untuk peserta ujianan 3, 4, dan 5 diberikan dalam gambar 3.1.

Log-kebolehjadian untuk peserta ujian 3 memuncak pada θ = -0.5, sementara

untuk peserta ujian 4 log-kebolehjadian memuncak pada θ = 1. untuk peserta

ujian 5 memuncak pada θ = -1,5. Nilai dari θ yang membuat fungsi

maksimum didefinisikan sebagai estimasi Kebolehjadian maksimum dari θ

untuk peserta ujian tersebut.

Masalah dari menemukan nilai maksimum suatu fungsi bukanlah

masalah sepele. Prosedur grafis yang digambarkan di atas digunakan sebagai

digunakan. Nilai yang memaksimalkan fungsi didapatkan menggunakan

prosedur pencarian dengan sebuah computer. Prosedur yang lebih efisien

menggunakan fakta bahwa, pada titik di mana fungsi mencapai maksimal.

estimasi Kebolehjadian maksimum dapat ia ditentukan dengan