Anda di halaman 1dari 30

Kelompok 2

Halyadin

Nurmawaddah Rustam

PEP 2020

Estimasi Parameter Kemampuan dan Butir

Langkah pertama dan paling penting dalam menerapkan teori respon

butir untuk menguji data adalah dengan memperkirakan parameter yang

mencirikan model respon butir yang terpilih. Sebenarnya, penerapan yang

sukses dari teori respon butir bergantung pada adanya prosedur yang cukup

baik untuk memperkirakan parameter model.

Dalam model respon butir, kebolehjadian respon yang benar

tergantung pada kemampuan peserta ujian, θ , dan parameter yang

mencirikan butir. Parameter Kemampuan maupun butir tidak diketahui. Apa

yang diketahui adalah respon dari peserta ujian terhadap butir yang diuji.

Masalah dari estimasi adalah untuk menentukan nilai θ untuk setiap peserta

ujian dan parameter butir dari respon butir. Masalah ini sama dengan yang

dihadapi dalam analisis regresi dimana, dari pengamatan respon ke variabel,


parameter yang mencirikan model regresi -- Koefisien regresi -- harus

diperkirakan.

Dua perbedaan besar membedakan model regresi dan model respon

butir. Pertama tama, model regresi biasanya lınear sedangkan model respon

butir yang nonlinear. Kedua, dan sangat penting, variabel regressor

(independen) dalam analisis regresi dapat diamati Yaitu, Dalam model respon

butir " regressor variabel " θ tidak dapat diamati. Jika θ dapat diamati atau dikenal,

masalah estimasi paranmeter butir, atau "koefisien regresi," akan sangat

sederhana, meskipun kita masih akan berurusan dengan model regresi nonlinear.

Demikian pula, jika parameter butir diketahui, estimasi kemampuan cukup

sederhana.

Estimasi parameter dapat dicapai dalam beberapa cara. Dalam kejadian

yang tidak mungkin bahwa model cocok dengan data dengan tepat, dan ketika θ

diketahui, prosedur yang ditunjukkan di bagian pada persamaan parameter dapat

digunakan. Dalam hal ini, hanya sebanyak poin yang ada parameter butir dalam

model yang diperlukan untuk memecahkan Parameter yang tidak diketahui.

Apabila sebuah sampel diperoleh, prosedur di atas tidak dapat

digunakan karena model tidak akan cocok data dengan tepat. Dalam kasus

ini, strategi kami adalah untuk menemukan nilai parameter yang akan

menghasilkan kurva "paling pas". Dalam regresi linear, ukuran terbaik sering

didefinisikan dalam hal kriteria kotak paling sedikit. Dalam model IRT

kriteria kotak tidak digunakan karena sulit untuk menentukan sifat dari
estimasi kotak paling sedikit dalam model nonlinear. Sebagai alternatif,

parameter dapat diperkirakan menggunakan kriteria Kebolehjadian

maksimum. Contoh distribusi dari estimasi Kebolehjadian maksimum

dikenal dalam sampel besar. Dan informasi ini dapat digunakan dalam

berbagai cara dalam aplikasi IRT. Kami pertama kali akan mennggambarkan

prosedur Kebolehjadian maksimal untuk mengestimasi kemampuan ketika

parameter butir diketahui, dan kemudian mennggambarkan prosedur untuk

mengestimasi parameter butir.

Estimasi kemampuan

Misalkan bahwa secara acak dipilih peserta ujian menanggapi sebuah

kumpulan n butir dengan pola respon (U1,U2 ,..,UJ,…., Un) Dimana Uj adalah

1dari indenpendensi lokal (respon yang benar) atau θ (respon yang salah)

pada butir j. Dengan asumsi independensi lokal, probabilitas gabungan dari

mengamati pola respon adalah hasil dari probabilitas mengamati setiap

respon butir, yaitu.

P(U1,U2 ,..,UJ,…., Un |θ) =

P(U 1∨θ) P(U 2∨θ) … P(U j∨θ) … P (U n∨θ)

yang dapat dinyatakan dengan lebih ringkas seperti


Karena Uj adalah 1 atau 0. hal ini dapat diperhitungkan dengan menulis

fungsi kebolehjadian sebagai

Atau sederhananya

Dimana P j=P ( U j|θ ) DanQ j=1−P(U j ∨θ)

Persamaan 3.1 adalah pernyataan probabilitas gabungan dari pola

sebuah respon. Jika pola respon diamati, U j= u j, interpretasi probabilitas

tidak tepat; pernyataan untuk probabilitas gabungan sekarang disebut fungsi

Kebolehjadian dan ditandai sebagai L(U1,U2,…UJ,…,Un | θ) Dimana Uj adalah

respon diamati untuk butir j. Dengan demikian,"

Mengingat Pj dan Qj adalah fungsi dari θ dan parameter butir , fungsi

Kebolehjadian juga merupakan fungsi dari parameter ini. Sebagai contoh,


perhatikan tanggapan dari lima orang peserta ujian terhadap lima butir

dengan nilai parameter butir yang diketahui, yang diberikan dalam tabel 3.1.

fungsi Kebolehjadian untuk setiap peserta ujian mungkin ditulis dengan

menggunakan pernyataan umum di atas. Untuk 3 peserta ujian, misalny; u 1 =

0. U2 = 0, u3 = 0, u4 = 1, u5 = 1 Oleh karena itu, fungsi Kebolehjadian untuk

peserta ujian ini adalah

Karena P (dan karena Q) adalah fungsi respon butir yang bentuknya

bergantung pada parameter butir, dan parameter butir dikenal dalam contoh

ini, nilai yang tepat dari fungsi Kebolehjadian untuk θ tertentu dapat diatasi.

Khususnya, grafik fungsi Kebolehjadian sebagai variasi θ dapat digambarkan.

Karena fungsi Kebolehjadian adalah produk jumlah, masing-masing dibatasi

antara 0 dan 1, nilainya akan sangat kecil. Peningkatan yang lebih baik dari

fungsi Kebolehjadian dapat diperoleh dengan mengubahnya menggunakan

logaritma. Selain itu, karena sifat-sifat logaritma berikut,

Tabel 3.1 Parameter Butir dan Pola Respon untuk Lima Ujian pada Lima Butir

Test
Dan

Dengan menggunakan perhitungan logaritma yang sederhana (dan,

seperti yang akan kita lihat, perhitungan dari turunan pertama). Dengan

menggunakan dua sifat, pernyataan umum untuk logaritma dari fungsi

Kebolehjadian (log-, kebolehjadian, untuk pendeknya) dapat ditulis sebagai

Di sini, u adalah vektor respon butir. Grafik dari logaritma

kebolehjadian untuk peserta ujianan 3, 4, dan 5 diberikan dalam gambar 3.1.

Log-kebolehjadian untuk peserta ujian 3 memuncak pada θ = -0.5, sementara

untuk peserta ujian 4 log-kebolehjadian memuncak pada θ = 1. untuk peserta

ujian 5 memuncak pada θ = -1,5. Nilai dari θ yang membuat fungsi


Kebolehjadian (atau, sesuai, log-kebolehjadian) untuk peserta ujian

maksimum didefinisikan sebagai estimasi Kebolehjadian maksimum dari θ

untuk peserta ujian tersebut.

Masalah dari menemukan nilai maksimum suatu fungsi bukanlah

masalah sepele. Prosedur grafis yang digambarkan di atas digunakan sebagai

ilustrasi dan tidak cocok bila banyak peserta ujian dan banyak butir yang

digunakan. Nilai yang memaksimalkan fungsi didapatkan menggunakan

prosedur pencarian dengan sebuah computer. Prosedur yang lebih efisien

menggunakan fakta bahwa, pada titik di mana fungsi mencapai maksimal.

Kemiringan dari fungsi (turunan pertama) adalah nol. Oleh karena itu,

estimasi Kebolehjadian maksimum dapat ia ditentukan dengan

menyelesaikan persamaan yang diperoleh

Dasar-dasar teori respon BUTIR


Letak turunan pertama dari Kebolehjadian atau log-berfungsi

kebolehjadian sama dengan nol. Sekali lagi, persamaan ini tidak dapat

diselesaikan secara langsung, dan metode perkiraan harus digunakan.

Metode perkiraan yang paling populer adalah prosedur Newton-Raphson

yang diuraikan secara terperinci dalam bahasa Hambleton dan Swaminathan

(l985).

Sayangnya. Fungsi Kebolehjadian (atau Likelihooc log-) mungkin tidak

memiliki nilai terbatas sebagai maksimum. Seperti ketika peserta ujian

menjawab semua butir dengan benar atau semua butir dengan tidak benar.

Dalam hal ini, estimasi Kebolehjadian maksimum adalah θ=+∞ atau θ=−∞

Beberapa pola respon yang aneh (yang tidak dapat dipahami seperti priori)

mungkin hasilnya juga dalam fungsi Kebolehjadian yang tidak memiliki batas

maksimum mutlak. Fungsi log-untuk dua peserta ujian pertama dari Tabel

3.1 diperlihatkan dalam gambar 3.2. Untuk peserta ujian 2, fungsi log-

kebolehjadian memiliki maksimum pada titik θ = 0,9; Namun, fungsi ini

memiliki nilai yang lebih tinggi pada θ = - ∞ (nilai dari fungsi ditampilkan

dalam gambar hanya untuk θ = -6). Untuk ujian I. juga, fungsi Kebolehjadian

maksimum memiliki maksimum di θ =-∞ , oleh karena itu, untuk kedua

peserta ujianan, estimasi Kebolehjadian maksimum tidak ada. Alasan untuk

situasi ini adalah bahwa pola respon dua peserta ujian ini menyimpang:
Peserta ujian menjawab beberapa hal yang relatif sulit dan

diskriminatif dengan butir benar dan menjawab salah beberapa hal yang

lebih mudah. Dalam kasus seperti ini prosedur numerik yang digunakan

menemukan maksimum biasanya akan menyimpang. Masalah yang dicatat di

atas dengan respon yang menyimpang terjadi hanya dengan model tiga

parameter dan tidak dengan model satu atau dua parameter. (lihat

Hambleton & Sykes swaminathan 1985. dan Yen, burket & Sykes, tekan untuk

diskusi tentang masalah ini), dan bahkan bisa muncul untuk tes yang

sebanyak 40 butir.

Estimasi kebolehjadian maksimum (MLEs), jika memang ada,

memiliki sifat yang dikenal sebagai asymptotik (yaitu, sampel besar). Karena

kita tidak lagi berurusan dengan peserta ujian, asimptotik menunjukkan

panjangnya ujian yang meningkat sebagai tes panjang yang meningkat, MLE

dari θ, yang dinyatakan sebagai θ^ distribusikan secara normal dengan rata-


rata θ,. Hal ini menyiratkan bahwa distribusi asymptotik θ^ terpusat pada nilai

θ yang sebenarnya; Oleh karena itu, MLE θ^ tidak memihak dalam tes panjang.

Simpangan baku θ^ , atau kesalahan standar, yang disebut sebagai SE ( θ^ ),

adalah fungsi θ dan diberikan sebagai

Di mana I (θ) yang disebut dengan fungsi informasi. Sejak θ tidak

diketahui, fungsi informasi harus dihitung dengan mengganti θ^ untuk θ pada

pernyataan di atas. perhitungan fungsi informasi, sifatnya, dan perannya

dalam pembuatan tes, diuraikan secara terperinci di pasal 6.

Normalitas θ^ dapat digunakan untuk membangun interval

kepercayaan untuk θ. Interval kepercayaan (1- α ¿ % untuk θ diberikan oleh

Dimana SE (θ^ ) adalah standar kesalahan yang dievaluasi pada (θ^ ) dan

Z α /2 diatas dari (1- α /2) titik persentil dari distribusi normal . Untuk 95%

interval kepercayaan , α = 0,05 dan Z α /2 =¿ 1,96.

Masalah dari tidak menemukan estimasi kebolehjadian maksimum

dalam beberapa situasi dapat diatasi jika prosedur estimasi Bayes digunakan.

Ide dasarnya adalah mengubah fungsi kebolehjadian untuk memasukkan


setiap informasi sebelumnya yang mungkin kita miliki tentang parameter

kemampuan. Sebagai contoh, kita mungkin dapat mengatakan, berdasarkan

pada beberapa pengalaman sebelumnya, bahwa θ didistribusikan secara

normal dengan rata-rata μ dan standar deviasi σ ". Dalam hal ini, informasi

sebelumnya dapat dinyatakan dalam bentuk fungsi kepadatan dan

dinyatakan sebagai f(θ).

Teori Bayes menyatakan bahwa probabilitas dari suatu peristiwa A

ditentukan B adalah

Dimana P(A) adalah probabilitas prior dari peristiwa A yang terjadi.

Hubungan di atas juga berlaku untuk fungsi kepadatan, dimana A adalah θ

dan B adalah pola respon butir yang diamati, u. Teori Bayes' dapat ditulis:

Sekarang f (u∨θ) adalah, pada kenyataannya, fungsi kebolehjadian dan,

karenanya,

Fungsi Kebolehjadian direvisi f (u∨θ) disebut kepadatan posterior dan

modusnya adalah nilai "paling mungkin" untuk θ, dan dapat dianggap


sebagai Perkiraan dariθ . Catatan bahwa jika kita asumsikan sebuah keseragaman

distribusi sebelumnya untukθ ( yaitu, f ( θ )=k , konstan) maka

f ( θ∨u ) ∝ L(u∨θ)

Dalam hal ini, estimasi Bayes identik secara numerik dengan estimasi

Kebolehjadian maksimum. Kami menekankan secara numerik karena landasan

filosofis yang mendasari prosedur Bayes sangat berbeda dari gagasan klasik atau

relatif frekuensi peluang (lihat Kendall & Stuart [1961] untuk rincian mengenai

masalah ini). Menggunakan pendekatan Bayes memecahkan beberapa kesulitan

yang dihadapi dengan pendekatan Kebolehjadian maksimum. Estimasi Bayes dari

θ dapat diperoleh untuk nol butir yang benar dan pola respon yang sempurna, dan

untuk pola respon yang "menyimpang"

Distribusi posterior dari θ dapat dijelaskan dalam banyak cara. Modus dari

distribusi, perkiraan modal Bayes, hanya memberikan satu penjelasan. Maksud

dari distribusi itu, mungkin juga digunakan sebagai perkiraan. Maksudnya dapat

dihitung dengan mendekati distribusi posterior dalam interval terbatas dengan

sebuah histogram, yaitu, membentuk distribusi frekuensi dengan nilai k dariθ .

Frekuensi pada titik θ j ,( j=1 , … , k ) adalah f ( θ j∨u ). Maksudnya dapat kemudian

diperoleh dengan cara yang biasanya:

∑ θ j f ( θ j∨u )
j=1
μ ( θ∨u )= k [3.3]
∑ f ( θ j∨u )
j=1
Bock dan Mislevy (1982) menyebut estimasi ini sebagai perkiraan Posteriori

(EAP) yang diharapkan.

Estimasi Parameter Butir

Dalam menggambarkan prosedur untuk mengestimasi θ , kami berasumsi

bahwa parameter butir sudah diketahui. Pada titik tertentu, kita harus menghadapi

fakta bahwa parameter butir juga harus diestimasi! Untuk mengestimasi

kemampuan dari seorang peserta ujian ketika parameter butir diketahui, kita

memberikan banyak butir ke peserta ujian dan memperoleh fungsi kebolehjadian

untuk tanggapan dari peserta ujian ke n butir. Sebaliknya, jika kita ingin

mengestimasi parameter butir ketika θ diketahui untuk setiap peserta ujian, kami

memberikan butir dari yang menarik ke sejumlah peserta ujian dan mendapatkan

fungsi kebolehjadian untuk tanggapan dari N peserta ujian ke butir, yaitu,

N
L ( u1 ,u2 , … , uN |θ , a , b , c ) =∏ P ui Q1−u
i
i
i

i=1

Dimana a, b, dan c adalah parameter butir (asumsikan tiga model parameter).

Perbedaan antara fungsi kebolehjadian dari peserta ujian dan dari sebuah butir

adalah bahwa, untuk sebuah butir, asumsi dari independen lokal tidak perlu

diajukan; Kami hanya berasumsi bahwa tanggapan dari N peserta ujian ke sebuah

butir yang independen, sebuah asumsi standar dalam statistik. Asumsi independen

lokal lebih ketat dalam hal bahwa kita harus memperkirakan bahwa respon dari

seorang peserta ujian ke dua atau lebih butir bersifat independen.


Ketika nilai θ diketahui, estimasi parameter butir adalah lugas dan sebanding

dengan prosedur yang diuraikan di bagian sebelumnya. Perbedaannya adalah

bahwa fungsi Kebolehjadian untuk sebuah butir, tidak seperti itu untuk peserta

ujian, adalah multidimensional untuk parameter butir; Artinya, itu adalah fungsi

dari tiga parameter. Jadi, untuk menemukan MLE dari parameter a, b, dan c, kita

harus menemukan nilai a, b, dan c yang sesuai dengan nilai maksimum dari

permukaan dalam tiga dimensi. Ini dicapai dengan menemukan turunan pertama

dari fungsi kebolehjadian sehubungan dengan setiap parameter a, b, dan c,

mengatur turunan ini ke nol, dan pnyelesaian secara bersamaan sistem yang

dihasilkan dari persamaan nonlinear dalam tiga hal yang tidak diketahui. Jelas,

kami menyelesaikan untuk dua hal yang tidak diketahui ketika dua model

parameter digunakan, dan memecahkan hanya untuk satu hal yang tidak diketahui

ketika satu model parameter digunakan. Sekali lagi, prosedur Newton-Raphson,

dalam bentuk multivariat, digunakan umum untuk memecahkan persamaan ini.

Apabila kemampuan setiap peserta ujian diketahui, tiap-tiap butir dapat

dipertimbangkan secara terpisah tanpa merujuk pada butir lainnya. Dengan

demikian, prosedur estimasi harus diulangi n kali, sekali untuk setiap butir.

Estimasi Bersama dari Parameter Butir dan Kemampuan

Ini jelas bahwa pada titik tertentu tidak ada θ atau parameter butir yang akan

diketahui. Ini adalah situasi yang paling umum dan menyajikan masalah yang

paling sulit. Dalam hal ini respon dari semua peserta ujian untuk semua butir

harus dipertimbangkan secara simultan.


Fungsi kebolehjadian ketika N peserta ujian merespon ke n butir, menggunakan

asumsi dari independen lokal, adalah

N n
L ( u1 ,u2 , … , uN |θ , a , b , c ) =∏ ∏ Puij Q1−u
ij
ij
ij

i=1 j=1

Di mana ui , adalah pola respon dari peserta ujian i ke n butir; θ adalah vektor dari

N parameter kemampuan; a, b, dan c adalah vektor dari parameter butir untuk tes

n-butir. Jumlah parameter butir adalah 3n dalam tiga model parameter (2n untuk

dua - dan n untuk satu model parameter, berturut-turut). Independen lokal harus

diasumsikan sejak θ tidak diketahui. Jumlah parameter kemampuan adalah N dan,

karenanya, untuk tiga model parameter jumlah dari 3n + N parameter dapat

diestimasi. Sebelum estimasi dapat berlanjut, bagaimanapun, masalah dari

ketidakpastian harus ditangani.

Dalam fungsi kebolehjadian yang diberikan di atas, parameter butir dan

kemampuan tidak ditentukan dengan unik. Dalam fungsi respon butir untuk,

katakanlah, model tiga-parameter (lihat untuk persamaan 2.3), jika kita mengganti

¿ ¿ ¿ a
θ dengan θ =αθ + β , b by b =αb+ β ,∧a by a = , kebolehjadian respon yang
α

benar tidak berubah,

P ( θ )=P(θ ¿ )

Karena a dan β adalah konstanta skala yang berubah-ubah, fungsi Kebolehjadian

besar tidak akan memiliki keunikan maksimum. Setiap prosedur numerik yang

digunakan untuk menemukan maksimal fungsi Kebolehjadian akan gagal karena


ketidakpastian ini. Masalah ini tidak muncul dalam estimasi θ ketika parameter

butir diketahui atau dalam situasi paralel di mana parameter butir yang diestimasi

adanya parameter kemampuan yang diketahui, karena tidak ada ketidakpastian

dalam situasi ini.

Masalah dari ketidakpastian mungkin dieliminasi dengan memilih skala yang

berubah-ubah untuk nilai kemampuan (atau nilai b ); Biasanya, maksud dan

simpangan baku dari nilai kemampuan N (atau n butir nilai yang sulit) ditetapkan

menjadi 0 dan 1, berturut-turut. Seperti yang akan kita lihat nanti, skala ini harus

diperhitungkan ketika membandingkan estimasi dari dua atau lebih grup.

Setelah ketidakpastian dihilangkan, nilai dari parameter butir dan kemampuan

yang dimaksimalkan fungsi Kebolehjadian dapat ditentukan. Dalam prosedur

estimasi simultan atau prosedur estimasi kebolehjadian maksimum bersama,

penentuan ini hanya dilakukan dalam dua tahap. Pada tahap awal, nilai awal untuk

parameter kemampuan yang dipilih. Logaritma dari rasio skor nomor-benar ke

skor nomor-salah untuk masing-masing peserta ujian memberikan nilai awal yang

baik. Nilai-nilai ini kemudian distandarkan (untuk menghilangkan ketidakpastian)

dan, menganggap nilai kemampuan diketahui, parameter butir diestimasi. Pada

tahap kedua, menganggap parameter butir yang diketahui, parameter kemampuan

diestimasi. Prosedur ini diulangi sampai nilai estimasi tidak berubah antara dua

tahap estimasi berturut-turut. Prosedur estimasi Kebolehjadian maksimum

diimplementasikan dalam LOGIST (Wingersky. 1983) untuk model satu-dua, dan

tiga parameter, dan di BICAL (Wright, Mead,& Bell, 1979) dan BIGSCALE

(Wrighi, Sclulz, & Linacre, 1989) untuk model satu-parameter.


Prosedur Kebolehjadian maksimum bersama, walaupun konseptual menarik,

memiliki beberapa kekurangan. Pertama, estimasi kemampuan dengan sempurna

dan skor nol tidak ada. Kedua, estimasiparameter butir memperkirakan untuk butir

yang dijawab benar (atau tidak benar) oleh semua peserta ujian dihilangkan.

Butir dan peserta ujian menunjukkan pola ini harus dihilangkan sebelum estimasi

dapat diproses. Ketiga, dalam dua dan tiga model parameter, prosedur model

kebolehjadian maksimum bersama tidak menghasilkan estimasi yang konsisten

dari parameter butir dan kemampuan. (Swaminathan & Gifford[1983] telah

menunjukkan secara empiris bahwa estimasi konsisten mungkin didapatkan dari

parameter butir dan kemampuan jika kedua angka dari peserta ujian dan angka

dari butir menjadi besar.) Keempat, dalam model tiga parameter, kecuali

pembatasan butirpada nilai butir dan mengambil parameter kemampuan, prosedur

numerik untuk menemukan estimasi mungkin gagal.

Pendekatan alternatif untuk estimasi yang tersedia. Salah satu pendekatannya

adalah untuk mendapatkan estimasi Bayes dari parameter menggunakan distribusi

sebelumnya. Swaminathan dan Gifford (1982, 1985, 1986) telah mengembangkan

prosedur Bayes untuk model satu, dua, dan tiga-parameter di mana distribusi

sebelumnya yang ditempatkan pada parameter butir dan kemampuan. Prosedur ini

menghilangkan masalah yang dihadapi dalam prosedur kebolehjadian maksimum

bersama, yaitu estimasi yang tidak tepat untuk pola respon tertentu.

Masalah ketidakjelasan kebolehjadian maksimum bersama: terjadi karena kedua

parameter butir dan kemampuan diestimasi secara simultan. Masalah ini hilang

jika parameter butir dapat diestimasi tanpa merujuk pada parameter kemampuan.
Jika kita membebani peserta ujian yang telah dipilih secara acak dari populasi,

kemudian, dengan distribusi khusus untuk parameter kemampuan, kita dapat

mengintegrasikannya dari fungsi kebolehjadian (mengintegrasikan parameter

kemampuan yang memiliki efek yang sama dengan "berjalan" melalui distribusi

kemampuan untuk mendapatkan fungsi kebolehjadian marginal dalam hal

parameter butir). Menghasilkan "estimasi Kebolehjadian maksimal marginal"

yang dihasilkan memiliki sifat asimptotik yang diinginkan; Artinya, estimasi

parameter butir konsisten karena jumlah peserta ujian meningkat. Prosedur

perkiraan kebolehjadian maksimal marginal ini dikembangkan oleh Bock dan

Lieberman (1970), disempurnakan oleh Bock dan Aikin (1981), dan

diimplementasikan di Program Compuler Bilog oleh Mislevy and Bock (1984).

Prosedur kebolehjadian maksimal marginal adalah perhitungan secara lebih

intensif daripada prosedur Kebolehjadian maksimum bersama karena dengan

tujuan integrasi yang dibutuhkan. Selain, untuk mendapatkan fungsi

Kebolehjadian marginal dari parameter butir. Ini perlu untuk memperkirakan

distribusi dari kemampuan. Untuk perkiraan yang baik dari distribusi kemampuan,

peserta ujian dengan jumlah yang besar itu penting. Oleh karena itu, prosedur

maksimum kebolehjadian marginal harus dilakukan hanya dengan jumlah peserta

ujian yang cukup besar.

Pada parameter butir yang telah diestimasi menggunakan prosedur Kebolehjadian

maksimal marginal, estimasi parameter butir mungkin diperlakukan seperti yang

diketahui dan kemampuan peserta ujian dapat diestimasi dengan menggunakan

Metode yang diuraikan di bab ini. Sekali lagi, semakin banyak jumlah butir,
semakin baik estimasi parameter kemampuan. Salah satu estimasi kebolehjadian

maksimum dari kemampuan atau,jika dikehendaki, estimasi EAP dari kemampuan

mungkin dapat diperoleh.

Dalam beberapa situasi, bahkan prosedur maksimum marginal mungkin dapat

gagal; Artinya, prosedur numerik mungkin gagal untuk menghasilkan hasil yang

memuaskan bahkan setelah sejumlah besar perulangan. Kegagalan ini terutama

terjadi pada estimasi dari parameter c dalam model tiga-parameter. Estimasi c

yang buruk, pada gilirannya, menurunkan estimasi parameter butir yang lain dan

dari kemampuan (Swaminathan & Gifford, 1985). Estimasi Bayes (Mislevy,

1986) memecahkan masalah ini (sebenarnya, dalam program komputer BILOG,

distribusi sebelumnya ditempatkan pada nilai parameter c sebagai pilihan standar).

Kesalahan Standar dari Estimasi Parameter Butir

Konsep dari fungsi informasi, yang diperkenalkan secara singkat di awal, adalah

konsep umum yang berkaitan dengan variasi dari estimasi Kebolehjadian

maksimum. Ketika estimasi Kebolehjadian maksimum dari parameter

kemampuan diperoleh, variasinya diberikan sebagai timbal balik dari fungsi

informasi yang sesuai. Demikian pula, ketika estimasi kemampuan maksimum

dari parameter butir diperoleh, keragaman matriks kovarian dari estimasi

diberikan sebagai invers matriks informasi dari estimasi parameter butir (karena,

dalam kasus model dua dan tiga parameter, masing-masing ditandai dengan dua

dan tiga parameter). Elemen dari matriks inforimasi untuk estimasi kebolehjadian

maksimum bersama untuk setiap butir diatur dalam cara berikut (karena matriks

simetris, hanya elemen segitiga atas yang diberikan):


I i=
[ I aai I abi I aci
I bbi ¿ I cci ] i=1,2,…,n

Pernyataan dari elemen ditentukan di bawah (Hambleton&Swaminathan, 1985;

Lord, 1980).

N
D2 Q
2∑
I aai = (θ i−bi )2 (Pij −c i)2 ij
(1−c i ) j =1 Pij

2 N
D ai Q
2∑
2 ij
I abi = (θ j−bi)(Pij −ci )
(1−c ) i j =1 P ij

D
N
Q
2∑
I aci= (θ j −bi )(Pij −c i) ij
(1−c i) j=1 Pij

D 2 ai2 N
Q
I bbi =
(1−c )
∑ (Pij −c i )2 ij
2
P
i j=1 ij

N
1 Qij
2∑
I cci =
(1−c i ) j=1 Pij
Pernyataan sederhana untuk matriks varians — kovarians kebolehjadian

maksimum marjinal tidak tersedia, tetapi penjelasan tentang prosedur untuk

memperolehnya diberikan dalam Mislevy dan Bock (1984) dan Mislevy (1986).

Matriks variance-covariance dari parameter butir penting ketika membandingkan

parameter butir dalam dua kelompok, masalah yang timbul dalam bias atau studi

fungsi perbedaan butir (Lord, 1980).


Ringkasan metode penilaian Parameter

Dalam bagian sebelumnya, kebolehjadian maksimum, Kebolehjadian maksimum

marjinal, dan prosedur estimasi Bayes diuraikan. Ini adalah prosedur estimasi

yang paling banyak digunakan. Untuk tinjauan tentang prosedur terkini,

perhatikan Baker (1987) dan Swaminathan (1983). Beberapa pendekatan lain

untuk estimasi tidak diuraikan dalam bab ini. Daftar prosedur estimasi yang

tersedia penjelasan singkat diberikan di bawah ini:

 Metode maksimum kebolehjadian bersama (Lord, 1974, 1980), berlaku

untuk model satu - dua -, dan tiga parameter. Parameter kemampuan dan

butir diestimasi secara bersamaan.

 Metode maksimum marginal (Bock & Aitkin, 1981), berlaku untuk model

satu - dua -, dan tiga parameter. Parameter kemampuan terintegrasi, dan

parameter butir yang diestimasi. Dengan parameter butir yang ditentukan,

parameter kemampuan diestimasi.

 Prosedur kebolehjadian maksimum yang kondisional (Andersen, 1972,

1973: Rasch.1960), hanya berlaku untuk model satu-parameter. Disini,

fungsi kebolehjadian dikondisikan pada skor benar.

 Prosedur estimasi bersama dan estimasi Bayes (Mislevy. 1986 Swaminathan

& Gifford, 1982, 1985, 1986), berlaku untuk satu —. Model dua dan tiga

parameter. Distribusi sebelumnya ditempatkan pada parameter butir dan

kemampuan, menghilangkan beberapa masalah, seperti estimasi yang tidak

tepat dari parameter dan nonkonvergensi, yang dihadapi dengan prosedur

kebolehjadian maksimum bersama dan marjinal.


 Prosedur estimasi heuristik (Urry, 1974. 1978), terutama berlaku untuk

model dua dan tiga parameter.

 Metode berdasarkan pada prosedur analisis faktor nonlinear (McDonald,

1967. 1989), dapat diterapkan pada dua parameter dan kasus yang

dimodifikasi dari model tiga parameter, di mana nilai C tetap.

Selain itu, ketika parameter butir sudah diketahui, estimasi kemampuan

dapat dilaksanakan dengan memperoleh modus fungsi kebolehjadian, atau, dalam

kasus prosedur Bayes, baik modus rata-rata atau dari fungsi kepadatan posterior e.

Prosedur yang dimusim panas di atas diterapkan dalam program komputer yang

diuraikan di bagian berikut :

Program komputer untuk estimasi Parameter

Hingga sekarang ini, hanya sedikit program komputer yang tersedia untuk

estimasi parameter model IRT yang diperkenalkan sebelumnya. Pada tahun 1970-

an, program yang paling banyak dikenal dan digunakan adalah BICAL (Wright et

al., 1979) dan LOGIST (Wingersky, Barton, & Lord, 1982). BICAL cocok

dengan model satu parameter, Logist cocok dengan model satu, dua, dan tiga

parameter. Kedua program itu menggunakan prosedur estimasi kebolehjadian

maksimum, dan keduanya masih digunakan secara luas. LOGIST tetap menjadi

standar yang dengannya program estimasi baru dinilai.

Program lain yang tersedia di tahun 1970-an adalah PML (Gustafsson.,

1980a) dan ANCILLES (Urry, 1974, 1978). PML cocok dengan model satu

parameter menggunakan prosedur kebolehjadian maksimum kondisional,


sedangkan ANCILLES cocok dengan model tiga parameter menggunakan

prosedur heuristik. PML tidak banyak digunakan di Amerika Serikat, dan

ANCILLES tidak sering digunakan karena prosedur estimasi tidak baik berdasar

secara teoretis dan pemrograman lainnya telah terbukti menghasilkan perkiraan

yang lebih baik.

Pada tahun 1980-an beberapa program estimasi baru diperkenalkan. Yang

paling menonjol adalah BILOG (Mislevy & Bock, 1984) dan ASCAL (sistem

penilaian Corporalion, 1988). BILOG cocok dengan model satu, dua, dan tiga

Parameter dengan menggunakan prosedur kebolehjadian maksimum marginal

dengan prosedur alternatif Bayes; ASCAL cocok dengan model tiga parameter

menggunakan prosedur Bayes. BILOG tersedia dalam versi utama dan

mikrokomputer, sedangkan ASCAL merupakan program mikrokomputer.

Yang juga tersedia pada awal tahun 1980-an adalah program NOHARM

(Fraser & McDonald, 1988), yang cocok dengan model dua dan tiga parameter

(dengan nilai C yang tetap) menggunakan pendekatan analisis faktor nonlinear.

NOHARM tidak mendapat banyak perhatian di amerika serikat.

Perkembangan lainnya termasuk program mikrokomputer untuk

mencocokkan model satu-parameter. Skala mikro (Mediax Interactive

Technologies. 1986) dan RASCAL (Assessment Systems Corporation, 1988).

Sebuah versi mikrokomputer dari LOGIST telah dikembangkan dan diharapkan

akan dirilis pada tahun 1991 atau 1992. RIDA (Glass, 1990) adalah program

mikrokomputer baru untuk menganalisis data dikotomis menggunakan model

satu-parameter. Baik prosedur estimasi kebolehjadian maksimum marginal dan


kondisional tersedia. Fitur khususnya adalah kemampuan menganalisis berbagai

desain yang tidak lengkap yang sering muncul dalam pengujian persamaan (lihat

chapter 9).

Yang terakhir, minat pada program IRT yang menangani data polytomous

(Thissen, 1986; Wright dan al.. 1989) dan data multidimensional (Carl. Son,

1987) telah dikembangkan, tetapi mengerjakan topik yang terakhir ini baru saja

dimulai dan perlu banyak riset sebelum program Carlson dapat digunakan.

Ringkasan dari program-program yang terdaftar di atas dan kelebihan-

kelebihannya serta fitur-fitur utamanya diberikan dalam tabel 3.2. Sumber untuk

program yang terdaftar dalam lampiran B.

Tabel 3,2 Program Estimasi Parameter IRT yang Tersedia Saat Ini

Pros (+)
Prosedur Persyaratan
Program Sumber Model Cons (-) dan
estimasi Komputer
Features (*)

BICAL Wright dan 1P Kebolehja Kebanyakan + Murah

(Replaced al. dian mainframe + Memberikan kesalahan

by BIG- (1979): Maksimu standar

SCALE) Wright dan m tanpa +Memberikan Grafik/

al. syarat analisis statistik yang

(1989) baik

MICRO Mediax 1P Multi Kebolehja PC * PC versi untuk BICAL

SCALE Interactive kategori dian * Data dapat diinput di

Technologie Maksimu lembar kerja


s (1986) mtanpa elektronik

syarat

PML Gustafson 1P Kebolehja Unknown * Estimasinya konsisten

(1980) dian - Komputasi intesif

Maksimu + Tidak banyak

m digunakan di U.S

bersyarat

RASCAL Assesment 1P Kebolehja PC + Memiliki analisis yang

Systems dian sesuai

Corp. Maksimu * Disertakan dalam paket

(1988) m tanpa Micro CAT

syarat

RIDA Glas (1990) 1P Kebolehja PC + Menyediakan analisis

dian sampel dan data yang

Maksimu lengkap

m + menggunakan desain

bersyarat tidak lengkap untuk

atau tes equating.

marginal + Dilengkapi analasis

yang sesuai
Lanjutan Tabel 3.2

Computer Pros (+)


Prosedur
Program Sumber Model Requirem Cons (-) dan
estimasi
ents Features (*)

ANCILLES Urry 3P Heuristic Most + Murah

(1974, 1978) mainframe - Seringkali butir

hilang/orang yang

diuji

- Prosedur estimasi tidak

berdasarkan teori

* Tidak digunakan

secara luas

ASCAL Assesment 1P Modifikasi PC + Memiliki analisis yang

Systems Corp. 2P Bayes sesuai

(1988) 3P +Disertakan dalam paket

Micro CAT

*Menggunakan prosedur

Bayes

LOGIST Wingersky 1P Maksimum IMB/CDC + menghasilkan standar


(1983); 2P Kebolehjadi Mainfram kesalaha Logist V

Wingersky et 3P an tanpa e (Versi + Fleksibel, banyak

al. (1982) syarat IV) pilihan

+ Megizinkan

kelalaian/tak tercapai

- Spesifikasi penginputan

kompleks

- Mahal untuk dijalankan

- Sulit dikonversi ke

peralatan non-IBM

- Tempatkan banyak

kendala pada

parameter untuk

mendapatkan

konvergensi

Lanjutan Tabel 3.2

Program Sumber Model Prosedur Computer Pros (+)

estimasi Requirem Cons (-) dan


ents Features (*)

BILOG Mislevy & 1P Marginal IBM + Pilihan estimasi

Bock (1984) 2P Maksimum mainframe Baye’s

3P Kebolehjadi PC + Mencegah estimasi

an Version ekstrim

- Mahal dijalankan

dimainframe

- Masih ada

kebolehjadian

estimasi yang cacat

NOHARM Fraser dan 1P Least Most + Model multidimensi

McDonald 2P Square mainframe yang baik

(1988) 3P s PC + Dilengkapi analisis

residual

- Tidak ada parameter

yang pasti

* Tidak banyak

digunakan di U.S

MULTILOG Thissen Multi IBM * Merupakan

(1986) kategori Mainfram generalisasi BILOG

e yang dapat mencakup

multikategori data

MIRTE Carlson 1P Maksimum IBM + Model multi


(1987) 2P Kebolehjadi Mainfram dimensional yang

3P an tanpa es PC sesuai

syarat + Memberikan standar

eror

+ Dilengkapi analisis

residual

- Tidak ada parameter

yang pasti

Anda mungkin juga menyukai