4.1 Pengertian
Pengukuran pendidikan mencakup berbagai bidang. Bila mana
kita menggunakan taksonomi psikologi belajar maka hal itu
mencakup pengukuran bidang kognitif, afektif, dan bidang
psikomotorik. Pada umumnya aspek kognitif diukur dengan tes, aspek
afektif dengan nontes, dan aspek psikomotorik dengan perbuatan dan
pengamatan. Dalam pengukuran pendidikan, kita mengukur
kemampuan, keberhasilan belajar, sikap, minat, atau ciri terpendam
lainnya yang terdapat pada masing-masing individu siswa. Hanya saja
karena hal itu terpendam, berbagai ciri yang ingin diukur tidak akan
teramati dan tidak dapat dilihat. Dengan demikian kita sesungguhnya
mengukur berbagai aspek itu secara tidak langsung, yakni dengan
memberikan berbagai stimulus baik melalaui ujites maupun
kuesioner, tepatnya dapat dilakukan melalui tes atau nontes.
62
umumnya berubah. Dengan kata lain, taraf sukar dan daya beda
kelompok butir itu berubah semata-mata karena mereka ditanggapi
oleh kelompok peserta yang berbeda. Untuk butir yang sama,
kelompok peserta berbeda menunjukkan ciri butir (taraf sukar dan
daya beda) yang berbeda.
Jika kelompok peserta yang sama menempuh kelompok butir
ujites atau mengisi kelompok butir koesioner yang berbeda, maka ciri
kelompok peserta pun pada umumnya berubah. Artinya, kemampuan
atau sikap para peserta berubah semata-mata karena menempuh atau
mengisi butir yang berbeda. Untuk peserta yang sama, kelompok butir
berbeda menunjukkan ciri peserta (kemampuan dan sikap) yang
berbeda.
Demikian pula, pada uji tes dan kuesioner klasik, sekor sangat
bergantung pada butir dan peserta. Pangungkapan sekor selalu perlu
disertai keterangan tentang butir dan peserta yang terlibat di dalam
pensekoran itu. Butir dan peserta tes terkait atau tidak terlepas dari
faktor lain serta keterkaitan atau ketidaklepasan di antara butir dan
peserta tersebut dapat menimbulkan sejumlah hal yang cukup
mempengaruhi hasil analisis dalam menentukan kualitas butir tes
yang memadai.
63
tafsiran sekor menjadi tafsiran meracuan norma. Dalam hal
ini, ada orang yang ingin sekor menjadi tafsiran beracuan
patokan. Bersama itu timbul percabangan (dualisme) di
dalam penefsiran sekor.
3. Dalam hal ujites, butir yang terlalu mudah atau terlalu
sukar bagi kemampuan peserta tidak dapat memberi sekor
yang mencerminkan dengan benar kemampuan peserta itu.
Lebih dari itu, para pserta harus mengerjakan semua butir
lainnya sekalipun butir butir itu terlalu mudah atau terlalu
sukar bagi bereka.
4. Dalam hal uji tes, kalau butir ujites itu terlalu mudah
atau terlalu sukar bagi dua atau lebih peserta, maka sekor
tidak lagi dapat membedakan kemmapuan para peserta itu
sekiranya di antara mereka terdapat perbedaan kemampuan.
Itulah sejumlah masalah yang dihadapi oleh pengukuran klasik.
Masih ada masalah lain, namum keempat masalah ini sudah cukup
menunjukkan kelemahan yang ada pada pengukuran klasik.
Pengukuran modern bertujuan untuk menghilangkan
kelemahan pada pengukuran klasik. Tujuan utama pengukuran
modern adalah melepaskan ketakterpisahan di antara butir ujites
dengan peserta ujites. Dengan pengukuran modern ini, ciri butir akan
tetap sama, tidak menjadi soal peserta mana yang menempuhnya.
Demikian pula, ciri peserta akan tetap sama, tidak menjadi soal butir
mana yang ditangggapinya. Salah satu jenis pengukuran modern yang
cukup terkenal adalah teori responsi butir (item renposn theory-IRT).
Pada IRT kita mengenal tiga hal.
1. proporsi jawaban benar yang dilakukan peserta ujites
terhadap butir ujites. Dalam hal sikap, hal pertama ini
adalah proporsi jawaban positip yang dilakukan oleh
responden kuesionar.
64
2. ciri butir (parameter butir yakni taraf sukar, daya pembeda,
dan tebakan) yang menyebabkan peserta ujites memberikan
tangapan seperti itu
3. ciri terpendam peserta yang menyebabkan peserta ujites
memberikan tanggapan demikian.
Pengertian ciri butir dalam pengukuran kalsik dan modern
berbeda. Ciri terpendam peserta tes dikenal sebagai parameter peserta,
yang terdiri atas kemampuan, sikap, serta yang lainnya.
Pengukuran klasik mengaitkan butir dengan peserta secara tak
terpisahkan dalam pensekoran. Pengukuran modern memisahkan
mereka dalam pensekoran. Artinya, pensekoran adalah invarians
(tetap tidak berubah) terhadap butir serta terhadap peserta. Dengan
kata lain, ciri butir adalah invarians sekalipun pesertanya berbeda-
beda serta ciri peserta adalah invarians sekalipun butir tesnya
berbeda-beda.
65
patuh terhadap rumus tersebut. Dalam proses semacam ini terjadilah
apa yang disebut invariansi di antara butir tes dan peserta tes
Perbedaan mendasar antara pengukuran klasik dengan
pengukuran modern terletak pada invariansi pensekoran, di mana
pensekoran modern adalah invarians (tidak berubah atau tetap)
terhadap butir tes serta terhadap peserta tes. Menurut Lord (1990)
bahwa invariansi parameter-parameter butir tes melalui kelompok
peserta tes merupakan karakteristik yang paling penting dari IRT. Kita
biasanya memikirkan bahwa indeks kesukaran butir tes sebagai
proporsi jawaban yang benar sehingga sukar untuk membayangkan
bagaimana indeks kesukaran tes dapat menjadi invarian terhadap
kelompok peserta tes dari tingkat kemampuan yang berbeda.
Menurut Setiadi (1998: 7), apabila IRT digunakan sesuai
konsep statistik, soal yang diperoleh tidak bergantung kepada sampel
para pengikut ujian. Jadi, walaupun soal-soal dikerjakan oleh siswa
yang pandai atau siswa yang kurang pandai, indikasi tingkat
kesukaran suatu soal tetap tidak berubah, yang mana hal ini
merupakan salah satu kelebihan yang dimiliki IRT jika dibandingkan
dengan tes klasik. Untuk memberikan ilustrasi tentang invariansi ini,
lihatlah gambar berikut.
Pada Gambar 1, tampak ada dua kurva karakteristik butir tes
yang berbeda. Hal itu terlihat juga pada garis dasar distribusi
kemampuan dari dua kelompok peserta tes yang berbeda.
Kemampuan yang diinginkan untuk suatu probabilitas kesuksesan
pada sebuah butir tes tidak bergantung pada distribusi kemampuan
dari beberapa kemampuan tersebut, sehingga konsekuensinya, indeks
kesukaran butir (b) adalah sama terhadap kelompok butir tes.
Kemudian, pada kelompok A, butir 1 dijawab benar lebih sedikit dari
butir 2. Di dalam kelompok B, sebaliknya terjadi. Jika kita digunakan
proporsi jawaban benar seperti mengukur indeks kesukaran butir tes,
ditemukan bahwa butir 1 lebih mudah dari butir 2 untuk sebuah
66
kelompok tetapi lebih sukar dari kelompok 2 pada kelompok yang
lain.
P
1,0 1
2
0,5
0,0 b1
A B
67
tidak teramati dengan variabel kemampuan yang teramati. Asumsi-
asumsi tersebut juga menyangkut karakteristik butir tes yang relevan
terhadap kinerja peserta tes pada suatu butir tes tersebut. Perbedaan
besar antara model-model IRT dalam pemakaian bersama adalah
dalam jumlah dan tipe serta karakteristik-karakteristik yang
diasumsikan untuk kinerja peserta tes.
1. Unidimensi
Menurut Naga (1992; 164) bahwa persyaratan unidimensi
ditujukan untuk mempertahankan invariansi pada IRT. Kalau butir tes
sampai mengukur lebih dari satu dimensi, maka jawaban terhadap
butir itu akan merupakan kombinasi dari berbagai kemampuan peserta
tes. Akibatnya, tidak lagi diketahui kontribusi dari setiap kemampuan
terhadap jawaban peserta tes tersebut. Dengan mengganti butir tes
atau kelompok peserta tes, kita tidak dapat lagi dipertahankan
invariansi pada ukuran ciri butir tes dan pada ukuran ciri peserta tes,
sehingga ketidakmampuan mempertahankan syarat invariansi ini
akan bertentangan dengan tujuan ITR tersebut.
Dengan terpenuhinya persyaratan unidimensi tersebut maka
diperlukan cara untuk menentukan apakah suatu butir tes merupakan
unidimensi atau tidak. Untuk hal ini, biasanya digunakan metode
analisis faktor. Dalam hal ini, penggunaan analisis faktor bertujuan
untuk memperlihatkan pada kelompok faktor mana butir tes itu
berada. Setiap faktor hanya menunjukkan suatu dimensi indikator tes.
Dengan demikian, setiap dimensi indikator tes terhimpun dalam satu
faktor yang melibatkan beberapa butir tes yang diperlukan. Faktor-
faktor tersebut mungkin meliputi motivasi, kecemasan, kemampuan
bekerja cepat, kecenderungan menebak bila dalam keadaan ragu-ragu
menjawab, dan keterampilan kognitif di dalam menjumlahkan, serta
faktor dominan lain yang diukur dengan sehimpunan butir tes.
Asumsi unidimensi bertujuan untuk melihat secara lengkap
sekumpulan data tes dari sebuah komponen yang domonan atau faktor
yang mempengaruhi kinerja tes tersebut. Komponen dominan atau
68
faktor dihubungkan dengan kemampuan yang diukur melalui tes
tersebut , di mana kemampuan itu tidak cukup inheren atau tidak
dapat berubah. Skor-skor kemampuan dapat berubah di luar waktu
itu, karena adanya faktor belajar, mengingat dan sebagaianya
(Hambleton, 1991; 10).
Menurut Setiadi (1998; 6) bahwa penggunaan teori tes klasik
(classical test theory) memiliki beberapa kerugian apabila
dibandingkan dengan penggunaan IRT. Dalam teori tes klasik, tingkat
kesukaran soal tergantung pada sampel dari peserta tes. Jadi, apabila
soal-soal dikerjakan oleh sampel siswa-siswa yang pandai maka soal-
soal tersebut sepertinya menjadi mudah atau tingkat kesukaran
soalnya menjadi besar, tetapi sebaliknya apabila dikerjakan oleh
kelompok siswa yang kurang pandai, maka soal-soal tersebut menjadi
sepertinya sukar atau tingkat kesukaran soal itu menjadi kecil. Jadi,
statistik soal-soal itu tidak konsisten atau berubah-ubah tergantung
pada kemampuan kelompok sampel siswa yang menempuh ujian. Hal
sernacam itu fidak menguntungkan karena soal-soal yang dibangun
itu seharusnya tetap konsisten tidak berubah-ubah, dalam arti bahwa
soal itu tidak tergantung pada siapa yang mengerjakan apakah oleh
siswa pandai atau siswa yang kurang pandai. Dengan kata lain,
apabila "classical item analysis" dijadikan dasar pada penyusunan
butir-butir soal maka akan sangat sukar apabila kita ingin memonitor
atau membandingkan mutu siswa dari tahun ke tahun jika soal-soal
yang digunakan adalah berbeda walaupun berasal dari pokok bahasan
yang sama.
a. Independensi Lokal
Di samping syarat unidimensi yang telah dikemukan
sebelumnya, maka asumsi independensi lokal merupakan salah satu
syarat yang harus dipenuhi oleh IRT. Independensi Lokal
dimaksudkan sebagai letak pada suatu titik di kontinum parameter ciri
peserta tes yakni (Naga, 1992; 170). Prinsip Independensi Lokal
69
dinyatakan oleh asumsi Lazarsfeld (1968) bahwa secara formal,
Probabilitas (success pada butir i yang diberikan ) = Probabilitas
(success pada butir i yang diberikan dan juga diberikan kinerjanya
pada butir j, k, ...). Jika ui = 0 atau 1 menyatakan skor pada butir ke i,
maka secara kompak hal ini ditulis dengan:
P(ui =1 ) = P(ui =1 , uj, uk, ....) ( i j k , ... )
Menurut Lord (1990, 19) secara matematika pernyataan
independensi lokal berarti bahwa probabilitas sukses seluruh butir tes
sama dengan perkalian dari bagian-bagian probabilitas sukses
tersebut. Sebagai contoh, ada tiga butir tes i, j, dan k, maka:
P(ui =1, uj =1, uk =1 ) = P(ui =1 ) P(uj =1 ) P(uk =1 ).
Independensi Lokal menginginkan setiap dua butir tidak berkorelasi
apabila adalah tetap. Secara definisi tidak diinginkan butir-butir
tidak berkorelasi dalam kelompok, di mana bervariasi. Dalam hal
tertentu, independensi lokal secara otomatis mengikuti
keunidimensian.
Menurut Crocker dan Algina (1986) di dalam IRT secara
bersama digunakan konsep-konsep yang lebih umum terhadap
keterikatan dan kebebasan statistik untuk menyatakan tentang
hubungan antara variabel-variabel. Untuk dua skor butir dikotomi
konsep-konsep tersebut dapat didefinisikan sebagai berikut.
Andaikan Pi(+) menyatakan peluang jawaban benar butir ke i, dan
Pi(-) menyatakan peluang jawaban salah butir ke i. Andaikan pula
Pj(+) dan Pj(-) menyatakan hubungan peluang tersebut untuk butir ke
j. Demikian pula misalkan P(+, +), P(-, -), P(+, -), P(-, +) menyatakan
peluang dari susunan jawaban yang didefinifsikan dalam tanda
kurung. Sebagai contoh, P(+, +) menyatakan peluang jawaban benar
dari butir ke i, dan j. Dengan definisi tersebut, skor-skor pada dua
butir secara statistik adalah bebas jika :
P(+ , +) = Pi(+) Pj(+)
P(+ , -) = Pi(+) Pj(-)
P(- , +) = Pi(-) Pj(+), dan
70
P(- , -) = Pi(-) Pj(-)
Dan adalah tidak bebas secara statistik jika setiap empat persamaan
tersebut tidak memenuhi, misalnya jika Pi(+) = 0,8, Pi( -) = 0,2,
Pj(+) = 0,6 dan Pj(-) = 0,4 maka skor-skor pada kedua butir adalah
bebas jika dan hanya jika:
P(+ , +) = Pi(+) Pj(+) = (0,8)(0,6) = 0,48
P(+ , -) = Pi(+) Pj(-) = (0,8)(0,4) = 0,32
P(- , +) = Pi(-) Pj(+) = (0,2)(0,6) = 0,12, dan
P(- , -) = Pi(-) Pj(-) = (0,2)(0,4) = 0,08
Contoh lainnya adalah bila diketahui responsi dari 40 responden pada
suatu tertentu hasil akhirnya sebagai berikut.
71
Tabel 4-.1. Responsi 40 responden
B Responsi Responden
u
ti
r
1 00000 11000 00011 00010 00100 00000 11001 10101
2 01100 00011 10000 11111 11111 11100 00110 01111
Butir ke-2
1 0
Butir ke 1
1 0,10 0,20 0,30
0 0,50 0,20 0,70
0,60 0,40
72
untuk kedua butir sedemikian rupa sehingga peluang pada ruas kiri
dari persamaan dapat dihitung dengan mengetahui hanya peluang
jawaban benar dan salah untuk masing-masing butir tersebut. Dengan
demikian, dapat disimpulkan bahwa sebuah tes adalah unidimensional
jika butir-butir tes tersebut secara statistik adalah tidak bebas di dalam
populasi yang dilibatkan. Suatu ciri atau sifat terpendam tunggal ada
sehingga butir-butir tersebut secara statistik adalah bebas di dalam
masing-masing subpopulasi dari peserta tes yang homogen.
Dalam IRT, proporsi jawaban benar, ciri (parameter) butir, dan
ciri peserta dihubungkan melalui rumus, di mana muncul masalah
dalam menentukan rumus responsi butir atau rumus karakteristik butir
yang dikenal sebagai penentuan model responsi butir atau model
karakteristik butir. Masalah lainnya adalah bagaimana menentukan
nilai parameter butir dan nilai parameter peserta yang diistilahkan
sebagai pengestimasian parameter, baik parameter butir maupun
parameter peserta, yang disebut sebagai pengkalibrasian butir. Untuk
pemeriksaan hasilnya dilakukan estiamasi parameter, yang bertujuan
sebagai pencocokan model. Bilamana nilai parameter yang didapat
mengandung variansi yang besar, maka nilai tersebut kurang cermat,
dan sebaliknya jika nilai parameter kecil maka nilai tersebut cukup
tajam atau cukup cermat (Naga, 1992; 8). Bilamana model yang
dipilih sudah tepat maka diperlukan pemeriksaan berikutnya, di mana
parameter yang diperoleh akan memberikan informasi yang berharga,
yang dikenal dengan fungsi informasi.
73
yang mencirikan seorang peserta tes tidak bergantung pada himpunan
butir-butir tes tersebut .
Secera sederhana dicatat, sifat invarian terhadap parameter butir
dapat diobservasi pada gambar berikut.
Probability
1,0
0,5
0,0 θ
2
1
74
Sifat invariansi merupakan suatu ciri yang tepat terhadap model
regresi linier. Dalam model regresi linier , garis regresi untuk
memprediksi variabel Y dari variabel X diperoleh sebagai garis yang
menghubungkan mean variabel Y untuk masing-masing nilai variabel
X. Pada saat model regresi ini dibentuk, garis regresi yang sama akan
diperoleh dalam setiap range taerbatas dari variabel X, sehingga pada
setiap subpopulasi X, berarti bahwa slope (kecondongan) dan
intercept (perpotongan) dari garis tersebut akan menjadi sama dalam
sebarang subpopulasi X. Suatu indeks yang digunakan, seperti
koefisien korelasi , yang bukan merupakan parameter maka
karakteristik garis regresi tersebut tidak invarian terhadap
subpopulasi. Perbedaan antara parameter kecondongan dan koefisien
korelasi adalah bahwa parameter kecondongan tidak bergantung pada
karakteristik dari subpopulasi tersebut, seperti variability, demikian
pula koefisien korelasi juga tidak ( catatlah, walau bagaimanapun
juga sifat estimasi terhadap garis menghendaki suatu keheterogenan
sampel). Konsep-konsep yang sama juga diterapkan dalam model-
model jawaban butir, yang dapat berupa model-model regresi
nonlinier.
75
di mana: Pj (θ) adalah peluang peserta tes dengan kemampuan θ
menjawab benar butir ke j; bj adalah parameter kesukaran butir tes
ke j; aj adalah parameter daya pembeda butir tes; cj adalah
parameter tebakan, D = 1,7 dan e = 2.718
Andaikan terdapat empat butir tes yang memiliki masing-
masing nilai ketiga parameter butir, seperti tercantum pada tabel
berikut.
Nilai Parameter
Butir
Butir
a b c
1 0,20 -1 0,00
2 0,50 0 0,10
3 1,00 1 0,15
4 2,00 2 0,20
Tabel 4.4. Nilai P() Untuk Harga (-4 +4) Secara Mendatar
a b c -4 -3 -2 -1 0 1 2 3 4
1 0,.20 -1 0,00 0,27 0,34 0,42 0,50 0,58 0,66 0,73 0,80 0,85
2 0,50 0 0,10 0,13 0,17 0,24 0,37 0,55 0,73 0,86 0,93 0,97
3 1,00 1 0,15 0,15 0,15 0,16 0,18 0,28 0,58 0,87 0,97 0,99
4 2,00 2 0,20 0,20 0,20 0,20 0,20 0,20 0,23 0,60 0,97 1,0
76
Nilai P() secara tegak ditampilkan sebagai berikut.
Tabel 4.5. Nilai P() Untuk Harga (-4 +4) Secara Tegak
Grafik dari keempat butir dari Tabel 2.6 seperti Gambar 2.5.
77
Lengkungan Butir 3P
1.2
0.8
P(0)
0.6
Series1
0.4 Series2
0.2 Series3
Series4
0
-5 0 Kemampuan 5
78
kemampuan siswa (). Ketiga hal ini perlu terjadi secara sejalan
karena nilai a yang tinggi dan nilai c yang rendah saja, tanpa disertai
dengan kecocokan di antara nilai b dan , akan menghasilkan fungsi
informasi butir yang rendah. Ketiga b > di mana jika selisih kedua
nilai tersebut cukup tinggi, berarti taraf sukar jauh di atas nilai
kemampuan siswa (soalnya sangat sukar), maka peluang siswa
menjawab dengan benar butir tes akan cukup rendah.
Di pihak lainnya, peningkatan peluang menjawab benar butir
dipengaruhi juga oleh besar taraf sukar butir tersebut. Semakin besar
taraf sukar suatu butir maka akan semakin menurunkan peluang
menjawab dengan benar butir tersebut.
Contoh
79
P(0)
1,2
P1(0)
1
0,8 P2(0) Series1
0,6 Series2
0,4 P3(0) Series3
0,2
0 0
-4 -2 0 2 4
Contoh
1
Pi ( ) 1, 7 ( bi )
1 e
80
P(0)
1,2
1
0,8 Series1
0,6 Series2
P1(0) 0,4 P2(0) P3(0) Series3
0,2
0 0
-4 -2 0 2 4
Contoh
1
Menggunakan model 2P: Pi ( ) Da ( bi )
1 e
1 1 1
Untuk = -3 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 31) 1 e 3, 4 0,032
1 1 1
Untuk = -2 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 21) 1 e 2,55 0,07
1 1 1
Untuk = -1 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 11) 1 e1, 7 0,154
1 1 1
Untuk = 0 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 01) 1 e 0,85 0,300
1 1 1
Untuk = 1 Pi ( ) 1 e 0,85( 1) 1 e 0,85(11) 1 e 0 0,500
1 1 1
Untuk = 2 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 2 1) 1 e 0,85 0,700
81
1 1 1
Untuk = 3 Pi ( ) 1 e 0,85( 1) 1 e 0,85(31) 1 e 1,7 0,846
Tabel 4.8. Data 1 butir tes Model Logistik 2 Parameter
bi
Butir ai P1() untuk
i -3 -2 -1 0 1 2 3
1 0,5 1,0 0,032 0,070 0,154 0,300 0,500 0,700 0,846
P(0)
1
0,8
0,6
Series1
0,4
0,2
0 0
-4 -2 0 2 4
82
1
P1 ( ) 2 , 55 ( 1)
1 e
1
P2 ( )
1 e 2 , 04
1
P1 ( ) 0 ,85 ( 1)
1 e
1
P1 ( ) 1, 7 ( 1)
1 e
Pi(0)
1,2
1
Series1
0,8
Series2
0,6
Series3
0,4 0
Series4
0,2
0 0
-4 -2 0 2 4
Butir ke i 1 2 3 4
Parameter ai 0,2 0,5 1,0 2,0
Parameter bi -1,0 0,0 1,0 2,0
Parameter ci 0,00 0,10 0,15 0,20
D = 1,7
83
1
Rumus model 3P: Pi ( ) ci (1 ci ) Da ( bi ) , di mana:
1 e
max bi
1
Dai
ln 0,5 1 1 8ci
1
P1 ( ) 0 , 374 ( 1)
1 e
0,9
P2 ( ) 0,1
1 e 0,85
0,85
P3 ( ) 0,15
1 e 1, 7 ( 1)
0,8
P4 ( ) 0,2
1 e 3, 4( 2)
Tabel 4.11. Data 4 butir tes Model Logistik 3 Parameter
P(0)
1,2
1
Series1
0,8
Series2
0,6
Series3
P2(0) 0,4 P4(0) P(1(0)
P3(0) Series4
0,2
0 0
-5 0 5
84
2. Tingkat Kecuraman Kurva Karakteristik Butir
Butir Nilai
Daya Beda -4 -3 -2 -1 0 1 2 3 4
1 0.2 0.04 0.08 0.08 0.09 0.08 0.08 0.07 0.06 0.04
2 0.5 0.02 0.05 0.1 0.16 0.19 0.16 0.1 0.05 0.02
3 1 0.01 0 0.01 0.05 0.19 0.36 0.19 0.05 0.01
4 2 0 0 0 0 0 0.09 0.68 0.09 0
85
mengandung kedua parameter indeks kesukaran bj dan parameter
daya pembeda butir aj. Sementara model tiga parameter tampaknya
merupakan yang paling realistik dari ketiga model logistik yang ada,
sehingga menyatakan perubahan jawaban cj yang mengkaji estimasi
masalah-masalah tersebut.
Pada gambar 2.6. dilukiskan arti dari parameter–parameter
butir. Parameter c adalah peluang bahwa seseorang secara lengkap
tidak memiliki kemampuan (θ = - ∞) untuk menjawab dengan benar
butir tes tersebut. Hal ini dinamakan parameter tebakan (guessing
parameter). Jika sebuah butir tidak dapat dijawab benar dengan
tebakan, maka c = 0. Parameter b adalah suatu lokasi parameter. Hal
ini menunjukkan posisi kurva sepanjang skala kemampuan tersebut,
yang dinamakan kesukaran butir.
1,0
Inflexion
0,5_
cj
0,0 θ
b
86
tingkat kemampuan di mana peluang dari suatu jawaban benar
adalah 0,5. Ketika ada tebakan maka b merupakan tingkat
kemampuan, di mana peluang menjawab benar adalah antara c dan
1. Parameter a adalah proporsi kecondongan kurva pada titik
perubahan [kecondongan itu ternyata adalah 0,425a (1-c)], dalam
hal ini a merupakan daya pembeda butir tes, di mana peringkat
jawaban butir adalah bervariasi dengan tingkat kemampuan.
Pada model 1P, D = 1,7. taraf sukar 3 butir adalah masing-
masing –0,5, 0,5, dan 1,5
P(0)
1,2
P1(0)
1
0,8 P2(0) Series1
0,6 Series2
0,4 P3(0) Series3
0,2
0 0
-4 -2 0 2 4
87
Gambar 4.10. Fungsi Karakteristik Butir pada Model 1P
Contoh
1
Pi ( ) 1, 7 ( bi )
1 e
Penerapan rumus model 1P dalam analisis dapat ditunjukkan melalui
proses perhitungan setiap butir sebagai berikut:
88
Tabel 4.14. Butir Tes pada Mpdel 1 Parameter
P(0)
1,2
1
0,8 Series1
0,6 Series2
P1(0) 0,4 P2(0) P3(0) Series3
0,2
0 0
-4 -2 0 2 4
Contoh
1
Menggunakan model 2P: Pi ( ) Da ( bi )
1 e
1 1 1
Untuk = -3 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 31) 1 e 3, 4 0,032
89
1 1 1
Untuk = -2 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 21) 1 e 2,55 0,07
1 1 1
Untuk = -1 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 11) 1 e1, 7 0,154
1 1 1
Untuk = 0 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 01) 1 e 0,85 0,300
1 1 1
Untuk = 1 Pi ( ) 1 e 0,85( 1) 1 e 0,85(11) 1 e 0 0,500
1 1 1
Untuk = 2 Pi ( ) 1 e 0,85( 1) 1 e 0,85( 2 1) 1 e 0,85 0,700
1 1 1
Untuk = 3 Pi ( ) 1 e 0,85( 1) 1 e 0,85(31) 1 e 1,7 0,846
Tabel 4.15. Butir Tes pada Model 2 Parameter
bi
Butir ai P1() untuk
i -3 -2 -1 0 1 2 3
1 0,5 1,0 0,032 0,070 0,154 0,300 0,500 0,700 0,846
P(0)
1
0,8
0,6
Series1
0,4
0,2
0 0
-4 -2 0 2 4
90
Contoh penerapan model 2P pada teori responsi butir tes sama halnya
dengan yang diterapkan pada analisis model 1P. Hal itu dapat
diperlihatkan melalui analisis sederhana seperti disajikan pada
tabel berikut, dan sekaligus dilukiskan lengkungan karakteristik
butir untuk model 2P tersebut.
1
P1 ( ) 2 , 55 ( 1)
1 e
1
P2 ( )
1 e 2 , 04
1
P1 ( ) 0 ,85 ( 1)
1 e
1
P1 ( ) 1, 7 ( 1)
1 e
91
Pi(0)
1,2
1
Series1
0,8
Series2
0,6
Series3
0,4 0
Series4
0,2
0 0
-4 -2 0 2 4
Contoh
Butir ke i 1 2 3 4
Parameter ai 0,2 0,5 1,0 2,0
Parameter bi -1,0 0,0 1,0 2,0
Parameter ci 0,00 0,10 0,15 0,20
1
Rumus model 3P: Pi ( ) ci (1 ci ) Da ( bi )
1 e
1
P1 ( )
1 e 0,374 ( 1)
0,9
P2 ( ) 0,1
1 e 0,85
0,85
P3 ( ) 0,15
1 e 1, 7 ( 1)
0,8
P4 ( ) 0,2
1 e 3, 4( 2)
92
Tabel 4.18. Butir-butir Tes pada Model 3 Parameter
Latihan:
93
1. Gambarkanlah kurva karakteristik ke 5 butir tes untuk model 1P
berikut.
Butir b
1 0,50
2 0,0
3 0,10
4 3,05
5 3,65
Butir a b
1 1,25 1,50
2 -1,00 2,40
3 0,75 0,90
4 2,66 3,75
5 2,30 3,65
3. Gambarkanlah kurva karakteristik ke 5 butir tes untuk model 3P
berikut.
Butir a b c
1 0,25 0,50 1,00
2 -1,00 0,0 1,00
3 0,00 0,10 0,15
4 2,47 3,05 4,00
5 2,30 3,65 2,54
94
Estimasi Parameter Butir
dan
Parameter Kemampuan
Jika parameter-parameter butir model IRT diketahui maka
estimasi terhadap kemampuan bagi suatu sampel peserta tes secara
nyata menggunakan metode maksimum likelihood. Hal tersebut
lazimnya secara praktis digunakan untuk mengestimasi parameter–
parameter butir yang dilibatkan dari berbagai kajian kalibrasi butir
sebelum kita melakukan estimasi terhadap θ. Estimasi simultan
terhadap kemampuan dan parameter- parameter butir dapat dilakukan
pada model pada persamaan (1), sementara di sisi lain merupakan
tugas berat dan problematik.
Setelah sebuah model IRT dipilih dari suatu kumpulan data
khusus, hal itu cukup digunakan untuk mengestimasi paremeter-
parameter tes dan parameter butir. Pada semua model, sebuah
parameter kemampuan tunggal θ diestimasi untuk masing-masing
individu . Sebaliknya paramater-parameter tersebut harus diestimasi
untuk masing-masing butir bergantung pada model IRT yang dipilih,
yakni bi untuk model logistik satu parameter, dan ai, bi untuk model
logistik dua parameter, serta ai , bi, , ci untuk model logistik tiga
parameter.
Pengestimasian parameter ciri peserta dan parameter ciri butir
dapat dilakukan secara berbarengan. Namun kemampuan prosedur ini
cukup terbatas sehingga sukar untuk digunakan secara umum.
Biasanya, cara umum untuk mengestimasi parameter ciri peserta dan
parameter ciri butir dapat dilakukan secara bersama yakni iterasi.
95
Andaikan jika pada pengestimasian parameter tersebut terdapat M
peserta mengerjakan N butir tes. Ini berarti bahwa dalam
pengestimasian diperlukan estimasi terhadap M parameter ciri peserta
dan N ciri butir. Pada model 1P kita hanya mengestimasi N pa ciri
butir, dan pada model 2P kita perlu mengestimasi 2N parameter ciri
butir, serta pada model 3P kita perlu mengestimasi 3N parameter ciri
butir. Estimasi parameter melalui perhitungan iterasi dimulai dengan
suatu nilai awal dan diteruskan dengan sejumlah langkah.
Pertama, kita menentukan nilai awal pada parameter ciri peserta
tes. Nilai awal parameter ciri peserta diambil diturunkan dari nilai
logit keberhasilan. Nilai awal ini diubah kedalam skala bakat. Pada
langkah kedua, dengan nilai awal ciri peserta dari langkah pertama,
kita mengestimasi parameter ciri butir. Selanjutnya langkah ketiga
dilakukan dengan menggunakan hasil pengestimasian parameter dari
langkah kedua, dilakukan estimasi ulang parameter ciri peserta.
Kemudian pada langkah keempat, estimasi diteruskan dengan
menggunakan hasil dari estimasi pada langkah ketiga untuk
mengestimasi parameter ciri butir. Demikian seterusnya sampai pada
nilai selisih estmasi di antara dua putaran sangat kecil biasanya pada
0,01. Selisih nilai yang kecil ini dinamakan konvergensi. Artinya
iterasi dilakukan sampai nilai estimasi itu konvergen ke 0,01.
Andaikan ada tiga butir soal ujian dijawab oleh responden
berkemampuan seperti tertera pada tabel berikut.
Butir bi Xi
1 -2,00 1
2 0,00 1
3 1,75 0
96
Estimasi dari responden itu.
Pertama masukkan masing-masing nilai parameter ciri butir
itu ke dalam model logistik 1P sebagai berikut
Persamaan butir 1 adalah sebagai berikut :
e D ( bi ) e1,7( 2)
P1 ( )
1 e D ( bi ) 1 e1,7 ( 2)
Persamaan butir 2 adalah sebagai berikut :
e D ( b2 ) e1,7
P2 ( )
1 e D ( b2 ) 1 e1,7 )
Persamaan butir 3 adalah sebagai berikut :
e D ( b3 ) e1,7 ( 1, 75)
P3 ( )
1 e D ( b3 ) 1 e1,7 ( 1,75)
2
0,1033
1 0 0,693 0,1947 0,8878
0,5305
Selisih = 0 - 1 = 0,195 (masih cukup besar, harus diiterasi lagi)
97
Pada 1 = 0,8878, maka hasil iterasi ketiga persamaan dirangkum
pada tabel berikut.
0,0007
2 1 0,8877 0,0013 0,8891
0,5235
Selisih = 1 - 2 = 0,0013 (kurang kecil, harus diiterasi lagi)
Pada 2 = 0,889, maka hasil iterasi ketiga persamaan dirangkum pada
tabel berikut.
0,0002
3 2 0,889 0,0004 0,8894
0,5235
98
Selisih = 2 - 3 = 0,0003 (cukup mendekati nol, iterasi dihentikan)
Untuk model logistik Dua Parameter .
Andaikan ada tiga butir dengan karakteristik seperti pada tabel
berikut.
Butir ai bi XI
1 1,0 -1 1
2 1,2 0 1
3 0,8 1 0
99
Buti Xi Pi() Qi() Dai [Xi - Pi ()] D2. a i2 . Pi ().Qi ()
r
1 1 0,9468 0,0532 0,0905 0,1457
2 1 0,8044 0,1956 0,3991 0,6549
3 0 0,3971 0,6029 -0,5401 0,4428
-0,0504 1,2434
0,0504
1 0 0,693 0,0405 0,6524
1,2434
Selisih = 0 - 1 = 0,0405 (masih cukup besar, harus diiterasi lagi)
Untuk 1 = 0,6524 , hasil iterasi ketiga persamaan sebagai berikut :
0,0013
2 1 0,6524 0,0010 0,6534
1,2807
Selisih = 1 - 2 = 0,0010 (masih cukup besar, harus diiterasi lagi)
Untuk 2 = 0,653 hasil iterasi ketiga persamaan sebagai berikut :
100
Buti X Pi () Qi () Dai [Xi - Pi ()] D2. a i2 Pi ().Qi()
r
1 1 0,9432 0,0568 0,0965 0,1548
2 1 0,7912 0,2088 0,4260 0,6875
3 0 0,3842 0,6158 -0,5225 0,4376
0,00004 1,2799
0,00004
3 2 0,653 0,00003 0,653003
1,2799
Selisih = 2 - 3 = 0,00003 (mendekati nol, iterasi dihentikan)
Contoh
101
Tabel 4.27. Data butir tes dengan 1 parameter
Butir bi X
1 -2,00 1
2 0,00 1
3 1,75 0
Penyelesaian:
102
2 1 0,7646 0,2354 0,2354 0,3060
3 0 0,1422 0,8578 -0,1422 0,2074
0,1033 0,5305
0,1033
1 0 0,693 0,1947 0,8878
0,5305
Selisih = 0 - 1 = 0,195 (masih cukup besar, harus diiterasi lagi)
0,0007
2 1 0,8877 0,0013 0,8891
0,5235
Selisih = 0 - 1 = 0,0013 (kurang kecil, harus diiterasi lagi)
103
Buti X Pi () Qi() X- Pi D.Pi ().Qi ()
r ()
1 1 0,9927 0,0073 0,0073 0,0123
2 1 0,8193 0,1807 0,1810 0,2517
3 0 0,1879 0,8121 -0,1876 0,2594
0,0002 0,5235
0,0002
3 2 0,889 0,0004 0,8894
0,5235
Selisih = 0 - 1 = 0,0003 (cukup mendekati nol, iterasi dihentikan)
Contoh
Butir ai bi
1 1,0 -1
2 1,2 0
3 0,8 1
Butir Xi
1 1
2 1
3 0
104
Penyelesaian:
e 1, 7 (1)( 1) e 1, 7 ( 1)
Karakteristik Butir 1: P1 ( )
1 e 1,7 (1)( 1) 1 e 1,7 ( 1)
e 1, 7 (1, 2) e 2, 04
Karakteristik Butir 2: 2
P ( )
1 e 1, 7 (1, 2 ) 1 e 2, 04
e 1, 7 ( 0,8)( 1) e 1,36 1)
Karakteristik Butir 3: P3 ( )
1 e 1, 7 ( 0,8)( 1) 1 e 1,36( 1)
2
0,0504
1 0 0,693 0,0405 0,6524
1,2434
Selisih = 0 - 1 = 0,0405 (masih cukup besar, harus diiterasi lagi)
105
2 1 0,7909 0,2091 0,4267 0,6883
3 0 0,3838 0,6162 -0,5220 0,4374
0,0013 1,2807
0,0013
2 1 0,6524 0,0010 0,6534
1,2807
Selisih = 1 - 2 = 0,0010 (masih cukup besar, harus diiterasi lagi)
0,00004
3 2 0,653 0,00003 0,653003
1,2799
Selisih = 2 - 3 = 0,00003 (mendekati nol, iterasi dihentikan)
Contoh
Satu butir soal ujian dijawab oleh 3 responden dengan hasil
sebagai berikut :
Butir g Xg
1 -2,00 0
2 0,00 1
106
3 1,75 1
Penyelesaian:
e 1,7 ( 2 b1 )
Responden 1 : 1 = -2 P1 ( )
1 e 1, 7 ( 2 b1 )
e 1, 7b2
Responden 2 : 2 = 0 P2 ( )
1 e 1,7 b2
e1,7 (1,75b3 )
Responden 3 : 3 = 1,75 3 P ( )
1 e1,7 (1,75b3 )
1
B u t i Xg Xg – D. Pi () Qi
r Pg() ()
1 0 -0,0978 0,1500
2 1 0,2354 0,3060
3 1 0,0135 0,0259
0,1531 0,4819
0,1531
b1 b0 0,693 0,3177 1,0107
0,4819
Selisih = b1 – b0 = 0,3176 (masih cukup besar, harus diiterasi
kembali)
107
Untuk b1 = -1,0107 maka hasil ketiga persamaan adalah sebagai
berikut.
Buti Xg Xg – D. Pi ()
r Pg() Qi ()
1 0 -0,1569 0,2248
2 1 0,1521 0,2192
3 1 0,0091 0,0153
0,0043 0,4593
0,0043
b2 b1 1,0107 0,0094 1,0201
0,4593
Selisih = b1 – b2 = 0,0094 (kalau selisih ini sudah cukup kecil maka
iterasi dihentikan)
Butir bi Xi
1 2,20 1
2 1,15 0
3 1,35 1
4 0,80 0
5 0,15 1
108
Tabel 4.40. Estimasi butir tes dengan proses iterasi.
Butir ai bi XI
I 1,25 -1 1
2 1,20 0 1
3 2,85 1 0
4 3,12 -1,25 0
5 -1,75 2,45 0
109
Fungsi Informasi Butir Tes
Hulin, Drasgow & Parsons (1985; 63) mendefinisikan fungsi
informasi sebagai istilah dalam ketidakpastian dari beberapa
peristiwa. Kemudian informasi maksimum butir dapat ditentukan
melalui tebakan, karena:
(1) penyelesaian tes kurang dapat memperkecil makna dari
kecocokan butir-butir tersebut sehingga pertanyaan yang ada
dalam tes menjadi beresiko,
(2) tebakan dapat memungkinkan pilihan jawaban benar untuk
sejumlah kecil butir tes dari sekian banyak butir tes yang
dilibatkan.
Menurut Hambleton, Swaminathan & Rogers (1991; 92) fungsi
informasi tes adalah suatu fungsi yang memberi gambaran
lengkap tentang kemampuan siswa dalam menjawab soal,
yang melibat :
tingkat kesukaran butir (b),
daya pembeda soal (a) dan
besarnya tebakan (c),
yang dihubungkan dengan kemampuan ().
Menurut Naga (1992; 308) Untuk menjelaskan fungsi informasi
tidak terlepas kaitannya dengan fungsi tes klasik dan teori respons
butir dapat dijelaskan perbandingannya sebagai berikut.
110
reliabilitas dinilai mutu 2. Mencapai tujuan yang
perangkat uji tes yang sama melalui fungsi
terdiri dari sejumlah butir informasi butir
111
asimtot untuk estimasi kemampuan dan skor y. Fungsi informasi
suatu estimator kemampuan yang tidak bias adalah hubungan timbal
balik dari varians sampling terhadap estimator. Artinya fungsi
informasi I() yang diberikan adalah suatu daerah tertinggi untuk
informasi yang dapat diperoleh dengan setiap metode pensekoran tes
tersebut.
Hulin, Drasgow & Parsons (1985; 63) mendefinisikan fungsi
informasi sebagai istilah dalam ketidakpastian dari beberapa
peristiwa. Kemudian informasi maksimum butir dapat ditentukan
melalui tebakan, karena: (1) penyelesaian tes kurang dapat
memperkecil makna dari kecocokan butir-butir tersebut sehingga
pertanyaan yang ada dalam tes menjadi beresiko, (2) tebakan dapat
memungkinkan pilihan jawaban benar untuk sejumlah kecil butir tes
dari sekian banyak butir tes yang dilibatkan. Menurut Hambleton,
Swaminathan & Rogers (1991; 92) fungsi informasi tes adalah suatu
fungsi yang memberi gambaran lengkap tentang kemampuan siswa
dalam menjawab soal, yang melibat tingkat kesukaran butir (b), daya
pembeda soal (a) dan besarnya tebakan (c), yang dihubungkan dengan
kemampuan ().
, di mana i = 1, 2, 3, ..., n
Pi ( )Qi ( )
Ii () adalah fungsi informasi butir ke i pada kemampuan .
Dalam hal ini, nilai membentang dari - sampai + , namun nilai
yang masih berguna secara praktis hanya terletak di antara –4,0
sampai +4,0 (Naga, 1992: 224), dan kemudian P’i () menyatakan
derivative dari Pi (), serta Qi () = 1 - Pi ().
Selanjutnya Birnbaum (dalam Hambleton, 1991 :91)
menurunkan rumus informasi di atas sebagai berikut.
112
Dai2 (1 ci )
I i ( )
c i
e Da ( b ) 1 e Da ( b ) 2
113
1
max bi ln[0,5(1 1 8ci }] .
Dai
Agar informasi tinggi, kita perlu memilih butir yang memiliki nilai a
yang tinggi, nilai c yang rendah dan nilai b yang cocok dengan
kemampuan siswa (). Ketiga hal ini perlu terjadi secara berbarengan
karena nilai a yang tinggi dan nilai c yang rendah saja, tetapi tidak
disertai dengan kecocokan di antara nilai b dan , akan menghasilkan
fungsi informasi butir yang rendah (Naga 1992; 328-329).
Sebagai bahan illustrasi, dipilih dari 6 butir tes yang diketahui
parameter –parameternya sebagai berikut .
Parameter butir
Butir a b c
ke
1 1,75 1,0 0,00
2 0,75 1,0 0,00
3 1,75 1,0 0,20
4 1,75 -2,0 0,00
5 1,20 -0,5 0,10
6 0,50 0,5 0,15
114
-3 0 0,009 0 0,409 0,001 0,007
-2,5 0 0,018 0 1,331 0,009 0,014
-2 0,001 0,034 0 2,213 0,051 0,026
-1,5 0,005 0,062 0 1,331 0,216 0,044
-1 0,023 0,109 0 0,409 0,571 0,068
-0,5 0,1 0,182 0,004 0,1 0,851 0,095
0 0,409 0,278 0,067 0,023 0,704 0,119
0,5 1,331 0,368 0,565 0,005 0,376 0,134
1 2,213 0,407 1,475 0,001 0,159 0,134
1,5 1,331 0,368 1,018 0 0,061 0,121
2 0,409 0,278 0,324 0 0,023 0,101
2,5 0,1 0,182 0,08 0 0,008 0,078
3 0,023 0,109 0,018 0 0,003 0,058
3,5 0,005 0,062 0,004 0 0,001 0,041
4 0,001 0,034 0 0 0 0,028
Sumber: (Naga, 1992; 326)
Dari tabel di atas tampak bahwa untuk butir-butir yang
memiliki daya pembeda (b = 1,0 dan c = 0) ada tiga butir tes,
sehingga nilai fungsi informasi tes tersebut terletak pada kemampuan
yang sama, sehingga menurut sifat fungsi informasi bahwa nilai
maksimum fungsi informasi tersebut terletak pada = b = 1,0.
Namun letak ketinggiannya tidak sama, hal ini disebabkan oleh faktor
nilai a dan nilai c yang berbeda-beda. Makin besar nilai indeks
kusukaran butir a makin tinggi pula nilai fungsi informasinya,
misalnya butir ke 1, tetapi tidak terjadi pada butir ketiga walaupun
memiliki nilai a yang sama sebesar 1,75.
Selanjutnya, butir 4 mirip dengan butir 1 yang memiliki a yang
tinggi sebesar 1,75, dan tidak memiliki nilai c atau c = 0. sehingga
kedua butir ini memiliki nilai maksimum fungsi informasi yang sama.
Hanya saja perbedaan kedua butir ini terletak pada nilai kemampuan
115
, di mana butir 1 berada pada = 1,0 sedangkan butir 4 pada =
-2,0.
Kemudian ketinggian atau nilai maksimum fungsi informasi
butir 5 dan 6 dipengaruhi nilai c kedua butir itu yang agak besar dan
nilai a yang tinggi sehingga jika dibandingkan dengan butir lain, butir
5 dan 6 cukup rendah, terutama untuk butir 6. Dengan demikian dari
keadaan ini dapat disimpulkan bahwa nilai a yang tinggi, dan nilai c
yang rendah, serta nilai b yang mendekati kemampuan ( )akan
memberikan nilai fungsi informasi butir tes yang tinggi. Dengan kata
lain, nilai a yang tinggi, dan nilai c yang rendah, tanpa dibarengi nilai
b yang mendekati kemampuan ( ) akan memberikan nilai fungsi
informasi butir tes yang rendah.
, di mana i = 1, 2, 3, ..., n
Pi ( )Qi ( )
Ii () adalah fungsi informasi butir ke i pada kemampuan .
Dalam hal ini, nilai membentang dari - sampai + , namun nilai
yang masih berguna secara praktis hanya terletak di antara –4,0
sampai +4,0 (Naga, 1992: 224), dan kemudian P’i () menyatakan
derivative dari Pi (), serta Qi () = 1 - Pi ().
Selanjutnya Birnbaum (dalam Hambleton, 1991 :91)
menurunkan rumus informasi di atas sebagai berikut.
Dai2 (1 ci )
I i ( )
c i
e Da ( b ) 1 e Da ( b ) 2
116
nilai b mendekati –2,0 maka butir tes tersebut sangat mudah dan
sebaliknya jika nilai b mendekati +2,0 maka butir tes tersebut sangat
sukar], dan c = tebakan, sehingga dengan mengganti D = 1,7 rumus di
atas menjadi:
2,89(1 ci )
I i ( )
c i
e1, 7 a ( b ) 1 e 1,7 a ( b ) 2
117
nilai tersebut, yang dirumuskan dengan I ( )
i
I i ( ) 2
. Fungsi
informasi ujian untuk model logistik tiga parameter adalah sebagai
berikut.
N (1 c) D 2 .a 2j
I ( ) 3
i 1 c j
e Dai ( bi ) 1 e Dai ( bi ) 2
118
1,0 4,389 4,388 2,017 4,254 3,847 2,506
1,5 2,899 2,899 1,507 2,778 2,41 1,513
2,0 1,135 1,135 0,703 1,034 0,756 0,533
2,5 0,448 0,448 0,34 0,37 0,188 0,186
3 0,211 0,211 0,185 0,153 0,044 0,084
3,5 0,113 0,113 0,107 0,072 0,01 0,047
4,0 0,063 0,063 0,062 0,035 0,001 0,029
Dari Tabel 2.3 dan Gambar 2.2 dapat dilihat bahwa fungsi
informasi ujian dari beberapa butir yang dilibatkan cukup bervariasi,
baik dari tingginya maupun posisi kelengkungannya. Semakin banyak
butir yang dilibatkan jelas akan semakin menambah tinggi fungsi
informasi ujiannya, hal ini disebabkan jumlah total dari masing-
119
masing fungsi informasi butir akan semakin besar pula. Untuk kurva
1, melibatkan butir-butir 1, 2, 3, 4, 5, dan 6 dengan ketinggian
maksimum 4,389 pada saat =1. Untuk kurva 2 melibatkan butir-
butir 1, 2, 3, 5, dan 6 dengan ketinggian maksimum 3,888 pada saat
=1. Untuk kurva 3 melibatkan butir-butir 2, 3,4 dan 6 dengan
ketinggian maksimum 2,273 pada saat = -2. Untuk kurva 4
melibatkan butir-butir 2, 3, 4, dan 5 dengan ketinggian maksimum
4,254 pada saat =1. Untuk kurva 5 melibatkan butir-butir 1, 4, dan 5
dengan ketinggian maksimum 3,847 pada saat =1, serta kurva 6
melibatkan butir-butir 1, 5, dan 6 dengan ketinggian maksimum 2,506
pada saat =1.
120
LATIHAN 4
121
8. Sebutkan dengan contoh, apa yang dimaksud dengan fungsi
informasi butir tes.
9. Tentukan masing-masing fungsi informasi butir tes dari data berikut.
Parameter butir
Butir a b c
ke
1 1,53 1,63 0,35
2 0,75 1,52 0,031
3 1,75 1,81 0,25
4 1,75 -2,02 0,23
5 1,20 -0,53 0,15
6 0,50 0,54 0,16
10.Sebutkan dengan contoh, apa yang dimaksud dengan fungsi
informasi ujian.
11.Tentukan fungsi informasi ujian untuk butir tes nomor 9.
Daftar Pustaka
122
Hambleton, Ronald K; Swaminathan, H; dan Jane Rogers, H. 1991.
Fundamentals of Item Response Theory. London: Sage
Publications.
Hulin, Charles, L., Drasgor, Frits, & Parsons, Charles, K. 1985. Item
Respons Theory. Application to Psichological Measuremant.
Illinois: Dow Jones- Irwin Homewed.
Kepmen Pendidikan Nasional. 2003. Standard Prosedur Operasional
(SPO) Ujian Naional. Jakarta: Dirjen Pendidikan Manegah.
Kumaidi. 2000. Standardisasi Butir Soal. Jurnal Pendidikan dan
Kebudayaan. Nomor 022 Tahun Ke – 5. p.105
Lazarsfeld P, F & Henry, N. W. 1968. Latent structure analysis.
Boston: Houhgton-Mifflin.
Lord, Frederick, M. 1990. Aplications of Item Response Theory to
Practical Testing Problrms. New Jersey: Lawrence Erlbaum
Associates, Publishers.
Naga, Dali, S. 1992. Pengantar Teori Sekor Pada Pengukuran
Pendidikan. Jakarta: Besbats
Nitko. A. J. 1992. Criterion Refrence testing Worlshop.: Handdouts
and Reading Material Tidak dipublikasikan). Cipayung, Bogor:
Examination Development Unit (Puslitbang Sisjian)
Setiadi, Hari. 1998. Bank Soal yang dikalibrasi dengan konsep IRT
memecahkan permasalahan pada ujian-ujian sistematikyg
diadakan pada periode-periode tertentu.. Jurnal Kajian Dikbud
No. 013, Tahun IV . p. 7
Wright, Benjamin, D, & Stone, Mark, H. 1979. Best Test Design
Chicago: Mesa Press.
123