Bab 2 Teori Tes Klasik Dan Teori Tes Modern

Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika
BAB II
CLASICAL TEST THEORY (CTT) dan
ITEM RESPONS THEORY (IRT)
Pengukuran dalam pendidikan meliputi pengukuran kemampuan

testee, dan pengukuran untuk mengetahui karakteristik alat ukur yang
digunakan.Karakteristik alat ukur ditunjukkan oleh hasil analisis dari
skor hasil pengukuran. Ada dua teori pengukuran yang saat ini masih
dikembangkan, yaitu teori tes klasik disebut jugaclasical test theory (CTT)
dan teori tes modern disebut juga disebut teori respons item atau
itemrespons theory (IRT).
Persyaratan tes yang baik, harus memenuhi dua persyaratan yaitu
validity dan reliability.Validitymenunjuk pada seberapa jauh skor suatu
tes dapat memberikan bukti bahwa tes telah mengukur konstrukyang
didefinisikan. Reliabilitymenunjuk pada besar kesalahan pengukuran,
semakin andal suatu tes, semakin kecil kesalahan pengukuran yang ter-
jadi. Reliabilitydinyatakan dengan ρxx’ dan validityρxT.
A. Clasical Test Theory (CTT)

Clasical Test Theory (CTT) diterjemahkan dalam bahasa
IndonesiaTeori Tes Klasik yang juga disebut Teori Skor Murni didasarkan
pada model aditif, yaitu skor amatanatauobserve score(X) merupakan
penjumlahan dari skor sebenarnyaatautrue score(T) dan kesalahan
pengukuranatauerror (e). Secara matematis, model tersebut dituliskan
X = T + e (Allen dan Yen, 1979: 57). Kesalahan pengukuran adalah
kesalahan acak atau kesalahan yang tidak sistematis. Kesalahan peng-
ukuran merupakan penyimpangan secara teoriantaraskor amatan
5
dengan skor harapan. Kesalahan pengukuran sistematis bukan merupa-

kan kesalahan pengukuran.
Pengukuran menurut teori tes klasik yaitupemberian angka
kepada objek atau kejadian dengan aturan tertentu(Crocker & Algina,
1986:3). Angka diartikan sebagai sifat yang melekat pada objek.Asumsi
yang diajukan teori tes klasik ada tujuh yaitu: 1). Skor amatan (X)terdiri
dari skor sebenarnya atau true score(T) dan kesalahan pengukuran atau
error(𝑒), 𝑋 = T + e .2).Nilai skor harapan(EX ) sama dengan skor
sebenarnya (T), EX = T. 3).Korelasi antara skor sebenarnya dengan
kesalahan pengukuran sama dengan nol(𝜌𝑇𝑒 = 0). 4).Kesalahan pengu-
kuran pada dua tes yang mengukur kemampuan sama tidak berkorelasi
(𝜌𝑒𝑙𝑒2 = 0). 5).Dua tes yang mengukur kemampuan sama, kesalahan
pengukuran pada tes pertama (e1) tidak berkorelasi dengan dengan skor
sebenarnya pada tes kedua (T2 )(𝜌𝑒𝑙𝑇2 = 0). 6).Dua tes yang meng-
hasilkan skor dan memenuhi kelima asumsi pertama disebut tes paralel.
Skor sebenarnya(T) dan variansi kesalahan pengukuran yang diperoleh
testee sama. 7). Dua test yang menghasilkan skor yang memenuhi
kelima asumsi pertama disebut essentially τ – equivalent test, jika selisih
skor sebenarnya yang diperoleh testee pada tes pertama dan pada tes
kedua merupakan bilangan konstan (Allen & Yen, 1979 : 57). Ketujuh
asumsi yang telah disebutkan dijadikan dasar pengembanganrumus
untuk menghitung kesahihan dan keandalan tes.
Teori tes klasik menyatakan bahwa, karakteristik item dipengaruhi
oleh testee yang menempuh tes tersebut. Jika kelompok peserta yang
sama menempuh tesberbeda maka ciri kelompok peserta umumnya
berubah. (Allen, Yen 1979: 60; Djemari Mardapi, 2008:4). Sebagai
contoh, Gambar 2.1. menunjukkan kedudukan testee terhadap karak-
teristik tes.
6
Gambar 2.1
Kemampuan testee pada CTT
Gambar 2.1. menunjukkan kemampuan testee selalu berubah

sesuai dengan tes yang diberikan. Jika diberikan tes yang mudah,
kemampuan testee berada pada level tinggi sebaliknya jika diberikan tes
yang sulit, kemampuan testee berada pada level rendah. Secara teoritik,
kemampuan seseorang tidak berubah karena karakteristik tes.
Kelemahanteori tes klasik diatasi menggunakan teori tes modern
atau teori respons item (IRT).Sebagai model alternatif, IRT memiliki
sifatyaitu, karakteristik item tidak tergantung pada kelompok testee
yang dikenai item tersebut.Model pada IRT dinyatakan dalam tingkatan
item. Model tidak memerlukan tes paralel untuk menghitung koefisien
keandalan,dan model menyediakan ukuran yang tepat untuk setiap
kemampuan testee (Hambleton, Swaminathan & Rogers, 1991: 5).
1. Keandalan dan Kesahihan
Keandalan diartikan sebagai keajegan atau konsistensi hasil peng-
ukuran atau hasil tes yang dilakukan pada waktu yang berbeda dengan
subjek yang sama. Allen dan Yen (1979:72), menyatakan bahwa tes
disebut andal jika skor amatan mempunyai korelasi yang tinggi dengan
skor sebenarnya. Mereka juga menyatakan bahwa keandalan merupa-
7
kan koefisien korelasi antara dua skor amatan yang diproleh dari hasil
pengukuran menggunakan tes paralel.
Nilai keandalan suatu tes dapat ditentukan dengan berbagai cara,
antara lain metodebelah dua, alfa (𝛼)Cronbach, Guttman, dan
metodeparalel. Nilai hasil perhitungan disebut sebagai koefisien
keandalan. Mehrens dan Lehmann (1973) seperti ditulis oleh Allen dan
Yen (1979:73) menyatakan bahwa meskipun tidak ada ketentuan umum,
tetapi secara luas dapat diterima bahwa tes yang digunakan untuk mem-
buat keputusan secara perorangan paling tidak harus memiliki koefisien
keandalan 0,85.
Kesahihan secara empirik dinyatakan oleh suatu koefisien yang
dinamakan koefisien kesahihan. Kesahihan dinyatakan oleh korelasi
antara distribusi skor tes yang berkaitan dengan distribusi skor kriteria
yang relevan. Kriteria dapat berupa skor tes lain yang mempunyai fungsi
ukur sama dengan tes yang bersangkutan dan dapat juga berupa ukuran
lain yang relevan, misalnya tampilan pada suatu pekerjaan, hasil rating
yang diperoleh fihak ketiga (Saifuddin Azwar, 2006: 10). Jika skor tes
diberi notasi (X) dan skor kriteria dinyatakan dengan (Y), maka
koefisien korelasi antara tes dan kriteria dinyatakan dengan
(rXY ).rXY menyatakan tinggi rendahnya kesahihan suatu alat ukur.
Nilaikesahihan paling rendahsamadengan 0, dan paling
tinggisamadengan 1. Pada kenyataannya sulit untuk mencapai nilai
kesahihan tertinggi (rXY = 1), sebabtidakadahasilpengukuran yang
sempurna.
2. Tingkat Kesukaran
Tingkat kesukaranitemyang disimbolkan dengan p merupakan
salah satu parameter item pada analisisitem. Tingkat kesukaranitem
dapat dihitung dengan berbagai cara, salah satunya adalah proporsi
jawaban benar (Bahrul Hayat, dkk., 1999). Secara matematis proporsi
menjawab benar item tertentu (p)dihitungdari banyak testee yang
menjawab benar(∑ B)untukjumlah testee (N)ditulis sebagai berikut:
∑B
p= (2.1)
N
Hasil hitung nilai p menyatakan bahwa, jika p mendekati 0,
makaitem terlalu sukar, dan jika nilai p mendekati 1, makaitem terlalu
mudah. Soal yang terlalu mudah atau terlalu sukar tidak memberi
8
informasi yang banyak tentang tes karena tidak mampu membedakan

kemampuan testee sehingga perlu dibuang.
Allen dan Yen (1979: 87) menyatakan bahwa tingkat kesukaran
item sebaiknya antara 0,3sampai0,7sebagaibentukinformasi tentang
kemampuan siswa secara maksimal. Namun angka 0,3sampai0,7perlu
disesuaikan dengan tujuan pengembangan soal, untuk keperluan seleksi,
remidi, atau ulangan umum seharusnya mempunyai p yang berbeda-
beda agar mencapai tujuan yang maksimal.
3. Daya Beda
Daya beda merupakan parameter tes yang memberikan informasi
tentang seberapa besar soal mampumembedakan testee yang skornya
tinggi dan rendah. Daya beda dihitung dengan beberapa cara antara lain,
koefisien korelasi point biserial(rpbis ). dan koefisien korelasi
biserial(rpbis ).Korelasi point biserial dicari berdasarkan proporsi testee
yang menjawab benar pada item soal (p), mean skor pada tes dari
testee yang memiliki jawaban benar pada (Mp ) dan mean skor total
(Mt ). Ubahan tersebut dinyatakan dalam persamaan 2.2.
Mp − Mt p Mp − Mt p
rpbis = √ = √ (2.2)
ST 1−p sT q
Jikavarians total(sT )danordinat 𝑝dalam distribusi normal (𝑦),

maka korelasi biserial (rbis )secara matematis dinyatakan dalam per-
samaan 2.3.
Mp − M r p (2.3)
rbis = ( )( )
ST y
Nilai korelasi point biserial selalu lebih rendah dibanding dengan

nilai korelasi biserial. Hubungan antara keduanya dinyatakan dalam per-
samaan 2.4.
y
rpbis = rbis
√pq (2.4)
4. Efektivitas Distraktor
Soal pilihan ganda memiliki pengecoh, yaitu jawaban yang tidak
bernilai benar. Setiap pengecoh dibuat sedemikian rupa sehingga
9
menarik perhatian testee yang belum memiliki konsep yang baik ter-
hadap materi yang diujikan.
Allen dan Yen (1979: 102), pengecoh yang baik minimum ber-
indeks 0,1 yang berupa koefisien korelasi point biserial, dan bernilai
negatif. Untuk
kuncijawabanbernilaipositif.Efektifitasdistraktordapatdilihatdarihasilhitu
ng point biserialsemuapilihanjawaban yang
disediakan.Jikapoilihanjawabanberindeks 0,1danbernilainegative,
makapilihanjawabantersebutcukupefektifsebagaipengecoh.
5. Kesalahan Pengukuran
Kesalahan pengukuran (Standard Error of Measurement: SEM)
membantu pemakai tes dalam memahami kesalahan yang bersifat acak.
SEM mempengaruhi skor testee. Allen dan Yen (1979: 246),
menyatakanbahwa, jilastandard deviasi dari skor total(σx ), koefisien
reliabilitas tes (ρxx′ )maka kesalahan
pengukuran(𝜎𝐸 )dituliskansepertipada persamaan 2.5.
σE = σx √1 − ρxx′ (2.5)
B. Teori Tes Modern

Teori tes modern atau teori responsitem (Item Response Theory:
IRT), disebut juga teori ciri laten (latent trait theory:LTT), lengkungan
karakteristik item atau kurvakarakteristikitem(Item Characteristic Curve),
fungsi karakteristik item atau item characteristicfunction (ICF). Pada
disertasi ini digunakan satu istilah yaitu teori responsitem (Item
Response Theory: IRT).
Teori responsitempada dasarnya memperbaiki kelemahan yang
terdapat pada teori tes klasik, yaitu ketergantungan ukuran ciri item
kepada kelompok peserta, serta ketergantungan ciri peserta kepada
kelompok tes. Pada teori tes modern, ukuran taraf kesukaran item serta
ciri item lainnya bersifat bebas atau invarian terhadap kelompok peserta
tes. Ciri item dengan kemampuan peserta dihubungkan oleh model yang
berbentuk fungsi atau lengkungan grafik dengan sejumlah sarat yang
dinyatakan melalui parameter, yaitu parameter ciri itemmeliputi indeks
kesukaran item (item difficulty), daya beda item (item discrimination)
dan tebakan (guessing) serta parameter ciri peserta yaitu kemampuan
peserta (ability).
10
Postulat yang disaratkan pada teori responsitem ada dua, yaitu:

1).Kinerja testee pada suatu item yang dapat diprediksi oleh sekumpulan
faktor yang disebut traits atau kemampuan. 2).Hubungan antara kinerja
testee pada suatu item dan sekumpulan traits dapat digambarkan dalam
sebuah fungsi naik yang disebut fungsi karakteristik item (item
characteristic function) atau disebut juga kurva karakteristik item (item
characteristic curve), yang disingkat dengan ICC. (Hambleton,
Swaminathan & Rogers, 1991: 7).Fungsi karakteristik item menyatakan
bahwa semakin meningkat level kemampuan seseorang, semakin me-
ningkat pula peluang menjawab benar suatu item tertentu.Fungsi karak-
tristik itemmenyatakan hubungan sebenarnya antara variabel kemam-
puan dengan variabel ciri item. (Hambleton,Swaminathan & Rogers,
1991: 9).
Asumsi yang mendasari teori responsitem (IRT), yaitu:Unidimen-
sionalitas dan Independensi lokal. Asumsi unidimensionalitas menyata-
kan bahwa, hanya satu kemampuan yang diukur sekelompok tes. Asumsi
tersebut dalam praktek sulit dipenuhi, sebab terdapat banyak faktor
yang dapat mempengaruhi hasil suatu tes. Faktor tersebut antara lain,
motivasi, kecemasan, kemampuan untuk bekarja cepat, ketrampilan
kognitif di luar kemampuan yang diukur oleh sekumpulan item dalam
suatu tes.
Persaratan unidimensi ditujukan untuk mempertahankan invari-
ansi pada teori responsitem. Asumsi lainyang harus dipenuhi yaitu,inde-
pendensi lokal. Independensi lokal adalah independensi secara statistik,
lokal dimaksudkan sebagai letak pada suatu titik dalam kontinum para-
meter kemampuan peserta (θ). Pada praktek, titik pada kontinum para-
meter kemampuan peserta dapat berbentuk interval, interval parameter
kemampuan peserta diperoleh dari populasi yang homogen.
Selain homogen, sarat independensi lokal juga menentukan
bahwa semua peserta dalam subpopulasi harus independen terhadap
item. Sekor pada suatu item tidak bergantung pada sekor.Independensi
lokal disebut juga independensi kondisional(Hambleton, Linden, 1997:
12). Asumsi terpenuhi jika jawaban peserta terhadap sebuahitem tidak
mempengaruhi jawaban terhadap itemyang lain.
Pengujian asumsi dilakukan menggunakanpeluang dari pola
jawaban setiap testee sama dengan hasil kali peluang jawaban testee
pada setiap item. Hambleton dan Swaminathan
(1991)menyatakanbahwaindependensi lokal
dinyatakansecaramatematisdalam persamaan 2.6.
11
p(u1 , u2 , u3 … … un |θ)
= p(u1 |θ). p(u2 |θ) … … . . p(un |θ)
p(u1 , u2 , u3 … … un |θ)
n n 2.6
= ∏ p(u1 |θ) = ∏ Pi (θ)x iQ i (θ)1−x i
i=1 i=1
Persamaan 2.6,menghubungkan item soal (i:1, 2, 3, ..., n)

denganjumlahsoal (n). Probabilitas testee yang memiliki kemampuan θ
dipilih secara acak dapat menjawab item-item dengan benar(𝑝(𝑢𝑖 |𝜃)).
Invariansiparameteryaitukemampuantestee tidak berubah karena
mengerjakan itemyang berbeda tingkat kesulitannya, demikian juga
parameter itemtidak akan berubah karena diujikan pada kelompok
testee yang berbeda tingkat kemampuannya.
HambletondanSwaminathan (1991) menyatakan bahwa invariandari
parameter kemampuan dapat diselidiki dengan menggunakandua
perangkat tes atau lebih yang memiliki tingkat kesukaran yang berbeda
pada sekelompok testee, seperti ditunjukkan pada Gambar 2.2.
Gambar 2.2
DuaItem TesdenganIndeksKesulitanBerbeda
IRT memiliki tiga model yaitu, modellogistiksatu parameter atau

juga disebut model Rasch, modellogistik2 parameter dan model 3logistik
tiga parameter.Model menunjukkan banyaknya parameter ciri item
yang terkandung didalamnya. Modellogistik satu parameter memiliki 1
parameter ciri item yaitu indeks kesulitan item (b), modellogistik dua
parameter memiliki dua parameter ciri item yaitu indeks kesulitan item
(b)dan indeks dayabeda item (a),modellogistik tiga parametermemiliki
tiga parameter ciri item, yaitu indeks kesukaran item (b), indeks daya
beda item (a) dan tebakan (c).
12
1. Model Logistik 1 Parameter atau Model Rasch.

Model logistik1 parameter, memiliki pameter kesukaran item (𝑏𝑖 )
dan parameter kemampuan(𝜃𝑗 ), probabilitas benar dengan kemampuan
θ yang dimiliki peserta uji (𝑃𝑖𝑗 (𝜃𝑗 , 𝑏𝑖 )), dicari berdasarkan parameter
kesukaran item (𝑏𝑖 ) dan parameter kemampuan(𝜃𝑗 )
Gambar 2.3
ModelLogistik 1 Parameter
exp(𝜃𝑗 − 𝑏𝑖 )
𝑃𝑖𝑗 (𝜃𝑗 , 𝑏𝑖 ) = (2.7)
1 + exp(𝜃𝑗 − 𝑏𝑖 )
Parameter (𝑏𝑖 ) merupakan suatu titik pada skala kemampuan agar

peluang menjawab benar sebesar 0,5 Semakin besar nilai (𝑏𝑖 ) semakin
besar kemampuan yang diperlukan untuk menjawab benar dengan
peluang 0,5.Jadi semakin besar nilai (𝑏𝑖 ) semakin sulit item soal
tersebut.
2. Model Logistik 2 Parameter

Model logistik 2 parameter, memiliki parameter daya beda
item(𝑎𝑖 ), nilai kesukaran item (𝑏𝑖 ) dan kemampuan peserta(𝜃𝑖 ). Persa-
maan 2.8 menunjukkan bahwa probabilitas benar dengan kemampuan θ
yang dimiliki peserta uji(𝑃𝑖𝑗 (𝜃)), dapat dihitung berdasarkan daya beda
item(𝑎𝑖 ), nilai kesukaran item(𝑏𝑖 ) dan kemampuan peserta(𝜃𝑗 ).
13
exp{𝑎𝑗 − 𝑏𝑖 ) (2.8)
𝑃𝑖𝑗 =
1 + exp{𝑎𝑖 (𝜃𝑗 − 𝑏𝑖 )}
Gambar 2.4
3. ModelLogistik 3Parameter
Modellogistik3 parameter, selainmemilikiparameter ciri item yang
sama dengan pada modellogistik 1 dan 2 parameter, jugamemiliki
parameter tebakanatauguessing(c), yang tidak dimiliki oleh
modellogistik 1 dan 2 parameter. Model logistic3 parameter
digambarkan padaGambar 2.5.
exp{ai (θj − bi )}
Pij = ci + (1 − ci ) (2.9)
1 + exp{ai (θj − bi )}
14
Gambar 2.5
Secara konsepsual, proses pengukuran adalah proses penentuan

tempat seseorang pada suatu garis kontinumvariabelyang mau diukur.
Garis kontinum bergerak ke sebelah kiri yang menunjukkan nilai kurang
dan ke kanan menunjukkan nilai lebih. Garis kontinum bersifat abstrak,
dikonstruksi melalui sejumlah item dalam tes. Item yang mudah terletak
pada bagian sebelah kiri pada garis kontinum, sebaliknyaitem yang sulit
terletak pada bagian kanan.
Syarat yang harus dipenuhi pengukuran yaitu, a). Objek yang
diukur hanya satu dimensi, hal ini juga berlaku pada pengukuran sikap.
Sikap yang dideskripsikan oleh suatu pengukuran hanya satu karakter-
istik. b). Karakteristik suatu objek yang diukur merupakan karakteristik
yang dapat dideskripsikan dalam bentuk lebih kurang (more or less).
Terpenuhinya syarat ini memungkinkan dilakukannya perbandingan
suatu hasil pengukuran antar objek dalam kriteria yang diukur. c). Karak-
teristik yang akan diukur dapat dideskripsikan oleh pengukuran sebagai
besaran linear. d).Satuan ukuran ditentukan oleh suatu proses yang
dapat diulang tanpa modifikasi rentang variabel. Esensi dari proses yang
dapat diulang tanpa modifikasi adalah teori atau model yang meng-
gambarkan bagaimana orang atau objek yang diukur dan item ber-
interaksi untuk menghasilkan observasi yang berguna.
Hambleton dan Swaminathan (1991) serta Hulin dkk. (1983) me-
nyatakan bahwa teori responsitem bertujuan untukmemberikan:
1).Statistik item yang tidak tergantung pada kelompok subjek. 2).Skor
tes yang dapat menggambarkan kemampuan subjek dan tidak tergan-
15
tung pada taraf kesulitan tes. 3).Model tes dapat memberikan dasar
pencocokan antara item dan tingkat kemampuan. 4).Model tes yang
asumsi-asumsinya mempunyai dukungan kuat. 5).Model tes tidak
memerlukan asumsi paralel dalam pengujian reliabilitas.
4. Fungsi Informasi Item dan Tes

Fungsi informasi item (Item Information Function: IIF) merupakan
cara untuk menjelaskan kekuatan suatu item pada perangkat tes,
pemilihan item, dan pembandingan beberapa perangkat tes. Fungsi
informasi item, berkaitan dengan sumbangan item dalam mengungkap
latent trait yang diukur dengan tes tersebut, dengan kata lain, fungsi
informasi item, memberi informasi tentang kecocokan itemdengan
model, sehingga membantu seleksi item. Secara matematis fungsi
informasi itemkeiialah(Ii (θ))dinyatakan pada persamaan
2.11.sebagaihubunganantaraPeluang peserta menjawab benar item ide-
ngan kemampuan  ialah (Pi (θ)), Turunan Pi ( ) terhadap  ialah
(Pi′ (θ)) dan Peluang peserta menjawab salah pada item i dengan
kemampuan  ialah(Q i (θ))
[Pi′ (θ)]2 (2.11)
Ii (θ) =
Pi (θ)Q i (θ)
Fungsi informasi itemi menurut Birnbaum (Ii (θ))yang dikutip oleh
Hambleton dan Swaminathan (1991), secara matematis dinyatakan pada
persamaan 2.12.
𝐼𝑖 (𝜃) = 2,89 𝑎𝑖2 (1 − 𝑐𝑖 )

= (2.12).
[(𝑐𝑖 + exp(𝐷𝑎𝑖 (𝜃 − 𝑏𝑖 )][1 + exp(−𝐷𝑎𝑖 (𝜃 − 𝑏𝑖 )]2
Persamaan 2.12 menyatakanhubunganfungsiinformasi Ii (θ) de-

ngankemampuan subjek(θ), daya beda item ke-i(ai ), indeks
kesukaran item ke i (bi ) dan indekstebakan kebenaran jawaban
tebakan item kei(ci )sertabilangan transendental yang besarnya
mendekati 2,718. Berdasarkan persamaan 2.12, fungsi informasi item
memilikisifat: a).Pada responsitem model logistik, fungsi informasi item
mendekati maksimal ketika nilai bi mendekati θ. Padamodel logistik tiga
parameter, fungsi informasi maksimal dicapai ketika θ terletak sedikit di
atasbi dan nilai tebakan semu item menurun.b).Fungsi informasi secara
16
keseluruhan meningkat jika bi meningkat.Fungsi informasi tes merupa-

kan jumlah dari fungsi informasi item penyusun tersebut (Hambleton
dan Swaminathan, 1991), sehingga fungsi informasi tes akan besar jika
item mempunyai fungsi informasi yang besar. Fungsi informasi tes
dinyatakan dalam persamaan 2.13.
n
Ii (θ) = ∑ Ii (θ) (2.13)

i=1
Nilai parameter item dan kemampuan, merupakanestimasi, sehingga

kebenarannya bersifat probabilistik dan tidak bebas dari kesalahan
pengukuran.
Pengukuran kesalahan standaratau standard error
measurement(SEM), berkaitan erat dengan fungsi informasi, yaitu
berbanding terbaliksecara kuadratik. Makin besar fungsi informasi, maka
SEM semakin kecil, atau sebaliknya (Croker dan Algina, 1996). Jika fungsi
informasi dinyatakan dengan I(θ) dan SEM dinyatakan dengan SEM
( 𝜃́ ), maka secara matematis hubungan keduanya dapat
dinyatakanpadapersamaan 2.14.
1
SEM( 𝜃́ ) = (2.14).
√I(θ)
Efisiensi relatif (ER) adalah perbandingan nilai fungsi informasi

dari dua tes yang berbeda. Jika fungsi informasi tes A dinyatakan dengan
IA (θ)) dan fungsi informasi tes B dinyatakan dengan IB (θ), maka
efisiensi relatif atau ER(θ) dinyatakan dengan persamaan 2.15.
IA (θ)
ER(θ) = (2.15)
IB (θ)
Hasil kajian tentang Teori Tes Klasik dan Teori Respons Item
atauTeoriTes Modern ditinjau dari item statistik dapatdiringkas seperti
pada tabel 2.1.
17
Tabel: 2.1.
StatistikItempada Teori Tes Klasik dan Teori Respons Item
Statistik Teori Tes Klasik Teori Respons Item
Indeks Kesukaran Nilaip,proporsi benar Parameter b, lokasi item pada
item(b) dari testee, tergantung skala indeks kesukaran, dapat
pada sampel. dideteksi dengan mengguna-
kan model logistik 1 para-
meter.
Indeks Daya Τ biserial dari atau r Parametera,merupakan garis
Bedaitem (a) pointbiserial, korelasi singgung pada titik b item ter-
antara skoritem dan tentu, dapat dideteksi meng-
skor total gunakan model logistik 2
parameter.
Kemampuan Skor mentah dari Estimasi parameter θ. Lokasi
Peserta (θ) subjek yang mengikuti pada indeks kesukaran atau
tes. kemampuan
Akurasi Skor Reliabilitas dan Standard error dari estimasi
standard error of kemampuan.
measurement (SEM)
dari rerata skor tes.
Tebakan (c) Tidak dapat terdeteksi Parameter c (guessing) , lokasi
pada probabilitas, hanya
dapat dideteksi jika
menggunakan modellogistik 3
parameter.
18

Bab 2 Teori Tes Klasik Dan Teori Tes Modern

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab 2 Teori Tes Klasik Dan Teori Tes Modern

Diunggah oleh

Hak Cipta:

Format Tersedia

Dasar-dasar Pengukuran dan Statistik Pada Pembelajaran Fisika

Pengukuran dalam pendidikan meliputi pengukuran kemampuan

A. Clasical Test Theory (CTT)

dengan skor harapan. Kesalahan pengukuran sistematis bukan merupa-

Gambar 2.1. menunjukkan kemampuan testee selalu berubah

informasi yang banyak tentang tes karena tidak mampu membedakan

Jikavarians total(sT )danordinat 𝑝dalam distribusi normal (𝑦),

Nilai korelasi point biserial selalu lebih rendah dibanding dengan

B. Teori Tes Modern

Postulat yang disaratkan pada teori responsitem ada dua, yaitu:

Persamaan 2.6,menghubungkan item soal (i:1, 2, 3, ..., n)

IRT memiliki tiga model yaitu, modellogistiksatu parameter atau

1. Model Logistik 1 Parameter atau Model Rasch.

Parameter (𝑏𝑖 ) merupakan suatu titik pada skala kemampuan agar

2. Model Logistik 2 Parameter

Secara konsepsual, proses pengukuran adalah proses penentuan

4. Fungsi Informasi Item dan Tes

𝐼𝑖 (𝜃) = 2,89 𝑎𝑖2 (1 − 𝑐𝑖 )

Persamaan 2.12 menyatakanhubunganfungsiinformasi Ii (θ) de-

keseluruhan meningkat jika bi meningkat.Fungsi informasi tes merupa-

Ii (θ) = ∑ Ii (θ) (2.13)

Nilai parameter item dan kemampuan, merupakanestimasi, sehingga

Efisiensi relatif (ER) adalah perbandingan nilai fungsi informasi

Anda mungkin juga menyukai