Oleh :
C. Tujuan................................................................................................... 5
D. Manfaat................................................................................................. 6
1. Model 1 PL ......................................................................................14
2. Model 2 PL ......................................................................................18
3. Model 3 PL ......................................................................................25
4. Model 4 PL ......................................................................................27
2
KATA PENGANTAR
Puji syukur kehadirat Tuhan Yang Maha Esa atas segala karunia-Nya
sehingga makalah “Model – model Teori Respon Butir” dapat diselesaikan. Teori
Respon Butir (TRB) adalah kerangka kerja yang popular dan bermanfaat untuk
membuat model data uji pendidikan dan psikologis, karena sifat – sifat yang
menarik seperti invariance item dan menguji nilai parameter (ketika model TRB
dapat ditemukan yang sesuai dengan data uji) dan parameter item dan memeriksa
parameter yang dilaporkan pada skala umum. Model TRB didasarkan pada dua
asumsi ketat yaitu unidimensionality dan bentuk matematis dari fungsi karakteristik
item.
Teori Respon Butir (TRB) muncul pada awal tahun 1940-an dan mulai
dikenal di akhir tahun 1970-an. Model TRB mempertimbangkan perilaku peserta
tes pada level item, dan bukan pada level tes. Pemodelan pada tingkat item
menciptakan banyak fleksibilitas untuk diterapkan dalam pengembangan tes, studi
perbandingan fungsi item, pengujian computer adatif, pelaporan skor dan
sebagainya. Model TRB pada awalnya dikembangkan untuk menangani tanggapan
dikotomi yakni tanggapan atau respon yang terdiri dari dua kategori dengan skor 0-
1. Tetapi saat ini, model yang tersedia hanya dapat digunakan untuk menangani
hampir semua jenis data pendidikan dan psikologis.
Makalah ini menjelaskan tentang teori respon butir berdasarkan jenis/
macamnya, dan penjelasan mengenai komponen penyusun dari analisis tiap
modelnya. Penulis menyadari masih adanya kekurangan dalam penulisan makalah
ini. Namun, penulis mengucapkan terima kasih kepada seluruh pihak yang telah
membantu dalam penulisan ini. Semoga makalah ini memberikan kebermanfaatan
bagi para pembaca.
Penyusun
3
BAB I
PENDAHULUAN
A. Latar Belakang
Classical Test Theory (CTT) atau teori tes klasik telah banyak digunakan
dalam dalam proses analisis item butir. Popularitas ini bisa jadi dikarenakan
kelebihan yang dimiliki CTT. Kelebihan tersebut antara lain taraf kesukaran dan
daya diskriminasi item dalam teori tes klasik dapat dihitung secara manual.
Perhitungan ini dapat dikerjakan secara manual dikarenakan analisis dengan CTT
didasarkan pada data dengan jumlah yang tidak terlalu banyak. Selain kelebihan,
CTT juga tidak lepas dari kelemahan. Kelemahan tersebut diantaranya taraf
kesukaran dan daya diskriminasi item yang diperoleh bergantung pada sampel
(Hambleton & Swaminathan, 1985). Adanya sifat group dependent dan item
dependent menyebabkan karakteristik item yang dianalisis dengan CTT dapat
berubah sesuai konteks dari responden. Artinya, suatu item bisa memiliki taraf
kesukaran rendah karena item tersebut dikerjakan oleh kelompok responden dengan
kemampuan tinggi.
Kelemahan-kelemahan dari teori tes klasik memicu lahirnya Item Respone
Theory (IRT) atau teori respon butir. IRT merupakan kerangka umum dari fungsi
matematika yang menjelaskan interaksi antara subjek dan butir tes (Sumintono &
Widhiarso, 2013). Estimasi terhadap parameter item atau abilitas responden pada
IRT tidak bergantung pada sampel item tertentu atau responden yang dipilih dalam
suatu tes. Dengan IRT ini, ukuran taraf kesukaran butir serta ciri butir lainnya akan
tetap (invarian) terhadap kelompok peserta tes, tidak masalah kelompok peserta
mana saja yang mengerjakannya selama mereka mempunyai kemampuan yang
memadai untuk mengerjakannya; dan dengan teori ini pula, ukuran kemampuan
peserta akan tetap (invarian) terhadap kelompok butir tes, tidak masalah kelompok
butir mana saja yang mereka kerjakan selama kelompok butir itu mampu secara
memadai dikerjakan oleh peserta tes (Dali S.Naga, 1992).
Teori Respon Butir (IRT) telah dikembangkan untuk memperbaiki
keterbatasan – keterbatasan dari teori tes klasik. IRT biasa disebut dengan teori sifat
4
laten (latent trait theory). Konsep dasar teori IRT menggunakan kinerja subjek pada
suatu tes, sehingga sebuah tes dapat diprediksi atau dijelaskan oleh seperangkat
faktor tertentu. Faktor tersebut diantaranya adalah traits atau abilitas dan hubungan
antara kinerja subjek pada suatu butir. Faktor lain yang ditambahkan adalah
seperangkat kemampuan laten yang mendasari IRT yaitu dapat digambarkan
dengan suatu fungsi yang menaik secara monoton yang disebut sebagai kurva
karakteristik butir (Item Charasteristic Curve - ICC) (Hambleton, dkk. 1997).
Untuk mengurangi kelemahan dari CTT, IRT membangun suatu model
yang menghubungkan ciri butir dengan ciri peserta. Model hubungan itu dibuat
untuk berlaku secara bebas bagi kelompok butir dan kelompok peserta mana pun
yang memenuhi sejumlah syarat tertentu. Dengan kata lain, model hubungan
tersebut dibuat untuk berlaku bagi sejumlah kelompok butir dan sejumlah
kelompok peserta tanpa ketergantungan satu terhadap ciri lainnya. Ciri butir dan
ciri peserta yang dihubungkan oleh model memiliki bentuk fungsi atau lengkungan
grafik dengan sejumlah syarat itu dinyatakan melalui sejumlah parameter. Dalam
IRT terdapat 4 jenis model IRT, diantaranya: One-Parameter Logistic Model
(1PLM); Two-Parameter Logistic Models (2 PLM); Three- Parameter Logistic
Models (3 PLM); dan Four- Parameter Logistic Models (4 PLM);
B. Rumusan Masalah
Pada makalah ini beberapa rumusan masalah diambil berdasarkan latar
belakang, beberapa diantaranya adalah:
1. Bagaimanakah mengidentifikasikan pemodelan IRT berdasarkan tanggapan
dikotomi?
2. Bagaimanakah perbedaan dan persamaan masing – masing model IRT
tanggapan dikotomi unidimensional?
C. Tujuan
Tujuan penulisan makalah ini adalah untuk:
1. Menjelaskan pengertian dari pemodelan IRT berdasarkan tanggapan
dikotomi: unidimensional
2. Mengetahui pengidentifikasian jenis model IRT tersebut dalam
penggunaannya pada suatu permasalahan
5
3. Menjelaskan model – model IRT berdasarkan tanggapan dikotomi :
unidimensional
D. Manfaat
Manfaat penulisan makalah ini adalah untuk:
1. Memberi kemudahan kepada mahapeserta didik, guru, dosen dan profesi
lainnya dalam mempelajari Teori Respon Butir
6
BAB II
KAJIAN PUSTAKA
7
B. Persyaratan dan Hakikat pada Teori Respons Butir
Menurut Dali S.Naga (1992), persyaratan dan hakikat pada IRT, yaitu:
Pada umumnya, IRT mensyaratkan bahwa setiap butir hanya mengukur satu
ciri di kalangan peserta, meskipun belakangan ini berkembang IRT Multidimensi.
Namun IRT dapat dibatasi pada butir unidimensi sehingga unidimensi inilah yang
menjadi salah satu syarat pada butir itu. Persyaratan butir unidimensi ditujukan
untuk mempertahankan invariansi pada IRT. Jika suatu butir tes mengukur lebih
dari satu dimensi, maka jawaban terhadap butir itu merupakan kombinasi dari
berbagai kemampuan peserta. Akibatnya kita tidak lagi mengetahui kontribusi dari
setiap kemampuan terhadap jawaban peserta. Misalnya suatu tes bertujuan untuk
mengetahui kemampuan fisika pada materi tertentu. Jika kita tidak hati-hati dalam
mengkonstruksi butir, selain mengukur fisika, butir juga bisa mengukur
kemampuan berbahasa karena butir diungkapkan melalui bahasa. Sekiranya siswa
memberi jawaban salah, maka kita tidak lagi mengetahui apakah kesalahan
disebabkan oleh kemampuan peserta di bidang fisika atau di bidang bahasa.
2. Parameter
Dalam penilaian IRT terdapat 3 unsur utama, yaitu: butir, peserta, dan respon
(jawaban) peserta terhadap butir. Ketiga fungsi ini berhubungan sehingga
menghasilkan fungsi atau juga lengkungan responsi atau lengkungan karakteristik
butir. Hubungan tersebut dapat ditafsirkan sebagai berikut: Ada satu butir (misal
butir ke-j) direspon oleh sejumlah peserta. Respon para peserta terhadap butir itu
8
ditentukan oleh ciri butir dan ciri peserta. Dalam hubungan ini, ciri peserta
dinyatakan melalui parameter ciri peserta (𝜃); ciri butir dinyatakan melalui tiga
parameter butir 𝑎, 𝑏, 𝑐; serta respon peserta terhadap butir itu dinyatakan dalam
bentuk probabilitas jawaban benar P(𝜃). Dengan demikian, untuk butir ke-j,
hubungan itu dapat ditulis sebagai berikut:
Pj(𝜃) = 𝜑 (𝜃, 𝑎𝑗 , 𝑏𝑗 , 𝑐𝑗 )
3. Subpopulasi
9
keadaan tertentu, ukuran populasi yang kecil sama sekali tidak memungkinkan
pelaksanaan pengestimasian nilai parameter. Ada cara pengestimasian pada model
tertentu yang menuntut ukuran populasi tidak kurang dari 500, bahkan dalam
prakteknya, ada orang yang sampai menggunakan populasi peserta hampir
mencapai 50.000 orang. Setiap peserta memiliki nilai 𝜃 tertentu. Karena jumlah
peserta cukup besar, maka pada suatu nilai 𝜃 tertentu terdapat lebih dari satu
peserta. Pada kontinum parameter 𝜃 ini, gugus peserta yang memiliki nilai 𝜃 yang
sama disebut subpopulasi. Oleh karena itu, para peserta di dalam subpopulasi yang
sama adalah homogen. Mereka semua memiliki probabilitas yang sama untuk dapat
menjawab butir tes itu dengan benar atau salah.
4. Independensi Lokal
5. Invariansi Parameter
Melalui syarat pokok ini, kita menemukan bahwa fungsi atau lengkungan
responsi atau karakteritik butir adalah tetap atau tidak berubah sekalipun kelompok
peserta yang menjawab butir yang sama itu berubah-ubah. Dan untuk kelompok
yang sama, ciri mereka adalah tetap sekalipun butir yang mereka jawab berubah-
ubah.
10
C. Model Teori Respon Butir Dikotomi : Unidimensional
Dua asumsi itu yang telah dijelaskan sebelumnya, hanyalah cara yang
berbeda untuk mengatakan hal yang sama tentang data. Asumsi utama ketiga adalah
pemodelan hubungan antara sifat yang diukur dengan tes dan tanggapan item. Pada
makalah ini, penekanan dilakukan pada satu subtopik bahasan yaitu pemodelan IRT
berdasarkan tanggapan dikotomi jenis unidimensional yang membuat asumsi
berbeda tentang hubungan antara sifat yang diukur dengan tes dan tanggapan item.
Di dalam penentuannya, model respon atau karakteristik butir memerlukan
(Dali S.Naga, 1992:175) :
1. Bentuk matematika sebagai fungsi yang menghubungkan ciri peserta dengan ciri
butir melalui respon (jawaban) peserta terhadap butir.
2. Sejumlah parameter yang dapat mewakili ciri peserta dan ciri butir.
Menurut Hambleton & Swaminathan, (1985: 35), berdasarkan jenis data
yang diperoleh, ada beberapa model IRT yang dapat digunakan untuk
menganalisisnya, yaitu:
Tabel 1. Model-model Teori Respon Butir Berdasarkan Jenis Data
Model yang
No. Jenis Data Referensi
digunakan
1. Dichotomous Latent Linear Lazarsfeld & Henry (1968)
Perfect Scale Guttman (1944)
Latent Distance Lazarsfeld & Henry (1968)
One-, Two-, Three-
Parameter Normal Lord (1952)
Ogive
Birbaum (1957, 1958a, 1958b,
One-, Two-, Three- 1968), Lord & Novick (1968).
Parameter Logistic Lord (1980a), Rasch (1960),
Wright & Stone (1979)
11
Four-Parameter McDonald (1967), Barton &
Logistic Lord (1981)
2. Multicategory Nominal Respone Bock (1972)
Scoring Graded Respone Samejima (1969)
Partial Credit Model Master (1982)
3. Continous Continous Respone Samejima (1972)
12
Gambar 2. Perbandingan kurva distribusi normal dengan kurva distribusi logistik
(𝑥−𝜋)2
1 −
Distribusi Normal : N(0,1) = 𝑒 2𝜎2
√2𝜋𝜃2
1,7𝑒 −1,7𝑧
Distribusi Logistik : L(0,1,7) =
(1+𝑒 −1,7𝑧 )2
Besarnya peluang dicari pada luasan suatu distribusi itu, maka digunakanlah
integral. Pada distribusi logistik tidak ada tanda integral, sedangkan pada distribusi
normal memiliki tanda integral, sehingga lebih mudah menggunakan distribusi
logistik. Hal ini dapat dijelaskan dalam persamaan berikut:
𝑧 1 𝑧 2/
Distribusi Normal : ∫−∞ N(0,1) = ∫ 𝑒 −𝑧
√2𝜋 −𝜋
2 𝑑𝑧
𝑧 1
Distribusi Logistik : ∫−∞ L(0,1,7) =
1+𝑒 −1,7𝑧
Persamaan di atas menunjukkan bahwa integral distribusi logistik lebih
sederhana dibandingkan integral distribusi normal. Perbedaan integral dari kedua
distribusi tersebut lebih kecil dari 0,01. Asumsi yang digunakan adalah distribusi
normal, namun untuk memudahkan perhitungan, digunakan distribusi logistik.
Beda distribusi normal dan distribusi logistik paling kecil adalah jika simpangan
baku distribusi logistik sebesar 1,7; sehingga IRT cenderung menggunakan
distribusi logistik (Djemari Mardapi, 2012: 203).
Dengan menggunakan distribusi logistik, maka model pada IRT
berdasarkan jumlah parameter butirnya dibagi menjadi 4, yaitu one-parameter
logistic model (1PL), two-parameter logistic model (2PL), three-parameter logistic
13
model (3PL), dan four-parameter logistic model (4PL) (Hambleton &
Swaminathan, 1985: 34). Namun, dari keempat model tersebut model 1 PL, 2PL,
dan 3PL merupakan model yang umumnya digunakan. Ketiganya dibedakan
melalui jumlah parameter yang dimiliki masing-masing model sebagai pembentuk
fungsi respon item.
1. Model 1 PL
Model 1-PL adalah model IRT yang paling sederhana dimana hanya terdapat
satu item parameter. Parameter yang dimaksud ialah tingkat kesukaran item yang
dilambangkan dengan huruf b. Kurva karakteritik butir soal untuk model satu
parameter diberikan oleh persamaan:
Model Rumus matematis
𝑒 𝐷(𝜃−𝑏𝑖 )
1-PL 𝑃𝑖 (𝜃) = [1 + 𝑒 −𝐷(𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷(𝜃−𝑏𝑖 )
Dengan:
𝜃 : Tingkat kemampuan (ability) peserta tes
𝑃𝑖 (𝜃): Probabilitas peserta tes yang memiliki kemampuan 𝜃 dapat menjawab butir
i dengan benar
𝑏𝑖 : Indeks kesukaran butir ke-i
𝑒 : bilangan natural yang nilainya mendekati 2,718
D : faktor penskalaan yang harganya 1,7
Pada saat nilai b meningkat, ini berarti tingkat kesukaran item juga
meningkat. Pada saat skor kemampuan dari satu kelompok peserta ujian
ditransformasikan maka rata-ratanya ialah nol (0) dan standar deviasinya ialah satu
(1). Indeks tingkat kesukaran biasanya berkisar antara kira-kira -2,0 hingga +2,0
(Hambleton & Swaminathan, 1985: 36). Nilai yang semakin mendekati -2
menunjukkan karakteristik butir yang semakin mudah, dan nilai yang mendekati +2
menunjukkan karakteristik butir yang semakin sulit bagi peserta ujian. Dalam
model 1-PL, nilai b melambangkan tingkat kemampuan (θ) yang dituntut bagi 50%
kesempatan menjawab dengan tepat. Jadi, jika b = 0, maka kemungkinan jawaban
benar akan sama dengan 0,5 pada tingkat kemampuan θ = 0
14
Gambar 3 menunjukkan dua butir berbeda yang memiliki nilai berbeda. Nilai
b untuk butir 1 = -1 (𝑏1 = -1) dan nilai b untuk butir 2 = 1 (𝑏2 = 1). Perhatikan
bagaimana nilai b menentukan lokasi horizontal lokasi fungsi respon butir; saat
nilai b bertambah, fungsi respon butir bergerak ke kanan dan butir berubah menjadi
semakin sulit. Dalam situasi ini, butir 2 merupakan butir yang lebih sulit daripada
butir 1. Dengan demikian, pada setiap tahap kemampuan yang ada, peluang untuk
menjawab butir 1 dengan benar lebih tinggi daripada peluang menjawab butir 2
dengan benar. Perhatikanlah bahwa peluang merespon dengan tepat terhadap butir
1 = 0,5 pada tingkat kemampuan -1, seperti yang diharapkan yaitu b1 = -1.
Demikian juga peluang menjawab benar terhadap butir 2 =0,5 pada tingkat
kemampuan 1, seperti yang diharapkan yaitu b2 = 1 (lihat Gambar 2)
15
Contoh Model 1 PL :
Studi kasus: Soal Ujian Akhir Semester Tingkat Persiapan Bersama IPB Mata
Kuliah Fisika Tahun 2008/2009
1 0,551 0,002 0,013 0,030 0,067 0,282 0,478 0,834 0,922 0,985 P1 (Ɵ)
2 0,229 0,004 0,022 0,050 0,110 0,404 0,613 0,897 0,953 0,991 P2 (Ɵ)
3 0,474 0,003 0,015 0,034 0,075 0,309 0,511 0,851 0,930 0,987 P3(Ɵ)
4 0,45 0,003 0,015 0,035 0,078 0,318 0,521 0,856 0,933 0,987 P4(Ɵ)
5 0,754 0,002 0,009 0,021 0,048 0,217 0,394 0,780 0,893 0,979 P5 (Ɵ)
6 0,184 0,004 0,024 0,054 0,118 0,422 0,631 0,904 0,956 0,992 P6 (Ɵ)
7 0,236 0,004 0,022 0,050 0,109 0,401 0,610 0,896 0,953 0,991 P7 (Ɵ)
8 0,938 0,001 0,007 0,016 0,036 0,169 0,322 0,722 0,859 0,971 P8 (Ɵ)
9 0,396 0,003 0,017 0,038 0,085 0,338 0,544 0,867 0,939 0,988 P9 (Ɵ)
10 0,43 0,003 0,016 0,036 0,081 0,325 0,530 0,860 0,935 0,987 P10 (Ɵ)
16
17
Kurva Karakteristik 10 Butir Soal
1.2
1
Probability Correct
0.8
0.6
Butir 1
Butir 2
0.4 Butir 3
Butir 4
Butir 5
Butir 6
0.2 Butir 7
Butir 8
Butir 9
Butir 10
0
-3 -2 -1 0 1 2 3
Tingkat Kemampuan
2. Model 2 PL
Model 2-PL memang memiliki keuntungan dalam hal kemudahan, namun
model itu kekurangan fleksibilitas yang membolehkan butir yang berbeda memiliki
fungsi respon butir dari kemiringan atau kecuraman yang berbeda. Model 2-PL
mengatasi keterbatasan model ini dengan menambahkan parameter kedua
(dilambangkan dengan a) yang mengontrol kemiringan fungsi respon butir.
18
Kurva karakteritik butir soal untuk model satu parameter diberikan oleh
persamaan:
Model Rumus matematis
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
2-PL 𝑃𝑖 (𝜃) = [1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
Dengan:
𝜃 : Tingkat kemampuan (ability) peserta tes
𝑃𝑖 (𝜃): Probabilitas peserta tes yang memiliki kemampuan 𝜃 dapat menjawab butir
i dengan benar
𝑎𝑖 : Indeks daya pembeda butir ke-i
𝑏𝑖 : Indeks kesukaran butir ke-i
𝑒 : bilangan natural yang nilainya mendekati 2,718
D : faktor penskalaan yang harganya 1,7
Pada saat a meningkat, kemiringan fungsi respon butir juga meningkat.
Kemiringan fungsi respon butir merefleksikan seberapa baiknya kemampuan butir
untuk membedakan antara individu yang memiliki nilai kemampuan θ tinggi
ataupun rendah; ini dikenal sebagai daya beda atau parameter pembeda (OAERS,
n.d.). Biasanya rentang daya beda berada antara 0-2, atau nilai daya beda tidak akan
melebihi 2 (Hambleton & Swaminathan, 1985: 36). Artinya nilai a yang tinggi akan
menghasilkan kurva karakteristik butir yang sangat curam, sedangkan nilai a yang
rendah akan menciptakan kurva karakteristik butir yang naik secara bertahap
sebagai satu fungsi kemampuan. Tingginya daya beda sebuah butir merefleksikan
tingginya tingkat informasi yang diberikan oleh sebuah butir mengenai tingkat
kemampuan responden. Oleh sebab itu, nilai a adalah indikator dari berapa banyak
sebuah butir memberi informasi mengenai tingkat kemampuan peserta tes.
Adapun arti rentang nilai daya beda butir tes dapat dibedakan sebagai berikut
(Baker, 2001):
Label Verbal Rentang Nilai
Tidak ada 0
Sangat rendah 0,1 – 0,34
19
Rendah 0,35 – 0,64
Sedang 0,65 – 1,34
Tinggi 1,35 – 1,69
Sangat tinggi >1,70
Sempurna + tidak terbatas
Gambar 5 menunjukkan fungsi respon butir dari dua butir (butir 1 dan butir
2) yang memiliki nilai daya beda yang berbeda. Nilai a untuk butir 1=2,5 (a1 = 2.5)
dan nilai a untuk butir 2=1 (a2 = 1). Bagi kedua butir ini, nilai tingkat kesulitan b =
0. Perhatikan bahwa nilai daya beda a menentukan kemiringan fungsi respon butir;
saat a bertambah, fungsi respon butir menjadi lebih curam dan butir tersebut
menjadi butir dengan daya beda yang semakin tinggi. Dalam situasi ini, butir 1
memiliki daya beda yang lebih tinggi dari butir 2 sehingga butir itu memberikan
banyak informasi mengenai tingkat kemampuan peserta tes. Sehingga, butir dengan
daya beda yang lebih tinggi memiliki karakteristik psikometri yang lebih
diinginkan dibandingkan dengan butir yang memiliki nilai daya beda yang lebih
rendah (OAERS, n.d.).
20
Studi kasus: Soal Ujian Akhir Semester Tingkat Persiapan Bersama IPB Mata
Kuliah Fisika Tahun 2008/2009.
21
Butir Soal 1 dan 2
1.200
Probabability Correct
1.000
0.800
0.600
0.400
0.200
0.000
-3 -2 -1 0 1 2 3
Tingkat kemampuan (Ɵ) butir soal 1
butir soal 2
1.000
0.800
0.600
0.400
0.200
0.000
-3 -2 -1 0 1 2 3
tingkat kemampuan (Ɵ)
butir soal 3
butir soal 4
22
Butir Soal 5 dan 6
1.000
0.600
0.400
0.200
0.000
-3 -2 -1 0 1 2 3
tingkat kemampuan (Ɵ)
0.800
0.600
0.400
0.200
0.000
-3 -2 -1 0 1 2 3
tingkat kemampuan (Ɵ)
23
Butir Soal 9 dan 10
1.000
0.900
probability corret Pi (Ɵ) 0.800
0.700
0.600
0.500
0.400
0.300
0.200
0.100
0.000
-3 -2 -1 0 1 2 3
tingkat kemampuan (Ɵ)
butir soal 9
butir soal 10
1
Probabability Correct Pi (Ɵ)
0.8
0.6
0.4
0.2
0
-3 -2 -1 0 1 2 3
Tingkat Kemampuan (Ɵ)
24
Pada keseluruhan butir, banyak informasi yang dapat diperhatikan dari lokasi
fungsi respon butir. Dalam kondisi 2PL, diketahui bahwa jika fungsi respon butir
memiliki kemiringan yang diperngaruhi oleh daya beda dari setiap butir soal. Pada
Gambar Kurva Karakteristik 10 Butir soal di atas diketahui bahwa soal nomor 3
memiliki daya beda yang paling tinggi dengan melihat kecondongan slope S dari
fungsi respons butir dan butir soal 10 memiliki daya beda butir paling rendah.
Dalam situasi ini, butir 3 memiliki daya beda yang paling tinggi dari butir
lainnya sehingga butir itu memberikan banyak informasi mengenai tingkat
kemampuan peserta tes. Sehingga, butir dengan daya beda yang lebih tinggi
memiliki karakteristik psikometri yang lebih diinginkan dibandingkan dengan butir
yang memiliki nilai daya beda yang lebih rendah.
3. Model 3 PL
Model 3PL adalah model yang menambahkan parameter c, mewakili peluang
menebak jawaban. Dengan adanya indeks tebakan semu (pseudo-guessing) pada
model 3-PL, memungkinkan peserta yang memiliki kemampuan rendah
mempunyai peluang untuk menjawab butir soal dengan benar.
Kurva karakteritik butir soal untuk model satu parameter diberikan oleh
persamaan:
Model Rumus matematis
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
3-PL 𝑃𝑖 (𝜃) = 𝑐𝑖 + (1 − 𝑐𝑖 ) 𝑐𝑖 + (1 − 𝑐𝑖 )[1 + 𝑒 −𝐷𝑎𝑖(𝜃−𝑏𝑖) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
Dengan:
𝜃 : Tingkat kemampuan (ability) peserta tes
𝑃𝑖 (𝜃): Probabilitas peserta tes yang memiliki kemampuan 𝜃 dapat menjawab butir
i dengan benar
𝑎𝑖 : Indeks daya pembeda butir ke-i
𝑏𝑖 : Indeks kesukaran butir ke-i
𝑐𝑖 : Indeks tebakan semu (pseudo-guessing) butir ke-i
25
𝑒 : bilangan natural yang nilainya mendekati 2,718
D : faktor penskalaan yang harganya 1,7
Nilai c merefleksikan nilai terendah dari fungsi respon butir saat kemampuan
menjadi sangat rendah (dikenal sebagai asimtot fungsi respon butir). Jadi, jika c =
0,2, maka peluang menjawab benar bagi individu dengan kemampuan yang sangat
rendah ialah 0,2. Karena nilai c merefleksikan hasil perilaku menebak jawaban, hal
ini disebut dengan parameter pseudo-guessing. Indeks tebakan semu pada tes
pilihan ganda terletak di sekitar seperbanyaknya pilihan jawaban. Misalnya pada
tes dengan pilihan 4 jawaban, maka nilai 𝑐𝑖 terletak di sekitar ¼ atau 0,25 (Dali S.
Naga, 1992: 224).
Gambar 7 menunjukkan fungsi respon butir dari dua butir berbeda (butir 1
dan butir 2) yang memiliki nilai c yang berbeda; nilai c untuk butir 1 ialah 0 (c1 =
0) dan nilai c untuk butir 2 ialah (c2 = 0.2). Namun, nilai c2 = 0.2 untuk butir 2
menyebabkan batas bawah fungsi respon butir 2 menjadi lebih tinggi daripada butir
1, mengindikasikan adanya perilaku menebak di butir 2. Pada saat nilai tingkat
kesukaran b mewakili tingkat kemampuan pada peluang menjawab benar ialah 0,5
di bawah model 1-PL dan model 2-PL, hal yang sama tidak terjadi di bawah model
PL ketika c > 0. Gambar 6 mendemonstrasikan hal ini, dimana peluang menjawab
benar sama dengan 0,5 pada taraf kemampuan θ = b1 (ingat bahwa c1 = 0), tetapi
peluang menjawab butir 2 dengan benar sama dengan 0,5 pada taraf kemampuan θ
< b2 (ingat bahwa c2 = 0,2).
26
menunjukkan bahwa probabilitas menjawab benar tidak berawal dari 0, tetapi
berawal dari 0,198. Jadi jawaban yang sifatnya tebakan mempunyai kemungkinan
benar 19,8%.
Gambar 8. Kurva karakteristik butir soal dengan 𝑎=1,117; b=2,287; dan c=0,198
Contoh 3 PL :
Studi kasus: Soal Ujian Akhir Semester Tingkat Persiapan Bersama IPB Mata
Kuliah Fisika Tahun 2008/2009.
27
Ө -3,5 -3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5
No
(ai) (bi) (ci) Pi (Ɵ)
Soal
1 0,551 0,687 0,551 0,560 0,565 0,573 0,585 0,602 0,628 0,662 0,706 0,756 0,808 0,857 0,898 0,931 0,954 0,970 P1 (Ɵ)
2 0,229 0,455 0,395 0,502 0,520 0,540 0,563 0,588 0,614 0,642 0,671 0,700 0,729 0,758 0,786 0,812 0,836 0,858 P2 (Ɵ)
3 0,474 0,823 0,474 0,490 0,497 0,508 0,523 0,544 0,572 0,609 0,653 0,703 0,756 0,807 0,853 0,892 0,922 0,945 P3(Ɵ)
4 0,45 0,636 0,450 0,472 0,482 0,496 0,515 0,540 0,572 0,612 0,659 0,711 0,763 0,813 0,857 0,893 0,923 0,945 P4(Ɵ)
5 0,754 0,444 0,754 0,756 0,757 0,760 0,764 0,773 0,787 0,810 0,843 0,881 0,919 0,949 0,971 0,984 0,991 0,995 P5 (Ɵ)
6 0,184 0,308 0,573 0,673 0,685 0,698 0,713 0,728 0,743 0,760 0,776 0,793 0,810 0,826 0,842 0,857 0,871 0,885 P6 (Ɵ)
7 0,236 0,429 0,368 0,476 0,495 0,517 0,541 0,567 0,596 0,626 0,657 0,688 0,720 0,751 0,780 0,808 0,834 0,857 P7 (Ɵ)
8 0,938 0,187 0,938 0,938 0,938 0,939 0,940 0,942 0,946 0,954 0,964 0,977 0,987 0,993 0,997 0,998 0,999 1,000 P8 (Ɵ)
9 0,396 0,424 0,396 0,436 0,451 0,470 0,495 0,526 0,563 0,607 0,655 0,706 0,756 0,803 0,845 0,880 0,909 0,932 P9 (Ɵ)
10 0,43 0,222 0,430 0,465 0,479 0,499 0,524 0,556 0,596 0,641 0,692 0,744 0,794 0,839 0,878 0,909 0,934 0,952 P10 (Ɵ)
1 0.560 55.97
2 0.502 50.18
3 0.490 48.97
4 0.472 47.23
5 0.756 75.56
6 0.673 67.25
7 0.476 47.63
8 0.938 93.82
9 0.436 43.62
10 0.465 46.52
Pada keseluruhan butir, banyak informasi yang dapat diperhatikan dari lokasi
fungsi respon butir. Dalam kondisi 3PL, diketahui bahwa jika fungsi respon butir
memiliki nilai batas bawah yang diperngaruhi oleh nilai c (nilai psudo-guessing)
dari setiap butir soal. Pada Gambar Kurva Karakteristik 10 Butir soal di atas
diketahui bahwa soal nomor 9 memiliki nilai batas bawah yang paling kecil dari
keseluruhan butir dengan butir soal 8 memiliki nilai batas bawah butir paling tinggi.
Dalam situasi ini, butir 9 memiliki nilai batas bawah yang paling kecil dari
keseluruhan butir dan hal ini memberikan informasi bahwa sedikitnya responden
melakukan perilaku menebak jawaban pada butir tersebut. Sedangkan butir soal 8,
memiliki nilai batas bawah yang paling tinggi mengindikasikan peluang perilaku
menebak pada butir ini sangat besar. Hal ini pula dapat diperhatikan dalam bentuk
porsentase tebakan menjawab benar butir soal nomor 8 lebih besar dari keseluruhan
butir soal.
4. Model 4 PL
Model empat parameter, yaitu untuk menganalisis data yang menitikberatkan
pada parameter tingkat kesukaran soal, daya beda soal, menebak, dan penyebab lain
(Hambleton dalam Depdiknas, 2010: 18). Hambleton & Swaminathan (1985: 48)
menyatakan melalui model 4-PL akan dijelaskan bahwa peserta didik yang
32
memiliki kemampuan tinggi tidak selalu menjawab soal dengan benar. Terkadang
mereka mengerjakan soal dengan sembrono, sehingga soal yang seharusnya
dijawab benar malah dijawab salah. Selanjutnya, dikarenakan indeks parameter
butir dan kemampuan peserta merupakan hasil estimasi, maka kebenarannya
bersifat probabilistik dan mengandung kesalahan pengukuran. Namun, karena
bebas dari group dependent dan item dependent, maka IRT dapat digunakan untuk
mengetahui karakteristik butir soal secara lebih meyakinkan dibandingkan dengan
teori tes klasik (Samsul Hadi, 2013).
Dibawah ini disajikan rumus untuk model 4 parameter logistik (Hambleton
& Swaminathan, 1985: 48) :
Model Rumus matematis
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
4-PL 𝑃𝑖 (𝜃) = 𝑐𝑖 + (𝛾𝑖 − 𝑐𝑖 ) 𝑐𝑖 + (𝛾𝑖 − 𝑐𝑖 )[1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
Dengan:
𝜃 : Tingkat kemampuan (ability) peserta tes
𝑃𝑖 (𝜃): Probabilitas peserta tes yang memiliki kemampuan 𝜃 dapat menjawab butir
i dengan benar
𝑎𝑖 : Indeks daya pembeda butir ke-i
𝑏𝑖 : Indeks kesukaran butir ke-i
𝑐𝑖 : Indeks tebakan semu (pseudoguessing) butir ke-i
𝑒 : bilangan natural yang nilainya mendekati 2,718
D : faktor penskalaan yang harganya 1,7
33
BAB III
PENUTUP
Kesimpulan
Berdasaran pembahasan tentang pemodelan dalam teori respon butir atau
IRT di atas dapar diperoleh kesimpulan bahwa,
1. Model IRT pada awalnya dikembangkan untuk menangani tanggapan
dikotomi yakni tanggapan atau respon yang terdiri dari 2 kategori dengan skor
0-1. Tetapi, saat ini model tersedia untuk menangani hampir semua jenis data
pendidikan dan psikologis (Van der Linden & Hambleton 1997 dalam
Diputera, 2018). Dua asumsi mendasar dengan model IRT adalah
unidimensional dan local independen. Asumsi unidimensionalitas merujuk
pada abilitas yang diukur dalam suatu set soal adalah tunggal. Hal ini
diartikan bahwa dalam satu set soal atau ukuran tes (s) hanya satu sifat laten
(𝜃). Item soal yang disusun hanya mengukur satu dari kemampuan peserta
tes.
2. Dengan menggunakan distribusi logistik, maka model pada IRT berdasarkan
jumlah parameter butirnya dibagi menjadi 4, yaitu one-parameter logistic
model (1PL), two-parameter logistic model (2PL), three-parameter logistic
model (3PL), dan four-parameter logistic model (4PL) (Hambleton &
Swaminathan, 1985: 34). Namun, dari keempat model tersebut model 1 PL,
2PL, dan 3PL merupakan model yang umumnya digunakan. Ketiganya
dibedakan melalui jumlah parameter yang dimiliki masing-masing model
sebagai pembentuk fungsi respon item.
Dibawah ini disajikan rumus bagi masing-masing model parameter logistik
(Hambleton & Swaminathan, 1985: 48) :
Model Rumus matematis
𝑒 𝐷(𝜃−𝑏𝑖 )
1-PL 𝑃𝑖 (𝜃) = [1 + 𝑒 −𝐷(𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷(𝜃−𝑏𝑖 )
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
2-PL 𝑃𝑖 (𝜃) = [1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
34
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
3-PL 𝑃𝑖 (𝜃) = 𝑐𝑖 + (1 − 𝑐𝑖 ) 𝑐𝑖 + (1 − 𝑐𝑖 )[1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
4-PL 𝑃𝑖 (𝜃) = 𝑐𝑖 + (𝛾𝑖 − 𝑐𝑖 ) 𝑐𝑖 + (𝛾𝑖 − 𝑐𝑖 )[1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
35
DAFTAR PUSTAKA
Dali S. Naga. (1992). Pengantar Teori Sekor pada Pengukuran Pendidikan. Jakarta:
Gunadarma.
Diputera, Artha Mahindra. 2018. Analisis IRT Menggunakan Wingen 3: Teori
Respons Butir & Aplikasinya. Ponorogo : Uwais Inspirasi Indonesia
Hambleton, R. K., Swaminathan, H., & Rogers, J. H. (1991).Fundamentals of Item
Respone Theory. California: SAGE PUBLICATIONS
Mardapi, Djemari. 2012. Pengukuran, Penilaian, dan Evaluasi Pendidikan.
Yogyakarta: Nuha Litera
Naga, Dali S.. 1992. Pengantar Teori Sekor pada Pengukuran Pendidikan. Jakarta:
Gunadarma.
Office of Assessment, Evaluation, & Research Services (OAERS). Overview of
item response theory. Diambil dari http://erm.uncg.edu/oaers/methodology-
resources/item-response-theory/
Samsul Hadi. (2013). Pengembangan Computerized Adaptive Test Berbasis Web.
Yogyakarta: Aswaja Pressindo.
Sumintono, B, & Widhiarso, W. (2013). Aplikasi Model Rasch untuk Penelitian
Ilmu-ilmu Sosial. Cimahi: Trim Komunikata Publishing House.
36