Anda di halaman 1dari 36

MAKALAH

MODEL - MODEL TEORI RESPON BUTIR


Makalah ini untuk memenuhi tugas mata kuliah Teori Respon Butir yang
dibimbing oleh Dr. Edi Istiyono, M.Si.

Oleh :

Anissa Maghfiroh, S.Pd. (18726251004)


Tanty Dwi Purwita, S.Si. (18726251020)
Aprillia Mayang Sari, S. Pd. (18726251022)
S2 Pendidikan Fisika A 2018

PROGRAM STUDI PENDIDIKAN FISIKA


PROGRAM PASCASARJANA
UNIVERSITAS NEGERI YOGYAKARTA
2019
DAFTAR ISI

DAFTAR ISI ........................................................................................................... 2

KATA PENGANTAR ............................................................................................ 3

BAB I PENDAHULUAN ....................................................................................... 4

A. Latar Belakang ..................................................................................... 4

B. Rumusan Masalah ................................................................................ 5

C. Tujuan................................................................................................... 5

D. Manfaat................................................................................................. 6

BAB II KAJIAN PUSTAKA .................................................................................. 7

A. Teori Respon Butir ............................................................................... 7

B. Persyaratan dan Hakikat pada Teori Respons Butir ............................. 8

C. Model Teori Respon Butir Dikotomi : Unidimensional..................... 11

1. Model 1 PL ......................................................................................14

2. Model 2 PL ......................................................................................18

3. Model 3 PL ......................................................................................25

4. Model 4 PL ......................................................................................27

BAB III PENUTUP .............................................................................................. 34

DAFTAR PUSTAKA ........................................................................................... 36

2
KATA PENGANTAR

Puji syukur kehadirat Tuhan Yang Maha Esa atas segala karunia-Nya
sehingga makalah “Model – model Teori Respon Butir” dapat diselesaikan. Teori
Respon Butir (TRB) adalah kerangka kerja yang popular dan bermanfaat untuk
membuat model data uji pendidikan dan psikologis, karena sifat – sifat yang
menarik seperti invariance item dan menguji nilai parameter (ketika model TRB
dapat ditemukan yang sesuai dengan data uji) dan parameter item dan memeriksa
parameter yang dilaporkan pada skala umum. Model TRB didasarkan pada dua
asumsi ketat yaitu unidimensionality dan bentuk matematis dari fungsi karakteristik
item.
Teori Respon Butir (TRB) muncul pada awal tahun 1940-an dan mulai
dikenal di akhir tahun 1970-an. Model TRB mempertimbangkan perilaku peserta
tes pada level item, dan bukan pada level tes. Pemodelan pada tingkat item
menciptakan banyak fleksibilitas untuk diterapkan dalam pengembangan tes, studi
perbandingan fungsi item, pengujian computer adatif, pelaporan skor dan
sebagainya. Model TRB pada awalnya dikembangkan untuk menangani tanggapan
dikotomi yakni tanggapan atau respon yang terdiri dari dua kategori dengan skor 0-
1. Tetapi saat ini, model yang tersedia hanya dapat digunakan untuk menangani
hampir semua jenis data pendidikan dan psikologis.
Makalah ini menjelaskan tentang teori respon butir berdasarkan jenis/
macamnya, dan penjelasan mengenai komponen penyusun dari analisis tiap
modelnya. Penulis menyadari masih adanya kekurangan dalam penulisan makalah
ini. Namun, penulis mengucapkan terima kasih kepada seluruh pihak yang telah
membantu dalam penulisan ini. Semoga makalah ini memberikan kebermanfaatan
bagi para pembaca.

Yogyakarta, 26 Februari 2019

Penyusun

3
BAB I
PENDAHULUAN

A. Latar Belakang
Classical Test Theory (CTT) atau teori tes klasik telah banyak digunakan
dalam dalam proses analisis item butir. Popularitas ini bisa jadi dikarenakan
kelebihan yang dimiliki CTT. Kelebihan tersebut antara lain taraf kesukaran dan
daya diskriminasi item dalam teori tes klasik dapat dihitung secara manual.
Perhitungan ini dapat dikerjakan secara manual dikarenakan analisis dengan CTT
didasarkan pada data dengan jumlah yang tidak terlalu banyak. Selain kelebihan,
CTT juga tidak lepas dari kelemahan. Kelemahan tersebut diantaranya taraf
kesukaran dan daya diskriminasi item yang diperoleh bergantung pada sampel
(Hambleton & Swaminathan, 1985). Adanya sifat group dependent dan item
dependent menyebabkan karakteristik item yang dianalisis dengan CTT dapat
berubah sesuai konteks dari responden. Artinya, suatu item bisa memiliki taraf
kesukaran rendah karena item tersebut dikerjakan oleh kelompok responden dengan
kemampuan tinggi.
Kelemahan-kelemahan dari teori tes klasik memicu lahirnya Item Respone
Theory (IRT) atau teori respon butir. IRT merupakan kerangka umum dari fungsi
matematika yang menjelaskan interaksi antara subjek dan butir tes (Sumintono &
Widhiarso, 2013). Estimasi terhadap parameter item atau abilitas responden pada
IRT tidak bergantung pada sampel item tertentu atau responden yang dipilih dalam
suatu tes. Dengan IRT ini, ukuran taraf kesukaran butir serta ciri butir lainnya akan
tetap (invarian) terhadap kelompok peserta tes, tidak masalah kelompok peserta
mana saja yang mengerjakannya selama mereka mempunyai kemampuan yang
memadai untuk mengerjakannya; dan dengan teori ini pula, ukuran kemampuan
peserta akan tetap (invarian) terhadap kelompok butir tes, tidak masalah kelompok
butir mana saja yang mereka kerjakan selama kelompok butir itu mampu secara
memadai dikerjakan oleh peserta tes (Dali S.Naga, 1992).
Teori Respon Butir (IRT) telah dikembangkan untuk memperbaiki
keterbatasan – keterbatasan dari teori tes klasik. IRT biasa disebut dengan teori sifat

4
laten (latent trait theory). Konsep dasar teori IRT menggunakan kinerja subjek pada
suatu tes, sehingga sebuah tes dapat diprediksi atau dijelaskan oleh seperangkat
faktor tertentu. Faktor tersebut diantaranya adalah traits atau abilitas dan hubungan
antara kinerja subjek pada suatu butir. Faktor lain yang ditambahkan adalah
seperangkat kemampuan laten yang mendasari IRT yaitu dapat digambarkan
dengan suatu fungsi yang menaik secara monoton yang disebut sebagai kurva
karakteristik butir (Item Charasteristic Curve - ICC) (Hambleton, dkk. 1997).
Untuk mengurangi kelemahan dari CTT, IRT membangun suatu model
yang menghubungkan ciri butir dengan ciri peserta. Model hubungan itu dibuat
untuk berlaku secara bebas bagi kelompok butir dan kelompok peserta mana pun
yang memenuhi sejumlah syarat tertentu. Dengan kata lain, model hubungan
tersebut dibuat untuk berlaku bagi sejumlah kelompok butir dan sejumlah
kelompok peserta tanpa ketergantungan satu terhadap ciri lainnya. Ciri butir dan
ciri peserta yang dihubungkan oleh model memiliki bentuk fungsi atau lengkungan
grafik dengan sejumlah syarat itu dinyatakan melalui sejumlah parameter. Dalam
IRT terdapat 4 jenis model IRT, diantaranya: One-Parameter Logistic Model
(1PLM); Two-Parameter Logistic Models (2 PLM); Three- Parameter Logistic
Models (3 PLM); dan Four- Parameter Logistic Models (4 PLM);
B. Rumusan Masalah
Pada makalah ini beberapa rumusan masalah diambil berdasarkan latar
belakang, beberapa diantaranya adalah:
1. Bagaimanakah mengidentifikasikan pemodelan IRT berdasarkan tanggapan
dikotomi?
2. Bagaimanakah perbedaan dan persamaan masing – masing model IRT
tanggapan dikotomi unidimensional?
C. Tujuan
Tujuan penulisan makalah ini adalah untuk:
1. Menjelaskan pengertian dari pemodelan IRT berdasarkan tanggapan
dikotomi: unidimensional
2. Mengetahui pengidentifikasian jenis model IRT tersebut dalam
penggunaannya pada suatu permasalahan

5
3. Menjelaskan model – model IRT berdasarkan tanggapan dikotomi :
unidimensional
D. Manfaat
Manfaat penulisan makalah ini adalah untuk:
1. Memberi kemudahan kepada mahapeserta didik, guru, dosen dan profesi
lainnya dalam mempelajari Teori Respon Butir

6
BAB II
KAJIAN PUSTAKA

A. Teori Respon Butir


Teori Respon Butir (Item Respone Theory) yang disingkat IRT atau sering
disebut juga dengan Latent Trait Theory (LTT) atau sering juga disebut Item
Characteristic Curve (ICC) merupakan salah satu kerangka umum dari fungsi
matematika yang menjelaskan interaksi antara subjek dan butir tes (Sumintono &
Widhiarso, 2013). IRT muncul pada awal tahun 1940-an, namun mulai popular
dikenal di akhir tahun 1970-an. IRT telah banyak mengalami perkembangan seiring
dengan banyak jenis kegiatan manusia yang tidak terlepas dari pengukuran,
penilaian dan evaluasi. Penerapan IRT pada saat ini tidak hanya dikenakan pada tes
yang bersifat unidimensional, melainkan telah merambah pada tes
multidimensional. Hal ini dikarenakan IRT memiliki tujuan untuk mengatasi
kelemahan atau keterbatasan yang terdapat pada pengukuran klasik.
Konsep dasar IRT adalah kinerja subjek pada tes dapat diprediksi atau
dijelaskan oleh seperangkat faktor yang disebut traits, laten traits,atau abilitas.
Hubungan antara kinerja subjek suatu butir dan seperangkat kemampuan laten yang
menjadi dasarnya untuk dapar digambarkan oleh suatu kurva karakteristik butir
(ICC) (Hambleton, dkk. 1991). IRT disebut juga kerangka kerja yang popular dan
bermanfaat untuk membuat model data uji pendidikan dan psikologis, karena sifat
– sifat yang menarik seperti invariance item dan menguji nilai parameter serta
memeriksa parameter yang dilaporkan ada skala umum.
Pemodelan IRT mempertimbangkan perilaku peserta tes pada level item,
bukan pada level tes. Pemodelan pada tingkat item menciptakan banyak
fleksibilitas untuk diterapkan dalam pengambangan tes, studi perbandingan fungsi
item, pengujian komputer adaptif, pelaporan skor, dan sebagainya. Model IRT pada
awalnya dikembangkan untuk menangani tanggapan dikotomi yakni tanggapan
atau respon yang terdiri dari 2 kategori dengan skor 0-1. Tetapi, saat ini model
tersedia untuk menangani hampir semua jenis data pendidikan dan psikologis (Van
der Linden & Hambleton 1997 dalam Diputera, 2018).

7
B. Persyaratan dan Hakikat pada Teori Respons Butir

Menurut Dali S.Naga (1992), persyaratan dan hakikat pada IRT, yaitu:

1. Unidimensi (mengukur satu dimensi)

Pada umumnya, IRT mensyaratkan bahwa setiap butir hanya mengukur satu
ciri di kalangan peserta, meskipun belakangan ini berkembang IRT Multidimensi.
Namun IRT dapat dibatasi pada butir unidimensi sehingga unidimensi inilah yang
menjadi salah satu syarat pada butir itu. Persyaratan butir unidimensi ditujukan
untuk mempertahankan invariansi pada IRT. Jika suatu butir tes mengukur lebih
dari satu dimensi, maka jawaban terhadap butir itu merupakan kombinasi dari
berbagai kemampuan peserta. Akibatnya kita tidak lagi mengetahui kontribusi dari
setiap kemampuan terhadap jawaban peserta. Misalnya suatu tes bertujuan untuk
mengetahui kemampuan fisika pada materi tertentu. Jika kita tidak hati-hati dalam
mengkonstruksi butir, selain mengukur fisika, butir juga bisa mengukur
kemampuan berbahasa karena butir diungkapkan melalui bahasa. Sekiranya siswa
memberi jawaban salah, maka kita tidak lagi mengetahui apakah kesalahan
disebabkan oleh kemampuan peserta di bidang fisika atau di bidang bahasa.

Adanya syarat unidimensi, menyebabkan dibutuhkan cara untuk menentukan


apakah suatu butir itu unidimensi atau tidak. Salah satu cara tersebut adalah
menggunakan analisis faktor. Analisis ini dapat menunjukkan di rumpun mana
suatu butir tes itu terletak.

2. Parameter

Dalam penilaian IRT terdapat 3 unsur utama, yaitu: butir, peserta, dan respon
(jawaban) peserta terhadap butir. Ketiga fungsi ini berhubungan sehingga
menghasilkan fungsi atau juga lengkungan responsi atau lengkungan karakteristik
butir. Hubungan tersebut dapat ditafsirkan sebagai berikut: Ada satu butir (misal
butir ke-j) direspon oleh sejumlah peserta. Respon para peserta terhadap butir itu

8
ditentukan oleh ciri butir dan ciri peserta. Dalam hubungan ini, ciri peserta
dinyatakan melalui parameter ciri peserta (𝜃); ciri butir dinyatakan melalui tiga
parameter butir 𝑎, 𝑏, 𝑐; serta respon peserta terhadap butir itu dinyatakan dalam
bentuk probabilitas jawaban benar P(𝜃). Dengan demikian, untuk butir ke-j,
hubungan itu dapat ditulis sebagai berikut:

Pj(𝜃) = 𝜑 (𝜃, 𝑎𝑗 , 𝑏𝑗 , 𝑐𝑗 )

Parameter 𝜃 sebagai ciri peserta dapat memiliki berbagai wujud sesuai


dengan keperluannya. Di dalam suatu keperluan, 𝜃 berwujud kemampuan
akademik dari peserta, dalam keperluan lain berwujud sikap peserta, demikian
seterusnya. Namun, dalam makalah ini, 𝜃 berwujud kemampuan akademik peserta.
Parameter ɑ pada butir melambangkan daya beda, b melambangkan tingkat
kesukaran, dan c melambangkan faktor tebakan semu (pseudo-guessing). Respon
(jawaban) peserta terhadap butir dinyatakan dalam bentuk probabilitas benar.
Probabilitas jawaban benar ini diturunkan dari banyaknya peserta yang menjawab
benar terhadap banyaknya keseluruhan peserta yang menjawab butir itu. Dengan
demikian, nilai respon benar dari peserta terhadap butir itu terletak di antara 0 dan
1. Di dalam setiap model IRT, selalu terdapat parameter 𝜃 dan probabilitas jawaban
benar Pj(𝜃), namun tidak selalu memiliki ketiga parameter butir sekaligus.

3. Subpopulasi

Parameter ciri peserta 𝜃 di dalam karakteristik butir membentuk suatu


kontinum (rangkaian). Bentangan kontinum ini tidak dibatasi, kesemuanya
tergantung pada ukuran ciri peserta yang terdapat pada para peserta masing-masing.
Seluruh peserta yang mengerjakan tes merupakan populasi peserta. Biasanya IRT
menuntut agar ukuran peserta tidaklah terlalu kecil. Pada umumnya, model 2P
menuntut ukuran populasi peserta yang lebih besar daripada yang dituntut oleh
model 1P, dan model 3P menuntut ukuran populasi peserta yang lebih besar
daripada yang dituntut oleh model 2P. Ukuran populasi yang kecil akan
menghasilkan nilai estimasi parameter yang kurang cermat, dan bahkan dalam

9
keadaan tertentu, ukuran populasi yang kecil sama sekali tidak memungkinkan
pelaksanaan pengestimasian nilai parameter. Ada cara pengestimasian pada model
tertentu yang menuntut ukuran populasi tidak kurang dari 500, bahkan dalam
prakteknya, ada orang yang sampai menggunakan populasi peserta hampir
mencapai 50.000 orang. Setiap peserta memiliki nilai 𝜃 tertentu. Karena jumlah
peserta cukup besar, maka pada suatu nilai 𝜃 tertentu terdapat lebih dari satu
peserta. Pada kontinum parameter 𝜃 ini, gugus peserta yang memiliki nilai 𝜃 yang
sama disebut subpopulasi. Oleh karena itu, para peserta di dalam subpopulasi yang
sama adalah homogen. Mereka semua memiliki probabilitas yang sama untuk dapat
menjawab butir tes itu dengan benar atau salah.

4. Independensi Lokal

Selain unidimensi, IRT juga mensyaratkan adanya independensi lokal.


Disini, lokal dimaksudkan sebagai letak pada suatu titik di kontinum ciri peserta 𝜃.
Pada prakteknya, titik pada kontinum peserta dapat berbentuk interval. Dan di
dalam titik atau di dalam interval parameter ciri peserta itu terhadap subpopulasi
yang homogen. Di samping homogen, syarat independensi lokal menentukan
bahwa semua peserta di dalam subpopulasi itu harus independen terhadap butir tes.
Ini berarti bahwa dengan independensi lokal, skor dari sejumlah butir tes yang
dijawab oleh subpopulasi yang sama, masing-masing haruslah independen. Dengan
demikian, skor dari satu butir tes tidak boleh ditentukan atau bergantung kepada
skor pada butir tes yang lain.

5. Invariansi Parameter

Melalui syarat pokok ini, kita menemukan bahwa fungsi atau lengkungan
responsi atau karakteritik butir adalah tetap atau tidak berubah sekalipun kelompok
peserta yang menjawab butir yang sama itu berubah-ubah. Dan untuk kelompok
yang sama, ciri mereka adalah tetap sekalipun butir yang mereka jawab berubah-
ubah.

10
C. Model Teori Respon Butir Dikotomi : Unidimensional
Dua asumsi itu yang telah dijelaskan sebelumnya, hanyalah cara yang
berbeda untuk mengatakan hal yang sama tentang data. Asumsi utama ketiga adalah
pemodelan hubungan antara sifat yang diukur dengan tes dan tanggapan item. Pada
makalah ini, penekanan dilakukan pada satu subtopik bahasan yaitu pemodelan IRT
berdasarkan tanggapan dikotomi jenis unidimensional yang membuat asumsi
berbeda tentang hubungan antara sifat yang diukur dengan tes dan tanggapan item.
Di dalam penentuannya, model respon atau karakteristik butir memerlukan
(Dali S.Naga, 1992:175) :
1. Bentuk matematika sebagai fungsi yang menghubungkan ciri peserta dengan ciri
butir melalui respon (jawaban) peserta terhadap butir.
2. Sejumlah parameter yang dapat mewakili ciri peserta dan ciri butir.
Menurut Hambleton & Swaminathan, (1985: 35), berdasarkan jenis data
yang diperoleh, ada beberapa model IRT yang dapat digunakan untuk
menganalisisnya, yaitu:
Tabel 1. Model-model Teori Respon Butir Berdasarkan Jenis Data
Model yang
No. Jenis Data Referensi
digunakan
1. Dichotomous Latent Linear Lazarsfeld & Henry (1968)
Perfect Scale Guttman (1944)
Latent Distance Lazarsfeld & Henry (1968)
One-, Two-, Three-
Parameter Normal Lord (1952)
Ogive
Birbaum (1957, 1958a, 1958b,
One-, Two-, Three- 1968), Lord & Novick (1968).
Parameter Logistic Lord (1980a), Rasch (1960),
Wright & Stone (1979)

11
Four-Parameter McDonald (1967), Barton &
Logistic Lord (1981)
2. Multicategory Nominal Respone Bock (1972)
Scoring Graded Respone Samejima (1969)
Partial Credit Model Master (1982)
3. Continous Continous Respone Samejima (1972)

Tabel 1 di atas menunjukan bahwa terdapat tiga jenis sistem penskoran


berdasarkan jenis data yang dimiliki, yang terdiri dari sistem penskoran
dichotomous, multicategory, dan continuous. Dari ketiga sistem tersebut,
pensekoran dichotomous adalah yang paling umum digunakan dalam bidang
penilaian pendidikan. Model ini sendiri memiliki bermacam-macam tipe seperti
true-false, short answer, sentence completion, dan matching items (Hambleton &
Swaminathan, 1985: 48). Dalam hal ini, dichotomous IRT models hanyalah cocok
untuk item yang memiliki dua kategori skor yang mungkin seperti kategori benar-
salah. Sedangkan, untuk item yang memiliki lebih dari dua kategori skor, model
yang sesuai ialah sistem penskoran multicategory. Sebagai contoh untuk model ini
ialah tes item yang memberikan kredit parsial, seperti pertanyaan essay yang
skornya diberi rating mulai dari nol hingga empat (0 – 4). Selain itu, model ini juga
dapat berupa item survei dengan tingkat respon yang beragam seperti sangat tidak
setuju, tidak setuju, setuju, atau sangat setuju. Sedangkan, sistem penskoran yang
terakhir yaitu continuous scoring system merupakan model yang jarang digunakan
serta kurang dikenal oleh para praktisi. Salah satu penyebab yang barangkali
menyebabkan ketidakpopulerannya ialah kekurangan software yang mudah diakses
untuk mengestimasi model parameternya.
Pada prinsipnya, IRT menggunakan distribusi normal. Namun
penghitungan menggunakan distribusi normal agak rumit, sehingga digunakanlah
distribusi logistik (Djemari Mardapi, 2012: 202).

12
Gambar 2. Perbandingan kurva distribusi normal dengan kurva distribusi logistik
(𝑥−𝜋)2
1 −
Distribusi Normal : N(0,1) = 𝑒 2𝜎2
√2𝜋𝜃2

1,7𝑒 −1,7𝑧
Distribusi Logistik : L(0,1,7) =
(1+𝑒 −1,7𝑧 )2

Besarnya peluang dicari pada luasan suatu distribusi itu, maka digunakanlah
integral. Pada distribusi logistik tidak ada tanda integral, sedangkan pada distribusi
normal memiliki tanda integral, sehingga lebih mudah menggunakan distribusi
logistik. Hal ini dapat dijelaskan dalam persamaan berikut:
𝑧 1 𝑧 2/
Distribusi Normal : ∫−∞ N(0,1) = ∫ 𝑒 −𝑧
√2𝜋 −𝜋
2 𝑑𝑧
𝑧 1
Distribusi Logistik : ∫−∞ L(0,1,7) =
1+𝑒 −1,7𝑧
Persamaan di atas menunjukkan bahwa integral distribusi logistik lebih
sederhana dibandingkan integral distribusi normal. Perbedaan integral dari kedua
distribusi tersebut lebih kecil dari 0,01. Asumsi yang digunakan adalah distribusi
normal, namun untuk memudahkan perhitungan, digunakan distribusi logistik.
Beda distribusi normal dan distribusi logistik paling kecil adalah jika simpangan
baku distribusi logistik sebesar 1,7; sehingga IRT cenderung menggunakan
distribusi logistik (Djemari Mardapi, 2012: 203).
Dengan menggunakan distribusi logistik, maka model pada IRT
berdasarkan jumlah parameter butirnya dibagi menjadi 4, yaitu one-parameter
logistic model (1PL), two-parameter logistic model (2PL), three-parameter logistic

13
model (3PL), dan four-parameter logistic model (4PL) (Hambleton &
Swaminathan, 1985: 34). Namun, dari keempat model tersebut model 1 PL, 2PL,
dan 3PL merupakan model yang umumnya digunakan. Ketiganya dibedakan
melalui jumlah parameter yang dimiliki masing-masing model sebagai pembentuk
fungsi respon item.
1. Model 1 PL
Model 1-PL adalah model IRT yang paling sederhana dimana hanya terdapat
satu item parameter. Parameter yang dimaksud ialah tingkat kesukaran item yang
dilambangkan dengan huruf b. Kurva karakteritik butir soal untuk model satu
parameter diberikan oleh persamaan:
Model Rumus matematis
𝑒 𝐷(𝜃−𝑏𝑖 )
1-PL 𝑃𝑖 (𝜃) = [1 + 𝑒 −𝐷(𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷(𝜃−𝑏𝑖 )

Dengan:
𝜃 : Tingkat kemampuan (ability) peserta tes
𝑃𝑖 (𝜃): Probabilitas peserta tes yang memiliki kemampuan 𝜃 dapat menjawab butir
i dengan benar
𝑏𝑖 : Indeks kesukaran butir ke-i
𝑒 : bilangan natural yang nilainya mendekati 2,718
D : faktor penskalaan yang harganya 1,7
Pada saat nilai b meningkat, ini berarti tingkat kesukaran item juga
meningkat. Pada saat skor kemampuan dari satu kelompok peserta ujian
ditransformasikan maka rata-ratanya ialah nol (0) dan standar deviasinya ialah satu
(1). Indeks tingkat kesukaran biasanya berkisar antara kira-kira -2,0 hingga +2,0
(Hambleton & Swaminathan, 1985: 36). Nilai yang semakin mendekati -2
menunjukkan karakteristik butir yang semakin mudah, dan nilai yang mendekati +2
menunjukkan karakteristik butir yang semakin sulit bagi peserta ujian. Dalam
model 1-PL, nilai b melambangkan tingkat kemampuan (θ) yang dituntut bagi 50%
kesempatan menjawab dengan tepat. Jadi, jika b = 0, maka kemungkinan jawaban
benar akan sama dengan 0,5 pada tingkat kemampuan θ = 0

14
Gambar 3 menunjukkan dua butir berbeda yang memiliki nilai berbeda. Nilai
b untuk butir 1 = -1 (𝑏1 = -1) dan nilai b untuk butir 2 = 1 (𝑏2 = 1). Perhatikan
bagaimana nilai b menentukan lokasi horizontal lokasi fungsi respon butir; saat
nilai b bertambah, fungsi respon butir bergerak ke kanan dan butir berubah menjadi
semakin sulit. Dalam situasi ini, butir 2 merupakan butir yang lebih sulit daripada
butir 1. Dengan demikian, pada setiap tahap kemampuan yang ada, peluang untuk
menjawab butir 1 dengan benar lebih tinggi daripada peluang menjawab butir 2
dengan benar. Perhatikanlah bahwa peluang merespon dengan tepat terhadap butir
1 = 0,5 pada tingkat kemampuan -1, seperti yang diharapkan yaitu b1 = -1.
Demikian juga peluang menjawab benar terhadap butir 2 =0,5 pada tingkat
kemampuan 1, seperti yang diharapkan yaitu b2 = 1 (lihat Gambar 2)

Gambar 3. Tingkat kesulitan butir 1 dan butir 2


Contoh kurva karakteristik butir yang dianalisis menggunakan model 1-PL
ditunjukkan oleh Gambar 4. Dalam gambar tersebut besarnya 𝑎=1 (konstanta),
sedangkan besarnya b=0,018 (Samsul Hadi, 2013).

Gambar 4. Kurva karakteristik butir soal dengan b=0,018

15
Contoh Model 1 PL :
Studi kasus: Soal Ujian Akhir Semester Tingkat Persiapan Bersama IPB Mata
Kuliah Fisika Tahun 2008/2009

Statistik nilai dugaan parameter kemampuan peserta ujian pada Tabel 3


menunjukkan rata-rata kemampuan peserta ujian sebesar 0,0083 dengan rentang
nilai dari -3,0491 sampai -3,3110. Sehingga tabel penyelesaiannya dapat diolah
menggunakan Microsoft Excel 2013, sebagi berikut.
Ɵ -3 -2 -1,5 -1 0 0,5 1,5 2 3
Nomor
Tingkat
soal Pi (Ɵ)
Kesukaran

1 0,551 0,002 0,013 0,030 0,067 0,282 0,478 0,834 0,922 0,985 P1 (Ɵ)
2 0,229 0,004 0,022 0,050 0,110 0,404 0,613 0,897 0,953 0,991 P2 (Ɵ)
3 0,474 0,003 0,015 0,034 0,075 0,309 0,511 0,851 0,930 0,987 P3(Ɵ)
4 0,45 0,003 0,015 0,035 0,078 0,318 0,521 0,856 0,933 0,987 P4(Ɵ)
5 0,754 0,002 0,009 0,021 0,048 0,217 0,394 0,780 0,893 0,979 P5 (Ɵ)
6 0,184 0,004 0,024 0,054 0,118 0,422 0,631 0,904 0,956 0,992 P6 (Ɵ)
7 0,236 0,004 0,022 0,050 0,109 0,401 0,610 0,896 0,953 0,991 P7 (Ɵ)
8 0,938 0,001 0,007 0,016 0,036 0,169 0,322 0,722 0,859 0,971 P8 (Ɵ)
9 0,396 0,003 0,017 0,038 0,085 0,338 0,544 0,867 0,939 0,988 P9 (Ɵ)
10 0,43 0,003 0,016 0,036 0,081 0,325 0,530 0,860 0,935 0,987 P10 (Ɵ)

Keterangan : Ɵ = tingkat kemampuan


Sehingga intepretasi grafik butir – butir soal adalah sebagai berikut.

16
17
Kurva Karakteristik 10 Butir Soal
1.2

1
Probability Correct

0.8

0.6
Butir 1
Butir 2
0.4 Butir 3
Butir 4
Butir 5
Butir 6
0.2 Butir 7
Butir 8
Butir 9
Butir 10
0
-3 -2 -1 0 1 2 3

Tingkat Kemampuan

Pada keseluruhan butir, tingkat kesulitan dapat diperhatikan dari lokasi


fungsi respon butir. Dalam kondisi 1PL, diketahui bahwa jika fungsi respon butir
bergerak ke kanan maka butir soal memiliki tingkat kesulitan yang lebih tinggi.
Pada Gambar Kurva Karakteristik 10 Butir soal diketahui bahwa soal nomor 8
memiliki tingkat kesulitan yang paling tinggi dan butir soal 6 memiliki tingkat
kesulitan butir paling rendah.

2. Model 2 PL
Model 2-PL memang memiliki keuntungan dalam hal kemudahan, namun
model itu kekurangan fleksibilitas yang membolehkan butir yang berbeda memiliki
fungsi respon butir dari kemiringan atau kecuraman yang berbeda. Model 2-PL
mengatasi keterbatasan model ini dengan menambahkan parameter kedua
(dilambangkan dengan a) yang mengontrol kemiringan fungsi respon butir.

18
Kurva karakteritik butir soal untuk model satu parameter diberikan oleh
persamaan:
Model Rumus matematis
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
2-PL 𝑃𝑖 (𝜃) = [1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )

Dengan:
𝜃 : Tingkat kemampuan (ability) peserta tes
𝑃𝑖 (𝜃): Probabilitas peserta tes yang memiliki kemampuan 𝜃 dapat menjawab butir
i dengan benar
𝑎𝑖 : Indeks daya pembeda butir ke-i
𝑏𝑖 : Indeks kesukaran butir ke-i
𝑒 : bilangan natural yang nilainya mendekati 2,718
D : faktor penskalaan yang harganya 1,7
Pada saat a meningkat, kemiringan fungsi respon butir juga meningkat.
Kemiringan fungsi respon butir merefleksikan seberapa baiknya kemampuan butir
untuk membedakan antara individu yang memiliki nilai kemampuan θ tinggi
ataupun rendah; ini dikenal sebagai daya beda atau parameter pembeda (OAERS,
n.d.). Biasanya rentang daya beda berada antara 0-2, atau nilai daya beda tidak akan
melebihi 2 (Hambleton & Swaminathan, 1985: 36). Artinya nilai a yang tinggi akan
menghasilkan kurva karakteristik butir yang sangat curam, sedangkan nilai a yang
rendah akan menciptakan kurva karakteristik butir yang naik secara bertahap
sebagai satu fungsi kemampuan. Tingginya daya beda sebuah butir merefleksikan
tingginya tingkat informasi yang diberikan oleh sebuah butir mengenai tingkat
kemampuan responden. Oleh sebab itu, nilai a adalah indikator dari berapa banyak
sebuah butir memberi informasi mengenai tingkat kemampuan peserta tes.
Adapun arti rentang nilai daya beda butir tes dapat dibedakan sebagai berikut
(Baker, 2001):
Label Verbal Rentang Nilai
Tidak ada 0
Sangat rendah 0,1 – 0,34

19
Rendah 0,35 – 0,64
Sedang 0,65 – 1,34
Tinggi 1,35 – 1,69
Sangat tinggi >1,70
Sempurna + tidak terbatas
Gambar 5 menunjukkan fungsi respon butir dari dua butir (butir 1 dan butir
2) yang memiliki nilai daya beda yang berbeda. Nilai a untuk butir 1=2,5 (a1 = 2.5)
dan nilai a untuk butir 2=1 (a2 = 1). Bagi kedua butir ini, nilai tingkat kesulitan b =
0. Perhatikan bahwa nilai daya beda a menentukan kemiringan fungsi respon butir;
saat a bertambah, fungsi respon butir menjadi lebih curam dan butir tersebut
menjadi butir dengan daya beda yang semakin tinggi. Dalam situasi ini, butir 1
memiliki daya beda yang lebih tinggi dari butir 2 sehingga butir itu memberikan
banyak informasi mengenai tingkat kemampuan peserta tes. Sehingga, butir dengan
daya beda yang lebih tinggi memiliki karakteristik psikometri yang lebih
diinginkan dibandingkan dengan butir yang memiliki nilai daya beda yang lebih
rendah (OAERS, n.d.).

Gambar 5. Daya beda butir 1 dan butir 2


Model 2-PL dan 1-PL merupakan bagian dari model 3-PL. Model 2-PL
merupakan kasus khusus dari 3-PL, yakni ketika c=0. Model 1-PL merupakan kasus
khusus dari 2-PL, yakni ketika 𝑎 =1 atau 𝑎 merupakan tetapan untuk keseluruhan
butir tes. Kurva karakteristik butir yang dianalisis dengan model 2-PL yang
memiliki 𝑎=0,527; b=1,531 ditunjukkan oleh Gambar 5.
Contoh 2 PL :

20
Studi kasus: Soal Ujian Akhir Semester Tingkat Persiapan Bersama IPB Mata
Kuliah Fisika Tahun 2008/2009.

Statistik nilai dugaan parameter kemampuan peserta ujian pada Tabel 4


menunjukkan rata-rata kemampuan peserta ujian sebesar 0,0153 dengan rentang
nilai dari -3,1029 sampai 3,4897. Sehingga tabel penyelesaiannya dapat diolah
menggunakan Microsoft Excel 2013, sebagai berikut.

Ɵ -3 -2,5 -2 -1,5 -1 0 1 1,5 2 2,5 3 3,5


Nomor Tingkat Daya
Pi (Ɵ)
soal Kesukaran Pembeda
1 0,551 0,6869 0,016 0,028 0,048 0,084 0,140 0,344 0,628 0,752 0,844 0,907 0,946 0,969
2 0,229 0,4545 0,076 0,108 0,152 0,208 0,279 0,456 0,645 0,728 0,797 0,853 0,895 0,926
3 0,474 0,8232 0,008 0,015 0,030 0,059 0,113 0,340 0,676 0,808 0,894 0,945 0,972 0,986
4 0,45 0,6364 0,023 0,039 0,066 0,108 0,172 0,381 0,645 0,757 0,842 0,902 0,940 0,964
5 0,754 0,4444 0,055 0,079 0,111 0,154 0,210 0,361 0,546 0,637 0,719 0,789 0,845 0,888
6 0,184 0,3081 0,159 0,197 0,242 0,293 0,350 0,476 0,605 0,666 0,721 0,771 0,814 0,850
7 0,236 0,4293 0,086 0,120 0,164 0,220 0,289 0,457 0,636 0,716 0,784 0,839 0,883 0,915
8 0,938 0,1869 0,222 0,251 0,282 0,315 0,351 0,426 0,505 0,545 0,584 0,622 0,658 0,693
9 0,396 0,4242 0,080 0,110 0,151 0,203 0,268 0,429 0,607 0,689 0,761 0,820 0,867 0,904
10 0,43 0,2222 0,215 0,248 0,285 0,325 0,368 0,459 0,554 0,600 0,644 0,686 0,725 0,761

Sehingga intepretasi grafik butir – butir soal adalah sebagai berikut.

21
Butir Soal 1 dan 2
1.200

Probabability Correct
1.000

0.800

0.600

0.400

0.200

0.000
-3 -2 -1 0 1 2 3
Tingkat kemampuan (Ɵ) butir soal 1
butir soal 2

Butir Soal 3 dan 4


1.200
probabability correct Pi (Ɵ)

1.000

0.800

0.600

0.400

0.200

0.000
-3 -2 -1 0 1 2 3
tingkat kemampuan (Ɵ)
butir soal 3
butir soal 4

22
Butir Soal 5 dan 6
1.000

probability corret Pi (Ɵ)


0.800

0.600

0.400

0.200

0.000
-3 -2 -1 0 1 2 3
tingkat kemampuan (Ɵ)

butir soal 5 butir soal 6

Butir Soal 7 dan 8


1.000
probability corret Pi (Ɵ)

0.800

0.600

0.400

0.200

0.000
-3 -2 -1 0 1 2 3
tingkat kemampuan (Ɵ)

butir soal 7 butir soal 8

23
Butir Soal 9 dan 10
1.000
0.900
probability corret Pi (Ɵ) 0.800
0.700
0.600
0.500
0.400
0.300
0.200
0.100
0.000
-3 -2 -1 0 1 2 3
tingkat kemampuan (Ɵ)
butir soal 9
butir soal 10

Kurva Karakteristik 10 Butir Soal (2PL)


1.2

1
Probabability Correct Pi (Ɵ)

0.8

0.6

0.4

0.2

0
-3 -2 -1 0 1 2 3
Tingkat Kemampuan (Ɵ)

Butir 1 Butir 2 Butir 3 Butir 4 Butir 5


Butir 6 Butir 7 Butir 8 Butir 9 Butir 10

24
Pada keseluruhan butir, banyak informasi yang dapat diperhatikan dari lokasi
fungsi respon butir. Dalam kondisi 2PL, diketahui bahwa jika fungsi respon butir
memiliki kemiringan yang diperngaruhi oleh daya beda dari setiap butir soal. Pada
Gambar Kurva Karakteristik 10 Butir soal di atas diketahui bahwa soal nomor 3
memiliki daya beda yang paling tinggi dengan melihat kecondongan slope S dari
fungsi respons butir dan butir soal 10 memiliki daya beda butir paling rendah.

Dalam situasi ini, butir 3 memiliki daya beda yang paling tinggi dari butir
lainnya sehingga butir itu memberikan banyak informasi mengenai tingkat
kemampuan peserta tes. Sehingga, butir dengan daya beda yang lebih tinggi
memiliki karakteristik psikometri yang lebih diinginkan dibandingkan dengan butir
yang memiliki nilai daya beda yang lebih rendah.

3. Model 3 PL
Model 3PL adalah model yang menambahkan parameter c, mewakili peluang
menebak jawaban. Dengan adanya indeks tebakan semu (pseudo-guessing) pada
model 3-PL, memungkinkan peserta yang memiliki kemampuan rendah
mempunyai peluang untuk menjawab butir soal dengan benar.
Kurva karakteritik butir soal untuk model satu parameter diberikan oleh
persamaan:
Model Rumus matematis
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
3-PL 𝑃𝑖 (𝜃) = 𝑐𝑖 + (1 − 𝑐𝑖 ) 𝑐𝑖 + (1 − 𝑐𝑖 )[1 + 𝑒 −𝐷𝑎𝑖(𝜃−𝑏𝑖) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )

Dengan:
𝜃 : Tingkat kemampuan (ability) peserta tes
𝑃𝑖 (𝜃): Probabilitas peserta tes yang memiliki kemampuan 𝜃 dapat menjawab butir
i dengan benar
𝑎𝑖 : Indeks daya pembeda butir ke-i
𝑏𝑖 : Indeks kesukaran butir ke-i
𝑐𝑖 : Indeks tebakan semu (pseudo-guessing) butir ke-i

25
𝑒 : bilangan natural yang nilainya mendekati 2,718
D : faktor penskalaan yang harganya 1,7
Nilai c merefleksikan nilai terendah dari fungsi respon butir saat kemampuan
menjadi sangat rendah (dikenal sebagai asimtot fungsi respon butir). Jadi, jika c =
0,2, maka peluang menjawab benar bagi individu dengan kemampuan yang sangat
rendah ialah 0,2. Karena nilai c merefleksikan hasil perilaku menebak jawaban, hal
ini disebut dengan parameter pseudo-guessing. Indeks tebakan semu pada tes
pilihan ganda terletak di sekitar seperbanyaknya pilihan jawaban. Misalnya pada
tes dengan pilihan 4 jawaban, maka nilai 𝑐𝑖 terletak di sekitar ¼ atau 0,25 (Dali S.
Naga, 1992: 224).
Gambar 7 menunjukkan fungsi respon butir dari dua butir berbeda (butir 1
dan butir 2) yang memiliki nilai c yang berbeda; nilai c untuk butir 1 ialah 0 (c1 =
0) dan nilai c untuk butir 2 ialah (c2 = 0.2). Namun, nilai c2 = 0.2 untuk butir 2
menyebabkan batas bawah fungsi respon butir 2 menjadi lebih tinggi daripada butir
1, mengindikasikan adanya perilaku menebak di butir 2. Pada saat nilai tingkat
kesukaran b mewakili tingkat kemampuan pada peluang menjawab benar ialah 0,5
di bawah model 1-PL dan model 2-PL, hal yang sama tidak terjadi di bawah model
PL ketika c > 0. Gambar 6 mendemonstrasikan hal ini, dimana peluang menjawab
benar sama dengan 0,5 pada taraf kemampuan θ = b1 (ingat bahwa c1 = 0), tetapi
peluang menjawab butir 2 dengan benar sama dengan 0,5 pada taraf kemampuan θ
< b2 (ingat bahwa c2 = 0,2).

Gambar 7. Perilaku menebak di butir 2


Contoh kurva karakteristik butir soal yang dianalisis dengan model 3-PL yang
memiliki 𝑎=1,117; b=2,287; dan c=0,198 ditunjukkan pada Gambar 8. Gambar ini

26
menunjukkan bahwa probabilitas menjawab benar tidak berawal dari 0, tetapi
berawal dari 0,198. Jadi jawaban yang sifatnya tebakan mempunyai kemungkinan
benar 19,8%.

Gambar 8. Kurva karakteristik butir soal dengan 𝑎=1,117; b=2,287; dan c=0,198

Contoh 3 PL :
Studi kasus: Soal Ujian Akhir Semester Tingkat Persiapan Bersama IPB Mata
Kuliah Fisika Tahun 2008/2009.

Statistik nilai dugaan parameter kemampuan peserta ujian pada Tabel 5


menunjukkan rata-rata kemampuan peserta ujian sebesar -0,0760 dengan rentang
nilai dari -3,4655 sampai 3,4339. Sehingga tabel penyelesaiannya dapat diolah
menggunakan Microsoft Excel 2013, sebagi berikut.

27
Ө -3,5 -3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5

No
(ai) (bi) (ci) Pi (Ɵ)
Soal

1 0,551 0,687 0,551 0,560 0,565 0,573 0,585 0,602 0,628 0,662 0,706 0,756 0,808 0,857 0,898 0,931 0,954 0,970 P1 (Ɵ)
2 0,229 0,455 0,395 0,502 0,520 0,540 0,563 0,588 0,614 0,642 0,671 0,700 0,729 0,758 0,786 0,812 0,836 0,858 P2 (Ɵ)
3 0,474 0,823 0,474 0,490 0,497 0,508 0,523 0,544 0,572 0,609 0,653 0,703 0,756 0,807 0,853 0,892 0,922 0,945 P3(Ɵ)
4 0,45 0,636 0,450 0,472 0,482 0,496 0,515 0,540 0,572 0,612 0,659 0,711 0,763 0,813 0,857 0,893 0,923 0,945 P4(Ɵ)
5 0,754 0,444 0,754 0,756 0,757 0,760 0,764 0,773 0,787 0,810 0,843 0,881 0,919 0,949 0,971 0,984 0,991 0,995 P5 (Ɵ)
6 0,184 0,308 0,573 0,673 0,685 0,698 0,713 0,728 0,743 0,760 0,776 0,793 0,810 0,826 0,842 0,857 0,871 0,885 P6 (Ɵ)
7 0,236 0,429 0,368 0,476 0,495 0,517 0,541 0,567 0,596 0,626 0,657 0,688 0,720 0,751 0,780 0,808 0,834 0,857 P7 (Ɵ)
8 0,938 0,187 0,938 0,938 0,938 0,939 0,940 0,942 0,946 0,954 0,964 0,977 0,987 0,993 0,997 0,998 0,999 1,000 P8 (Ɵ)
9 0,396 0,424 0,396 0,436 0,451 0,470 0,495 0,526 0,563 0,607 0,655 0,706 0,756 0,803 0,845 0,880 0,909 0,932 P9 (Ɵ)
10 0,43 0,222 0,430 0,465 0,479 0,499 0,524 0,556 0,596 0,641 0,692 0,744 0,794 0,839 0,878 0,909 0,934 0,952 P10 (Ɵ)

Keterangan: ai = Daya Pembeda


bi = Tingkat Kesukaran
ci = Pseudo guessing
Ө = Tingkat Kemampuan
Pi (Ɵ) = Probability Correct

Sehingga intepretasi grafik butir – butir soal adalah sebagai berikut.


30
31
Nomor Batas
(%)
Soal Bawah

1 0.560 55.97
2 0.502 50.18
3 0.490 48.97
4 0.472 47.23
5 0.756 75.56
6 0.673 67.25
7 0.476 47.63
8 0.938 93.82
9 0.436 43.62
10 0.465 46.52

Pada keseluruhan butir, banyak informasi yang dapat diperhatikan dari lokasi
fungsi respon butir. Dalam kondisi 3PL, diketahui bahwa jika fungsi respon butir
memiliki nilai batas bawah yang diperngaruhi oleh nilai c (nilai psudo-guessing)
dari setiap butir soal. Pada Gambar Kurva Karakteristik 10 Butir soal di atas
diketahui bahwa soal nomor 9 memiliki nilai batas bawah yang paling kecil dari
keseluruhan butir dengan butir soal 8 memiliki nilai batas bawah butir paling tinggi.

Dalam situasi ini, butir 9 memiliki nilai batas bawah yang paling kecil dari
keseluruhan butir dan hal ini memberikan informasi bahwa sedikitnya responden
melakukan perilaku menebak jawaban pada butir tersebut. Sedangkan butir soal 8,
memiliki nilai batas bawah yang paling tinggi mengindikasikan peluang perilaku
menebak pada butir ini sangat besar. Hal ini pula dapat diperhatikan dalam bentuk
porsentase tebakan menjawab benar butir soal nomor 8 lebih besar dari keseluruhan
butir soal.

4. Model 4 PL
Model empat parameter, yaitu untuk menganalisis data yang menitikberatkan
pada parameter tingkat kesukaran soal, daya beda soal, menebak, dan penyebab lain
(Hambleton dalam Depdiknas, 2010: 18). Hambleton & Swaminathan (1985: 48)
menyatakan melalui model 4-PL akan dijelaskan bahwa peserta didik yang

32
memiliki kemampuan tinggi tidak selalu menjawab soal dengan benar. Terkadang
mereka mengerjakan soal dengan sembrono, sehingga soal yang seharusnya
dijawab benar malah dijawab salah. Selanjutnya, dikarenakan indeks parameter
butir dan kemampuan peserta merupakan hasil estimasi, maka kebenarannya
bersifat probabilistik dan mengandung kesalahan pengukuran. Namun, karena
bebas dari group dependent dan item dependent, maka IRT dapat digunakan untuk
mengetahui karakteristik butir soal secara lebih meyakinkan dibandingkan dengan
teori tes klasik (Samsul Hadi, 2013).
Dibawah ini disajikan rumus untuk model 4 parameter logistik (Hambleton
& Swaminathan, 1985: 48) :
Model Rumus matematis
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
4-PL 𝑃𝑖 (𝜃) = 𝑐𝑖 + (𝛾𝑖 − 𝑐𝑖 ) 𝑐𝑖 + (𝛾𝑖 − 𝑐𝑖 )[1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )

Dengan:
𝜃 : Tingkat kemampuan (ability) peserta tes
𝑃𝑖 (𝜃): Probabilitas peserta tes yang memiliki kemampuan 𝜃 dapat menjawab butir
i dengan benar
𝑎𝑖 : Indeks daya pembeda butir ke-i
𝑏𝑖 : Indeks kesukaran butir ke-i
𝑐𝑖 : Indeks tebakan semu (pseudoguessing) butir ke-i
𝑒 : bilangan natural yang nilainya mendekati 2,718
D : faktor penskalaan yang harganya 1,7

33
BAB III
PENUTUP

Kesimpulan
Berdasaran pembahasan tentang pemodelan dalam teori respon butir atau
IRT di atas dapar diperoleh kesimpulan bahwa,
1. Model IRT pada awalnya dikembangkan untuk menangani tanggapan
dikotomi yakni tanggapan atau respon yang terdiri dari 2 kategori dengan skor
0-1. Tetapi, saat ini model tersedia untuk menangani hampir semua jenis data
pendidikan dan psikologis (Van der Linden & Hambleton 1997 dalam
Diputera, 2018). Dua asumsi mendasar dengan model IRT adalah
unidimensional dan local independen. Asumsi unidimensionalitas merujuk
pada abilitas yang diukur dalam suatu set soal adalah tunggal. Hal ini
diartikan bahwa dalam satu set soal atau ukuran tes (s) hanya satu sifat laten
(𝜃). Item soal yang disusun hanya mengukur satu dari kemampuan peserta
tes.
2. Dengan menggunakan distribusi logistik, maka model pada IRT berdasarkan
jumlah parameter butirnya dibagi menjadi 4, yaitu one-parameter logistic
model (1PL), two-parameter logistic model (2PL), three-parameter logistic
model (3PL), dan four-parameter logistic model (4PL) (Hambleton &
Swaminathan, 1985: 34). Namun, dari keempat model tersebut model 1 PL,
2PL, dan 3PL merupakan model yang umumnya digunakan. Ketiganya
dibedakan melalui jumlah parameter yang dimiliki masing-masing model
sebagai pembentuk fungsi respon item.
Dibawah ini disajikan rumus bagi masing-masing model parameter logistik
(Hambleton & Swaminathan, 1985: 48) :
Model Rumus matematis
𝑒 𝐷(𝜃−𝑏𝑖 )
1-PL 𝑃𝑖 (𝜃) = [1 + 𝑒 −𝐷(𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷(𝜃−𝑏𝑖 )

𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
2-PL 𝑃𝑖 (𝜃) = [1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )

34
𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
3-PL 𝑃𝑖 (𝜃) = 𝑐𝑖 + (1 − 𝑐𝑖 ) 𝑐𝑖 + (1 − 𝑐𝑖 )[1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )

𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )
4-PL 𝑃𝑖 (𝜃) = 𝑐𝑖 + (𝛾𝑖 − 𝑐𝑖 ) 𝑐𝑖 + (𝛾𝑖 − 𝑐𝑖 )[1 + 𝑒 −𝐷𝑎𝑖 (𝜃−𝑏𝑖 ) ]−1
1 + 𝑒 𝐷𝑎𝑖 (𝜃−𝑏𝑖 )

35
DAFTAR PUSTAKA

Dali S. Naga. (1992). Pengantar Teori Sekor pada Pengukuran Pendidikan. Jakarta:
Gunadarma.
Diputera, Artha Mahindra. 2018. Analisis IRT Menggunakan Wingen 3: Teori
Respons Butir & Aplikasinya. Ponorogo : Uwais Inspirasi Indonesia
Hambleton, R. K., Swaminathan, H., & Rogers, J. H. (1991).Fundamentals of Item
Respone Theory. California: SAGE PUBLICATIONS
Mardapi, Djemari. 2012. Pengukuran, Penilaian, dan Evaluasi Pendidikan.
Yogyakarta: Nuha Litera
Naga, Dali S.. 1992. Pengantar Teori Sekor pada Pengukuran Pendidikan. Jakarta:
Gunadarma.
Office of Assessment, Evaluation, & Research Services (OAERS). Overview of
item response theory. Diambil dari http://erm.uncg.edu/oaers/methodology-
resources/item-response-theory/
Samsul Hadi. (2013). Pengembangan Computerized Adaptive Test Berbasis Web.
Yogyakarta: Aswaja Pressindo.
Sumintono, B, & Widhiarso, W. (2013). Aplikasi Model Rasch untuk Penelitian
Ilmu-ilmu Sosial. Cimahi: Trim Komunikata Publishing House.

36

Anda mungkin juga menyukai