Anda di halaman 1dari 46

ESTIMASI

PARAMETER
BUTIR
Teori dan Praktik

● Andrea Vicky (18701251032) ● Ferry Desnita (20701251008) ● Jumini (20701251011)


2. 3. 4.
Tujuan Konsep dan Estimasi Parameter
Kriteria Parameter Butir Dikotomus 5.
1. Butir dan
Estimasi Parameter
Interpretasinya
Latar Butir Politomus dan
Belakang Interpretasinya
OUTLINE PRESENTASI
Latar Belakang

Tes adalah sebuah perangkat evaluasi yang


merupakan prosedur yang sistematis berupa
keterangan, kumpulan, dan interpretasi guna
mengukur kemampuan, pemahaman, dan kinerja
peserta tes mengenai apa yang mereka telah
pelajari dalam proses pembelajaran dan untuk
mendapatkan penilaian (Brown dalam UKEssays,
2018; Azwar, 2005; Nitko, 1983).
Latar Belakang
(lanjutan)

Keberhasilan proses belajar dan mengajar dapat


dilihat dari hasil sebuah tes.

Tes yang baik mampu memberikan hasil ukur yang


cermat dan akurat yang ditentukan oleh kualitas
butir-butirnya.
Latar Belakang
(lanjutan)

Pada analisis butir tipe objektif, kualitas butir juga


dilihat dari:
- tingkat kesulitan,
- daya beda (daya diskriminasi),
- tebakan semu (pseudo-guessing), dan
- kecerobohan.
Latar Belakang
(lanjutan)
Kesimpulan mengenai kualitas butir akan membawa
kepada keputusan mengenai apakah butir itu
memenuhi syarat untuk dimasukkan ke dalam bank
soal.

Kelemahan estimasi butir tes dalam Teori Tes Klasik


dapat diatasi dengan estimasi butir menggunakan
Teori Respon Butir dengan beberapa parameter
logistik.
Tujuan:

1. Menjelaskan konsep parameter butir dalam Teori


Respon Butir dan kriterianya.

2. Menjelaskan langkah-langkah estimasi parameter


butir jenis dikotomus dan interpretasinya.

3. Menjelaskan langkah-langkah estimasi parameter


butir jenis politomus dan interpretasinya.
KONSEP DAN KRITERIA PARAMETER BUTIR
1. Tingkat Kesulitan
• Taraf kesulitan yang disimbolkan sebagai b atau bi
di dalam Teori Respon Butir.

• Dalam Teori Tes Klasik, tingkat kesulitan butir


didapatkan dari proporsi menjawab benar dari total
peserta tes, di mana semakin besar nilainya maka
butir tersebut semakin mudah. Sedangkan, dalam
Teori Respon Butir tingkat kesulitan didapatkan
berdasarkan hubungan kemampuan dengan peluang
menjawab benar.

• Memiliki beberapa istilah di antaranya threshold,


dan location di program yang berbeda.
KONSEP DAN KRITERIA PARAMETER BUTIR
1. Tingkat Kesulitan

• Parameter bi merupakan suatu titik pada skala


kemampuan agar peluang menjawab benar sebesar 50%
atau 0,5.

• Jika suatu butir memiliki bi sebesar -1, maka artinya


diperlukan kemampuan minimal -1 untuk dapat
menjawab benar butir tersebut dengan peluang 50%.
Semakin besar nilai bi maka butir tersebut semakin sulit
(Retnawati, 2016).
KONSEP DAN KRITERIA PARAMETER BUTIR
1. Tingkat Kesukaran
• Suatu butir dikatakan baik jika memiliki nilai bi berkisar
dari -2 hingga 2. Jika nilai bi kurang dari -2 maka tingkat
kesulitannya sangat rendah dan jika nilai bi lebih dari 2
maka tingkat kesulitannya sangat tinggi (Hambleton &
Swaminathan dalam Retnawati, 2014)
KONSEP DAN KRITERIA PARAMETER BUTIR
1. Tingkat Kesukaran
Tingkat kesulitan dapat diestimasi melalui
- model Rasch dan 1PL yang memuat parameter
tingkat kesulitan saja; atau,
- model 2PL yang memuat parameter tingkat
kesulitan, dan daya beda; atau
- model 3PL yang memuat parameter tingkat kesulitan,
daya beda, dan tebakan semu; atau,
- model 4PL yang memuat parameter tingkat kesulitan,
daya beda, tebakan semu, dan kecerobohan; atau
- model 3PLu yang memuat parameter tingkat
kesulitan, daya beda, dan kecerobohan, dan
- didasarkan pada uji kecocokan model.
2. Daya Beda

Merupakan kemampuan suatu butir soal untuk


membedakan peserta tes berkemampuan tinggi
dengan peserta tes berkemampuan rendah
(Istiyono, 2018; Anggreyani, 2009).

Istilah lain untuk daya eda adalah daya pembeda,


indeks diskriminan, dan slope.

Dalam persamaan model parameter logistik dan


item characteristic curve (ICC), parameter ini
disimbolkan dengan a.
2. Daya Beda

Parameter ai merupakan daya beda yang dimiliki butir ke-


i.

Pada kurva karateristik, ai merupakan kemiringan (slope)


dari kurva di titik bi pada skala kemampuan tertentu
(Retnawati, 2014).

Semakin tegak atau curam kurva karakteristik, maka butir


tersebut memiliki daya beda yang semakin besar.

Butir-butir yang memiliki daya beda yang sama akan


memiliki kurva yang sejajar.
2. Daya Beda

Secara teoritis, nilai ai terletak antara -∞ dan ∞.

Jika daya beda bernilai positif, maka semakin


tinggi kemampuan peserta tes, semakin tinggi pula
peluang menjawab benar butir tersebut, sehingga
kurva akan naik dari kiri ke kanan.

Sebaliknya, jika daya beda bernilai negatif, maka


semakin tinggi kemampuan peserta didik, peluang
menjawab benar semakin rendah, dan hal ini
ditunjukkan dengan kurva yang menurun dari kiri
ke kanan.
2. Daya Beda
Pada butir yang baik, nilai daya beda mempunyai
hubungan positif antara performa butir dengan
kemampuan yang diukur dan ai terletak antara 0
dan 2 (Retnawati, 2014; Hambleton &
Swaminathan, 1985).

Selain itu, butir memiliki kriteria baik jika daya


bedanya lebih dari 0,5 (Istiyono, 2018).

Daya beda diestimasi melalui model 2PL, 3PL,


4PL dan 3PLu di mana pemilihan model yang
digunakan untuk estimasi didasarkan pada uji
kecocokan model (Istiyono, 2018: 263).
Merupakan parameter faktor
3. Tebakan Semu kebetulan menjawab dengan benar
(pseudo guessing) di mana pada model 3PL nilainya
tidak sama dengan nol.

Hal tersebut berarti siswa yang berkemampuan sangat


rendah sekalipun mempunyai peluang untuk
menjawab benar (Istiyono, 2018).

Disimbolkan dengan c, namun


beberapa output hasil analisis
program komputer menyimbolkan
dengan g.
3. Tebakan Semu
Peluang menjawab benar butir ke-i
(pseudo guessing) dengan memberikan tebakan semu
dilambangkan dengan ci.
Parameter ini memberikan suatu kemungkinan asimtot
bawah yang tidak nol (non-zero lower asymtote) pada
kurva ICC dan berkisar antara 0 dan 1 (Retnawati, 2014).
Nilai ci ini memiliki sifat yang mirip dengan
konstanta dalam persamaan linier, dimana
jika variabel bebas bernilai 0 maka variabel
terikat masih memiliki nilai sebesar
konstanta tersebut.
3. Tebakan Semu Suatu butir dikatakan baik jika nilai ci tidak
(pseudo guessing) lebih dari 1/k di mana k adalah banyaknya
pilihan. Misal suatu butir soal obyektif
memiliki opsi atau pilihan sebanyak 5 opsi,
maka butir tersebut dikatakan baik jika nilai
ci tidak lebih dari 1/5 atau 0,2 (Hullin
dalam Retnawati, 2014).

Tebakan Semu diestimasi melalui model


3PL dan 4PL di yang didasarkan pada uji
kecocokan model.
4. Kecerobohan (carelessness)
Merupakan faktor yang membuat siswa dengan kemampuan tinggi mungkin
menjawab salah pada soal yang memiliki tingkat kesulitan di bawah
kemampuannya (Nurjanah, 2017; Magis, 2013).

Parameter/faktor ini menyebabkan asimtot atas (upper asymtote) pada kurva


ICC kurang dari 1.

Parameter kecerobohan disimbolkan dengan d, di mana nilainya berhubungan


dengan nilai asimtot atas yang disimbolkan dengan u.

u+d=1
4. Kecerobohan (carelessness)
Suatu butir soal dikatakan baik jika nilai u mendekati 1  semakin kecil
faktor kecerobohan maka butir tersebut semakin baik.

Parameter kecerobohan ini dapat diestimasi dengan model 4PL dan 3PLu di
mana pemilihan model didasarkan pada uji kecocokan model.
RANGKUMAN
Tingkat
  Daya Beda Tebakan Semu Kecerobohan  
Kesulitan
Simbol b a c atau g d  

Model yang dapat Rasch, 1PL, 2PL, 2PL, 3PL, 4PL, 3PL dan 4PL 4PL dan 3PLu  
digunakan untuk estimasi 3PL, 4PL, 3PLu dan 3PLu
Kriteria Baik -2 ≤ b ≤ 2 a > 0,5 c ≤ 1/k Mendekati 0
k= banyaknya  

opsi
Beberapa program Rasch = Program R, Quest, Rascal
komputer yang dapat 1PL = Program R, Rascal, Parscale
digunakan berdasarkan 2PL = Program R, Rsscal, Bilog, Parscale
model PL
3PL = Program R, Rascal, Bilog, Multilog, Parscale
4PL = Program R
3PLu = Program R
Estimasi Parameter Butir Dikotomus
dan Interpretasinya
dengan Program R
1. Siapkan file data yang akan dianalisa dalam excel.
2. Jalankan program R atau R studio dengan package yang akan dipakai telah terinstal.
3. Tentukan folder tempat bekerja dengan klik File  Change Directory.
4. Pilih folder yang digunakan (folder yang memuat data excel, sintaks R, dan nantinya akan
memuat output yang dihasilkan).
5. Buka sintaks analisis 4 PL di program R atau R Studio dengan cara klik File  Open Script
lalu pilih file sintaks R yang akan dipakai.
Pada jendela editor akan ditampilkan sintaks seperti di atas.
6. Klik ctrl+A kemudian klik Run atau dengan klik Run dari baris pertama sampai terakhir satu per
satu.
Pada bagian Console akan muncul beberapa output, salah satunya adalah tabel parameter a (daya
beda), b (tingkat kesukaran), g (tebakan semu) dan u (upper/asimtot atas, dimana kecerobohan
dapat dihitung dengan d = 1 – u).

Selain tabel parameter, muncul juga ICC per item di jendela lain.
Pada kedua output di slide sebelumnya, banyak butir yang tidak berkriteria “Baik”
karena tidak fit dengan model.

Untuk model 4PL, responden yang dibutuhkan berkisar 4 kali lipat dari 1 PL,
sehingga model 4PL ini akan lebih mudah fit jika jumlah responden di atas 1000
responden.

Hal ini senada dengan pernyataan Retnawati (2014) bahwa semakin banyak respon
peserta tes yang digunakan, semakin besar perolehan nilai khi-kuadrat sehingga
semakin besar pula peluang menolak hipotesis butir cocok dianalisis dengan model
3PL.
7. Interpretasi parameter butir dikotomus

Butir ke-6 memiliki nilai:

Daya beda (a) = 1,1695  kriteria butir “Baik”  > 0,5 dan dalam rentang 0 – 2  butir tes dapat
antara membedakan peserta dengan kemampuan tinggi dan dengan dengan
kemampuan rendah.

Tingkat kesukaran (b) = 0,4258  kriteria butir “Baik”  berada antara -2 dan 2
 kategori tingkat kesukaran -1 ≤ b ≤ 1  “Sedang” 
diperlukan kemampuan (θ) minimal 0,4258 untuk dapat menjawab
benar butir ini dengan peluang 50%.
Butir ke-6 memiliki nilai:

Tebakan semu (c/g) = 0,02  jika peserta tes yang tidak menggunakan kemampuannya sama
sekali (θ = -∞), maka peserta tes tersebut tetap memiliki peluang
menjawab benar sebesar 0,02 atau 2%.

Upper (u) = 0,997  sehingga kecerobohan (d) = 1 – 0,997 = 0,003  peserta tes yang memiliki
kemampuan paling tinggi sekalipun (θ = ∞) tetap ada peluang salah dalam
menjawab butir ini sebesar 0,003 atau 0,3% karena faktor kecerobohan.
 kriteria butir termasuk “Baik”  mendekati 0
Kesimpulan:

Berdasarkan Item Characteristic Curve (ICC) butir ke-6


membentuk kurva membentuk S dengan asimtot bawah
mendekati 0 dan asimtot atas mendekati 1.

Kurva cukup tegak dan tidak landai, yang mengisyaratkan


butir tersebut memiliki daya beda yang baik.

Di samping itu, jika kita tarik dari sumbu tegak (peluang


menjawab benar) pada titik 0,5 ke kanan sehingga bertemu
pada kurva lalu kita tarik ke bawah pada sumbu θ, maka akan
jatuh pada titik yang berada di antara -2 dan 2. Dengan
demikian, butir tersebut merupakan butir yang baik.
Estimasi Parameter Butir Politomus
dan Interpretasinya
dengan Program R
Model-model politomus pada teori respons butir antara lain:
- Nominal Respons Model (NRM),
- Rating Scale Model (RSM),
- Partial Credit Model (PCM),
- Graded Respons Model (GRM), dan
- Generalized Partial Credit Model (GCPM).

Model respons politomus dapat dikategorikan menjadi model respons butir nominal
dan ordinal, bergantung pada asumsi karakteristik tentang data (Retnawati, 2014).

PCM hanya mengukur satu parameter butir.


GPCM mengukur dua parameter, yaitu parameter lereng (ai) dan parameter
perpotongan garis (δi atau bi).
Paramater lereng adalah istilah lain untuk daya beda sedangkan parameter
perpotongan garis adalah istilah lain untuk tingkat kesukaran butir tahap yang
berkaitan dengan transisi dari satu kategori ke kategori berikutnya.

Model GRM juga memuat parameter daya beda dan tingkat kesulitan, akan tetapi
daya beda/nilai lereng untuk tiap kategori dalam satu butir disamakan (Istiyono,
2018).

Dalam model politomus, hubungan antara kemampuan dengan peluang menjawab


benar digambarkan dengan fungsi respon kategori atau Categorical Response
Function (CRF).
Langkah-langkah estimasi parameter butir untuk model PCM dengan Program R adalah sebagai
berikut.

1. Siapkan file data yang hendak hendak dianalisis, misal file berekstensi xlsx (file excel) dengan
susunan sebagai berikut.
2. Buka/jalankan Program R atau R Studio beserta packages yang akan digunakan.
3. Buka sintaks analisis PCM di program RStudio dengan cara klik Session  Set working
directory  Choose directory lalu pilih file sintaks R yang akan dipakai.
4. Maka akan tertampil sintaks seperti Berikut pada jendela editor.

Tertulis itemtype = “Rasch” karena


PCM merupakan perluasan dari
Rasch.
5. Untuk menjalankannya, bisa dengan klik ctrl+A kemudian klik Run atau dengan klik Run dari
baris pertama sampai terakhir satu per satu.
6. Pada bagian Console akan muncul output tabel parameter b (tingkat kesukaran),
dimana semua a = 1 hal ini karena model PCM hanya memuat satu parameter
saja yaitu tingkat kesukaran.

Kolom b1, b2, b3 menunjukkan tingkat kesulitan relatif tiap tahap.

Sedangkan location adalah tingkat kesulitan butir secara utuh.


7. Interpretasi parameter butir politomus model PCM

Butir ke-1 mempunyai nilai b1 = -2, 26


 artinya individu dengan tingkat kemampuan di  bawah 
-2, 26 memiliki probabilitas yang tinggi untuk memilih
kategori 0 dibandingkan dengan kategori 1.
Butir ke-1 mempunyai nilai b3 = 1, 195
 artinya individu dengan tingkat kemampuan di bawah 1,
195 memiliki probabilitas yang tinggi untuk memilih
kategori 2 dinbandingkan dengan kategori 3.
Butir ke-1 mempunyai nilai location -1,119  artinya
indeks kesukaran lokasi butir adalah -1,119.
Kesimpulan
Tes adalah sebuah perangkat evaluasi guna mengukur
kemampuan, pemahaman, dan kinerja peserta tes mengenai
apa yang mereka telah pelajari dalam proses pembelajaran dan
untuk mendapatkan penilaian.

Keberhasilan proses belajar dan mengajar dapat dilihat dari hasil


tes.

Kualitas tes sangat ditentukan oleh kualitas butir-butirnya yang


dapat dilihat dari beberapa parameter, yaitu indeks kesukaran,
indeks daya beda (daya diskriminasi), pseudo-guessing dan
kecerobohan yang dapat dilakukan dengan pendekatan Teori Tes
Klasik maupun Teori Respon Butir.
Kesimpulan
Estimasi dalam Teori Respon Butir meliputi estimasi 1PL untuk
mengukur tingkat kesulitan butir, 2PL untuk mengukur tingkat
kesulitan dan daya beda butir, 3PL untuk mengukur tingkat
kesulitan, daya beda, dan tebakan semu butir, 4PL untuk
mengukur tingkat kesulitan, daya beda, tebakan semu, dan
kecerobohan butir, dan 3PLu untuk mengukur tingkat kesulitan,
daya beda, dan kecerobohan butir.

Model untuk mengukur butir dengan jenis respon dikotomus:


Program R, Quest, Rascal, Bilog,Multilog, dan Parscale.

Model untuk jenis respon politomus dapat menggunakan model


Nominal Respons Model (NRM), Rating Scale Model (RSM), Partial
Credit Model (PCM), Graded Respons Model (GRM) dan
Generalized Partial Credit Model (GCPM).
TERIMA KASIH

Anda mungkin juga menyukai