Anda di halaman 1dari 6

Nama : Dwi Noviyanti

NIM : 1810211012

Tugas EPB
1. Buatlah contoh cara menghitung tingkat kesukaran soal
Jawab:
Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan rumus sebagai
berikut:
TK = U + L
             T
Keterangan:
U = jumlah siswa yang termasuk kelompok pandai (upper group)yang menjawab benar
untuk tiap soal.
L =  jumlah siswa yang termasuk kurang (lower group) yang menjawab benar untuk tiap
soal.
T =  jumlah siswa dari kelompok pandai dan kelompok kurang(jumlah upper group dan
lower group)
Misalkan suatu tes yang terdiri atas N soal yang diberikan kepada 40 siswa. Dari hasil tes
tersebut, tiap-tiap soal dianalisis taraf kesukarannya. mula-mula hasil tes itu kita susun
kedalam peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa kelompok
pandai), dan 10 lembar jawaban siswa dari kelompok yang kurang pandai. Kemudian kita
tabulasikan. Misalkan dari tabulasi soal kita peroleh hasil sebagai berikut: yang
menjawab benar dari kelompok pandai ada 9 siswa, dan yang menjawab benar dari
kelompok kurang pandai ada 4 siswa.
Dengan menggunakan rumus diatas, maka taraf kesukaran atau TK dari soal adalah:
TK =  U + L  =  9 + 4  =  0,65 atau 65%
T             20 
Jadi dapat disimpilkan bahwa nilai dari TK atau tingkat kesukarannya adalah 65%.  
Sedangkan dalam bukunya Drs. H. Daryanto, rumus untuk mencari taraf kesukaran atau
indeks kesukaran adalah:
P = B
JS
Keterangan:
P =  indeks kesukaran.
B =  banyaknya siswa yang menjawab soal itu dengan benar.
JS =  jumlah seluruh siswa peserta tes.
Contoh:
Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40 siswa tersebut terdapat
12 siswa yang mampu mengerjakan soal no. 1 dengan benar. Maka berapa indeks
kesukarannya?
Jawab:
P = B   
JS
= 12
40
= 0,30
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai
berikut:
a) Soal dengan P 0,00 sampai 0,30 adalah soal sukar.
b) Soal dengan P 0,30 sampai 0,70 adalah soal sedang.
c) Soal dengan P 0,70 sampai 1,00 adalah soal mudah.

2. Buatlah contoh bagaimana menganalisis butir soal


Jawab:
Teori Klasik analisis butir soal dapat dilakukan dengan menghitung tingkat kesukaran,
daya beda. Untuk soal yang berbentuk pilihan ganda (multiple choice) dapat diteruskan
dengan menghitung proporsi respon testee terhadap option (pilihan) yang disediakan atau
dengan istilah lain dengan melakukan analisis terhadap berfungsi tidaknya distraktor /
pengecoh.
1. Tingkat Kesukaran
Tingkat kesukaran suatu item (butir soal) dinyatakan dalam bentuk indeks kesukaran
(diffculty index) yang disimbulkan dengan huruf P. Indeks kesukaran merupakan rasio
antara penjawab item dengan benar dan banyaknya penjawab item (testee yang
menjawab). Secara teoritik dikatakan bahwa P sebenarnya merupakan probabilitas
empirik untuk lulus item tertentu bagi sekelompok siswa tertentu. Indeks kesukaran item
tersebut dapat diformulasikan sebagai berikut: P = B/JS
Keterangan:
P = indeks kesukaran item
JSB = jumlah testee yang menjawab item dengan benar
JS = jumlah testee yang menjawab item.
Sebagai contoh, dari 100 siswa yang dikenai suatu tes, ternyata item nomor 1 dapat
dijawab benar oleh 65 orang di antara mereka, sedangkan selainnya 35 menjawab salah.
Maka item nomor 1 tersebut indeks kesukarannya (p) adalah 65 dibagi 100 = 0,65.
Indeks kesukaran item soal berkisar antara 0,00 hingga 1,00. Semakin mendekati angka
1,00 menunjukkan item soal tersebut semakin mudah. Dengan demikian nilai indeks
kesukaran item berlawanan arah dengan tingkat kesukaran, sehingga indeks tersebut lebih
tepat dikatakan sebagai indeks kemudahan dari pada indeks kesukaran. Namun sudah
menjadi kesepakatan (salah kaprah), meskipun nilai indeks berlawanan arah dengan
tingkat kesukaran tetap dikenal dengan istilah indeks kesukaran.
0,00 1,00
sukar / sulit mudah
Untuk menentukan taraf kesukaran yang ideal tergantung pada beberapa faktor, antara
lain: sifat hal yang diukur, interkorelasi antara item, tujuan khusus si perancang tes dan
sesebagainya. Apabila tujuab pengukuran itu adalah untuk pengukuran penguasaan
(mastery testing), maka indeks yang diinginkan adalah 1,00. Namun jika tujuan tes
hendak menyeleksi secara ketat terhadap sejumlah testee, maka diperlukan indeks
kesukaran yang
rendah (mendekati nol).
Namun demikian, mengingat pada umumnya tes juga bertujuan untuk mengetahui tingkat
perbedaan kemampuan (competence testing) testee, kebanyakan ahli berpendapat bahwa
tes yang terbaik adalah tes yang terdiri atas item-item soal yang mempunyai taraf
kesukaran sedang (cukup) dan rentang distribusi kesukarannya kecil, yakni item tes
dengan indeks kesukaran antara 0,30 sampai 0,70.
Item soal yang terlalu sulit dengan indeks kesukaran terlalu rendah (mendekati 0,00) dan
item soal yang terlalu mudah dengan indeks kesukaran tinggi (mendekati 1,00) secara
umum tidak banyak memberikan kontribusi keefektifan suatu tes. Hal ini disebabkan
butir soal tersebut tidak memiliki kemampuan untuk membedakan testee yang
berkemampuan tinggi dengan testee yang berkemampuan rendah. Item soal yang terlalu
mudah akan mampu dijawab benar oleh siswa yang memiliki kemampuan tinggi dan
rendah. Sebaliknya item soal yang terlalu sulit, kedua kelompok testee menjawab salah.
Dengan demikian daya diskrimansi item tersebut rendah atau tidak baik. Perlu diingat
bahwa besarnya harga P yang dihitung merupakan indeks kesukaran item soal bagi
seluruh kelompok testee, buka indeks kesukaran bagi masing-masing testee secara
individual. Taraf kesukaran bagi masing-masing testee adalah berbeda-beda dan kita
tidak tahu seberapa sulit atau seberapa mudah suatu item soal bagi siswa. Harga P yang
dihitung dalam kelompok hanya merupakan rata-rata indeks kesukaran bagi seluruh siswa
dalam kelompok itu. Apa yang kita ketahui adalah apabila testee mampu menjawab benar
suatu item soal berarti taraf kesukaran item tersebut lebih rendah dari pada taraf
kemampuannya dalam menjawab. Sebaliknya, apabila testee salah menjawab suatu item
soal berarti bahwa tingkat kemampuannya lebih rendah dari pada taraf kesukaran item
yang bersangkutan.
2. Daya Beda Item
Terdapat dua konsep “daya beda”, yang pertama adalah kemampuan suatu item soal
dalam membedakan antara siswa yang memiliki kemampuan tinggi / baik / good student
dengan siswa yang memiliki kemampuan rendah / poor student. Sementara konsep yang
kedua, daya beda item adalah tingkat kesesuaian antara item soal dengan keseluruhan
soal dalam membedakan antara mereka yang tinggi kemampuannya dan mereka yang
rendah kemampuannya dalam hal yang diukur oleh tes yang bersangkutan. Kedua konsep
tersebut didasarkan atas asumsi bahwa dalam suatu kelompok testee terdapat Kelompok
Tinggi dan Kelompok Rendah. Suatu item soal yang baik adalah item soal yang hanya
mampu dijawab benar oleh testee yang memang memiliki kemampuan (Kelompok
Tinggi). Kalau proporsi penjawab benar dari dua kelompok tersebut sama, berarti item
soal tersebut tidak mampu membedakan antara mereka yang berkemampuan tinggi dan
mereka yang kemampuan rendah. Apalagi bila suatu item soal ternyata justru dapat
dijawab benar oleh sebagian besar subyek Kelompok Rendah, sedangkan sebagian besar
subyek Kelompok Tinggi tidak banyak yang mampu menjawab dengan benar, maka hal
itu menunjukkan bahwa item soal tersebut menyesatkan karena daya diskriminasinya
terbalik (minus). Untuk menghitung Daya Beda antara testee Kelompok Tinggi dengan
testee Kelompok Rendah.
Untuk penghitungan indeks daya beda terlebih dahulu testee dipisahkan ke dalam
Kelompok Tinggi dan Kelompok Rendah. Pembagian kelompok ini didasarkan atas hasil
jawaban benar oleh testee terhadap keseluruhan tes. Testee diurutkan dari yang jumlah
jawaban benar tertinggi hingga jumlah jawaban benar terendah. Apabila jumlah seluruh
testee kurang dari 100, pengelompokan dapat dilakukan dengan membagi seluruh testee
menjadi dua (masing-masing kelompok 50 % = 50 testee). Sedangkan jika testee
berjumlah lebih dari 100, untuk memilih Kelompok Atas dapat diambil 27 % testee
teratas (rankingnya), dan untuk Kelompok Bawah diambil 27 % testee terbawah (ranking
dari bawah), masing-masing kelompok tersebut mewakili Kelompok Atas dan Bawah.
Besarnya indeks diskriminasi item soal merentang antara -1,00 hingga 1,00.
Indeks Daya Beda
Interpretasi
Negatif
Sangat jelek
0,00 – 0,20
Jelek (poor)
0,21 – 0.40
Cukup (satisfactory)
0,41 – 0,70
Baik (good)
0,71 – 1,00
Baik sekali (excellent)
Sementara itu, untuk menghitung daya beda butir soal pada konsep yang kedua, yakni
kesesuaian item dengan keseluruhan tes dalam membedakan antara mereka yang tinggi
kemampuannya dan mereka yang rendah kemampuannya, teknik yang dipergunakan
adalah dengan menggunakan teknik Korelasi Biserial dan teknik Korelasi Point Biserial.
Bagian esensial dalam rumus di atas adalah perbedaan antara kedua rata-rata dalam
perbandingan dengan simpangan baku. Makin besar perbedaan kedua rata-rata (Xb – Xs)
itu akan semakin tinggi korelasi biserial, dan berarti makin tinggi daya beda soal.
Teknik lain yang biasa digunakan untuk menghitung indeks diskriminasi adalah teknik
Korelasi Point-Biserial (biserial titik). Mana di antara kedua teknik tersebut yang hendak
dipergunakan, tergantung kepada pertimbangan yang mendasari pemilihan tersebut.
Sementara ahli lebih menyukai r pbis karena koefisen ini memberikan informasi yang
lebih dari pada yang diberikan r bis. Nilai r pbis terpengaruh oleh p yang harga
maksimumnya akan diperoleh kalau p = 0,50. Ini berarti bahwa koefisien ini cenderung
mengutamakan soal-soal yang mempunyai taraf kesukaran rata-rata. Dengan istilah lain
korelasi Point-Biserial merupakan kombinasi antara hubungan soal dengan kriteria serta
taraf kesukaran. Sementara kelompok ahli lain lebih menyukai menggunakan korelasi
Biserial karena ingin memperlakukan korelasi antara soal dengan kriteria bebas dari taraf
kesukaran.
Hubungan antara Tingkat Kesukaran dan Daya Beda Tingkat Daya Beda yang “tinggi”
pada umumnya berada pada Tingkat Kesukaran “sedang” ke atas. Sementara itu Tingkat
Kesukaran yang “tinggi” tidak selalu menunjukkan Daya Beda yang tinggi. Dapat terjadi
Tingkat Kesukaran menunjukkan “baik” atau “cukup” sementara Daya bedanya 0 (nol),
jika proporsi jawaban benar Kelompok Atas (tinggi) sama dengan proporsi jawaban
benar Kelompok Rendah (bawah). Bahkan dapat terjadi Tingkat Kesukaran “baik” ,
sementara Daya Bedanya “negatif” (minus), jika ternyata proporsi jawaban benar
Kelompok Rendah lebih besar dari pada proporsi jawaban benar Kelompok Tinggi.
3. Berfungsi Tidaknya Distraktor / Pengecoh
Analisis butir ini, sebagaimana telah dikemukakan penulis di awal bagian ini, hanya
berlaku untuk soal berbentuk pilihan ganda (multiplr choice). Dalam soal bentuk ini
alternatif jawaban (option) yang disediakan (kadang 3, 4 atau 5 pilihan) satu di antaranya
merupakan kunci jawaban sedangkan yang lainnya merupakan distraktor. Konsep dasar
dalam analisis ini adalah bahwa distraktor yang baik adalah distraktor yang mampu
mengecoh testee untuk memilihnya, sehingga manakala tidak ada satu pun di antara
testee yang memilihnya, maka dapat dikatakan distraktor atau pengecoh tersebut tidak
berfungsi. Berapa ukuran suatu distraktor telah berfungsi. Secara umum suatu distraktor
dikatakan telah berfungsi dengan baik manakala distraktor tersebut dipilih minimal 5 %
dari seluruh testee.

Anda mungkin juga menyukai