Oleh:
Ni Luh Putu Diani Nariyanti (1823011005)
Putu Mahendra Adi (1823011020)
I Dewa Made Krisna Yasa (1823011021)
Dosen Pengampu:
Prof. Dr. I Made Ardana, M.Pd
Om Swastyastu,
Puji syukur penulis panjatkan ke hadapan Tuhan Yang Maha Esa, karena
atas kehendak Beliau maka makalah ini dapat diselesaikan tepat pada waktunya.
Melalui kesempatan yang berbahagia ini, penulis mengucapkan terima kasih
yang kepada :
1. Prof. Dr. I Made Ardana, M.Pd selaku do sen pengampu mata kuliah
Evaluasi Pendidikan Matematika
2. Rekan-rekan mahasiswa Program Studi Pendidikan Matematika tahun
akademik 2018/2019, yang telah memberikan banyak informasi terkait
penulisan makalah ini, sehingga dapat diselesaikan tepat pada waktunya.
Penulis
i
DAFTAR ISI
ii
BAB I
PENDAHULUAN
1
1.2 RUMUSAN MASALAH
Berdasarkan latar belakang di atas dapat dirumuskan masalah antara lain
sebagai berikut ini:
a. Apa pengertian taraf kesukaran?
b. Bagaimana tehnik analisis taraf kesukaran?
c. Apa kriteria penafsiran taraf kesukaran?
d. Apa pengertian daya pembeda?
e. Bagaimana menghitung daya beda butir soal uraian?
f. Bagaimana menghitung daya beda butir soal pilihan ganda?
g. Bagaimana tindak lanjut terhadap butir soal setelah analisis daya beda?
h. Apa pengertian efektifitas pengecoh?
i. Bagaimana cara menentukan dan menghitung efektitifas pengecoh?
2
BAB II
PEMBAHASAN
3
sedang, dan sukar jumlahnya seimbang. Misalnya perbandingan antara soal
mudah, sedang, dan sukar dapat dibuat, 30% kategori mudah, 40% kategori
sedang, dan 30% kategori sukar. Kedua, menentukan kriteria soal, yaitu ukuran
untuk menentukan apakah soal tersebut termasuk mudah, sedang, atau sukar.
Dalam menentukan kriteria ini digunakan judgment (keputusan) dari guru
berdasarkan pertimbangan-pertimbangan tertentu (Sudjana, 2014). Oleh karena
itu, dalam menyusun soal guru harus memperhatikan kualitas soal yang akan
diberikan kepada peserta didiknya.
Fungsi taraf kesukaran butir soal biasanya dikaitkan dengan tujuan tes.
Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki taraf
kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang memiliki
taraf kesukaran tinggi/sukar,dan untuk keperluan diagnostik biasanya digunakan
butir soal yang memiliki taraf kesukaran rendah/mudah. Taraf kesukaran butir
soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan kegunaan bagi pengujian
dan pengajaran (Kusaeri & Suprananto, 2012).
Kegunaannya bagi guru adalah:
a. sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi
masukan kepada siswa tentang hasil belajar mereka
b. memperoleh informasi tentang penekanan kurikulum atau mencurigai
terhadap butir soal yang biasa.
Adapun kegunaannya bagi pengujian dan pengajaran adalah:
a. pengenalan konsep yang diperlukan untuk diajarkan ulang
b. tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah
c. memberi masukan kepada siswa
d. tanda-tanda kemungkinan adanya butir soal yang biasa
e. merakit tes yang memiliki ketepatan data soal..
Taraf kesukaran butir soal juga dapat digunakan untuk memprediksi alat
ukur itu sendiri (soal) dan kemampuan peserta didik dalam memahami materi
yang diajarkan guru. Misalnya satu butir soal termasuk kategori mudah, maka
prediksi terhadap informasi ini adalah seperti berikut.
4
a. pengecoh butir soal itu tidak berfungsi.
b. sebagian besar siswa menjawab benar butir soal itu; artinya bahwa
sebagian besar siswa telah memahami materi yang ditanyakan.
Bila suatu butir soal termasuk kategori sukar, maka prediksi terhadap
informasi ini adalah seperti berikut.
a. butir soal itu "mungkin" salah kunci jawaban.
b. butir soal itu mempunyai 2 atau lebih jawaban yang benar
c. materi yang ditanyakan belum diajarkan atau belum tuntas
pembelajarannya, sehingga kompetensi minimum yang harus dikuasai
siswa belum tercapai.
d. materi yang diukur tidak cocok ditanyakan dengan menggunakan bentuk
soal yang diberikan (misalnya meringkas cerita atau mengarang
ditanyakan dalam bentuk pilihan ganda).
e. pernyataan atau kalimat soal terlalu kompleks dan panjang.
Namun, analisis secara klasik ini memang memiliki keterbatasan, yaitu bahwa
taraf kesukaran sangat sulit untuk mengestimasi secara tepat.
5
Untuk menghitung taraf kesukaran soal bentuk objektif dapat digunakan
dengan rumus berikut (Arifin, 2012).
TK = Rumus 1
Keterangan:
WL = jumlah peserta didik yang menjawab salah dari kelompok bawah
WH = jumlah peserta didik yang menjawab salah dari kelompok atas
nL = jumlah kelompok bawah
nH = jumlah kelompok atas
Contoh Soal:
36 peserta didik SMP mengikuti Ujian Akhir Semester dalam mata pelajaran Ilmu
Pengetahuan Umum. Berdasarkan hasil ujian tersebut kemudian disusun lembar
jawaban peserta didik dari yang mendapat skor tertinggi sampai dengan skor
terendah. Selanjutnya, diambil 27% dari skor tertinggi yaitu 27% x 36 peserta
didik = 9,72 = 10 peserta didik (dibulatkan) dan 27% dari skor terendah yaitu 27%
x 36 peserta didik = 9,72 = 10 peserta didik (dibulatkan). Setelah diketahui jumlah
sampel kelompok atas dan kelompok bawah, kemudian membuat tabel untuk
mengetahui jawaban (benar atau salah) dari setiap peserta didik dalam kelompok
tersebut.
Tabel 1.1
Jawaban Benar-Salah dari Kelompok Atas
No. Soal
1 2 3 4 5 6 7 8 9 10
Peserta Didik
Ulwi 1 1 1 1 1 1 1 1 0 1
Umi 1 1 1 1 0 1 1 1 1 1
Kamal 1 1 1 1 1 1 1 1 1 0
Nadia 0 1 1 1 1 1 0 1 0 1
Alfa 1 1 0 1 1 1 1 1 0 1
Ulum 1 1 1 1 1 1 1 1 1 1
Utari 0 0 0 1 0 1 1 0 0 0
Aslih 0 0 0 1 1 0 0 0 1 0
Nafis 0 1 1 0 0 0 0 0 1 1
Darin 1 1 1 1 1 1 1 0 1 1
Tabel 1.2
Jawaban Benar-Salah dari Kelompok Bawah
No. Soal
1 2 3 4 5 6 7 8 9 10
Peserta Didik
Rahayu 1 1 1 1 1 1 1 0 1 0
Eko 0 0 1 0 0 0 1 1 1 0
Laila 1 0 0 0 1 1 0 1 0 1
Ulfa 0 0 1 0 0 0 1 1 1 0
6
Arin 0 1 0 0 1 1 0 1 1 1
Zuhriyah 1 1 1 1 1 1 1 0 0 1
Ali 1 1 0 0 0 1 0 0 0 0
Riza 0 0 0 1 0 1 0 1 1 0
Anis 0 0 0 0 0 0 1 0 0 1
Atania 0 0 0 1 0 1 0 1 0 1
2. TK = 7. TK =
3. TK = 8. TK =
4. TK = 9. TK =
5. TK = 10. TK =
Tabel 1.3
Klasifikasi Soal Berdasarkan Proporsi Tingkat Kesukarannya
7
2. Soal Bentuk Uraian
Cara menghitung taraf kesukaran untuk soal bentuk uraian adalah menghitung
beberapa persen peserta didik yang gagal menjawab benar atau ada dibawah batas
lulus (passing grade) untuk tiap-tiap soal (Arifin, 2012).
Mean
Tingkat kesukaran =
skor maksimum yang ditetapkan
Contoh Soal:
33 orang peserta didik di tes dengan lima soal bentuk uraian. Skor maksimum
ditentukan 10 dan skor minimum 0. Jumlah peserta didik yang memperoleh nilai
0-5 = 10 orang (berarti gagal), nilai 6 = 12 orang, dan nilai 7-10 = 11 orang.
Jadi, taraf kesukaran (TK) =
Taraf kesukaran 30,3 berada di antara 28 dan 72, berarti soal tersebut
termasuk sedang. Catatan: batas lulus ideal = 6 (skala 0-10).
8
indeks diskriminasi digunakan jika sesuatu soal “terbalik” menunjukkan kualitas.
Angka yang menunjukkan besarnya daya beda disebut Indeks Diskriminasi
berkisar antara 0,00 sampai 1,00. Akan tetapi pada indeks diskriminasi ini
mengenal/ ada tanda negatif (-) yakni -1,0 ------------0,0----------1,0 (semakin ke
kanan soal semakin baik, semakin ke kiri maka soal semakin jelek, sebab semakin
ke kanan siswa yang pandai semakin sulit/tidak bisa menjawab dan sebaliknya
siswa yang kurang pintar (kiri) bisa menjawab dengan asal-asalan). Butir soal tes
yang baik juga harus dapat menunjukan daya pembedanya. Sebagaimana
penuturan Arikunto di atas, “daya beda adalah kemampuan suatu soal untuk
membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa
yang kurang (berkemampuan Menurut Anastasi dan Urbina dalam Purwanto,
daya beda rendah berhubungan dengan derajad kemampuan butir membedakan
dengan baik prilaku pengambil tes dalam tes yang dikembangkan. Soal dapat
dikatakan mempunyai daya pembeda jika soal tersebut dapat dijawab oleh siswa
berkemampuan tinggi dan tidak dapat dijawab oleh siswa berkemampuan rendah.
Jika suatu soal dapat dijawab oleh siswa pintar maupun kurang, berarti soal
tersebut tidak mempunyai daya beda, demikian juga jika soal tersebut tidak dapat
dijawab oleh siswa pintar dan siswa kurang, berarti soal tersebut tidak baik sebab
tidak mempunyai daya pembeda.
Ada butir soal yang memiliki ciri-ciri dapat dijawab dengan betul oleh
kebanyakan responden berkemampuan tinggi, tidak dapat dijawab dengan betul
oleh kebanyakan responden dengan kemampuan rendah. Butir soal yang demikian
memiliki daya untuk membedakan responden berdasarkan kemampuan mereka.
Dan butir soal yang demikian memiliki parameter yang disebut sebagai daya
pembeda. Seperti yang telah dipaparkan daya pembeda adalah kemampuan suatu
soal untuk membedakan antara siswa yang berkemampuan tinggi dengan siswa
yang berkemampuan rendah.
Suatu perangkat alat tes yang baik harus bisa membedakan antara siswa
yang pandai, rata-rata, dan yang berkemampuan rendah. Karena dalam suatu kelas
biasanya terdiri dari ketiga kelompok tersebut, sehingga hasil evaluasinya tidak
baik semua atau sebaliknya, tidak buruk semua. Juga tidak sebagian besar baik
atau sebaliknya sebagian besar buruk, tetapi haruslah berdistribusi normal. Siswa
9
yang mendapat nilai baik dan siswa yang mendapat nilai buruk ada (terwakili)
meskipun sedikit, namun bagian terbesar berada pada hasil yang cukup.
Manfaat daya pembeda butir soal adalah seperti berikut ini.
1. Untuk meningkatkan mutu setiap butir soal melalui data empiriknya.
Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah
butir soal itu baik, direvisi, atau ditolak.
2. Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi atau
membedakan kemampuan siswa, yaitu siswa yang telah memahami atau
belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak
dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat
dicurigai "kemungkinannya" seperti berikut ini.
a) Kunci jawaban butir soal itu tidak tepat.
b) Butir soal itu memiliki dua atau lebih kunci jawaban yang benar
c) Kompetensi yang diukur tidak jelas
d) Pengecoh tidak berfungsi
e) Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang
menebak
f) Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada
yang salah informasi dalam butir soalnya.
Daya pembeda suatu butir soal dapat diketahui dengan cara melihat besar
kecilnya nilai indeks diskriminasi item. Indeks diskriminasi (DP) pada dasarnya
dihitung atas dasar pembagian testee ke dalam dua kelompok yakni kelompok atas
(the higher group) adalah kelompok testee yang tergolong memiliki kemampuan
tinggi dan kelompok bawah (the lower group) yaitu kelompok testee yang
tergolong memiliki kemampuan rendah.
Adapun cara untuk menentukan dua kelompok tersebut biasanya bervariasi,
misalnya dapat menggunakan median sehingga pembagian menjadi dua kelompok
terdiri atas 50% testee kelompok atas dan 50% testee kelompok bawah; dapat juga
dengan hanya mengambil 20% dari testee yang termasuk dalam kelompok atas
dan 20% lainnya diambil dari testee yang termasuk dalam kelompok bawah; dapat
juga menggunakan angka presentase lainnya. Namun pada umumnya para pakar
di bidang evaluasi pendidikan lebih banyak menggunakan presentase sebesar 27%
10
dari testee dalam kelompok atas dan 27% lainnya diambil dari testee kelompok
bawah telah menunjukkan kesensitifannya atau dengan kata lain cukup dapat
diandalkan.
Nilai dari indeks diskriminasi berkisar antara -1.00 sampai +1,00. Bagi
suatu soal yang dapat dijawab benar oleh siswa dengan kemampuan tinggi
maupun siswa dengan kemampuan rendah, maka soal itu tidak baik, demikian
pula jika semua siswa, baik pandai maupun bodoh tidak dapat menjawab dengan
benar, soal tersebut tidak baik karena keduanya tidak mempunyai daya pembeda.
Nilai indeks diskriminasi terbesar adalah 1,00. Indeks diskriminasi ini
tercapai jika seluruh kelompok atas dapat menjawab soal dengan benar,
sedangkan seluruh kelompok bawah menjawab dengan salah. Namun sebaliknya,
jika seluruh kelompok atas menjawab soal dengan salah, dan seluruh kelompok
bawah menjawab soal dengan benar maka indeks diskriminasi akan memiliki nilai
-1,00. Tetapi jika siswa kelompok atas dan siswa kelompok bawah sama-sama
menjawab benar atau sama-sama menjawab salah, maka soal tersebut mempunyai
nilai diskriminasi 0,00 karena tidak mempunyai daya pembeda sama sekali.
Berdasarkan pada hal tersebut, berikut ini diberikan tabel yang merupakan
patokan untuk nilai indeks diskriminasi yang pada umumnya digunakan untuk
menentukan suatu butir soal memiliki daya pembeda yang baik atau tidak.
11
Besarnya Nilai Indeks Klasifikasi Interpelasi
Diskriminasi (DP)
sekali.
Keterangan:
ΣH : Jumlah skor kelompok Atas
ΣL : Jumlah Skor kelompok bawah
N : Jumlah peserta tes (testee) pada kelompok atas atau
bawah
Scoremax : skor tertinggi butir soal
Scoremin : skor terendah butir soal
12
Berikut ini merupakan contoh menentukan daya pembeda butir soal uraian
Nomor Soal
1 2 3 4
siswa (skor maks 25) (skor maks 25) (skor maks 25) (skor maks 25)
A 25 25 22 15
kel. B 25 23 20 10
C 25 20 19 10
Atas
D 25 22 15 8
E 20 15 19 7
ΣU 120 105 95 50
F 25 15 15 4
G 25 20 10 5
kel
. H 25 22 7 7
Bawah I 25 23 18 4
J 20 21 10 0
ΣL 120 60 70 20
ΣU+ΣL 240 165 165 70
Mean 24 16.5 16.5 7
Berdasarkan data pada tabel di atas akan dicari indeks diskriminasi (daya
beda) butir soal dapat dihitung menggunakan rumus pertama di atas. Setelah
melakukan perihitungan untuk soal nomor 4, diperoleh daya pembeda sebesar 0,4
yang menunjukkan bahwa soal nomor 4 sudah memiliki daya pembeda yang baik.
Dengan menggunakan rumus kedua juga diperoleh hasilnya 0,4
13
Dengan menggunakan rumus yang kedua diperoleh pula besarnya nilai daya
pembeda adalah 0,4 yang menunjukkan bahwa soal tersebut telah memiliki daya
pembeda yang baik.
a. Rumus Pertama
Dalam menentukan daya pembeda suatu butir soal pilihan ganda dapat
dihitung dengan menggunakan persaman:
BA BB
DP P P
A B
(Arikunto, 2005: 213).
J J
A B
Dengan
DP : merupakan indeks daya pembeda
BA : banyaknya peserta tes kelompok atas yang menjawab soal dengan benar
BB : banyaknya peserta tes kelompok bawah yang menjawab soal dengan benar,
JA : banyaknya peserta tes kelompok atas
14
Contoh 4. Menentukan indeks diskriminasi suatu butir soal dengan
menggunakan
Nomor Soal
Total
No. Subjek 1 2 3 4 5 6 7 8 9 10
1. A 1 1 1 1 1 1 1 1 1 1 10
2. B 1 1 1 1 1 0 1 1 1 1 9
3. C 1 1 1 1 1 0 1 1 0 0 7
4. D 1 1 1 0 1 0 1 1 0 1 7
15
5. E 1 1 1 1 0 1 0 0 1 1 7
6. F 1 0 1 1 0 1 1 0 0 0 5
7. G 1 1 1 1 0 1 0 0 1 0 6
8. H 1 1 0 1 0 0 0 0 0 1 4
9. I 1 1 0 0 0 1 0 0 0 1 4
10. J 1 1 0 0 0 1 0 0 0 0 3
Jumlah 10 9 7 7 4 7 4 4 4 6 62
Jumlah
Kuadrat 10 9 7 7 4 7 4 4 4 6 430
Pada tabel tersebut skor total untuk setiap siswa telah diurutkan dari
skor tertinggi ke skor terendah.
A 10 F 5
16
B 9 G 6
C 7 H 4
D 7 I 4
E 7 J 3
JA = 5 JB = 5
A 1 1 1 1 1 1 1 1 1 1 10 Atas
B 1 1 1 1 1 0 1 1 1 1 9 Atas
C 1 1 1 1 1 0 1 1 0 0 7 Atas
D 1 1 1 0 1 0 1 1 0 1 7 Atas
E 1 1 1 1 0 1 0 0 1 1 7 Atas
17
F 1 0 1 1 0 1 1 0 0 0 5 Bawah
G 1 1 1 1 0 1 0 0 1 0 6 Bawah
H 1 1 0 1 0 0 0 0 0 1 4 Bawah
I 1 1 0 0 0 1 0 0 0 1 4 Bawah
J 1 1 0 0 0 1 0 0 0 0 3 Bawah
Jumlah 10 9 7 7 4 7 5 4 4 6 62
Jumlah
Kuadrat 10 9 7 7 7 7 5 4 4 6 430
Langkah ketiga, mencari atau menghitung BA, BB, PA, PB dan DP untuk 12
butir soal di atas. Untuk mencari DP digunakan rumus
18
Tabel 6. Intrepretasi daya pembeda butir soal pilihan ganda
Nomor
Butir
Soal BA BB JA JB BA/JA BB/JB DP Intrepretasi
Bertitik tolak dari hasil di atas sebanyak 9 butir soal dari 10 butir
soal yang ada telah memiliki daya pembeda yang memadai, sedangkan
1 soal belum memiliki daya pembeda seperti yang diharapkan.
19
b. Rumus Kedua (Korelasi Phi)
Dengan rumus kedua ini maka angka indeks diskriminasi item diperoleh
menggunakan teknik korelasi Phi (ø) dengan rumus sebagai berikut:
PH PL 2 pq
(Sudijono, 1996:
390-391)
dimana :
ø: angka indeks korelasi Phi, yang pada hal ini dianggap sebagai angka
indeks diskriminasi item.
PH : proportion of the higher group
PL : proportion of the lower group
2 : bilangan konstanta
p : proporsi seluruh testee yang jawabannya betul
q : proporsi seluruh testee yang jawabannya salah, dimana q = (1-p).
P P
H L
. Dalam menentukan nilai phi kita harus memperhatikan bahwa
2 pq
20
nilai PH = PA = BA/JA , sedangkan nilai PL = PB = BB/JB, kemudian
kita juga harus menentukan nilai p dan q. Analisis untuk menentukan
indeks diskriminasi dengan menggunakan korelasi phi disajikan pada
Tabel 7.
Nomor
1 2 3 4 5 6 7 8 9 10
A (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) 10 Atas
B (1) (1) (1) (1) (1) 0 (1) (1) (1) (1) 9 Atas
C Atas
1 1 1 1 1 0 1 1 0 0 7
D Atas
1 1 1 0 1 0 1 1 0 1 7
E Atas
1 1 1 1 0 1 0 0 1 1 7
F 1 0 1 1 0 1 1 0 0 0 5 Bawah
G 1 1 1 1 0 1 0 0 1 0 6 Bawah
H 1 1 0 1 0 0 0 0 0 1 4 Bawah
I 1 1 0 0 0 1 0 0 0 1 4 Bawah
J 1 0 1 0 0 1 0 0 0 0 3 Bawah
Jumlah
10 9 7 7 4 7 5 4 4 6 62
BA 5 5 5 5 5 5 5 5 5 5
BB 5 5 5 5 5 5 5 5 5 5
JA
5 5 5 5 5 5 5 5 5 5
21
JB 5 5 5 5 5 5 5 5 5 5
PH 1,0 1,0 1,0 0,8 1,0 0,4 0,8 0,8 0,6 0,8
PL 1,0 0,8 0,4 0,6 0,0 0,8 0,2 0,0 0,2 0,4
p 1,0 0,9 0,7 0,7 0,4 0,7 0,5 0,4 0,4 0,6
q 0,0 0,1 0,3 0,3 0,6 0,3 0,5 0,6 0,6 0,4
Nomor
PH PL P Q Phi Klasifikasi
22
Dengan menggunakan teknik korelasi phi, ternyata angka indeks
diskriminasi itemnya sedikit berbeda dengan angka indeks
diskriminasi item yang dihitung dengan menggunakan rumus pertama.
Hal ini memang dapat dipahami sebab menurut para ahli di bidang
evaluasi pendidikan angka indeks diskriminasi item yang diperoleh
dengan menggunakan teknik korelasi Phi itu sifatnya lebih teliti.
23
Jika kita bekerja secara cermat, perhitungan daya pembeda
dengan menggunakan kelompok atas dan kelompok bawah sebagai
sampel, mempunyai kelemahan. Kelemahannya adalah karena cara
ini tidak melibatkan kelompok tengah (middle group) sebanyak
46%. Tidak dilibatkannya kelompok tengah setidaknya akan
mencemari hasil analisis (bias). Untuk mengatasi kelemahan itu,
beberapa pakar evaluasi mengemukakan cara lain yaitu dengan
menggunakan teknik korelasi biserial titik (point biserial
correlation). Rumus yang digunakan untuk menghitung daya
pembeda butir soal tes pilihan ganda dengan teknik tersebut adalah:
2.2.4 Tindak Lanjut Terhadap Butir Soal Setelah Analisis Daya Beda
24
1. Ditelusuri untuk selanjutnya diperbaiki, dan setelah
diperbaiki dapat diajukan lagi dalam tes hasil belajar yang
akan datang; kelak item tersebut dianalisis lagi apakah daya
pembedanya meningkat ataukah tidak.
2.3.Efektivitas Pengecoh
2.3.1 Pengecoh (Distraktor)
25
Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta
didik yang menjawab salah. Sebaliknya, butir soal yang yang kurang baik,
pengecohnya akan dipilih secara tidak merata. Pengecoh dianggap bila jumlah
peserta didik yang memilih pengecoh itu sama atau mendekati jumlah ideal.
Suatu distraktor dapat diperlakukan dengan 3 cara:
1. Diterima, karena sudah baik.
2. Ditolak, karena tidak baik.
3. Ditulis kembali, karena kurang baik.
Kekurangannya mungkin hanya terletak pada rumusan kalimatnya
sehingga hanya perlu ditulis kembali, dengan perubahan seperlunya (Arikunto,
2010).
Cacatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci
jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian,
pengecoh tidak berfungsi.
Contoh :
50 orang peserta didik di tes dengan 10 soal untuk pilihan-ganda. Tiap soal
memilki 5 alternatif jawaban (a, b, c, d, dan e). Kunci jawaban (jawaban yang
benar) soal nomor 8 adalah c. Setelah nomor 8 diperiksa untuk peserta didik,
ternyata dari 50 orang peserta didik. 20 peserta didik menjawab benar dan 30
peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata, artinya
26
semua pengecoh secara merata ikut menyesatkan peserta didik. Perhatikan contoh
soal nomor 8 berikut ini:
Alternatif Jawaban a b c d e
Distribusi jawaban peserta didik 7 8 20 7 8
IP 93% 107% ** 93% 107%
Kualitas Pengecoh ++ ++ ** ++ ++
Keterengan:
** : kunci jawaban
++ : sangat baik
+ : baik
- : kurang baik
_ : jelek
__ : sangat jelek
Pada contoh di atas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan
107%. Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik
sebab semua pengecoh itu berfungsi. Jika pilihan jawaban peserta didik
menumpuk pada suatu alternatif jawaban, misalnya seperti berikut :
Alternatif Jawaban a b c d e
Distribusi jawaban peserta didik 20 2 20 8 0
IP 267% 27% ** 107% 0%
Kualitas Pengecoh ++ - ** ++ -
27
Untuk analisis pengecoh perlu dibuat tabel khusus agar setiap butir soal
diketahui berapa banyak peserta didik yang menjawab a, b, c dan seterusnya. Hal
ini tentu saja sangat memakan waktu dan tenaga. Jika diolah dengan komputer
dan data sudah dimasukkan dalam disket, pengolahan ini hanya memerlukan
waktu beberapa detik saja.
28
BAB III
PENUTUP
2.4 Simpulan
Berdasarkan uraian pembahasan tersebut di atas, maka dapa disimpulkan
bahwa taraf kesukaran adalah bilangan yang menunjukkan sukar atau mudahnya
suatu soal. Soal yang baik dan bermutu adalah soal yang memiliki taraf kesukaran
seimbang antara mudah, sedang, sulit. Untuk menafsirkan taraf kesukaran soal
dapat digunakan kriteria yaitu, jika jumlah peserta didik yang gagal mencapai
27% termasuk mudah, jika jumlah peserta didik yang gagal antara 28% sampai
dengan 72% termasuk sedang, dan jika jumlah peserta didik yang gagal 73% ke
atas termasuk sukar.
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang
pintar (berkemampuan rendah). Angka yang menunjukkan besarnya daya
pembeda disebut indeks diskriminasi, disingkat D. Indeks diskriminasi berkisar
antara 0,00 sampai 1,00. Angka yang menunjukkan besarnya daya beda disebut
Indeks Diskriminasi berkisar antara 0,00 sampai 1,00. Akan tetapi pada indeks
diskriminasi ini mengenal/ ada tanda negatif (-) yakni -1,0 ------------0,0----------
1,0 (semakin ke kanan soal semakin baik, semakin ke kiri maka soal semakin
jelek, sebab semakin ke kanan siswa yang pandai semakin sulit/tidak bisa
menjawab dan sebaliknya siswa yang kurang pintar (kiri) bisa menjawab dengan
asal-asalan). Butir soal tes yang baik juga harus dapat menunjukan daya
pembedanya. Manfaat daya pembeda butir soal diantaranya adalah untuk
meningkatkan mutu setiap butir soal melalui data empiriknya, dan untuk
mengetahui seberapa jauh setiap butir soal dapat mendeteksi atau membedakan
kemampuan siswa.
Distraktor yaitu suatu pola yang dapat menggambarkan bagaimana testee
menentukan pilihan jawabannya terhadap kemungkinan-kemungkinan jawab yang
telah dipasangkan pada setiap butir item. Butir soal yang baik, pengecohnya akan
dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya, butir
soal yang yang kurang baik, pengecohnya akan dipilih secara tidak merata.
29
Pengecoh dianggap bila jumlah peserta didik yang memilih pengecoh itu sama
atau mendekati jumlah ideal.
1.2 Saran
Guru sebaiknya lebih mampu meningkatkan diri dalam menganalisis tes
sehingga tes yang dibuat akan benar-benar mampu mengukur kemampuan
siswa serta dapat tepat sasaran.
30
DAFTAR PUSTAKA
31