Taraf Kesukaran, Daya Beda, Efektivitas Pengecoh

EVALUASI PENDIDIKAN MATEMATIKA
TARAF KESUKARAN, DAYA BEDA,

DAN EFEKTIVITAS PENGECOH
Oleh:
Ni Luh Putu Diani Nariyanti (1823011005)
Putu Mahendra Adi (1823011020)
I Dewa Made Krisna Yasa (1823011021)
Dosen Pengampu:
Prof. Dr. I Made Ardana, M.Pd
PROGRAM STUDI S2 PENDIDIKAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PENDIDIKAN GANESHA
2019
KATA PENGANTAR
Om Swastyastu,
Puji syukur penulis panjatkan ke hadapan Tuhan Yang Maha Esa, karena
atas kehendak Beliau maka makalah ini dapat diselesaikan tepat pada waktunya.
Melalui kesempatan yang berbahagia ini, penulis mengucapkan terima kasih
yang kepada :
1. Prof. Dr. I Made Ardana, M.Pd selaku do sen pengampu mata kuliah
Evaluasi Pendidikan Matematika
2. Rekan-rekan mahasiswa Program Studi Pendidikan Matematika tahun
akademik 2018/2019, yang telah memberikan banyak informasi terkait
penulisan makalah ini, sehingga dapat diselesaikan tepat pada waktunya.
Penulis menyadari bahwa makalah ini jauh dari sempurna karena

terbatasnya pengetahuan dan kemampuan yang penulis miliki. Oleh karena itu,
dalam kesempatan ini penulis mohon saran-saran yang bersifat membangun guna
kesempurnaan tugas ini, sehingga dalam pembuatan makalah selanjutnya
menjadi lebih sempurna.
Akhir kata penulis ucapkan terima kasih kepada semua pihak yang telah
banyak membantu penulis dalam menyelesaikan pembuatan makalah ini.
Om Shanti, Shanti, Shanti, Om
Denpasar, Maret 2019
Penulis
i
DAFTAR ISI
KATA PENGANTAR ...................................................................................... i

DAFTAR ISI .................................................................................................... ii
BAB I PENDAHULUAN .................................................................................. 1
1.1 Latar Belakang ..................................................................................... 1
1.2 Rumusan Masalah ................................................................................ 2
1.3 Tujuan .................................................................................................. 2
1.4 Manfaat ................................................................................................ 2
BAB II PEMBAHASAN .................................................................................. 3
2.1 Taraf Kesukaran ................................................................................... 3
2.1.1. Pengertian Taraf Kesukaran ........................................................ 3
2.1.2. Tehnik Analisis Taraf Kesukaran ................................................ 5
2.1.3. Kriteria Penafsiran Taraf Kesukaran ........................................... 8
2.2 Daya Beda ............................................................................................ 8
2.2.1 Pengertian Daya Pembeda.......................................................... 8
2.2.2 Daya Pembeda Butir Soal Uraian ............................................. 12
2.2.3 Daya Pembeda Butir Soal Pilihan Ganda ................................. 14
2.2.4 Tindak Lanjut Terhadap Butir Soal Setelah Analisis Daya Beda25
2.3 Efektifitas Pengecoh ........................................................................... 26
2.3.1 Pengecoh (Distraktor) .............................................................. 26
2.3.2 Cara Menentukan dan Menghitung Efektitifas Pengecoh.......... 27
BAB III PENUTUP ........................................................................................ 29
3.1 Simpulan ............................................................................................ 30
3.2 Saran .................................................................................................. 31
DAFTAR PUSTAKA
ii
BAB I
PENDAHULUAN
1.1 LATAR BELAKANG

Evaluasi merupakan salah satu komponen komponen penting dalam
pembelajaran. Melalui kegiatan evaluasi, guru akan dapat mengetahui tentang
informasi perkembangan siswanya diantaranya tingkat pencapaian tujuan, tingkat
penguasaan materi belajar, kekuatan, kelemahan siswa dalam belajar, serta
kekuatan-kelemahan guru dalam proses pembelajaran yang dikembangkan.
Walaupun evaluasi dianggap penting dan sudah merupakan pekerjaan rutin guru,
namun dalam kenyataan sehari-hari di lapangan sistem evaluasi dalam
pembelajaran bukan berarti tanpa persoalan. Berdasar pengamatan sepintas di
lapangan, beberapa persoalan tersebut paling tidak berkaitan dengan pemahaman
konsep dasar evaluasi, pelaksanaan dan pemanfaatannya, serta evaluasi program
pengajaran.
Dalam melakukan evaluasi, diperlukan alat yang dapat digunakan untuk
mengukur keberhasilan belajar dari para peserta didiknya (muridnya, siswa,
mahasiswa dan lain-lain). Alat pengukur dimaksud adalah tes hasil belajar, yang
sebagai mana telah kita maklumi, batang tubuhnya terdiri dari kumpulan butir-
butir soal (=item, tes). Dalam aplikasinya mempunyai fungsi dan peranan yang
sangat penting dalam hal untuk mengetahui tujuan yang ingin dicapai.
Alat yang digunakan untuk mengukur tersebut harus bermutu sehingga
dapat digunakan untuk mengukur sesuai tujuan yang hendak dicapai. Oleh sebab
itu alat (tes) tersebut perlu memiliki parameter item tes yang baik agar menjadi tes
yang bermutu sehingga akan mampu memberikan informasi yang setepat-
tepatnya. Analisis butir soal cara. Karakteristik item tes meliputi tingkat
kesukaran, daya pembeda, dan efektifitas pengecoh. Tingkat kesukaran soal dapat
digunakan untuk mengetahui tingkat kesulitan soal, apakah soal tesebut tergolong
mudah atau sukar. Sedangkan daya pembeda soal digunakan untuk membedakan
kelompok yang berkemampuan tinggi dan yang berkemampuan rendah.
1
1.2 RUMUSAN MASALAH
Berdasarkan latar belakang di atas dapat dirumuskan masalah antara lain
sebagai berikut ini:
a. Apa pengertian taraf kesukaran?
b. Bagaimana tehnik analisis taraf kesukaran?
c. Apa kriteria penafsiran taraf kesukaran?
d. Apa pengertian daya pembeda?
e. Bagaimana menghitung daya beda butir soal uraian?
f. Bagaimana menghitung daya beda butir soal pilihan ganda?
g. Bagaimana tindak lanjut terhadap butir soal setelah analisis daya beda?
h. Apa pengertian efektifitas pengecoh?
i. Bagaimana cara menentukan dan menghitung efektitifas pengecoh?
1.3 TUJUAN PENULISAN

Tujuan penulisan makalah ini disesuaikan dengan rumusan masalah yang
dijabarkan di atas antara lain :
a. Untuk mengetahui pengertian taraf kesukaran
b. Untuk mengetahui cara tehnik analisis taraf kesukaran
c. Untuk mengetahui kriteria penafsiran taraf kesukaran
d. Untuk mengetahui pengertian daya beda
e. Untuk mengetahui cara menghitung daya beda butir soal uraian
f. Untuk mengetahui cara menghitung daya beda butir soal pilihan ganda
g. Untuk mengetahui tindak lanjut terhadap butir soal setelah analisis daya beda
h. Untuk mengetahui pengertian efektifitas pengecoh
i. Untuk mengetahui cara menentukan dan menghitung efektifitas pengecoh
1.4 MANFAAT PENULISAN

Penulisan makalah ini diharapkan dapat memberikan manfaat bagi pembaca
maupun penulis untuk memperluas pengetahuan di dalam proses analisis tes dan
sebagai referensi di dalam penulisan makalah selanjutnya.
2
BAB II
PEMBAHASAN
2.1 TARAF KESUKARAN

2.1.1. Pengertian Taraf Kesukaran
Taraf kesukaran adalah bilangan yang menunjukan sukar atau mudahnya
suatu soal. (Arikunto, 1999: 207). Selain itu juga taraf kesukaran soal adalah
peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang
biasanya dinyatakan dalam bentuk indeks.
Menurut Allen dan Yen (1979:120) dalam buku yang dikutip oleh
Suwarto, “the item difficulty for item i, p is defined as the proportion of examinees
who get that item correct.” Artinya taraf kesukaran tes didefinisikan sebagai
proporsi peserta yang menjawab butir itu dengan benar. Apabila butir tes dijawab
dengan benar oleh semua peserta tes, berarti butir tes tersebut sangat mudah.
Sebaliknya apabila tidak ada peserta tes yang menjawab benar, berati butir tes
tersebut sangat sukar.
Perhitungan analisis taraf kesukaran soal adalah pengukuran seberapa
besar derajat kesukaran suatu soal. Suatu soal tes hendaknya tidak terlau sukar
dan tidak pula terlalu mudah (Arifin, 2012). Asumsi yang digunakan untuk
memperoleh kualitas soal yang baik disamping memenuhi validitas dan reabilitas,
adalah adanya keseimbangan dari taraf kesulitan soal tersebut. Keseimbangan
yang dimaksudkan adalah adanya soal-soal yang termasuk mudah, sedang, dan
sukar secara proporsional. Jika suatu soal memiliki taraf kesukaran seimbang
(proporsional), maka dapat dikatakan bahwa soal tersebut baik. Taraf kesukaran
soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawabnya,
bukan dilihat dari sudut pandang guru sebagai pembuat soal
Persoalan yang penting dalam melakukan analisis taraf kesukaran soal
adalah penentuan proporsi dan kriteria soal yang termasuk mudah, sedang, dan
sukar. Ada beberapa dasar pertimbangan dalam menentukan proporsi jumlah soal
kategori mudah, sedang, dan sukar. Pertimbangan pertama adalah keseimbangan,
yaitu jumlah soal sama untuk ketiga kategori tersebut. Artinya, soal mudah,
3
sedang, dan sukar jumlahnya seimbang. Misalnya perbandingan antara soal
mudah, sedang, dan sukar dapat dibuat, 30% kategori mudah, 40% kategori
sedang, dan 30% kategori sukar. Kedua, menentukan kriteria soal, yaitu ukuran
untuk menentukan apakah soal tersebut termasuk mudah, sedang, atau sukar.
Dalam menentukan kriteria ini digunakan judgment (keputusan) dari guru
berdasarkan pertimbangan-pertimbangan tertentu (Sudjana, 2014). Oleh karena
itu, dalam menyusun soal guru harus memperhatikan kualitas soal yang akan
diberikan kepada peserta didiknya.
Fungsi taraf kesukaran butir soal biasanya dikaitkan dengan tujuan tes.
Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki taraf
kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang memiliki
taraf kesukaran tinggi/sukar,dan untuk keperluan diagnostik biasanya digunakan
butir soal yang memiliki taraf kesukaran rendah/mudah. Taraf kesukaran butir
soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan kegunaan bagi pengujian
dan pengajaran (Kusaeri & Suprananto, 2012).
Kegunaannya bagi guru adalah:
a. sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi
masukan kepada siswa tentang hasil belajar mereka
b. memperoleh informasi tentang penekanan kurikulum atau mencurigai
terhadap butir soal yang biasa.
Adapun kegunaannya bagi pengujian dan pengajaran adalah:
a. pengenalan konsep yang diperlukan untuk diajarkan ulang
b. tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah
c. memberi masukan kepada siswa
d. tanda-tanda kemungkinan adanya butir soal yang biasa
e. merakit tes yang memiliki ketepatan data soal..
Taraf kesukaran butir soal juga dapat digunakan untuk memprediksi alat
ukur itu sendiri (soal) dan kemampuan peserta didik dalam memahami materi
yang diajarkan guru. Misalnya satu butir soal termasuk kategori mudah, maka
prediksi terhadap informasi ini adalah seperti berikut.
4
a. pengecoh butir soal itu tidak berfungsi.
b. sebagian besar siswa menjawab benar butir soal itu; artinya bahwa
sebagian besar siswa telah memahami materi yang ditanyakan.
Bila suatu butir soal termasuk kategori sukar, maka prediksi terhadap
informasi ini adalah seperti berikut.
a. butir soal itu "mungkin" salah kunci jawaban.
b. butir soal itu mempunyai 2 atau lebih jawaban yang benar
c. materi yang ditanyakan belum diajarkan atau belum tuntas
pembelajarannya, sehingga kompetensi minimum yang harus dikuasai
siswa belum tercapai.
d. materi yang diukur tidak cocok ditanyakan dengan menggunakan bentuk
soal yang diberikan (misalnya meringkas cerita atau mengarang
ditanyakan dalam bentuk pilihan ganda).
e. pernyataan atau kalimat soal terlalu kompleks dan panjang.
Namun, analisis secara klasik ini memang memiliki keterbatasan, yaitu bahwa
taraf kesukaran sangat sulit untuk mengestimasi secara tepat.
2.1.2 Teknik Analisis Taraf Kesukaran Soal

Menurut Zainal Arifin (2012), dalam menganalisis tingkat kesukaran soal
dibedakan menjadi dua jenis soal, yaitu:
1. Soal Bentuk Objektif
Langkah-langkah yang harus ditempuh terlebih dahulu sebelum menghitung
tingkat kesukaran soal sebagai berikut.
a. menyusun lembar jawaban peserta didik dari skor tertinggi sampai dengan
skor terendah.
b. mengambil 27% lembar jawaban dari atas yang disebut dengan kelompok
atas (higher group), dan 27% lembar jawaban dari bawah yang disebut
kelompok bawah (lower group). Sisanya sebanyak 46% disisihkan.
c. membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap
peserta didik, baik untuk kelompok atas maupun kelompok bawah. Jika
jawaban peserta didik benar diberi angka 1, jika jawaban peserta didik
salah diberi angka 0.
5
Untuk menghitung taraf kesukaran soal bentuk objektif dapat digunakan
dengan rumus berikut (Arifin, 2012).
TK = Rumus 1
Keterangan:
WL = jumlah peserta didik yang menjawab salah dari kelompok bawah
WH = jumlah peserta didik yang menjawab salah dari kelompok atas
nL = jumlah kelompok bawah
nH = jumlah kelompok atas
Contoh Soal:
36 peserta didik SMP mengikuti Ujian Akhir Semester dalam mata pelajaran Ilmu
Pengetahuan Umum. Berdasarkan hasil ujian tersebut kemudian disusun lembar
jawaban peserta didik dari yang mendapat skor tertinggi sampai dengan skor
terendah. Selanjutnya, diambil 27% dari skor tertinggi yaitu 27% x 36 peserta
didik = 9,72 = 10 peserta didik (dibulatkan) dan 27% dari skor terendah yaitu 27%
x 36 peserta didik = 9,72 = 10 peserta didik (dibulatkan). Setelah diketahui jumlah
sampel kelompok atas dan kelompok bawah, kemudian membuat tabel untuk
mengetahui jawaban (benar atau salah) dari setiap peserta didik dalam kelompok
tersebut.
Tabel 1.1
Jawaban Benar-Salah dari Kelompok Atas
No. Soal
1 2 3 4 5 6 7 8 9 10
Peserta Didik
Ulwi 1 1 1 1 1 1 1 1 0 1
Umi 1 1 1 1 0 1 1 1 1 1
Kamal 1 1 1 1 1 1 1 1 1 0
Nadia 0 1 1 1 1 1 0 1 0 1
Alfa 1 1 0 1 1 1 1 1 0 1
Ulum 1 1 1 1 1 1 1 1 1 1
Utari 0 0 0 1 0 1 1 0 0 0
Aslih 0 0 0 1 1 0 0 0 1 0
Nafis 0 1 1 0 0 0 0 0 1 1
Darin 1 1 1 1 1 1 1 0 1 1
Tabel 1.2
Jawaban Benar-Salah dari Kelompok Bawah
No. Soal
1 2 3 4 5 6 7 8 9 10
Peserta Didik
Rahayu 1 1 1 1 1 1 1 0 1 0
Eko 0 0 1 0 0 0 1 1 1 0
Laila 1 0 0 0 1 1 0 1 0 1
Ulfa 0 0 1 0 0 0 1 1 1 0
6
Arin 0 1 0 0 1 1 0 1 1 1
Zuhriyah 1 1 1 1 1 1 1 0 0 1
Ali 1 1 0 0 0 1 0 0 0 0
Riza 0 0 0 1 0 1 0 1 1 0
Anis 0 0 0 0 0 0 1 0 0 1
Atania 0 0 0 1 0 1 0 1 0 1
Jadi, dapat dihitung tingkat kesukaran setiap soal menggunakan rumus 1

sebagai berikut
1. TK = 6. TK =
2. TK = 7. TK =
3. TK = 8. TK =
4. TK = 9. TK =
5. TK = 10. TK =
Berdasarkan perhitungan tersebut, maka dapat diketahui klasifikasi taraf

kesukaran soal yang didasarkan pada kriteria penafsiran taraf kesukaran soal pada
pembahasan sebelumnya.
Tabel 1.3
Klasifikasi Soal Berdasarkan Proporsi Tingkat Kesukarannya
Tingkat Kesukaran Soal Nomor Soal Jumlah

Mudah P 27% 6 1 (10%)
Sedang P 28-72% 1,2,3,4,5,7,8,9,10 9 (90%)
Sukar P 73% 0 0
.
Untuk memperoleh prestasi belajar yang baik, sebaiknya proporsi antara
taraf kesukaran soal tersebar secara normal. Penyusunan suatu soal dilakukan
dengan mempertimbangkan taraf kesukaran soal, sehingga hasil yang dicapai
peserta didik dapat menggambarkan prestasi yang sesungguhnya. Perhitungan
proporsi antara tingkat kesukaran dapat diatur sebagai berikut.
1. Soal sukar 25%, soal sedang 50%, soal mudah 25%, atau
2. Soal sukar 20%, soal sedang 60%, soal mudah 20%, atau
3. Soal sukar 15%, soal sedang 70%, soal mudah 15%.
7
2. Soal Bentuk Uraian
Cara menghitung taraf kesukaran untuk soal bentuk uraian adalah menghitung
beberapa persen peserta didik yang gagal menjawab benar atau ada dibawah batas
lulus (passing grade) untuk tiap-tiap soal (Arifin, 2012).
Mean
Tingkat kesukaran =
skor maksimum yang ditetapkan
Contoh Soal:
33 orang peserta didik di tes dengan lima soal bentuk uraian. Skor maksimum
ditentukan 10 dan skor minimum 0. Jumlah peserta didik yang memperoleh nilai
0-5 = 10 orang (berarti gagal), nilai 6 = 12 orang, dan nilai 7-10 = 11 orang.
Jadi, taraf kesukaran (TK) =
Taraf kesukaran 30,3 berada di antara 28 dan 72, berarti soal tersebut
termasuk sedang. Catatan: batas lulus ideal = 6 (skala 0-10).
2.1.3 Kriteria Penafsiran Taraf Kesukaran Soal

Untuk menafsirkan taraf kesukaran soalnya dapat digunakan kriteria
sebagai berikut (Arifin, 2012)
1. Jika jumlah peserta didik yang gagal mencapai 27% termasuk mudah.
2. Jika jumlah peserta didik yang gagal antara 28% sampai dengan 72%
termasuk sedang.
3. Jika jumlah peserta didik yang gagal 73% ke atas termasuk sukar.
2.2 DAYA BEDA

Menganalisis daya pembeda butir soal merupakan salah satu hal yang
dilakukan terkait dengan analisis butir soal. Berikut ini dijelaskan mengenai daya
pembeda soal yang meliputi pengertian daya pembeda, menentuka daya pembeda
butir soal uraian dan menentukan daya pembeda butir soal pilihan ganda.
2.2.1 Pengertian Daya Pembeda

Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang
pintar (berkemampuan rendah). Angka yang menunjukkan besarnya daya
pembeda disebut indeks diskriminasi, disingkat D. Indeks diskriminasi berkisar
antara 0,00 sampai 1,00. Hanya bedanya, indeks kesukaran tidak mengenal tanda
negatif (-), tetapi pada indeks diskriminasi ada tanda negatif. Tanda negatif pada
8
indeks diskriminasi digunakan jika sesuatu soal “terbalik” menunjukkan kualitas.
Angka yang menunjukkan besarnya daya beda disebut Indeks Diskriminasi
berkisar antara 0,00 sampai 1,00. Akan tetapi pada indeks diskriminasi ini
mengenal/ ada tanda negatif (-) yakni -1,0 ------------0,0----------1,0 (semakin ke
kanan soal semakin baik, semakin ke kiri maka soal semakin jelek, sebab semakin
ke kanan siswa yang pandai semakin sulit/tidak bisa menjawab dan sebaliknya
siswa yang kurang pintar (kiri) bisa menjawab dengan asal-asalan). Butir soal tes
yang baik juga harus dapat menunjukan daya pembedanya. Sebagaimana
penuturan Arikunto di atas, “daya beda adalah kemampuan suatu soal untuk
membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa
yang kurang (berkemampuan Menurut Anastasi dan Urbina dalam Purwanto,
daya beda rendah berhubungan dengan derajad kemampuan butir membedakan
dengan baik prilaku pengambil tes dalam tes yang dikembangkan. Soal dapat
dikatakan mempunyai daya pembeda jika soal tersebut dapat dijawab oleh siswa
berkemampuan tinggi dan tidak dapat dijawab oleh siswa berkemampuan rendah.
Jika suatu soal dapat dijawab oleh siswa pintar maupun kurang, berarti soal
tersebut tidak mempunyai daya beda, demikian juga jika soal tersebut tidak dapat
dijawab oleh siswa pintar dan siswa kurang, berarti soal tersebut tidak baik sebab
tidak mempunyai daya pembeda.
Ada butir soal yang memiliki ciri-ciri dapat dijawab dengan betul oleh
kebanyakan responden berkemampuan tinggi, tidak dapat dijawab dengan betul
oleh kebanyakan responden dengan kemampuan rendah. Butir soal yang demikian
memiliki daya untuk membedakan responden berdasarkan kemampuan mereka.
Dan butir soal yang demikian memiliki parameter yang disebut sebagai daya
pembeda. Seperti yang telah dipaparkan daya pembeda adalah kemampuan suatu
soal untuk membedakan antara siswa yang berkemampuan tinggi dengan siswa
yang berkemampuan rendah.
Suatu perangkat alat tes yang baik harus bisa membedakan antara siswa
yang pandai, rata-rata, dan yang berkemampuan rendah. Karena dalam suatu kelas
biasanya terdiri dari ketiga kelompok tersebut, sehingga hasil evaluasinya tidak
baik semua atau sebaliknya, tidak buruk semua. Juga tidak sebagian besar baik
atau sebaliknya sebagian besar buruk, tetapi haruslah berdistribusi normal. Siswa
9
yang mendapat nilai baik dan siswa yang mendapat nilai buruk ada (terwakili)
meskipun sedikit, namun bagian terbesar berada pada hasil yang cukup.
Manfaat daya pembeda butir soal adalah seperti berikut ini.
1. Untuk meningkatkan mutu setiap butir soal melalui data empiriknya.
Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah
butir soal itu baik, direvisi, atau ditolak.
2. Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi atau
membedakan kemampuan siswa, yaitu siswa yang telah memahami atau
belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak
dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat
dicurigai "kemungkinannya" seperti berikut ini.
a) Kunci jawaban butir soal itu tidak tepat.
b) Butir soal itu memiliki dua atau lebih kunci jawaban yang benar
c) Kompetensi yang diukur tidak jelas
d) Pengecoh tidak berfungsi
e) Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang
menebak
f) Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada
yang salah informasi dalam butir soalnya.
Daya pembeda suatu butir soal dapat diketahui dengan cara melihat besar
kecilnya nilai indeks diskriminasi item. Indeks diskriminasi (DP) pada dasarnya
dihitung atas dasar pembagian testee ke dalam dua kelompok yakni kelompok atas
(the higher group) adalah kelompok testee yang tergolong memiliki kemampuan
tinggi dan kelompok bawah (the lower group) yaitu kelompok testee yang
tergolong memiliki kemampuan rendah.
Adapun cara untuk menentukan dua kelompok tersebut biasanya bervariasi,
misalnya dapat menggunakan median sehingga pembagian menjadi dua kelompok
terdiri atas 50% testee kelompok atas dan 50% testee kelompok bawah; dapat juga
dengan hanya mengambil 20% dari testee yang termasuk dalam kelompok atas
dan 20% lainnya diambil dari testee yang termasuk dalam kelompok bawah; dapat
juga menggunakan angka presentase lainnya. Namun pada umumnya para pakar
di bidang evaluasi pendidikan lebih banyak menggunakan presentase sebesar 27%
10
dari testee dalam kelompok atas dan 27% lainnya diambil dari testee kelompok
bawah telah menunjukkan kesensitifannya atau dengan kata lain cukup dapat
diandalkan.
Nilai dari indeks diskriminasi berkisar antara -1.00 sampai +1,00. Bagi
suatu soal yang dapat dijawab benar oleh siswa dengan kemampuan tinggi
maupun siswa dengan kemampuan rendah, maka soal itu tidak baik, demikian
pula jika semua siswa, baik pandai maupun bodoh tidak dapat menjawab dengan
benar, soal tersebut tidak baik karena keduanya tidak mempunyai daya pembeda.
Nilai indeks diskriminasi terbesar adalah 1,00. Indeks diskriminasi ini
tercapai jika seluruh kelompok atas dapat menjawab soal dengan benar,
sedangkan seluruh kelompok bawah menjawab dengan salah. Namun sebaliknya,
jika seluruh kelompok atas menjawab soal dengan salah, dan seluruh kelompok
bawah menjawab soal dengan benar maka indeks diskriminasi akan memiliki nilai
-1,00. Tetapi jika siswa kelompok atas dan siswa kelompok bawah sama-sama
menjawab benar atau sama-sama menjawab salah, maka soal tersebut mempunyai
nilai diskriminasi 0,00 karena tidak mempunyai daya pembeda sama sekali.
Berdasarkan pada hal tersebut, berikut ini diberikan tabel yang merupakan
patokan untuk nilai indeks diskriminasi yang pada umumnya digunakan untuk
menentukan suatu butir soal memiliki daya pembeda yang baik atau tidak.
Tabel 2.1. Interpretasi Nilai Indeks Diskriminasi
Besarnya Nilai Indeks Klasifikasi Interpelasi

Diskriminasi (DP)
Kurang dari 0,20 Poor Butir item yang bersangkutan daya

pembedanya lemah sekali (jelek)
dianggap tidak memiliki daya pembeda
yang baik.
0,20 ≤ DP < 0,40 Satisfactory Butir item yang bersangkutan telah
memiliki daya pembeda yang cukup
(sedang).
0,40 ≤ DP < 0,70 Good Butir item yang bersangkutan telah

memiliki daya pembeda yang baik.
0,70 ≤ DP < 1,00 Excellent Butir item yang bersangkutan telah

memiliki daya pembeda yang baik
11
Besarnya Nilai Indeks Klasifikasi Interpelasi
Diskriminasi (DP)
sekali.
Bertanda negatif - Butir item yang bersangkutan daya

pembedanya negatif (jelek sekali).
2.2.2 Daya Pembeda Butir Soal Uraian

Dalam menentukan daya pembeda hal pertama yang dilakukan adalah
menentuka siswa yang termasuk kelompok atas dan siswa yang termasuk
kelompok bawah. Dalam menentukan kelompok atas dan kelompok bawah antara
lain dapat dilakukan dengan cara menggunakan median sehingga pembagian
menjadi dua kelompok terdiri atas 50% testee kelompok atas dan 50% testee
kelompok bawah; dapat juga dengan hanya mengambil 20% dari testee yang
termasuk dalam kelompok atas dan 20% lainnya diambil dari testee yang
termasuk dalam kelompok bawah; dapat juga menggunakan angka presentase
lainnya.
Untuk menentukan nilai indeks diskriminasi pada butir soal uraian dapat
dilakukan dengan menggunakan rumus sebagai berikut.
Keterangan:
ΣH : Jumlah skor kelompok Atas
ΣL : Jumlah Skor kelompok bawah
N : Jumlah peserta tes (testee) pada kelompok atas atau
bawah
Scoremax : skor tertinggi butir soal
Scoremin : skor terendah butir soal
Dalam menghitung nilai indeks diskriminasi (daya pembeda) dapat pula

digunakan rumus berikut ini.
Mean kelompok atas - Mean kelompok bawah
DP = Skor maksimum soal
(Kusaeri,2012:176)
12
Berikut ini merupakan contoh menentukan daya pembeda butir soal uraian
Contoh 3. Menentukan daya pembeda butir soal uraian.

Diketahui 10 orang testee mengikuti tes hasil belajar dalam bidang
matematika yang tertuang dalam bentuk soal uraian. Dalam tes
tersebut dikeluarkan 4 butir soal dengan skor maksimal untuk
masing-masing butir soal adalah 25. Hasil tes matematika siswa
dituangkan pada tabel 5.
Tabel 2. Hasil Tes Matematika Siswa
Nomor Soal
1 2 3 4
siswa (skor maks 25) (skor maks 25) (skor maks 25) (skor maks 25)
A 25 25 22 15
kel. B 25 23 20 10
C 25 20 19 10
Atas
D 25 22 15 8
E 20 15 19 7
ΣU 120 105 95 50
F 25 15 15 4
G 25 20 10 5
kel
. H 25 22 7 7
Bawah I 25 23 18 4
J 20 21 10 0
ΣL 120 60 70 20
ΣU+ΣL 240 165 165 70
Mean 24 16.5 16.5 7
Berdasarkan data pada tabel di atas akan dicari indeks diskriminasi (daya
beda) butir soal dapat dihitung menggunakan rumus pertama di atas. Setelah
melakukan perihitungan untuk soal nomor 4, diperoleh daya pembeda sebesar 0,4
yang menunjukkan bahwa soal nomor 4 sudah memiliki daya pembeda yang baik.
Dengan menggunakan rumus kedua juga diperoleh hasilnya 0,4
13
Dengan menggunakan rumus yang kedua diperoleh pula besarnya nilai daya
pembeda adalah 0,4 yang menunjukkan bahwa soal tersebut telah memiliki daya
pembeda yang baik.
2.2.3 Daya Pembeda Butir Soal Pilihan Ganda
Untuk mengetahui besar kecilnya indeks diskriminasi butir soal

uraian dapat digunakan dua macam rumus berikut ini.
a. Rumus Pertama
Dalam menentukan daya pembeda suatu butir soal pilihan ganda dapat
dihitung dengan menggunakan persaman:
BA BB
DP P P
A B
(Arikunto, 2005: 213).
J J
A B
Dengan
DP : merupakan indeks daya pembeda
BA : banyaknya peserta tes kelompok atas yang menjawab soal dengan benar
BB : banyaknya peserta tes kelompok bawah yang menjawab soal dengan benar,
JA : banyaknya peserta tes kelompok atas
JB : banyaknya peserta tes kelompok bawah.
PA : proporsi peserta kelompok atas yang menjawab benar.
PB : proporsi peserta kelompok bawah yang menjawab benar.
Berikut ini merupakan contoh penggunaan rumus pertama untuk

menentukan daya pembeda butir soal pilihan ganda
14
Contoh 4. Menentukan indeks diskriminasi suatu butir soal dengan
menggunakan
Diketahui 10 orang testee mengikuti tes hasil belajar dalam

bidang matematika yang tertuang dalam bentuk pilihan ganda. Dalam
tes tersebut dikeluarkan 10 butir soal dengan catatan bahwa untuk
setiap butir item yang dijawab betul diberi bobot 1 sedangkan untuk
setiap butir item yang dijawab salah diberi bobot 0.
Setelah tes hasil belajar tersebut berakhir dan dilakukan

pengoreksian serta diberi skor, maka dari tes tersebut diperoleh data
mengenai skor jawaban item sebagaimana tertera pada Tabel 6.
Tabel 3. Hasil Tes Matematika Tipe Objektif
Nomor Soal
Total
No. Subjek 1 2 3 4 5 6 7 8 9 10
1. A 1 1 1 1 1 1 1 1 1 1 10
2. B 1 1 1 1 1 0 1 1 1 1 9
3. C 1 1 1 1 1 0 1 1 0 0 7
4. D 1 1 1 0 1 0 1 1 0 1 7
15
5. E 1 1 1 1 0 1 0 0 1 1 7
6. F 1 0 1 1 0 1 1 0 0 0 5
7. G 1 1 1 1 0 1 0 0 1 0 6
8. H 1 1 0 1 0 0 0 0 0 1 4
9. I 1 1 0 0 0 1 0 0 0 1 4
10. J 1 1 0 0 0 1 0 0 0 0 3
Jumlah 10 9 7 7 4 7 4 4 4 6 62
Jumlah
Kuadrat 10 9 7 7 4 7 4 4 4 6 430
Pada tabel tersebut skor total untuk setiap siswa telah diurutkan dari
skor tertinggi ke skor terendah.
Langkah pertama : karena terdiri dari 10 subjek, maka data ini

termasuk ke dalam kelompok kecil. Oleh karena itu, untuk
menentukan kelompok atas dan kelompok bawah, masing-masing 50%
dari populasi yaitu 5 subjek untuk kelompok atas dan 5 subjek untuk
kelompok bawah, maka keadaannya adalah sebagai berikut:
Tabel 4. Kelompok Atas dan Kelompok Bawah
Kelompok Atas Kelompok Bawah
Subjek Skor Subjek Skor
A 10 F 5
16
B 9 G 6
C 7 H 4
D 7 I 4
E 7 J 3
JA = 5 JB = 5
Langkah kedua, dilakukan pemberian kode-kode terhadap hasil

pengelompokan testee atas dua kategori tersebut di atas seperti yang
ditunjukkan pada Tabel 8. Skor 1 yang berada pada tanda kurung
merupakan skor jawaban betul yang dimiliki oleh kelompok kelas atas,
sedangkan skor 1 yang tidak dibubuhi oleh tanda kurung merupakan
jawaban betul dari kelompok bawah.
Tabel 5. Pengkodean hasil pengelompokkan testee
Nomor Soal Ket.

Total
Subjek 1 2 3 4 5 6 7 8 9 10
A 1 1 1 1 1 1 1 1 1 1 10 Atas
B 1 1 1 1 1 0 1 1 1 1 9 Atas
C 1 1 1 1 1 0 1 1 0 0 7 Atas
D 1 1 1 0 1 0 1 1 0 1 7 Atas
E 1 1 1 1 0 1 0 0 1 1 7 Atas
17
F 1 0 1 1 0 1 1 0 0 0 5 Bawah
G 1 1 1 1 0 1 0 0 1 0 6 Bawah
H 1 1 0 1 0 0 0 0 0 1 4 Bawah
I 1 1 0 0 0 1 0 0 0 1 4 Bawah
J 1 1 0 0 0 1 0 0 0 0 3 Bawah
Jumlah 10 9 7 7 4 7 5 4 4 6 62
Jumlah
Kuadrat 10 9 7 7 7 7 5 4 4 6 430
Langkah ketiga, mencari atau menghitung BA, BB, PA, PB dan DP untuk 12
butir soal di atas. Untuk mencari DP digunakan rumus
Untuk hal ini, perhatikanlah dengan cermat skor-skor jawaban betul

yang dimiliki oleh kelompok atas dan skor-skor jawaban betul yang
dimiliki oleh kelompok bawah. Setelah memperoleh nilai DP kita
dapat mengetahui bagaiman daya pembeda suatu butir soal dengan
cara mengintrepretasikan besar kecilnya nilai indeks diskriminan,
sesuai dengan Tabel 6. Adapun hasilnya dapat dilihat pada Tabel 9.
18
Tabel 6. Intrepretasi daya pembeda butir soal pilihan ganda
Nomor
Butir
Soal BA BB JA JB BA/JA BB/JB DP Intrepretasi
1 5 5 5 5 1,00 1,00 0,00 Poor
2 5 4 5 5 1,00 0,80 0,20 Satisfactory
3 5 2 5 5 1,00 0,40 0,60 Good
4 4 3 5 5 0,80 0,60 0,20 Satisfactory
5 5 0 5 5 1,00 0,00 1,00 Excellent
6 2 4 5 5 0,40 0,80 0,40 Good
7 4 1 5 5 0,80 0,20 0,60 Good
8 4 0 5 5 0,80 0,00 0,80 Excellent
9 3 1 5 5 0,60 0,20 0,40 Good
10 4 2 5 5 0,80 0,40 0,40 Good
Bertitik tolak dari hasil di atas sebanyak 9 butir soal dari 10 butir
soal yang ada telah memiliki daya pembeda yang memadai, sedangkan
1 soal belum memiliki daya pembeda seperti yang diharapkan.
19
b. Rumus Kedua (Korelasi Phi)
Dengan rumus kedua ini maka angka indeks diskriminasi item diperoleh
menggunakan teknik korelasi Phi (ø) dengan rumus sebagai berikut:
PH PL 2 pq
(Sudijono, 1996:
390-391)
dimana :
ø: angka indeks korelasi Phi, yang pada hal ini dianggap sebagai angka
indeks diskriminasi item.
PH : proportion of the higher group
PL : proportion of the lower group
2 : bilangan konstanta
p : proporsi seluruh testee yang jawabannya betul
q : proporsi seluruh testee yang jawabannya salah, dimana q = (1-p).
Berikut ini merupakan contoh bagaimana cara mencari angka indeks
diskriminasi item dengan menggunakan kedua rumus di atas.
Contoh 3. Menentukan nilai DP dengan rumus teknik korelasi Phi.
Masih dengan menggunakan data yang sama seperti pada contoh

2, kita akan menentukan nilai DP dengan menggunakan rumus
korelasi Phi yakni
P P
H L
. Dalam menentukan nilai phi kita harus memperhatikan bahwa
2 pq
20
nilai PH = PA = BA/JA , sedangkan nilai PL = PB = BB/JB, kemudian
kita juga harus menentukan nilai p dan q. Analisis untuk menentukan
indeks diskriminasi dengan menggunakan korelasi phi disajikan pada
Tabel 7.
Tabel 7. Daya Pembeda berdasarkan korelasi Phi
Nomor
1 2 3 4 5 6 7 8 9 10
A (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) 10 Atas
B (1) (1) (1) (1) (1) 0 (1) (1) (1) (1) 9 Atas
C Atas
1 1 1 1 1 0 1 1 0 0 7
D Atas
1 1 1 0 1 0 1 1 0 1 7
E Atas
1 1 1 1 0 1 0 0 1 1 7
F 1 0 1 1 0 1 1 0 0 0 5 Bawah
G 1 1 1 1 0 1 0 0 1 0 6 Bawah
H 1 1 0 1 0 0 0 0 0 1 4 Bawah
I 1 1 0 0 0 1 0 0 0 1 4 Bawah
J 1 0 1 0 0 1 0 0 0 0 3 Bawah
Jumlah
10 9 7 7 4 7 5 4 4 6 62
BA 5 5 5 5 5 5 5 5 5 5
BB 5 5 5 5 5 5 5 5 5 5
JA
5 5 5 5 5 5 5 5 5 5
21
JB 5 5 5 5 5 5 5 5 5 5
PH 1,0 1,0 1,0 0,8 1,0 0,4 0,8 0,8 0,6 0,8
PL 1,0 0,8 0,4 0,6 0,0 0,8 0,2 0,0 0,2 0,4
p 1,0 0,9 0,7 0,7 0,4 0,7 0,5 0,4 0,4 0,6
q 0,0 0,1 0,3 0,3 0,6 0,3 0,5 0,6 0,6 0,4
Adapun besarnya nilai phi ditunjukkan pada Tabel 8.
Tabel 8. Klasifikasi daya pembeda soal berdasarkan korelasi phi
Nomor
PH PL P Q Phi Klasifikasi
1 1,00 1,00 1,00 0,00 - Poor
2 1,00 0,80 0,90 0,10 0,34 Satisfactory
3 1,00 0,40 0,70 0,30 0,65 Good
4 0,80 0,60 0,70 0,30 0,21 Satisfactory
5 1,00 0,00 0,40 0,60 1,0 Excellent
6 0,40 0,80 0,70 0,30 0,43 Good
7 0,80 0,20 0,50 0,50 0,6 Good
8 0,80 0,00 0,40 0,60 0,81 Excellent
9 0,60 0,20 0,40 0,60 0,40 Good
10 0,80 0,40 0,60 0,40 0,40 Good
22
Dengan menggunakan teknik korelasi phi, ternyata angka indeks
diskriminasi itemnya sedikit berbeda dengan angka indeks
diskriminasi item yang dihitung dengan menggunakan rumus pertama.
Hal ini memang dapat dipahami sebab menurut para ahli di bidang
evaluasi pendidikan angka indeks diskriminasi item yang diperoleh
dengan menggunakan teknik korelasi Phi itu sifatnya lebih teliti.
c. Rumus Ketiga ( Korelasi Point Biserial )
Dalam menentukan indeks diskriminasi ada kalanya kita

akandipertemukan pada suatu keadaan dimana jumlah testee yang
menjawab butir soal yang diberikan cukup besar (100 orang atau
lebih). Daya pembeda butir soal tersebut cukup dihitung berdasarkan
27% testee kelompok atas dan 27% dari kelompok bawah. Sementara
testee yang terletak diantara kedua ujung ekstrem itu tidak perlu
diikutsertakan dalam perhitungan analisis. Secara ringkas ditunjukkan
oleh gambar di bawah ini.
Gambar 5. Pembagian Testee menjadi Kelompok Atas dan Kelompok

Bawah
23
Jika kita bekerja secara cermat, perhitungan daya pembeda
dengan menggunakan kelompok atas dan kelompok bawah sebagai
sampel, mempunyai kelemahan. Kelemahannya adalah karena cara
ini tidak melibatkan kelompok tengah (middle group) sebanyak
46%. Tidak dilibatkannya kelompok tengah setidaknya akan
mencemari hasil analisis (bias). Untuk mengatasi kelemahan itu,
beberapa pakar evaluasi mengemukakan cara lain yaitu dengan
menggunakan teknik korelasi biserial titik (point biserial
correlation). Rumus yang digunakan untuk menghitung daya
pembeda butir soal tes pilihan ganda dengan teknik tersebut adalah:
2.2.4 Tindak Lanjut Terhadap Butir Soal Setelah Analisis Daya Beda
Akhirnya sebagai tindak lanjut hasil penganalisaan mengenai

daya pembeda item tes hasil belajar adalah:
a. Butir-butir item yang sudah memiliki daya pembeda item yang

baik (satisfactory, good, excellent) hendaknya dimasukkan
dalam buku bank soal tes hasil belajar. Butir-butir item tersebut
pada tes hasil belajar yang akan datang dapat dikeluarkan lagi,
karena kualitasnya sudah cukup memadai.
b. Butir-butir item yang daya pembedanya masih rendah (poor),

ada dua kemungkinan tindak lanjut, yaitu:
24
1. Ditelusuri untuk selanjutnya diperbaiki, dan setelah
diperbaiki dapat diajukan lagi dalam tes hasil belajar yang
akan datang; kelak item tersebut dianalisis lagi apakah daya
pembedanya meningkat ataukah tidak.
2. Dibuang (didrop) dan untuk tes hasil belajar yang akan

datang butir item tersebut tidak akan dikeluarkan lagi.
Khusus butir-butir item yang angka indek diskriminasi itemnya bertanda

negatif, sebaiknya pada tes hasil belajar yang akan datang tidak usah
dikeluarkan lagi., sebab butir item yang demikian itu kualitasnya sangat
jelek.
2.3.Efektivitas Pengecoh
2.3.1 Pengecoh (Distraktor)
Pengecoh (distraktor) merupakan suatu pola yang dapat menggambarkan

bagaimana testee menentukan pilihan jawabannya terhadap kemungkinan-
kemungkinan jawaban yang telah dipasangkan pada setiap butir item. Distraktor
dapat dinyatakan telah dapat menjalankan fungsinya dengan baik apabila
distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta
tes atau 34 apabila mempunyai daya tarik yang besar bagi pengikut-pengikut tes
yang kurang memahami konsep atau kurang menguasai bahan (kelompok bawah).
Untuk menentukan angka pedoman efektivitas distraktor dapat dilakukan dengan
cara mengalikan antara 5% X Jumlah siswa.
Pada soal bentuk pilihan ganda ada alternatif jawaban (opsi) yang
merupakan pengecoh, jadi pengecoh disini adalah jawaban dari soal yang bisa
mengecoh jawaban yang sebenarnya.
Opsi atau alternatif itu jumlahnya berkisar antara tiga sampai dengan lima
buah, dan dari kemungkinan-kemungkinan jawab yang terpasang pada setiap butri
item itu, salah satu di antaranya adalah merupakan jawaban betul (kunci jawaban);
sedangkan sisanya adalah merupakaan jawaban salah. Jawaban-jawaban salah
itulah yang biasa dikenal dengan istilah distraktor (pengecoh).
25
Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta
didik yang menjawab salah. Sebaliknya, butir soal yang yang kurang baik,
pengecohnya akan dipilih secara tidak merata. Pengecoh dianggap bila jumlah
peserta didik yang memilih pengecoh itu sama atau mendekati jumlah ideal.
Suatu distraktor dapat diperlakukan dengan 3 cara:
1. Diterima, karena sudah baik.
2. Ditolak, karena tidak baik.
3. Ditulis kembali, karena kurang baik.
Kekurangannya mungkin hanya terletak pada rumusan kalimatnya
sehingga hanya perlu ditulis kembali, dengan perubahan seperlunya (Arikunto,
2010).
2.3.2 Cara Menentukan dan Menghitung Efektivitas Pengecoh

Indek pengecoh dihitung dengan rumus :
P 100%
IP 
N  B n  1
Keterangan :
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban (opsi)
1 = bilangan tetap
Cacatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci
jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian,
pengecoh tidak berfungsi.
Contoh :
50 orang peserta didik di tes dengan 10 soal untuk pilihan-ganda. Tiap soal
memilki 5 alternatif jawaban (a, b, c, d, dan e). Kunci jawaban (jawaban yang
benar) soal nomor 8 adalah c. Setelah nomor 8 diperiksa untuk peserta didik,
ternyata dari 50 orang peserta didik. 20 peserta didik menjawab benar dan 30
peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata, artinya
26
semua pengecoh secara merata ikut menyesatkan peserta didik. Perhatikan contoh
soal nomor 8 berikut ini:
Alternatif Jawaban a b c d e
Distribusi jawaban peserta didik 7 8 20 7 8
IP 93% 107% ** 93% 107%
Kualitas Pengecoh ++ ++ ** ++ ++
Keterengan:
** : kunci jawaban
++ : sangat baik
+ : baik
- : kurang baik
_ : jelek
__ : sangat jelek
Pada contoh di atas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan
107%. Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik
sebab semua pengecoh itu berfungsi. Jika pilihan jawaban peserta didik
menumpuk pada suatu alternatif jawaban, misalnya seperti berikut :
Alternatif Jawaban a b c d e
Distribusi jawaban peserta didik 20 2 20 8 0
IP 267% 27% ** 107% 0%
Kualitas Pengecoh ++ - ** ++ -
Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh

(e) dan (b) tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e)
perlu diganti karena termasuk jelek, dan pengecoh (b) perlu direvisi karena kurang
baik. Adapun kualitas pengecoh berdasar indeks pengecoh adalah :
Sangat baik IP = 76% - 125%
Baik IP = 51% - 75% atau 126%-150%
Kurang baik IP = 26% - 50% atau 151% - 175%
Jelek IP = 0% - 25% atau 176% - 200%
Sangat jelek IP = Lebih dari 200%
27
Untuk analisis pengecoh perlu dibuat tabel khusus agar setiap butir soal
diketahui berapa banyak peserta didik yang menjawab a, b, c dan seterusnya. Hal
ini tentu saja sangat memakan waktu dan tenaga. Jika diolah dengan komputer
dan data sudah dimasukkan dalam disket, pengolahan ini hanya memerlukan
waktu beberapa detik saja.
28
BAB III
PENUTUP
2.4 Simpulan
Berdasarkan uraian pembahasan tersebut di atas, maka dapa disimpulkan
bahwa taraf kesukaran adalah bilangan yang menunjukkan sukar atau mudahnya
suatu soal. Soal yang baik dan bermutu adalah soal yang memiliki taraf kesukaran
seimbang antara mudah, sedang, sulit. Untuk menafsirkan taraf kesukaran soal
dapat digunakan kriteria yaitu, jika jumlah peserta didik yang gagal mencapai
27% termasuk mudah, jika jumlah peserta didik yang gagal antara 28% sampai
dengan 72% termasuk sedang, dan jika jumlah peserta didik yang gagal 73% ke
atas termasuk sukar.
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang
pintar (berkemampuan rendah). Angka yang menunjukkan besarnya daya
pembeda disebut indeks diskriminasi, disingkat D. Indeks diskriminasi berkisar
antara 0,00 sampai 1,00. Angka yang menunjukkan besarnya daya beda disebut
Indeks Diskriminasi berkisar antara 0,00 sampai 1,00. Akan tetapi pada indeks
diskriminasi ini mengenal/ ada tanda negatif (-) yakni -1,0 ------------0,0----------
1,0 (semakin ke kanan soal semakin baik, semakin ke kiri maka soal semakin
jelek, sebab semakin ke kanan siswa yang pandai semakin sulit/tidak bisa
menjawab dan sebaliknya siswa yang kurang pintar (kiri) bisa menjawab dengan
asal-asalan). Butir soal tes yang baik juga harus dapat menunjukan daya
pembedanya. Manfaat daya pembeda butir soal diantaranya adalah untuk
meningkatkan mutu setiap butir soal melalui data empiriknya, dan untuk
mengetahui seberapa jauh setiap butir soal dapat mendeteksi atau membedakan
kemampuan siswa.
Distraktor yaitu suatu pola yang dapat menggambarkan bagaimana testee
menentukan pilihan jawabannya terhadap kemungkinan-kemungkinan jawab yang
telah dipasangkan pada setiap butir item. Butir soal yang baik, pengecohnya akan
dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya, butir
soal yang yang kurang baik, pengecohnya akan dipilih secara tidak merata.
29
Pengecoh dianggap bila jumlah peserta didik yang memilih pengecoh itu sama
atau mendekati jumlah ideal.
1.2 Saran
Guru sebaiknya lebih mampu meningkatkan diri dalam menganalisis tes
sehingga tes yang dibuat akan benar-benar mampu mengukur kemampuan
siswa serta dapat tepat sasaran.
30
DAFTAR PUSTAKA
Arifin, Zainal. 2012. Evaluasi Pembelajaran: Prinsip, Teknik, Prosedur.

Bandung: Remaja Rosdakarya.
Arikunto, Suharsimi. 2005. Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi

Aksara.
Arikunto, Suharsimi. 2010. Dasar-Dasar Evaluasi Pendidikan (edisi revisi).

Jakarta. Bumi Aksara.
Sudijono, Anas. 2011. Pengantar Evaluasi Pendidikan. Jakarta: PT Raja Grafindo

Persada.
Candiasa, I. M. 2010a. Pengujian Instrumen Penelitian Disertai Aplikasi ITEMAN

danBIGSTEPS. Singaraja : Universitas Pendidikan Ganesha.
Kusaeri, Suprananto. 2012. Pengukuran dan Penilaian Pendidikan. Yogyakarta :

Graha Ilmu.
Sudjana, Nana.2014. Penilaian Hasil Proses Belajar Mengajar. Bandung:

Remaja Rosdakarya.
Suwarto. 2013. Pengembangan Tes Diagnostik dalam Pembelajaran: Panduan

Praktis Bagi Pendidik dan Calon Pendidik. Yogyakarta: Pustaka Pelajar.
31

Taraf Kesukaran, Daya Beda, Efektivitas Pengecoh

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Taraf Kesukaran, Daya Beda, Efektivitas Pengecoh

Diunggah oleh

Hak Cipta:

Format Tersedia

EVALUASI PENDIDIKAN MATEMATIKA

TARAF KESUKARAN, DAYA BEDA,

PROGRAM STUDI S2 PENDIDIKAN MATEMATIKA

Penulis menyadari bahwa makalah ini jauh dari sempurna karena

Om Shanti, Shanti, Shanti, Om

Denpasar, Maret 2019

KATA PENGANTAR ...................................................................................... i

1.1 LATAR BELAKANG

1.3 TUJUAN PENULISAN

1.4 MANFAAT PENULISAN

2.1 TARAF KESUKARAN

2.1.2 Teknik Analisis Taraf Kesukaran Soal

Jadi, dapat dihitung tingkat kesukaran setiap soal menggunakan rumus 1

Berdasarkan perhitungan tersebut, maka dapat diketahui klasifikasi taraf

Tingkat Kesukaran Soal Nomor Soal Jumlah

2.1.3 Kriteria Penafsiran Taraf Kesukaran Soal

2.2 DAYA BEDA

2.2.1 Pengertian Daya Pembeda

Tabel 2.1. Interpretasi Nilai Indeks Diskriminasi

Besarnya Nilai Indeks Klasifikasi Interpelasi

Kurang dari 0,20 Poor Butir item yang bersangkutan daya

0,40 ≤ DP < 0,70 Good Butir item yang bersangkutan telah

0,70 ≤ DP < 1,00 Excellent Butir item yang bersangkutan telah

Bertanda negatif - Butir item yang bersangkutan daya

2.2.2 Daya Pembeda Butir Soal Uraian

Dalam menghitung nilai indeks diskriminasi (daya pembeda) dapat pula

Contoh 3. Menentukan daya pembeda butir soal uraian.

Tabel 2. Hasil Tes Matematika Siswa

2.2.3 Daya Pembeda Butir Soal Pilihan Ganda

Untuk mengetahui besar kecilnya indeks diskriminasi butir soal

JB : banyaknya peserta tes kelompok bawah.

PA : proporsi peserta kelompok atas yang menjawab benar.

PB : proporsi peserta kelompok bawah yang menjawab benar.

Berikut ini merupakan contoh penggunaan rumus pertama untuk

Diketahui 10 orang testee mengikuti tes hasil belajar dalam

Setelah tes hasil belajar tersebut berakhir dan dilakukan

Tabel 3. Hasil Tes Matematika Tipe Objektif

Langkah pertama : karena terdiri dari 10 subjek, maka data ini

Tabel 4. Kelompok Atas dan Kelompok Bawah

Kelompok Atas Kelompok Bawah

Subjek Skor Subjek Skor

Langkah kedua, dilakukan pemberian kode-kode terhadap hasil

Tabel 5. Pengkodean hasil pengelompokkan testee

Nomor Soal Ket.

Untuk hal ini, perhatikanlah dengan cermat skor-skor jawaban betul

1 5 5 5 5 1,00 1,00 0,00 Poor

2 5 4 5 5 1,00 0,80 0,20 Satisfactory

3 5 2 5 5 1,00 0,40 0,60 Good

4 4 3 5 5 0,80 0,60 0,20 Satisfactory

5 5 0 5 5 1,00 0,00 1,00 Excellent

6 2 4 5 5 0,40 0,80 0,40 Good

7 4 1 5 5 0,80 0,20 0,60 Good

8 4 0 5 5 0,80 0,00 0,80 Excellent

9 3 1 5 5 0,60 0,20 0,40 Good

10 4 2 5 5 0,80 0,40 0,40 Good

Berikut ini merupakan contoh bagaimana cara mencari angka indeks

diskriminasi item dengan menggunakan kedua rumus di atas.

Contoh 3. Menentukan nilai DP dengan rumus teknik korelasi Phi.

Masih dengan menggunakan data yang sama seperti pada contoh

Tabel 7. Daya Pembeda berdasarkan korelasi Phi

Adapun besarnya nilai phi ditunjukkan pada Tabel 8.

Tabel 8. Klasifikasi daya pembeda soal berdasarkan korelasi phi

1 1,00 1,00 1,00 0,00 - Poor