Anda di halaman 1dari 14

FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN,

PILIHAN GANDA, INSTRUMEN PERBUATAN DAN


INSTRUMEN NON-TES

FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN, PILIHAN GANDA,


INSTRUMEN PERBUATAN DAN INSTRUMEN NON-TES

A. Analisis Butir Soal Secara Kualitatif dan Kuantitatif


Menurut Kamus Besar Bahasa Indonesia (2002) analisis adalah penguraian suatu pokok
atas berbagai bagiannya dan penelaahan bagian itu sendiri serta hubungan antar bagian untuk
memperoleh pengertian yang tepat dan pemahaman arti keseluruhan.Analisis butir soal yang
dalam bahasa inggris disebut item analiysis dilakukan terhadap empirik. Maksudnya, analisis itu
baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir
soal telah kita peroleh. Analisis butir soal adalah suatu kegiatan analisis untuk menentukan
tingkat kebaikan butir-butir soal yang terdapat dalam suatu tes sehingga informasi yang
dihasilkan dapat kita pergunakan untuk memperbaiki butir soal dan tes tersebut.
Identifikasi terhadap setiap butir item soal dilakukan dengan harapan akan menghasilkan
berbagai informasi berharga, yang pada dasarnya akan merupakan umpan balik (feed back) guna
melakukan perbaikan, pembenahan, dan penyempurnaan kembali terhadap butir-butir soal,
sehingga pada masa-masa yang akan yang akan dating tes hasil belajar yang disusun atau
dirancang oleh guru itu betul-betul dapat menjalankan fungsinya sebagai alat pengukur hasil
belajar yang memiliki kualitas yang tinggi.
Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan analisis butir soal
merupakan kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu.
Tujuan kegiatan ini adalah:
1. Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan,
2. meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif,
3. mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah
diajarkan.
Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya
tentang siswa mana yang telah menguasai materi dan siswa mana yang belum menguasai materi.
Selanjutnya menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal
dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya) dan kuantitatif (berkaitan
dengan ciri-ciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan
konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validitas dan reliabilitas butir
soal, kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-masing memiliki
keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah menggunakan atau memadukan
keduanya.
Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaida
penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan sebelum
soal digunakan atau diujikan. Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini
adalah setiap soal ditelaah dari segi materi, konstruksi, bahasa atau budaya, dan kunci jawaban
atau pedoman penskorannya. Dalam menganalisis butir soal, terdapat dua teknik. Yaitu teknik
kualitatifdan teknik kuantitatif.
1.Teknik Analisis Secara Kualitatif
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif,
diantaranya adalah teknik moderator dan teknik panel.
a. Teknik moderator
Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama
dengan beberapa ahli seperti guru yang mengajarkan materi, ahli materi, penyusun atau
pengembangkurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi.Teknik ini sangat
baik karena setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya. Di
samping itu, para penelaah dipersilakan mengomentari berdasarkan kompetensinya masing-
masing. Setiap komentar atau masukan dari peserta diskusi dicatat. Setiap butir soa ldapat
dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini
memiliki kelemahan karena memerlukan waktu lama untuk rnendiskusikan setiap satu butir
soal.Teknik berikutnya adalah
b. Teknik Panel
Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya
ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi,
bahasa/budaya, kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh beberapa
penelaah. Caranya adalah beberapa penelaah diberikan: butir-butir soal yang akan
ditelaah, format penelaahan, dan pedoman penilaian/ penelaahannya. Pada tahap awal para
penelaah diberikan pengarahan, kemudian tahap berikutnya para penelaah berkerja sendiri-
sendiri di tempat yang tidak sama. Penalaah dipersilakan memperbaiki langsung pada teks soal
dan memberikan nilai pada setiap butir soalnya yang kriterianya adalah : baik, diperbaiki, atau di
ganti. Secara ideal penelaah butiran soal di samping memiliki latar belakang materi yang
diujikan, beberapa penelaah yang diminta untuk menelaah butir soal memiliki ketrampilan,
seperti guru yang mengajarkan materi itu,
ahlimateri, ahli pengembang kurikulum, ahli penilaian, psikolog, ahli bahasa, ahli kebijakan
pendidikan, atau lainnya.
2. Analisis Butir Soal Secara Kuantitatif
Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan pada bukti
empirik. Salah satu tujuan utama pengujian butir-butir soal secara emperik adalah untuk
mengetahui sejauh mana masing-masing butir soal membedakan antara mereka yang tinggi
kemampuannya dalam hal yang didefinisikan oleh kriteria dari mereka yang rendah
kemampuannya.
Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam analisis
secara kuantitatif yaitu pendekatan secara klasik dan modern.
a. Analisis butir soal secara klasik
Analisa butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari
jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan
teori tes klasik. Pada teori tes klasik, analisis item tes dilakukan dengan memperhitungkan
kedudukan item dalam suatu kelas atau kelompok. Karakteristik atau kualitas item sangat
tergantung pada kelompok dimana diujicobakan sehingga kualitas item terikat pada sampel
responden atau peserta tes yang memberikan respons (sample bounded).
Ada beberapa kelebihan analisis butir soal secara klasik adalah murah, sederhana,
familiar, dapat dilaksanakan sehari-hari dengan cepat menggunakan komputer dan dapat
menggunakan beberapa data dari peserta tes.
b. Analisis butir soal secara moderen
Analisa butir soal secara moderen adalah penelaahan butir soal dengan menggunakan
teori respon butir atau item response theory. Teori ini merupakan suatu teori yang menggunakan
fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu butir dengan
kemampuan siswa.
Teori ini muncul karena adanya beberapa keterbatasan pada analisis secara klasik, yaitu:
1) Tingkat kemampuan dalam teori klasik adalah true score. Artinya, jika suatu tes sulit maka
tingkat kemampuan peserta tes akan rendah. sebaliknya, jika suatu tes mudah maka tingkat
kemampuan peserta tes tinggi.
2) Tingkat kesukaran butir soal didefinisikan sebagai proporsi peserta tes yang menjawab benar.
Mudah atau sulitnya butir soal tergantung pada kemampuan peserta tes. Daya pembeda,
reliabilitas, dan validitas tes tergantung pada kondisi peserta tes.
A. Analisis Butir Soal
Pedoman penskoran. Caranya beberapa penelaah diberikan butir-butir soal yang akan
ditelaah, format penelaahan, dan pedoman penilaian atau penelaahan. Pada tahap awal, semua
orang yang terlibat dalam kegiatan penelaahan disamakan persepsinya, kemudian mereka
terlibat berkerja sendiri-sendiri di tempat berbeda. Para penelaah dipersilakan memperbaiki
langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap butir
soal dengan kriteria: soal baik, perlu diperbaiki, atau diganti.Dalam menganalisis butir soal
secara kualitatif, penggunaan format penelaahan soal akan sangat membantu dan mempermudah
prosedur pelaksanaannya. Format penelaahan soal digunaka sebagai dasar untuk menganalisis
setiap butir soal. Format penelaahan soal yang dimaksud adalah format penelaahan butir soal:
uraian, pilihan ganda, tes perbuatan dan instrumen non-tes. Berikut disajikan keempat format
penelaahan butir soal.
a. Format Penelaahan Butir Soal Bentuk Uraian
FORMAT PENELAAHAN SOAL BENTUK URAIAN
Mata pelajaran :
Kelas/semester :
Penelaah :
NomorSoal
No. Aspek yang ditelaah 1 2 3 4 5 6 7 8 9 ...
A.
1

2 Materi
Soal sesuai dengan indikator(menuntuttes tertulis untuk
3 bentuk Uraian)
Batasan pertanyaandan jawaban yang diharapkan sudah
sesuai
Materi yang ditanyakan sesuai dengankompetensi (urgensi,
4 relevasi, kontinyuitas, keterpakaian sehari- hari tinggi)
Isi materi yang ditanyakan sesuai dengan jenjang jenis
B sekolah atau tingkatkelas
5 Konstruksi
Menggunakan kata tanya atau perintahyang menuntut
jawaban uraian
6 Ada petunjukyang jelas tentangcara mengerjakan soal
Ada pedoman penskorannya
7 Tabel, gambar, grafik, peta,atau yang sejenisnya disajikan
8 dengan jelas dan terbaca
NomorSoal
No. Aspek yang ditelaah 1 2 3 4 5 6 7 8 9 ...
C. Bahasa/Budaya
9 Rumusan kalimat coal komunikatif
Butir soal menggunakan bahasa
10 Indonesia yang baku
Tidak menggunakan kata/ungkapan yang menimbulkan
11 penafsiran ganda atau salah pengertian
Tidak menggunakan bahasa yang berlaku setempat/tabu
12 Rumusan soal tidak mengandung
13

Keterangan : Berilah tanda (V) bila tidak sesuai dengan aspek yangditelaah !

b. Format Penelaahan untuk Instrumen pilihan ganda


FORMAT PENELAAHAN SOAL BENTUK PILIHAN GANDA
Mata Pelajaran :.................................
Kelas/semester:.................................
Penelaah:.................................

Nomor S
oal
N ..
o. Aspek yang ditelaah 1 2 3 45.
A. Materi
1 Soal sesuai dengan indikator (menuntuttes tertulis untuk bentuk pilihan
ganda
2. Materi yang ditanyakan sesuai dengan kompetensi
(urgensi,relevasi, kontinyuitas, keterpakaian sehari- hari tinggi)
Pilihan jawaban homogen dan logis
3. Hanya ada satu kunci jawaban
4. Konstruksi
Pokok soal dirumuskan dengansingkat,jelas,dan tegas
B. Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang
5. diperlukan saja
Pokok soal tidak memberi petunjuk kunci jawaban
6. Pokok soal bebas dan pernyataan yang bersifat negatif ganda
Pilihan jawaban homogen dan logis ditinjau dari segi materi
7. Gambar, grafik, tabel, diagram, atausejenisnya
jelas dan berfungsi
8 Panjang pilihan jawaban relatif sama
Pilihan jawaban tidak menggunakan pernyataan "semua jawaban di atas
9. salah/benar"dan sejenisnya
Pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan
10 besar kecilnya angka atau kronologisnya
. Butir soal tidak bergantung pada jawaban soal sebelumnya

11
.
12
.

13
.

14
.
C.
15
.

16 Bahasa/Budaya
. Menggunakan bahasa yang sesuai dengankaidah bahasa Indonesia
17 Menggunakan bahasa yang komunikatif
. Tidak menggunakan bahasa yangberlakusetempat/tabu
18 Pilihan jawaban tidak mengulangkata/kelompok kata yang sama,kecualimerupa
. kan satu kesatuan pengertian
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

c. Format Penelaahan untuk Instrumen Perbuatan


FORMAT PENELAAHAN SOAL TES PERBUATAN
Mata Pelajaran:.................................
Kelas/semester: .................................
Penelaah :.................................
Nomor Soal
No. Aspek yang ditelaah 1 2 3 ...
Materi
. Soal sudah sesuai dengan indikator (menuntut tes
1. perbuatan: kinerja, hasil karya, atau penugasan)
Pertanyaan dan jawaban yang diharapkan sudah sesuai
2. Materi sesuai dengan tuntutan kompetensi (urgensi,
3. relevansi, kontinyuitas, keterpakaian sehari-hari tinggi)
Isi materi yang ditanyakan sesuai dengan jenjang jenis
4. sekolah taua tingkat kelas
Konstruksi
B. Menggunakan kata tanya atau perintah yang menuntut
5. jawaban perbuatan/praktik
Ada petunjuk yang jelas tentang cara mengejakan soal
6. Ada pedoman penskorannya
7. Tabel, peta, gambar, grafik, atau sejenisnya disajkian
8. dengan jelas dan terbaca
Bahasa/Budaya
C. Rumussan soal komunikatif
9. Butir soal menggunakan bahasa Indonesia yang baku
10. Tidak menggunakan kata /ungkapan yang menimbulkan
11. penafsiran ganda atau salah pengertian
Tidak menggunakan bahasa yang berlaku setempat/tabu
12. Rumusan soal tidak mengandung kata/ungkatpan yang
13. dapat menyinggung perasaan siswa
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
d. Format Penelaahan untuk Instrumen Non-Tes
FORMAT PENELAAHAN SOAL NON-TES
Nama Tes :.................................
Kelas/semester: .................................
Penelaah :.................................
Nomor Soal
No. Aspek yang ditelaah 1 2 3 ...
A.
1. Materi
Pernyataan/soal sudah sesuai dengan rumusan indikator
2. dalam kisi-kisi.
Aspek yang diukur pada setiap pernyataan sudah sesuai
dengan tuntutan dalam kisi-kisi (misal untuk tes sikap:
aspek koginisi, afeksi, atau konasinya dan pernyataan
positif atau negatifnya).
B. Konstruksi
3. Pernyataan dirumuskan dengan singkat (tidak melebihi
20 kata ) dan jelas.
4. Kalimatnya bebas dari pernyaatn yang tidak relevan
objek yang dipersoalkan atau kalimatnya merupakan
pernyataan yang diperlukan saja.
5. Kalimatnya bebas dari pernyataan yang bersifat negatif
ganda.
6. Kalimatnya bebas dari pernyataan yang mengacu pada
masa lalu.
7. Kalimatnya bebas dari pernyataan faktual atau dapat
diinterpretasikan sebagai fakta.
Kalimatnya bebas dari pernyataan dapat
8. diinterpretasikan lebih
Kalimatnya bebas dari pernyataan yang
9. mungkin disetujui atau dikosongkan oleh hampir semua
responden.
Setiap pernyataan hanya berisi satu gagasan secara
10. lengkap.
Kalimatnya bebas dari pernyatan yang tidak pasti pasti
11. seperti semua, selalu, kadang-kadang, tidak satupun,
tidak pernah.
Jangan banyak menggunakan kata hanya, sekedar,
12. semata-mata gunakan seperlunya.
Bahasa/Budaya
C. Bahsa soa harus komunikatif dan sesuai dengan
13. jenjang pendidikan siswa atau responden.
Soal harus menggunakan bahasa Indonesia baku. Soal
14. tidak menggunakan bahasa yang berlaku
15. setempat/tabu.
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
B. Parameter Item Tes yang Baik
Sebagaimana telah disebut sebelumnya, bahwa item tes yang baik adalah item yang
memenuhi syarat sebagaimana kriteria atau karakteristik item tes yang baik. Karakteristik item
yang dimaksud adalah tingkat kesulitan atau kesukaran, daya pembeda, dan efektivitas pengecoh.

1. Tingkat Kesulitan atau Kesukaran (Difficulty level)


Tingkat kesukaran soal adalah peluang menjawab benar suatu soal pada tingkat
kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Tingkat kesukaran
dinyatakan dalam indeks kesukaran (dificulty index), yaitu angka yang menunjukkan proporsi
siswa yang menjawab benar soal tersebut. Semakin besar indeks tingkat kesukaran yang
diperoleh dan hasil hitungan, berarti semakin mudah soal itu.
Dalam hal ini, item yang baik adalah item yang tingkat kesukarannya dapat diketahui,
tidak terlalu sukar dan tidak terlalu mudah. Sebab, tingkat kesukaran item itu memiliki korelasi
dengan daya pembeda. Bilamana item memiliki tingkat kesukaran yang maksimal, maka daya
pembedanya akan rendah, demikian pula bila item itu terlalu mudah maka tidak akan memiliki
daya pembeda.
Oleh karena itu, sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas yang
mampu memberikan daya pembeda. Namun, jika terdapat tujuan khusus dalam penyusunan tes,
maka tingkat kesukaran itu bisa dipertimbangkan. Misalnya, tingkat kesukaran item untuk tes
sumatif berbeda dengan tingkat kesukaran pada tes diagnostik.
Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan rumus sebagai berikut:
TK = U + L
T
Keterangan:
U = jumlah siswa yang termasuk kelompok pandai (upper group)yang menjawab benar untuk tiap soal.
L = jumlah siswa yang termasuk kurang (lower group) yang menjawab benar untuk tiap soal.
T = jumlah siswa dari kelompok pandai dan kelompok kurang(jumlah upper group dan lower group)
Misalkan suatu tes yang terdiri atas N soal yang diberikan kepada 40 siswa. Dari hasil tes
tersebut, tiap-tiap soal dianalisis taraf kesukarannya. mula-mula hasil tes itu kita susun kedalam
peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa kelompok pandai), dan 10 lembar
jawaban siswa dari kelompok yang kurang pandai. Kemudian kita tabulasikan. Misalkan dari
tabulasi soal kita peroleh hasil sebagai berikut: yang menjawab benar dari kelompok pandai ada
9 siswa, dan yang menjawab benar dari kelompok kurang pandai ada 4 siswa.
Dengan menggunakan rumus diatas, maka taraf kesukaran atau TK dari soal adalah:
TK = U + L = 9 + 4 = 0,65 atau 65%
T 20
Jadi dapat disimpilkan bahwa nilai dari TK atau tingkat kesukarannya adalah 65%.
Sedangkan dalam bukunya Drs. H. Daryanto, rumus untuk mencari taraf kesukaran atau indeks
kesukaran adalah:
P= B
JS
Keterangan:
P = indeks kesukaran.
B = banyaknya siswa yang menjawab soal itu dengan benar.
JS = jumlah seluruh siswa peserta tes.
Contoh:
Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40 siswa tersebut terdapat 12
siswa yang mampu mengerjakan soal no. 1 dengan benar. Maka berapa indeks kesukarannya?
Jawab:
P = B
JS
= 12
40
= 0,30
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut:
a. Soal dengan P 0,00 sampai 0,30 adalah soal sukar.
b. Soal dengan P 0,30 sampai 0,70 adalah soal sedang.
c. Soal dengan P 0,70 sampai 1,00 adalah soal mudah.
2. Daya Pembeda
Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal mampu
membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang belum
atau kurang menguasai kompetensi berdasarkan kriteria tertentu. Semakin tinggi koofisien daya
pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan antara peerta didik
yang menguasai kompetensi dengan pesertan didik yang kurang menguasai kompetensi.
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi. Daya pembeda
suatu soal tes dapat dihitung dengan menggunakan rumus sebagai berikut:
DP = U – L
½T
Keterangan:
DP = indeks DP atau daya pembeda yang dicari.
U = jumlah siswa yang termasuk dalam kelompok pandai yang mampu menjawab benar untuk tiap
soal.
L = jumlah siswa yang termasuk kurang yang menjawab benar untuk tiap soal.
T = jumlah siswa keseluruhan.
Contoh:
Dari hasil tes lomba olimpiade IPS, jumlah siswa yang dites adalah 40 siswa, sedangkan tes
tersebut terdiri dari 20 soal. Setelah hasil tes tersebut diperiksa, kemudian disusun kedalam
peringkat untuk menentukan 25% siswa yang termasuk kelompok pandai (upper group) dan 25%
siswa yang termasuk kelompok kurang (lower group).
Kemudian hasil tes tersebut ditabulasikan dengan menggunakan format tabulasi jawaban tes,
kemudian hasil tabulasi dari kedua kelompok tersebut dimasukkan kedalam format analisis soal
tes, sehingga kita dapat menghitung tingkat kesukaran dan daya pembeda tiap soal yang kita
analisis.
Misalkan dari tabulasi soal no. 1 kita peroleh hasil sebagai berikut: yang menjawab benar dari
kelompok pandai ada 10 siswa, dan yang menjawab benar dari kelompok kurang ada 9 siswa.
Maka daya pembedanya adalah:
DP = U – L
½T
= 10 – 9
½ x (20)
= 1
10
= 0,10
Jadi dapat disimpulkan bahwa indeks pembedanya adalah 0,10.
Dalam bukunya Prof. Dr. Suharsimi Arikunto, dijelaskan mengenai klasifikasi daya pembeda,
yaitu:
D = 0,00 – 0,20 = jelek (poor).
D = 0,20 – 0,40 = cukup (satisfactory).
D = 0,40 – 0,70 = baik (good).
D = 0,70 – 1,00 = baik sekali (excellent).
3. Analisis pengecoh (Efektifitas Distraktor )
Instrumen evaluasi yang berbentuk tes dan objektif, selain harus memenuhi syarat-syarat yang
telah disebutkan terdahulu, harus mempunyai distraktor yang efektif. Yang disebut dengan
distraktor atau pengecoh adalah opsi-opsi yang bukan merupakan kunci jawaban (jawaban
benar).
Butir soal yang baik pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab
salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata.
Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau
mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus:
IP = P x 100%
(N - B) (n - 1)
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban
1= bilangan tetap
Catatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci jawaban), maka
IP = 0 yang berarti soal tersebut jelek. Dengan demikian pengecoh tidak berfungsi.
Contoh:
50 orang peserta didik dites dengan 10 soal bentuk pilihan ganda. Tiap soal memiliki alternatif
jawaban (a, b, c, d, e). Kunci jawaban (jawaban yang benar) no. 8 adalah c. Setelah soal no.8
diperiksa untuk semua peserta didik, ternyata dari 50 orang peserta didik, 20 peserta didik
menjawab benar dan 30 peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata.

Berikut ini adalah contoh soal no.8.


Alternatif jawaban A B C D E
Distribusi jawaban peserta 7 8 20 7 8
didik
IP 93% 107% ** 93% 107%
Kualitas pengecoh ++ ++ ++ ++ ++

Keterangan:
** = kunci jawaban
++ = sangat baik
+ = baik
= kurang baik
_ = jelek
_ _ = sangat jelek
Pada contoh diatas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan 107%. Semuanya
dekat dengan angka 100%, sehingga digolongkan sangat baik sebab semua pengecoh itu
berfungsi. Jika pilihan jawaban peserta didik menumpuk pada satu alternatif jawaban, misalnya
seperti berikut:
Alternatif jawaban A B C D E
Distribusi jawaban peserta didik 20 2 20 8 0
IP 267% 27% ** 107% 0%
Kualitas pengecoh _ - ** ++ _
Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan (b) tidak
berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu diganti karena termasuk
jelek, danpengecoh (b) perlu direvisikarena kurang baik. adapun kualitas pengecoh berdasar
indeks pengecoh adalah:
1) Sangat baik IP = 76% - 125%
2) Baik IP = 51% - 75% atau 126% - 150%
3) Kurang baik IP = 26% - 50% atau 151% - 175%
4) Jelek IP = 0% - 25% atau 176% - 200%
5) Sangat jelek IP = lebih dari 200%

D. Manfaat Kegiatan Menganalisis Butir Soal


Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina (1997) dalam Suprananto
(2012), analisis butir soal memiliki banyak manfaat, diantaranya yakni:
1) Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan.
2) Relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa dikelas.
3) Mendukung penulisan butir soal yang efektif.
4) Secara materi dapat memperbaiki tes di kelas.
5) Meningkatkan validitas soal dan reliabilitas.
Linn dan Gronlund (1995) dalam Suprananto (2012: 163), menambahkan bahwa pelaksanaan
kegiatan analisis butir soal, biasanya didesain untuk menjawab pertanyaan-pertanyaan berikut:
1) Apakah fungsi soal sudah tepat?
2) Apakah soal telah memiliki tingkat kesukaran yang tepat?
3) Apakah soal bebas dari hal-hal yang tidak relevan?
4) Apakah pilihan jawabannya efektif?
Selain itu, data hasil analisis butir soal juga sangat bermanfaat sebagai dasar untuk:
1) Diskusi tentang efisien hasil tes,
2) Kerja remedial
3) Peningkatan secara umum pembelajaran di kelas,
4) Peningkatan keterampilan pada kontruksi tes.
Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal memberikan manfaat:
1) Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik,
2) Meningkatkan butir soal melalui tiga komponen analisis yaitu, tingkat kesukaran, daya
pembeda dan pengecoh soal,
3) Merevisi soal yang tidak relevan degan materi yang diajarkan, ditandai dengan banyaknya anak
yang tidak dapat menjawab butir soal tertentu.

E. Kriteria Kualitas Butir Soal


Berdasarkan uraian di atas, menurut pandangan teori tes klasik secara empiris mutu butir
soal ditentukan oleh statistik butir soal yang meliputi : tingkat kesukaran, daya beda dan
efektifitas distraktor. Menurut statistik butir, kualitas butir soal secara keseluruhan dapat
dikategorikan sebagai berikut :
Klasifikasi Kualitas Butir Soal
Kategori Kriteria Penilaian
Baik Apabila
(1). Tingkat kesukaran 0,25 ≤ p ≤ 0,75.
(2). Korelasi biserial butir soal ≥ 0,40 dan
(3). Korelasi biserial alternatif jawaban (distraktor) bernialai negatif.
Revisi Apabila
(1). Tingkat kesukaran p < 0,25 atau p > 0,75 tetapi korelasi biserial butir ≥ 0,40 dan korelasi biserial
distraktor bernilai negatif.
(2). Tingkat kesukaran 0,25 ≤ p ≤ 0,75 dan korelasi biserial butir soal ≥ 0,40 tetapi ada korelasi
biserial pada distraktor yang bernilai positif
(3). Tingkat kesukaran 0,25 ≤ p ≤ 0,75 dan korelasi biserial butir soal antara 0,20 sampai 0,30 tetapi
korelasi distraktor bernilai negatif selain kunci atau tidak ada yang lebih besar nilainya dari kunci
jawaban.
Tidak baik Apabila
(1). Tingkat kesukaran p < 0,25 atau p > 0,75 dan ada korelasi biserial pada distraktor bernilai positif
(2). Korelasi biserial butir soal < 0,20, (3). Korelasi biserial butir soal < 0,30 dan korelasi biserial
distraktor bernilai positif.10

F . Reliabilitas
Reliabilitas adalah suatu hal yang sangat penting pada alat pengukuran standar. Reliabilitas
dihubungkan dengan pengertian adanya ketepatan tes dalam pengukurannya. Reliabilitas adalah
kestabilan skor yang diperoleh peserta tes yang sama ketika diuji ulang dengan tes yang sama
pada situasi yang berbeda atau dari suatu pengukuran ke pengukuran lainnya. Dengan kata lain
reliabilitas merupakan tingkat konsistensi atau kemantapan hasil terhadap hasil dua pengukuran
hal yang sama. Dapat juga diartikan sebagai tingkat kepercayaan dari
suatu alat ukur (Depdikbud : 1997). Hasil pengukuran diharapkan akan sama apabila pengukuran
itu diulangi. Dengan perangkat tes yang reliabel, apabila tes itu diberikan dua kali pada peserta
yang sama tetapi dalam selang waktu yang berbeda sepanjang tidak ada perubahan dalam
kemampuan maka skor yang diperoleh akan konstan. Kriteria untuk menentukan tinggi
rendahnya reliabilitas sebuah perangkat tes, menurut (Suharsimi Arikunto : 2001) dilihat pada
rentangan koefesien korelasi sebagai berikut :
Klasifikasi Tingkat Reliabilitas Tes
Kategori Reliabilitas Tes Nilai Koefesien Korelasi
1) Sangat Tinggi 0,800 – 1,000
2) Tinggi 0,600 – 0,799
3) Cukup 0,400 – 0,599
4) Rendah 0,200 – 0,399
5) Sangat Rendah 0,000 – 0,199

Anda mungkin juga menyukai