Anda di halaman 1dari 8

ANALISIS BUTIR SOAL

Oleh Kelompok 10

(Reni Retnawati Malaka, Karmeliana Lalu, Maria Emila Santi, Maria Anjelina Pau, Yulius Dappa)

Semester VI, Prodi PPKn, Universitas Nusa Cendana

Abstrak

Makalah ini bertujuan untuk mengkaji dan memberikan informasi mengenai analisis butir soal.
Penulisan makalah ini menggunakan metode deskriptif kualitatif yakni pengambilan infor masi melalui
kajian kepustakaan buku-buku evaluasi pembelajaran maupun yang bersumber dari internet. Analisis soal
antara lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang lebih atau sedang dan
soal yang tidak baik. Dengan analisis soal dapat diperoleh informasi tentang kekurangan sebuah soal tes
dan “petunjuk” untuk mengadakan perbaikan. Dalam tes dan pengukuran, dikenal beberapa karakteristik
butir soal. Untuk tes hasil belajar pada umumnya dipertimbangkan tiga karakteristik butir soal, yaitu :
tingkat kesukaran, daya beda dan distribusi jawaban atau berfungsi tidaknya pilihan jawaban (distraktor).
Ketiga karakteristik butir soal ini secara bersama-sama akan menentukan mutu butir soal. Bila salah satu
dari ketiga karakteristik ini tidak memenuhi persyaratan maka mutu butir soal akan turun.

Kata Kunci: Perlunya Analisis Butir Soal, Karakteristik Butir Soal, Tingkat Kesukaran , Daya Pembeda,
Berfungsi Tidaknya pilihan

PENDAHULUAN
Dalam dunia pendidikan, penilaian merupakan bagian yang tidak terpisahkan dari proses belajar
mengajar. Sistem penilaian yang baik akan mendorong guru menggunakan strategi mengajar yang lebih
baik dan memotivasi anak untuk belajar lebih giat. Penilaian biasanya dimulai dengan kegiatan
pengukuran. Pengukuran (measurement) merupakan cabang ilmu statistika terapan yang bertujuan untuk
membangun dasar-dasar pengembangan tes yang lebih baik sehingga menghasilkan tes yang berfungsi
secara optimal, valid, dan reliabel.
Proses belajar mengajar dilaksanakan tidak hanya untuk kesenangan atau bersifat mekanis saja
tetapi mempunyai misi atau tujuan bersama. Dalam usaha untuk mencapai misi dan tujuan itu perlu
diketahui apakah usaha yang dilakukan sudah sesuai dengan tujuan? Untuk mengetahui apakah tujuan
pendidikan sudah tercapai perlu diadakan tes. Sebuah tes yang dapat baik sebagai alat pengukur harus
dianalisis terlebih dahulu. Dalam menganalisis butir soal dalam tes harus memperhatikan daya serap,
tingkat kesukaran, daya beda, fungsi pengecoh, . Hal tersebut dilakukan agar tes yang diberikan kepada
siswa sesuai dengan daya serap siswa, tingkat kesukarannya, dan soal yang diberikan pun harus valid.
Sehingga, tujuan dari pembelajaran dapat tercapai.

PEMBAHASAN
Analisis butir soal adalah suatu kegiatan analisis untuk menentukan tingkat kebaikan butir-butir
soal yang terdapat dalam suatu tes sehingga informasi yang dihasilkan dapat kita perpergunakan untuk
memperbaiki butir soal dalam tes tersebut.
Penilaian terhadap butir soal pada dasarnya merupakan analisis butir soal, dan selama ini pada
umumnya para ahli pengukuran mengatakan bahwa analisis butir soal maksudnya adalah penilaian
terhadap soal. Telah diketahui bersama bahwa penyusunan tes sangat mempengaruhi kualitas butir soal.
Pendekatan untuk menganalisis butir soal yang berkembang saat ini terdiri dari dua pendekatan
yaitu pendekatan klasik dan pendekatan modern. Kedua pendekatan ini masing-masing memiliki
kelebihan dan kekurangan. Namun keduanya masih sering digunakan dalam analisis butir soal. Analisis
butir soal dengan pendekatan klasik diantaranya dapat dilakukan menggunakan Program Iteman.
Dengan melihat beberapa persyaratan yang harus dipenuhi, penyusunan tes dituntut untuk mengikuti
pedoman penyusunan tes dan melakukan ujicoba. Kemudian berdasarkan hasil ujicoba, respon peserta
dianalisis menggunakan Program Iteman untuk mendapatkan karakteristik butir soal.
Data hasil analisis dengan Program Iteman dianalisis kembali menggunakan instrumen penilaian
butir soal yang memenuhi syarat sebagai alat ukur yang baik. Suryabrata (1999) menyatakan bahwa
analisis butir soal mencakup telaah soal atau analisis kualitatif dan analisis terhadap data empirik hasil
ujicoba atau analisis kuantitatif.
Analisis butir soal secara kualitatif menekankan penilaian dari ketiga segi yaitu materi, konstruksi, dan
bahasa. Namun demikian dalam pembahasan ini dikhususkan untuk menjelaskan analisis butir soal secara
kuantitatif.
Analisis ini dilakukan berdasarkan data yang diperoleh secara empiris melalui ujicoba dari suatu
perangkat tes. Analisis kuantitatif sering disebut dengan analisis item yang menghasilkan karakteristik
atau parameter butir dan tes, yaitu: tingkat kesukaran, daya beda dan distribusi jawaban dan kunci setiap
butir, serta reliabilitas dan kesalahan pengukuran (SEM) dalam tes.
Telah disinggung di depan bahwa analisis soal antara lain bertujuan untuk mengadakan identifikasi
soal-soal yang baik, kurang lebih atau sedang dan soal yang tidak baik. Dengan analisis soal dapat
diperoleh informasi tentang kekurangan sebuah soal tes dan “petunjuk” untuk mengadakan perbaikan.
Dalam tes dan pengukuran, dikenal beberapa karakteristik butir soal. Untuk tes hasil belajar pada
umumnya dipertimbangkan tiga karakteristik butir soal, yaitu : tingkat kesukaran, daya beda dan
distribusi jawaban atau berfungsi tidaknya pilihan jawaban (distraktor). Ketiga karakteristik butir soal ini
secara bersama-sama akan menentukan mutu butir soal. Bila salah satu dari ketiga karakteristik ini tidak
memenuhi persyaratan maka mutu butir soal akan turun.
A. Perlunya Analisis Butir Soal
Ada beberapa alasan mengapa diperlukan analisis butir soal. Menurut (Asmawi Zainul,
dkk :1997) alasan tersebut antara lain :
a. Untuk mengetahui kekuatan dan kelemahan butir tes, sehingga dapat dilakukan seleksi dan revisi
butir soal.
b. Untuk menyediakan informasi tentang spesifikasi butir soal secara lengkap, sehingga akan lebih
memudahkan bagi pembuat soal dalam menyusun perangkat soal yang akan memenuhi kebutuhan
ujian dalam bidang dan tingkat tertentu.
c. Untuk segera dapat mengetahui masalah yang terkandung dalam butir soal, seperti: kemenduaan
butir soal, kesalahan meletakkan kunci jawaban, soal yang terlalu sukar dan terlalu mudah, atau
soal yang mempunyai daya beda rendah. Masalah ini bila diketahui dengan segera akan
memungkinkan bagi pembuat soal untuk mengambil keputusan apakah butir soal yang
bermasalah itu akan digugurkan atau direvisi guna menentukan nilai peserta didik.
d. Untuk dijadikan alat guna menilai butir soal yang akan disimpan dalam kumpulan soal.
e. Untuk memperoleh informasi tentang butir soal sehingga memungkinkan untuk menyusun
beberapa perangkat soal yang paralel. Penyusunan perangkat seperti ini sangat bermanfaat bila
akan melakukan ujian ulang atau mengukur kemampuan beberapa kelompok peserta tes dalam
waktu yang berbeda.
B. Karakteristik Butir Soal
1. Tingkat kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya
soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai
semangat untuk mencoba lagi karena di luar jangkauannya (Suharsimi Arikunto : 2001).
Seorang siswa akan menghafal akan kebiasaan guru-gurunya dalam hal pembuatan soal ini.
Misalnya saja guru A dalam memberikan ulangngan soalnya mudah-mudah, sebaliknya guru B
kalau memberikan ulangan soalnya sukar-sukar. Dengan pengetahuannya tentang kebiasaan ini,
maka siswa akan belajar giat jika menghadapi ulangan dari guru B dan sebaliknya mendapat
ulangan dari guru A, tidak mau belajar giat atau bahkan mungkin tidak mau belajar sama sekali.
Bilangan yang menunjukan sukar atau mudahnya sesuatu soal disebut indeks kesukaran
(diificulty indeks). Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran
ini menunnjukan taraf kesukaran soal. Soal dan indeks kesukaran 0,0 menunjukan bahwa soal itu
terlalu sukar. Sebaliknya , indeks 1,0 menunnjukan bahwa soal terlalu mudah.

0,00 ____________ 1,0


sukar mudah

Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P, singkatan dari “Proporsi
“. Dengan demikian, soal dengan P = 0.70 lebih mudah jika dibandingkan dengan P= 0, 20.
Sebaliknya, soal dengan P = 0,30 lebih sukar dari pada soal dengan P= 0,80.

Melihat besarnya bilangan indeks ini, maka lebih cocok jika bukan disebut sebagai
indeks kesukaran, tetapi indeks kemudahan atau indeks fasilitas, karena semakin mudah soal itu,
semakin besar pulah bilangan indeksnya. Akan tetapi disepakati bahwa walaupun semakin tinggi
indeksnya menunjukan soal yang semakin mudah, tetapi tetap disebut indeks kesukaran.

B
Rumus mencari P adalah: P=
JS
Dimana:
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai
berikut:

 Soal dengan P 0,00 sampai 0,30 adalah soal sukar


 Soal dengan P 0,31 sampai 0,70 adalah soal sedang
 Soal dengan P 0,71 sampai 1,00 adalah soal mudah
Walaupun demikian, ada yang berpendapat bahwa soal-soal yang dianggap baik, yaitu
soal sedang adalah soal-soal yang mempunyai indeks kesukaran 0,30 sampai 0,70.
Perlu diketahui bahwa soal-soal yang terlalu mudah atau terlalu sukar, lalu tidak berarti
tidak boleh digunakan. hal ini tergantung dengan penggunaannya. Jika dari pengikut yang banyak
, kita menghendaki yang lulus hanya sedikit, kita ambil siswa yang paling top. Untuk ini maka
lebih baik diambilkan butir- butir tes yang sukar.
Sebaliknya, jika kekurangan pengikut ujian, kita pilihkan soal-soal yang mudah. Selain
itu, soal yang sukar akan menambah gairah belajar bagi yang pandai, sedangkan soal-soal yang
terlaluh mudah akan membangkintkan semangat kepada siswa yang lemah.
2. Daya Pembeda
Daya pembeda soal, adalah kemampuan suatu soal untuk membedakan antara siswa yang
berkemampuan tinggi dan siswa yang berkemampuan rendah.Angka yang menunjukan besarnya
daya pembeda tersebut indeks diskriminasi. perti halnya indeks kesukaran, indeks diskriminasi
(daya pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya bedannya ,indeks kesukaran tidak
mengenal tanda negatif (-) tetapi pada indeks diskriminasi ada tanda negatif.tanda negatif pada
indeks diskriminasi digunakn jika sesuatu soal “terbalik” menujukan kualitas testee.
Bagi soal yang pada di jawab benar oleh siswa yang berkempuan tinggi maupun
berkemampuan rendah maka soal itu tidak baik karena tidak mempunyai pembeda. Demikian
pula jika semua siswa baik pandai maupun bodoh tidak dapat menjawab dengan benar.Soal
tersebut tidak baik juga karena tidak mempunyai daya pembeda.Soal yang baik adalah soal yang
dapat dijawab benar oleh siswa-siswa yang pandai saja.
Seluruh pengikut tes dikelompokkan menjadi 2 (dua) kelompok,yaitu kelompok pandai
atau kelompok atas (upper group) dn kelompok bawah (lower group).
Jika seluruh kelompok atas dapat menjawab soal tersebut dengan benar,sedang seluruh
kelompok bawah menjawab salah maka soal tersebut mempunyai D paling besar,yaitu
1,00.Sebaliknya,jika semua kelompok atas menjawab salah,tetapi semua kelompok bawah
menjawab betul maka nilai D-nya-1,00.Akan tetapi,jika siswa kelompok atas dan siswa kelompok
bawah ssama-sama menjawab benar atau sama-sama menjawab salah maka soal tersebut
mempunyai nilai D 0,00.Karena tidak mempunyai daya pembeda sama sekali
a. Cara menentukan daya pembeda (nilai D)
Untuk ini perlu dibedakan antara kelompok kecil(kurang dari 100)dan kelompok besar (100
orang ke atas).
1) Untuk kelompok kecil
Seluruh kelompok testee dibagi dua sama besar,50% kelompok atas dan 50% kelompok
bawah
2) Untuk kelompok besar
Mengingat biaya dan waktu untuk menganalisis maka untuk kelompok besar biasanya
hanya diambil kedua kutubnya saja,yaitu 27% skor teratas sebagai kelompok atas ( J A ¿
dan 27 % skor terbawah sebagai kelompok bawah ((J B).

J A = Jumlah kelompok atas


J B = Jumlah kelompok bawah

b. Rumus Mencari D
Rumus uuntuk menentukan indeks diskriminasi adalah:

BA BB
D= − =P A−¿ P ¿
J A JB B

Dimana:

J = Jumlah peserta tes


J A =¿¿ Banyaknya peserta kelompok atas
J B =¿¿ Banyaknya peserta kelompok bawah
B A = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
BB =¿ ¿ banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar
P A =¿ ¿ proporsi peserta kelompok atas yang menjawab benar ( ingat, P sebagai indeks kesukaran)
PB =¿¿ Proporsi peserta kelompok bawah yang menjawab benar

Butir soal yang baik adalah butir-butir soal yang mempunyai indeks
diskriminasi 0,4 sampai dengan 0,7.

Klasifikasi daya pembeda dibagi menjadi beberapa seperti berikut:


D : 0,00 -0,20 : jelek (poor)
D: 0,21- 0,40 :cukup ( satistifactory)
D: 0,41 -0,70 : baik (good)
D : 0,71 – 1,00 : baik sekali (excellent)
D : negatif, semua tidak baik . Jadi semua butir soal yang mempunyai nilai D
negatif sebaiknya dibuang saja

3. Berfungsi Tidaknya Pilihan


Pada saat membicarakan tes objektif bentuk multiple choice item tersebut untuk setiap butir
item yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan beberapa kemungkinan
jawab, atau yang sering dikenal dengan istilah option atau alternatif. option atau alternatif itu
jumlahnya berkisar antara 0 sampai dengan 5 buah, dan dari kemungkinan-kemungkinan jawaban
yang terpasang pada setiap butir item itu, salah satu diantaranya adalah merupakan jawaban betul
(kunci jawaban), sedangkan sisanya adalah merupakan jawaban salah. Jawaban-jawaban salah
itulah yang biasa dikenal dengan istilah distractor (pengecoh).
Fungsi pengecoh dimaksudkan untuk mengetahui seberapa besar peserta yang tidak
memiliki kunci jawaban (option) pada bentuk soal pilihan ganda. !ntuk soal pilihan ganda,
alternatif jawaban menurut kaidah harus homogen dan logis sehingga setiap pilihan jawaban
(opition) dapat berfungsi atau ada yang memilih. Setiap pengecoh dapat dikatakan berfungsi
apabila ada yang memilih. Setiap pengecoh dapat dikatakan berfungsi apabila terpilih minimal
sebanyak 5% dari jumlah peserta.untuk menghitungnya dapat digunakan rumus sebagai berikut:
jumla h siswa yang memilih opsion yang salah
x 100 %
jumla h seluru h peserta didik
Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu : menganalisis pola
penyebaran jawaban item. Adapun yang dimaksud dengan pola penyebaran jawaban item adalah
suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabnya terhadap
kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir item. Suatu
kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif yang dipasang pada butir item
tertentu, sama sekali tidak dipilih oleh testee. Dengan kata lain, testee menyatakan -blangko.
Pernyataan blangko ini sering dikenal dengan istilah omit dan biasa diberi lambang dengan huruf
H. Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka
distraktor yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai lagi pada tes-tes
yang akan datang, sedangkan distraktor yang belum dapat berfungsi dengan baik sebaiknya
diperbaiki atau diganti dengan distraktor yang lain (Anas,2011:408).
KESIMPULAN

Analisis butir soal adalah suatu kegiatan analisis untuk menentukan tingkat kebaikan butir-butir
soal yang terdapat dalam suatu tes sehingga informasi yang dihasilkan dapat kita perpergunakan untuk
memperbaiki butir soal dalam tes tersebut.
Untuk tes hasil belajar pada umumnya dipertimbangkan tiga karakteristik butir soal, yaitu :
tingkat kesukaran, daya beda dan distribusi jawaban atau berfungsi tidaknya pilihan jawaban (distraktor).
Ketiga karakteristik butir soal ini secara bersama-sama akan menentukan mutu butir soal. Bila salah satu
dari ketiga karakteristik ini tidak memenuhi persyaratan maka mutu butir soal akan turun.

REFERENSI

Arikunto, Suharsimi. 2018. DASAR-DASAR EVALUASI PENDIDIKAN, EDISI 3. Jakarta: Bumi


Aksara.

Asmawi Zainul dan Noehi Nasoetion. 1997. Penilaian Hasil Belajar. Pusat Antar Universitas, Direktorat
Jenderal Pendidikan Tinggi: Departemen Pendidikan Dan kebudayaan.

Arifin, Zaenal. 2009. EVALUASI PEMBELAJARAN. Bandung; PT. REMAJA.

Kusaeri dan Suprananto. 2012. Pengukuran dan Penilaian Pendidikan. Jakarta; GRAHA ILMU

Utami, Rizky Dayu. Makalah Analisis Butir Soal.


https://www.academia.edu/9808266/Makalah_Analisis_Butir_Soal. Diakses pada tanggal 5 Mei 2021.
Pukul 12.52 .

Anda mungkin juga menyukai