Anda di halaman 1dari 23

KATA PENGANTAR

Dengan menyebut nama Allah SWT Yang Maha Pengasih lagi Maha
Penyayang, serta segala puji dan syukur kepada-Nya yang telah memberikan
rahmat, taufik dan hidayah-Nya.Tak lupa pula shalawat serta salam kami
ucapkan kepada Nabi besar Muhammad SAW beserta keluarga, sahabat-
sahabat dan para pengikut beliau hingga akhir zaman.

Alhamdulillah kami dapat menyelesaikan Tugas Mata Kuliah Evaluasi


pendidikan dengan tema “Teknik Penskoran dan Analisis Soal”. Kami
menyadari bahwa dalam pembuatan makalah ini masih terdapat banyak
kekurangan dan kesalahan. Oleh karena itu kami sangat mengharapkan kritik
dan saran yang bersifat membangun demi kesempurnaan makalah ini, baik dari
teman-teman mahasiswa maupun dosen pembimbing.

Semoga makalah ini bermanfaat bagi pembaca dan kita dimudahkan


dalam menuntut ilmu yang bermanfaat untuk dunia dan akherat, terima kasih
banyak atas perhatiannya.

DAFTAR ISI

STAI SABILI BANDUNG 1


KATA PENGANTAR…………………….…,……………….…….…...1

BAB I PENDAHULUAN

1.1 Latar Belakang ………………………..………………….….....…3


1.2 Rumusan Masalah …………………..………………………,,,.… 3
1.3 Tujuan Penulisan……………………..…………………......……..3

BAB II PEMBAHASAN

2.1. Pengertian Penskoran dan Penilaian............................................4


2.2. Perbedaan Penskoran dan Penilaian……………………..........….6
2.3. Alat Bantu Pemberian Skor…..........……….........................……7
2.4. Pemberian Skor Dalam Berbagai Bentuk Tes…………............…7
2.5. Kunci Jawaban Dan Kunci Pemberian Skor Untuk Tugas..........10
2.6. Pengertian Analisis Butir Soal....................................................11
2.7. Teknik Analisis Butir Soal.........................................................12
2.8. Parameter Item Tes Yang Baik..................................................14
2.9. Manfaat Kegiatan Menganalisis Butir Soal................................21

BAB III PENUTUP

3.1. Kesimpulan …………………………………………....…...........22


3.2. Daftar pustaka ……………...………………………....…........... 23

BAB I

PENDAHULUAN

1.1. LATAR BELAKANG

Evaluasi adalah suatu proses merencanakan, memperoleh dan


menyediakan informasi yang sangat diperlukan untuk membuat alternatif-

STAI SABILI BANDUNG 2


alternatif keputusan. Sesuai dengan pengertian tersebut maka setiap kegiatan
evaluasi atau penilaian merupakan suatu proses yang sengaja direncanakan
untuk memperoleh informasi atau data. Berdasarkan data tersebut kemudian
dicoba membuat suatu keputusan. Sudah barang tentu informasi atau data yang
dikumpulkan itu haruslah data yang sesuai dan mendukung tujuan evaluasi
yang direncanakan. Dalam hubungan dengan kegiatan pengajaran, evaluasi
adalah suatu proses yang sistematis untuk menentukan atau membuat
keputusan sampai sejauh mana tujuan-tujuan pengajaran telah dicapai siwa.

Dalam dunia pendidikan pasti dilakukan suatu evaluasi, salah satunya


dengan cara tes dikumpulkan dan kemudian dilakukan penilaian dan pemberian
skor. Penilaian yang meliputi pengertian penyekoran dan penilaian, perbedaan
menyekor dan menilai serta langkah-langkah melakukan penilaian.

1.2. RUMUSAN MASALAH

1. Apa pengertian dari penskoran dan penilaian?

2. Bagaimana perbedaan antara penskoran dan penilaian?

3. Apa saja jenis-jenis kunci pemberian skor?

1.3. TUJUAN MASALAH

1. Untuk mengetahui pengertian penskoran dan penilaian.

2. Untuk mengetahui perbedaan penskoran dan penilaian.

3. Untuk mengetahui jenis-jenis kunci pemberian skor.

BAB II

PEMBAHASAN

2.1. PENGERTIAN PENSKORAN DAN PENILAIAN

1. Pengertian Penskoran

STAI SABILI BANDUNG 3


Pemberian skor (scoring) merupakan langkah pertama dalam proses
pengolahan hasil tes, yaitu proses pengubahan jawaban soal tes menjadi angka-
angka dengan kata lain pemberian skor itu merupakan tindakan kuantifikasi
terhadap jawaban-jawaban yang diberikan oleh penguji dalam suatu tes hasil
belajar.

Angka-angka hasil penilaian itu selanjutnya diubah menjadi nilai-nilai


(grade) melalui proses tertentu. Penggunaan simbol untuk menyatakan nilai-
nilai hasil tes itu ada yang tertuang dalam bentuk angka dengan rentangan
antara 0 – 10, antara 0 – 100, dan ada pula yang menggunakan simbol huruf A,
B, C, D dan F (fail / gagal).

Cara pemberian skor terhadap hasil tes belajar pada umumnya


disesuaikan dengan bentuk soal-soal yang dikeluarkan dalam tes tersebut,
apakah tes uraian (essay) ataukah tes objektif (objective test). [Anas
Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: PT. Raja Grafindo Persada,
1996), h. 301]

Untuk soal-soal objektif biasanya setiap jawaban benar diberi skor 1


(satu) dan setiap jawaban yang salah diberi skor 0 (nol), total skor diperoleh
dengan menjumlahkan skor yang diperoleh dari semua soal. Untuk soal-soal
essay dalam penskorannya biasanya digunakan cara memberi bobot (weithing)
kepada setiap soal menurut tingkat kesukaranya atau banyak-sedikitnya unsur
yang harus terdapat dalam jawaban yang dianggap paling baik. Misalnya :
untuk soal no. 1 diberi skor maksimal 4, untuk soal no. 3 diberi skor
maksimum 6, untuk skor no. 5 skor maksimum 10 dan seterusnya.

Di lembaga–lembaga pendidikan kita, masih banyak pengajaran yang


melakukan penskoran soal-soal essay, tanpa pembobotan; setiap soal diberi
skor yang sama meskipun sebenarnya tingkat kesukaran soal-soal dalam tes
yang disusunnya itu tidak sama.

Bahkan yang lebih memprihatinkan lagi, terutama dalam penilaian soal-


soal essay, proses penskoran dan penilaian biasanya tidak dibedakan satu sama
lain, pekerjaan siswa atau mahasiswa langsung diberi nilai, jadi bukan diskor
terlebih dahulu. Oleh karena itu, hal ini sering kali menimbulkan

STAI SABILI BANDUNG 4


terjadinya halo effect, yang berarti dalam penilaiannya itu diikutsertakan pula
unsur-unsur yang tidak relevan seperti kerapian dan ketidakrapian tulisan,
gaya bahasa, atau panjang-pendeknya jawaban sehingga cenderung
menghasilkan penilaian yang kurang andal. Hasil penilaian menjadi kurang
objektif, jika tes yang berbentuk soal-soal essay tersebut dinilai oleh lebih dari
satu orang, sering kali terjadi perbedaan-perbedaan diantara penilai, bahkan
juga hasil penilaian seorang penilai sering kali berbeda terhadap jawaban-
jawaban yang sama dari soal tertentu. Kesalahan seperti ini tidak akan selalu
terjadi jika dalam pelaksanaannya diadakan pemisahan antara proses penskoran
dan penilaian.

2. Pengertian Penilaian

Sesuai memeriksa hasil tes dan menghitung jumlah jawaban benar untuk
menentukan skornya, maka langkah berikut adalah menetapkan nilai untuk
pencapaian belajar siswa seperti yang dicerminkan oleh skor itu. Kalimat ini
menunjukkan bahwa skor dan nilai mempunyai pengertian yang berbeda.

Skor (score atau mark) adalah angka yang menunjukkan jumlah jawaban
yang benar dari sejumlah butir soal yang membentuk tes. Dengan demikian,
apabila jumlah soal yang benar ada 25, maka skor untuk siswa tersebut adalah
juga 25, terlepas dari berapa jumlah soal yang membentuk tes itu. Jadi, biarpun
jumlah soal dalam tes itu 30, 40, 50, 75, atau 100 sekalipun, siswa tersebut
tetap mendapat skor 25. Pemberian angka skor itu sebagai angka nilai tersebut
tidak tepat. Skor 25 dari 30 butir soal berbeda nilai daripada skor 25 pada tes
dengan 50 butir soal, apalagi pada tes dengan 100 butir soal. Pada tes dengan
30 butir soal, skor 25 menempatkan siswa itu pada kelompok yang berhasil
mencapai 83% tujuan instruksional yang diukur dengna tes tersebut. Tetapi
skor 25 yang diperoleh dari tes dengan 50 butir soal, tingkat pencapaian tujuan
instruksional hanya sebesar 50%, dan hanya sebesar 25% pada tes dengan 100
butir soal. Angka-angka persentase itu diperoleh dengan jalan membagi jumlah
skor dengan jumlah butir soal dalam seluruh tes dan dikalikan dengan 100%.
Angka-angka persentase ini menunjukkan nilai skor tersebut dalam kaitan

STAI SABILI BANDUNG 5


dengan seluruh tes yang disajikan. [Suke Silverius, Evaluasi Hasil Belajar dan
Umpan Balik, (Jakarta: Grasindo, 1991), h. 107-108]

2.2. PERBEDAAN PENSKORAN DAN PENILAIAN

Skor adalah hasil pekerjaan menyekor (sama dengan memberikan angka


yang diperoleh dengan jalan menjumlahkan angka-angka bagi setiap butir item
yang oleh teruji telah dijawab dengan betul, dengan memperhitungkan bobot
jawaban betulnya. [Anas Sudijono, op.cit., h. 39]

Adapun yang dimaksud nilai adalah angka (bisa juga huruf), yang
merupakan hasil ubahan dari skor yang sudah dijadikan satu dengan skor-skor
lainnya, serta disesuaikan pengaturannya dengan standar tertentu. Itulah
sebabnya mengapa nilai sering disebut skor standar (standard score).

Nilai pada dasarnya adalah angka atau huruf yang melambangkan


seberapa jauh dan seberapa besar kemampuan yang telah ditujukan oleh teruji
terhadap materi atau bahan yang diujikan, sesuai dengan tujuan instruksional
khusus yang telah ditentukan.

Penskoran berarti proses pengubahan prestasi menjadi angka-angka,


sedangkan dalam penilaian kita memproses angka-angka hasil kuantifikasi
prestasi itu dalam hubungannya dengan “kedudukan” personal siswa dan
mahasiswa yang memperoleh angka-angka tersebut di dalam skala tertentu.

Dalam penskoran, perhatian utama ditujukam kepada kecermatan dan


kemantapan, sedangkan dalam penilaian, perhatian terutama ditujukan kepada
validitas dan kegunaan. [Ngalim Purwanto, op.cit., h. 73]

2.3. ALAT BANTU PEMBERIAN SKOR

Disamping penyusunan dan pelaksanaan tes, menskor dan menilai


merupakan pekerjaan yang menuntut ketekunan yang luar biasa dari penilai,
ditambah dengan kebijaksanaan-kebijaksanaan tertentu. Nama lain dari
menskor adalah memberi angka.

STAI SABILI BANDUNG 6


Dalam hal menskor atau menentukan angka, dapat digunakan tiga
macam alat bantu, yaitu :

1. Pembantu menentukan jawaban yang benar, disebut kunci jawaban.

2. Pembantu menyeleksi jawaban yang benar dan yang salah, disebut kunci
scoring.

3. Pembantu menentukan angka, disebut pedoman penilaian.

2.4. PEMBERIAN SKOR DALAM BERBAGAI BENTUK TES

1. Kunci jawaban dan kunci pemberian skor untuk tes bentuk pilihan ganda
(Multiple Choice)

Dengan bentuk tes seperti ini, teruji diminta untuk melingkari atau tanda
silang salah satu pilihan jawaban. Dalam hal menentukan kunci jawaban
bentuk ini, langkahnya sama seperti soal bentuk betul salah. Hanya untuk soal
yang jumlahnya melebihi 30 buah, sebaiknya menggunakan lembar jawaban
dan nomor-nomor urutannya dibuat sedemikian rupa sehingga tidak memakan
tempat.

2. Kunci jawaban dan kunci pemberian skor untuk tes bentuk betul-salah
(true-false)

Untuk tes bentuk betul-salah (true-false) yang dimaksud dengan kunci


jawaban adalah deretan jawaban yang kita persiapkan untuk pertanyaan atau
soal-soal yang kita susun, sedangkan kunci skoring adalah alat yang kita
gunakan untuk mempercepat pekerjaan skoring.

Oleh karena itu dalam hal ini teruji hanya diminta untuk melingkari huruf
B atau S, maka kunci jawaban yang disediakan hanya berbentuk urutan nomor
serta huruf dimana kita menghendaki untuk melingkari atau dapat juga diberi
tanda X pada jawabannya.

Misalnya :

1. B 4. S

2. S 5. B

STAI SABILI BANDUNG 7


3. S

3. Kunci jawaban dan kunci pemberian skor untuk tes bentuk jawaban
singkat (Short answer test)

Tes berbentuk jawaban singkat adalah bentuk tes yang menghendaki


jawaban berbentuk kata atau kalimat pendek. Bentuk tes ini dapat digolongkan
kedalam bentuk tes obyektif. Tes bentuk isian ini, dianggap setaraf dengan tes
jawaban singkat ini.

Dengan mengingat jawaban yang hanya satu pengertian saja, maka angka
bagi tiap nomor soal mudah ditebak. Usaha yang dikeluarkan oleh siswa
sedikit, tetapi lebih sulit dari pada tes bentuk betul-salah atau bentuk pilihan
ganda. Sebaiknya tiap soal diberi angka 2. Dapat juga angka itu kita samakan
dengan angka pada bentuk betul-salah atau pilihan ganda jika memang jawaban
yang diharapkannya ringan atau mudah. Tetapi sebaliknya apabila jawabannya
bervariasi misalnya lengkap sekali, lengkap dan kurang lengkap, maka
angkanya dapat dibuat bervariasi pula misalnya 2; 1,5; dan 1.
[Arikunto,Suharsimi. Op,cit., hal 260]

4. Kunci jawaban dan kunci pemberian skor untuk tes bentuk menjodohkan
(Matching)

Pada dasarnya tes ini adalah bentuk tes pilihan ganda, dimana
jawabannya dijadikan satu, demikian pula pertanyaan-pertanyaannya. Satu
kesulitan lagi adalah bahwa jawaban yang dipilih dibuat sedemikian rupa
sehingga jawaban yang satu tidak diperlukan bagi pertanyaan lain.

Kunci jawaban tes bentuk ini dapat berbentuk deretan jawaban yang
dikehendaki atau deretan nomor yang diikuti oleh huruf-huruf yang terdapat
didepan alternative jawaban.

Telah dijelaskan bahwa tes bentuk menjodohkan ini adalah tes bentuk
pilihan ganda yang lebih kompleks. Maka angka yang diberikan sebagai
imbalan juga harus lebih banyak. Sebagai ancar-ancar dapat ditentukan bahwa
angka untuk tiap nomor adalah 2. [Arikunto,Suharsimi. Op,cit., hal 265]

STAI SABILI BANDUNG 8


5. Kunci jawaban dan kunci pemberian skor untuk tes bentuk uraian (Essay
test)

Sebelum menyusun sebuah tes uraian sebaiknya kita tentukan terlebih


dahulu pokok-pokok jawaban yang kita kehendaki. Dengan demikian, akan
mempermudah kita dalam mengoreksinya.

Dengan membaca terlebih dahulu seluruh jawaban yang diberikan oleh


siswa, kita menjadi tahu bahwa mungkin tidak ada seorang pun dari siswa yang
menjawab dengan betul untuk sesuatu nomor soal. Menghadapi situasi seperti
ini, kita gunakan cara pemberian angka yang relatif. Misalnya untuk sesuatu
nomor soal jawaban yang paling lengkap mengandung 3 unsur, padahal kita
menghendaki 5 unsur, maka pada jawaban yang paling lengkap itulah kita
berikan angka 5, sedangkan jika menjawab hanya 2 atau 1 unsur, kita berikan
angka lebih sedikit. Ini adalah cara memberikan angka dengan menggunakan
atau mendasarkan pada norma kelompok. Apabila memberikan angka
berdasarkan pada standar mutlak, maka langkah-langkahnya akan lain, yaitu :

a. Membaca setiap jawaban yang diberikan siswa dan dibandingkan


dengan kunci jawaban yang telah kita susun.

b. Membubuhkan skor disebelah kiri setiap jawaban (dilakukan per


nomor).

c. Menjumlahkan skor-skor yang telah dituliskan pada setiap soal, dan


terdapatlah skor untuk bagian soal yang berbentuk uraian

Dengan cara ini maka skor siswa tidak dibandingkan dengan jawaban
yang paling lengkap yang diberikan oleh siswa lain, tetapi dibandingkan
dengan jawaban yang sudah ditentukan oleh guru.

2.5. KUNCI JAWABAN DAN KUNCI PEMBERIAN SKOR


UNTUK TUGAS

Kunci jawaban untuk memeriksa tugas merupakan pokok-pokok yang


harus termuat didalam pekerjaan siswa. Hal ini menyangkut kriteria tentang isi
tugas. Namun sebagai kelengkapan dalam pemberian skor, digunakan suatu

STAI SABILI BANDUNG 9


tolak ukur tertentu. Tolak ukur yang disarankan dalam makalah ini sebagai
ukuran keberhasilan tugas adalah :

1. Ketepatan waktu menyerahkan tugas

2. Bentuk fisik pengerjaan tugas yang menandakan keseriusan siswa


dalam mengerjakan tugas

3. Sistematika yang menunjukkan alur keruntutan pikiran

4. Kelengkapan isi menyangkut ketuntasan penyelesaian dan kepadatan


isi

5. Mutu hasil tugas, yaitu kesesuaian hasil dengan garis-garis yang


sudah ditentukan oleh guru

Dalam mempertimbangkan nilai akhir perlu difikirkan peranan masing-


masing aspek kriteria tersebut, misalnya :

A1 - ketepatan waktu, diberi bobot 2

A2 - bentuk fisik, diberi bobot 1

A3 - sistematika, diberi bobot 3

A4 - kelengkapan isi, diberi bobot 3

A5 - mutu hasil, diberi bobot 3

Maka nilai hasil akhir tugas tersebut diberikan dengan rumus :

NAT = Skor bobot x 100

Jumlah bobot

NAT adalah Nilai Akhir Tugas.

Dari uraian di atas dapat disimpulkan bahwa di satu pihak kita lihat
adanya peranan penting yang diberikan kepada nilai-nilai sebagai simbol
prestasi akademis siswa, tetapi di lain pihak kita melihat pula adanya
kekurangan cara pemberiannya. [Arikunto,Suharsimi. Op,cit., hal 270]

STAI SABILI BANDUNG 10


2.6. PENGERTIAN ANALISI BUTIR SOAL

Menurut Kamus Besar Bahasa Indonesia (2002) analisis adalah


penguraian suatu pokok atas berbagai bagiannya dan penelaahan bagian
itu sendiri serta hubungan antar bagian untuk memperoleh pengertian
yang tepat dan pemahaman arti keseluruhan.

Analisis butir soal yang dalam bahasa inggris disebut item analiysis
dilakukan terhadap empirik. Maksudnya, analisis itu baru dapat
dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban
terhadap butir-butir soal telah kita peroleh. Analisis butir soal adalah
suatu kegiatan analisis untuk menentukan tingkat kebaikan butir-butir
soal yang terdapat dalam suatu tes sehingga informasi yang dihasilkan
dapat kita pergunakan untuk memperbaiki butir soal dan tes tersebut.

Identifikasi terhadap setiap butir item soal dilakukan dengan


harapan akan menghasilkan berbagai informasi berharga, yang pada
dasarnya akan merupakan umpan balik (feed back) guna melakukan
perbaikan, pembenahan, dan penyempurnaan kembali terhadap butir-
butir soal, sehingga pada masa-masa yang akan yang akan dating tes
hasil belajar yang disusun atau dirancang oleh guru itu betul-betul dapat
menjalankan fungsinya sebagai alat pengukur hasil belajar yang memiliki
kualitas yang tinggi.

Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan


analisis butir soal merupakan kegiatan penting dalam penyusunan soal
agar diperoleh butir soal yang bermutu. Tujuan kegiatan ini adalah:

1. Mengkaji dan menelaah setiap butir soal agar diperoleh soal


yang bermutu sebelum digunakan,

2. Meningkatkan kualitas butir tes melalui revisi atau membuang


soal yang tidak efektif,

3. Mengetahui informasi diagnostik pada siswa apakah mereka


telah memahami materi yang telah diajarkan.

Soal yang bermutu adalah soal yang dapat memberikan informasi


setepat-tepatnya tentang siswa mana yang telah menguasai materi dan
siswa mana yang belum menguasai materi. Selanjutnya menurut
Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal
dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya)
dan kuantitatif (berkaitan dengan ciri-ciri statistiknya). Analisis kualitatif
mencakup pertimbangan validitas isi dan konstruksi, sedangkan analisis

STAI SABILI BANDUNG 11


kuantitatif mencakup pengukuran validitas dan reliabilitas butir soal,
kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-
masing memiliki keunggulan dan kelemahan, oleh karena itu teknik
terbaik adalah menggunakan atau memadukan keduanya.

2.7. TEKNIK ANALISIS BUTIR SOAL

Analisis soal dilakukan untuk mengetahui berfungsi atau tidaknya


sebuah soal. Analisis pada umumnya dilakukan melalui dua cara, yaitu
analisis kualitatif (qualitatif control) dan analisis kuantitatif (quantitatif
control).

1. Analisis Butir Soal Secara Kualitatif

Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan


berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap).
Penelaahan ini biasanya dilakukan sebelum soal digunakan atau diujikan.
Aspek yang diperhatikan dalam penelaahan secara kualitatif mencakup
aspek materi, konstruksi, bahasa atau budaya, dan kunci jawaban.

Ada beberapa teknik yang digunakan untuk menganalisis butir soal


secara kualitatif, yaitu teknik moderator dan teknik panel. Teknik
moderator merupakan teknik berdiskusi yang didalamnya terdapat satu
orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal
didiskusikan secara bersama-sama dengan beberapa ahli.

Sedangkan teknik panel adalah teknik menelaah butir soal


berdasarkan kaidah penulisan butir soal. Kaidah itu diantaranya adalah
materi, kontruksi, bahasa atau budaya, kebenaran kunci jawaban.
Caranya beberapa penelaah diberikan beberapa butir soal yang akan
ditelaah, format penelaahan, dan pedoman penelaahan.

Dalam menganalisis butir soal secara kualitatif penggunaan format


penelaahan soal akan membantu dan mempermudah prosedur
pelaksanaannya. Format penelaahan soal digunakan sebagai dasar untuk
menganalisis setiap butir soal.

2. Analisis Butir Soal Secara Kuantitatif

Penelaahan soal secara kuantitatif adalah penelaahan butir soal


didasarkan pada bukti empirik. Salah satu tujuan utama pengujian butir-
butir soal secara emperik adalah untuk mengetahui sejauh mana masing-

STAI SABILI BANDUNG 12


masing butir soal membedakan antara mereka yang tinggi
kemampuannya dalam hal yang didefinisikan oleh kriteria dari mereka
yang rendah kemampuannya.

Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua
pendekatan dalam analisis secara kuantitatif yaitu pendekatan secara
klasik dan modern.

Analisis butir soal secara klasik adalah proses penelaahan butir soal
melalui informasi dari jawaban peserta tes guna meningkatkan mutu butir
soal yang bersangkutan dengan menggunakan teori tes klasik. Pada teori
tes klasik, analisis item tes dilakukan dengan memperhitungkan
kedudukan item dalam suatu kelas atau kelompok. Karakteristik atau
kualitas item sangat tergantung pada kelompok dimana diujicobakan
sehingga kualitas item terikat pada sampel responden atau peserta tes
yang memberikan respons(sample bounded).

Ada beberapa kelebihan analisis butir soal secara klasik adalah


murah, sederhana, familiar, dapat dilaksanakan sehari-hari dengan cepat
menggunakan komputer dan dapat menggunakan beberapa data dari
peserta tes.

Analisis butir soal secara modern adalah penelaahan butir soal


dengan menggunakan teori respon butir atau item response theory. Teori
ini merupakan suatu teori yang menggunakan fungsi matematika untuk
menghubungkan antara peluang menjawab benar suatu butir dengan
kemampuan siswa.

Teori ini muncul karena adanya beberapa keterbatasan pada analisis


secara klasik, yaitu:

Tingkat kemampuan dalam teori klasik adalah true score. Artinya,


jika suatu tes sulit maka tingkat kemampuan peserta tes akan
rendah.sebaiknya, jika suatu tes mudah maka tingkat kemampuan peserta
tes tinggi.

Tingkat kesukaran butir soal didefinisikan sebagai proporsi peserta


tes yang menjawab benar. Mudah atau sulitnya butir soal tergantung pada
kemampuan peserta tes.

Daya pembeda, reliabilitas, dan validitas tes tergantung pada


kondisi peserta tes.

2.8. PARAMETER ITEM TES YANG BAIK

STAI SABILI BANDUNG 13


Sebagaimana telah disebut sebelumnya, bahwa item tes yang baik
adalah item yang memenuhi syarat sebagaimana kriteria atau
karakteristik item tes yang baik. Karakteristik item yang dimaksud adalah
tingkat kesulitan atau kesukaran, daya pembeda, dan efektivitas
pengecoh.

1. Tingkat Kesulitan atau Kesukaran

Tingkat kesukaran soal adalah peluang menjawab benar suatu soal


pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam
bentuk indeks. Tingkat kesukaran dinyatakan dalam indeks
kesukaran (dificulty index), yaitu angka yang menunjukkan proporsi
siswa yang menjawab benar soal tersebut. Semakin besar indeks tingkat
kesukaran yang diperoleh dan hasil hitungan, berarti semakin mudah soal
itu.

Dalam hal ini, item yang baik adalah item yang tingkat
kesukarannya dapat diketahui, tidak terlalu sukar dan tidak terlalu
mudah. Sebab, tingkat kesukaran item itu memiliki korelasi dengan daya
pembeda. Bilamana item memiliki tingkat kesukaran yang maksimal,
maka daya pembedanya akan rendah, demikian pula bila item itu terlalu
mudah maka tidak akan memiliki daya pembeda.

Oleh karena itu, sebaiknya tingkat kesukaran soal itu dipertahankan


dalam batas yang mampu memberikan daya pembeda. Namun, jika
terdapat tujuan khusus dalam penyusunan tes, maka tingkat kesukaran itu
bisa dipertimbangkan. Misalnya, tingkat kesukaran item untuk tes
sumatif berbeda dengan tingkat kesukaran pada tes diagnostik.

Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan


rumus sebagai berikut:

TK = U + L

Keterangan:

U = jumlah siswa yang termasuk kelompok pandai (upper


group) yang menjawab benar untuk tiap soal.

L = jumlah siswa yang termasuk kurang (lower group) yang


menjawab benar untuk tiap soal.

STAI SABILI BANDUNG 14


T = jumlah siswa dari kelompok pandai dan kelompok
kurang (jumlah upper group dan lower group)

Misalkan suatu tes yang terdiri atas N soal yang diberikan kepada
40 siswa. Dari hasil tes tersebut, tiap-tiap soal dianalisis taraf
kesukarannya. mula-mula hasil tes itu kita susun kedalam peringkat,
kemudian kita ambil 25% (10 lembar jawaban siswa kelompok pandai),
dan 10 lembar jawaban siswa dari kelompok yang kurang pandai.
Kemudian kita tabulasikan. Misalkan dari tabulasi soal kita peroleh hasil
sebagai berikut: yang menjawab benar dari kelompok pandai ada 9 siswa,
dan yang menjawab benar dari kelompok kurang pandai ada 4 siswa.

Dengan menggunakan rumus diatas, maka taraf kesukaran atau TK


dari soal adalah:

TK = U + L = 9 + 4 = 0,65 atau 65%

T 20

Jadi dapat disimpilkan bahwa nilai dari TK atau tingkat


kesukarannya adalah 65%.

Sedangkan dalam bukunya Drs. H. Daryanto, rumus untuk mencari


taraf kesukaran atau indeks kesukaran adalah:

P= B

JS

Keterangan:

P = indeks kesukaran.

B = banyaknya siswa yang menjawab soal itu dengan benar.

JS = jumlah seluruh siswa peserta tes.

Contoh:

Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40
siswa tersebut terdapat 12 siswa yang mampu mengerjakan soal no. 1
dengan benar. Maka berapa indeks kesukarannya?

STAI SABILI BANDUNG 15


Jawab:

P = B

JS

= 12

40

= 0,30

Menurut ketentuan yang sering diikuti, indeks kesukaran sering


diklasifikasikan sebagai berikut:

a. Soal dengan P 0,00 sampai 0,30 adalah soal sukar.

b. Soal dengan P 0,30 sampai 0,70 adalah soal sedang.

c. Soal dengan P 0,70 sampai 1,00 adalah soal mudah.

2. Daya Pembeda

Perhitungan daya pembeda adalah pengukuran sejauh mana suatu


butir soal mampu membedakan peserta didik yang sudah menguasai
kompetensi dengan peserta didik yang belum atau kurang menguasai
kompetensi berdasarkan kriteria tertentu. Semakin tinggi koofisien daya
pembeda suatu butir soal, semakin mampu butir soal tersebut
membedakan antara peerta didik yang menguasai kompetensi dengan
pesertan didik yang kurang menguasai kompetensi.

Angka yang menunjukkan besarnya daya pembeda disebut indeks


diskriminasi. Daya pembeda suatu soal tes dapat dihitung dengan
menggunakan rumus sebagai berikut:

DP = U – L

½T

Keterangan:

DP = indeks DP atau daya pembeda yang dicari.

U = jumlah siswa yang termasuk dalam kelompok pandai yang


mampu menjawab benar untuk tiap soal.

STAI SABILI BANDUNG 16


L = jumlah siswa yang termasuk kurang yang menjawab benar
untuk tiap soal.

T = jumlah siswa keseluruhan.

Contoh:

Dari hasil tes lomba olimpiade IPS, jumlah siswa yang dites adalah
40 siswa, sedangkan tes tersebut terdiri dari 20 soal. Setelah hasil tes
tersebut diperiksa, kemudian disusun kedalam peringkat untuk
menentukan 25% siswa yang termasuk kelompok pandai (upper
group) dan 25% siswa yang termasuk kelompok kurang (lower group).

Kemudian hasil tes tersebut ditabulasikan dengan menggunakan


format tabulasi jawaban tes, kemudian hasil tabulasi dari kedua
kelompok tersebut dimasukkan kedalam format analisis soal tes,
sehingga kita dapat menghitung tingkat kesukaran dan daya pembeda tiap
soal yang kita analisis.

Misalkan dari tabulasi soal no. 1 kita peroleh hasil sebagai berikut:
yang menjawab benar dari kelompok pandai ada 10 siswa, dan yang
menjawab benar dari kelompok kurang ada 9 siswa. Maka daya
pembedanya adalah:

DP = U – L

½T

= 10 – 9

½ x (20)

= 1

10

= 0,10

Jadi dapat disimpulkan bahwa indeks pembedanya adalah 0,10.

Dalam bukunya Prof. Dr. Suharsimi Arikunto, dijelaskan mengenai


klasifikasi daya pembeda, yaitu:

D = 0,00 – 0,20 = jelek (poor).

D = 0,20 – 0,40 = cukup (satisfactory).

STAI SABILI BANDUNG 17


D = 0,40 – 0,70 = baik (good).

D = 0,70 – 1,00 = baik sekali (excellent).

3. Analisis pengecoh (Efektifitas Distraktor )

Instrumen evaluasi yang berbentuk tes dan objektif, selain harus


memenuhi syarat-syarat yang telah disebutkan terdahulu, harus
mempunyai distraktor yang efektif. Yang disebut dengan distraktor atau
pengecoh adalah opsi-opsi yang bukan merupakan kunci jawaban
(jawaban benar).

Butir soal yang baik pengecohnya akan dipilih secara merata oleh
peserta didik yang menjawab salah. Sebaliknya, butir soal yang kurang
baik, pengecohnya akan dipilih secara tidak merata. Pengecoh dianggap
baik bila jumlah peserta didik yang memilih pengecoh itu sama atau
mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus:

IP = P x 100%

(N - B) (n - 1)

Keterangan:

IP = indeks pengecoh

P = jumlah peserta didik yang memilih pengecoh

N = jumlah peserta didik yang ikut tes

B = jumlah peserta didik yang menjawab benar pada setiap soal

n = jumlah alternatif jawaban

1= bilangan tetap

Catatan:

Jika semua peserta didik menjawab benar pada butir soal tertentu
(sesuai kunci jawaban), maka IP = 0 yang berarti soal tersebut jelek.
Dengan demikian pengecoh tidak berfungsi.

Contoh:

50 orang peserta didik dites dengan 10 soal bentuk pilihan ganda.


Tiap soal memiliki alternatif jawaban (a, b, c, d, e). Kunci jawaban

STAI SABILI BANDUNG 18


(jawaban yang benar) no. 8 adalah c. Setelah soal no.8 diperiksa untuk
semua peserta didik, ternyata dari 50 orang peserta didik, 20 peserta didik
menjawab benar dan 30 peserta didik menjawab salah. Idealnya,
pengecoh dipilih secara merata.

Berikut ini adalah contoh soal no.8.

Alternatif
A B C D E
jawaban

Distribusi
jawaban 7 8 20 7 8
peserta didik

IP 93% 107% ** 93% 107%

Kualitas
++ ++ ++ ++ ++
pengecoh

Keterangan:

** = kunci jawaban

++ = sangat baik

+ = baik

= kurang baik

_ = jelek

_ _ = sangat jelek

Pada contoh diatas, IP butir a, b, c, d, dan e adalah 93%, 107%,


93%, dan 107%. Semuanya dekat dengan angka 100%, sehingga
digolongkan sangat baik sebab semua pengecoh itu berfungsi. Jika
pilihan jawaban peserta didik menumpuk pada satu alternatif jawaban,
misalnya seperti berikut:

Alternatif jawaban A B C D E

STAI SABILI BANDUNG 19


Distribusi jawaban
20 2 0 8 0
peserta didik

IP 267% 27% ** 107% 0%

Kualitas pengecoh _ - ** ++ _

Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik,


pengecoh (e) dan (b) tidak berfungsi, pengecoh (a) menyesatkan, maka
pengecoh (a) dan (e) perlu diganti karena termasuk jelek, danpengecoh
(b) perlu direvisikarena kurang baik. adapun kualitas pengecoh berdasar
indeks pengecoh adalah:

Sangat baik IP = 76% - 125%

Baik IP = 51% - 75% atau 126% - 150%

Kurang baik IP = 26% - 50% atau 151% - 175%

Jelek IP = 0% - 25% atau 176% - 200%

Sangat jelek IP = lebih dari 200%

2.9. MANFAAT KEGIATAN MENGANALISIS BUTIR


SOAL

Berdasarkan pendapat yang diungkapkan oleh Anastasia dan


Urbina (1997) dalam Suprananto (2012), analisis butir soal memiliki
banyak manfaat, diantaranya yakni:

1. Membantu pengguna tes dalam mengevaluasi kualitas tes yang


digunakan,

2. Relevan bagi penyusunan tes informal seperti tes yang


disiapkan guru untuk siswa dikelas,

3. Mendukung penulisan butir soal yang efektif,

4. Secara materi dapat memperbaiki tes di kelas,

STAI SABILI BANDUNG 20


5. Meningkatkan validitas soal dan reliabilitas.

Selain itu, data hasil analisis butir soal juga sangat bermanfaat
sebagai dasar untuk:

1. Diskusi tentang efisien hasil tes,

2. kerja remedial

3. peningkatan secara umum pembelajaran di kelas,

4. peningkatan keterampilan pada kontruksi tes.

Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal


memberikan beberapa manfaat diantaranya :

1. Menentukan soal-soal yang cacat atau tidak berfungsi dengan


baik,

2. Meningkatkan butir soal melalui tiga komponen analisis yaitu,


tingkat kesukaran, daya pembeda dan pengecoh soal,

3. Merevisi soal yang tidak relevan degan materi yang diajarkan,


ditandai dengan banyaknya anak yang tidak dapat menjawab
butir soal tertentu.

BAB III

PENUTUP

3.1. KESIMPULAN

Dari pemaparan di atas, maka dapat diambil beberapa kesimpulan


bahwa :

1. Penyekoran adalah proses pengubahan jawaban soal tes menjadi


angka-angka, atau sebuah tindakan kuantifikasi terhadap jawaban-
jawaban yang diberikan oleh teruji dalam suatu tes hasil belajar.

2. Penilaian adalah memproses angka-angka hasil kuantifikasi prestasi


dalam hubungannya dengan “kedudukan” personal siswa dan
mahasiswa yang memperoleh angka-angka tersebut di dalam skala

STAI SABILI BANDUNG 21


tertentu, misalnya skala tentang baik buruk, bisa diterima-tidak bisa
diterima, dinyatakan lulus-tidak lulus.

3. Dalam menentukan pemberian skor terdapat jenis-jenis kunci yang


berbeda tergantung dari setiap jenis tes yang diberikan apakah tes
bentuk pilihan ganda (Multiple Choice) , tes bentuk betul-salah, tes
bentuk jawaban singkat (Short answer test), tes bentuk menjodohkan
(Matching), tes bentuk uraian (Essay test) dan tes bentuk tugas.

4. Analisis soal dilakukan untuk mengetahui berfungsi atau


tidaknya sebuah soal. Analisis pada umumnya dilakukan
melalui dua cara, yaitu analisis kualitatif (qualitatif control) dan
analisis kuantitatif (quantitatif control).

5. Item tes yang baik adalah item yang memenuhi syarat


sebagaimana kriteria atau karakteristik item tes yang baik.
Karakteristik item yang dimaksud adalah tingkat kesulitan atau
kesukaran, daya pembeda, dan efektivitas pengecoh.

6. analisis butir soal memberikan beberapa manfaat diantaranya :

a. Menentukan soal-soal yang cacat atau tidak berfungsi dengan


baik,

b. Meningkatkan butir soal melalui tiga komponen analisis


yaitu, tingkat kesukaran, daya pembeda dan pengecoh soal,

c. Merevisi soal yang tidak relevan degan materi yang


diajarkan, ditandai dengan banyaknya anak yang tidak dapat
menjawab butir soal tertentu.

3.2. DAFTAR PUSTAKA

1. Arikunto,Suharsimi. 2007. Dasar-Dasar Evaluasi Pendidikan .Jakarta :


Bina Aksara

STAI SABILI BANDUNG 22


2. Sudijono, Anas. 1996. Pengantar Evaluasi Pendidikan. Jakarta: PT. Raja
Grafindo Persada.

3. Purwanto, Ngalim.. 2001.Prinsip-prinsip dan Teknik Evaluasi


Pengajaran. Bandung: PT. Remaja Rosdakarya.

4. Silverius, Suke. 1991. Evaluasi Hasil Belajar dan Umpan Balik. Jakarta:
Grasindo.

STAI SABILI BANDUNG 23