Anda di halaman 1dari 15

BAB VI

ANALISIS KUALITAS TES DAN BUTIR SOAL


DALAM PEMBELAJARAN

Deskripsi Singkat
Suharsimi Arikunto menyatakan bahwa analisis kualitas tes merupakan kegiatan
untuk mengkaji soal pada setiap item atau butirnya guna mengetahui kualitas dari
setiap butir soal tersebut. Analisis kualitas butir soal adalah suatu prosedur yang
sistematis, yang akan memberikan informasiinformasi yang sangat khusus terhadap
butir tes yang kita susun. Sumarna Surapranata mengemukakan bahwa analisis kualitas
soal dilakukan untuk mengetahui berfungsi tidaknya sebuah soal. Dari pengertian
tersebut dapat disimpulkan bahwa analisis kualitas butir soal merupakan kegiatan
menganalisis tiap-tiap butir soal secara mendetail menggunakan metode pengujian
tertentu.

Berdasarkan definisi dari 2 ahli di atas, dapat disimpulkan bahwa analisis


kualitas soal merupakan kegiatan meneliti dan mengidentifikasi setiap pertanyaan
untuk mengetahui kualitas setiap pertanyaan. Hasil dari proses review dan identifikasi
pertanyaan dapat digunakan untuk memperbaiki dan menyempurnakan setiap
komponen pertanyaan.

Relevansi

Tujuan utama analisis kualitas butir soal dalam sebuah tes yang dibuat pendidik
adalah untuk mengidentifikasi kekurangan-kekurangan dalam tes atau pembelajaran.

Indikator

Setelah membaca, membahas, dan mempelajari bab ini mahasiswa diharapkan


mampu mengetahui tujuan dari dilakukannya kegiatan analisis kualitas tes dan butir
soal dalam mendukung proses pembelajaran.
A. Teknik Analisis Kualitas Butir Soal
Kegiatan analisis kualitas butir soal dapat dilakukan dengan dua cara
yaitu secara kualitatif dan kuantitatif. Analisis secara kualitatif berkaitan
dengan isi dan bentuknya, sedangkan secara kuantitatif berkaitan dengan ciri
- ciri statistiknya. Kedua teknik ini masing-masing memiliki keunggulan dan
kelemahan masing-masing. Oleh karena itu, teknik terbaik dalam
menganalisis kualitas butir soal adalah dengan menggunakan keduanya
(Penggabungan).
a. Teknik Analisis Kualitas Butir Soal secara Kualikatif
Pada prinsipnya analisis kualitatif terhadap kualitas soal
dilakukan berdasarkan kaidah penulisan soal (penulisan tes,
tindakan, dan sikap). Ada beberapa teknik yang digunakan untuk
menganalisis kualitas kuesioner secara kualitatif, antara lain teknik
moderasi dan teknik panel. Teknik fasilitasi merupakan teknik
diskusi yang mana satu orang bertindak sebagai mediator.
Berdasarkan teknik ini, setiap pertanyaan akan didiskusikan
dengan beberapa ahli seperti guru, ahli penilaian, ahli bahasa dan
psikolog. Teknik ini bagus karena setiap soal diujikan bersama-
sama sesuai dengan aturan penulisan yang benar. . Teknik ini bagus
karena setiap soal diujikan bersama-sama sesuai dengan aturan
penulisan yang benar. Selain itu, pengulas diundang untuk
berkomentar/memodifikasi berdasarkan pengetahuan mereka.
Setiap komentar/masukan peserta diskusi dicatat oleh seorang
notulen. Setiap item pertanyaan dapat diselesaikan bersama-sama.
Namun kelemahan dari teknik ini adalah membutuhkan banyak
waktu untuk membahas setiap soal.
Teknik panel adalah teknik review soal berdasarkan kaidah
penulisan soal, khususnya penilaian isi, struktur, bahasa/budaya,
kebenaran jawaban/tes dan petunjuk penilaian.Harga dibuat oleh
beberapa reviewer. Analisis dokumen dirancang sebagai kajian
mengenai muatan ilmiah yang ditanyakan dalam soal serta tingkat
kemampuan yang sesuai dengan soal tersebut. Analisis konstruktif
dirancang sebagai kajian penelitian yang seringkali melibatkan
teknik penulisan pertanyaan. Analisis linguistik bertujuan untuk
mengkaji permasalahan yang berkaitan dengan penggunaan bahasa
Indonesia yang baik dan benar.
Kaidah penulisan butir soal yang menjadi pedoman dalam
menganalisis kualitas butir soal secara kualitatif adalah sebagai
berikut:
1) Materi
 Soal harus sesuai dengan indikator, artinya soal
harus menyatakan perilaku dan materi yang
hendak diukur sesuai dengan rumusan indikator
dalam kisi-kisi. Indikator dalam kisi-kisi
merupakan pedoman dalam merumuskan soal
yang dikehendaki.
 Pengecoh harus berfungsi
 Setiap soal harus mempunyai, satu kunci jawaban
yang benar. Artinya, satu soal hanya mempunyai
satu kunci jawaban.
2) Konstruksi
 Pokok soal harus dirumuskan secara jelas dan
tegas.
 Rumusan pokok soal dan pilihan jawaban harus
menerapkan pernyataan yang diperlukan saja.
 Pokok soal jangan memberi petunjuk kearah
jawaban yang benar.
 Pokok soal jangan mengandung pernyataan yang
bersifat negatif ganda.
 Pilihlah jawaban harus homogen dan logis
ditinjau dari segi materi.
 Panjang rumusan pilihan jawaban harus relatif
sama.
 Pilihan jawaban jangan mengandung penyataan
“semua pilihan jawaban salah” atau “semua
pilihan jawaban benar”.
 Memilih jawaban yang berbentuk angka atau
waktu harus disusun berdasarkan urutan besar
kecilnya nilai angka atau kronologis.
 Gambar, grafik, tabel, diagram, wacana, dan
sejenisnya yang terdapat pada soal harus jelas
dan berfungsi.
 Rumusan pokok soal tidak menggunakan
ungkapan atau kata yang bermakna tidak pasti.
 Butir soal jangan bergantung pada jawaban soal
sebelumnya.
3) Bahasa/budaya
 Setiap soal harus menggunakan bahasa yang
sesuai dengan kaidah bahasa Indonesia.
 Bahasa yang digunakan harus komunikatif,
sehingga pernyataan mudah dimengerti peserta
didik.
 Pilihan jawaban jangan yang mengulang
kata/frasa yang bukan merupakan satu kesatuan
pengertian.

b. Teknik Analisis Kualitas Butir Soal secara Kuantitatif


Teknik analisis kualitas butir soal secara kuantitaif dikenal
juga dengan istilah analisis empirik. Analisis ini dilaksanakn dengan
mengukur berapa kriteria kualitas soal, diantaranya adalah
validitas, reliabilitas, tingkat kesukaran, daya beda dan efektifitas
pengecoh/fungsi distraktor.
1) Validitas
Validitas sering diartikan dengan kesahihan. Suatu
alat ukur disebut memiliki validitas bilamana sifat alat
ukur tersebut isinya layak mengukur objek yang
seharusnya diukur dan sesuai dengan kriteria tertentu.
Validitas berhubungan dengan kemampuan untuk
mengukur secara tepat sesuatu yang diinginkan diukur.
Zainal Arifin menyebutkan ada dua unsur penting dalam
validitas yaitu validitas menunjukkan suatu derajat dan
validitas selalu dihubungkan dengan suatu putusan atau
tujuan yang spesifik. Penganalisisan terhadap tes hasil
belajar dapat dilakukan dengan dua cara. Pertama,
penganalisisan yang dilakukan dengan jalan berpikir
secara rasional atau penganalisisan dengan
menggunakan logika (logical analysis). Ada 2 hal penting
dalam validatas yaitu: Pertama, validitas yang
menunjukka suatu derajat, ada yang sempurna, ada yang
sedang dan ada yang rendah. Kedua, validitas selalu
dihubunngkan dengan suatu putusan dan tujuan yang
spesifik.
Ada dua macam validitas empiris yaitu validitas
prediksi dan validitas konkuren. Dari uraian adanya dua
jenis validitas, yaitu validitas logis yang mempunyai dua
jenis validitas dan validitas empiris yang juga
mempunyai dua jenis validitas, maka secara keseluruhan
dikenal dengan adanya empat validitas, yaitu:
 Validitas Isi (Content Validity)
 Validitas Konstruksi (Construct Validity)
 Validitas Ramalan (Predictive Validity)
 Validitas Bandingan (Concurrent Validity)

Adapun faktor yang mempengaruhi Validitas yaitu

 Faktor Instrument Evaluasi.


 Faktor Administrasi Evaluasi dan Penskoran.
 Faktor Jawaban dari Peserta Didik.

Dalam literatur modern tentang evaluasi, banyak


dikemukakan tentang jenis – jenis validitas yaitu:

 Validitas Permukaan yaitu validitas yang


berkriteria sangat sederhana, karena hanya
melihat dari sisi muka atau tampang dari
instrument itu sendiri.
 Validitas Isi yaitu validitas yang sering digunakan
dalam penilaian hasil belajar. Tujan utamanya
adalah untuk mengetahui sejauh mana peserta
didik menguasai materi pelajaran yang telah
disampaikan, dan perubahan psikologis apa yang
timbul pada diri peserta didik tersebut setelah
mengalami proses pembelajaran tertentu.
 Validitas Susunan artinya kajituan daripada
suatu tes ditinjau dari susunan tersebut.
 Validitas Empiris yaitu validitas yang biasanya
menggunakan teknis statistik, yaitu analisis
korelasi. Hal ini disebabkan validitas empiris
mencari hubungan antara skor tes dengan suatu
kriteria tertentu yang merupakan suatu tolak
ukur diluar tes yang bersangkutan.
 Validitas Faktor dalam validitas ini hasil belajar
sering digunakan skala pengukuran tentang
suatu variabel yang terdiri atas beberapa faktor.
Faktor tersebut diperoleh berdasarkan dimensi
dari variabel yang diukur sesuai apa yang
terungkap dalam kontruksi teoritisnya.

2) Reliabilitas
Realibilitas berasal dari kata reliable yang berarti
dapat dipercaya. Realibilitas sering diartikan dengan
keterandalan. Menurut Suharsimi Arikunto, pengertian
reliabilitas tes, berhubungan dengan masalah ketepatan
hasil tes.40 Didukung dengan pendapat Zainal Arifin
bahwa reliabilitas merupakan tingkat atau derajat
konsistensi dari suatu alat pengukur atau instrument.
Menurut teori klasik, reliabilitas dihubungkan dengan
pengertian adanya ketepatan suatu tes dalam
pengukurannya. Pendapat lain menyatakan bahwa
reliabilitas adalah kestabilan skor yang diperoleh orang
yang sama ketika diuji ulang dengan tes yang sama pada
situasi yang berbeda atau dari satu pengukuran
kepengukuran lainnya. Jadi reliabilitas dapat dinyatakan
sebagai tingkat keajegan atau kemantapan hasil dari dua
pengukuran terhadap hal yang sama.
Adapun teknis yang digunakan untuk mencari
reliabilitas pada sebuah tes yaitu:
 Teknik Ulangan
 Teknik Bentuk Paralel
 Teknik Belah Dua
Cronbach juga menyatakan ada tiga mekanisme
untuk memeriksa reliabilitas tanggapan responden
terhadap tes yaitu: a) Teknik test retest adalah
pengetesan dua kali dengan menggunakan suatu tes
yang sama pada waktu yang berbeda. b) Teknik belah
dua, pada teknik ini pengukuran dilakukan dengan dua
kelompok item yang setara pada saat yang sama c)
Bentuk ekivalen, disini pengukuran dilakukan dengan
menggunakan dua tes yang dibuat setara kemudian
diberikan kepada responden atau obyek ukur tes dalam
waktu yang bersamaan. Skor kedua kelompok item
tersebut dikorelasikan untuk mendapatkan reliabilitas
tes.

3) Kepraktisan
Kepraktisan berarti sebuah kemudahan baik dalam hal
persiapan, penggunaan, pengolahan, penafsiran, maupun
pegadministrasian. Kepraktisan merupakan syarat suatu
tes standar. Berikut ini merupakan faktor – faktor yang
memengaruhi kepraktisan, yaitu:
 Kemudahan mengadministrasi
 Waktu yang disediakan untuk
melancarkan evaluasi
 Kemudahan menskor
 Kemudahan interpretasi dan aplikasi
 Tersedianya bentuk instrument evaluasi
yang ekuivalen.
4) Objektivitas
Objektivitas yang dibahas disini menunjukkan skor
tes kemampuan yang sama antara peserta didik yang
satu dengan peserta didik yang lainnya. Objektivitas
prosedur tes yang tinggi akan memperoleh reliabilitas
hasil tes yang tidak dipengaruhi oleh prosedur
penskoran. Konsep realibilitas mendasari kesalahan
pengukuran yang mungkin terjadi pada suatu proses
pengukuran atau pada nilai tunggal tertentu.
Faktor yang memengaruhi subjektivitas dari sebuah
tes adalah:
 Bentuk Tes
 Penilaian

B. Analisis Kualitas Butir Soal


Tingkat kesukaran soal harus dapat dipertahankan dalam batas
yang mampu memberikan daya pembeda. Apabila terdapat tujuan khusus
penyusunan tes dapat dipertimbangkan seperti tingkat kesukaran.
 Soal bentuk objektif
 Soal bentuk uraian
 Daya pembeda
Analisis kualitas butir soal secara kualitatif dengan Teknik panel
merupakan suatu teknik menelaah butir soal berdasarkan kaidah
penulisan butir soal, yaitu ditelaah dari segi konstruksi, bahasa/budaya,
kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh
beberapa penelaah. Caranya adalah beberapa penelaah diberikan butir
soal yang akan ditelaah, format penelaahan, dan pedoman
penilaian/penelaahan. Para penelaah dipersilahkan memperbaiki
langsung pada teks soal dan memberikan komentarnya serta memberikan
nilai pada setiap butir soalnya yang kriterianya adalah baik, diperbaiki,
atau diganti.
Agar penelaah dapat dengan mudah menggunakan format
penelaahan soal, maka para penelaah perlu memperhatikan petunjuk
pengisian formatnya seperti berikut ini:
 Analisislah setiap butir soal berdasarkan semua kriteria yang
tertera di dalam format!
 Berilah tanda cek (√) pada kolom nomor butir soal apabila butir
soal yang ditelaah sudah sesuai dengan kriteria!
 Berilah tanda silang (X) pada kolom nomor butir soal apabila butir
soal yang ditelaah tidak sesuai dengan kriteria.

C. Analisis Pengecoh

Analisis efektifitas pengecoh (distractor) atau analisis pola jawaban


dilakukan dengan menghitung peserta tes yang memilih tiap alternatif
jawaban pada masing-masing Butir. Kriteria pengecoh yang baik adalah
apabila pengecoh tersebut dipilih oleh paling sedikit 5% dari peserta tes.
Pengecoh diadakan untuk menyesatkan mahasiswa agar tidak memilih kunci
jawaban pengecoh menggoda mahasiswa yang kurang begitu memahami
materi pelajaran untuk memilihnya. Agar dapat melakukan fungsinya untuk
mengecoh maka pengecoh harus dibuat semirip mungkin dengan kunci
jawaban.

Pengecoh dikatakan berfungsi efektif apabila paling tidak ada siswa yang
terkecoh memilih. Pengecoh yang sama sekali tidak dipilih tidak dapat
melakukan fungsinya sebagai pengecoh karena terlalu mencolok dan
dimengerti oleh semua mahasiswa sebagai pengecoh soal. Pengecoh yang
berdasarkan hasil uji coba tidak efektif direkomendasikan untuk diganti
dengan pengecoh yang lebih menarik.
D. Acuan Penilaian

Perencanaan dan penafsiran hasil pengukuran dalam bidang pendidikan


dapat berdasarkan acuan norma/relatif atau acuan kriteria/patokan. Kedua
acuan tersebut menggunakan asumsi yang berbeda tentang kemampuan
seseorang. Penafsiran hasil tes antara kedua acuan itu juga berbeda, sehingga
menghasilkan informasi yang berbeda maknanya. Pemilihan acuan
ditentukan oleh karakteristik mata pelajaran yang akan diukur dan tujuan
yang akan dicapai. Penilaian acuan norma berasumsi bahwa kemampuan
orang berbeda dan dapat digambarkan menurut distribusi normal.
Perbedaan itu harus ditunjukan oleh hasil pengukuran, misalnya setelah
mengikuti pembelajaran selama satu semester, mahasiswa dites. Hasil tes
seorang mahasiswa dibandingkan dengan kelompoknya, sehingga dapat
diketahui posisi mahasiswa tersebut di kelas itu. Penilaian acuan kriteria
berasumsi bahwa hampir semua orang dapat belajar apa saja, meskipun
dengan waktu yang berbeda. Dalam acuan kriteria, penafsiran skor hasil tes
selalu dibandingkan dengan kriteria yang telah ditetapkan.

Ada dua pendekatan yang dapat digunakan dalam melakukan penilaian


hasil belajar, yaitu penilaian yang mengacu kepada norma (Penilaian Acuan
Norma atau norm-referenced assesment) biasa disebut dengan PAN dan
penilaian yang mengacu kepada kriteria (Penilaian Acuan Kriteria atau
criterion referenced assessment) biasa disebut dengan PAP. Perbedaan
kedua pendekatan tersebut terletak pada acuan yang dipakai. Pada penilaian
yang mengacu kepada norma, interpretasi seluruh peserta didik yang dinilai
dengan alat penilaian yang sama. Jadi hasil seluruh peserta didik digunakan
sebagai acuan. Sedangkan, penilaian yang mengacu kepada kriteria atau
patokan, interpretasi hasil penilaian bergantung pada apakah atau sejauh
mana seorang peserta didik mencapai atau menguasai kriteria atau patokan
yang telah ditentukan. Kriteria atau patokan itu dirumuskan dalam
kompetensi atau hasil belajar dalam kurikulum berbasis kompetensi.
Untuk menentukan kedudukan setiap siswa di dalam kelompoknya
digunakan acuan kurva normal, maka disebut penilaian acuan norma. Hal ini
lebih cocok jika digunakan pada evaluasi sumatif (mengapa?)

Sebagai ilustrasi perhatikan contoh berikut ini.

Skor terbagi atas lima kategori : A, B, C, D, E atau 1, 2, 3, 4, 5.

Ada tiga cara menentukan angka-angka batas kategori, yaitu :

1. Mx + 0,50 SD dan + 1,50 SD


2. Mx + 1,00 SD dan + 2,00 SD.
3. Penghitungan persentil tertentu, yaitu :
P7, P31, P69 dan P93

Sedangkan Criterion Referenced (PAP)/Criterion Based


Evaluation/Criterion Reference Evaluation biasa disebut dengan Penilaian
Acuan Patokan/Standar Mutlak yang merupakan Norma Ideal. Penguasaan
mahasiswa diukur dengan menggunakan perbandingan terhadap suatu
kriteria tertentu. Patokan/kriteria yang dimaksud adalah tujuan yang dicita-
citakan, yaitu menguasai seluruh materi (100%) bila tidak mampu
diperhitungkan berapa % dari 100%.

Patokan 100% adalah :

 angka 100 (skala penilaian 1-100)


 angka 10 (skala penilaian 1-10)
 angka 4 (skala penilaian 0-4/E-A).
TABEL SPESIFIKASI PENULISAN BUTIR SOAL
Jenis Sekolah : Sekolah Menengah Atas
Kelas/Semester : 1 (satu)/I
Bentuk soal : Uraian
Aspek Nomor
Tujuan Umum P.Bahasan/
Materi Indikator Kognitif soal
Pembelajaran S.P. Bahasan
C1 C2 C3
Siswa memahami Fungsi Fungsi  Menemukan suatu x 1
dan terampil Kuadrat Kuadrat fungsi dari sekumpulan
menggunakan data yang diberkan.
aturan, konsep dan  Menentukan apakah x 5
rumus-rumus suatu grafik yang
fungsi kuadrat dan disajikan dalam diagram
grafiknya kartesius merupakan
grafik fungsi. x 3,6
 Menentukan persamaan
fungsi kuadrat, jika
diketahui titik balik
minimum dan suatu titik
yang dilalui grafik
Aplikasi fungsi kuadrat x 2
fungsi  Menggunakan
kuadrat dan tranformasi geser untuk
grafiknya menemukan grafik
fungsi kuadrat g dari
grafik fungsi kuadrat f
yang diberikan x 4
 Menggambarkan grafik
fungsi kuadrat x 8
 Menggunakan prinsip-
prinsip dalam fungsi
kuadrat untuk menentu
kan luas maksimum dua
kandang dengan kondisi
yang diberikan x 7
 Menentukan hasil kali
maksimum dua bilangan
jika diketahui jumlah
kedua bilangan tersebut
Untuk mengetahui karakteristik dari instrumen tes hasil belajar, dengan
menganalisis data hasil uji coba, yang dikenal dengan analisis butir tes. Butir tes
dikatakan baik apabila memiliki informasi yang baik secara kualitatif maupun secara
kuantitatif.

Setelah soal disusun, dilakukan telaah butir soal secara kualitatif yang bertujuan
untuk menguji mutu butir soal dari segi kesesuaian materi, bahasa, dan konstruksi. Ini
berkaitan erat dengan validasi isi. Hasil validasi tersebut dapat dilihat pada tabel
berikut.

Tabel Hasil Validasi Tes

Penilaian Validator untuk Butir Soal


No. Validator
1 2 3 4 5 6 7 8

1 Validator 1 LD LD LDP LD LD LD LD LD

2 Validator 2 LD LD LD LD LD LD LD LDP

3 Validator 3 LD LD LD LD LDP LD LD LD

4 Validator 4 LD LD LD LD LD LD LD LD

5 Validator 5 LD LD LD LD LD LD LD LD

6 Validator 6 LD LD LD LD LD LD LD LD

Keterangan:

LD : Layak Digunakan

LDP : Layak Digunakan dengan Perbaikan

Secara kuantitatif seyogyanya memenuhi kritria validitas item, reliabilitas,


tingkat kesukaran, dan daya pembeda berdasarkan data hasil uji coba lapangan.
KESIMPULAN

Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk
mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal
yang menjadi bagian dari tes tersebut.

Suatu instrument dapat dikatakan valid apabila benar-benar mampu mengukur


apa yang hendak diukur dengan tepat. Validitas dapat dihitung dengan beberapa
metode, antara lain metode korelasi product moment angka simpangan,korelasi
perbedaan peringkat peringkat dan diagram pencar. Reliabilitas merupakan derajat
konsistensi suatu instrument.

Suatu tes dapat dikatakan reliable apabila selalu memberikan hasil yang sama
bila diteskan pada kelompok yang sama pada kesempatan yang berbeda.

Analisis butir soal dilakukan dengan melakukan perhitungan tingkat kesukaran


dan daya pembeda. Analisis lain yang dibutuhkan untuk memastikan kualitas tes dan
butir soal adalah analisis pengecoh, analisis homogenitas dan analisis efektivitas fungsi
opsi.

SOAL LATIHAN

1. Mengapa seorang guru harus melakukan analisis kualitas tes dan karakteristik
butir soal?
2. Aspek apa yang perlu diperhatikan dalam menyusun butir soal?
3. Apa itu analisis kualitas soal?
4. Apa manfaat dari analisis butir soal?
5. Seberapa penting dan jelaskan fungsi dari adanya pengecoh dalam penyusunan
soal?
DAFTAR PUSTAKA

Dr. Muhammad Ilyas Ismail, M. Pd., M. Si. Penerbit: PT. Raja Grafindo Persada,Evaluasi
Pembelajaran

Arif Mu’Amar Wahid, Februari 2022,Analisis Butir Tes Hasil Belajar,LP3M UAP

Aridol, Wibawa, Karman, Desember 2016, Analisis Kualitas Tes dan Butir Soal,Aridol
Berkarya

Anda mungkin juga menyukai