Disusun Oleh:
Kelompok 2
Futri Furnama Sari (220902500010)
Wasimah Nur Afifah (220902501001)
Wahdini (220902501002)
Serli Agestina (220902501003)
Lisma (220902501004)
Nur Aviati (220902501005)
Putri Anggraeni Fajiran Safar (220902501007)
Rahmawati (220902501008)
ii
KATA PENGANTAR
Kelompok 2
i
DAFTAR ISI
KATA PENGANTAR..............................................................................................i
DAFTAR ISI............................................................................................................ii
DESKRIPSI AWAL................................................................................................1
A. Deskripsi Singkat......................................................................................1
B. Relevansi...................................................................................................1
C. Indikator....................................................................................................1
PEMBAHASAN......................................................................................................2
A. Validitas.....................................................................................................2
B. Reliabilitas.................................................................................................6
C. Kepraktisan..............................................................................................11
D. Objektivitas.............................................................................................13
E. Analisis Kualitas Butir Soal....................................................................14
F. Analisis Pengecoh.......................................................................................16
G. Analisis Homogenitas Soal.....................................................................18
H. Efektifitas Fungsi Opsi............................................................................19
PENUTUP..............................................................................................................21
SOAL LATIHAN..................................................................................................22
REFERENSI..........................................................................................................23
ii
BAB 6
ANALISIS KUALITAS TES DAN BUTIR SOAL
DALAM PEMBELAJARAN
DESKRIPSI AWAL
A. Deskripsi Singkat
Suharsimi Arikunto menyatakan bahwa analisis kualitas tes merupakan
kegiatan untuk mengkaji soal pada setiap item atau butirnya guna mengetahui
kualitas dari setiap butir soal tersebut. Analisis kualitas butir soal adalah suatu
prosedur yang sistematis, yang akan memberikan informasi-informasi yang sangat
khusus terhadap butir tes yang kita susun. Sumarna Surapranata mengemukakan
bahwa analisis kualitas soal dilakukan untuk mengetahui berfungsi tidaknya
sebuah soal. Dari pengertian tersebut dapat disimpulkan bahwa analisis kualitas
butir soal merupakan kegiatan menganalisis tiap-tiap butir soal secara mendetail
menggunakan metode pengujian tertentu.
Berdasarkan definisi dari 2 ahli di atas, dapat disimpulkan bahwa analisis
kualitas soal merupakan kegiatan meneliti dan mengidentifikasi setiap
pertanyaan untuk mengetahui kualitas setiap pertanyaan. Hasil dari proses review
dan identifikasi pertanyaan dapat digunakan untuk memperbaiki dan
menyempurnakan setiap komponen pertanyaan.
B. Relevansi
Tujuan utama analisis kualitas butir soal dalam sebuah tes yang dibuat
pendidik adalah untuk mengidentifikasi kekurangan-kekurangan dalam tes atau
pembelajaran.
C. Indikator
Setelah membaca, membahas, dan mempelajari bab ini mahasiswa
diharapkan mampu mengetahui tujuan dari dilakukannya kegiatan analisis kualitas
tes dan butir soal dalam mendukung proses pembelajaran.
1
PEMBAHASAN
A. Validitas
a. Pengertian Validitas
Validitas sering diartikan dengan kesahihan. Suatu alat ukur
disebut memiliki validitas bilamana sifat alat ukur tersebut isinya layak
mengukur objek yang seharusnya diukur dan sesuai dengan kriteria
tertentu. Validitas berhubungan dengan kemampuan untuk mengukur
secara tepat sesuatu yang diinginkan diukur. Zainal Arifin
menyebutkan ada dua unsur penting dalam validitas yaitu validitas
menunjukkan suatu derajat dan validitas selalu dihubungkan dengan
suatu putusan atau tujuan yang spesifik. Penganalisisan terhadap tes
hasil belajar dapat dilakukan dengan dua cara. Pertama, penganalisisan
yang dilakukan dengan jalan berpikir secara rasional atau
penganalisisan dengan menggunakan logika (logical analysis). Ada 2
hal penting dalam validatas yaitu: Pertama, validitas yang menunjukka
suatu derajat, ada yang sempurna, ada yang sedang dan ada yang
rendah. Kedua, validitas selalu dihubunngkan dengan suatu putusan
dan tujuan yang spesifik.
Ada dua macam validitas empiris yaitu validitas prediksi dan
validitas konkuren. Dari uraian adanya dua jenis validitas, yaitu
validitas logis yang mempunyai dua jenis validitas dan validitas
empiris yang juga mempunyai dua jenis validitas, maka secara
keseluruhan dikenal dengan adanya empat validitas, yaitu:
Validitas Isi (Content Validity)
Validitas Konstruksi (Construct Validity)
Validitas Ramalan (Predictive Validity)
Validitas Bandingan (Concurrent Validity)
b. Faktor-faktor yang Memengaruhi Validitas
Faktor Instrument Evaluasi.
2
Dalam mengembangkan instrumen evaluasi, seorang evaluator
harus memperhatikan hal-hal yang memengaruhi validitas
instrumen dan berkaitan dengan prosedur penyusunan
instrumen. Seperti silabus, kisi-kisi soal, petunjuk mengerjakan
soal dan pengisian lembar jawaban, tingkat kesukaran, daya
pembeda, dan sebagainya. Beberapa sumber yang pada
umumnya berasal dari faktor internal tes evaluasi di antaranya
sebagai berikut:
1. Arahan tes yang disusun dengan makna tidak jelas
sehingga dapat mengurangi validitas tes.
2. Kata-kata yang digunakan dalam struktur instrument
evaluasi, terlalu sulit.
3. Item-item tes dikonstruksi dengan jelek.
4. Tingkat kesulitan item tes tidak tepat dengan materi
pembelajaran yang diterima siswa.
5. Waktu yang dialokasikan tidak tepat, hal ini termasuk
kemungkinan terlalu kurang atau terlalu longgar.
6. Jumlah item tes terlalu sedikit sehingga tidak mewakili
sample materi pembelajaran.
7. Jawaban masing-masing item evaluasi bisa diprediksi
siswa
B. Reliabilitas
a. Pengertian Reliabilitas
c. Karakteristik Reabilitas
Sebuah tes dianggap memiliki reliabilitas yang baik apabila memiliki
karakteristik sebagai berikut:
- Reliabilitas merupakan milik dari satu set nilai tes bukan milik tes
itu sendiri, artinya suatu tes dikatakan baik apabila dapat
menghasilkan skor yang cukup akurat, apabila tes tersebut
diberikan pada kelas tertentu, maka bisa juga menghasilkan skor
yang cukup konsisten bila diberikan pada kelas yang berbeda atau
ketika diberikan pada kelas yang sama pada waktu yang berbeda.
- Suatu tes dikatakan reliable jika dua buah tes dilakukan pada jarak
waktu yang berbeda dan menunjukkan skor yang tidak jauh
berbeda.
- Reliabilitas dapat dinyatakan untuk dua atau lebih pengukuran
independen yang diperoleh dari tes yang sama untuk setiap anggota
kelompok
d. Rumus Reabilitas
Terdapat beberapa rumus dalam pengujian reliabilitas instrumen,
antara lain; Spearman Brown, Flanagan, Rulon, Kuder Richardson
(KR) dan Cronbanch Alpha.
- Rumus Spearman-Brown
Rumus Spearman-Brown
Keterangan:
ri = reliabilitas instrument
rb = indeks korelasi antara dua belahan instrument
N = banyaknya responden
X = belahan pertama
Y = belahan kedua
- Rumus Flanagan
Keterangan:
ri = reliabilitas instrument
v1 = varians belahan pertama (varian skor butir-butir ganjil)
v2 = varians belahan kedua (varian skor butir-butir genap)
vt = varians skor total
- Rumus Rulon
Keterangan:
ri = reliabilitas instrument.
Vt = varians total atau varians skor total
Vd = varians (varians difference)
d = skor pada belahan awal dikurangi skor pada belahan akhir
- Rumus KR 20
Keterangan:
ri = reliabilitas instrument
k = banyaknya butir pertanyaan atau banyaknya soal
pi = proporsi subjek yang menjawab betul pada suatu butir
(proporsi subjek yang mendapat skor 1)
- Rumus KR 21
Keterangan:
ri = reliabilitas instrument
k = banyaknya butir pertanyaan atau banyaknya soal
p = skor rata-rata
Keterangan:
ri = reliabilitas instrumen
k = banyaknya butir pertanyaan atau banyaknya soal
C. Kepraktisan
Dalam kamus besar bahasa Indonesia kepraktisan diartikan sebagai
suatu yang bersifat praktis atau efisien. Arikunto (2010) mengartikan
kepraktisan dalam evaluasi pendidikan merupakan kemudahan-kemudahan
yang ada pada instrument evaluasi baik dalam mempersiapkan,
menggunakan, menginterpretasi/ memperoleh hasil, maupun kemudahan
dalam menyimpanya.
Kepraktisan juga merupakan salah satu ukuran suatu instrumen
evaluasi dikatakan baik atau tidak. Bila guru menggunakan esay tes untuk
mengukur tanggapan siswa terhadap suatu produk pembelajaran, dan
jumlah siswa yang dibimbingnya mencapai dua ratus orang, maka upaya
ini cenderung tidak praktis. Diperlukan cara lain untuk menilai tanggapan
siswa tersebut, misalnya dengan tes lisan terhadap hasil diskusi kelompok.
Kepraktisan diartikan pula sebagai kemudahan dalam penyelenggaraan,
membuat instrumen, dan dalam pemeriksaan atau penentuan keputusan
yang objektif, sehingga keputusan tidak menjadi bias dan meragukan.
Kepraktisan dihubungkan pula dengan efisien dan efektifitas waktu dan
dana. Sebuah tes dikatakan baik bila tidak memerlukan waktu yang
banyak dalam pelaksanaannya, dan tidak memerlukan dana yang besar
atau mahal.
D. Objektivitas
Objektivitas yang dibahas disini menunjukkan skor tes kemampuan
yang sama antara peserta didik yang satu dengan peserta didik yang
lainnya. Objektivitas prosedur tes yang tinggi akan memperoleh
reliabilitas hasil tes yang tidak dipengaruhi oleh prosedur penskoran.
Konsep realibilitas mendasari kesalahan pengukuran yang mungkin terjadi
pada suatu proses pengukuran atau pada nilai tunggal tertentu. ebuah tes
dikatakan memiliki objektivitas apabila dalam pelaksanaan apabila dalam
tes itu tidakada faktor subjektif yang mempengaruhi. Hal ini terjadi pada
sistem pada sistem skoring.Ada dua faktor yang mempengaruhi
subjektivitas dari suatu tes yaitu bentuk tes dan penilai
Faktor yang memengaruhi subjektivitas dari sebuah tes adalah:
Bentuk Tes
Tes yang berbentuk uraian akan memberikan banyak
kemungkinan kepada si pemakai untukmemberikan
penilaian menurut caranya sendiri. Dengan demikian maka
hasil dari seorang siswayang mengerjakan soal-soal dari
sebuah tes, akan dapat berbeda apabila dinilai oleh dua
orang penilai. Untuk menghindari masuknya unsur
subjektivitas dari penilai, maka sistenm skoringnyadapat
dilakukan dengan membuat pedoman skoring terlebih
dahulu.
Penilaian
Subjektivitas dari penilai akan dapat masuk karena
secara agak leluasa terutama dalam
tes bentuk uraian. Faktor yang mempengaruhi subjektivitas
yaitu kesan penilai terhadapsiswa, tulisan, waktu
mengadakan penilaian, bahasa, kelelahan dan sebagainya.
Untukmenghindari masuknya unsur subjektivitas dalam
pekerjaan penilaian, maka penilaian harusdilaksanakan
dengan pengingat pedoman. Pedoman yang dimaksud,
terutama menyangkutmasalah pengadministrasian yaitu
kontinuitas dan komprehensivitas. Dengan penelitian
yangkontinu (terus menerus) maka penilaian akan
memperoleh gambaran yang lebih jelas tentangkeadaan
siswa. Adapun komprehensif di sini mencakup keseluruhan
materi, aspek berfikir(ingatan, pemahaman, aplikasi dan
sebagainya), dan berbagai cara tes (tertulis, lisan,
perbuatandan sebagainya).
Keterangan:
WL = Jumlah peserta didik yang menjawab salah dari kelompok bawah
WH = Jumlah peserta didik yang menjawab salah dari kelompok atas
nL = Jumlah kelompok bawah
nH = Jumlah kelompok atas
c. Daya Pembeda
Perhitungan daya pembeda adalah pengukuran sejauhmana suatu butir
soal mampu membedakan pesertadidik yang sudah belum menguasai
kompetensi berdasarkan kriteria tertentu.
Adapun rumus untuk mengetahui daya pembeda adalah:
( WL−WH )
DP=
n
Keterangan:
DP = adalah besarnya daya pembeda yang dicari
n = besarnya sampel dari salah satu kelompok
F. Analisis Pengecoh
Pengecoh dikatakan berfungsi efektif apabila paling tidak ada siswa
yang terkecoh memilih. Pengecoh yang sama sekali tidak dipilih tidak
dapat melakukan fungsinya sebagai pengecoh karena terlalu mencolok dan
dimengerti oleh semua mahasiswa sebagai pengecoh soal. Pengecoh yang
berdasarkan hasil uji coba tidak efektif direkomendasikan untuk diganti
dengan pengecoh yang lebih menarik.
Indeks pengecoh dihitung dengan rumus:
IP = P x 100%
(N - B) (n - 1)
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban
1= bilangan tetap
Catatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai
kunci jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan
demikian pengecoh tidak berfungsi.
Contoh:
50 orang peserta didik dites dengan 10 soal bentuk pilihan ganda. Tiap soal
memiliki alternatif jawaban (a, b, c, d, e). Kunci jawaban (jawaban yang
benar) no. 8 adalah c. Setelah soal no.8 diperiksa untuk semua peserta didik,
ternyata dari 50 orang peserta didik, 20 peserta didik menjawab benar dan
30 peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata.
Berikut ini adalah contoh soal no.8
.
Alternatif jawaban A B C D E
Distribusi jawaban peserta
7 8 20 7 8
didik
IP 93% 107% ** 93% 107%
Kualitas pengecoh ++ ++ ++ ++ ++
Keterangan:
** = kunci jawaban
++ = sangat baik
+ = baik
= kurang baik
_ = jelek
_ _ = sangat jelek
Pada contoh diatas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan
107%. Semuanya dekat dengan angka 100%, sehingga digolongkan sangat
baik sebab semua pengecoh itu berfungsi. Jika pilihan jawaban peserta didik
menumpuk pada satu alternatif jawaban, misalnya seperti berikut:
Alternatif jawaban A B C D E
Distribusi jawaban peserta didik 20 2 20 8 0
IP 267% 27% ** 107% 0%
Kualitas pengecoh _ - ** ++ _
Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e)
dan (b) tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan
(e) perlu diganti karena termasuk jelek, danpengecoh (b) perlu
direvisikarena kurang baik. adapun kualitas pengecoh berdasar indeks
pengecoh adalah:
Sangat baik IP = 76% - 125%
Baik IP = 51% - 75% atau 126% - 150%
Kurang baik IP = 26% - 50% atau 151% - 175%
Jelek IP = 0% - 25% atau 176% - 200%
Sangat jelek IP = lebih dari 200%
Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh
untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun
butir soal yang menjadi bagian dari tes tersebut.
Suatu instrument dapat dikatakan valid apabila benar-benar mampu
mengukur apa yang hendak diukur dengan tepat. Validitas dapat dihitung dengan
beberapa metode, antara lain metode korelasi product moment angka
simpangan,korelasi perbedaan peringkat peringkat dan diagram pencar.
Reliabilitas merupakan derajat konsistensi suatu instrument.
Suatu tes dapat dikatakan reliable apabila selalu memberikan hasil yang
sama bila diteskan pada kelompok yang sama pada kesempatan yang berbeda.
Analisis butir soal dilakukan dengan melakukan perhitungan tingkat
kesukaran dan daya pembeda. Analisis lain yang dibutuhkan untuk memastikan
kualitas tes dan butir soal adalah analisis pengecoh, analisis homogenitas dan
analisis efektivitas fungsi opsi.
21
SOAL LATIHAN
22
REFERENSI
23