Dosen Pengampu :
Disusun Oleh:
Puji dan syukur kami panjatkan kepada Allah SWT, karena atas Rahmat
dan Hidayah-Nya, tugas makalah mata kuliah Metodologi penelitian pendidikan
dapat terselesaikan dengan baik yang berjudul “Analisis pokok Uji Intrumen
Penelitian”.Tujuan penyusunan makalah ini adalah untuk pembelajaran dan
memenuhi syarat mendapatkan nilai pada mata kuliah Metodologi Penelitian
Pendidikan. Makalah ini disusun berdasarkan referensi-referensi dari berbagai
sumber.
Kami menyadari bahwa dalam penyusunan makalah ini tidak lepas dari
dukungan dan bantuan berbagai pihak. Tidak lupa kami sampaikan terimakasih
kepada dosen mata kuliah metodologi penelitian pendidikan yaitu Ibu Nukhbatul
Bidayati Haka, M.Pd. yang telah membantu dan membimbing kami dalam
mengerjakan makalah ini. Kami juga mengucapkan terimakasih kepada teman-
teman mahasiswa yang sudah memberi bantuan baik langsung maupun tidak
langsung dalam pembuatan makalah ini.
Penulis
ii
DAFTAR ISI
DAFTAR ISI........................................................................................................ii
KATA PENGANTAR.........................................................................................iii
BAB 1 PENDAHULUAN
1.1 Latar Belakang......................................................................................1
1.2 Rumusan Masalah.................................................................................1
1.3 Tujuan...................................................................................................1
BAB II PEMBAHASAN
2.1 Pengertian Instrumen Penelitian............................................................2
2.2 Jenis-jenis uji instrument Penelitian......................................................2
1. Validitas ..........................................................................................2
2. Reliabilitas ....................................................................................12
3. Daya Beda......................................................................................18
4. Tingkat Sukar.................................................................................21
5. Tingkat Pengecoh ..........................................................................23
DAFTAR PUSTAKA
iii
BAB I
PENDAHULUAN
1.3 Tujuan
Adapun tujuan dari makalah embriogenesis ini adalah sebagai berikut:
1. Untuk mengetahui pengertian dari intrumen penelitian
2. Untuk mengetahui apa saja jenis-jenis uji instrument penelitian
1
BAB II
PEMBAHASAN
1. Validitas
Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata validity
yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen
pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes dikatakan memiliki
validitas yang tinggi apabila alat tersebut menjalankan fungsi ukur secara tepat
1
Puspitasari, wahyu” pengujian validasi isi angket persepri mahasiswa terhadap pembelajaran
daring matakuliah matematika komputasi” jurnal FACTOR, vol.4, 2021, hal 77-90
2
atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran tersebut. Artinya hasil ukur dari pengukuran tersebut merupakan
besaran yang mencerminkan secara tepat fakta atau keadaan sesungguhnya dari
apa yang diukur. Suryabrata (2000: 41) menyatakan bahwa validitas tes pada
dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat
kecermatan ukurnya sesuatu tes. Validitas suatu tes mempermasalahkan apakah
tes tersebut benar-benar mengukur apa yang hendak diukur. Maksudnya adalah
seberapa jauh suatu tes mampu mengungkapkan dengan tepat ciri atau keadaan
yang sesungguhnya dari obyek ukur, akan tergantung dari tingkat validitas tes
yang bersangkutan. Sudjana (2004: 12) menyatakan bahwa validitas berkenaan
dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-
betul menilai apa yang seharusnya dinilai.2
Suatu tes yang valid untuk tujuan tertentu atau pengambilan keputusan
tertentu, mungkin tidak valid untuk tujuan atau pengambilan keputusan lain. Jadi
validitas suatu tes, harus selalu dikaitkan dengan tujuan atau pengambilan
keputusan tertentu. Tes masuk di SMA misalnya harus selalu dikaitkan dengan
seberapa jauh tes masuk tersebut dapat mencerminkan prestasi atau hasil belajar
para calon peserta didik baru setelah belajar nanti. Konsep Validitas tes dapat
dibedakan atas tiga macam yaitu validitas isi (content validity), validitas konstruk
(construct validity), dan validitas empiris atau validitas kriteria.
a. Validitas isi
Validitas isi suatu tes mempermasalahkan seberapa jauh suatu tes
mengukur tingkat penguasaan terhadap isi atau konten atau materi
tertentu yang seharusnya dikuasai sesuai dengan tujuan pengajaran.
Dengan kata lain tes yang mempunyai validitas isi yang baik ialah tes
yang benar-benar mengukur penguasaan materi yang seharusnya
dikuasai sesuai dengan konten pengajaran yang tercantum dalam
Garis-garis Besar Program Pengajaran (GBPP). Validitas isi
menunjukkan sejauhmana pertanyaan, tugas atau butir dalam suatu tes
atau instrumen mampu mewakili secara keseluruhan dan proporsional
perilaku sampel yang dikenai tes tersebut. Artinva tes itu valid apabila
butir-butir tes itu mencerminkan keseluruhan konten atau materi yang
diujikan atau yang seharusnya dikuasai secara proporsional. Untuk
mengetahui apakah tes itu valid atau tidak, harus dilakukan melalui
penelaahan kisi-kisi tes untuk memastikan bahwa soal-soal tes itu
sudah mewakili atau mencerminkan keseluruhan konten atau materi
yang seharusnya dikuasai secara proporsional. Oleh karena itu
2
Sanaky, musrifah”analisis factor-faktor penyebab keterlambatan pada proyek pembangunan
gedung asrama MAN 1 Tulehu Maluku Tengah” jurnal simetrik, vol.11, 2021. hal 432-439
3
validitas isi suatu tes tidak mempunyai besaran tertentu yang dihitung
secara statistika tetapi dipahami bahwa tes itu sudah valid berdasarkan
telaah kisi-kisi tes. Oleh karena itu, validitas isi sebenarriya
mendasarkan pada analisis logika, tidak merupakan suatu koefisien
validitas yang dihitung secara statistika.
c. Validitas empiris
Validitas empiris sama dengan validitas kriteria yang berarti bahwa
Validitas ditentukan berdasarkan kriteria, baik kriteria internal maupun
kriteria eksternal. Validitas empiris diperoleh melalui hasil uji coba tes
kepada responden yang setara dengan responden yang akan dievaluasi
atau diteliti. Kriteria internal adalah tes atau instrumen itu sendiri yang
menjadi kriteria, sedang kriteria eksternal adalah hasil ukur instrumen
atau tes lain di luar instrumen itu sendiri yang menjadi kriteria. Ukuran
lain yang sudah dianggap baku atau dapat dipercaya dapat pula
dijadikan sebagai kriteria eksternal. Validitas yang ditentukan
4
berdasarkan kriteria internal disebut validitas internal sedangkan
validitas yang ditentukan berdasarkan kriteria eksternal disebut
validitas eksternal.
Validitas dapat diartikan begini, sebuah tes dapat dikatakan valid apabila
tes tersebut mengukur apa yang hendak diukur. Serta, pengukuran valid itu
apabila sejajar antara materi dan isi pelajaran yang bersangkutan. Suatu instrumen
yang valid mempunyai validitas tinggi. Begitu sebaliknya, instrumen yang kurang
valid berarti memiliki validitas rendah. Untuk menguji validitas instrumen dapat
dihitung dengan koefesien korelasi menggunakan Product Moment dengan
mencari angka korelasi "r" product moment (ty) dengan derajat kebebasan sebesar
(N-2) sebagai berikut:
Keterangan:
∑xy = jumlah hasil kali antara deviasi skor - skor X (yaitu x) dan deviasi skor -
skor Y (yaitu skor y).
∑x = jumlah kuadrat dari deviasi tiap skor X.
3
Yusuf, febrianawati”uji validitas dan reliabilitas instrument penelitian kuantitatif” jurnal
tarbiyah, vol.7, 2018, hal 17-23
5
∑y = jumlah kuadrat dari deviasi tiap skor Y.
Nilai rxy akan dibandingkan dengan koefisien korelasi table nilai "r" product
moment pada taraf signifikan 5%. Apabila nilai rxy hasil koefisien korelasi lebih
besar (>) dari nilai rtabel, maka hasil yang diperoleh adalah signifikan, artinya
butir soal tes dinyatakan valid. Nilai rxy adalah nilai koefisien korelasi dari setiap
butir/ item soal sebelum dikoreksi, kemudian dicari corrected item-total
correlation coefficient dengan rumus sebagai berikut:
Nilai (y-1) akan dibandingkan dengan koefisien korelasi tabel ftabel Jika Tx (y-
1)>Tubel. Maka instrumen valid. Setelah tes di ujikan kepada siswa yang berada
diluar sampel kemudian instrumen tes diuji melalui pengujian validitas soal tes,
didapat hasil uji coba lapangan untuk validitas butir soal dapat dilihat pada Tabel
di bawah ini:
1. Valid 1,2,5,8,9,10,11,12,13,14
Gambar 1.
Dalam suatu instrumen baik tes maupun non tes dapat dikatakan baik
apabila sudah melewati setiap tahapan pengecekan sebelum instrumen tersebut
akan digunakan. Salah satu tahapannya yaitu pengujian validitas dan reliabilitas.
Fungsi melakukan validitas adalah untuk mengukur derajat ketepatan/kelayakan
instrumen yang digunakan untuk mengukur apa yang akan diukur (Zaenal Arifin,
2012) sedangkan reliabilitas berfungsi untuk sejauh mana hasil suatu pengukuran
memiliki keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan yang
dapat dipercaya (Azwar, 2011). Pengembangan instrumen non tes ini dilakukan
6
mengikuti tahapan pada metode penelitian dan pengembangan model 4D, yaitu
Tahap define, Tahap design, Tahap develop, dan Tahap disseminate.
a. Tahap Define
Instrumen non tes yang dikembangkan bertujuan untuk mengukur tingkat
siswa dalam aspek kreativitas. Adapun langkah-langkah pendefinisian
pengembangan instrument non tes yang dilakukan adalah sebagai berikut:
a) Penentuan subjek
b) Menelaah definisi konseptual dan definisi operasional aspek
kreativitas;
c) Indikator kreativitas yang digunakan adalah fluency, fleksibility,
originality, elaboration, dan sensivity;
d) Pengembangan indikator kreativitas menjadi sebuah butir
pernyataan yang dituangkan dalam kisi-kisi;
e) Penurunan indikator pernyataan kisi-kisi ke dalam bentuk angket.
b. Tahap Design
Setelah dilakukan tahap define, instrumen tes kemudian didesain berdasarkan
hasil kajian terhadap definsi konseptual dan operasional serta indikator kreativitas
yang dikembangkan dari Guilford dalam (suryosubroto, 2009:193). Sebanyak
lima buah indikator pokok yang disusun menjadi soal pertanyaan berdasarkan
aspek kreativitas. Kemudian, tiap pokok soal dibagi menjadi beberapa item soal
berdasarkan indikator kreativitas sehingga secara keseluruhan terdapat lima belas
item soal dengan sebaran soal seperti ditunjukkan Tabel dibawah:
1. Fluency 7 7
2. Fleksibility 3 3
3. Originality 2 2
4. Elaboration 1 1
5. Sensivity 2 2
15
Gambar.2
Tabel sebaran indicator kreativitas (Suryo,2009)
c. Tahap Develop
7
Pada tahap develop, dilakukan analisis butir soal secara eksplisit oleh penilai
terhadap instrumen kreativitas yang akan digunakan nantinya. Ditinjau dari segi
materi, konstruksi, dan bahasa. Instrumen kreativitas yang dibuat memerlukan
beberapa perbaikan sesuai dengan masukan yang diberikan oleh penilai.
Masukan tersebut berguna untuk peningkatan kelayakan instrumen kreativitas
sebelum di uji coba secara langsung kepada siswa.
Jawaban
No Pertanyan
SL S K TP
8
12. Saya lebih memilih mengikuti pendapat orang
lain dari pada pendapat sendiri.
Gambar.3
Tabel instrument non tes kreativitas siswa (Rahayu,2022)
Keterangan:
SL : selalu
S : sering
K : kadang-kadang
TP : tidak pernah
Jawaban
No Pertanyan
SL S K TP
9
sulit untuk diselesaikan.
Gambar.4
d. Tahap Disseminate
Setelah selesai diperbaiki sesuai saran dari penilai, tahap selanjutnya yang
dilakukan yaitu tahap disseminate atau menyebarkan. Pada tahap ini, instrumen
soal diuji coba untuk diteskan pada sampel siswa Sekolah Dasar di kota Tegal
Alur, Jakarta Barat dengan jumlah sampel sebanyak 50 orang. Berikut merupakan
rekapan hasil jawaban pada salah satu nomor yang telah dijawab siswa
10
Gambar.4
Hasil rekapan jawaban siswa pada butir nomor dua (Rahayu,2022)
Uji validitas tiap soal dapat menggunakan uji korelasi moment Pearson.
Pada uji validitas dengan uji korelasi moment Pearson, kriteria valid atau tidaknya
pada tiap item dalam instrumen dapat diperoleh dari hasil perbandingan antara
koefisien korelasi Pearson rhitung terhadap nilai moment Pearson tabel rtabel. Jika
nilai rhitung lebih besar daripada rtabel maka item tes tersebut dapat dikatakan
valid. Dengan demikian, jumlah sampel sebanyak 50 orang dan taraf signifikansi
5% maka diperoleh rtabel = 0,279. Hasil uji validitas instrumen dan kriterianya
dapat dilihat pada Tabel 5 dibawah:
1. 0,450 Valid
3. 0,526 Valid
4. 0,457 Valid
4
Utomo, fuad”uji validitas dan reliabilitas instrument non tes kreativitas siswa klas VI SDN Tegal
Alur 16 Petang” jurnal hurriah, Vol.3, 2022, hal 20-28
11
5. 0,321 Valid
7. 0,464 Valid
8. 0,336 Valid
9. 0,298 Valid
Gambar.5
Berdasarkan gambar tabel 5 dapat dilihat bahwa keseluruhan item instrumen non
tes kreativitas yang telah dikembangkan bersifat valid namun ada juga yang tidak
valid. Penggunaan instrumen non tes ini pada dasarnya memiliki tujuan untuk
mengukur tingkat kreativitas siswa. Berdasarkan hasil pada tahap disseminate
diperoleh informasi bahwa instrumen non tes yang telah dikembangkan layak
untuk digunakan dalam mengukur tingkat kreativitas siswa dengan catatan masih
terdapat butir soal yang belum valid artinya harus melakukan perbaikan pada butir
tersebut.
2. Reliabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu
pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila
dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang
sama. diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur
dalam diri subyek memang belum berubah. Nur (1987: 47) menyatakan bahwa
reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu. atau skor-z,
relatif konsisten apabila dilakukan pengulangan yang ekivalen.
pengadministrasian dengan tes yang sama atau tes yang ekivalen. Azwar (2003:
176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau karakter utama
12
instrumen pengukuran yang baik. Arifin (1991: 122) menyatakan bahwa suatu tes
dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada
kelompok yang sama pada waktu atau kesempatan yang berbeda. Konsep
reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan masalah
kekeliruan pengukuran.
Pada teknik belah dua ini pengukuran dilakukan dengan dua kelompok
butir yang setara pada saat yang sama. Karena setiap kelompok butir merupakan
separuh dari seluruh tes, maka biasanya kelompok butir pertama diambil dari
butir-butir tes yang bernomor ganjil, sedangkan kelompok butir yang kedua
diambil dari butir-butir tes yang bernomor genap. Perlu diketahui bahwa
reliabilitas dengan teknik ini sangat relatif, karena reliabilitas akan tergantung
pada cara penomoran dan pengelompokan butir yang diambil. Di sini pengukuran
dilakukan dengan menggunakan dua tes yang dibuat Setara kenndian diberikan
kepada responden atau obyck ses dalam waktu yang bersamaan. Skor dari kedua
kelompok butir tes tersebut dikorelasikan untuk mendapatkan reliabilitas tes.
Reliabilitas instrumen dapat diuji dengan beberapa uji reliabilitas. Beberapa uji
reliabilitas suatu instrumen yang bisa digunakan antara lain test-retest, ekuivalen,
dan internal consistency. Internal consistency sendiri memiliki beberapa teknik uji
13
yang berbeda. Teknik uji relibilitas internal consistency terdiri dari uji split half,
KR 20, KR 21, dan Alfa Cronbach.5
b. KR 20 dan KR 21
Teknik pengujian reliabilitas dengan uji internal consistency yang
selanjutnya dibahas adalah teknik Kuder Richardson atau sering
disingkat KR. Instrumen yang dapat diuji reliabilitasnya menggunakan
5
Puspasari, heny “uji validitas dan reliabilitas instrument penelitian tingkat pengetahuan dan sikap
mahasiswa terhadap pemilihan suplemen kesehatan dalam menghadapi covid-19” jurnal
kesehatan, vol.12, 2022, hal 65-71
14
KR adalah instrumen dengan satu jawaban benar saja. Rumus KR yang
sering digunakan adalah KR 20 dan KR 21. Kedua teknik KR tersebut
memiliki kriteria instrumen khusus untuk bisa menggunakan
rumusnya. Saat instrumen tidak dapat dipastikan bahwa setiap item
soal memiliki tingkat kesulitan yang sama, maka instrumen tersebut
dianalisis reliabilitasnya menggunakan rumus KR 20 (Fraenkel,
Wallen, & Hyun, 2012).
15
Menurut Fraenkel, Wallen, & Hyun (2012) suatu instrumen dikatakan
reliabel apabila nilai koefisien reliabilitas KR lebih dari 0,70 (>0,70).
c. Alfa Cronbach
Pengujian reliabilitas menggunakan uji Alfa Cronbach dilakukan untuk
instrumen yang memiliki jawaban benar lebih dari 1 (Adamson &
Prion, 2013). Instrumen tersebut misalnya instrumen berbentuk esai,
angket, atau kuesioner. Rumus koefisien reliabilitas Alfa Cronbach
adalah sebagai berikut.
16
Alfa Cronbach untuk instrumen yang reliabel. Menurut Nunnally
(dalam Streiner, 2003) menyatakan bahwa instrumen dikatakan
reliabel jika koefisien reliabilitas Alfa Cronbach lebih dari 0,70 (r>
0,70) dan Streiner sendiri (2003) menyatakan bahwa koefisien
reliabilitas Alfa Cronbach, tidak boleh lebih dari 0,90 (<0,9). Jika
koefisien reliabilitas Alfa Cronbach kurang dari 0,70 (< 0,70). Tavakol
& Dennick (2011) menyarankan untuk merevisi atau menghilangkan
item soal yang memiliki korelasi yang rendah. Cara mudah
menentukan item soal tersebut adalah dengan bantuan program di
komputer. Jika koefisien reliabilitas Alfa Cronbach lebih dari 0,90 (>
0.90). mereka pun memiliki saran. Mereka menyarankan untuk
mengurangi jumlah soal dengan kriteria soal yang sama meskipun
dalam bentuk kalimat yang berbeda.
Reliabilitas merupakan ketetapan suatu hasil tes, suatu tes dapat dikatakan
mempunyai taraf kepercayaan tinggi jika tes tersebut dapat memberikan hasil
yang tetap. Sedangkan untuk menguji reliabilitas soal tes dengan menggunakan
Koefisien Cronbach Alpha, yaitu:
Keterangan:
0,71-0,90 Tinggi
0,41-0,70 Sedang
17
0,21-0,40 Rendah
Gambar.6
Tabel kriteria reabilitas (Sugiono,2013)
1) Apabila r₁₁ sama dengan atau lebih besar dari pada 0.70 berarti tes hasil
belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki
reliabilitas yang tinggi (reliabel)
2) Apabila r₁₁ lebih kecil dari pada 0,70 berarti tes hasil belajar yang sedang
diuji reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi
(un-reliabel)
Berdasarkan hasil perhitungan uji reliabilitas dari 15 soal yang telah diuji
cobakan, di dapat nilai reliabilitas sebesar 0,83 maka termasuk kategori sangat
tinggi. Hasil uji coba ini dianalisis keabsahannya menggunakan program
Microsoft Office Exel 2007.
Uji reliabilitas instrumen non tes dapat menggunakan uji alpha cronbach.
Suatu item instrumen dapat dikatakan r eliabel jika rhitung instrumennya lebih besar
dari rtabel. Hasil uji relibitas dengan menggunakan uji alpha cronbach dapat
dilihat pada Tabel dibawah.
Gambar.7
Tabel hasil uji coba reabilitas instrument non tes (Rahayu,2022)
18
yaitu sebesar 0.279. Maka dapat disimpulkan bahwa instrumen sudah reliabel
karena rhitung = 0,50 > rtabel = 0,279.6
3. Daya Beda
Daya pembeda dalam suatu tes bertujuan untuk mengetahui perbedaan
peserta didik kemampuan peserta didik. Semakin tinggi indeks yang dimiliki oleh
butir soal, maka semakin baik butir soal tersebut karena memiliki daya untuk
membedakan kemampuan peserta didik yang pandai dan kurang pandai.
Sebaliknya jika semakin rendah indeks yang dimiliki oleh butir soal, maka
semakin rendah soal tersebut membedakan kemampuan peserta didik yang pandai
dan kurang pandai (Amelia, 2017). Koefisien daya beda butir soal berkisar dari -
1,00 sampai +1,00. Jika suatu butir soal memiliki tanda negatif maka dapat
dinyatakan bahwa soal tersebut menyesatkan karena peserta dari kelompok pandai
menjawab salah sehingga harus dihilangkan atau dibuang. Analisis daya beda
artinya mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam
membedakan siswa yang termasuk kedalam kategori rendah dan kategori tinggi.
Daya pembeda butir adalah kemampuan suatu butir tes untuk dapat membedakan
antara testee yang berkemampuan tinggi dan berkemampuan rendah. Analisis
daya beda pada penelitian ini menggunakan rumus.7
Dimana:
6
Budiantoro, tekad “ validitas dan reliabilitas instrument keterampilan komunikasi dan
keterampilan kolaborasi pada mata kuliah bahasa Indonesia” jurnal humoniora teknologi, vol.7,
2021, hal 1-6
7
Fatimah, laela” analisis kesukaran soal, daya pembeda dan fungsi instraktor” jurnal komunikasi
dan pendidikan islam, vol 8, 2019, hal. 37-64
19
PA = Proporsi peserta didik kelompok atas yang dapat menjawab dengan betul
butir item yang bersangkutan.
keterangan:
BA = Banyaknya peserta didik kelompok atas yang dapat menjawab dengan
betul butir item yang bersangkutan.
JA = jumlah peserta didik yang termasuk dalam kelompok atas.
PB = Proporsi peserta didik kelompok atas yang dapat menjawab dengan betul
butir item yang bersangkutan ini diperoleh dengan rumus :
Keterangan :
BB = Banyaknya peserta didik kelompok bawah yang dapat menjawab
dengan betul butir item yang bersangkutan.
JB = Jumlah peserta didik yang termasuk dalam kelompok bawah.
Gambar.8
Tabel klasifikasi uji daya beda (Anas, 2009)
20
Seperti halnya angka tingkat kesukaran butir soal, maka tingkat diskriminasi atau
daya pembeda ini besarnya berkisar antara 0 (nol) sampai dengan 1,00. Butir-
butir soal yang baik adalah butir-butir soal yang mempunyai tingkat diskriminasi
0,4 sampai 0,7. Hasil uji daya pembeda butir soal dapat dilihat pada tabel dibawah
ini:
1. Jelek 0
2. Cukup 2,3
3. Baik 1,4,6,7,9,10,12,13,14
Gambar. 9
Tabel hasil uji daya pembeda butir soal (Anas, 2009)
Berdasarkan hasil perhitungan uji daya pembeda butir soal yang akan digunakan
untuk mengukur kemampuan berpikir kritis siswa pada soal pretest dan postest
adalah butir soal yang memiliki kriteria cukup, baik dan sangat baik. Berdasarkan
hasil perhitungan uji daya pembeda dari 15 soal yang telah diuji cobakan,
diperoleh kriteria soal dengan kategori cukup, baik dan sangat baik.Hasil uji coba
ini dianalisis keabsahannya menggunakan program Microsoft Office Exel 2007.8
4. Tingkat Sukar
Analisis tingkat kesukaran dimaksudkan untuk mengetahui apakah soal
tersebut tergolong mudah atau sukar. Tingkat kesukaran adalah bilangan yang
menunjukan sukar atau mudahnya sesuatu soal. (Arikunto, 1999: 207). Analisis
tingkat kesukaran artinya mengkaji soal-soal tes dari segi kesulitannya, sehingga
dapat diperoleh soal-soal yang layak untuk diberikan keperserta didik, untuk
mengetahui mana soal yang mudah, mana soal yang sedang dan mana soal yang
sulit. Tingkat kesukaran soal dapat diliat dari seberapa banyak siswa tersebut
dapat menjawabnya, bukan dilihat dari sudut guru yang membuat soal. Analisis
tingkat kesukaran pada penelitian ini menggunakan satu rumus.9
21
jawaban yang benar terhadap suatu butir soal (Suryani, 2017). Koefisien korelasi
point biserial pada dasarnya menunjukkan kerelasian antara skor jawaban suatu
item. Nilai koefisien yang tinggi menunjukkan bahwa peserta didik dapat
menjawab dengan benar suatu soal. Sebaliknya nilai koefisien yang rendah
menunjukkan bahwa butir soal tidak dapat dijawab dengan benar. Nilai koefisien
korelasi biserial menunjukkan yang semakin tinggi menunjukkan bahwa suatu
item memiliki indeks kesukaran baik (Zein et al., 2013). Butir-butir item tes hasil
belajar dapat dinyatakan sebagai butir-butir item yang baik, apabila butir-butir
tersebut tidak terlalu sukaratau tidak terlalu mudah dengankata lain tingkat
kesukarannya adalah sedang atau cukup. Jadi bermutu tidaknya butir-butir item
tes hasil belajar dapat diketahui dari tingkat kesukaran yang dimiliki masing-
masing butir soal. selanjutnya angka indeks menggunakan rumus yang
dikemukakan oleh Du Bois, yaitu
Keterangan:
P = proporsi (indeks kesukaran)
B = jumlah siswa yang menjawab soal tes dengan benar
JS = jumlah seluruh peserta didik peserta tes
0,00-0,30 Sukar
0,31-0,70 Sedang
0,71-1,00 Mudah
Gambar.10
Tabel indeks tingkat kesukaran (Anas,2002)
Hasil uji coba tingkat kesukaran butir soal dapat dilihat pada Tabel dibawah ini:
22
1. Sukar 0
2. Sedang 1,2,3,4,5,6,7,8,11,15
3. Mudah 9,10,13,14
Gambar. 11
Berdasarkan hasil perhitungan tingkat kesukaran butir soal yang digunakan untuk
mengukur kemampuan berpikir kritis siswa adalah 10 butir soal dari kategori
sedang yang di sesuaikan dengan kevalidan dan indikator kemampuan berpikir
kritis. Hasil uji coba ini dianalisis keabsahannya menggunakan program Microsoft
Office Exel 2007.10
5. Tingkat pengecoh
Pengecoh (distraktor) merupakan suatu pola yang dapat menggambarkan
bagaimana testee menentukan pilihan penjelasan terhadap kemungkinan-
kemungkinan jawaban yang telah dipasang pada setiap butir item. Distraktor dapat
dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor
tersebut sekurang- kurangnya sudah dipilih oleh 5% dari seluruh peserta tes atau
34 apabila mempunyai daya tarik yang besar bagi pengikut- pengikut tes yang
kurang memahami konsep atau kurang menguasai bahan (kelompok bawah).
Untuk menentukan angka pedoman efektivitas distraktor dapat dilakukan dengan
cara mengalikan antara 5% X Jumlah siswa. Pada soal bentuk pilihan ganda ada
alternatif jawaban (opsi) yang merupakan pengecoh, jadi pengecoh disini adalah
jawaban dari soal yang bisa mengecoh jawaban yang sebenarnya. Setiap tes
pilihan ganda memiliki satu pertanyaan serta beberapa pilihan jawaban. Diantara
pilihan jawaban yang ada, hanya satu yang benar Selain jawaban yang benar
tersebut, adalah jawaban yang salah. Jawaban yang salah itulah yang dikenal
dengan distractor (pengecoh).
23
cakap memilih alternatif jawaban tersebut. Penulisan soal bentuk pilihan ganda
harus memiliki keefektifitasan distraktor. Artinya bahwa jangan sampai jawaban
menjadi sebuah hadiah untuk siswa, tetapi jawaban tersebut dapat menunjukkan
kemampuan yang sesungguhnya terkait dengan siapa yang memiliki pengetahuan,
kurang memiliki pengetahuan, atau bingung dengan materi yang disampaikan
(Chatterji dalam Aulia 2014, hlm,75). Hal demikian dapat ditunjukkan dengan
adanya korelasi yang tinggi, rendah atau negatif pada hasil analisis. Suatu
distraktor dapat dikatakan berfungsi dengan baik jika paling sedikit dipilih oleh
5% pengikut tes (Anas Sudijono dalam Aulia, 2014, hlm. 80). Hal yang paling
sulit dilakukan dalam menulis soal dalam bentuk pilihan ganda adalah
menentukan pengecohnya.
Pengecoh yang baik adalah pengecoh yang tingkat kerumitan atau tingkat
kesederhanaan, serta panjang pendeknya relatif sama dengan kunci jawaban.
Sesuai dengan aturan keempat penulisan soal pilihan ganda menurut Chatterji
dalam (2014, hlm. 84) yaitu pilihan jawaban yang salah atau pengecoh, harus
masuk akal dan tingkat kerumitan yang masuk akal. Untuk itu, pengecoh harus
menjadi pilihan yang masuk akal. Analisis efektivitas distraktor dilakukan dengan
tujuan untuk mengetahui butir soal tersebut sudah memiliki pengecoh yang
berfungsi sebagaimana mestinya, jika pengecoh berfungsi maka soal tersebut
dianggap baik. Saifuddin dalam Aulia (2014, hlm. 85) mengatakan bahwa
proporsi alternatif jawaban masing-masing butir dapat dilihat pada kolom
proportion endorsing pada hasil analisis iteman. Selain memperhatikan fungsi
daya tarik untuk dipilih oleh peserta tes, pengecoh soal juga perlu memperhatikan
daya beda (koefisien korelasi) yang ditunjukkan oleh masing-masing alternatif
jawaban. Setiap pengecoh diharapkan memiliki daya beda negatif, artinya suatu
pengecoh diharapkan lebih
sedikit dipilih oleh kelompok tinggi dibandingkan dengan kelompok bawah. Atau
daya beda pengecoh tidak lebih besar dari daya beda kunci jawaban setiap butir
soal. Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta
didik yang menjawab salah. Sebaliknya, butir soal yang yang kurang baik,
pengecohnya akan dipilih secara tidak merata. Pengecoh dianggap bila jumlah
peserta didik yang memilih pengecoh itu sama atau mendekati jumlah ideal.11
11
Effendi, anwar”analisis butir soal ujian sekolah menggunakan program iteman” jurnal
pendidikan, vol.8, 2023, hal 276-289
24
3) Ditulis kembali, karena kurang baik.
Keterangan:
IP = indeks pengecoh
1 = bilangan tetap
Cacatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci
jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian,
pengecoh tidak berfungsi.
Contoh :
50 orang peserta didik di tes dengan 10 soal untuk pilihan-ganda. Tiap soal
memilki 5 alternatif jawaban (a, b, c, d. dan e). Kunci jawaban (jawaban yang
benar) soal nomor 8 adalah c. Setelah nomor 8 diperiksa untuk peserta didik,
ternyata dari 50 orang peserta didik. 20 peserta didik menjawab benar dan 30
peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata, artinya
semua pengecoh secara merata ikut menyesatkan peserta didik. Perhatikan contoh
soal nomor 8 berikut ini:
Alternatif jawaban a b c d e
25
Kualitas pengecoh ++ ++ ** ++ ++
Gambar. 12
Keterangan:
** : kunci jawaban
++ : sangat baik
+ : baik
- : kurang baik
_ : jelek
__ : sangat jelek
Pada contoh di atas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan 107%.
Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik sebab
semua pengecoh itu berfungsi. Jika pilihan jawaban peserta didik menumpuk pada
suatu alternatif jawaban, misalnya seperti berikut:
Alternatif jawaban a b c d e
Kualitas pengecoh ++ - ** ++ -
Gambar.13
Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan
(b) tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu
diganti karena termasuk jelek, dan pengecoh (b) perlu direvisi karena kurang baik.
Adapun kualitas pengecoh berdasar indeks pengecoh adalah:
26
Jelek IP=0%-25% atau 176% - 200%
BAB III
PENUTUP
3.1 Kesimpulan
27
menjalankan fungsi ukur secara tepat atau memberikan hasil ukur yang
sesuai dengan maksud dilakukannya pengukuran tersebut.
b. Reliabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu
pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya
apabila dalam beberapa kali pelaksanaan pengukuran terhadap
kelompok subyek yang sama. diperoleh hasil pengukuran yang relatif
sama, selama aspek yang diukur dalam diri subyek memang belum
berubah. Nur (1987: 47) menyatakan bahwa reliabilitas ukuran
menyangkut seberapa jauh skor deviasi individu. atau skor-z, relatif
konsisten apabila dilakukan pengulangan yang ekivalen.
pengadministrasian dengan tes yang sama atau tes yang ekivalen
c. Daya Beda
Daya pembeda dalam suatu tes bertujuan untuk mengetahui perbedaan
peserta didik kemampuan peserta didik. Semakin tinggi indeks yang
dimiliki oleh butir soal, maka semakin baik butir soal tersebut karena
memiliki daya untuk membedakan kemampuan peserta didik yang
pandai dan kurang pandai. Sebaliknya jika semakin rendah indeks
yang dimiliki oleh butir soal, maka semakin rendah soal tersebut
membedakan kemampuan peserta didik yang pandai dan kurang
pandai (Amelia, 2017).
d. Tingkat Sukar
Analisis tingkat kesukaran dimaksudkan untuk mengetahui apakah
soal tersebut tergolong mudah atau sukar. Tingkat kesukaran adalah
bilangan yang menunjukan sukar atau mudahnya sesuatu soal.
(Arikunto, 1999: 207). Analisis tingkat kesukaran artinya mengkaji
soal-soal tes dari segi kesulitannya, sehingga dapat diperoleh soal-soal
yang layak untuk diberikan keperserta didik, untuk mengetahui mana
soal yang mudah, mana soal yang sedang dan mana soal yang sulit.
Tingkat kesukaran soal dapat diliat dari seberapa banyak siswa tersebut
dapat menjawabnya, bukan dilihat dari sudut guru yang membuat soal.
e. Tingkat Pengecoh
Pengecoh (distraktor) merupakan suatu pola yang dapat
menggambarkan bagaimana testee menentukan pilihan penjelasan
terhadap kemungkinan- kemungkinan jawaban yang telah dipasang
pada setiap butir item. Distraktor dapat dinyatakan telah dapat
menjalankan fungsinya dengan baik apabila distraktor tersebut
sekurang- kurangnya sudah dipilih oleh 5% dari seluruh peserta tes
atau 34 apabila mempunyai daya tarik yang besar bagi pengikut-
28
pengikut tes yang kurang memahami konsep atau kurang menguasai
bahan (kelompok bawah).
3.2 Saran
DAFTAR PUSTAKA
Dewi, sukma “ analisis tingkat kesukaran dan daya pembeda soal olimpiade
matematika (OMI) tingkat SMP tahun 2018” jurnal pendidikan
matematika, vol.3, 2019, hal 15-26
Fatimah, laela” analisis kesukaran soal, daya pembeda dan fungsi instraktor”
jurnal komunikasi dan pendidikan islam, vol 8, 2019, hal. 37-64
29
Fitriani, nani”analisis tingkat kesukaran, daya pembeda, dan efektivitas pengecoh
soal pelatihan kewaspadaan pengawatdaruratan maternal dan neonatal”
jurnal kajian penelitian, vol.12, 2021, 199-205
Nisa, chairun”analisis karakteristik butir soal tes ujian kenaikan kelas pelejaran
matematika dengan program iteman” jurnal pendidikan dan social
budaya, vol.2, 2022, hal 862-870
Utomo, fuad”uji validitas dan reliabilitas instrument non tes kreativitas siswa klas
VI SDN Tegal Alur 16 Petang” jurnal hurriah, Vol.3, 2022, hal 20-28
30