Makalah Metopen - Kelompok 2

MAKALAH
ANALISIS POKOK UJI INSTRUMEN PENELITIAN
Diajukan Sebagai Tugas kelompok 2
Mata Kuliah Metodologi Penelitian Pendidikan
Dosen Pengampu :
Nukhbatul Bidayati Haka, M.Pd
Disusun Oleh:
Fadila ismar solehah 2111060035
Faridha Noer Barkah 2111060036
Gilang Putri 2111060119
Lulu’ Nur Rohmah 2111060194
Obi Permana AS 2111060135
Selviana Yuniarti 2111060186
Vera Noperti 2111060157
PROGRAM STUDI PENDIDIKAN BIOLOGI
FAKULTAS TARBIYAH DAN KEGURUAN
UNIVERSITAS ISLAM NEGERI RADEN INTAN LAMPUNG
TAHUN AJARAN 2023/2024

KATA PENGANTAR
Assalamu’alaikum warahmatullahi wabarakatuh.
Puji dan syukur kami panjatkan kepada Allah SWT, karena atas Rahmat
dan Hidayah-Nya, tugas makalah mata kuliah Metodologi penelitian pendidikan
dapat terselesaikan dengan baik yang berjudul “Analisis pokok Uji Intrumen
Penelitian”.Tujuan penyusunan makalah ini adalah untuk pembelajaran dan
memenuhi syarat mendapatkan nilai pada mata kuliah Metodologi Penelitian
Pendidikan. Makalah ini disusun berdasarkan referensi-referensi dari berbagai
sumber.
Kami menyadari bahwa dalam penyusunan makalah ini tidak lepas dari
dukungan dan bantuan berbagai pihak. Tidak lupa kami sampaikan terimakasih
kepada dosen mata kuliah metodologi penelitian pendidikan yaitu Ibu Nukhbatul
Bidayati Haka, M.Pd. yang telah membantu dan membimbing kami dalam
mengerjakan makalah ini. Kami juga mengucapkan terimakasih kepada teman-
teman mahasiswa yang sudah memberi bantuan baik langsung maupun tidak
langsung dalam pembuatan makalah ini.
Kami menyadari bahwa dalam menyusun makalah ini masih banyak

kekurangan, untuk itu kami sangat mengharapkan kritik dan saran yang bersifat
membangun guna memperbaiki makalah ini. Kami berharap semoga makalah ini
bisa bermanfaat bagi kami penulis dan bagi pembaca.
Bandar lampung, November 2023
Penulis
ii
DAFTAR ISI
DAFTAR ISI........................................................................................................ii
KATA PENGANTAR.........................................................................................iii
BAB 1 PENDAHULUAN
1.1 Latar Belakang......................................................................................1
1.2 Rumusan Masalah.................................................................................1
1.3 Tujuan...................................................................................................1
BAB II PEMBAHASAN
2.1 Pengertian Instrumen Penelitian............................................................2
2.2 Jenis-jenis uji instrument Penelitian......................................................2
1. Validitas ..........................................................................................2
2. Reliabilitas ....................................................................................12
3. Daya Beda......................................................................................18
4. Tingkat Sukar.................................................................................21
5. Tingkat Pengecoh ..........................................................................23
BAB III PENUTUP

3.1 Kesimpulan..........................................................................................28
3.2 Saran ...................................................................................................28
DAFTAR PUSTAKA
iii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran. Untuk

mengukur keberhasilan proses pembelajaran diperlukan evaluasi dan proses
analisis dari evaluasi. Manfaat dari analisis evaluasi untuk mengetahui kekuatan
dan kelemahan pembelajaran dalam rangka meningkatkan proses pembelajaran.
Karena itu begitu pentingnya guru mengadakan analisis butir soal dengan
pengujian instrumen penilaian yaitu validitas, reliabilitas, daya beda tingkat sukar,
tingkat pengecoh. Ada tiga sasaran pokok ketika guru melakukan analisis terhadap
hasil belajar, yaitu terhadap guru, siswa dan prosedur pembelajaran. Fungsi
analisis untuk guru terutama untuk mendiagnosis keberhasilan pembelajaran dan
sebagai bahan untuk merevisi dan mengembangkan pembelajaran dan tes.
Bagi siswa, analisis diharapkan berfungsi mengetahui keberhasilan belajar,

mendiagnosa mengoreksi kesalahan belajar, serta Memotivasi siswa belajar lebih
baik. Pada makalah ini akan dibahas mengenai analisis berupa validitas,
reliabilitas, daya beda, tingkat sukar,tingkat pengecoh untuk instrument test dan
non test dan pola contoh soal yang berguna sebagai pedoman bagi pendidikan
dalam melakukan analisis soal terutama untuk soal objektif.
1.2 Rumusan Masalah

Adapun rumusan masalah dari makalah ini yaitu sebagai berikut:
1. Apa pengertian dari instrumen penelitian?
2. Apa saja jenis-jenis uji intrumen penelitian?
1.3 Tujuan
Adapun tujuan dari makalah embriogenesis ini adalah sebagai berikut:
1. Untuk mengetahui pengertian dari intrumen penelitian
2. Untuk mengetahui apa saja jenis-jenis uji instrument penelitian
1
BAB II
PEMBAHASAN
2.1 Pengertian Intrumen Penelitian
Semua penelitian melibatkan pengumpulan data untuk menguji hipotesis

yang telat ditetapkan dalam penelitian tersebut. Umumnya peneliti menggunakan
instrumen untuk mengumpulkan data penelitian. Sappaile (2007) menyebutkan
bahwa Instrumen merupakan suatu alat yang memenuhi persyaratan akademis
sehingga dapat dipergunakan sebagai alat untuk mengukur suatu objek ukur atau
mengumpulkan data mengenai suatu variabel. Instrumen dapat berbentuk tes dan
juga dapat berbentuk non- tes, namun untuk memperoleh sampel tingkah laku dari
ranah kognitif digunakan tes.
Menurut Darmadi (2011:85) bahwa definisi instrumen adalah sebagai alat

untuk mengukur informasi atau melakukan pengukuran. Instrumen pengumpul
data menurut Suryabrata (2008:52) adalah alat yang digunakan untuk merekam-
pada umumnya secara kuantitatif-keadaan dan aktivitas atribut-atribut psikologis.
Atibut-atribut psikologis itu secara teknis biasanya digolongkan menjadi atribut
kognitif dan atribut non kognitif. Sumadi mengemukakan bahwa untuk atribut
kognitif, perangsangnya adalah pertanyaan. Sedangkan untuk atribut non-kognitif,
perangsangnya adalah pernyataan. Selanjutnya menurut Sukarnyana dkk
(2003:71) instrumen penelitian merupakan alat-alat yang digunakan untuk
memperoleh atau mengumpulkan data dalam rangka memecahkan masalah
penelitian atau mencapai tujuan penelitian. Jika, data yang diperoleh tidak akurat
(valid), maka keputusan yang diambil pun akan tidak tepat. Berdasarkan beberapa
pengertian di atas, maka dapat ditarik kesimpulan bahwa instrumen penelitian
merupakan alat yang digunakan untuk mendapatkan dan mengumpulkan data
penelitian, sebagai langkah untuk menemukan hasil atau kesimpulan dari
penelitian dengan tidak meninggalkan kriteria pembuatan instrument yang baik. 1
2.2 Jenis-Jenis Uji Intrumen Penelitian
1. Validitas
Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata validity
yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen
pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes dikatakan memiliki
validitas yang tinggi apabila alat tersebut menjalankan fungsi ukur secara tepat
1
Puspitasari, wahyu” pengujian validasi isi angket persepri mahasiswa terhadap pembelajaran
daring matakuliah matematika komputasi” jurnal FACTOR, vol.4, 2021, hal 77-90
2
atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran tersebut. Artinya hasil ukur dari pengukuran tersebut merupakan
besaran yang mencerminkan secara tepat fakta atau keadaan sesungguhnya dari
apa yang diukur. Suryabrata (2000: 41) menyatakan bahwa validitas tes pada
dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat
kecermatan ukurnya sesuatu tes. Validitas suatu tes mempermasalahkan apakah
tes tersebut benar-benar mengukur apa yang hendak diukur. Maksudnya adalah
seberapa jauh suatu tes mampu mengungkapkan dengan tepat ciri atau keadaan
yang sesungguhnya dari obyek ukur, akan tergantung dari tingkat validitas tes
yang bersangkutan. Sudjana (2004: 12) menyatakan bahwa validitas berkenaan
dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-
betul menilai apa yang seharusnya dinilai.2
Suatu tes yang valid untuk tujuan tertentu atau pengambilan keputusan
tertentu, mungkin tidak valid untuk tujuan atau pengambilan keputusan lain. Jadi
validitas suatu tes, harus selalu dikaitkan dengan tujuan atau pengambilan
keputusan tertentu. Tes masuk di SMA misalnya harus selalu dikaitkan dengan
seberapa jauh tes masuk tersebut dapat mencerminkan prestasi atau hasil belajar
para calon peserta didik baru setelah belajar nanti. Konsep Validitas tes dapat
dibedakan atas tiga macam yaitu validitas isi (content validity), validitas konstruk
(construct validity), dan validitas empiris atau validitas kriteria.
a. Validitas isi
Validitas isi suatu tes mempermasalahkan seberapa jauh suatu tes
mengukur tingkat penguasaan terhadap isi atau konten atau materi
tertentu yang seharusnya dikuasai sesuai dengan tujuan pengajaran.
Dengan kata lain tes yang mempunyai validitas isi yang baik ialah tes
yang benar-benar mengukur penguasaan materi yang seharusnya
dikuasai sesuai dengan konten pengajaran yang tercantum dalam
Garis-garis Besar Program Pengajaran (GBPP). Validitas isi
menunjukkan sejauhmana pertanyaan, tugas atau butir dalam suatu tes
atau instrumen mampu mewakili secara keseluruhan dan proporsional
perilaku sampel yang dikenai tes tersebut. Artinva tes itu valid apabila
butir-butir tes itu mencerminkan keseluruhan konten atau materi yang
diujikan atau yang seharusnya dikuasai secara proporsional. Untuk
mengetahui apakah tes itu valid atau tidak, harus dilakukan melalui
penelaahan kisi-kisi tes untuk memastikan bahwa soal-soal tes itu
sudah mewakili atau mencerminkan keseluruhan konten atau materi
yang seharusnya dikuasai secara proporsional. Oleh karena itu
2
Sanaky, musrifah”analisis factor-faktor penyebab keterlambatan pada proyek pembangunan
gedung asrama MAN 1 Tulehu Maluku Tengah” jurnal simetrik, vol.11, 2021. hal 432-439
3
validitas isi suatu tes tidak mempunyai besaran tertentu yang dihitung
secara statistika tetapi dipahami bahwa tes itu sudah valid berdasarkan
telaah kisi-kisi tes. Oleh karena itu, validitas isi sebenarriya
mendasarkan pada analisis logika, tidak merupakan suatu koefisien
validitas yang dihitung secara statistika.
b. Validitas konstruk (construct validity)

Validitas kontruk adalah validitas yang mempermasalahkan seberapa
jauh butir-butir tes mampu mengukur apa yang benar-benar hendak
diukur sesuai dengan konsep khusus atau definisi konseptual yang
telah ditetapkan. Validitas konstruk biasa digunakan untuk instrumen
yang dimaksudkan mengukur variabel konsep, baik yang sifatnya
performansi tipikal seperti instrumen untuk mengukur sikap. minat
konsep diri, lokus kontrol. gaya kepemimpinan, motivasi berprestasi,
dan lain-lain, maupun yang sifatnya performansi maksimum seperti
instrumen untuk mengukur bakat (tes bakat), inteligansi (kecerdasan
intelektual), kecerdasan, emosional dan lain-lain.
Untuk menentukan validitas konstruk dilakukan proses penelaahna

teoretik dari suatu konsep dari variabel yang hendak diukur. mulai dari
perumusan konstruk, penentuan dimensi dan indikator. sampai kepada
penjabaran dan penulisan butir-butir instrumen. Perumusan, konstruk
harus dilakukan berdasarkan sintesis dari teori-teori mengenai konsep
variabel yang hendak diukur melalui proses analisis dan komparasi
yang logik dan cermat. Menyimak proses telaah teoretik seperti telah
dikemukakan, maka proses validasi konstruk sebuah instrumen
dilakukan melalui penelaahan atau justifikasi pakar atau melalui
penilaian sekelompok panel yang terdiri dari orang-orang yang
menguasai substansi atau konten dari variabel yang hendak diukur.
c. Validitas empiris
Validitas empiris sama dengan validitas kriteria yang berarti bahwa
Validitas ditentukan berdasarkan kriteria, baik kriteria internal maupun
kriteria eksternal. Validitas empiris diperoleh melalui hasil uji coba tes
kepada responden yang setara dengan responden yang akan dievaluasi
atau diteliti. Kriteria internal adalah tes atau instrumen itu sendiri yang
menjadi kriteria, sedang kriteria eksternal adalah hasil ukur instrumen
atau tes lain di luar instrumen itu sendiri yang menjadi kriteria. Ukuran
lain yang sudah dianggap baku atau dapat dipercaya dapat pula
dijadikan sebagai kriteria eksternal. Validitas yang ditentukan
4
berdasarkan kriteria internal disebut validitas internal sedangkan
validitas yang ditentukan berdasarkan kriteria eksternal disebut
validitas eksternal.
Validitas internal (validitas butir) termasuk kelompok validitas kriteria

yang merupakan validitas yang diukur dengan besaran yang
menggunakan tes sebagai suatu kesatuan (keseluruhan butir) sebagai
kriteria untuk menentukan validitas butir dari tes itu. Dengan demikian
validitas internal mempermasalahkan validitas butir dengan
menggunakan hasil ukur tes tersebut sebagai suatu kesatuan sebagai
kriteria, sehingga biasa juga disebut validitas butir. Validitas internal
diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten
dengan hasil ukur tes secara keseluruhan. Oleh karena itu validitas
butir tercermin pada besaran koefisien korelasi antara skor butir
dengan skor total tes. Jika koefisien korelasi skor butir dengan skor
total tes positif dan signifikan maka butir tersebut valid berdasarkan
ukuran validitas internal.3
Validitas dapat diartikan begini, sebuah tes dapat dikatakan valid apabila
tes tersebut mengukur apa yang hendak diukur. Serta, pengukuran valid itu
apabila sejajar antara materi dan isi pelajaran yang bersangkutan. Suatu instrumen
yang valid mempunyai validitas tinggi. Begitu sebaliknya, instrumen yang kurang
valid berarti memiliki validitas rendah. Untuk menguji validitas instrumen dapat
dihitung dengan koefesien korelasi menggunakan Product Moment dengan
mencari angka korelasi "r" product moment (ty) dengan derajat kebebasan sebesar
(N-2) sebagai berikut:
Keterangan:
rxy = koefisien korelasi antara variabel x dan variabel y.
∑xy = jumlah hasil kali antara deviasi skor - skor X (yaitu x) dan deviasi skor -
skor Y (yaitu skor y).
∑x = jumlah kuadrat dari deviasi tiap skor X.
3
Yusuf, febrianawati”uji validitas dan reliabilitas instrument penelitian kuantitatif” jurnal
tarbiyah, vol.7, 2018, hal 17-23
5
∑y = jumlah kuadrat dari deviasi tiap skor Y.
Nilai rxy akan dibandingkan dengan koefisien korelasi table nilai "r" product
moment pada taraf signifikan 5%. Apabila nilai rxy hasil koefisien korelasi lebih
besar (>) dari nilai rtabel, maka hasil yang diperoleh adalah signifikan, artinya
butir soal tes dinyatakan valid. Nilai rxy adalah nilai koefisien korelasi dari setiap
butir/ item soal sebelum dikoreksi, kemudian dicari corrected item-total
correlation coefficient dengan rumus sebagai berikut:
Nilai (y-1) akan dibandingkan dengan koefisien korelasi tabel ftabel Jika Tx (y-
1)>Tubel. Maka instrumen valid. Setelah tes di ujikan kepada siswa yang berada
diluar sampel kemudian instrumen tes diuji melalui pengujian validitas soal tes,
didapat hasil uji coba lapangan untuk validitas butir soal dapat dilihat pada Tabel
di bawah ini:
No Keterangan No butir soal
1. Valid 1,2,5,8,9,10,11,12,13,14
2. Tidak valid 3,4,6,7,15
Gambar 1.
Uji validitas butir soal (Hery, 2014)
Hasil uji coba ini dianalisis keabsahannya menggunakan program Microsoft

Office Exel 2007, soal yang digunakan untuk pretest dan posttest adalah butir soal
yang masuk kategori valid yang berjumlah 10 soal.
Dalam suatu instrumen baik tes maupun non tes dapat dikatakan baik
apabila sudah melewati setiap tahapan pengecekan sebelum instrumen tersebut
akan digunakan. Salah satu tahapannya yaitu pengujian validitas dan reliabilitas.
Fungsi melakukan validitas adalah untuk mengukur derajat ketepatan/kelayakan
instrumen yang digunakan untuk mengukur apa yang akan diukur (Zaenal Arifin,
2012) sedangkan reliabilitas berfungsi untuk sejauh mana hasil suatu pengukuran
memiliki keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan yang
dapat dipercaya (Azwar, 2011). Pengembangan instrumen non tes ini dilakukan
6
mengikuti tahapan pada metode penelitian dan pengembangan model 4D, yaitu
Tahap define, Tahap design, Tahap develop, dan Tahap disseminate.
a. Tahap Define
Instrumen non tes yang dikembangkan bertujuan untuk mengukur tingkat
siswa dalam aspek kreativitas. Adapun langkah-langkah pendefinisian
pengembangan instrument non tes yang dilakukan adalah sebagai berikut:
a) Penentuan subjek
b) Menelaah definisi konseptual dan definisi operasional aspek
kreativitas;
c) Indikator kreativitas yang digunakan adalah fluency, fleksibility,
originality, elaboration, dan sensivity;
d) Pengembangan indikator kreativitas menjadi sebuah butir
pernyataan yang dituangkan dalam kisi-kisi;
e) Penurunan indikator pernyataan kisi-kisi ke dalam bentuk angket.
b. Tahap Design
Setelah dilakukan tahap define, instrumen tes kemudian didesain berdasarkan
hasil kajian terhadap definsi konseptual dan operasional serta indikator kreativitas
yang dikembangkan dari Guilford dalam (suryosubroto, 2009:193). Sebanyak
lima buah indikator pokok yang disusun menjadi soal pertanyaan berdasarkan
aspek kreativitas. Kemudian, tiap pokok soal dibagi menjadi beberapa item soal
berdasarkan indikator kreativitas sehingga secara keseluruhan terdapat lima belas
item soal dengan sebaran soal seperti ditunjukkan Tabel dibawah:
No Indikator kreativitas Item soal Jumlah
1. Fluency 7 7
2. Fleksibility 3 3
3. Originality 2 2
4. Elaboration 1 1
5. Sensivity 2 2
15
Gambar.2
Tabel sebaran indicator kreativitas (Suryo,2009)
c. Tahap Develop
7
Pada tahap develop, dilakukan analisis butir soal secara eksplisit oleh penilai
terhadap instrumen kreativitas yang akan digunakan nantinya. Ditinjau dari segi
materi, konstruksi, dan bahasa. Instrumen kreativitas yang dibuat memerlukan
beberapa perbaikan sesuai dengan masukan yang diberikan oleh penilai.
Masukan tersebut berguna untuk peningkatan kelayakan instrumen kreativitas
sebelum di uji coba secara langsung kepada siswa.
Jawaban
No Pertanyan
SL S K TP
1. Saya suka membaca buku untuk mengisi waktu

luang.
2. Saya suka mengutarakan pendapat yang berbeda

dari yang lain
3. Saya mampu mengerjakan tugas dari hasil

pikiran saya sendiri.
4. Saya suka mengutarakan pendapat ketika guru

sedang bertanya.
5. Saya malu bertanya kepada guru terkait materi

yang sulit dipahami.
6. Saya mengalami kesulitan dalam

menyimpulkan tugas.
7. Saya lebih memilih tidak mengerjakan tugas

yang sulit untuk diselesaikan.
8. Saya tidak tertarik untuk mendalami materi baru

yang diberikan oleh guru.
9. Saya suka menggambar ketika sedang bosan.
10. saya suka mencari cara penyelesaian yang

lebihsederhana ketika diberi tugas oleh guru.
11. Saya suka menyalin hasil pekerjaan orang lain.
8
12. Saya lebih memilih mengikuti pendapat orang
lain dari pada pendapat sendiri.
13. Saya temasuk ke dalam siswa yang pasif.
14. Saya suka merangkum materi yang telah

diajarkan oleh guru.
15. Saya menyumbangkan ide-ide terkait materi

penugasan kelompok.
Gambar.3
Tabel instrument non tes kreativitas siswa (Rahayu,2022)
Keterangan:
SL : selalu
S : sering
K : kadang-kadang
TP : tidak pernah
Jawaban
No Pertanyan
SL S K TP
1. Saya suka membaca buku untuk mengisi waktu 4. 3. 2. 1.

luang.
2. Saya suka mengutarakan pendapat yang berbeda 4. 3. 2. 1.

dari yang lain
3. Saya mampu mengerjakan tugas dari hasil pikiran 4. 3. 2. 1.

saya sendiri.
4. Saya suka mengutarakan pendapat ketika guru 4. 3. 2. 1.

sedang bertanya.
5. Saya malu bertanya kepada guru terkait materi 1. 2. 3. 4.

yang sulit dipahami.
6. Saya mengalami kesulitan dalam menyimpulkan 1. 2. 3. 4.

tugas.
7. Saya lebih memilih tidak mengerjakan tugas yang 1. 2. 3. 4.
9
sulit untuk diselesaikan.
8. Saya tidak tertarik untuk mendalami materi baru 1. 2. 3. 4.

yang diberikan oleh guru.
9. Saya suka menggambar ketika sedang bosan. 4. 3. 2. 1.
10. Saya suka mencari cara penyelesaian yang 4. 3. 2. 1.

lebihsederhana ketika diberi tugas oleh guru.
11. Saya suka menyalin hasil pekerjaan orang lain. 1. 2. 3. 4.
12. Saya lebih memilih mengikuti pendapat orang 1. 2. 3. 4.

lain dari pada pendapat sendiri.
13. Saya temasuk ke dalam siswa yang pasif. 1. 2. 3. 4.
14. Saya suka merangkum materi yang telah 4. 3. 2. 1.

diajarkan oleh guru.
15. Saya menyumbangkan ide-ide terkait materi 4. 3. 2. 1.

Penugasan kelompok.
Gambar.4
Tabel rubrik penilaian instrument non tes (Rahayu,2022)
d. Tahap Disseminate
Setelah selesai diperbaiki sesuai saran dari penilai, tahap selanjutnya yang
dilakukan yaitu tahap disseminate atau menyebarkan. Pada tahap ini, instrumen
soal diuji coba untuk diteskan pada sampel siswa Sekolah Dasar di kota Tegal
Alur, Jakarta Barat dengan jumlah sampel sebanyak 50 orang. Berikut merupakan
rekapan hasil jawaban pada salah satu nomor yang telah dijawab siswa
10
Gambar.4
Hasil rekapan jawaban siswa pada butir nomor dua (Rahayu,2022)
Gambar Tabel 3 merupakan contoh instrumen angket yang diujikan

pada siswa sedangkan pada gambar tabel 2 merupakan hasil jawaban dari
siswa pada salah satu nomor. Hasil jawaban seluruh siswa pada tiap soal
kemudian diberi skor berdasarkan rubrik instrumen kreativitas yang
ditunjukkan pada Tabel 4. Hasil penskoran terhadap tiap jawaban siswa
kemudian di uji validitas dan reliabilitasnya. Uji validitas item non tes
menggunakan uji korelasi moment Pearson.4
Uji validitas tiap soal dapat menggunakan uji korelasi moment Pearson.
Pada uji validitas dengan uji korelasi moment Pearson, kriteria valid atau tidaknya
pada tiap item dalam instrumen dapat diperoleh dari hasil perbandingan antara
koefisien korelasi Pearson rhitung terhadap nilai moment Pearson tabel rtabel. Jika
nilai rhitung lebih besar daripada rtabel maka item tes tersebut dapat dikatakan
valid. Dengan demikian, jumlah sampel sebanyak 50 orang dan taraf signifikansi
5% maka diperoleh rtabel = 0,279. Hasil uji validitas instrumen dan kriterianya
dapat dilihat pada Tabel 5 dibawah:
No Soal Koefisien korelasi (r) Kriteria
1. 0,450 Valid
2. 0,241 Tidak valid
3. 0,526 Valid
4. 0,457 Valid
4
Utomo, fuad”uji validitas dan reliabilitas instrument non tes kreativitas siswa klas VI SDN Tegal
Alur 16 Petang” jurnal hurriah, Vol.3, 2022, hal 20-28
11
5. 0,321 Valid
6. 0,207 Tidak Valid
7. 0,464 Valid
8. 0,336 Valid
9. 0,298 Valid
10. 0,132 Tidak Valid
11. 0,464 Valid
12. 0,440 Valid
13. 0,383 valid
14. 0,402 Valid
15. 0,353 Valid
Gambar.5
Hasil uji validitas tiap item non tes (Rahayu, 2022)
Berdasarkan gambar tabel 5 dapat dilihat bahwa keseluruhan item instrumen non
tes kreativitas yang telah dikembangkan bersifat valid namun ada juga yang tidak
valid. Penggunaan instrumen non tes ini pada dasarnya memiliki tujuan untuk
mengukur tingkat kreativitas siswa. Berdasarkan hasil pada tahap disseminate
diperoleh informasi bahwa instrumen non tes yang telah dikembangkan layak
untuk digunakan dalam mengukur tingkat kreativitas siswa dengan catatan masih
terdapat butir soal yang belum valid artinya harus melakukan perbaikan pada butir
tersebut.
2. Reliabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu
pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila
dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang
sama. diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur
dalam diri subyek memang belum berubah. Nur (1987: 47) menyatakan bahwa
reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu. atau skor-z,
relatif konsisten apabila dilakukan pengulangan yang ekivalen.
pengadministrasian dengan tes yang sama atau tes yang ekivalen. Azwar (2003:
176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau karakter utama
12
instrumen pengukuran yang baik. Arifin (1991: 122) menyatakan bahwa suatu tes
dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada
kelompok yang sama pada waktu atau kesempatan yang berbeda. Konsep
reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan masalah
kekeliruan pengukuran.
Kekeliruan pengukuran sendiri menunjukkan sejauh mana inkonsistensi

hasil pengukuran terjadi apabila dilakukan pengukuran ulang terhadap kelompok
subyek yang sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil ukur
berkaitan erat dengan kekeliruan dalam pengambilan sampel yang yang mengacu
pada inkonsistensi hasil ukur apabila pengukuran dilakukan ulang pada kelompok
yang berbeda. Sudjana (2004: 16) menyatakan bahwa reliabilitas alat penilaian
adalah ketepatan atau keaje gan alat tersebut dalam menilai apa yang dinilainya,
Artinya, kapanpun alat penilaian tersebut digunakan akan. memberikan hasil yang
relatif sama. Djaali (2000: 81) menyatakan bahwa reliabilitas dibedakan atas dua
macam, yaitu reliabilitas konsistensi tanggapan, dan reliabilitas Dalam
pelaksanaan pengetesan dua kali ini dapat ditempupuh berbagai cara yaitu kita
melakukan pengetesan dua kali dengan tes sama terhadap obyek ukur yang sama,
atau dengan melakukan pengetesan sekali dengan menggunakan dua tes yang
butir-butirnya setara. Jika kita menggunakan pengetesan sekali maka kesamaan
atau kesetaraan tes yang digunakan merupakan syarat mutlak yang harus dipenuhi,
karena kemantapan atau konsistensi tanggapan terhadap butir-butir yang akan
diperiksa.
Pada teknik belah dua ini pengukuran dilakukan dengan dua kelompok
butir yang setara pada saat yang sama. Karena setiap kelompok butir merupakan
separuh dari seluruh tes, maka biasanya kelompok butir pertama diambil dari
butir-butir tes yang bernomor ganjil, sedangkan kelompok butir yang kedua
diambil dari butir-butir tes yang bernomor genap. Perlu diketahui bahwa
reliabilitas dengan teknik ini sangat relatif, karena reliabilitas akan tergantung
pada cara penomoran dan pengelompokan butir yang diambil. Di sini pengukuran
dilakukan dengan menggunakan dua tes yang dibuat Setara kenndian diberikan
kepada responden atau obyck ses dalam waktu yang bersamaan. Skor dari kedua
kelompok butir tes tersebut dikorelasikan untuk mendapatkan reliabilitas tes.
Reliabilitas instrumen dapat diuji dengan beberapa uji reliabilitas. Beberapa uji
reliabilitas suatu instrumen yang bisa digunakan antara lain test-retest, ekuivalen,
dan internal consistency. Internal consistency sendiri memiliki beberapa teknik uji
13
yang berbeda. Teknik uji relibilitas internal consistency terdiri dari uji split half,
KR 20, KR 21, dan Alfa Cronbach.5
a. Spearman Brown (Split Half)

Pengujian reliabilitas dengan uji internal consistency teknik split half
dari Spearman-Brown dilakukan pada instrumen yang memiliki satu
jawaban benar. Instrumen tersebut misalnya pilihan ganda,
mencocokkan, dan yang lainnya: yang hanya memiliki satu jawaban
benar. Uji reliabilitas menggunakan teknik spit half dilakukan dengan
cara mencobakan instrumen sekali saja pada subjek penelitian
kemudian hasil uji dibagi menjadi dua. Pembagian ini biasanya
didasarkan pada soal ganji-genap. Pertama, koefisien korelasi dari
kumpulan soal ganjil dengan soal genap dihitung menggunakan rumus
(2). Koefisien ini menggambarkan derajat kesamaan hasil antara kedua
belahan yang menggambarkan konsistensi internal dari sebuah
instrumen. Kemudian, koefisien reliabilitas dihitung menggunakan
rumus yang dikenal dengan istilah Spearman-Brown.
Suatu instrumen dikatakan reliabel saat nilai koefisien reliabilitas

Spearman-Brown lebih dari 0,70 (n> 0,70). Jika nilai koefisien
reliabilitas Spearman-Brown kurang dari 0,70, maka jumlah soal
ditambah dengan soal yang sesuai dengan aslinya (Fraenkel, Wallen &
Hyun, 2012).
b. KR 20 dan KR 21
Teknik pengujian reliabilitas dengan uji internal consistency yang
selanjutnya dibahas adalah teknik Kuder Richardson atau sering
disingkat KR. Instrumen yang dapat diuji reliabilitasnya menggunakan
5
Puspasari, heny “uji validitas dan reliabilitas instrument penelitian tingkat pengetahuan dan sikap
mahasiswa terhadap pemilihan suplemen kesehatan dalam menghadapi covid-19” jurnal
kesehatan, vol.12, 2022, hal 65-71
14
KR adalah instrumen dengan satu jawaban benar saja. Rumus KR yang
sering digunakan adalah KR 20 dan KR 21. Kedua teknik KR tersebut
memiliki kriteria instrumen khusus untuk bisa menggunakan
rumusnya. Saat instrumen tidak dapat dipastikan bahwa setiap item
soal memiliki tingkat kesulitan yang sama, maka instrumen tersebut
dianalisis reliabilitasnya menggunakan rumus KR 20 (Fraenkel,
Wallen, & Hyun, 2012).
Saat instrumen dapat dipastikan memiliki tingkat kesulitan yang sama

untuk setiap item soal, maka untuk menguji relibilitasnya digunakan
rumus KR 21. Berikut disajikan rumus KR 21 (Sugiyono, 2014).
15
Menurut Fraenkel, Wallen, & Hyun (2012) suatu instrumen dikatakan
reliabel apabila nilai koefisien reliabilitas KR lebih dari 0,70 (>0,70).
c. Alfa Cronbach
Pengujian reliabilitas menggunakan uji Alfa Cronbach dilakukan untuk
instrumen yang memiliki jawaban benar lebih dari 1 (Adamson &
Prion, 2013). Instrumen tersebut misalnya instrumen berbentuk esai,
angket, atau kuesioner. Rumus koefisien reliabilitas Alfa Cronbach
adalah sebagai berikut.
Rumus variasi item danvariasi total
Jika koefisien reliabilitas Alfa Cronbach telah dihitung (r), nilai

tersebut kemudian dibandingkan dengan kriteria koefisien reliabilitas
16
Alfa Cronbach untuk instrumen yang reliabel. Menurut Nunnally
(dalam Streiner, 2003) menyatakan bahwa instrumen dikatakan
reliabel jika koefisien reliabilitas Alfa Cronbach lebih dari 0,70 (r>
0,70) dan Streiner sendiri (2003) menyatakan bahwa koefisien
reliabilitas Alfa Cronbach, tidak boleh lebih dari 0,90 (<0,9). Jika
koefisien reliabilitas Alfa Cronbach kurang dari 0,70 (< 0,70). Tavakol
& Dennick (2011) menyarankan untuk merevisi atau menghilangkan
item soal yang memiliki korelasi yang rendah. Cara mudah
menentukan item soal tersebut adalah dengan bantuan program di
komputer. Jika koefisien reliabilitas Alfa Cronbach lebih dari 0,90 (>
0.90). mereka pun memiliki saran. Mereka menyarankan untuk
mengurangi jumlah soal dengan kriteria soal yang sama meskipun
dalam bentuk kalimat yang berbeda.
Reliabilitas merupakan ketetapan suatu hasil tes, suatu tes dapat dikatakan
mempunyai taraf kepercayaan tinggi jika tes tersebut dapat memberikan hasil
yang tetap. Sedangkan untuk menguji reliabilitas soal tes dengan menggunakan
Koefisien Cronbach Alpha, yaitu:
Keterangan:
r11 = Reabilitas instrumen secara keseluruhan
k = Banyaknya item/butir soal

Si² = Varians total
∑Si² = Jumlah seluruh varians masing-masing soal
Adapun kriteria reliabilitas untuk dijelaskan dalam tabel dibawah ini.
Reliabilitas R11 Kriteria
0,81-1,00 Sangat tinggi
0,71-0,90 Tinggi
0,41-0,70 Sedang
17
0,21-0,40 Rendah
0,00-0,20 Sangat rendah
Gambar.6
Tabel kriteria reabilitas (Sugiono,2013)
Selanjutnya dalam pemberian interpretasi terhadap koefisien reliabilitas tes (R1)

pada umumnya digunakan patokan sebagai berikut:
1) Apabila r₁₁ sama dengan atau lebih besar dari pada 0.70 berarti tes hasil
belajar yang sedang diuji reliabilitasnya dinyatakan telah memiliki
reliabilitas yang tinggi (reliabel)
2) Apabila r₁₁ lebih kecil dari pada 0,70 berarti tes hasil belajar yang sedang
diuji reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi
(un-reliabel)
Berdasarkan hasil perhitungan uji reliabilitas dari 15 soal yang telah diuji
cobakan, di dapat nilai reliabilitas sebesar 0,83 maka termasuk kategori sangat
tinggi. Hasil uji coba ini dianalisis keabsahannya menggunakan program
Microsoft Office Exel 2007.
Uji reliabilitas instrumen non tes dapat menggunakan uji alpha cronbach.
Suatu item instrumen dapat dikatakan r eliabel jika rhitung instrumennya lebih besar
dari rtabel. Hasil uji relibitas dengan menggunakan uji alpha cronbach dapat
dilihat pada Tabel dibawah.
Gambar.7
Tabel hasil uji coba reabilitas instrument non tes (Rahayu,2022)
Berdasarkan gambar Tabel 4 diketahui bahwa pada tabel 7 instrumen tes

keterampilan pemecahan masalah yang telah dikembangkan memiliki koefisien
reliabilitas sebesar 0,50 dengan tingkat reliabilitas sedang. dan Pada Gambar tabel
7 menunjukkan bahwa koefisien reliabilitas atau r hitung instrumen kreativitas
sebesar 0,50 jika dibandingkan dengan r tabel dengan sampel sebanyak 50 orang
18
yaitu sebesar 0.279. Maka dapat disimpulkan bahwa instrumen sudah reliabel
karena rhitung = 0,50 > rtabel = 0,279.6
3. Daya Beda
Daya pembeda dalam suatu tes bertujuan untuk mengetahui perbedaan
peserta didik kemampuan peserta didik. Semakin tinggi indeks yang dimiliki oleh
butir soal, maka semakin baik butir soal tersebut karena memiliki daya untuk
membedakan kemampuan peserta didik yang pandai dan kurang pandai.
Sebaliknya jika semakin rendah indeks yang dimiliki oleh butir soal, maka
semakin rendah soal tersebut membedakan kemampuan peserta didik yang pandai
dan kurang pandai (Amelia, 2017). Koefisien daya beda butir soal berkisar dari -
1,00 sampai +1,00. Jika suatu butir soal memiliki tanda negatif maka dapat
dinyatakan bahwa soal tersebut menyesatkan karena peserta dari kelompok pandai
menjawab salah sehingga harus dihilangkan atau dibuang. Analisis daya beda
artinya mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam
membedakan siswa yang termasuk kedalam kategori rendah dan kategori tinggi.
Daya pembeda butir adalah kemampuan suatu butir tes untuk dapat membedakan
antara testee yang berkemampuan tinggi dan berkemampuan rendah. Analisis
daya beda pada penelitian ini menggunakan rumus.7
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan

antara siswa pandai (berkemampuan tinggi) dengan siswa yang kurang pandai
(berkemampuan rendah). Bagi suatu soal yang dapat dijawab dengan benar oleh
siswa pandai maupun siswa kurang pandai, maka soal itu tidak baik karena tidak
mempunyai daya pembeda. Demikian pula jika semua siswa baik pandai maupun
kurang pandai tidak dapat menjawab dengan benar. Soal yang baik adalah soal
yang dapat diajawab benar oleh siswa yang pandai saja. dimana indeks daya
pembeda dapat diukur dengan menggunakan rumusan seperti dibawah ini:
Dimana:
D = Discriminatory power (angka indeks deskriminasi item)
6
Budiantoro, tekad “ validitas dan reliabilitas instrument keterampilan komunikasi dan
keterampilan kolaborasi pada mata kuliah bahasa Indonesia” jurnal humoniora teknologi, vol.7,
2021, hal 1-6
7
Fatimah, laela” analisis kesukaran soal, daya pembeda dan fungsi instraktor” jurnal komunikasi
dan pendidikan islam, vol 8, 2019, hal. 37-64
19
PA = Proporsi peserta didik kelompok atas yang dapat menjawab dengan betul
butir item yang bersangkutan.
PA ini diperoleh dengan rumus :
keterangan:
BA = Banyaknya peserta didik kelompok atas yang dapat menjawab dengan
betul butir item yang bersangkutan.
JA = jumlah peserta didik yang termasuk dalam kelompok atas.
PB = Proporsi peserta didik kelompok atas yang dapat menjawab dengan betul
butir item yang bersangkutan ini diperoleh dengan rumus :
Keterangan :
BB = Banyaknya peserta didik kelompok bawah yang dapat menjawab
dengan betul butir item yang bersangkutan.
JB = Jumlah peserta didik yang termasuk dalam kelompok bawah.
Daya Beda (DP) Interpretasi Daya Beda
DP < 0,20 Jelek
0,21 ≤ DP ≤ 0,40 Cukup
0,41 ≤ DP ≤ 0,70 Baik
0,71 ≤ DP ≤ 1,00 Sangat baik
Gambar.8
Tabel klasifikasi uji daya beda (Anas, 2009)
20
Seperti halnya angka tingkat kesukaran butir soal, maka tingkat diskriminasi atau
daya pembeda ini besarnya berkisar antara 0 (nol) sampai dengan 1,00. Butir-
butir soal yang baik adalah butir-butir soal yang mempunyai tingkat diskriminasi
0,4 sampai 0,7. Hasil uji daya pembeda butir soal dapat dilihat pada tabel dibawah
ini:
No Keterangan No Butir Soal
1. Jelek 0
2. Cukup 2,3
3. Baik 1,4,6,7,9,10,12,13,14
4. Sangat Baik 5,8,11,15
Gambar. 9
Tabel hasil uji daya pembeda butir soal (Anas, 2009)
Berdasarkan hasil perhitungan uji daya pembeda butir soal yang akan digunakan
untuk mengukur kemampuan berpikir kritis siswa pada soal pretest dan postest
adalah butir soal yang memiliki kriteria cukup, baik dan sangat baik. Berdasarkan
hasil perhitungan uji daya pembeda dari 15 soal yang telah diuji cobakan,
diperoleh kriteria soal dengan kategori cukup, baik dan sangat baik.Hasil uji coba
ini dianalisis keabsahannya menggunakan program Microsoft Office Exel 2007.8
4. Tingkat Sukar
Analisis tingkat kesukaran dimaksudkan untuk mengetahui apakah soal
tersebut tergolong mudah atau sukar. Tingkat kesukaran adalah bilangan yang
menunjukan sukar atau mudahnya sesuatu soal. (Arikunto, 1999: 207). Analisis
tingkat kesukaran artinya mengkaji soal-soal tes dari segi kesulitannya, sehingga
dapat diperoleh soal-soal yang layak untuk diberikan keperserta didik, untuk
mengetahui mana soal yang mudah, mana soal yang sedang dan mana soal yang
sulit. Tingkat kesukaran soal dapat diliat dari seberapa banyak siswa tersebut
dapat menjawabnya, bukan dilihat dari sudut guru yang membuat soal. Analisis
tingkat kesukaran pada penelitian ini menggunakan satu rumus.9
Tingkat kesukaran merupakan rasio atau parameter yang mendeskripsikan

seberapa sukar soal tes yang diberikan pada peserta ujian untuk memberikan
8
Dewi, sukma “ analisis tingkat kesukaran dan daya pembeda soal olimpiade matematika (OMI)
tingkat SMP tahun 2018” jurnal pendidikan matematika, vol.3, 2019, hal 15-26
9
Fitriani, nani”analisis tingkat kesukaran, daya pembeda, dan efektivitas pengecoh soal pelatihan
kewaspadaan pengawatdaruratan maternal dan neonatal” jurnal kajian penelitian, vol.12, 2021,
199-205
21
jawaban yang benar terhadap suatu butir soal (Suryani, 2017). Koefisien korelasi
point biserial pada dasarnya menunjukkan kerelasian antara skor jawaban suatu
item. Nilai koefisien yang tinggi menunjukkan bahwa peserta didik dapat
menjawab dengan benar suatu soal. Sebaliknya nilai koefisien yang rendah
menunjukkan bahwa butir soal tidak dapat dijawab dengan benar. Nilai koefisien
korelasi biserial menunjukkan yang semakin tinggi menunjukkan bahwa suatu
item memiliki indeks kesukaran baik (Zein et al., 2013). Butir-butir item tes hasil
belajar dapat dinyatakan sebagai butir-butir item yang baik, apabila butir-butir
tersebut tidak terlalu sukaratau tidak terlalu mudah dengankata lain tingkat
kesukarannya adalah sedang atau cukup. Jadi bermutu tidaknya butir-butir item
tes hasil belajar dapat diketahui dari tingkat kesukaran yang dimiliki masing-
masing butir soal. selanjutnya angka indeks menggunakan rumus yang
dikemukakan oleh Du Bois, yaitu
Keterangan:
P = proporsi (indeks kesukaran)
B = jumlah siswa yang menjawab soal tes dengan benar
JS = jumlah seluruh peserta didik peserta tes
Menurut Thorndike dan Hagen cara penafsiran terhadap tingkat kesukaran

butir tes dapat menggunakan kriteria sebagai berikut:
Indeks tingkat kesukaran Interpretasi
0,00-0,30 Sukar
0,31-0,70 Sedang
0,71-1,00 Mudah
Gambar.10
Tabel indeks tingkat kesukaran (Anas,2002)
Hasil uji coba tingkat kesukaran butir soal dapat dilihat pada Tabel dibawah ini:
No Keterangan No butir soal
22
1. Sukar 0
2. Sedang 1,2,3,4,5,6,7,8,11,15
3. Mudah 9,10,13,14
Gambar. 11
Tabel tingkat kesukaran butir soal (Anas, 2002)
Berdasarkan hasil perhitungan tingkat kesukaran butir soal yang digunakan untuk
mengukur kemampuan berpikir kritis siswa adalah 10 butir soal dari kategori
sedang yang di sesuaikan dengan kevalidan dan indikator kemampuan berpikir
kritis. Hasil uji coba ini dianalisis keabsahannya menggunakan program Microsoft
Office Exel 2007.10
5. Tingkat pengecoh
Pengecoh (distraktor) merupakan suatu pola yang dapat menggambarkan
bagaimana testee menentukan pilihan penjelasan terhadap kemungkinan-
kemungkinan jawaban yang telah dipasang pada setiap butir item. Distraktor dapat
dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor
tersebut sekurang- kurangnya sudah dipilih oleh 5% dari seluruh peserta tes atau
34 apabila mempunyai daya tarik yang besar bagi pengikut- pengikut tes yang
kurang memahami konsep atau kurang menguasai bahan (kelompok bawah).
Untuk menentukan angka pedoman efektivitas distraktor dapat dilakukan dengan
cara mengalikan antara 5% X Jumlah siswa. Pada soal bentuk pilihan ganda ada
alternatif jawaban (opsi) yang merupakan pengecoh, jadi pengecoh disini adalah
jawaban dari soal yang bisa mengecoh jawaban yang sebenarnya. Setiap tes
pilihan ganda memiliki satu pertanyaan serta beberapa pilihan jawaban. Diantara
pilihan jawaban yang ada, hanya satu yang benar Selain jawaban yang benar
tersebut, adalah jawaban yang salah. Jawaban yang salah itulah yang dikenal
dengan distractor (pengecoh).
Dari pernyataan di atas menunjukkan pengertian bahwa efektifitas

distraktor adalah seberapa baik pilihan yang salah tersebut dapat mengecoh
peserta tes yang memang tidak mengetahui kunci jawaban yang tersedia. Semakin
banyak peserta tes yang memilih distraktor tersebut, maka distraktor itu dapat
menjalankan fungsinya dengan baik.Efektivitas distraktor soal tes ialah bagaimana
kemampuan distraktor soal itu berfungsi untuk mengecoh siswa yang kurang
10
Nisa, chairun”analisis karakteristik butir soal tes ujian kenaikan kelas pelejaran matematika
dengan program iteman” jurnal pendidikan dan social budaya, vol.2, 2022, hal 862-870
23
cakap memilih alternatif jawaban tersebut. Penulisan soal bentuk pilihan ganda
harus memiliki keefektifitasan distraktor. Artinya bahwa jangan sampai jawaban
menjadi sebuah hadiah untuk siswa, tetapi jawaban tersebut dapat menunjukkan
kemampuan yang sesungguhnya terkait dengan siapa yang memiliki pengetahuan,
kurang memiliki pengetahuan, atau bingung dengan materi yang disampaikan
(Chatterji dalam Aulia 2014, hlm,75). Hal demikian dapat ditunjukkan dengan
adanya korelasi yang tinggi, rendah atau negatif pada hasil analisis. Suatu
distraktor dapat dikatakan berfungsi dengan baik jika paling sedikit dipilih oleh
5% pengikut tes (Anas Sudijono dalam Aulia, 2014, hlm. 80). Hal yang paling
sulit dilakukan dalam menulis soal dalam bentuk pilihan ganda adalah
menentukan pengecohnya.
Pengecoh yang baik adalah pengecoh yang tingkat kerumitan atau tingkat
kesederhanaan, serta panjang pendeknya relatif sama dengan kunci jawaban.
Sesuai dengan aturan keempat penulisan soal pilihan ganda menurut Chatterji
dalam (2014, hlm. 84) yaitu pilihan jawaban yang salah atau pengecoh, harus
masuk akal dan tingkat kerumitan yang masuk akal. Untuk itu, pengecoh harus
menjadi pilihan yang masuk akal. Analisis efektivitas distraktor dilakukan dengan
tujuan untuk mengetahui butir soal tersebut sudah memiliki pengecoh yang
berfungsi sebagaimana mestinya, jika pengecoh berfungsi maka soal tersebut
dianggap baik. Saifuddin dalam Aulia (2014, hlm. 85) mengatakan bahwa
proporsi alternatif jawaban masing-masing butir dapat dilihat pada kolom
proportion endorsing pada hasil analisis iteman. Selain memperhatikan fungsi
daya tarik untuk dipilih oleh peserta tes, pengecoh soal juga perlu memperhatikan
daya beda (koefisien korelasi) yang ditunjukkan oleh masing-masing alternatif
jawaban. Setiap pengecoh diharapkan memiliki daya beda negatif, artinya suatu
pengecoh diharapkan lebih
sedikit dipilih oleh kelompok tinggi dibandingkan dengan kelompok bawah. Atau
daya beda pengecoh tidak lebih besar dari daya beda kunci jawaban setiap butir
soal. Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta
didik yang menjawab salah. Sebaliknya, butir soal yang yang kurang baik,
pengecohnya akan dipilih secara tidak merata. Pengecoh dianggap bila jumlah
peserta didik yang memilih pengecoh itu sama atau mendekati jumlah ideal.11
Suatu distraktor dapat ditangani dengan 3 cara:
1) Diterima, karena sudah baik.

2) Ditolak, karena tidak baik.
11
Effendi, anwar”analisis butir soal ujian sekolah menggunakan program iteman” jurnal
pendidikan, vol.8, 2023, hal 276-289
24
3) Ditulis kembali, karena kurang baik.
Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga hanya

perlu ditulis kembali, dengan perubahan seperlunya (Arikunto, 2010).
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh
N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban (opsi)
1 = bilangan tetap
Cacatan:
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci
jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian,
pengecoh tidak berfungsi.
Contoh :
50 orang peserta didik di tes dengan 10 soal untuk pilihan-ganda. Tiap soal
memilki 5 alternatif jawaban (a, b, c, d. dan e). Kunci jawaban (jawaban yang
benar) soal nomor 8 adalah c. Setelah nomor 8 diperiksa untuk peserta didik,
ternyata dari 50 orang peserta didik. 20 peserta didik menjawab benar dan 30
peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata, artinya
semua pengecoh secara merata ikut menyesatkan peserta didik. Perhatikan contoh
soal nomor 8 berikut ini:
Alternatif jawaban a b c d e
Distribusi jawaban peserta didik 7 8 20 7 8
IP 93% 107% ** 93% 10%
25
Kualitas pengecoh ++ ++ ** ++ ++
Gambar. 12
Tabel uji daya pengecoh (Arikunto, 2010)
Keterangan:
** : kunci jawaban
++ : sangat baik
+ : baik
- : kurang baik
_ : jelek
__ : sangat jelek
Pada contoh di atas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan 107%.
Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik sebab
semua pengecoh itu berfungsi. Jika pilihan jawaban peserta didik menumpuk pada
suatu alternatif jawaban, misalnya seperti berikut:
Alternatif jawaban a b c d e
Distribusi jawaban peserta didik 20 2 20 8 0
IP 267% 27% ** 107% 0%
Kualitas pengecoh ++ - ** ++ -
Gambar.13
Tabel hasil uji tingkat pengecoh (Arikunto, 2010)
Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan
(b) tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu
diganti karena termasuk jelek, dan pengecoh (b) perlu direvisi karena kurang baik.
Adapun kualitas pengecoh berdasar indeks pengecoh adalah:
Sangat baik IP= 76% - 125%
Baik IP =51% -75% atau 126%-150%
Kurang baik IP =26% -50% atau 151% - 175%
26
Jelek IP=0%-25% atau 176% - 200%
Sangat jelek IP=Lebih dari 200%
BAB III
PENUTUP
3.1 Kesimpulan
Adapun kesimpulan dari makalah ini yaitu:
1. Instrumen adalah sebagai alat untuk mengukur informasi atau melakukan

pengukuran. Menurut Sukarnyana dkk (2003:71) instrumen penelitian
merupakan alat-alat yang digunakan untuk memperoleh atau
mengumpulkan data dalam rangka memecahkan masalah penelitian atau
mencapai tujuan penelitian. Jika, data yang diperoleh tidak akurat (valid),
maka keputusan yang diambil pun akan tidak tepat. Jadi instrumen
penelitian merupakan alat yang digunakan untuk mendapatkan dan
mengumpulkan data penelitian, sebagai langkah untuk menemukan hasil
atau kesimpulan dari penelitian dengan tidak meninggalkan kriteria
pembuatan instrument yang baik.
2. Jenis-jenis uji intrumen penelitian
a. Validitas
Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata
validity yang mempunyai arti sejauh mana ketepatan dan kecermatan
suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya.
Suatu tes dikatakan memiliki validitas yang tinggi apabila alat tersebut
27
menjalankan fungsi ukur secara tepat atau memberikan hasil ukur yang
sesuai dengan maksud dilakukannya pengukuran tersebut.
b. Reliabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu
pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya
apabila dalam beberapa kali pelaksanaan pengukuran terhadap
kelompok subyek yang sama. diperoleh hasil pengukuran yang relatif
sama, selama aspek yang diukur dalam diri subyek memang belum
berubah. Nur (1987: 47) menyatakan bahwa reliabilitas ukuran
menyangkut seberapa jauh skor deviasi individu. atau skor-z, relatif
konsisten apabila dilakukan pengulangan yang ekivalen.
pengadministrasian dengan tes yang sama atau tes yang ekivalen
c. Daya Beda
Daya pembeda dalam suatu tes bertujuan untuk mengetahui perbedaan
peserta didik kemampuan peserta didik. Semakin tinggi indeks yang
dimiliki oleh butir soal, maka semakin baik butir soal tersebut karena
memiliki daya untuk membedakan kemampuan peserta didik yang
pandai dan kurang pandai. Sebaliknya jika semakin rendah indeks
yang dimiliki oleh butir soal, maka semakin rendah soal tersebut
membedakan kemampuan peserta didik yang pandai dan kurang
pandai (Amelia, 2017).
d. Tingkat Sukar
Analisis tingkat kesukaran dimaksudkan untuk mengetahui apakah
soal tersebut tergolong mudah atau sukar. Tingkat kesukaran adalah
bilangan yang menunjukan sukar atau mudahnya sesuatu soal.
(Arikunto, 1999: 207). Analisis tingkat kesukaran artinya mengkaji
soal-soal tes dari segi kesulitannya, sehingga dapat diperoleh soal-soal
yang layak untuk diberikan keperserta didik, untuk mengetahui mana
soal yang mudah, mana soal yang sedang dan mana soal yang sulit.
Tingkat kesukaran soal dapat diliat dari seberapa banyak siswa tersebut
dapat menjawabnya, bukan dilihat dari sudut guru yang membuat soal.
e. Tingkat Pengecoh
Pengecoh (distraktor) merupakan suatu pola yang dapat
menggambarkan bagaimana testee menentukan pilihan penjelasan
terhadap kemungkinan- kemungkinan jawaban yang telah dipasang
pada setiap butir item. Distraktor dapat dinyatakan telah dapat
menjalankan fungsinya dengan baik apabila distraktor tersebut
sekurang- kurangnya sudah dipilih oleh 5% dari seluruh peserta tes
atau 34 apabila mempunyai daya tarik yang besar bagi pengikut-
28
pengikut tes yang kurang memahami konsep atau kurang menguasai
bahan (kelompok bawah).
3.2 Saran
Meskipun penulis menginginkan kesempurnaan dalam penyusunan

makalah ini, akan tetapi pada kenyataannya masih banyak kekurangan yang perlu
penulis perbaiki. Hal ini dikarenakan masih minimnya pengetahuan penulis.Oleh
karena itu, kritik dan saran yang membangun dari para pembaca sangat
diharapkan sebagai bahan eveluasi untuk ke depannya Sehingga bisa terus
menghasilkan karya tulis yang bermanfaat bagi banyak orang.
DAFTAR PUSTAKA
Puspitasari, wahyu” pengujian validasi isi angket persepri mahasiswa terhadap

pembelajaran daring matakuliah matematika komputasi” jurnal FACTOR,
vol.4, 2021, hal 77-90
Effendi, anwar”analisis butir soal ujian sekolah menggunakan program iteman”

jurnal pendidikan, vol.8, 2023, hal 276-289
Budiantoro, tekad “ validitas dan reliabilitas instrument keterampilan komunikasi

dan keterampilan kolaborasi pada mata kuliah bahasa Indonesia” jurnal
humoniora teknologi, vol.7, 2021, hal 1-6
Dewi, sukma “ analisis tingkat kesukaran dan daya pembeda soal olimpiade
matematika (OMI) tingkat SMP tahun 2018” jurnal pendidikan
matematika, vol.3, 2019, hal 15-26
Fatimah, laela” analisis kesukaran soal, daya pembeda dan fungsi instraktor”
jurnal komunikasi dan pendidikan islam, vol 8, 2019, hal. 37-64
29
Fitriani, nani”analisis tingkat kesukaran, daya pembeda, dan efektivitas pengecoh
soal pelatihan kewaspadaan pengawatdaruratan maternal dan neonatal”
jurnal kajian penelitian, vol.12, 2021, 199-205
Nisa, chairun”analisis karakteristik butir soal tes ujian kenaikan kelas pelejaran
matematika dengan program iteman” jurnal pendidikan dan social
budaya, vol.2, 2022, hal 862-870
Sanaky, musrifah”analisis factor-faktor penyebab keterlambatan pada proyek

pembangunan gedung asrama MAN 1 Tulehu Maluku Tengah” jurnal
simetrik, vol.11, 2021. hal 432-439
Utomo, fuad”uji validitas dan reliabilitas instrument non tes kreativitas siswa klas
VI SDN Tegal Alur 16 Petang” jurnal hurriah, Vol.3, 2022, hal 20-28
Yusuf, febrianawati”uji validitas dan reliabilitas instrument penelitian kuantitatif”

jurnal tarbiyah, vol.7, 2018, hal 17-23
30

Makalah Metopen - Kelompok 2

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah Metopen - Kelompok 2

Diunggah oleh

Hak Cipta:

Format Tersedia

MAKALAH

ANALISIS POKOK UJI INSTRUMEN PENELITIAN

Diajukan Sebagai Tugas kelompok 2

Mata Kuliah Metodologi Penelitian Pendidikan

Nukhbatul Bidayati Haka, M.Pd

Fadila ismar solehah 2111060035

Faridha Noer Barkah 2111060036

Gilang Putri 2111060119

Lulu’ Nur Rohmah 2111060194

Obi Permana AS 2111060135

Selviana Yuniarti 2111060186

Vera Noperti 2111060157

PROGRAM STUDI PENDIDIKAN BIOLOGI

FAKULTAS TARBIYAH DAN KEGURUAN

UNIVERSITAS ISLAM NEGERI RADEN INTAN LAMPUNG

TAHUN AJARAN 2023/2024

Assalamu’alaikum warahmatullahi wabarakatuh.

Kami menyadari bahwa dalam menyusun makalah ini masih banyak

Bandar lampung, November 2023

BAB III PENUTUP

1.1 Latar Belakang

Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran. Untuk

Bagi siswa, analisis diharapkan berfungsi mengetahui keberhasilan belajar,

1.2 Rumusan Masalah

2.1 Pengertian Intrumen Penelitian

Semua penelitian melibatkan pengumpulan data untuk menguji hipotesis

Menurut Darmadi (2011:85) bahwa definisi instrumen adalah sebagai alat

2.2 Jenis-Jenis Uji Intrumen Penelitian

b. Validitas konstruk (construct validity)

Untuk menentukan validitas konstruk dilakukan proses penelaahna

Validitas internal (validitas butir) termasuk kelompok validitas kriteria

rxy = koefisien korelasi antara variabel x dan variabel y.

No Keterangan No butir soal

2. Tidak valid 3,4,6,7,15

Uji validitas butir soal (Hery, 2014)

Hasil uji coba ini dianalisis keabsahannya menggunakan program Microsoft

No Indikator kreativitas Item soal Jumlah

1. Saya suka membaca buku untuk mengisi waktu

2. Saya suka mengutarakan pendapat yang berbeda

3. Saya mampu mengerjakan tugas dari hasil

4. Saya suka mengutarakan pendapat ketika guru

5. Saya malu bertanya kepada guru terkait materi

6. Saya mengalami kesulitan dalam

7. Saya lebih memilih tidak mengerjakan tugas

8. Saya tidak tertarik untuk mendalami materi baru

9. Saya suka menggambar ketika sedang bosan.

10. saya suka mencari cara penyelesaian yang

11. Saya suka menyalin hasil pekerjaan orang lain.

13. Saya temasuk ke dalam siswa yang pasif.

14. Saya suka merangkum materi yang telah

15. Saya menyumbangkan ide-ide terkait materi

1. Saya suka membaca buku untuk mengisi waktu 4. 3. 2. 1.

2. Saya suka mengutarakan pendapat yang berbeda 4. 3. 2. 1.

3. Saya mampu mengerjakan tugas dari hasil pikiran 4. 3. 2. 1.

4. Saya suka mengutarakan pendapat ketika guru 4. 3. 2. 1.

5. Saya malu bertanya kepada guru terkait materi 1. 2. 3. 4.

6. Saya mengalami kesulitan dalam menyimpulkan 1. 2. 3. 4.

7. Saya lebih memilih tidak mengerjakan tugas yang 1. 2. 3. 4.

8. Saya tidak tertarik untuk mendalami materi baru 1. 2. 3. 4.

9. Saya suka menggambar ketika sedang bosan. 4. 3. 2. 1.

10. Saya suka mencari cara penyelesaian yang 4. 3. 2. 1.

11. Saya suka menyalin hasil pekerjaan orang lain. 1. 2. 3. 4.

12. Saya lebih memilih mengikuti pendapat orang 1. 2. 3. 4.