DISUSUN OLEH:
22176006
DOSEN PEMBIMBING:
SEKOLAH PASCASARJANA
2023
DAFTAR ISI
DAFTAR ISI...................................................................................................................ii
DAFTAR TABEL...........................................................................................................iii
BAB I PENDAHULUAN
1.1 Latar Belakang...........................................................................................1
1.2 Rumusan Masalah......................................................................................1
BAB II PEMBAHASAN
2.1 Validitas Soal.............................................................................................2
2.2 Reliabilitas Soal.........................................................................................5
2.3 Daya Pembeda Soal...................................................................................6
2.4 Indeks Kesukaran Soal...............................................................................7
2.5 Distraktor Soal..........................................................................................................8
BAB III PENUTUP
3.1 Kesimpulan..................................................................................................10
3.2 Saran............................................................................................................10
DAFTAR PUSTAKA.....................................................................................................11
ii
DAFTAR TABEL
iii
BAB I
PENDAHULUAN
1
BAB II
PEMBAHASAN
2
3
Dari rumus di atas, rxy merupakan koefisien korelasi antara variabel X dan
variabel Y, N merupakan jumlah siswa uji coba, X adalah skor-skor tip butir
soal. Untuk menginterpretasikan tingkat validitas, Arikuto (1991)
mengategorikan koefisien korelasi pada kriteria sebagai berikut:
Tabel 1. Kriteria Validitas Instrumen Tes
Nila r Interpretasi
0,81 – 1,00 Sangat Tinggi
0,61 – 0,80 Tinggi
0,41 – 0,60 Cukup
0,21 – 0,40 Rendah
0,00 – 0,20 Sangat rendah
5
Setelah harga koefisien validitas tiap butir soal diperoleh, perlu dilakukan
uji signifikansi untuk mengukur keberartian koefisien korelasi berdasarkan
distribusi kurva normal dengan menggunakan statistik uji-t dengan persamaan:
t =r xy
√ N −2
1−¿ ¿
¿
Nilai t merupakan nili hitung koefisien validitas, rxy adalah nilai korelasi
tiap butir soal, dan N adalah jumah siswa uji coba. Kemudian hasil di atas
dibandingkan dengan nilai t dari tabel pada taraf kepercayaan 95% dan derajat
kebebasan (dk) = N-2. Jika thitung > ttabel maka koefisien validitas butir soal pada
taraf signifikansi yang dipakai.
2.2 Reliabilitas Soal
Reliabilitas berasal dari kata reliability yang bermakna sejauh mana hasil
suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat
dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap
kelompok subjek yang sama, diperoleh hasil pengukuran yang relatif sama,
selama aspek yang diukur dalam diri subyek memang belum berubah
(Sudaryono,2017). Menurut Arikunto (2013) pengertian reliabiltas berhubungan
dengan masalah ketepatan hasil tes. Didukung oleh Arifin (2012) yang
berpendapat bahwa reliabilitas merupakan tingkat atau derajat konsistensi dari
suatu alat pengukur atau instrumen.
Arifin (2012) mengemukakan bahwa reliabilitas dibedakan atas dua
macam yaitu: reliabilitas konsistensi tanggapan dan reliabilitas gangguan item.
Cronbach menyatakan ada tiga mekanisme untuk memeriksa reliabilitas:
1. Teknik test retest adalah pengetesan dua kali dengan menggunakan suatu tes
yang sama pada waktu yang berbeda.
2. Teknik belah dua, pada teknik pengukuran dilakukan dengan dua kelompok
item yang setara pada saat yang sama.
3. Bentuk ekivalen, di sini pengukuran dilakukan dengan menggunakan dua tes
yang dibuat setara kemudian diberikan kepada peserta didik dalam waktu
yangn bersamaan. Skor kedua kelompok item dikorelasikan untuk
mendapatkan reliabilitas.
6
100 orang. Untuk kelompok kecil, seluruh kelompok peserta didik dibagi
menjadi dua sama besar, 50% kelompok atas (JA) dan kelompok bawah (JB).
Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah lalu
dibagi dua. Untuk kelompok besar, mengingat biaya dan waktu untuk
menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua
kutubnya saja, yaitu 27% skor teratas sebagai JA dan 27% skor terbawah
sebagai JB (Arikunto,2013).
Untuk menghitung daya pembeda butir soal menurut Arikunto (1999)
dapat menggunakan persamaan:
B A BB
DP= −
J A JB
dengan DP merupakan daya pembeda soal, BA adalah banyaknya peserta tes kelompok
atas yang menjawab soal dengan benar, BB adalah banyaknya peserta tes kelompok
bawah yang menjawab soal dengan benar, JA adalah banyaknya peserta tes kelompok
atas, dan JB adalah banyaknya peserta tes kelompok bawah.
Setelah nilai daya pembeda diperoleh maka nilai tersebut diinterpretasikan
pada kriteria indeks pembeda soal sebagai berikut:
Tabel 3. Kriteria Indeks Daya Pembeda Soal
DP Kualifikasi
Jelek
0,00 – 0,19
Cukup
0,20 – 0,39
Baik
0,40 – 0,69
Baik sekali
0,70 – 1,00
Tidak baik, harus
Negatif
dibuang.
apabila butir-butir soal tersebut tidak terlalu sukar dan tidak terlalu mudah.
Dengan kata lain, derajat kesukarannya sedang atau cukup (Sudijono,2009).
Menurut Sudaryono indeks kesukaran butir soal memiliki dua kegunaan,
yaitu kegunaan bagi pendidikan dan kegunaan bagi pengujian dan pengajaran.
Kegunaan bagi pendidikan adalah:
a. Sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi
masukan kepada peserta didik tentang hasil belajar mereka.
b. Memperoleh informasi tentang penekanan kurikulum atau mencurigai butir
soal yang bias.
Adapun kegunaan bagi pengujian dan pengajaran adalah:
a. Pengenalan konsep yang diperlukan untuk diajarkan ulang.
b. Tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah.
c. Memberi masukan kepada peserta didik.
d. Tanda-tanda kemungkinan adanya butir soal yang bias.
e. Merakit tes yang memiliki ketepatan daya soal.
memilihnya, sebab mereka menyangka bahwa distractor yang mereka pilih itu
merupakan jawaban betul. Jadi peserta didik terkecoh, menganggap bahwa
distractor yang terpasang pada item itu sebagai kunci jawaban item, padahal
bukan (Sudijono, 2009).
Distractor baru dapat dikatakan telah menjalankan fungsinya dengan baik,
apabila distraktor tersebut memiliki daya tarik sedemikian rupa, sehingga peserta
didik merasa bimbang dan ragu-ragu sehingga akhirnya mereka terkecoh untuk
memilih distraktor sebagai jawaban betul, sebab mereka mengira jawaban
tersebut sebagai kunci jawaban yang betul, padahal bukan (Sudijono,2009).
Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta
didik yang menjawab salah. Sebaliknya butir soal yang kurang baik,
pengecohnya akan dipilih secara tidak merata. Jika semua peserta didik
menjawab benar pada butir soal tertentu (sesuai kunci jawaban) maka indeks
pengecohnya (IP) = 0 yang berarti soal tersebut jelek, dengan demikian
pengecoh tidak berfungsi (Arifin, 2012).
Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu
menganalisis pola penyebaran jawaban item. Adapun yang dimaksud dengan
pola jawaban item adalah suatu pola yang dapat menggambarkan bagaimana
peserta didik menentukan pilihan jawaban terhadap kemungkinan-kemungkinan
jawaban yang telah dipasangkan pada setiap butir item (Sudijono, 2009).
Sebuah pengecoh dikatakan berfungsi baik jika dipilih minimal oleh 5%
pesera didik. Contoh:
Pilihan Jawaban A B C* D E O Jumlah
Kelompok Atas 5 7 15 3 3 0 33
Kelompok Bawah 8 8 6 5 7 3 37
Jumlah 13 15 21 8 10 3 70
O = Omitted (tidak menjawab), C* = kunci jawaban
Pengecoh A : 13/7 x 100% > 5%, berfungsi
B : 15/70 x 100% > 5%, berfungsi
D : 8/70 x 100% > 5%, berfungsi
E : 10/70 x 100% > 5%, berfungsi
BAB III
PENUTUP
3.1 Kesimpulan
Berdasarkan penjabaran materi yang telah dilakukan, maka dapat ditarik
kesimpulan sebagai berikut:
1. Validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu
tes. Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang
hendak diukur. Tes memiliki validitas yang tinggi jika hasilnya sesuai
dengan kriteria, dalam artian memiliki kesejajaran antara tes dan kriteria.
2. Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subjek yang sama, diperoleh
hasil pengukuran yang relatif sama, selama aspek yang diukur dalam diri
subyek memang belum berubah.
3. Daya pembeda soal adalah indeks yang menunjukkan tingkat kemampuan
butir soal membedakan kelompok yang berprestasi tinggi (kelompok atas)
dari kelompok berprestasi rendah (kelompok bawah) diantara para peserta
tes.
4. Indeks kesukaran atau tingkat kesukaran soal dimaksudkan untuk
mengetahui apakah soal tersebut tergolong mudah atau sukar. Tingkat
kesukarana dalah bilangan yang menunjukkan sukar atau mudahnya suatu
soal.
5. Analisis butir soal juga dilakukan dengan memperhatikan pengecoh.
Pengecoh (distractor) juga dikenal dengan istilah penyesat atau penggoda
adalah pilihan jawaban yang bukan merupakan kunci jawaban.
3.2 Saran
Dalam penyusunan makalah ini, masih jauh dari kata sempurna. Penulis
mengharapkan kritik dan saran yang membangun untuk materi yang telah
dipaparkan.
10
DAFTAR PUSTAKA
11