Makalah Kelompok 3 - 3D PGSD - Evaluasi Pembelajaran DI SD

MAKALAH
KUALITAS SOAL TES (VALIDITAS, RELIABILITAS, DAYA PEMBEDA,

PENGECOH DAN TINGKAT KESUKARAN) PENGOLAHAN SKOR TES,
PENILAIAN ACUAN NORMATIF (PAN) DAN PENILAIAN ACUAN PATOKAN
(PAP)
Diajukan untuk memenuhi salah satu tugas Mata Kuliah Evaluasi Pembelajaran di SD
(GD421)
Dosen Pengampu:
Dr. Ghullam Hamdu, M.Pd. (2564)
Disusun Oleh:
Tesa Salsabila Santana (2001145)

Syanie Noeraisyiah (2001364)
Fazril Rizky Septiana (2006071)
Lisna Maulidia Sari (2008797)
PROGRAM STUDI S1 PENDIDIKAN GURU SEKOLAH DASAR

UNIVERSITAS PENDIDIKAN INDONESIA
KAMPUS TASIKMALAYA
2022
KATA PENGANTAR
Puji syukur kami panjatkan kepada Allah Swt. yang telah memberikan kesehatan dan
kelancaran kepada kita sehingga bisa menyelesaikan penulisan makalah Mata Kuliah Evaluasi
Pembelajaran di SD dengan judul “Kualitas Soal Tes (Validitas, Reliabilitas, Daya Pembeda,
Pengecoh, dan Tingkat Kesukaran) Pengolahan Skor Tes, Penilaian Acuan Normatif (PAN)
dan Penilaian Acuan Patokan (PAP)”.
Kami mengucapkan terima kasih kepada Bapak Dr. Ghullam Hamdu, M.Pd. selaku dosen
pengampu Mata Kuliah Evaluasi Pembelajaran di SD yang telah membimbing kami dalam
menyelesaikan makalah ini, tak lupa kami ucapkan terima kasih kepada semua pihak yang telah
memberikan kontribusi atas penyusunan makalah ini.
Penulisan makalah ini telah diupayakan semaksimal mungkin, namun disadari bahwa masih
terdapat berbagai kekurangan yang disebabkan oleh keterbatasan waktu dan ilmu pengetahuan
yang dimiliki. Oleh karena itu, diharapkan kritik dan saran yang bersifat membangun guna
menyempurnakan makalah ini. Semoga makalah ini dapat memberi manfaat bagi semua pihak.
Tasikmalaya, 6 September 2022
Penulis
i
DAFTAR ISI
KATA PENGANTAR.......................................................................................................................... i
DAFTAR ISI ....................................................................................................................................... ii
BAB 1 ................................................................................................................................................... 1
PENDAHULUAN ............................................................................................................................... 1
A. Latar Belakang ........................................................................................................................ 1
B. Rumusan Masalah .................................................................................................................. 1
C. Tujuan...................................................................................................................................... 2
BAB 2 ................................................................................................................................................... 3
PEMBAHASAN .................................................................................................................................. 3
A. Pengertian Analisis Kualitas Butir Soal ................................................................................ 3
B. Tujuan dan Manfaat Analisis Kualitas Butir Soal ............................................................... 3
C. Karakteristik Butir Soal ......................................................................................................... 4
1. Validitas ............................................................................................................................... 4
2. Reliabilitas ........................................................................................................................... 7
3. Tingkat Kesukaran ............................................................................................................. 9
4. Daya Pembeda ................................................................................................................... 10
D. Pengolahan Skor Tes ............................................................................................................ 12
1. Penilaian Acuan Norma (PAN) ........................................................................................ 12
2. Penilaian Acuan Patokan (PAP) ...................................................................................... 13
E. Persamaan dan Perbedaan PAN dan PAP .......................................................................... 16
BAB 3 ................................................................................................................................................. 18
PENUTUP ......................................................................................................................................... 18
DAFTAR PUSTAKA ........................................................................................................................ 20
ii
BAB 1
PENDAHULUAN
A. Latar Belakang
Salah satu alat yang digunakan sebagai sarana untuk penilaian hasil belajar yaitu tes.
Menurut (sudijono, 2012) tes adalah cara dalam mengukur dan menilai di bidang
pendidikan dalam bentuk pemberian tugas atau serangkaian tugas yang harus dikerjakan
oleh siswa, sehingga dapat diketahui nilai prestasi siswa. Nilai tersebut kemudian
dibandingkan dengan nilai-nilai yang dicapai oleh testee lainnya, atau dibandingkan
dengan nilai standar tertentu. Oleh karena itu, untuk mengetahui kualitas butir soal yang
digunakan untuk tes perlu dilakukan analisis butir soal.
Analisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk
meningkatkan kualitas soal yang telah ditulis. Menurut Aiken (1994) dalam Depdiknas
(2008), tujuan analisis butir soal yaitu meningkatkan kualitas butir tes dan mengetahui
informasi diagnostik siswa. Soal yang berkualitas yaitu soal yang dapat memberikan
informasi setepat tepatnya, sehingga dapat diketahui siswa yang telah menguasai materi
dan yang belum. Suatu tes evaluasi yang baik memiliki ciri dan sifat yang merupakan
persyaratan-persyaratan yang harus dipenuhi, yaitu tes tersebut harus valid atau memiliki
tingkat validitas yang absah/baik. Sebuah tes evaluasi dikatakan valid apabila tes tersebut
secara tepat dan benar dapat mengukur apa yang hendak diukur. Dalam evaluasi pendidikan
baik tes maupun nontes, keduanya merupakan instrumen atau alat bantu pengumpulan dan
pengolahan data tentang variabel-variabel yang diteliti. Ciri-ciri/karakteristik instrument
yang baik sebagai alat evaluasi adalah memenuhi persyaratan validitas dan reliabilitas.
Inilah alasan mengapa alat evaluasi yang baik dapat dilihat dari beberapa segi antara lain:
(1) validitas, (2) reliabilitas, (3) daya pembeda, (4) pengecoh, dan (5) tingkat kesukaran.
B. Rumusan Masalah
Berdasarkan latar belakang tersebut, maka dirumuskan beberapa permasalahan yaitu:
1
1. Apa yang dimaksud dengan analisis kualitas butir soal?
2. Apa tujuan dan manfaat analisis kualitas butir soal?
3. Bagaimana karakteristik butir soal validitas?
4. Bagaimana karakteristik butir soal reliabilitas?
5. Bagaimana karakteristik butir soal tingkat kesukaran?
6. Bagaimana karakteristik butir soal daya pembeda?
7. Apa yang dimaksud dengan Penilaian Acuan Normatif (PAN)?
8. Apa yang dimaksud dengan Penilaian Acuan Patokan (PAP)?
9. Apa persamaan dan perbedaan dari Penilaian Acuan Normatif (PAN) dan Penilaian
Acuan Patokan (PAP)?
C. Tujuan
Berdasarkan rumusan masalah tersebut, maka diperoleh tujuan penulisan makalah sebagai
berikut:
1. Untuk mengetahui pengertian analisis kualitas butir soal?
2. Untuk mengetahui tujuan dan manfaat analisis kualitas butir soal?
3. Untuk mengetahui karakteristik butir soal validitas?
4. Untuk mengetahui karakteristik butir soal reliabilitas?
5. Untuk mengetahui karakteristik butir soal tingkat kesukaran?
6. Untuk mengetahui karakteristik butir soal daya pembeda?
7. Untuk mengetahui Penilaian Acuan Normatif (PAN)
8. Untuk mengetahui Penilaian Acuan Patokan (PAP)
9. Untuk mengetahui persamaan dan perbedaan dari Penilaian Acuan Normatif (PAN) dan
Penilaian Acuan Patokan (PAP)?
2
BAB 2
PEMBAHASAN
A. Pengertian Analisis Kualitas Butir Soal
Suharsimi Arikunto menyatakan bahwa analisis kualitas tes merupakan kegiatan untuk
mengkaji soal pada setiap item atau butirnya guna mengetahui kualitas dari setiap butir soal
tersebut. Analisis kualitas butir soal adalah suatu prosedur yang sistematis, yang akan
memberikan informasiinformasi yang sangat khusus terhadap butir tes yang kita susun.
Sumarna Surapranata mengemukakan bahwa analisis kualitas soal dilakukan untuk
mengetahui berfungsi tidaknya sebuah soal. Dari pengertian tersebut dapat disimpulkan
bahwa analisis kualitas butir soal merupakan kegiatan menganalisis tiap-tiap butir soal
secara mendetail menggunakan metode pengujian tertentu. Sedangkan menurut Daryanto,
analisis kualitas butir soal adalah kegiatan yang dilakukan untuk mengidentifikasi soal-soal
baik, kurang baik dan soal jelek dan memperoleh petunjuk untuk melakukan
perbaikan.Menurut Nitko, kegiatan menganalisis kualitas butir soal merupakan kegiatan
yang harus dilakukan pendidik untuk meningkatkan mutu soal yang telah ditulis. Kegiatan
ini merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban
peserta didik untuk membuat keputusan tentang setiap penilaian.
Berdasarkan definisi para ahli di atas, dapat disimpulkan bahwa analisis kualitas butir soal
merupakan suatu kegiatan yang bertujuan untuk mengkaji dan mengidentifikasi setiap butir
soal guna mengetahui kualitas setiap butir soal tersebut. Hasil dari proses mengkaji dan
mengidentifikasi soal dapat digunakan untuk melakukan perbaikan dan penyempurnaan
pada setiap butir soal.
B. Tujuan dan Manfaat Analisis Kualitas Butir Soal
Tujuan utama analisis kualitas butir soal dalam sebuah tes yang dibuat pendidik adalah
untuk mengidentifikasi kekurangan-kekurangan dalam tes atau pembelajaran. Berdasarkan
tujuan ini maka kegiatan analisis kualitas butir soal memiliki banyak manfaat, diantaranya:
a. Menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan.
3
b. Memberi masukan kepada peserta didik tentang kemampuan dan sebagai dasar untuk
bahan diskusi di kelas.
c. Memberi masukan kepada pendidik tentang kesulitan kepada peserta didik.
d. Memberi masukan pada aspek tertentu untuk pengembangan kurikulum.
e. Merevisi materi yang dinilai atau diukur.
f. Meningkatkan keterampilan penulisan soal.
Kusaeri dan Suprananto juga mengemukakan beberapa manfaat yang diperoleh pendidik
dalam melakukan kegiatan analisis kualitas butir soal. Manfaat tersebut antara lain:
a. Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik
b. Meningkatkan butir soal melalui tiga komponen analisis yaitu tingkat kesukaran, daya
pembeda dan pengecoh soal
c. Merevisi soal yang tidak relevan dengan materi yang diajarkan, ditandai dengan
banyaknya anak yang tidak dapat menjawab butir soal tertentu.
Berdasarkan uraian di atas, menunjukkan bahwa kegiatan menganalisis kualitas butir soal
sangat perlu dilakukan oleh pendidik. Kegiatan ini dapat memberikan informasi kepada
pendidik mengenai kekurangan-kekurangan yang terdapat pada butir soal sehingga
pendidik dapat memperbaiki dan meningkatkan kualitas butir soal yang akan diujikan.
C. Karakteristik Butir Soal
Dalam menilai suatu butir soal atau melihat kualitas butir soal apakah sudah baik atau
belum, maka ada hal-hal yang harus dipenuhi oleh butir soal agar butir soal tersebut
berkualitas. Setiap butir akan diperiksa mutunya dalam empat kategori sebagai berikut:
1. Validitas
Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang dilakukan
oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris guna
mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas
adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya.
Suatu alat ukur disebut memiliki validitas apabila alat ukur tersebut isinya layak
mengukur objek yang seharusnya diukur dan sesuai dengan kreteria tertentu, artinya
4
adanya kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran.
Ini sesuai dengan Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B
Anderson dan disadur oleh Prof. Dr. Suharsimi Arikunto (2007, 65) bahwa A test is
valid if it measures what it purpose to measure bila diartikan sebuah tes dikatakan valid
apabila tes tersebut mengukur apa yang hendak diukur. Bilamana alat ukur tidak
memiliki validitas yang dapat dipertanggung jawabkan, maka data yang masuk juga sis
dan kesimpulan yang ditarik juga menjadi salah.
Validitas Tes Hasil Belajar

Menurut Suharsimi Arikunto 2007, validitas sebuah tes dapat diketahui dari hasil
pemikiran dan dari hasil pengalaman. Hal yang pertama akan diperoleh validitas logis
dan hal yang kedua akan diperoleh validitas empiris. Dua hal inilah yang menjadi dasar
pengelompokan validitas tes.
a. Validasi logis
Mengandung arti penalaran, sehingga validitas logis untuk suatu instrumen evaluasi
menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid
berdasarkan hasil penalaran. Kondisi valid itu dipandang terpenuhi karena
instrument itu telah dirancang sebaik mungkin menurut ketentuan yang ada.
Dengan keadaan itu validitas logis dapat dicapai apabila instrument disusun
mengikuti ketentuan yang ada. Validitas logis yang dapat dicapai oleh sebuah
instrumen terdiri dari dua yaitu :
 Validitas Isi
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrument
yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Sebuah tes
dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang
sejajar dengan materi atau isi pelajaran yang di berikan. Oleh karena materi
yang diajarkan tertera dalam kurikulum maka validitas ini sering disebut juga
dengan validitas kurikuler.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara
merinci materi kurikulum atau materi buku pelajaran.
5
 Validitas Konstruk
Validitas konstruk sebuah instrumen menunjukkan suatu kondisi sebuah
instrumen yang disusun berdasarkan konstruk-konstruk aspek kejiwaan yang
seharusnya dievaluasi. Sebuah tes dikatakan memiliki validitas konstruk apabila
butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir
seperti yang disebutkan dalam tujuan instruksional khusus. Dengan kata lain
jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek
berfikir yang menjadi tujuan instruksional.
b. Validitas Empiris
Mengandung arti kata pengalaman. Sebuah instrument dikatakan memiliki validitas
empiris apabila sudah di uji dengan pengalaman. Sebagai contoh, seseorang dapat
diakui jujur oleh masyarakat lain apabila dalam pengalaman dia diakui memang
jujur. Pada Validitas empiris terdiri dari dua cara yang dilakukan untuk mengujinya
sehingga dia menjadi valid. Pengujian itu dilakukan dengan membandingkan
kondisi instrumen yang bersangkutan dengan suatu ukuran. Kriteria yang
digunakan adalah :
 Validitas Konkuren
Disebut juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan
validitas empiris. Sebuah instrument dikatakan memiliki validitas empiris jika
hasilnya sesuai dengan pengalaman. Jika ada istilah :sesuai” tentu ada dua hal
yang dipasangkan, dimana dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data
pengalaman tersebut sekarang sudah ada.
Dalam membandingkan hasil sebuah tes maka diperlukan suatu alat

pembanding. Maka hasil tes merupakan sesuatu yang dibandingkan. Contoh :
seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid
atau belum. Untuk ini perlu sebuah kreteria masa lalu yang datanya sekarang
dimiliki. Misalnya nilai ulangan harian atau nilai semester yang lalu.
 Validitas Prediksi
6
Prediksi artinya meramal. Dengan meramal selalu mengenai hal yang akan
datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas
prediksi apabila mempunyai kemampuan untuk meramalkan apa yang terjadi
pada masa yang akan datang. Misalnya tes masuk perguruan tinggi adalah
sebuah tes yang diperkirakan dapat meramalkan keberhasilan peserta tes dalam
mengikuti kuliah di masa yang akan datang. Calon yang tersaring berdasarkan
hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti
kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilan kelak. Sebaliknya
seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah
jadi diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh
setelah peserta tes mengikuti pelajaran diperguruan tinggi. Jika ternyata siapa
yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan
dengan yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud
tidak memiliki validitas.
2. Reliabilitas
Reliabilitas instrumen adalah keadaan instrumen yang menunjukkan hasil pengukuran

yang reliable (tidak berubah-ubah, konsisten). Instrumen yang reliable adalah
instrumen yang apabila digunakan untuk mengukur subyek atau objek yang sama pada
waktu yang berbeda dan pengukuran dilakukan oleh orang yang berbeda hasilnya tetap
sama.
Beberapa faktor penting yang mempengaruhi reliabilitas suatu tes yaitu:
 Kemampuan peserta tes atau subjek uji coba. Makin heterogen atau makin berbeda
kemampuan peserta tes makin tinggi reliabilitas tes.
 Semakin besar jumlah peserta tes semakin besar reliabilitas, karena semakin banyak
peserta tes maka semakin beragam kemampuannya.
 Panjang pendeknya tes. Jumlah item tes yang banyak dengan mengkaji beberapa
tujuan akan lebih reliable dibandingkan dengan jumlah item yang sedikit, karena
akan lebih representatif. Namun jumlah item tes yang terlalu banyak akan
melelahkan dan mengganggu konsentrasi sehingga hasil yang diperoleh tidak tepat
lagi.
7
 Evaluasi yang subjektif juga akan menurunkan reliabilitas.
 Hal yang berhubungan dengan penyelenggaraan tes.
 Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung akan
mempengaruhi reliabilitas soal tes.
 Reliabilitas instrumen dinyatakan dengan koefisien reliabilitas. Instrumen yang
reliable adalah instrumen yang memiliki koefisien reliabilitas minimal 0,70.
Sebaiknya koefisien reliabilitas instrumen 0,80 atau lebih. Koefisien reliabilitas
instrumen dihitung dengan menggunakan rumus tertentu.
b. Pengujian Reliabilitas Tes Bentuk Objektif

Pada tes belajar bentuk objektif, ada tiga macam metode yang dapat digunakan
untuk menentukan taraf reliabilitas.
1) Metode atau teknik ulangan (test-retest method) atau single test-double trial
method.
Instrumen penelitian test-retest dilakukan dengan cara mencobakan instrumen
dua kali pada responden. Jadi dalam hal ini instrumennya sama, respondennya
sama, dan waktunya yang berbeda. Reliabilitas diukur dari koefisien korelasi
antara percobaan pertama dengan yang berikutnya. Bila koefisien korelasi
positif dan signifikan maka instrumen tersebut reliable. Pengujian cara ini
sering juga disebutstability, yaitu seberapa stabil skor yang diperoleh individu
apabila dilakuakn pengujian dalam waktu yang berbeda. Rumus yang dapat
digunakan untuk menentukan reliabiltas test dengan metode test-retest antara
lain adalah Product Momen Correlation. Yaitu sebagai berikut:
Dimana:
X = skor test pertama
Y = skor test kedua
N = jumlah peserta tes
Cara lain yang dapat digunakan dengan teknik tes retes ini adalah tekinik
korelasi rank- order dari Spearmen menggunakn rumus:
Dimana:
ρ = koefisien korelasi
D = difference (beda antara rank skor hasil tes I dengan rank skor hasil tes II)
= RI – RII
8
N = banyaknya peserta tes.
2) Metode Belah Dua (split-half method) atau Single Test Single Trial Method
Dalam menggunakan metode ini pendidik atau evaluator hanya menggunnakan
sebuah tes dan dicobakan satu kali. Oleh sebab itu disebut juga singel-test-
singel-trial method. Pada metode ini tes yang diberikan dibagi/dibelah menjadi
dua bagian. Jumlah item yang diberikan harus genap sehingga dapat dibagi dua
dan tiap kelompok memiliki jumlah item/butir soal yang sama jumlahnya.
Untuk menentukan reliabilitas seluruh tes dapat digunakan rumus Spearman-
Brown sebagai berikut: Rumus Spearman Brown:
Dimana: korelasi antara skor-skor setiap belahan tes. koefisien reliabilitas tes.
Cara lain yang juga dapat digunakan pada metode singel-test-singel-trial adalah
formula Rulon, Flanagan, Kuder-Richardson, Hoyt.
3) Metode Bentuk Paralel atau Metode Double Test Double Trial

Pada metode ini dipergunakan dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran, dan susunan, tetapi butir-butir soal berbeda. Pengujian
reliabilitas dengan cara ini cukup dilakukan sekali, tetapi instrumennya dua,
pada responden yang sama, waktu yang sama, instrumen berbeda. Reliabiltas
instrumen dihitung dengan cara mengkorelasikan antara data instrumen yang
satu dengan data instrumen yang dijadikan equivalen. Bila koefisien korelasi
positif dan signifikan maka instrumen tersebut reliable.
Kelemahan dari metode ini adalah kesukaran dalam penyusunan item yang
parallel dengan item pada tes pertama, selain itu juga membutuhkan biaya yang
lebih mahal dan memakan waktu yang lebih lama. Rumus yang dapat digunakan
untuk menentukan reliabilitas dengan metode parallel ini adalah Product
Moment Correlation dan Rank Order Correlation.
3. Tingkat Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha pemecahannya.
9
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan
tidak mempunyai semangat untuk mencoba lagi karena diluar jangkauannya.
Seorang akan menjadi hafal akan kebiasaan gurunya dalam pembuatan soal. Dengan
kebiasaaan ini maka siswa akan belajar giat untuk menghadapi ulangan dengan guru
yang terbiasa memberikan soal sukar, sedangkan siswa akan malas belajar bila akan
ujian dengan guru yang terbiasa dengan soal ulangan yang mudah-mudah.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut dengan indeks
kesukaran. Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks
kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,00
menunjukkan kalau soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa
soalnya terlalu mudah. Indeks kesukaran butir yang baik berkisar antara 0,3-0,7 paling
baik pada 0,5.
Dalam istilah evaluasi, indeks kesukaran ini diberi simbol P singkatan ari proporsi.
Dengan demikian maka soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P
= 0,20. sebaliknya soal dengan P = 0,30 lebih sukar daripada soal dengan P = 0,80.
Rumusan mencari indeks kesukaran menurut Daryanto (2005,180) adalah :
Dimana :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes.
4. Daya Pembeda
Daya pembeda soal yaitu kemampuan sesuatu soal untuk membedakan antara siswa
yang berkemampuan tinggi dengan siswa yang berkemampuan rendah. Angka yang
menunjukkan besarnya daya pembeda disebut indeks diskriminasi ( D), dan nilainya
berkisar antara 0,00 sampai 1,00. Pada daya pembeda ini berlaku tanda negatif yang
digunakan jika sesuatu soal “terbalik” menunjukkan kualitas testee yaitu anak pandai
disebut bodoh dan anak bodoh disebut pandai.
10
Dengan demikian ada tiga titik pada daya pembeda yaitu:
Bagi suatu soal yang dapat dijawab benar oleh siswa kemampuan tinggi dan siswa
kemampuan rendah, maka soal itu tidak baik karena tidak punya daya pembeda.
Demikian juga jika semua kelompok bawah menjawab salah dan siswa berkemampuan
tinggi juga sama-sama menjawab salah, maka soal itu tidak mempunyai daya beda sama
sekali. Cara menentukan daya pembeda (nilai D).
Cara menentukan daya pembeda (nilai D) yaitu perlu dibedakan antara kelompok kecil
(kurang dari 100 ) dan kelompok besar ( 100 orang ke atas ).
a. Untuk kelompok besar

Mengingat biaya dan waktu menganalisis, maka untuk kelompok besar biasanya
hanya diambil dua kutub saja yaitu 27% skor teratas sebagai kelompok atas (JA)
dan 27 % skor terbawahsebagai kelompok bawah (JB).
b. Untuk kelompok kecil

Seluruh kelompok tes di bagi dua sama besar, 50% kelompok atas dan 50%
kelompok bawah. Seluruh pengikut tes dideretkan mulai dari skor teratas sampai
kepada skor terendah, lalu di bagi dua.
Rumus Mencari Daya Pembeda menurut Daryanto ( 2005, 186) yaitu :
Dimana :
 D = Daya pembeda
 J = jumlah peserta tes
 JA = banyak peserta kelompok atas
 JB = banyak peserta kelompok bawah
 BA = banyaknya peserta kelompok atas yang menjawab soal itu dengan
benar
 BB = banyak peserta kelompok bawah yang menjawab soal dengan benar
 PA = proporsi peserta kelompok atas yang menjawab benar ( ingat P sebagai
indeks kesukaran )
 PB = Proporsi peserta kelompok bawah yang menjawab benar
11
D. Pengolahan Skor Tes
1. Penilaian Acuan Norma (PAN)
a. Konsep Pendekatan Acuan Norma (PAN)
Pendekatan Acuan Norma (PAN) merupakan penilaian yang dalam
menginterpretasikan hasil pengukuran dengan cara membandingkan hasil belajar
siswa dengan hasil belajar siswa lain dalam kelompoknya, sehingga dapat diketahui
posisi seorang siswa dalam kelompoknya, artinya penentuan skor mengacu pada
perolehan skor dikelompok itu sebagai patokan. Dengan demikian patokan dalam
PAN bersifat relatif.
Pengolahan nilai hasil evaluasi hasil belajar dengan menggunakan pendekatan nilai
acuan norma juga disebut dengan penilaian acuan kelompok (PAK), sebab dalam
penentuan nilai hasil evaluasi skor mentah yang dicapai siswa diperbandingkan
dengan skor mentah hasil evaluasi yang dicapai oleh siswa lain, sehingga kualitas
yang dimiliki oleh seorang siswa akan sangat ditentukan oleh kualitas
kelompoknya. Skor penilaian norma juga disebut dengan “skor percentil”,
kedudukan siswa dalam kelompok bersifat relatif karena patokan dalam
penilaiannya juga bersifat relatif yaitu rerata skor kelompok. Ujian dengan soal
yang sama bisa menghasilkan rerata skor yang berbeda-beda untuk kelas yang
berbeda, sehingga standar penilaiannya juga berbeda.
Skor dalam penilaian acuan norma tidak menunjukkan tingkat penguasaan

ketrampilan maupun pengetahuan yang dinilai. Pengolahan nilai dengan acuan
norma ini biasanya digunakan pada tes seleksi karena sesuai dengan tujuannya,
yaitu untuk membedakan kemampuan seseorang dalam kelompok tertentu. Acuan
ini juga digunakan untuk mengetahui hasil belajar seseorang pada materi yang
cakupannya luas. Penentuan nilai dengan menggunakan standar relatif ini juga
cocok untuk diterapkan pada tes-tes sumatif (ulangan umum, ujian akhir semester,
EBTANAS, atau yang setara dengan itu).
b. Kriteria Penyusunan Penilaian Acuan Normatif (PAN)

 Tidak ditekankan untuk mengukur penampilan yang eksak dari behavioral
objectives. Dengan kata lain, soal-soal pada PAN tidak didasarkan atas
pengajaran yang diterima siswa atau atas keterampilan atau tingkah laku yang
diidentifikasikan sebagai sesuatu yang dianggap relevan bagi belajar siswa.
12
 Pada proses belajar, penilaian nilai normatif pada umumnya banyak dilakukan
oleh seorang guru.
 Penekanan dalam penilaian untuk proses belajar, seseorang mengacu pada
ketentuan atau norma yang berlaku disekolah.
 Seorang guru dapat menggunakan acuan normatif nasional.
c. Ciri-ciri Acuan Penilaian Normatif (PAN)

 Penilaian acuan normatif digunakan untuk mengetahui kemampuan peserta
didik dalam komunitasnya, seperti di kelas, sekolah, dan sebagainya.
 Penilaian acuan normatif menggunakan kriteria yang bersifat relative.
 Nilai hasil dari penilaian acuan normatif digunakan untuk menunjukan
kedudukan peserta didik (peringkatnya) dalam komunitasnya (kelompoknya).
 Penilaian normatif memiliki kecendrungan untuk menggunakan rentangan
tingkat penguasaan seseorang terhadap kelompoknya, mulai dari yang sangat
istimewa sampai dengan yang mengalami kesulitan yang serius.
2. Penilaian Acuan Patokan (PAP)

a. Konsep Penilaian Acuan Patokan (PAP)
Pengolahan nilai hasil evaluasi hasil belajar dengan menggunakan pendekatan
Penilaian Acuan Patokan berarti bahwa nilai yang akan diberikan kepada siswa
didasarkan pada standar mutlak atau kriteria yang telah ditetapkan. Oleh karena itu
PAP juga sering disebut dengan penilaian acuan kriteria. PAP merupakan penilaian
yang dalam menafsirkan atau menginterpretasikan skor hasil pengukuran
menggunakan patokan (standar yang tetap), yang dilaksanakan dengan jalan
membandingkan antara skor mentah hasil evaluasi yang dimiliki oleh siswa dengan
skor maksimum ideal yang mungkin dapat dicapai oleh siswa, kalau seluruh soal
ujian dapat dijawab dengan betul. Patokan ini dipakai untuk kelompok siswa mana
saja yang mengikuti tes atau ujian yang sama. Dengan demikian kelas, sekolah,
maupun daerah manapun apabila menggunakan instrumen atau soal tes yang sama
akan menggunakan standar yang sama, yaitu berapa persen siswa menguasai
ketrampilan atau pengetahuan yang diujikan.
b. Tujuan PAP dan Manfaat PAP
13
Tujuan PAP adalah untuk mengukur secara pasti tujuan atau kompetensi yang
ditetapkan sebagai kriteria keberhasilannya. PAP sangat bermanfaat dalam upaya
meningkatkan kualitas hasil belajar sebab peserta didik diusahakan untuk mencapai
standar yang telah ditentukan, dan hasil belajar peserta didik dapat diketahui derajat
pencapaiannya. Untuk menentukan batas lulus (passing grade) dengan pendekatan
ini, setiap skor peserta didik dibandingkan dengan skor ideal yang mungkin dicapai
oleh peserta didik. Menurut Payne (1974) dalam bukunya Asmawi Zainul,
penerapan PAP dapat dimanfaatkan antara lain:
 Penempatan seseorang dalam rentetan kegiatan belajar.

 Untuk mendiagnosis kemampuan seseorang dalam pembelajaran.
 Jika dilakukan secara periodik dapat digunakan untuk memonitor kemajuan
setiap anak didik dalam proses pembelajaran. Secara berkelanjutan dapat
diketahui status seseorang dalam satu rentetan kegiatan belajar. Akhirnya dapat
memacu atau memotivasi semangat belajar siswa.
 Kemampuan masing-masing anak didik untuk menyelesaikan kurikulum secara
kumulatif akan dapat menentukan keterlaksanaan kurikulum
c. Penerapan PAP
Pendekatan PAP tidak berorientasi pada “apa adanya”. Pertama, pendekatan ini
mempergunakan angka rata-rata dengan terlebih dahulu menetapkan kriteria
keberhasilan, yaitu “batas lulus” penguasaan bahan pelajaran atau kriteria
pencapaian tujuan (TKP). Siswa yang telah mencapai batas ini dianggap telah
berhasil dalam belajar dan diperkenankan mempelajari bahan pelajaran yang lebih
tinggi, sedangkan yang belum mencapai batas tersebut dianggap belum berhasil dan
diharuskan memantapkan kembali pelajarannya itu. Kedua, dalam proses
pengajaran, tenaga pengajar tidak begitu saja membiarkan siswa menjalani sendiri
proses belajarnya, melainkan terus-menerus secara langsung ataupun tidak
langsung merangsang dan memeriksa kemajuan belajar siswa serta membantunya
melewati tahap-tahap pengajaran secara berhasil. Penggunaan tes formatif dalam
penilaian ini sangat mendukung untuk mengetahui keberhasilan belajar siswa.
Rumus yang digunakan untuk mengolah nilai dengan PAP adalah:
14
Contoh :
1) Pada sebuah tes objektif pilihan ganda dengan jumlah soal sebanyak 50 butir.
seorang siswa menjawab dengan benar 30 soal. Maka skor yang dicapai adalah
30. Maka nilai yang dicapai adalah
30
= 60 × 100
= 60
2) Skala penilaian kemampuan membaca Al-Qur’an

Satuan pendidikan : Madrasah Aliyah
Kelas/Semester : X/1
Mata pelajaran : Al-Qur’an Hadist
Aspek yang dinilai

Total
No. Nama Panjang
Tanwin Makhroj Qolqolah Skor
pendek
1 Aza 4 4 4 4 16
2 Beni 4 3 5 3 15
3 Caca 5 5 4 5 19
Pedoman penskoran:
5 = Sangat baik
4 = Baik
15
3 = Cukup
2 = Kurang
1 = Sangat kurang
Pada skala penilaian di atas anak yang bernama Aza memperolah skor 16, sedang skor
16
maksimal adalah 20, maka nilai anak tersebut adalah = 20 × 100 = 80
Pengolahan nilai PAP akan lebih mudah menggunakan komputer program microsoft
excel dengan langkah-langkah:
a. Memasukkan data ke microsoft excel

b. Menghitung skor akhir atau nilai sesuai rumus PAP diatas, dengan cara klik =(skor
riil persiswa/skor maksimum)*100
c. Maka akan muncul hasilnya, dan tinggal menarik kursor/copy kebawah, maka nilai
semua siswa akan muncul
Penilaian acuan patokan digunakan untuk mengetahui kemempuan anak terhadap

materi yang diujikan, seperti contoh diatas, siswa aza menguasai 70% dari materi yang
diujikan. Kelemahan acuan patokan ini adalah skor hasil tes siswa tergantung pada
tingkat kesulitan butir-butir tes yang mereka terima. Artinya apabila instrumen tes
memiliki butir soal yang tingkat kesulitannya rendah mak siswa akan memperoleh skor
yang tinggi, sebaliknya apabila butir soal yang diterima memiliki tingkat kesulitan yang
tinggi siswa akan memperoleh skor yang rendah.
E. Persamaan dan Perbedaan PAN dan PAP

1) Persamaan PAN dan PAP
 Kedua pengukuran PAN dan PAP memerlukan adanya tujun evaluasi spesifik
sebagai menentukan focus item yang diperlukan
 Kedua pengukuran memerlukan sampel yang relevan, digunakan sebagai subjek
16
yang hendak dijadikan sasaran evaluasi
 Untuk mendapatkan informasi yang diinginkan tentang siswa, kedua pengukuran
samasama memerlukan item-item yang disusun dalam suatu tes dengan
menggunakan aturan dasar penulisan instrument
 Kedua pengukuran memerlukan persayartan pokok, yaitu validitas dan reliabilitas.
Validitas yaitu apakah item yang disusun mengukur apa yang hendak diukur,
sedangkan realibilitas yaitu apakah item tes memiliki hasil keajegan atau konsistensi
Kedua pegukuran tersebut sama manfaatnya, yaitu alat pengumpul data siswa yang
di evaluasi
2) Perbedaan PAN dan PAP

 PAN
 Merupakan tes yang mencakup domain tugas pembelajaran dengan item
pengukuran yang spesifik.
 Menekankan perbedaan antara individual siswa satu dengan siswa lainnya
dalam kelompok atau kelas.
 Item-item memiliki tingkat kesulitan tinggi dan cenderung menghilangkan item
yang memiliki tingkat kesulitan rendah.
 Lebih banyak digunakan, khususnya pada kelas yang memiliki kelompok
dengan pembedaan siswa pandai, diatas rerata, dibawah rerata dan bodoh.
 Interpretasi evaluasi memerlukan adanya pengelompokan atas kelompok
tertentu secara jelas.
 PAP
 Merupakan tipe pengukuran yang berfokus pada penentuan domain tugas
belajar dengan tingkat kesulitan sejumlah item sesuai dengan tugas
pembelajaran
 Menekankan penggambaran tugas apa yang telah dipelajari oleh para siswa
 Item kesulitan sesuai dengan tugas pembelajaran, tanpa menghilangkan item
atau soal yag memiliki tingkat kesulitan rendah
 Lebih banyak digunakan, khususnya untuk kelas dengan tugas pembelajaran
dengan konsep atau penguasaan materi belajar (mastery learnig)
 Interpretasi memerlukan grup tertentu dengan memenuhi kriteria tertentu atau
domain pencapaian belajar.
17
BAB 3
PENUTUP
A. Kesimpulan
Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilaisehingga
betul-betul menilai apa yang yang seharusnya dinilai. Penilaian tersebut tidaktepat (valid).
Alat penilaian yang telah valid untuk suatu tujuan tertentu belum otomatisakan valid untuk
tujuan yang lain. Validitas terkait dengan ketepatan objek yang tidak lain adalah tidak
menyimpangnyadata dari kenyataan, artinya bahwa data tersebut benar, maka konsep
reliabilitas terkaitdengan pemotretan berkali-kali
Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat

dikatakanmempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan
hasilyang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah
ketetapanhasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi
dapatdikatakan tidak berarti.
Dari pembahasan makalah tersebut dapat diambil kesimpulan bahwa Penilaian Acuan
Patokan (PAP) dan Penilaian Acuan Norma (PAN) adalah penilaian yang dilakukan dengan
mengacu pada kelompok atau nilai-nilai yang diperoleh dibandingkan dengan nilai-nilai
lain dalam kelompok tersebut atau pemberian nilai pada perolehan skor kelompok itu atau
mengacu pada penilaian yang hasil pengukuran seseorang dengan hasil pengukuran yang
diperoleh orang-orang lain dalam kelompoknya. Sedangkan Penilaian Acuan Patokan
(PAP) adalah model penilaian yang mengacu pada suatu tujuan dari suatu tujuan atau tujuan
khusus yang telah ditetapkan sebelumnya. PAP merupakan suatu cara menentukan siswa
dengan menggunakan nilai atau penilaian yang membandingkan hasil pengukuran
seseorang dengan patkan “batas lulus” yang telah ditetapkan.
Persamaan dan Perbedaan PAN dan PAP yaitu sama-sama memerlukan adanya tujuan
evaluasi spesifik sebagai tujuan fokus yang diperlukan, kedua memenerlukan sampel yang
relecan digunakan sebagai subjek yang ingin dijadikan tujuan evaluasi, sampel yang diukur
presentasi populasi siswa yang ingin menjadi target akhir pengambilan keputusan, untuk
mendapatkan informasi yang diinginkan tentang siswa, ketiga pengukuran sama-sama
memerlukan item-item yang disusun dalam satu tes dengan menggunakan aturan dasar
18
penulisan instrument, keduanya mempersyaratkan perumusan secara spesifik prilaku yang
akan diukur dan dinilai dari segi validitas, dan realibilitas.
B. Saran
Sebagai guru yang baik tentu bukan hanya baik dalam pengajaran saja namun perlu juga
memahami tentang kecermatan dalam pembuatan soal soal yang akan digunakan pada
ujian. Serta Guru harus mampu memperhatikan kualitas soal. Agar soal tersebut dapat
dikatakan berkualitas dengan memperhatikan aspek aspek 1. Validitas 2. Reabilitas. 3.
Tingkat kesukaran. 4 daya pembeda.
19
DAFTAR PUSTAKA
Amelia, M. A. (2016). Analisis Soal Tes Hasil Belajar High Order Thinking Skills (HOTS)
Matematika Materi Pecahan untuk Kelas 5 Sekolah Dasar. Jurnal Penelitian, 20(2).
Azty, A. (2020). Analisis kualitas butir soal pendidikan agama islam berbasis Higher Order
Thinking Skills (HOTS) Kelas V SD Budi Mulia Medan TP 2019/2020 (Doctoral
dissertation, Universitas Islam Negeri Sumatera Utara).
Dewi, S. (2021). Kualitas Butir Soal Matematika pada Ujian Sekolah SDIT Al Fatih. Faktor:
Jurnal Ilmiah Kependidikan, 8(2), 213-222.
Magdalena, I., Fauziah, S. N., Faziah, S. N., & Nupus, F. S. (2021). Analisis Validitas,
Reliabilitas, Tingkat Kesulitan dan Daya Beda Butir Soal Ujian Akhir Semester Tema
7 Kelas III SDN Karet 1 Sepatan. BINTANG, 3(2), 198-214.
Sidin, A., & Khaeruddin, K. (2012). Evaluasi Pembelajaran.
Sriyanto, A. (2019). Teknik Pengolahan Hasil Asesmen Penentuan Standar Asesmen, Teknik
Pengolahan dengan Menggunakan Pendekatan Acuan Patokan (PAP) dan Acuan
Norma (PAN). Al-Lubab: Jurnal Penelitian Pendidikan dan Keagamaan Islam, 5(2),
224-240.
20

Makalah Kelompok 3 - 3D PGSD - Evaluasi Pembelajaran DI SD

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah Kelompok 3 - 3D PGSD - Evaluasi Pembelajaran DI SD

Diunggah oleh

Hak Cipta:

Format Tersedia

MAKALAH

KUALITAS SOAL TES (VALIDITAS, RELIABILITAS, DAYA PEMBEDA,

Tesa Salsabila Santana (2001145)

PROGRAM STUDI S1 PENDIDIKAN GURU SEKOLAH DASAR

Tasikmalaya, 6 September 2022

Berdasarkan latar belakang tersebut, maka dirumuskan beberapa permasalahan yaitu:

A. Pengertian Analisis Kualitas Butir Soal

B. Tujuan dan Manfaat Analisis Kualitas Butir Soal

C. Karakteristik Butir Soal

Validitas Tes Hasil Belajar

Dalam membandingkan hasil sebuah tes maka diperlukan suatu alat

Reliabilitas instrumen adalah keadaan instrumen yang menunjukkan hasil pengukuran

b. Pengujian Reliabilitas Tes Bentuk Objektif

3) Metode Bentuk Paralel atau Metode Double Test Double Trial

a. Untuk kelompok besar

b. Untuk kelompok kecil

Skor dalam penilaian acuan norma tidak menunjukkan tingkat penguasaan

b. Kriteria Penyusunan Penilaian Acuan Normatif (PAN)

c. Ciri-ciri Acuan Penilaian Normatif (PAN)

2. Penilaian Acuan Patokan (PAP)

b. Tujuan PAP dan Manfaat PAP

 Penempatan seseorang dalam rentetan kegiatan belajar.

Rumus yang digunakan untuk mengolah nilai dengan PAP adalah:

2) Skala penilaian kemampuan membaca Al-Qur’an

Mata pelajaran : Al-Qur’an Hadist

Aspek yang dinilai

a. Memasukkan data ke microsoft excel

Penilaian acuan patokan digunakan untuk mengetahui kemempuan anak terhadap

E. Persamaan dan Perbedaan PAN dan PAP

2) Perbedaan PAN dan PAP

Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat

Sidin, A., & Khaeruddin, K. (2012). Evaluasi Pembelajaran.

Anda mungkin juga menyukai