Diajukan untuk memenuhi salah satu tugas Mata Kuliah Evaluasi Pembelajaran di SD
(GD421)
Dosen Pengampu:
Dr. Ghullam Hamdu, M.Pd. (2564)
Disusun Oleh:
Puji syukur kami panjatkan kepada Allah Swt. yang telah memberikan kesehatan dan
kelancaran kepada kita sehingga bisa menyelesaikan penulisan makalah Mata Kuliah Evaluasi
Pembelajaran di SD dengan judul “Kualitas Soal Tes (Validitas, Reliabilitas, Daya Pembeda,
Pengecoh, dan Tingkat Kesukaran) Pengolahan Skor Tes, Penilaian Acuan Normatif (PAN)
dan Penilaian Acuan Patokan (PAP)”.
Kami mengucapkan terima kasih kepada Bapak Dr. Ghullam Hamdu, M.Pd. selaku dosen
pengampu Mata Kuliah Evaluasi Pembelajaran di SD yang telah membimbing kami dalam
menyelesaikan makalah ini, tak lupa kami ucapkan terima kasih kepada semua pihak yang telah
memberikan kontribusi atas penyusunan makalah ini.
Penulisan makalah ini telah diupayakan semaksimal mungkin, namun disadari bahwa masih
terdapat berbagai kekurangan yang disebabkan oleh keterbatasan waktu dan ilmu pengetahuan
yang dimiliki. Oleh karena itu, diharapkan kritik dan saran yang bersifat membangun guna
menyempurnakan makalah ini. Semoga makalah ini dapat memberi manfaat bagi semua pihak.
Penulis
i
DAFTAR ISI
KATA PENGANTAR.......................................................................................................................... i
DAFTAR ISI ....................................................................................................................................... ii
BAB 1 ................................................................................................................................................... 1
PENDAHULUAN ............................................................................................................................... 1
A. Latar Belakang ........................................................................................................................ 1
B. Rumusan Masalah .................................................................................................................. 1
C. Tujuan...................................................................................................................................... 2
BAB 2 ................................................................................................................................................... 3
PEMBAHASAN .................................................................................................................................. 3
A. Pengertian Analisis Kualitas Butir Soal ................................................................................ 3
B. Tujuan dan Manfaat Analisis Kualitas Butir Soal ............................................................... 3
C. Karakteristik Butir Soal ......................................................................................................... 4
1. Validitas ............................................................................................................................... 4
2. Reliabilitas ........................................................................................................................... 7
3. Tingkat Kesukaran ............................................................................................................. 9
4. Daya Pembeda ................................................................................................................... 10
D. Pengolahan Skor Tes ............................................................................................................ 12
1. Penilaian Acuan Norma (PAN) ........................................................................................ 12
2. Penilaian Acuan Patokan (PAP) ...................................................................................... 13
E. Persamaan dan Perbedaan PAN dan PAP .......................................................................... 16
BAB 3 ................................................................................................................................................. 18
PENUTUP ......................................................................................................................................... 18
DAFTAR PUSTAKA ........................................................................................................................ 20
ii
BAB 1
PENDAHULUAN
A. Latar Belakang
Salah satu alat yang digunakan sebagai sarana untuk penilaian hasil belajar yaitu tes.
Menurut (sudijono, 2012) tes adalah cara dalam mengukur dan menilai di bidang
pendidikan dalam bentuk pemberian tugas atau serangkaian tugas yang harus dikerjakan
oleh siswa, sehingga dapat diketahui nilai prestasi siswa. Nilai tersebut kemudian
dibandingkan dengan nilai-nilai yang dicapai oleh testee lainnya, atau dibandingkan
dengan nilai standar tertentu. Oleh karena itu, untuk mengetahui kualitas butir soal yang
digunakan untuk tes perlu dilakukan analisis butir soal.
Analisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk
meningkatkan kualitas soal yang telah ditulis. Menurut Aiken (1994) dalam Depdiknas
(2008), tujuan analisis butir soal yaitu meningkatkan kualitas butir tes dan mengetahui
informasi diagnostik siswa. Soal yang berkualitas yaitu soal yang dapat memberikan
informasi setepat tepatnya, sehingga dapat diketahui siswa yang telah menguasai materi
dan yang belum. Suatu tes evaluasi yang baik memiliki ciri dan sifat yang merupakan
persyaratan-persyaratan yang harus dipenuhi, yaitu tes tersebut harus valid atau memiliki
tingkat validitas yang absah/baik. Sebuah tes evaluasi dikatakan valid apabila tes tersebut
secara tepat dan benar dapat mengukur apa yang hendak diukur. Dalam evaluasi pendidikan
baik tes maupun nontes, keduanya merupakan instrumen atau alat bantu pengumpulan dan
pengolahan data tentang variabel-variabel yang diteliti. Ciri-ciri/karakteristik instrument
yang baik sebagai alat evaluasi adalah memenuhi persyaratan validitas dan reliabilitas.
Inilah alasan mengapa alat evaluasi yang baik dapat dilihat dari beberapa segi antara lain:
(1) validitas, (2) reliabilitas, (3) daya pembeda, (4) pengecoh, dan (5) tingkat kesukaran.
B. Rumusan Masalah
1
1. Apa yang dimaksud dengan analisis kualitas butir soal?
2. Apa tujuan dan manfaat analisis kualitas butir soal?
3. Bagaimana karakteristik butir soal validitas?
4. Bagaimana karakteristik butir soal reliabilitas?
5. Bagaimana karakteristik butir soal tingkat kesukaran?
6. Bagaimana karakteristik butir soal daya pembeda?
7. Apa yang dimaksud dengan Penilaian Acuan Normatif (PAN)?
8. Apa yang dimaksud dengan Penilaian Acuan Patokan (PAP)?
9. Apa persamaan dan perbedaan dari Penilaian Acuan Normatif (PAN) dan Penilaian
Acuan Patokan (PAP)?
C. Tujuan
Berdasarkan rumusan masalah tersebut, maka diperoleh tujuan penulisan makalah sebagai
berikut:
1. Untuk mengetahui pengertian analisis kualitas butir soal?
2. Untuk mengetahui tujuan dan manfaat analisis kualitas butir soal?
3. Untuk mengetahui karakteristik butir soal validitas?
4. Untuk mengetahui karakteristik butir soal reliabilitas?
5. Untuk mengetahui karakteristik butir soal tingkat kesukaran?
6. Untuk mengetahui karakteristik butir soal daya pembeda?
7. Untuk mengetahui Penilaian Acuan Normatif (PAN)
8. Untuk mengetahui Penilaian Acuan Patokan (PAP)
9. Untuk mengetahui persamaan dan perbedaan dari Penilaian Acuan Normatif (PAN) dan
Penilaian Acuan Patokan (PAP)?
2
BAB 2
PEMBAHASAN
Suharsimi Arikunto menyatakan bahwa analisis kualitas tes merupakan kegiatan untuk
mengkaji soal pada setiap item atau butirnya guna mengetahui kualitas dari setiap butir soal
tersebut. Analisis kualitas butir soal adalah suatu prosedur yang sistematis, yang akan
memberikan informasiinformasi yang sangat khusus terhadap butir tes yang kita susun.
Sumarna Surapranata mengemukakan bahwa analisis kualitas soal dilakukan untuk
mengetahui berfungsi tidaknya sebuah soal. Dari pengertian tersebut dapat disimpulkan
bahwa analisis kualitas butir soal merupakan kegiatan menganalisis tiap-tiap butir soal
secara mendetail menggunakan metode pengujian tertentu. Sedangkan menurut Daryanto,
analisis kualitas butir soal adalah kegiatan yang dilakukan untuk mengidentifikasi soal-soal
baik, kurang baik dan soal jelek dan memperoleh petunjuk untuk melakukan
perbaikan.Menurut Nitko, kegiatan menganalisis kualitas butir soal merupakan kegiatan
yang harus dilakukan pendidik untuk meningkatkan mutu soal yang telah ditulis. Kegiatan
ini merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban
peserta didik untuk membuat keputusan tentang setiap penilaian.
Berdasarkan definisi para ahli di atas, dapat disimpulkan bahwa analisis kualitas butir soal
merupakan suatu kegiatan yang bertujuan untuk mengkaji dan mengidentifikasi setiap butir
soal guna mengetahui kualitas setiap butir soal tersebut. Hasil dari proses mengkaji dan
mengidentifikasi soal dapat digunakan untuk melakukan perbaikan dan penyempurnaan
pada setiap butir soal.
Tujuan utama analisis kualitas butir soal dalam sebuah tes yang dibuat pendidik adalah
untuk mengidentifikasi kekurangan-kekurangan dalam tes atau pembelajaran. Berdasarkan
tujuan ini maka kegiatan analisis kualitas butir soal memiliki banyak manfaat, diantaranya:
a. Menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan.
3
b. Memberi masukan kepada peserta didik tentang kemampuan dan sebagai dasar untuk
bahan diskusi di kelas.
c. Memberi masukan kepada pendidik tentang kesulitan kepada peserta didik.
d. Memberi masukan pada aspek tertentu untuk pengembangan kurikulum.
e. Merevisi materi yang dinilai atau diukur.
f. Meningkatkan keterampilan penulisan soal.
Kusaeri dan Suprananto juga mengemukakan beberapa manfaat yang diperoleh pendidik
dalam melakukan kegiatan analisis kualitas butir soal. Manfaat tersebut antara lain:
a. Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik
b. Meningkatkan butir soal melalui tiga komponen analisis yaitu tingkat kesukaran, daya
pembeda dan pengecoh soal
c. Merevisi soal yang tidak relevan dengan materi yang diajarkan, ditandai dengan
banyaknya anak yang tidak dapat menjawab butir soal tertentu.
Berdasarkan uraian di atas, menunjukkan bahwa kegiatan menganalisis kualitas butir soal
sangat perlu dilakukan oleh pendidik. Kegiatan ini dapat memberikan informasi kepada
pendidik mengenai kekurangan-kekurangan yang terdapat pada butir soal sehingga
pendidik dapat memperbaiki dan meningkatkan kualitas butir soal yang akan diujikan.
Dalam menilai suatu butir soal atau melihat kualitas butir soal apakah sudah baik atau
belum, maka ada hal-hal yang harus dipenuhi oleh butir soal agar butir soal tersebut
berkualitas. Setiap butir akan diperiksa mutunya dalam empat kategori sebagai berikut:
1. Validitas
Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang dilakukan
oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris guna
mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas
adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya.
Suatu alat ukur disebut memiliki validitas apabila alat ukur tersebut isinya layak
mengukur objek yang seharusnya diukur dan sesuai dengan kreteria tertentu, artinya
4
adanya kesesuaian antara alat ukur dengan fungsi pengukuran dan sasaran pengukuran.
Ini sesuai dengan Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B
Anderson dan disadur oleh Prof. Dr. Suharsimi Arikunto (2007, 65) bahwa A test is
valid if it measures what it purpose to measure bila diartikan sebuah tes dikatakan valid
apabila tes tersebut mengukur apa yang hendak diukur. Bilamana alat ukur tidak
memiliki validitas yang dapat dipertanggung jawabkan, maka data yang masuk juga sis
dan kesimpulan yang ditarik juga menjadi salah.
a. Validasi logis
Mengandung arti penalaran, sehingga validitas logis untuk suatu instrumen evaluasi
menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid
berdasarkan hasil penalaran. Kondisi valid itu dipandang terpenuhi karena
instrument itu telah dirancang sebaik mungkin menurut ketentuan yang ada.
Dengan keadaan itu validitas logis dapat dicapai apabila instrument disusun
mengikuti ketentuan yang ada. Validitas logis yang dapat dicapai oleh sebuah
instrumen terdiri dari dua yaitu :
Validitas Isi
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrument
yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Sebuah tes
dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang
sejajar dengan materi atau isi pelajaran yang di berikan. Oleh karena materi
yang diajarkan tertera dalam kurikulum maka validitas ini sering disebut juga
dengan validitas kurikuler.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara
merinci materi kurikulum atau materi buku pelajaran.
5
Validitas Konstruk
Validitas konstruk sebuah instrumen menunjukkan suatu kondisi sebuah
instrumen yang disusun berdasarkan konstruk-konstruk aspek kejiwaan yang
seharusnya dievaluasi. Sebuah tes dikatakan memiliki validitas konstruk apabila
butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir
seperti yang disebutkan dalam tujuan instruksional khusus. Dengan kata lain
jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan aspek
berfikir yang menjadi tujuan instruksional.
b. Validitas Empiris
Mengandung arti kata pengalaman. Sebuah instrument dikatakan memiliki validitas
empiris apabila sudah di uji dengan pengalaman. Sebagai contoh, seseorang dapat
diakui jujur oleh masyarakat lain apabila dalam pengalaman dia diakui memang
jujur. Pada Validitas empiris terdiri dari dua cara yang dilakukan untuk mengujinya
sehingga dia menjadi valid. Pengujian itu dilakukan dengan membandingkan
kondisi instrumen yang bersangkutan dengan suatu ukuran. Kriteria yang
digunakan adalah :
Validitas Konkuren
Disebut juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan
validitas empiris. Sebuah instrument dikatakan memiliki validitas empiris jika
hasilnya sesuai dengan pengalaman. Jika ada istilah :sesuai” tentu ada dua hal
yang dipasangkan, dimana dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data
pengalaman tersebut sekarang sudah ada.
Validitas Prediksi
6
Prediksi artinya meramal. Dengan meramal selalu mengenai hal yang akan
datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas
prediksi apabila mempunyai kemampuan untuk meramalkan apa yang terjadi
pada masa yang akan datang. Misalnya tes masuk perguruan tinggi adalah
sebuah tes yang diperkirakan dapat meramalkan keberhasilan peserta tes dalam
mengikuti kuliah di masa yang akan datang. Calon yang tersaring berdasarkan
hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti
kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilan kelak. Sebaliknya
seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah
jadi diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh
setelah peserta tes mengikuti pelajaran diperguruan tinggi. Jika ternyata siapa
yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan
dengan yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud
tidak memiliki validitas.
2. Reliabilitas
7
Evaluasi yang subjektif juga akan menurunkan reliabilitas.
Hal yang berhubungan dengan penyelenggaraan tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung akan
mempengaruhi reliabilitas soal tes.
Reliabilitas instrumen dinyatakan dengan koefisien reliabilitas. Instrumen yang
reliable adalah instrumen yang memiliki koefisien reliabilitas minimal 0,70.
Sebaiknya koefisien reliabilitas instrumen 0,80 atau lebih. Koefisien reliabilitas
instrumen dihitung dengan menggunakan rumus tertentu.
8
N = banyaknya peserta tes.
2) Metode Belah Dua (split-half method) atau Single Test Single Trial Method
Dalam menggunakan metode ini pendidik atau evaluator hanya menggunnakan
sebuah tes dan dicobakan satu kali. Oleh sebab itu disebut juga singel-test-
singel-trial method. Pada metode ini tes yang diberikan dibagi/dibelah menjadi
dua bagian. Jumlah item yang diberikan harus genap sehingga dapat dibagi dua
dan tiap kelompok memiliki jumlah item/butir soal yang sama jumlahnya.
Untuk menentukan reliabilitas seluruh tes dapat digunakan rumus Spearman-
Brown sebagai berikut: Rumus Spearman Brown:
Dimana: korelasi antara skor-skor setiap belahan tes. koefisien reliabilitas tes.
Cara lain yang juga dapat digunakan pada metode singel-test-singel-trial adalah
formula Rulon, Flanagan, Kuder-Richardson, Hoyt.
Kelemahan dari metode ini adalah kesukaran dalam penyusunan item yang
parallel dengan item pada tes pertama, selain itu juga membutuhkan biaya yang
lebih mahal dan memakan waktu yang lebih lama. Rumus yang dapat digunakan
untuk menentukan reliabilitas dengan metode parallel ini adalah Product
Moment Correlation dan Rank Order Correlation.
3. Tingkat Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha pemecahannya.
9
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan
tidak mempunyai semangat untuk mencoba lagi karena diluar jangkauannya.
Seorang akan menjadi hafal akan kebiasaan gurunya dalam pembuatan soal. Dengan
kebiasaaan ini maka siswa akan belajar giat untuk menghadapi ulangan dengan guru
yang terbiasa memberikan soal sukar, sedangkan siswa akan malas belajar bila akan
ujian dengan guru yang terbiasa dengan soal ulangan yang mudah-mudah.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut dengan indeks
kesukaran. Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks
kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,00
menunjukkan kalau soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa
soalnya terlalu mudah. Indeks kesukaran butir yang baik berkisar antara 0,3-0,7 paling
baik pada 0,5.
Dalam istilah evaluasi, indeks kesukaran ini diberi simbol P singkatan ari proporsi.
Dengan demikian maka soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P
= 0,20. sebaliknya soal dengan P = 0,30 lebih sukar daripada soal dengan P = 0,80.
Rumusan mencari indeks kesukaran menurut Daryanto (2005,180) adalah :
Dimana :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes.
4. Daya Pembeda
Daya pembeda soal yaitu kemampuan sesuatu soal untuk membedakan antara siswa
yang berkemampuan tinggi dengan siswa yang berkemampuan rendah. Angka yang
menunjukkan besarnya daya pembeda disebut indeks diskriminasi ( D), dan nilainya
berkisar antara 0,00 sampai 1,00. Pada daya pembeda ini berlaku tanda negatif yang
digunakan jika sesuatu soal “terbalik” menunjukkan kualitas testee yaitu anak pandai
disebut bodoh dan anak bodoh disebut pandai.
10
Dengan demikian ada tiga titik pada daya pembeda yaitu:
Bagi suatu soal yang dapat dijawab benar oleh siswa kemampuan tinggi dan siswa
kemampuan rendah, maka soal itu tidak baik karena tidak punya daya pembeda.
Demikian juga jika semua kelompok bawah menjawab salah dan siswa berkemampuan
tinggi juga sama-sama menjawab salah, maka soal itu tidak mempunyai daya beda sama
sekali. Cara menentukan daya pembeda (nilai D).
Cara menentukan daya pembeda (nilai D) yaitu perlu dibedakan antara kelompok kecil
(kurang dari 100 ) dan kelompok besar ( 100 orang ke atas ).
11
D. Pengolahan Skor Tes
1. Penilaian Acuan Norma (PAN)
a. Konsep Pendekatan Acuan Norma (PAN)
Pendekatan Acuan Norma (PAN) merupakan penilaian yang dalam
menginterpretasikan hasil pengukuran dengan cara membandingkan hasil belajar
siswa dengan hasil belajar siswa lain dalam kelompoknya, sehingga dapat diketahui
posisi seorang siswa dalam kelompoknya, artinya penentuan skor mengacu pada
perolehan skor dikelompok itu sebagai patokan. Dengan demikian patokan dalam
PAN bersifat relatif.
Pengolahan nilai hasil evaluasi hasil belajar dengan menggunakan pendekatan nilai
acuan norma juga disebut dengan penilaian acuan kelompok (PAK), sebab dalam
penentuan nilai hasil evaluasi skor mentah yang dicapai siswa diperbandingkan
dengan skor mentah hasil evaluasi yang dicapai oleh siswa lain, sehingga kualitas
yang dimiliki oleh seorang siswa akan sangat ditentukan oleh kualitas
kelompoknya. Skor penilaian norma juga disebut dengan “skor percentil”,
kedudukan siswa dalam kelompok bersifat relatif karena patokan dalam
penilaiannya juga bersifat relatif yaitu rerata skor kelompok. Ujian dengan soal
yang sama bisa menghasilkan rerata skor yang berbeda-beda untuk kelas yang
berbeda, sehingga standar penilaiannya juga berbeda.
12
Pada proses belajar, penilaian nilai normatif pada umumnya banyak dilakukan
oleh seorang guru.
Penekanan dalam penilaian untuk proses belajar, seseorang mengacu pada
ketentuan atau norma yang berlaku disekolah.
Seorang guru dapat menggunakan acuan normatif nasional.
13
Tujuan PAP adalah untuk mengukur secara pasti tujuan atau kompetensi yang
ditetapkan sebagai kriteria keberhasilannya. PAP sangat bermanfaat dalam upaya
meningkatkan kualitas hasil belajar sebab peserta didik diusahakan untuk mencapai
standar yang telah ditentukan, dan hasil belajar peserta didik dapat diketahui derajat
pencapaiannya. Untuk menentukan batas lulus (passing grade) dengan pendekatan
ini, setiap skor peserta didik dibandingkan dengan skor ideal yang mungkin dicapai
oleh peserta didik. Menurut Payne (1974) dalam bukunya Asmawi Zainul,
penerapan PAP dapat dimanfaatkan antara lain:
c. Penerapan PAP
Pendekatan PAP tidak berorientasi pada “apa adanya”. Pertama, pendekatan ini
mempergunakan angka rata-rata dengan terlebih dahulu menetapkan kriteria
keberhasilan, yaitu “batas lulus” penguasaan bahan pelajaran atau kriteria
pencapaian tujuan (TKP). Siswa yang telah mencapai batas ini dianggap telah
berhasil dalam belajar dan diperkenankan mempelajari bahan pelajaran yang lebih
tinggi, sedangkan yang belum mencapai batas tersebut dianggap belum berhasil dan
diharuskan memantapkan kembali pelajarannya itu. Kedua, dalam proses
pengajaran, tenaga pengajar tidak begitu saja membiarkan siswa menjalani sendiri
proses belajarnya, melainkan terus-menerus secara langsung ataupun tidak
langsung merangsang dan memeriksa kemajuan belajar siswa serta membantunya
melewati tahap-tahap pengajaran secara berhasil. Penggunaan tes formatif dalam
penilaian ini sangat mendukung untuk mengetahui keberhasilan belajar siswa.
14
Contoh :
1) Pada sebuah tes objektif pilihan ganda dengan jumlah soal sebanyak 50 butir.
seorang siswa menjawab dengan benar 30 soal. Maka skor yang dicapai adalah
30. Maka nilai yang dicapai adalah
30
= 60 × 100
= 60
Kelas/Semester : X/1
Pedoman penskoran:
5 = Sangat baik
4 = Baik
15
3 = Cukup
2 = Kurang
1 = Sangat kurang
Pada skala penilaian di atas anak yang bernama Aza memperolah skor 16, sedang skor
16
maksimal adalah 20, maka nilai anak tersebut adalah = 20 × 100 = 80
Pengolahan nilai PAP akan lebih mudah menggunakan komputer program microsoft
excel dengan langkah-langkah:
16
yang hendak dijadikan sasaran evaluasi
Untuk mendapatkan informasi yang diinginkan tentang siswa, kedua pengukuran
samasama memerlukan item-item yang disusun dalam suatu tes dengan
menggunakan aturan dasar penulisan instrument
Kedua pengukuran memerlukan persayartan pokok, yaitu validitas dan reliabilitas.
Validitas yaitu apakah item yang disusun mengukur apa yang hendak diukur,
sedangkan realibilitas yaitu apakah item tes memiliki hasil keajegan atau konsistensi
Kedua pegukuran tersebut sama manfaatnya, yaitu alat pengumpul data siswa yang
di evaluasi
17
BAB 3
PENUTUP
A. Kesimpulan
Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilaisehingga
betul-betul menilai apa yang yang seharusnya dinilai. Penilaian tersebut tidaktepat (valid).
Alat penilaian yang telah valid untuk suatu tujuan tertentu belum otomatisakan valid untuk
tujuan yang lain. Validitas terkait dengan ketepatan objek yang tidak lain adalah tidak
menyimpangnyadata dari kenyataan, artinya bahwa data tersebut benar, maka konsep
reliabilitas terkaitdengan pemotretan berkali-kali
Dari pembahasan makalah tersebut dapat diambil kesimpulan bahwa Penilaian Acuan
Patokan (PAP) dan Penilaian Acuan Norma (PAN) adalah penilaian yang dilakukan dengan
mengacu pada kelompok atau nilai-nilai yang diperoleh dibandingkan dengan nilai-nilai
lain dalam kelompok tersebut atau pemberian nilai pada perolehan skor kelompok itu atau
mengacu pada penilaian yang hasil pengukuran seseorang dengan hasil pengukuran yang
diperoleh orang-orang lain dalam kelompoknya. Sedangkan Penilaian Acuan Patokan
(PAP) adalah model penilaian yang mengacu pada suatu tujuan dari suatu tujuan atau tujuan
khusus yang telah ditetapkan sebelumnya. PAP merupakan suatu cara menentukan siswa
dengan menggunakan nilai atau penilaian yang membandingkan hasil pengukuran
seseorang dengan patkan “batas lulus” yang telah ditetapkan.
Persamaan dan Perbedaan PAN dan PAP yaitu sama-sama memerlukan adanya tujuan
evaluasi spesifik sebagai tujuan fokus yang diperlukan, kedua memenerlukan sampel yang
relecan digunakan sebagai subjek yang ingin dijadikan tujuan evaluasi, sampel yang diukur
presentasi populasi siswa yang ingin menjadi target akhir pengambilan keputusan, untuk
mendapatkan informasi yang diinginkan tentang siswa, ketiga pengukuran sama-sama
memerlukan item-item yang disusun dalam satu tes dengan menggunakan aturan dasar
18
penulisan instrument, keduanya mempersyaratkan perumusan secara spesifik prilaku yang
akan diukur dan dinilai dari segi validitas, dan realibilitas.
B. Saran
Sebagai guru yang baik tentu bukan hanya baik dalam pengajaran saja namun perlu juga
memahami tentang kecermatan dalam pembuatan soal soal yang akan digunakan pada
ujian. Serta Guru harus mampu memperhatikan kualitas soal. Agar soal tersebut dapat
dikatakan berkualitas dengan memperhatikan aspek aspek 1. Validitas 2. Reabilitas. 3.
Tingkat kesukaran. 4 daya pembeda.
19
DAFTAR PUSTAKA
Amelia, M. A. (2016). Analisis Soal Tes Hasil Belajar High Order Thinking Skills (HOTS)
Matematika Materi Pecahan untuk Kelas 5 Sekolah Dasar. Jurnal Penelitian, 20(2).
Azty, A. (2020). Analisis kualitas butir soal pendidikan agama islam berbasis Higher Order
Thinking Skills (HOTS) Kelas V SD Budi Mulia Medan TP 2019/2020 (Doctoral
dissertation, Universitas Islam Negeri Sumatera Utara).
Dewi, S. (2021). Kualitas Butir Soal Matematika pada Ujian Sekolah SDIT Al Fatih. Faktor:
Jurnal Ilmiah Kependidikan, 8(2), 213-222.
Magdalena, I., Fauziah, S. N., Faziah, S. N., & Nupus, F. S. (2021). Analisis Validitas,
Reliabilitas, Tingkat Kesulitan dan Daya Beda Butir Soal Ujian Akhir Semester Tema
7 Kelas III SDN Karet 1 Sepatan. BINTANG, 3(2), 198-214.
Sriyanto, A. (2019). Teknik Pengolahan Hasil Asesmen Penentuan Standar Asesmen, Teknik
Pengolahan dengan Menggunakan Pendekatan Acuan Patokan (PAP) dan Acuan
Norma (PAN). Al-Lubab: Jurnal Penelitian Pendidikan dan Keagamaan Islam, 5(2),
224-240.
20