Makalah MUTU DAN KUALITAS INSTRUMEN PENILAIAN

Tugas Kelompok Dosen Pengampu
Pengembangan Hasil Belajar Nadiyah, S.pd.I, M.pd
MUTU DAN KUALITAS INSTRUMEN PENILAIAN
Dibuat Oleh :
Anisa Rumaida 19.01.11.1434

Renita Amanda Putri 19.01.11.1488
Nafisah 19.01.11.1476
Noor Jannah 19.01.11.1481
SEKOLAH TINGGI AGAMA ISLAM

PROGRAM STUDI PENDIDIKAN ISLAM
BANJARBARU 2021
KATA PENGANTAR
Syukur Alhamdulillah senantiasa saya panjatkan kehadirat Allah SWT yang telah
melimpahkan rahmat dan karunia-Nya, sehingga kami dapat menyelesaikan makalah ini guna
memenuhi tugas mata kuliah Pengembangan Hasil Belajar , dengan judul : “MUTU DAN
KUALITAS INSTRUEN PENILAIAN”
Saya menyadari bahwa dalam penulisan makalah ini tidak terlepas dari bantuan
banyak pihak yang tulus memberikan doa, dan semangat sehingga makalah ini dapat
terselesaikan.
Saya menyadari masih banyak kekurangan dalam penyusunan makalah ini, untuk itu
penulis mengharapkan saran dan masukan untuk perbaikan. Semoga makalah ini dapat
bermanfaat bagi penulis maupun para pembaca.
Banjarbaru, 14 Desember 2021
i
DAFTAR ISI
KATA PENGANTAR...........................................................................................................i
DAFTAR ISI..........................................................................................................................ii
BAB I.....................................................................................................................................1
PENDAHULUAN.................................................................................................................1
1.1 Latar Belakang.................................................................................................................1
1.2 Rumusan Masalah............................................................................................................2
1.3 Tujuan..............................................................2
BAB II....................................................................................................................................3
PEMBAHASAN....................................................................................................................3
2.1 Standar Penilaian Pendidikan..........................................................................................3
2.2 Persyaratan Instrumen Evaluasi.......................................................................................4
2.3 Pengembangan Instrumen Pembelajaran.........................................................................6
2.4 Kepraktisan Suatu Mutu dan Instrumen Kualitas Pembelajaran.....................................7
2.5 Penjaminan Mutu Penilaian Pendidikan..........................................................................8
BAB III..................................................................................................................................10
PENUTUP..............................................................................................................................10
3.1 KESIMPULAN................................................................................................................10
DAFTAR PUSTAKA............................................................................................................11
ii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kegiatan penilaian dalam sebuah lembaga pendidikan merupakan satu rutinitas yang
dilakukan dalam rangka untuk mengetahui perkembangan peserta didik dalam memahami, m
ensikapi dan melaksankan nilai yang harus diejawantahkan dalam kehidupan sehari-hari. Pen
ilaian akan memberikan informasi atas peserta didik dalam menindaklanjuti materi yang telah
diberikan juga akan memberikan informasi ketercapain tujuan pembelajaran. Dua hal ini sang
at penting dalam dunia pendidikan untuk bisa terdeteksi sebagai masukan dalam kegiatan pe
mbelajaran berikutnya agar lebih baik dan bermutu sehingga bisa menghasilkan lulusan yang
berkualitas.
Standar Penilaian Pendidikan adalah kriteria mengenai mekanisme, prosedur, dan inst
rumen penilaian hasil belajar peserta didik. Standar penilaian oleh pendidik menurut BSNP m
encakup standar umum, standar perencanaan, standar pelaksanaan, standar pengolahan dan pe
laporan hasil penilaian serta standar pemanfaatan hasil penilaian. Masing-masing standar ini
memiliki prinsip-prinsip dan kriteria yang ditetapkan oleh BSNP. Sementara itu, penilaian ha
sil belajar yang dilakukan oleh satuan pendidikan memiliki dua standar pokok yang harus dip
erhatikan, yaitu: standar penentuan kenaikan kelas dan standar penentian kelulusan.
Penilaian dalam penyelenggaraan pendidikan mempunyai peranan yang sangat pentin

g sehingga harus mendapatkan perhatian yang serius. Karenanya penilaian merupakan serang
kaian aktivitas untuk mengetahui keberhasilan proses pembelajaran, baik keberhasilan siswa
(prestasi belajar) dan keberhasilan guru mengajar maupun keberhasilan proses pembelajaran.
Instrumen merupakan alat yang akan digunakan dalam kegiatan penilaian agar sampai pada h
akikat penilaian dilakukan. Proses instrumen untuk mempu mengungkap semua itu perlu disi
apkan sebagai sebuah alat ukur yang memiliki daya ukur yang tepat. Instrumen yang memilik
i tingkat validitas yang tinggi dan reliabilitas yang handal akan menghantarkan kita mencapai
kegiatan penilaian mencapai apa yang diinginkan.
1
1.2 Rumusan Masalah
Bagaimana Mutu Dan Kualitas Instrumen Penilaian ?
1.3 Tujuan
Mengetahui kendala guru dalam proses penyusunan instrumen penilaian hasil belajar
Mengetahui proses penyusunan instrumen penilaian hasil belajar
Mengetahui implikasi uji kualitas instrumen penilaian
2
BAB II
PEMBAHASAN
1. Pengertian Validitas Instrumen
Suatu instrumen dikatakan valid bila instrumen terebut dapat dengan tepat mengukur
apa yang hendak di ukur. Sehingga dapat dikatakan bahwa validitas berhubungan dengan
“ketepatan” dengan alat ukur. Dengan istrumen yang valid akan menghasilkan data yang
valid pula. Istilah valid sukar untuk dicari penggantinya, sebagian peneliti ada yang
menyebutknya dengan “sahih”, “tepat”, dan juga “cermat”.
Secara garis besar validitas instrumen dibedakan menjadi dua yaitu, validitas internal
(internal validity) dan validitas eksternal (eksternal validity).
1. Validitas Internal (Internal Validity)
Validitas internal berkaitan dengan kriteria yang berasal dari dalam suatu instrumen
penelitian, seperti tampilan instrumen, isi dan juga kemampuan instrumen dalam mengukur.
Validitas internal disebut juga dengan Validitas Rasional, yang berarti validitas untuk sebuah
instrumen penelitian menunjuk pada kondisi yang memenuhi syarat valid berdasarkan pada
hasil penalaran atau rasionalitas. Instrumen dikatakan mempunyai validitas Internal bila
instrumen tersebut kriteria yang ada dalam instrumen secara rasional telah mencerminkan apa
yanga diukur. Validitas internal dibagi menjadi dua, yaitu validitas isi (Content Validity) dan
Validitas Konstruk (Construct Validity).
a. Validitas isi (Content Validity)
Validitas ini harus dimiliki oleh instrumen yang mengukur hasil belajar biasanya berbentuk
tes. Sebuah tes dikatakan memiliki validitas isi bila bisa mengukur kompetensi yang
dikembangkan beserta indikator dan materi pembelajarannya. Untuk menguji validitasnya
dapat dilakukan dengan cara membandingkan instrumen penelitian yang dibuat dengan
materi pelajaran yang telah dipelajari. Dalam mengembangkan instrumen tes dapat memakai
spesifikasi domain isi tes, yang menjelaskan isi secara rinci dengan spesifikasi cakupan isi
dan tipe butir soal. Validitas ini berkaitan dengan pertanyaan ” sejauh mana butir tes
mencakup keseluruhan indikator kompetensi yang dikembangkan dan materi atau bahan yang
ingin diukur.
3
b. Valitias Konstruk (Construct Validity)
Validitas konstruk mengacu pada sejauh mana suatu instrumen penelitian mengukur konsep
dari suatu teori, yaitu yang menjadi dasar penyusunan instrumen. Definisi atau konsep yang
diukur berasal dari teori yang dipakai dalam penelitian itu sendiri. Sehingga harus ada
pembahasan mengenai teori tentang variabel yang akan diukur yang menjadi dasar penentuan
konstruk suatu instrumen. Berdasarkan teori tentang variabel tersebut baru kemudian
dirumuskan konseptual dan definisi operasional, yang selanjutnya ditentukan indikator yang
akan diukur.
Suatu instruemn dikatakan mempunyai validitas konstruk bila terdapat keterkaitan antara
butir instrumen dengan indikator, definisi operaional dan konsep teori tentang variabel
peneltian yang diukur. Untuk menguji validitas konstruk bisa menggunakan pendapat para
ahli (expert judgment). Para ahli akan memberikan keputusan apakah instrumen tersebut bisa
sipakai tanpa perbaikan, ada perbaikan, dan mungkin dirombak total. Menurut Sugono
(2007:177) jumlah tenaga ahli yang dibutuhkan minimal tiga orang dan biasanya mereka
telah bergelar doktor sesuai dengan ruang lingkup yang diteliti.
2. Validitas Eksternal
Validitas Eksternal (esternal validity) dikenal juga validitas empiris (empiricial validity).
Pada validitas eksternal berdasarkan pada kriteria yang ada dari luar isntrumen yaitu
berdasarkan pada fakta empiris atau pengalaman. Kriterian yang dipakai sebagai pembanding
instrumen yaitu sesuatu yang sudah tersedian dan sesuatu yang masih belum tersedia akan
tetapi terjadi diwaktu yang akan datang. Instrumen yang sesuai dengan kriteria yang sudah
(predictive validity). ada dikenal dengan validitas kesejajaran (concurrent validity), sedangan
instrumen yang sesuai dengan kriteria yang diprediksi akan terjadi disebut dengan valditas
prediksi
a. Validitas Kesejajaran (concurrent validity)
Suatu instrumen dikatakan mempunyai validitas kesejajaran bisa hasilnya sesuai dengan
kriteria yang sudah ada, yang mana mempunyai kesejajaran dengan kriteria yang sudah ada.
Kriteria yang sudah ada dapat berupa instrumen lain yang mengukur hal yang sama dan
sudah diakui validitasnya, misalnya berupa tes terstandar. Akan tetapi juga dapat
3
dibandingkan dengan catatan-catatan yang ada di lapangan. Validitas ini dapat digunakan
untuk mengukur validitas instrumen bentuk tes maupun non tes.
b. Validitas Prediksi (predictive validity)
Suatu instrumen diaktakan memiliki validitas prediksi bila instrumen penelitian tersebut
memiliki kemampuan untuk memprediksi atau meramalkan apa yang akan terjadi pada masa
yang akan datang mengenai hal yang sama. Misalnya tes masuk perguruan tinggi, tes tersebut
diperkirakan mampu meramalkan keberhasilan calonmahasiswa dalam mengikuti kuliah di
masa yang akan datang. Calon yang lolos diperkirakan akan mampu perkuliahan di masa
yang akan datang dan begitu juga sebaliknya.
Validitas ini umumnya digunakan untuk menguji validitas dari suatu instrumen dalam bentuk
tes. Sebagai alat pembanding validitas prediksi adalah nilai yang diperoleh setelah peserta tes
mengikuti perkuliahan di perguruan tinggi. Apabila ternyata siapa yang mempunyai nilai tes
yang lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dulu nilai tesnya
rendah maka instrumen tersebut tidak mempunyai validitas prediksi. Pengujaian valditas
prediksi membutuhkan waktu yang lama dan biaya yang besar karena prosedurnya yang
cukup panjang dan berulang agar mendapat tes dengan kemampuan prediktor yang baik.
2. Pengertian Reliabilitas Instrumen
Kata reliabilitas dalam Bahasa Indonesia berasal dari Bahasa Inggris yaitu reliability, yang
mana asalnya dari kata reliable yang mempunyai arti dapat dipercaya. Suatu instrumen tes
dikatakan dapat dipercaya (reliable) bila memberikan hasil yang tetap atau ajeg (konsisten)
bila diteskan berkali-kali. Misalnya suatu tes yang sama diberikan kepada siswa dalam satu
kelas pada waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan
(rangking) yang sama atau ajeg dalam satu kelas tersebut.
Ajeg atau tetap tidak harus skornya selalu sama, skor yang diperoleh dapat berubah akan
tetapi urutan dalam kelompoklah yang sama. Jika dikaitkan dengan validitas maka validitas
berhubungan dengan ketepatan sedangkan reliabilitas berkaitan dengan ketepatan atau
keajegan. Banyak sekali istilah yang menuju pada reliabilitas, misalnya sperti konsistensi,
keajegan, ketetapan, kestabilan dan juga keandalan. Intrumen yang reliabel belum tentu valid.
Contohnya mistar yang patah diujungnya, bila dipakai berulang akan selalu menghasilkan
data yang sama (reliabel) akan tetapi selalu saja tidak valid. Reliabilitasisntrumen merupakan
3
syarat untuk pengujian validitas instrumen. Oleh karena itu meskipun instrumen yang valid
biasanya pasti reliabel, tetapi pengujian reliabilitas instrumen tetap perlu dilakukan.
Berdasarakan pada cara pengujian instrumen, makam reliabilitas instrumen dapat dibagi
menjadi dua yaitu, Reliabilitas Eksternal (External Reliability) dan Reliabilitas Internal
(Intenal Relability)
1. Reliabilitas Eksternal (External Reliability)
Reliabialitas eksternal didapatkan bila ukuran atau kriteria tingkat reliabilitasnya berada di
luar instrumen yang bersangkutan. Terdapat dua cara untuk menguji reliabilitas suatu
instrumen yaitu dengan metode bentuk paralel (equivalent method) dan metode tes berulang
(test-retest method)
a. Metode bentuk paralel (equivalent method)
Metode ini dilakukan dengan cara menyusun dua instrumen yang hampir sama (equivalent),
selanjutnya diujicobakan padaa sekelompok responden yang sama (responden mengejadakan
dau kali) kemudian dari hasil ujicoba tersebut dikorelasikan dengan teknik korelasi product
moment. Intrumen paralel atau ekuivalen adalah dua buah instrumen yang mempunyai
kesamaan tujuan, tingkat kesulitan dan susunan, tetap butir-butir pertanyaan/pertanyaan
berbeda. Kelemahan metode ini adalah membutuhkan waktu dan biaya yang lebih karena
harus menyusun dua instrumen, dan harus tersedia waktu yang lama untuk mencobakan dua
kali tes.
b. Metode tes berulang (test-retest method)
Metode ini dilakukan dengan tujuan untuk menghindari pembuatan soal dua kali. Pada
metode ini peneliti hanya menyiapka satu perangkat instrumen, yang selanjutnya diteskan dan
dicatat. Kemudian diwaktu yang berbeda perangkat tersebut diteskan kembali terhadap semua
responden yang sama dan hasilnya dicacat. Kedua hasil tersebut kemudia diuji menggunakan
korelasi yang sama dengn metode paralel.
Metode ini sebenarnya memiliki kelemahan yang berkaitan dengan kemungkinan responden
yang masih ingat butir-butir soal pada tes yang pertama, sehingga dapat berpengaruh pada
hasil tes yang kedua. Waktu jeda antar tes menjadi masalah yang tersendiri , karena bila
waktu terlalu dekat ditakutkan masih banyak responden yang ingat soalnya, namun bila
3
terlalu lama kemungkinan kondisi responden sudah berbuah misalnya responden telah belajar
lagi.
2. Reliabilitas internal (Internal Reliability)
Reliabilitas jenis ini diperoleh dari menganalisis data dari satu kali pengumpulan data.
Berdasarkan pada sistem pemberian skor (scoring system) instumen, ada dua metode analisis
internal yaitu Instrumen Skor Diskrit dan Instrumen Skor Non Diskrit.
a. Instrumen Skor Diskrit
Merupakan intrumen yang skor jawaban/responnya hanya dua, satu dan nol,dengan
kata lain benar dan salah. Untuk Instrumen skor diskrit tingkat reliabitiasnya dapat
dicari dengan menggunakan metode berikut, metode belah dua (split-hallf metode);
metode Flanagan; rumus Rulon; rumus K-R 20; rumus K-R 21; dan rumus Hoyt.
b. Instrumen Skor Non Diskrit.

Merupaka instrumen pengukuran yang dalam sistem skoringnya bukan satu dan nol,
tetapi bersifat gradual, yaitu ada penjelasan skor mulai dari skor tertinggi samoai skor
terendah. Hal ini umumnya terdapat pada tes bentuk uraian dan pilihan ganda, dan
instrumen non tes bentuk angket dengan skal Likert dan skala lajuan (ratting scale).
Interval skor dapat mulai dari 1 sampai 4; 1 sampai 5; dan sebagainya. Untuk
instrumen skor non diskrit dapat dianalisi menggunakan rumus Alpha.
3. Standar Penilaian Pendidikan
Penilaian pendidikan merupakan proses pengumpulan dan pengolahan informasi untu

k mengukur pencapaian hasil belajar peserta didik mencakup: penilaian otentik, penilaian diri
penilaian berbasis portofolio, ulangan, ulangan harian, ulangan tengah semester, ulangan akh
ir semester, ujian tingkat kompetensi, ujian mutu tingkat kompetensi, ujian nasional, dan ujia
n sekolah/madrasah.
Dalam Permendikbud Nomor 66 Tahun 2013 tentang Standar Penilaian Pendidikan di

sebutkan bahwa penilaian hasil belajar peserta didik pada jenjang pendidikan dasar dan mene
ngah didasarkan pada prinsip-prinsip sebagai berikut :
 Objektif, berarti penilaian berbasis pada standardan tidak dipengaruhi faktor s

ubjektivitas penilai.
3
 Terpadu, berarti penilaian oleh pendidik dilakukan secara terencana, menyatu
dengan kegiatan pembelajaran, dan berkesinambungan.
 Ekonomis, berarti penilaian yang efisien dan efektif dalam perencanaan, pelak
sanaan, dan pelaporannya.
 Transparan, berarti prosedur penilaian, kriteria penilaian, dan dasar pengambil
an keputusan dapat diakses oleh semua pihak.
 Akuntabel, berarti penilaian dapat dipertanggungjawabkan kepada pihak intern
al sekolah maupun eksternal untuk aspek teknik, prosedur, dan hasilnya.
 Edukatif, berarti mendidik dan memotivasi peserta didik dan guru. Jika diband
ingkan dengan prinsip-prinsip penilaian hasil belajar
Di atas dengan prinsip-prinsip umum yang ditetapkan oleh Badan Standar Nasional P
endidikan, maka nampak prinsip-prinsip di atas lebih ringkas dari pada yang ditetapkan oleh
BNSP.1 Demikian pula secara substansi tidak ditemukan perbedaan yang cukup mencolok an
tara prinsip penilaian yang ada dalam Permendikbud No. 66 tentang Standar Penilaian Pendid
ikan dengan yang ditetapkan oleh BNSP.
BSNP juga menegaskan bahwa dalam proses penilaian perlu pula diperhatikan prinsi
p-prinsip khusus sebagi berikut:
3
 Penilaian ditujukan untuk mengukur pencapaian kompetensi.
 Penilaian menggunakan acuan kriteria, yaitu keputusan yang diambil berdasar
kan apa yang seharusnya dapat dilakukan oleh peserta didik setelah mengikuti
proses pembelajaran.
 Penilaian dilakukan secara keseluruhan dan berkelanjutan.
 Hasil penilaian digunakan untuk menentukan tindak lanjut.
 Penilaian harus sesuai dengan pengalaman belajar yang ditempuh dengan pros
es pembelajaran.
4. Penilaian Acuan Norma (PAN)

PAN adalah penilaian yang membandingkan hasil belajar siswa dengan
terhadap hasil dalam kelompoknya. Pendekatan ini dapat dikatakan sebagai
pendekatan “apa adanya”, dalam arti bahwa patokan pembanding semata-mata
diambil dari kenyataan-kenyataan yang diperoleh pada saat pengukuran itu
berlangsung. Menurut Eko Putro Widoyoko dalam bukunya “penilaian hasil
pembelajaran di sekolah”, menjelaskan bahwa PAN merupakan penilaian yang
dalam menginterpretasikan hasil pengukuran dengan cara membandingkan hasil
belajar siswa dengan hasil elajar siswa lain dalam kelompoknya. Hasil tes seorang
siswa dibandingkan dengan siswa lain dalam kelompoknya, sehingga dapat
diketahui posisi seorang siswa dalam kelompoknya. Artinya, penentuan skor
mengacu pada perolehan skor dikelompoknya itu sebagai patokan.
Skor penilaian acuan norma disebut dengan “skor persentil”. Kedudukan

siswa dalam kelompok bersifat relatif karena patokan (standar) dalam
penilaiannya juga bersifat relatif yaitu rerata skor kelompok. Ujiian dengan soal
yang sama bisa menghasilkan rerata skor yang berbeda-beda untuk kelas yang
berbeda, sehingga standar penilaiannya juga berbeda. Skor dalam penilaian acuan
norma tingkat menunjukan tingkat penguasaan ketrampilan maupun pengetahuan
yang dinilai.
Pendekatan penilaian acuan norma disebut juga dengan “pendekatan

faktual” atau apa adanya. Dengan kata lain standar penilaiannya bersifat
faktual, yaitu fakta yang diperoleh kelompok siswa yang dinilai. Penilaian ini
9
sama sekali tidak dikaitkan dengan ukuran-ukuran atau patokan-patokan yang
terletak diluar hasil-hasil pengukuran sekelompok siswa.
2. Penilaian Acuan Patokan (PAP)
PAP pada dasarnya berarti penilaian yang membandingkan hasil belajar

siswa terhadap suatu patokan yang telah ditetapkan sebelumnya. Pengertian ini
menunjukan bahwa sebelum usaha penilaian dilakukan terlebih dahulu harus
ditetapkan patokan yang akan di pakai untuk membandingkan angka-angka hasil
pengukuran agar hasil itu mempunyai arti tertentu. Dengan demikian patokan ini
tidak di cari ditempat lain dan pula tidak dicari di dalam kelompok hasil
pengukuran sebagaimana dilakukan pada PAN.
Penilaian acuan patokan merupakan penilaian yang dalam menafsirkan

atau menginterpretasikan skor hasil pengukuran menggunakan patokan (standar)
yang tetap. Patokan dalam penilaian acuan kriteria menggunakan skor ideal.
Pendekatan penilaian acuan patokan disebut juga dengan “pendekatan
ideal” yaitu idealnya siswa mampu menjawab dengan benar semua soal maupun
menunjukan penguasaan semua keterampilan yang diujikan.
Melalui penilaian acuan kriteria dapat diketahui apakah siwa telah

menguasai atau tidak menguasai keterampilan atau pengetahuan yang dinilai.
Interpretasi mnguasai atau tidak menguasai merupakan interpretasi mutlak skor
tes siswa. Hasil penilaian acuan patokan akan menggambarkan kemampuan siswa
dalam menguasai pengetahuan maupun keterampilan yang diujikan.
9
3. KKM ( Kriteria Ketuntasan Minimal )
Istilah kriteria dalam penilaian sering juga disebut sebagai tolak ukur
atau standar. Kriteria, tolak ukur, standar adalah sesuatu yang digunakan
sebagai patokan atau batas minimal untuk sesuatu yang diukur.[10] Dalam
peraturan menteri pendidikan naisonal republik indonesia nomor 2 tahun 2007
tentang standar epnilaian pendidikan bab F tentang penilaian oleh satuan
pendidikan pasal 1 disebutkan, bahwa dalam menentukan KKM setiap mata
pelajaran adalah dengan memerhatikan karakteristik siswa, karakteristik mata
pelajaran, dan kondisi satuan pendidikan melalui rapat dewan pendidik.
Menurut Hamzah B. Uno mengatakan bahwa sudut pandang yang

digunakan dalam penetapan KKM adalah tingkat kemampuan akademis peserta
didik, kompleksitas indikator, dan daya dukung pndidik, serta ketersediaan
sarana dan parsarana.
Kriteria ketuntasan minimal ditetapkan oleh satuan pendidikan

berdasarkan hasil musyawarah guru mata pelajaran di satuan pendidikan atau
beberapa satuan pendidikan yang emiliki karakteristik yang hampir
sama.pertimbangan pendidik atau atau forum MGMP secara akademis menjadi
pertimbangan utama penetapan KKM. Target ketuntasan secara nasional
diharapkan mencapai minimal 75. Satuan pendidikan dapat memulai dari
kriteria ketuntasan minimal dibawah target nasional kemudian ditingkatkan
secara bertahap.
b. Fungsi KKM
Kriteria ketuntasan minima memiliki fungsi antara lain:
1) Sebagai acuan bagi pendidik dalam menilai kompetensi siswa sesuai

kompetensi dasar mata pelajaran yang di ikuti. Setiap kompetensi dasar
dapat diketahui ketercapaiannya berdasarkan KKM yang ditetapkan.
9
2) Sebagai acuan bagi siswa dalam menyiapkan diri mengikuti penilaian
mata pelajaran. Setiap kompetensi dasar dan indikator ditetapkan KKM
yang harus dicapai dan dikuasai oleh siswa.
3) Dapat digunakan sebagai bagian dari komponen dalam melakukan

evalausi program pembelajaran yang dilasnakan disekolah.
4) Merupakan kontrak pedagogik antara pendidik dengan siswa dan antara

satuan pendidikan dengan masyarakat. Keberhasilan pencapaian KKM
merupakan upaya yang harus dilakukan bersama antara pendidik, siswa,
pimpinan satuan pendidikan, dan orang tua.
5) Merupakan target satuan endidikan dlam pencapaian kompetensi tiap

mata pelajaran. Satuan pendidikan harus berupaya semaksimal mungkin
untuk melampaui KKM yang telah ditetapkan.
Validitas Instrumen penilaian hasil belajar
Menurut Suryabrata (2000), bahwa untuk mengetahui validitas isi dari sebuah
instrumen dapat digunakan validasi dari pendapat ahli (profesional judgment). Koefisien
validasi isi dapat dilakukan secara kualitatif dan kuantitatif oleh beberapa orang pakar
(Gregory, 2000 dalam Koyan, 2002). Untuk menetukan koefisien validitas isi, hasil penilaian
dari kedua pakar dimasukkan ke dalam tabulasi silang 2 X 2 yang terdiri dari kolom A, B, C,
dan D. Kolom A adalah sel yang menunjukkan ketidaksetujuan kedua penilai. Kolom B dan
C adalah sel yang menunjukkan perbedaan pandangan antara penilai pertama dan kedua
(penilai pertama setuju penilai kedua tidak setuju, atau sebaliknya). Kolom D adalah sel yang
menunjukkan persetujuan antara kedua penilai. Validitas isi adalah banyaknya butir soal pada
kolom D dibagi dengan banyaknya butir soal kolom A + B + C + D.
Setelah butir soal divalidasi oleh dua penilai, selanjutnya dianalisis dengan
menggunakan perhitungan menurut Gregory seperti pada tabel berikut.
9
Tabel Matrik Uji Gregory
Judges Judges I
Penilaian Kurang Sangat
Judges Relevan Relevan
Judges II Kurang Relevan A (- - ) B (+ -)
Sangat Relevan C (- +) D (+ +)
Dari tabel di atas dapat dicari validitas konten ( Content Validity) dengan
menggunakan rumus Gregory :
VC =
Keterangan : VC = Validitas Konten
D = Kedua Judges setuju
A. = Kedua Judges tidak setuju
B. = Judges I setuju, Judges II tidak setuju
C. = Judges I tidak setuju, Judges II setuju
Kriteria Validitas Konten :
a. 0,80 - 1,00 = Sangat tinggi
b. 0,60 - 0,79 = Tinggi
c. 0,40 - 0,59 = Sedang
d. 0,20 - 0,39 = Rendah
e. 0,00 - 0,19 = Sangat rendah
Sebagai dasar penilaian terhadap isi sebuah tes, maka berikut diuraikan kaidah
penulisan soal.
Aspek Materi
1. Soal harus sesuai dengan Indikator.
2. Pengecoh berfungsi.
3. Setiap soal harus mempunyai satu jawaban yang benar atau yang paling benar.
Aspek Konstruksi
9
1. Pokok soal harus dirumuskan secara jelas dan tegas.
2. Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang
diperlukan saja.
3. Pokok soal jangan memberi petunjuk ke arah jawaban benar.
4. Pokok soal jangan mengandung pernyataan negatif ganda.
5. Pilihan jawaban harus homogen dan logis ditinjau dari segi materi.
6. Panjang rumusan pilihan jawaban harus relatif sama.
7. Pilihan jawaban jangan mengandung pernyataan, “Semua pilihan jawaban di atas

salah”.
8. Pilihan jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan
besar kecilnya nilai angka tersebut, atau kronologis waktunya.
9. Gambar, grafik, tabel, diagram, dan sejenisnya yang terdapat pada soal harus jelas dan
berfungsi.
10. Butir soal jangan bergantung pada jawaban soal sebelumnya. Ketergantungan
pada soal sebelumnya
Aspek Bahasa
1. Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia.
2. Menggunakan bahasa yang komunikatif, sehingga mudah dimengerti.
3. Jangan menggunakan bahasa yang berlaku setempat.
4. Pilihan jawaban jangan mengulang kata atau frase yang bukan merupakan satu
kesatuan pengertian.
Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat
dicapai. Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber
kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin bahwa
validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat membuktikannya secara
empiris dengan langsung.
Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu
alat ukur menghasilkan ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak
ada alat ukur yang dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh
9
karena itu, pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh
keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa.
Itulah yang ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi
sebenarnya kita tidak bertujuan untuk melakukan validasi alat ukur akan tetapi melakukan
validasi terhadap interpretasi data yang diperoleh oleh prosedur tertentu.
Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat
ukur akan tetapi hendaklah selalu kita pahami bahwa sebenarnya validitas menyangkut
masalah hasil ukur bukan masalah alat ukurnya sendiri. Sebutan validitas alat ukur hendaklah
diartikan sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur tersebut.
Atas alasan tersebut di atas, maka uji validitas perlu dilakukan dengan uji coba
langsung kepada testee. Setelah uji empiric dilakukan, maka hasilnya dilakukan analisis butir
meliputi uji validitas.
Validitas butir dicari dengan mengkorelasikan skor butir dengan skor total. Rumus
yang digunakan adalah korelasi produk moment dengan rumus :

Keterangan :
X = Skor butir
Y = Skor total
N = banyaknya responden (Arikunto, 2001:72)
Kriteria yang digunakan adalah dengan membandingkan harga r xy dengan harga tabel
kritik r product moment, dengan ketentuan rxy dikatakan valid apabila rxy › rtabel pada ts = 0,05.
Namun dalam analisi menggunakan program microsoft excel telah tersedia fungsi korelasi.
Sehingga dalam uji ini digunakan rumus korelasi pada program microsoft excel.
9
Reliabilitas instrument penilaian hasil belajar
Suatu alat ukur dikatakan reliabel jika alat ukur tersebut menunjukkan sejauh mana hasil
pengukuran dengan alat tersebut dapat dipercaya. Hal ini ditunjukkan oleh taraf keajegan
(konsistensi) skor yang diperoleh oleh para subjek yang diukur dengan alat yang sama, atau
diukur dengan alat yang setara pada kondisi yang berbeda. Dalam artinya yang paling luas,
realiabilitas alat ukur menunjuk kepada sejauh mana perbedaan-perbedaan skor perolehan itu
mencerminkan perbedaan-perbedaan atribut yang sebenarnya.
Reliabilitas alat ukur yang juga menunjukkan derajat kekeliruan pengukuran tak dapat
ditentukan dengan pasti, malainkan hanya dapat diestimasi. Ada tiga pendekatan dalam
mengestimasi relibilitas alat ukur itu, yaitu:
1. Pendekatan tes ulang / Test-Retest Method: Suatu perangkat tes diberikan kepada
sekelompok subjek 2x, dengan selang waktu tertentu, misalkan 2 minggu. Reliabilitas tes
dicari dengan menghitung korelasi antara skor pada testing 1 dan skor pada testing 2.
Pendekatan ini secara teori baik, namun didalam praktek mengandung kelemahan, yaitu
bahwa kondisi subjek pada testing 2 tidak lagi sama dengan kondisi subjek pada testing 1,
karena terjadinya proses belajar, pengalaman, perubahan motivasi, dll. Oleh karena itu
pendekatan ini sudah sangat jarang dipakai. Pendekatan ini sangat sesuai kalau yang
dijadikan objek pengukuran adalah ketrampilan, terutama ketrampilan fisik.
2. Pendekatan dengan tes paralel / Parallel Form Method: Dua perangkat tes yang
paralel, misalnya perangkat A dan B diberikan kepada sekelompok subjek. Reliabilitas tes
dicari dengan menghitung korelasi antara skor pada perangkat A dan skor pada perangkat B.
Keterbatasan utama pendekatan ini terletak pada sulitnya menyusun 2 perangkat tes yang
paralel. Pendekatan inipun sudah jarang digunakan.
3. Pendekatan pengukuran satu kali / Single Trial Method: Seperangkat tes diberikan
kepada sekelompok subjek satu kali, lalu dengan cara tertentu dihitung estimasi reliabilitas
tes tersebut. Pendekatan pengukuran satu kali ini menghasilkan informasi mengenai keajegan
(konsistensi) internal alat ukur. Pendekatan pengukuran satu kali ini dapat menghindarkan
diri dari kesulitan yang timbul dari pendekatan dengan pengukuran ulang maupun pendekatan
tes paralel, oleh karena itu pendekatan ini banyak digunakan. Yang menggunakan pendekatan
pengukuran satu kali:
9
1. Spearman-Brown: Jumlah butir dibelah menjadi 2 dan dicari nilai rxx-nya.
Jumlah butir dapat dibelah kiri dan kanan, angka ganjil dan genap maupun dengan
cara random / acak. Bila nilai rxx-nya > 0.8 maka dianggap reliabel.
2. Rulon: Menghitung dengan melihat selisih belahan satu dengan belahan

yang lain, bukan dilihat dari belahannya. Bila nilai rxx-nya > 0.8 maka dianggap
reliabel.
3. Alpha Cronbach: Alpha membagi jumlah butir dengan berapapun asal sama
rata, tidak seperti Spearman-Brown dan Rulon yang tidak dapat membagi dua
angka ganjil menjadi sama rata seperti misalnya angka 15, Alpha bisa membagi
menjadi: 5, 5 dan 5. Bila nilai Alpha-nya > 0.8 maka dianggap reliabel.
4. Anava Hoyt: Membagi jumlah butir sebesar jumlah butirnya, jadi dapat
dibagi berapapun, tidak seperti Alpha yang tidak dapat membagi jumlah butir
yang nilainya imajiner, misalnya 19. Tapi Alpha akhirnya mengeluarkan rumus
baru yang dapat membagi jumlah butir sebesar jumlah butirnya juga. Dan Anava
Hoyt dan Alpha yang paling banyak digunakan dalam perhitungan reliabilitas
sampai saat ini. Bila nilai rtt-nya > 0.8 maka dianggap reliabel.
5. KR20: Kuder Richardson mengeluarkan rumus perbaikan tetapi KR20 juga

jarang dipakai karena KR20 hanya dapat digunakan pada data dikotomi (pilihan
ya dan tidak / 0 dan 1) tidak seperti diatas, yang bisa menghitung data dikotomi
dan kontinu. Bila nilai KR20-nya > 0.8 maka dianggap reliabel.
Tapi ada pendapat lain yang mengatakan bahwa suatu suatu alat tes bukan dilihat dari
rtt-nya tapi dilihat dari seberapa besar penyimpangan dari alat ukur tersebut (Standart Error
Measurement / SEM / SE). Semakin kecil nilai penyimpangannya maka alat ukur tersebut
semakin baik.
Dengan adanya kemajuan teknologi dan adanya program-program komputer yang

menangani tentang statistik, kita tidak perlu lagi menghitung secara manual, kita bisa
menggunakan program SPSS atau menggunakan program SPS.
Reliabilitas menyangkut derajat konsistensi atau kesepakatan antara dua perangkat

skor yang diturunkan secara indipenden sehingga dapat diungkap dengan istilah koefisien
korelasi. Dalam uji empiric ini digunakan koefisien alfa hasil penurunan rumus yang
dilakukan oleh Cronbach yakni
9
(Anastasi dan Urbina, 2006:110)
Dimana :
rtt adalah koefisien reliabilitas seluruh tes
n adalah jumlah soal dalam tes
adalah varian skor-skor total pada tes
adalah varian skor tes ke i
Cara Menentukan PAN :
Skor penilaian acuan norma disebut dengan “skor persentil”. Kedudukan

siswa dalam kelompok bersifat relatif karena patokan (standar) dalam
penilaiannya juga bersifat relatif yaitu rerata skor kelompok. Ujiian dengan soal
yang sama bisa menghasilkan rerata skor yang berbeda-beda untuk kelas yang
berbeda, sehingga standar penilaiannya juga berbeda. Skor dalam penilaian acuan
norma tingkat menunjukan tingkat penguasaan ketrampilan maupun pengetahuan
yang dinilai.
Pendekatan penilaian acuan norma disebut juga dengan “pendekatan

faktual” atau apa adanya. Dengan kata lain standar penilaiannya bersifat faktual,
yaitu fakta yang diperoleh kelompok siswa yang dinilai. Penilaian ini sama sekali
tidak dikaitkan dengan ukuran-ukuran atau patokan-patokan yang terletak diluar
hasil-hasil pengukuran sekelompok siswa.[5] Misalnya, pada saat ulangan akhir
semester mata pelajaran IPA kelas V diujikan 50 butir soal dan hasil penskoran
untuk 10 siswa dikelas tersebut adalah sebagai berikut:
Hasil UAS Mapel IPA
No
Nama Skor
.
1 Putri anggita 35
2 Lina 34
3 Bambang 32
4 Diar 30
5 Andi 29
9
6 Belinda 27
7 Ani puspa 24
8 Ahmidati 21
9 Emy 20
10 Imam 17
Skor-skor dalam tabel di atas merupakan skor faktual, yaitu skor yang
nyata-nyata diperoleh siswa. Berdasarkan tabel di atas dapat diketahui bahwa skor
tertinggi secara faktual adalah 35 dan skor terendah adalah 17. Jika menggunakan
penilaian acuan norma (PAN) maka peserta ujian yang mendapat skor tertinggi
(35) akan mendapat skor/nilai akhir tertinggi misalnya, 4, 5, 10, atau 100,
tergantung skala penilaian yang digunakan. Pemberian skor didasarkan pada
kenyataan (fakta) pencapaian hasil belajar kelompoknya.
Untuk mengubah skor mentah menjadi skor akhir dapat dihitung dengan
rumus berikut:
Keterangan:
SA = Skor Akhir Peserta Tes
PS = Perolehan Skor
ST = Skor Tertinggi Faktual
SP = Skala Penilaian
Berdasarkan rumus tersebut dapat ditentukan nilai atau skor akhir

menggunakan skala 10 dan 5 adalah sebagai berikut:
1. Putri, skala 10 = x 10 = 10
Skala 5 = x 5 = 5
2. Diar, skala 10 = x 10 = 8,6
9
Skala 5 = x 5 = 4,3
Dengan cara yang sama dapat dihitung skor akhir siswa yang lain. Secara
lengkap perolehan skor akhir siswa dalam skala 10 da skala 5 adalah.
Konversi Skor Mentah Menjadi Skor Akhir Dengan PAN
Skor Skor akhir

No. Nama siswa
mentah Skala 10 Skala 5
1 Putri anggita 35 10,0 5,0
2 Lina 34 9,7 4,9
3 Bambang 32 9,1 4,6
4 Diar 30 8,6 4,3
5 Andi 29 8,3 4,1
6 Belinda 27 7,7 3,9
7 Ani puspa 24 6,9 3,4
8 Ahmidati 21 6,0 3,0
9 Emy 20 5,7 2,9
10 Imam 17 4,9 2,4
Penilaian acuan norma berasumsi bahwa kemampuan orang itu berbeda-

beda dan dapat digambarkan menurut distribusi normal. Patokan itu dapat
berubah-ubah dari kurva normal ke kurva normal yang lain. Jika hasil ujian siswa
dalam satu kelompok umumnya lebih baik dan menghasilkan angka rata-rata yang
lebh tinggi, maka patokan menjadi bergeser ke atas (dinaikan). Dengan demikian
angka yang sama pada kurva yang berbeda akan mempunyai arti berbeda.[6]
Penilaian acuan norma memiliki kelebihan dan kekurangan. Kelebihannya

adalah penentuan skor dilakukan tanpa memandang tingkat kesulitan butir tes
secara teliti. Sedangkan kekurannya adalah:
a. Dianggap kurang adil, karena bagi siswa yang berada dikelas yang
memiliki skor yang tinggi, harus berusaha lebih tinggi utnuk mendapat nilai
amat baik atau baik.
b. Membuat terjadinya persaingan yang kurang sehat diantara para siswa,

karena pada saat seorang siswa mendapat nilai amat baik akan mengurangi
kesempatan siswa yang lain untuk mendapatkannya.
9
Cara Menentukan PAP :
Penilaian acuan patokan merupakan penilaian yang dalam menafsirkan

atau menginterpretasikan skor hasil pengukuran menggunakan patokan (standar)
yang tetap. Patokan dalam penilaian acuan kriteria menggunakan skor ideal.
Pendekatan penilaian acuan patokan disebut juga dengan “pendekatan
ideal” yaitu idealnya siswa mampu menjawab dengan benar semua soal maupun
menunjukan penguasaan semua keterampilan yang diujikan.
Melalui penilaian acuan kriteria dapat diketahui apakah siwa telah

menguasai atau tidak menguasai keterampilan atau pengetahuan yang dinilai.
Interpretasi mnguasai atau tidak menguasai merupakan interpretasi mutlak skor
tes siswa. Hasil penilaian acuan patokan akan menggambarkan kemampuan siswa
dalam menguasai pengetahuan maupun keterampilan yang diujikan.
Hasil UAS siswa kelas V mata pelajaran IPA sebelumnya, apabila dinilai
dengan menggunakan acuan patokan, maka dapat digunakan rumus sebagai
berikut:
Keterangan :
SA = Skor Akhir Peserta Tes
PS = Perolehan Skor
ST = Skor Tertinggi ideal
SP = Skala Penilaian
Dalam mata pelajaran tersebut skor tertinggi idealnya adalah 50. Maka
berdasarkan rumus tersebut dapat ditentukan nilai akhir dengan skala 10 dan 5
adalah sebagai berikut:
1. Putri skala 10 = x 10 = 7,0
Skala 5 = x 5 = 3,5
9
2. Diar skala 10 = x 10 = 6,0
Skala 5 = x 5 = 3,0
Secara lengkap perolehan skor akhir siswa dalam skala 10 dan skala 5
adalah sebagai berikut.
Konversi Nilai Mentah Menjadi Skor Akhir Dengan PAP
Skor akhir
No. Nama siswa Skor mentah
Skala 10 Skala 5
2 Lina 34 6,8 3,4
3 Bambang 32 6,4 3,2
4 Diar 30 6,0 3,0
5 Andi 29 5,8 2,9
6 Belinda 27 5,4 2,7
7 Ani puspa 24 4,8 2,4
8 Ahmidati 21 4,2 2,1
9 Emy 20 4,0 2,0
10 Imam 17 3,4 1,7
Berdasarkan hasil konversi tersebut dapat diinterpretasikan bahwa Putri

kemampuan penguasaan 70% mata pelajaran IPA yang diujikan, Diar memiliki
kemampuan penguasaan 60%. Perbedaan secara lengkap jika menggunakan
PAN dan PAP dalam skala 10 dapat dilihat pada tabel berikut:
Konversi Skor Dengan PAN Dan PAP
Skor Skor Skor

No. Nama siswa
mentah PAN PAP
2 Lina 34 9,7 6,8
3 Bambang 32 9,1 6,4
4 Diar 30 8,6 6,0
5 Andi 29 8,3 5,8
6 Belinda 27 7,7 5,4
7 Ani puspa 24 6,9 4,8
8 Ahmidati 21 6,0 4,2
9
9 Emy 20 5,7 4,0
10 Imam 17 4,9 3,4
Dengan demikian perbedaan pokok dalam mengoleh skor hasil ujian

antara penilaian acuan norma dengan penilaian acuan patokan terletak pada skor
pembagi terhadap skor yang diperoleh masing-masing siswa. Pada penilaian acuan
norma skor pembaginya adalah adalah skor “tertinggi faktual” yang diperoleh
oleh masing-masing kelompok. Sedangkan dalam penilaian acuan patokan skor
pembaginya adalah skor “tertinggi ideal” yang bisa di capai dengan instumen
yang digunakan.
Penilaian acuan patokan menggunakan asumsi bahwa hampir semua orang

bisa belajar apa saja namun waktunya yang berbeda. Konsekuensi penilaian acuan
patokan adalah adanya program remidi. Kelemahannya adalah skor hasil tes siswa
tergantung pada tingkat kesulitan butir-butir tes yang mereka terima. Artinya
apabila instrumen tes memiliki butir soal yang tingkat kesulitannya rendah siswa
akan memeroleh skor yang tinggi, sebaliknya apabila butir soal yang diterima
memiliki tingkat kesulitan tinggi siswa akan memeroleh skor yang rendah.
Cara Menentukan KKM
Penetapan KKM dilakukan oleh guru atau kelompok guru mata

pelajaran. Langkah penetapan KKM adalah sebagai berikut:[14]
1) Guru atau kelompok guru menetapkan KKM matapelajaran dengan

mempertimbangkan tiga aspek kriteria, yaitu kompleksitas, daya dukung,
dan intake siswa dengan skema sebagai berikut.
9

2)
Hasi
l
penetapan KKM indikator berlanjut pada KD, SK, hingga KKM mata
pelajaran.
3) Hasil penetapan KKM oleh guru atau kelompok guru mata pelajaran
disahkan oleh kepala sekolah untuk dijadikan patokan guru dalam
melakukan penilaian.
4) KKM yang ditetapkan disosialisasikan kepada pihak-pihak yang

berkepentingan, yaitu siswa, orang tua, dan dinas pendidikan.
5) KKM dicantumkan di dalam LHB (laporan hasil belajar) pada saat

hasil penilaian dilaporkan kepada orang tua/wali siswa.
Penentuan KKM
Dalam penetapan nilai ketuntasan belajar minimum dilakukan melalui
analisis ketuntasan minimum pada setiap indikator, KD, dan SK. Ketuntasan
belajar ideal untuk setiap indikator adalah 1-100%, dengan batas minimal ideal
minimum 75%. Dalam menetapkan KKM sekolah harus mempertimbangkan
kompleksitas, kemampuan rata-rata siswa, dan sumber daya dukung.[15]
1) Kompleksitas
9
Tingkat kompleksitas (kesulitan dan kerumitan) setiap indikator,
kompetensi dasar, dan standar kompetensi yang harus dicapai oleh siswa.
Kompleksitas merupakan tingkat kesulitan materi pada tiap indikator,
kompetensi dasar maupun standar kompetensi. Semakin tinggi tingkat
kompleksitas maka semakin kecil skor yang di pakai.
2) Kemampuan rata-rata siswa atau intakesiswa
Intak merupakan tingkat kemampuan rata-rata siswa. Penetapan

intak siswa SD/MI untuk kelas 2 sampai kelas 6 dapat didasarkan pada
hasil raport siswa pada kelas sebelumnya, dan yang paling lengkap adalah
daftar nilai. Sedangkan untuk kelas 1, intake siswa dapat ditentukan dengan
cara tes awal setelah siswa diterima di sekolah.
3) Daya dukung
Kemampuan sumber daya pendukung dalam penyelenggaraan

pembelajaran pada masing-masing sekolah/madrasah. Semakin tercukupi
sumber daya baik yang berupa sumber daya manusia maupun yang lainnya,
semakin tinggi tingkat kefektifan pembelajaran. semakin tinggi tingkat
ketercukupan dan kesesuaian daya dukung sekolah/madrasah maka semakin
mudah mencapai hasil belajar sehingga nilainya sangat tinggi. Semakin
rendah daya dukungnya maka semakin sulit untuk mencapai hasil belajar
yang ditetapkan sehingga rata-rata nilainya sangat rendah.
9
9
BAB III
PENUTUP
3.1 Kesimpulan
Kualitas instrumen yang baik haruslah memiliki ketetapan (valid), Ketetapan atau real
iabilitas, daya pembeda yang baik, tingkat kesukaran yang bervariasi, harus objektif, praktis,
efisian dan ekonomis .
Instrumen yang berkualitas adalah soal yang dapat memberikan informasi setepat-tepa
tnya sesuai dengan tujuannya di antaranya dapat menentukan peserta didik mana yang sudah
atau belum menguasai materi yang diajarkan guru. Kemudian untuk dipahami para guru bah
wa teknik untuk mendapatkan instrumen yang berkualitas bisa menggunakan teknik moderato
r yaitu teknik berdiskusi dengan satu orang sebagai penengah, setiap butir soal didiskusikan s
ecara bersama dengan beberapa ahli; guru yang mengajarkan materi, ahli materi, penyusun/pe
ngembang kurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi. Teknik ini sang
at baik karena setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya.
Di samping itu, para penelaah dipersilakan mengomentari/ memperbaiki berdasarkan ilmu ya
ng dimilikinya. Setiap komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap buti
r soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa.
Teknik yang lain yang bisa digunakan adalah teknik panel merupakan suatu teknik me
nelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal, y
aitu ditelaah dari segi materi, konstruksi, bahasa/budaya, kebenaran kunci jawaban/pedoman
penskorannya yang dilakukan oleh beberapa penelaah. Caranya adalah beberapa penelaah dib
erikan: butir-butir soal yang akan ditelaah, format penelaahan, dan pedoman penilaian/ penela
ahannya. Pada tahap awal para penelaah diberikan pengarahan, kemudian tahap berikutnya pa
ra penelaah berkerja sendiri-sendiri di tempat yang tidak sama. Para penelaah dipersilakan me
mperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pad
a setiap butir soalnya yang kriterianya adalah: baik, diperbaiki, atau diganti.
10
DAFTAR PUSTAKA
Eko Putro Widoyoko, Penilaian Hasil Pembelajaran di Sekolah.Yogyakrta: Pustaka

pelajar,2014.
Herman Yose Sunu Endrayanto dan Yustiana Wahyu Harumurti, Penilaian Belajar Siswa di
Sekolah, Yogyakarta, PT Kanisius, 2018
Depdiknas .(2003). Undang-Undang RI Nomor 20, Tahun 2003, tentang Sistem Pendidikan
Nasional.
11

Makalah MUTU DAN KUALITAS INSTRUMEN PENILAIAN

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah MUTU DAN KUALITAS INSTRUMEN PENILAIAN

Diunggah oleh

Hak Cipta:

Format Tersedia

Tugas Kelompok Dosen Pengampu

Pengembangan Hasil Belajar Nadiyah, S.pd.I, M.pd

MUTU DAN KUALITAS INSTRUMEN PENILAIAN

Anisa Rumaida 19.01.11.1434

SEKOLAH TINGGI AGAMA ISLAM

bermanfaat bagi penulis maupun para pembaca.

Banjarbaru, 14 Desember 2021

1.1 Latar Belakang.................................................................................................................1

1.2 Rumusan Masalah............................................................................................................2

2.1 Standar Penilaian Pendidikan..........................................................................................3

2.2 Persyaratan Instrumen Evaluasi.......................................................................................4

2.3 Pengembangan Instrumen Pembelajaran.........................................................................6

2.4 Kepraktisan Suatu Mutu dan Instrumen Kualitas Pembelajaran.....................................7

2.5 Penjaminan Mutu Penilaian Pendidikan..........................................................................8

Penilaian dalam penyelenggaraan pendidikan mempunyai peranan yang sangat pentin

1. Pengertian Validitas Instrumen

1. Validitas Internal (Internal Validity)

a. Validitas isi (Content Validity)

a. Validitas Kesejajaran (concurrent validity)

b. Validitas Prediksi (predictive validity)

2. Pengertian Reliabilitas Instrumen

1. Reliabilitas Eksternal (External Reliability)

a. Metode bentuk paralel (equivalent method)

b. Metode tes berulang (test-retest method)

2. Reliabilitas internal (Internal Reliability)

a. Instrumen Skor Diskrit

b. Instrumen Skor Non Diskrit.

3. Standar Penilaian Pendidikan

Penilaian pendidikan merupakan proses pengumpulan dan pengolahan informasi untu

Dalam Permendikbud Nomor 66 Tahun 2013 tentang Standar Penilaian Pendidikan di

 Objektif, berarti penilaian berbasis pada standardan tidak dipengaruhi faktor s

4. Penilaian Acuan Norma (PAN)

Skor penilaian acuan norma disebut dengan “skor persentil”. Kedudukan

Pendekatan penilaian acuan norma disebut juga dengan “pendekatan

2. Penilaian Acuan Patokan (PAP)

PAP pada dasarnya berarti penilaian yang membandingkan hasil belajar

Penilaian acuan patokan merupakan penilaian yang dalam menafsirkan

Melalui penilaian acuan kriteria dapat diketahui apakah siwa telah

Menurut Hamzah B. Uno mengatakan bahwa sudut pandang yang

Kriteria ketuntasan minimal ditetapkan oleh satuan pendidikan

Kriteria ketuntasan minima memiliki fungsi antara lain:

1) Sebagai acuan bagi pendidik dalam menilai kompetensi siswa sesuai

3) Dapat digunakan sebagai bagian dari komponen dalam melakukan

4) Merupakan kontrak pedagogik antara pendidik dengan siswa dan antara

5) Merupakan target satuan endidikan dlam pencapaian kompetensi tiap

Validitas Instrumen penilaian hasil belajar

Keterangan : VC = Validitas Konten

D = Kedua Judges setuju

A. = Kedua Judges tidak setuju

B. = Judges I setuju, Judges II tidak setuju

C. = Judges I tidak setuju, Judges II setuju

Kriteria Validitas Konten :

a. 0,80 - 1,00 = Sangat tinggi

e. 0,00 - 0,19 = Sangat rendah

1. Soal harus sesuai dengan Indikator.

3. Pokok soal jangan memberi petunjuk ke arah jawaban benar.

4. Pokok soal jangan mengandung pernyataan negatif ganda.

6. Panjang rumusan pilihan jawaban harus relatif sama.

7. Pilihan jawaban jangan mengandung pernyataan, “Semua pilihan jawaban di atas

2. Menggunakan bahasa yang komunikatif, sehingga mudah dimengerti.

3. Jangan menggunakan bahasa yang berlaku setempat.

X = Skor butir