Dibuat Oleh :
Syukur Alhamdulillah senantiasa saya panjatkan kehadirat Allah SWT yang telah
melimpahkan rahmat dan karunia-Nya, sehingga kami dapat menyelesaikan makalah ini guna
memenuhi tugas mata kuliah Pengembangan Hasil Belajar , dengan judul : “MUTU DAN
KUALITAS INSTRUEN PENILAIAN”
Saya menyadari bahwa dalam penulisan makalah ini tidak terlepas dari bantuan
banyak pihak yang tulus memberikan doa, dan semangat sehingga makalah ini dapat
terselesaikan.
Saya menyadari masih banyak kekurangan dalam penyusunan makalah ini, untuk itu
penulis mengharapkan saran dan masukan untuk perbaikan. Semoga makalah ini dapat
i
DAFTAR ISI
KATA PENGANTAR...........................................................................................................i
DAFTAR ISI..........................................................................................................................ii
BAB I.....................................................................................................................................1
PENDAHULUAN.................................................................................................................1
1.3 Tujuan..............................................................2
BAB II....................................................................................................................................3
PEMBAHASAN....................................................................................................................3
BAB III..................................................................................................................................10
PENUTUP..............................................................................................................................10
3.1 KESIMPULAN................................................................................................................10
DAFTAR PUSTAKA............................................................................................................11
ii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kegiatan penilaian dalam sebuah lembaga pendidikan merupakan satu rutinitas yang
dilakukan dalam rangka untuk mengetahui perkembangan peserta didik dalam memahami, m
ensikapi dan melaksankan nilai yang harus diejawantahkan dalam kehidupan sehari-hari. Pen
ilaian akan memberikan informasi atas peserta didik dalam menindaklanjuti materi yang telah
diberikan juga akan memberikan informasi ketercapain tujuan pembelajaran. Dua hal ini sang
at penting dalam dunia pendidikan untuk bisa terdeteksi sebagai masukan dalam kegiatan pe
mbelajaran berikutnya agar lebih baik dan bermutu sehingga bisa menghasilkan lulusan yang
berkualitas.
Standar Penilaian Pendidikan adalah kriteria mengenai mekanisme, prosedur, dan inst
rumen penilaian hasil belajar peserta didik. Standar penilaian oleh pendidik menurut BSNP m
encakup standar umum, standar perencanaan, standar pelaksanaan, standar pengolahan dan pe
laporan hasil penilaian serta standar pemanfaatan hasil penilaian. Masing-masing standar ini
memiliki prinsip-prinsip dan kriteria yang ditetapkan oleh BSNP. Sementara itu, penilaian ha
sil belajar yang dilakukan oleh satuan pendidikan memiliki dua standar pokok yang harus dip
erhatikan, yaitu: standar penentuan kenaikan kelas dan standar penentian kelulusan.
1
1.2 Rumusan Masalah
Bagaimana Mutu Dan Kualitas Instrumen Penilaian ?
1.3 Tujuan
Mengetahui kendala guru dalam proses penyusunan instrumen penilaian hasil belajar
Mengetahui proses penyusunan instrumen penilaian hasil belajar
Mengetahui implikasi uji kualitas instrumen penilaian
2
BAB II
PEMBAHASAN
Suatu instrumen dikatakan valid bila instrumen terebut dapat dengan tepat mengukur
apa yang hendak di ukur. Sehingga dapat dikatakan bahwa validitas berhubungan dengan
“ketepatan” dengan alat ukur. Dengan istrumen yang valid akan menghasilkan data yang
valid pula. Istilah valid sukar untuk dicari penggantinya, sebagian peneliti ada yang
menyebutknya dengan “sahih”, “tepat”, dan juga “cermat”.
Secara garis besar validitas instrumen dibedakan menjadi dua yaitu, validitas internal
(internal validity) dan validitas eksternal (eksternal validity).
Validitas internal berkaitan dengan kriteria yang berasal dari dalam suatu instrumen
penelitian, seperti tampilan instrumen, isi dan juga kemampuan instrumen dalam mengukur.
Validitas internal disebut juga dengan Validitas Rasional, yang berarti validitas untuk sebuah
instrumen penelitian menunjuk pada kondisi yang memenuhi syarat valid berdasarkan pada
hasil penalaran atau rasionalitas. Instrumen dikatakan mempunyai validitas Internal bila
instrumen tersebut kriteria yang ada dalam instrumen secara rasional telah mencerminkan apa
yanga diukur. Validitas internal dibagi menjadi dua, yaitu validitas isi (Content Validity) dan
Validitas Konstruk (Construct Validity).
Validitas ini harus dimiliki oleh instrumen yang mengukur hasil belajar biasanya berbentuk
tes. Sebuah tes dikatakan memiliki validitas isi bila bisa mengukur kompetensi yang
dikembangkan beserta indikator dan materi pembelajarannya. Untuk menguji validitasnya
dapat dilakukan dengan cara membandingkan instrumen penelitian yang dibuat dengan
materi pelajaran yang telah dipelajari. Dalam mengembangkan instrumen tes dapat memakai
spesifikasi domain isi tes, yang menjelaskan isi secara rinci dengan spesifikasi cakupan isi
dan tipe butir soal. Validitas ini berkaitan dengan pertanyaan ” sejauh mana butir tes
mencakup keseluruhan indikator kompetensi yang dikembangkan dan materi atau bahan yang
ingin diukur.
3
b. Valitias Konstruk (Construct Validity)
Validitas konstruk mengacu pada sejauh mana suatu instrumen penelitian mengukur konsep
dari suatu teori, yaitu yang menjadi dasar penyusunan instrumen. Definisi atau konsep yang
diukur berasal dari teori yang dipakai dalam penelitian itu sendiri. Sehingga harus ada
pembahasan mengenai teori tentang variabel yang akan diukur yang menjadi dasar penentuan
konstruk suatu instrumen. Berdasarkan teori tentang variabel tersebut baru kemudian
dirumuskan konseptual dan definisi operasional, yang selanjutnya ditentukan indikator yang
akan diukur.
Suatu instruemn dikatakan mempunyai validitas konstruk bila terdapat keterkaitan antara
butir instrumen dengan indikator, definisi operaional dan konsep teori tentang variabel
peneltian yang diukur. Untuk menguji validitas konstruk bisa menggunakan pendapat para
ahli (expert judgment). Para ahli akan memberikan keputusan apakah instrumen tersebut bisa
sipakai tanpa perbaikan, ada perbaikan, dan mungkin dirombak total. Menurut Sugono
(2007:177) jumlah tenaga ahli yang dibutuhkan minimal tiga orang dan biasanya mereka
telah bergelar doktor sesuai dengan ruang lingkup yang diteliti.
2. Validitas Eksternal
Validitas Eksternal (esternal validity) dikenal juga validitas empiris (empiricial validity).
Pada validitas eksternal berdasarkan pada kriteria yang ada dari luar isntrumen yaitu
berdasarkan pada fakta empiris atau pengalaman. Kriterian yang dipakai sebagai pembanding
instrumen yaitu sesuatu yang sudah tersedian dan sesuatu yang masih belum tersedia akan
tetapi terjadi diwaktu yang akan datang. Instrumen yang sesuai dengan kriteria yang sudah
(predictive validity). ada dikenal dengan validitas kesejajaran (concurrent validity), sedangan
instrumen yang sesuai dengan kriteria yang diprediksi akan terjadi disebut dengan valditas
prediksi
Suatu instrumen dikatakan mempunyai validitas kesejajaran bisa hasilnya sesuai dengan
kriteria yang sudah ada, yang mana mempunyai kesejajaran dengan kriteria yang sudah ada.
Kriteria yang sudah ada dapat berupa instrumen lain yang mengukur hal yang sama dan
sudah diakui validitasnya, misalnya berupa tes terstandar. Akan tetapi juga dapat
3
dibandingkan dengan catatan-catatan yang ada di lapangan. Validitas ini dapat digunakan
untuk mengukur validitas instrumen bentuk tes maupun non tes.
Suatu instrumen diaktakan memiliki validitas prediksi bila instrumen penelitian tersebut
memiliki kemampuan untuk memprediksi atau meramalkan apa yang akan terjadi pada masa
yang akan datang mengenai hal yang sama. Misalnya tes masuk perguruan tinggi, tes tersebut
diperkirakan mampu meramalkan keberhasilan calonmahasiswa dalam mengikuti kuliah di
masa yang akan datang. Calon yang lolos diperkirakan akan mampu perkuliahan di masa
yang akan datang dan begitu juga sebaliknya.
Validitas ini umumnya digunakan untuk menguji validitas dari suatu instrumen dalam bentuk
tes. Sebagai alat pembanding validitas prediksi adalah nilai yang diperoleh setelah peserta tes
mengikuti perkuliahan di perguruan tinggi. Apabila ternyata siapa yang mempunyai nilai tes
yang lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dulu nilai tesnya
rendah maka instrumen tersebut tidak mempunyai validitas prediksi. Pengujaian valditas
prediksi membutuhkan waktu yang lama dan biaya yang besar karena prosedurnya yang
cukup panjang dan berulang agar mendapat tes dengan kemampuan prediktor yang baik.
Kata reliabilitas dalam Bahasa Indonesia berasal dari Bahasa Inggris yaitu reliability, yang
mana asalnya dari kata reliable yang mempunyai arti dapat dipercaya. Suatu instrumen tes
dikatakan dapat dipercaya (reliable) bila memberikan hasil yang tetap atau ajeg (konsisten)
bila diteskan berkali-kali. Misalnya suatu tes yang sama diberikan kepada siswa dalam satu
kelas pada waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan
(rangking) yang sama atau ajeg dalam satu kelas tersebut.
Ajeg atau tetap tidak harus skornya selalu sama, skor yang diperoleh dapat berubah akan
tetapi urutan dalam kelompoklah yang sama. Jika dikaitkan dengan validitas maka validitas
berhubungan dengan ketepatan sedangkan reliabilitas berkaitan dengan ketepatan atau
keajegan. Banyak sekali istilah yang menuju pada reliabilitas, misalnya sperti konsistensi,
keajegan, ketetapan, kestabilan dan juga keandalan. Intrumen yang reliabel belum tentu valid.
Contohnya mistar yang patah diujungnya, bila dipakai berulang akan selalu menghasilkan
data yang sama (reliabel) akan tetapi selalu saja tidak valid. Reliabilitasisntrumen merupakan
3
syarat untuk pengujian validitas instrumen. Oleh karena itu meskipun instrumen yang valid
biasanya pasti reliabel, tetapi pengujian reliabilitas instrumen tetap perlu dilakukan.
Berdasarakan pada cara pengujian instrumen, makam reliabilitas instrumen dapat dibagi
menjadi dua yaitu, Reliabilitas Eksternal (External Reliability) dan Reliabilitas Internal
(Intenal Relability)
Reliabialitas eksternal didapatkan bila ukuran atau kriteria tingkat reliabilitasnya berada di
luar instrumen yang bersangkutan. Terdapat dua cara untuk menguji reliabilitas suatu
instrumen yaitu dengan metode bentuk paralel (equivalent method) dan metode tes berulang
(test-retest method)
Metode ini dilakukan dengan cara menyusun dua instrumen yang hampir sama (equivalent),
selanjutnya diujicobakan padaa sekelompok responden yang sama (responden mengejadakan
dau kali) kemudian dari hasil ujicoba tersebut dikorelasikan dengan teknik korelasi product
moment. Intrumen paralel atau ekuivalen adalah dua buah instrumen yang mempunyai
kesamaan tujuan, tingkat kesulitan dan susunan, tetap butir-butir pertanyaan/pertanyaan
berbeda. Kelemahan metode ini adalah membutuhkan waktu dan biaya yang lebih karena
harus menyusun dua instrumen, dan harus tersedia waktu yang lama untuk mencobakan dua
kali tes.
Metode ini dilakukan dengan tujuan untuk menghindari pembuatan soal dua kali. Pada
metode ini peneliti hanya menyiapka satu perangkat instrumen, yang selanjutnya diteskan dan
dicatat. Kemudian diwaktu yang berbeda perangkat tersebut diteskan kembali terhadap semua
responden yang sama dan hasilnya dicacat. Kedua hasil tersebut kemudia diuji menggunakan
korelasi yang sama dengn metode paralel.
Metode ini sebenarnya memiliki kelemahan yang berkaitan dengan kemungkinan responden
yang masih ingat butir-butir soal pada tes yang pertama, sehingga dapat berpengaruh pada
hasil tes yang kedua. Waktu jeda antar tes menjadi masalah yang tersendiri , karena bila
waktu terlalu dekat ditakutkan masih banyak responden yang ingat soalnya, namun bila
3
terlalu lama kemungkinan kondisi responden sudah berbuah misalnya responden telah belajar
lagi.
Reliabilitas jenis ini diperoleh dari menganalisis data dari satu kali pengumpulan data.
Berdasarkan pada sistem pemberian skor (scoring system) instumen, ada dua metode analisis
internal yaitu Instrumen Skor Diskrit dan Instrumen Skor Non Diskrit.
Merupakan intrumen yang skor jawaban/responnya hanya dua, satu dan nol,dengan
kata lain benar dan salah. Untuk Instrumen skor diskrit tingkat reliabitiasnya dapat
dicari dengan menggunakan metode berikut, metode belah dua (split-hallf metode);
metode Flanagan; rumus Rulon; rumus K-R 20; rumus K-R 21; dan rumus Hoyt.
3
Terpadu, berarti penilaian oleh pendidik dilakukan secara terencana, menyatu
dengan kegiatan pembelajaran, dan berkesinambungan.
Ekonomis, berarti penilaian yang efisien dan efektif dalam perencanaan, pelak
sanaan, dan pelaporannya.
Transparan, berarti prosedur penilaian, kriteria penilaian, dan dasar pengambil
an keputusan dapat diakses oleh semua pihak.
Akuntabel, berarti penilaian dapat dipertanggungjawabkan kepada pihak intern
al sekolah maupun eksternal untuk aspek teknik, prosedur, dan hasilnya.
Edukatif, berarti mendidik dan memotivasi peserta didik dan guru. Jika diband
ingkan dengan prinsip-prinsip penilaian hasil belajar
Di atas dengan prinsip-prinsip umum yang ditetapkan oleh Badan Standar Nasional P
endidikan, maka nampak prinsip-prinsip di atas lebih ringkas dari pada yang ditetapkan oleh
BNSP.1 Demikian pula secara substansi tidak ditemukan perbedaan yang cukup mencolok an
tara prinsip penilaian yang ada dalam Permendikbud No. 66 tentang Standar Penilaian Pendid
ikan dengan yang ditetapkan oleh BNSP.
BSNP juga menegaskan bahwa dalam proses penilaian perlu pula diperhatikan prinsi
p-prinsip khusus sebagi berikut:
3
Penilaian ditujukan untuk mengukur pencapaian kompetensi.
Penilaian menggunakan acuan kriteria, yaitu keputusan yang diambil berdasar
kan apa yang seharusnya dapat dilakukan oleh peserta didik setelah mengikuti
proses pembelajaran.
Penilaian dilakukan secara keseluruhan dan berkelanjutan.
Hasil penilaian digunakan untuk menentukan tindak lanjut.
Penilaian harus sesuai dengan pengalaman belajar yang ditempuh dengan pros
es pembelajaran.
9
sama sekali tidak dikaitkan dengan ukuran-ukuran atau patokan-patokan yang
terletak diluar hasil-hasil pengukuran sekelompok siswa.
9
3. KKM ( Kriteria Ketuntasan Minimal )
Istilah kriteria dalam penilaian sering juga disebut sebagai tolak ukur
atau standar. Kriteria, tolak ukur, standar adalah sesuatu yang digunakan
sebagai patokan atau batas minimal untuk sesuatu yang diukur.[10] Dalam
peraturan menteri pendidikan naisonal republik indonesia nomor 2 tahun 2007
tentang standar epnilaian pendidikan bab F tentang penilaian oleh satuan
pendidikan pasal 1 disebutkan, bahwa dalam menentukan KKM setiap mata
pelajaran adalah dengan memerhatikan karakteristik siswa, karakteristik mata
pelajaran, dan kondisi satuan pendidikan melalui rapat dewan pendidik.
b. Fungsi KKM
9
2) Sebagai acuan bagi siswa dalam menyiapkan diri mengikuti penilaian
mata pelajaran. Setiap kompetensi dasar dan indikator ditetapkan KKM
yang harus dicapai dan dikuasai oleh siswa.
Menurut Suryabrata (2000), bahwa untuk mengetahui validitas isi dari sebuah
instrumen dapat digunakan validasi dari pendapat ahli (profesional judgment). Koefisien
validasi isi dapat dilakukan secara kualitatif dan kuantitatif oleh beberapa orang pakar
(Gregory, 2000 dalam Koyan, 2002). Untuk menetukan koefisien validitas isi, hasil penilaian
dari kedua pakar dimasukkan ke dalam tabulasi silang 2 X 2 yang terdiri dari kolom A, B, C,
dan D. Kolom A adalah sel yang menunjukkan ketidaksetujuan kedua penilai. Kolom B dan
C adalah sel yang menunjukkan perbedaan pandangan antara penilai pertama dan kedua
(penilai pertama setuju penilai kedua tidak setuju, atau sebaliknya). Kolom D adalah sel yang
menunjukkan persetujuan antara kedua penilai. Validitas isi adalah banyaknya butir soal pada
kolom D dibagi dengan banyaknya butir soal kolom A + B + C + D.
Setelah butir soal divalidasi oleh dua penilai, selanjutnya dianalisis dengan
menggunakan perhitungan menurut Gregory seperti pada tabel berikut.
9
Tabel Matrik Uji Gregory
Judges Judges I
Penilaian Kurang Sangat
Judges Relevan Relevan
Judges II Kurang Relevan A (- - ) B (+ -)
Sangat Relevan C (- +) D (+ +)
Dari tabel di atas dapat dicari validitas konten ( Content Validity) dengan
menggunakan rumus Gregory :
VC =
b. 0,60 - 0,79 = Tinggi
c. 0,40 - 0,59 = Sedang
d. 0,20 - 0,39 = Rendah
Sebagai dasar penilaian terhadap isi sebuah tes, maka berikut diuraikan kaidah
penulisan soal.
Aspek Materi
2. Pengecoh berfungsi.
3. Setiap soal harus mempunyai satu jawaban yang benar atau yang paling benar.
Aspek Konstruksi
9
1. Pokok soal harus dirumuskan secara jelas dan tegas.
2. Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang
diperlukan saja.
5. Pilihan jawaban harus homogen dan logis ditinjau dari segi materi.
8. Pilihan jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan
besar kecilnya nilai angka tersebut, atau kronologis waktunya.
9. Gambar, grafik, tabel, diagram, dan sejenisnya yang terdapat pada soal harus jelas dan
berfungsi.
10. Butir soal jangan bergantung pada jawaban soal sebelumnya. Ketergantungan
pada soal sebelumnya
Aspek Bahasa
1. Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia.
4. Pilihan jawaban jangan mengulang kata atau frase yang bukan merupakan satu
kesatuan pengertian.
Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat
dicapai. Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber
kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin bahwa
validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat membuktikannya secara
empiris dengan langsung.
Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu
alat ukur menghasilkan ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak
ada alat ukur yang dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh
9
karena itu, pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh
keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa.
Itulah yang ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi
sebenarnya kita tidak bertujuan untuk melakukan validasi alat ukur akan tetapi melakukan
validasi terhadap interpretasi data yang diperoleh oleh prosedur tertentu.
Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat
ukur akan tetapi hendaklah selalu kita pahami bahwa sebenarnya validitas menyangkut
masalah hasil ukur bukan masalah alat ukurnya sendiri. Sebutan validitas alat ukur hendaklah
diartikan sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur tersebut.
Atas alasan tersebut di atas, maka uji validitas perlu dilakukan dengan uji coba
langsung kepada testee. Setelah uji empiric dilakukan, maka hasilnya dilakukan analisis butir
meliputi uji validitas.
Validitas butir dicari dengan mengkorelasikan skor butir dengan skor total. Rumus
yang digunakan adalah korelasi produk moment dengan rumus :
Keterangan :
Kriteria yang digunakan adalah dengan membandingkan harga r xy dengan harga tabel
kritik r product moment, dengan ketentuan rxy dikatakan valid apabila rxy › rtabel pada ts = 0,05.
Namun dalam analisi menggunakan program microsoft excel telah tersedia fungsi korelasi.
Sehingga dalam uji ini digunakan rumus korelasi pada program microsoft excel.
9
Reliabilitas instrument penilaian hasil belajar
Suatu alat ukur dikatakan reliabel jika alat ukur tersebut menunjukkan sejauh mana hasil
pengukuran dengan alat tersebut dapat dipercaya. Hal ini ditunjukkan oleh taraf keajegan
(konsistensi) skor yang diperoleh oleh para subjek yang diukur dengan alat yang sama, atau
diukur dengan alat yang setara pada kondisi yang berbeda. Dalam artinya yang paling luas,
realiabilitas alat ukur menunjuk kepada sejauh mana perbedaan-perbedaan skor perolehan itu
mencerminkan perbedaan-perbedaan atribut yang sebenarnya.
Reliabilitas alat ukur yang juga menunjukkan derajat kekeliruan pengukuran tak dapat
ditentukan dengan pasti, malainkan hanya dapat diestimasi. Ada tiga pendekatan dalam
mengestimasi relibilitas alat ukur itu, yaitu:
1. Pendekatan tes ulang / Test-Retest Method: Suatu perangkat tes diberikan kepada
sekelompok subjek 2x, dengan selang waktu tertentu, misalkan 2 minggu. Reliabilitas tes
dicari dengan menghitung korelasi antara skor pada testing 1 dan skor pada testing 2.
Pendekatan ini secara teori baik, namun didalam praktek mengandung kelemahan, yaitu
bahwa kondisi subjek pada testing 2 tidak lagi sama dengan kondisi subjek pada testing 1,
karena terjadinya proses belajar, pengalaman, perubahan motivasi, dll. Oleh karena itu
pendekatan ini sudah sangat jarang dipakai. Pendekatan ini sangat sesuai kalau yang
dijadikan objek pengukuran adalah ketrampilan, terutama ketrampilan fisik.
2. Pendekatan dengan tes paralel / Parallel Form Method: Dua perangkat tes yang
paralel, misalnya perangkat A dan B diberikan kepada sekelompok subjek. Reliabilitas tes
dicari dengan menghitung korelasi antara skor pada perangkat A dan skor pada perangkat B.
Keterbatasan utama pendekatan ini terletak pada sulitnya menyusun 2 perangkat tes yang
paralel. Pendekatan inipun sudah jarang digunakan.
3. Pendekatan pengukuran satu kali / Single Trial Method: Seperangkat tes diberikan
kepada sekelompok subjek satu kali, lalu dengan cara tertentu dihitung estimasi reliabilitas
tes tersebut. Pendekatan pengukuran satu kali ini menghasilkan informasi mengenai keajegan
(konsistensi) internal alat ukur. Pendekatan pengukuran satu kali ini dapat menghindarkan
diri dari kesulitan yang timbul dari pendekatan dengan pengukuran ulang maupun pendekatan
tes paralel, oleh karena itu pendekatan ini banyak digunakan. Yang menggunakan pendekatan
pengukuran satu kali:
9
1. Spearman-Brown: Jumlah butir dibelah menjadi 2 dan dicari nilai rxx-nya.
Jumlah butir dapat dibelah kiri dan kanan, angka ganjil dan genap maupun dengan
cara random / acak. Bila nilai rxx-nya > 0.8 maka dianggap reliabel.
3. Alpha Cronbach: Alpha membagi jumlah butir dengan berapapun asal sama
rata, tidak seperti Spearman-Brown dan Rulon yang tidak dapat membagi dua
angka ganjil menjadi sama rata seperti misalnya angka 15, Alpha bisa membagi
menjadi: 5, 5 dan 5. Bila nilai Alpha-nya > 0.8 maka dianggap reliabel.
4. Anava Hoyt: Membagi jumlah butir sebesar jumlah butirnya, jadi dapat
dibagi berapapun, tidak seperti Alpha yang tidak dapat membagi jumlah butir
yang nilainya imajiner, misalnya 19. Tapi Alpha akhirnya mengeluarkan rumus
baru yang dapat membagi jumlah butir sebesar jumlah butirnya juga. Dan Anava
Hoyt dan Alpha yang paling banyak digunakan dalam perhitungan reliabilitas
sampai saat ini. Bila nilai rtt-nya > 0.8 maka dianggap reliabel.
Tapi ada pendapat lain yang mengatakan bahwa suatu suatu alat tes bukan dilihat dari
rtt-nya tapi dilihat dari seberapa besar penyimpangan dari alat ukur tersebut (Standart Error
Measurement / SEM / SE). Semakin kecil nilai penyimpangannya maka alat ukur tersebut
semakin baik.
9
(Anastasi dan Urbina, 2006:110)
Dimana :
No
Nama Skor
.
1 Putri anggita 35
2 Lina 34
3 Bambang 32
4 Diar 30
5 Andi 29
9
6 Belinda 27
7 Ani puspa 24
8 Ahmidati 21
9 Emy 20
10 Imam 17
Skor-skor dalam tabel di atas merupakan skor faktual, yaitu skor yang
nyata-nyata diperoleh siswa. Berdasarkan tabel di atas dapat diketahui bahwa skor
tertinggi secara faktual adalah 35 dan skor terendah adalah 17. Jika menggunakan
penilaian acuan norma (PAN) maka peserta ujian yang mendapat skor tertinggi
(35) akan mendapat skor/nilai akhir tertinggi misalnya, 4, 5, 10, atau 100,
tergantung skala penilaian yang digunakan. Pemberian skor didasarkan pada
kenyataan (fakta) pencapaian hasil belajar kelompoknya.
Untuk mengubah skor mentah menjadi skor akhir dapat dihitung dengan
rumus berikut:
Keterangan:
PS = Perolehan Skor
SP = Skala Penilaian
1. Putri, skala 10 = x 10 = 10
Skala 5 = x 5 = 5
9
Skala 5 = x 5 = 4,3
Dengan cara yang sama dapat dihitung skor akhir siswa yang lain. Secara
lengkap perolehan skor akhir siswa dalam skala 10 da skala 5 adalah.
a. Dianggap kurang adil, karena bagi siswa yang berada dikelas yang
memiliki skor yang tinggi, harus berusaha lebih tinggi utnuk mendapat nilai
amat baik atau baik.
9
Cara Menentukan PAP :
Hasil UAS siswa kelas V mata pelajaran IPA sebelumnya, apabila dinilai
dengan menggunakan acuan patokan, maka dapat digunakan rumus sebagai
berikut:
Keterangan :
PS = Perolehan Skor
SP = Skala Penilaian
Dalam mata pelajaran tersebut skor tertinggi idealnya adalah 50. Maka
berdasarkan rumus tersebut dapat ditentukan nilai akhir dengan skala 10 dan 5
adalah sebagai berikut:
Skala 5 = x 5 = 3,5
9
2. Diar skala 10 = x 10 = 6,0
Skala 5 = x 5 = 3,0
Secara lengkap perolehan skor akhir siswa dalam skala 10 dan skala 5
adalah sebagai berikut.
Skor akhir
No. Nama siswa Skor mentah
Skala 10 Skala 5
1 Putri anggita 35 7,0 3,5
2 Lina 34 6,8 3,4
3 Bambang 32 6,4 3,2
4 Diar 30 6,0 3,0
5 Andi 29 5,8 2,9
6 Belinda 27 5,4 2,7
7 Ani puspa 24 4,8 2,4
8 Ahmidati 21 4,2 2,1
9 Emy 20 4,0 2,0
10 Imam 17 3,4 1,7
9
9 Emy 20 5,7 4,0
10 Imam 17 4,9 3,4
9
2)
Hasi
l
penetapan KKM indikator berlanjut pada KD, SK, hingga KKM mata
pelajaran.
3) Hasil penetapan KKM oleh guru atau kelompok guru mata pelajaran
disahkan oleh kepala sekolah untuk dijadikan patokan guru dalam
melakukan penilaian.
Penentuan KKM
Dalam penetapan nilai ketuntasan belajar minimum dilakukan melalui
analisis ketuntasan minimum pada setiap indikator, KD, dan SK. Ketuntasan
belajar ideal untuk setiap indikator adalah 1-100%, dengan batas minimal ideal
minimum 75%. Dalam menetapkan KKM sekolah harus mempertimbangkan
kompleksitas, kemampuan rata-rata siswa, dan sumber daya dukung.[15]
1) Kompleksitas
9
Tingkat kompleksitas (kesulitan dan kerumitan) setiap indikator,
kompetensi dasar, dan standar kompetensi yang harus dicapai oleh siswa.
Kompleksitas merupakan tingkat kesulitan materi pada tiap indikator,
kompetensi dasar maupun standar kompetensi. Semakin tinggi tingkat
kompleksitas maka semakin kecil skor yang di pakai.
3) Daya dukung
9
9
BAB III
PENUTUP
3.1 Kesimpulan
Kualitas instrumen yang baik haruslah memiliki ketetapan (valid), Ketetapan atau real
iabilitas, daya pembeda yang baik, tingkat kesukaran yang bervariasi, harus objektif, praktis,
efisian dan ekonomis .
Instrumen yang berkualitas adalah soal yang dapat memberikan informasi setepat-tepa
tnya sesuai dengan tujuannya di antaranya dapat menentukan peserta didik mana yang sudah
atau belum menguasai materi yang diajarkan guru. Kemudian untuk dipahami para guru bah
wa teknik untuk mendapatkan instrumen yang berkualitas bisa menggunakan teknik moderato
r yaitu teknik berdiskusi dengan satu orang sebagai penengah, setiap butir soal didiskusikan s
ecara bersama dengan beberapa ahli; guru yang mengajarkan materi, ahli materi, penyusun/pe
ngembang kurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi. Teknik ini sang
at baik karena setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya.
Di samping itu, para penelaah dipersilakan mengomentari/ memperbaiki berdasarkan ilmu ya
ng dimilikinya. Setiap komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap buti
r soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa.
Teknik yang lain yang bisa digunakan adalah teknik panel merupakan suatu teknik me
nelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal, y
aitu ditelaah dari segi materi, konstruksi, bahasa/budaya, kebenaran kunci jawaban/pedoman
penskorannya yang dilakukan oleh beberapa penelaah. Caranya adalah beberapa penelaah dib
erikan: butir-butir soal yang akan ditelaah, format penelaahan, dan pedoman penilaian/ penela
ahannya. Pada tahap awal para penelaah diberikan pengarahan, kemudian tahap berikutnya pa
ra penelaah berkerja sendiri-sendiri di tempat yang tidak sama. Para penelaah dipersilakan me
mperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pad
a setiap butir soalnya yang kriterianya adalah: baik, diperbaiki, atau diganti.
10
DAFTAR PUSTAKA
Herman Yose Sunu Endrayanto dan Yustiana Wahyu Harumurti, Penilaian Belajar Siswa di
Sekolah, Yogyakarta, PT Kanisius, 2018
Depdiknas .(2003). Undang-Undang RI Nomor 20, Tahun 2003, tentang Sistem Pendidikan
Nasional.
11