Pada hakikatnya pemberian skor (scoring) adalah proses pengubahan jawaban instrumen
menjadi angka-angka yang merupakan nilai kuantitatif dari suatu jawaban terhadap item dalam
instrumen. Angka-angka hasil penilaian selanjutnya diproses menjadi nilai-nilai (grade). Menurut
Kamus Besar Bahasa Indonesia (KBBI), penskoran adalah proses, cara, pembuatan skor.
Skor berbeda dengan nilai. Nilai adalah angka ( huruf ) yang merupakan hasil ubahan dari skor
yang sudah dijadikan satu dengan skor-skor lain serta disesuaikan pengaturannya dengan standart
tertentu. Sedangkan skor adalah hasil pekerjaan menyekor (memberikan angka) yang diperoleh dari
angka-angka dar setiap butir soal yang telah di jawab oleh testee dengan benar, dengan
mempertimbangkan bobot jawaban betulnya.
Menurut Suharsimi ( 2005:235 ) bahwa skor adalah hasil pekerjaan menskor yang diperoles
dengan menjumlahkan angka-angka bagi setiap soal tes yang di jawab betul oleh siswa. Sedangkan
nilai adalah angka ubahan dari skor dengan menggunakan acuan tertentu, yakni acuan norma atau
acuan standar.
Menurut Anas Sudijono ( 2007:309 ) bahwa skor merupakan hasil pekerjaan memberi angka
yang diperoleh dengan menjumlahkan angka-angka bagi setiap butir item yang si testee telah
menjawab dengan betul. Sedangkan nilai adalah angka ( bisa juga huruf), yang merupakan hasil
ubahan dari skor.
Dari penjelasan di atas dapat disimpulkan bahwa kegiatan penskoran (scoring) dan penilaian
merupakan satu rangkaian kegiatan yang tidak dapat dipisahakan. Penskoran merupakan kegiatan
mengumpulkan data melalui tes maupun non-tes sehingga di peroles skor mentah (raw store) untuk
kemudian diolah atau dikonversi (diubah).
Cara pemberian skor terhadap hasil tes hasil belajar pada umumnya disesuaikan dengan bentuk
soal yang dikeluarkan dalam tes tersebut, tes uraian (essay) atau tes obyektif (objektive test).
1. Pemberian Skor pada Tes Uraian .
Pada tes uraian, pemberian skor didasarkan pada bobot (weight) yang diberikan pada setiap butir
soal, didasarkan dan disesuaikan dengan tingkat kesulitan dari soal tersebut dan atau banyak
sedikitnya unsur yang terdapat dalam jawaban yang dianggap benar.
2. Pemberian skor pada tes obyektif
..
Pemberian skor pada tes obyektif pada umumnya digunakan sistem denda.Untuk soal obyektif
bentuk true-false misalnya, setiap item diberi skor maksimal 1 (satu). Apabila testee menjawab
benar maka diberikan skor 1 dan apabila salah maka diberikan skor 0. .
R-W
N-1
True – False
Cara penskorannya adalah
Ket,
S = Skor terakhir atau yang diharapkan
R = Jumlah item yang dijawab betul (right)
W = Jumlah item yang dijawab salah (wrong)
n = banyaknya option; untuk true-false selalu dua
1 = bilangan tetap
2)
S=R
Multiple Choice
Carapenskorannya adalah
3)
Matching
Cara penskorannya adalah
Cara menghitung skor terakhir dari seluruh item bentuk true-false, dapat digunakan dua macam
rumus yaitu : Rumus yang memperhitungkan denda dan rumus yang mengabaikan atau meniadakan
denda. Penggunaan rumus-rumus tersebut tergantung dari kebijakan tester. .
Yang perlu diperhatikan pada tes obyektif adalah karena berbentuk mutiple choice maka masing-
masing item soal memiliki derajat atau tingkat kesulitan masing-masing yang berbeda, jadi bobot
jawaban yang benar belum tentu memiliki skor 1, melainkan bisa juga berbobot 1 ½ , 2 ½, 5 dan
sebagainya. Dalam hal ini yang dapat menentukan bobot soal adalah orang yang paling tahu dengan
mengenai derajat kesulitan soal tersebut yaitu sebaiknya adalah pembuat soal itu sendiri atau tester.
1. Langkah-langkah Menskor
Adapun langkah – langkah memberi skor adalah sebagai berikut:
a. Menyusun suatu jawaban model sebagai kunci jawaban yang memenuhi syarat sebagai jawaban yang
baik (benar, relevan, lengkap, berstruktur, dan Jelas).
b. Setiap item bisa berbeda bobot. Perbedaan bobot bisa berdasar pada jenis bahan (bahan perangsang,
bahan inti, bahan penting, dan kurang penting), teksonomi (pengetahuan, pemahaman, evaluasi, dll).
c. Membaca beberapa jawaban dari peserta didik yang kurang pandai dan yang pandai. Hal ini dapat
dipakai untuk memperoleh gambaran umum tentang kualitas dari jawaban dari para peserta didik atau
mengecek apakah kunci jawaban cukup realistik.
d. Sebaiknya masing-masing nomor dari jawaban tes diperiksa sekaligus sebelum melakukan skoring
nomor yang lain.
e. Agar tidak terpengaruh oleh kesan mutu jawaban yang mendahului sebaiknya sesudah selesai
diperikasa jawaban-jawaban satu nomor, lembar jawab perlu ditukar urutannya.
f. Tidak usah memperhatikan nama dan nomor peserta, untuk mengurangi subyektivitas.
g. Membiasakan hanya memeriksa isi pikiran yang dikemukakan dalam jawaban, sehingga tidak perlu
menilai bentuk tulisan dan lain-lain.
h. Mengembalikan lembar jawab lengkap dengan catatan-catatan seperlunya.
Dalam evaluasi hasil belajar, wujud nyata dari kegiatan menghimpun data adalah melaksanakan
pengukuran, misalnya dengan menyelenggarakan tes hasil belajar apabila evaluasi hasil belajar itu
mengguanakan teknik tes, ataukah melakukan pengamatan, wawancara atau angket dengan
menggunakan instrumen-instrumen tertentu berupa rating scale, check list, interview guide atau
questionnaire apabila evaluasi hasil belajar itu menggunakan teknik non tes.
Data yang telah berhasil dihimpun disaring terlebih dahulu sebelum diolah lebih lanjut. Proses
penyaringan itu dikenal dengan istilah penelitian data atau verifikasi data. Verifikasi data dimaksudkan
untuk dapat memisahkan data yang baik yaitu data yang dapat memperjelas gambaran yang akan
diperoleh mengenai diri individu atau sekelompok individu yang sedang dievaluasi, dari data yang
kurang baik yaitu data yang mengaburkan gambaran yang akan diperoleh apabila data itu ikut serta
diolah.
Skor adalah hasil pekerjaan menyekor (memberikan angka) yang diperoleh dari penjumlahan
angka-angka dalam setiap butir soal yang di jawab dengan benar oleh testee, dan memperhitungkan
bobot jawaban, sedangkan nilai adalah angka atau huruf yang merupakan hasil konversi (rubahan) dari
penjumlahan skor yang disesuaikan pengaturannya dengan standar tertentu yang pada dasarnya
merupakan lambang kemampuan testee terhadap materi atau bahan yang diteskan.
Dari penjelasan diatas dapat dipahami bahwa untuk mendapatkan nilai, maka skor-skor yang telah
didapat masih merupakan skor mentah dan perlu diolah dan dikonversikan sehingga skor dapat
berubah menjadi nilai (menjadi skor yang sifatnya baku atau standar (Standard Score).
.
1. Acuan Penilaian
a. Penilaian Acuan Patokan (PAP) .
Penilaian Acuan Patokan (criterion referenced evaluation) yang dikenal juga dengan standar
mutlak berusaha menafsirkan hasil tes yang diperoleh siswa dengan membandingkannya dengan
patokan yang telah ditetapkan. Sebelum hasil tes diperoleh atau bahkan sebelum kegiatan pengajaran
dilakukan, patokan yang akan dipergunakan untuk menentukan kelulusan harus sudah ditetapkan.
Dengan PAP setiap individu dapat diketahui apa yang telah dan belum dikuasainya. Bimbingan
individual untuk meningkatkan penguasaan siswa terhadap materi pelajaran dapat dirancang, demikian
pula untuk memantapkan apa yang telah dikuasainya dapat dikembangkan. Guru dan setiap peserta
didik (siswa) mendapat manfaat dari adanya PAP.
Melalui PAP berkembang upaya untuk meningkatkan kualitas pembelajaran dengan
melaksanakan tes awal (pre test) dan tes akhir (post test). Perbedaan hasil tes akhir dengan test awal
merupakan petunjuk tentang kualitas proses pembelajaran.
Pembelajaran yang menuntut pencapaian kompetensi tertentu sebagaimana diharapkan dan
termuat pada kurikulum saat ini, PAP merupakan cara pandang yang harus diterapkan.
PAP juga dapat digunakan untuk menghindari hal-hal yang tidak diinginkan, misalnya kurang
terkontrolnya penguasaan materi, terdapat siswa yang diuntungkan atau dirugikan, dan tidak
dipenuhinya nilai-nilai kelompok berdistribusi normal. PAP ini menggunakan prinsip belajar
tuntas (mastery learning).
Selain itu juga, PAP dapat mengacu kepada suatu kriteria pencapaian tujuan instruksional yang
telah dirumuskan sebelumnya. Artinya, nilai-nilai yang diperoleh siswa dihubungkan dengan tingkat
pencapaian penguasaan (mastery) siswa tentang pengajaran sesuai dengan tujuan (instruksional) yang
telah ditetapkan. Kriteria yang digunakanpun bersifat mutlak. Artinya, kriteria itu bersifat tetap dan
berlaku bagi semua siswa yang mengikuti tes di lembaga terkait. Selain itu, nilai dari hasil PAP dapat
dijadikan indikator untuk mengetahui sampai dimana tingkat kemampuan dan penguasaan siswa
tentang materi pengajaran tertentu.
Sebagai contoh, untuk dapat diterima sebagai calon penerbang setiap calon harus memenuhi
syarat antara lain tinggi badan sekurang-kurangnya 170 cm. Berdasarkan kriteria tersebut, maka
siapaun yang tidak memenuhi syarat akan dinyatakan gagal dalam tes dan tidak diterima sebagai siswa
calon penerbang.
Standar atau patokan tersebut memuat ketentuan-ketentuan yang dipergunakan sebagai batas-
batas penentuan kelulusan testee atau batas pemberian nilai pada testee. Jika skor yang diperoleh oleh
testee memenuhi batas minimal maka testee dinyatakan telah memenuhi tingkat penguasaan minimal
terhadap materi yang disampaikan dan sebaliknya jika testee belum bisa memenuhi batas minimal
yang ditentukan maka testee dianggap belum “lulus” atau belum menguasai materi. Karena batasan-
batasan tersebut bersifat mutlak/ pasti maka hasil yang diperoleh tidak dapat di tawar lagi.
Berhubung standar penilaian ditentukan secara mutlak, banyaknya testee yang memperoleh nilai
tinggi atau jumlah kelulusan testee banyak akan mencerminkan penguasaannya terhadap materi yang
disampaikan. Pengolahan skor mentah menjadi nilai dilakukan dengan menempuh langkah-langkah
sebagai berikut :
1. Menggabungkan skor dari berbagai sumber penilaian untuk memperolah skor akhir.
2. Menghitung skor minimum penguasaan tuntas dengan menerapkan prosentase Batas Minimal
Penguasaan (BMP).
3. Menentukan tabel konversi .
PAP (Criterion Referenced Evaluation) mencoba menafsirkan hasil tes yang diperoleh siswa
dengan mem-bandingkannya dengan patokan yang telah ditetapkan. Pa-tokan ini biasanya ditetapkan
sebelum pembelajaran dimulai dan digunakan sebagai “standar kelulusan”. Standar kelu-lusan ini di
dalam PAP bersifat ajeg dan tidak dapat ditawar-tawar lagi. Oleh karena itu PAP ini dikenal pula
dengan na-ma “Standar Mutlak”.
Berhubung standar penilaian ditentukan secara mut-lak, maka banyaknya siswa yang lulus dan
memperoleh nilai tinggi akan mencerminkan prestasi siswa, sekaligus juga mencerminkan
penguasaannya terhadap bahan pelajaran. Se-bagai konsekuensi logis penggunaan standar mutlak ini,
sa-ngat mungkin terjadi bahwa sebagian besar siswa dalam satu kelompok lulus dengan nilai tinggi,
atau sebagian besar sis-wa tidak lulus karena nilainya di bawah standar minimal, atau jumlah siswa
yang mendapat nilai tinggi dan rendah mungkin pula berimbang. Hasil pengolahan yang demikian
jika digambarkan dalam bentuk kurva yang akan berwujud kurva juling positif, kurva juling negatif,
dan kurva normal.
Ini berarti bahwa standar kelulusan baru dapat ditentukan setelah diperoleh skor siswa. Hal ini
mengisyaratkan kepada kita bahwa standar yang dibuat untuk kelompok tertentu tidak dapat digunakan
untuk kelompok lainnya. Begitu pula dengan standar yang digunakan untuk hasil tes sebelumnya tidak
dapat digunakan untuk hasil tes sekarang atau yang akan datang. Jadi setiap kali kita memperoleh data
hasil tes, kita dituntut untuk membuat norma baru. Jika dibandingkan anatara norma yang satu dengan
yang lainnya mungkin saja akan ditemukan standar yang sangat berbeda. Jika kelompok tertentu
kebetulan sis-wanya pintar-pintar, maka norma/standar kelulusannya akan tinggi. Sebaliknya jika sis-
wanya kurang pintar, maka standar kelulusannya pun akan rendah. Itulah sebabnya pendekatan ini
disebut standar relatif.
Beberapa langkah yang perlu diperlukan dalam mengadakan penilaian berdasarkan acuan kelompok,
yaitu:
a. Memberikan skor tiap siswa
b. Mencari nilai rata-rata (mean) kelompok
c. Mencari nilai simpangan baku (standar deviation)
d. Menbuat pedoman konversi dan menentukan nilai berdasarkan standar yang dibuat.
Secara sederhana, konversi nilai yang biasa digunakan ada lima macam, ytaitu:
a. Skala Lima (Stanfive) diwujudkan dengan 0,1,2,3,4 atau A,B,C,D,E.
b. Skala Sembilan (Stannine) diwujudkan dengan 1,2,3,4,5,6,7,8,9.
c. Skala Sepuluh (C-scale) diwujudkan dengan 1,2,3,4,5,6,7,8,9,10.
d. Skala Sebelas (Staneleven), diwujudkan dengan 0,1,2,3,4,5,6,7,8,9,10.
e. Skala Seratus (T-Scale), diwujudkan dengan 0,1,2,3,s.d 100. (*)
1). Pedoman Konversi PAN
Konversi didasarkan pada Mean dan Standar Deviasi (SD) yang dihitung dari hasil tes yang diperoleh.
Oleh karena itu untuk membuat standar penilaian atau pedoman konversi, terlebih dahulu kita harus
menghitung Mean dan SD-nya. Jika dihubung-kan dengan skala penilaian, maka pedoman konversi
untuk PAN dapat mempergunakan berbagai skala, misalnya skala lima, sembilan, sepuluh, dan seratus.
2). Penggunaan PAN
Berbeda dengan PAP, PAN tidak dapat digunakan untuk mengukur kadar pencapaian tujuan dan
tingkat penguasaan bahan. PAN sering digunakan untuk fungsi prediktif, mera-malkan keberhasilan
pendidikan siswa di masa mendatang atau untuk menentukan peringkat/kedudukan siswa dalam
kelompok.