Dosen Pembina :
Prof. Dr. Nurhayati Abbas, M.Pd
Oleh :
Oleh:
NURSIYA BITO
NIM 705622008
Puji syukur kami panjatkan atas rahmat dan ridho Allah SWT sehingga
penulis dapat menyelesaikan makalah ini dengan baik dan selesai tepat waktu.
Adapun tujuan penulisan makalah ini adalah sebagai salah satu persyaratan mata
Tidak lupa kami sampaikan terima kasih kepada dosen pengampu Mata
Kuliah Prof. Dr. Nurhayati Abbas, M.Pd yang membimbing kami dalam pengerjaan
tugas mata kuliah ini. Kami juga menyampaikan terima kasih teman-teman yang
dalam pengerjaan makalah ini. Makalah ini menguraikan tentang Pengolahan Hasil
Penilaian.
Penulis
Nursiya Bito
BAB 1
PENDAHULUAN
A. Latar Belakang
Menurut Arifin (2006) dalam mengolah data hasil tes, ada 4 (empat) Langkah pokok
yang harus ditempuh, yaitu:
a. Menskor, yaitu memberi skor terhadap hasil tes yang dapat diperoleh peserta
didik. Untuk memperoleh skor mentah diperlukan tiga jenis alat bantu yaitu
kunci jawaban, kunci skoring, dan pedoman konversi.
b. Mengubah skor mentah menjadi skor standar sesuai dengan norma tertentu.
c. Mengkonversikan skor standar ke dalam nilai baik berupa huruf maupun
angka.
d. Melakukan analisis soal (jika diperlukan) untuk mengetahui validitas dan
reliabilitas soal, tingkat kesukaran soal (difficulty index) dan daya pembeda.
Setelah melaksanakan kegiatan tes dan lembar pekerjaan peserta didik telah
diperiksa kebenaran, kesalahan dan kelengkapannya, Langkah selanjutnya adalah
menghitung skor mentah untuk setiap peserta didik berdasarkan rumus-rumus
tertentu dan bobot setiap soal. Kegiatan ini harus dilakukan dengan teliti karena
menjadi dasar bagi kegiatan pengolahan hasil tes sampai menjadi nilai prestasi.
Sebelum melakukan tes, guru garus sudah Menyusun pedoman pemberian skor.
Pedoman penskoran sangat penting disiapkan terutama bentuk soal essay (Arifin,
2009: 223). Hal ini dimaksudkan untuk meminimalisir subjektivitas penilai.
Begitu pula saat melakukan tes domain afektif dan psikomotor peserta didik, karena
harus ditentukan ukuran-ukuran sikap dan pilihan tindakan dari peserta didik
dalam menguasai kompetensi yang telah ditetapkan. Rumus penskoran yang
digunakan bergantung pada bentuk soalnya, sedangkan bobot (weight) bergantung
pada tingkat kesulitan (difficulty index), sebagai missal sukar, sedang, dan mudah.
Untuk lebih jelasnya, kami paparkan cara-cara pengolahan hasil penilaian sebagai
berikut
A. Cara Memberi Skor Mentah untuk Tes Uraian
Dalam bentuk uraian skor mentah dicari dengan menggunakan sistem bobot.
Sistem bobot itu sendiri dibagi dua cara, yaitu:
1) Bobot dinyatakan dalam sistem skor maksimum sesuai dengan tingkat
kesukarannya. Contohnya, untuk soal yang mudah skor maksimumnya adalah
6, untuk skor yang sedang skor maksimumnya 7 dan untuk skor yang
tergolong sulit diberi skor maksimum 10. Dengan demikian ketika
menggunakan cara ini peserta didik tidak mungkin mendapatkan skor 10.
Contoh 1.
Seorang peserta didik diberi tiga soal dalam bentuk uraian. Setiap soal diberi
skor (x) maksimum dalam rentang 1-10 sesuai dengan kualitas peserta didik
Tabel 1
Perhitungan Skor dengan Sistem Bobot Pertama
No. Tingkat Kesukaran Jawaban Skor (x)
Soal
1 Mudah Betul 6
2 Sedang Betul 7
3 Sukar Betul 10
Jumlah 23
Rumus Skor
Keterangan:
= Jumlah Skor
= Jumlah Soal
Jadi, skor peserta didik A = 23/3 = 7,67
2) Bobot dinyatakan dalam bilangan-bilangan tertentu sesuai dengan tingkat
kesukaran soal. Sebagai contoh, soal mudah diberi bobot 3, soal sedang diberi
bobot 4 dan soal yang sulit diberi bobot 5. Dengan menggunakan cara ini
memungkinkan peserta didik mendapatkan skor 10
Contoh 2.
Seorang peserta didik dites dengan tiga soal dalam bentuk uraian. masing-
masing soal diberi bobot sesuai tingkat kesulitannya, yaitu bobot 5 untuk soal
sukar, 4 untuk soal sedang, dan 3 untuk soal mudah. Tiap-tiap soal diberikan
skor (X) dengan rentang 1-10 sesuai dengan kualitas jawaban yang betul.
Kemudian skor (X) yang dicapai oleh setiap peserta didik dikalikan dengan
bobot setiap soal.
Tabel 2
Perhitungan Skor dengan Sistem Bobot Kedua
No. Tingkat Kesukaran Jawaban Skor (X) Bobot (B)
Soal
1 Mudah Betul 10 3
2 Sedang Betul 10 4
3 Sukar Betul 10 5
Jumlah 30 12
Rumus Skor
Keterangan:
TK = Tingkat Kesukaran
X = Skor Tiap Soal
B = Bobot sesuai dengan Tingkat Kesukaran Soal
= Jumlah hasil perkalian X dengan B
= Jumlah Bobot
Jadi, skor peserta didik A = 120/12 = 10
B. Cara Memberi Skor Mentah untuk Tes Objektif
Ada dua acara untuk memberikan skor pada soal tes bentuk objektif, yaitu:
1) Tanpa menggunakan rumus tebakan (Non Guessing Formula)
Cara ini digunakan apabila soal belum diketahui tingkat kebaikannya.
Caranya adalah dengan menghitung jumlah jawaban yang betul saja, setiap
jawaban betul diberi skor 1 dan jawaban yang salah diberi skor 0.
Rumus : S =
Keterangan:
S = skor yang dicari
∑ B= jumlah jawaban yang benar
∑ S = jumlah jawaban yang salah
n = jumlah alternatif jawaban(option) yang disediakan
1 = bilangan tetap
c) Untuk soal bentuk menjodohkan (matching)
Rumus: S = ∑B
Keterangan:
S = skor yang dicari
∑ B= jumlah jawaban yang benar
d) Untuk soal bentuk jawaban singkat (short answer) dan melengkapi
(completion)
Rumus: S = ∑B
Keterangan:
S = skor yang dicari
∑ B= jumlah jawaban yang benar
C. Skor Total (Total Score)
Skor total adalah jumlah skor yang diperoleh dari seluruh bentuk soal setelah
diolah dengan rumus tebakan (guessing formula) (Arifin, 2009: 231). Misalnya
mengambil contoh di atas maka skor total peserta didik adalah 20 + 6 + 5 + 7 =
38. Skor ini merupakan skor mentah (raw score). Langkah selanjutnya adalah
mengolah skor mentah tersebut menjadi nilai-nilai jadi.
D. Konversi Skor
Konversi skor adalah proses transformasi skor mentah yang dicapai peserta
didik ke dalam skor terjabar atau skor standar untuk menetapkan nilai hasil
belajar yang telah diperoleh. Yang secara tradisional seringkali guru
menggunakan rumus sebagai berikut:
Nilai = (skala 0-10)
Keterangan:
∑X = jumlah skor mentah
∑S = jumlah soal
E. Cara Memberi Skor untuk Skala Sikap
Data penilaian sikap bersumber dari catatan harian peserta didik berdasarkan
pengamatan atau observasi para evaluator. Data hasil pengamatan tersebut
kemudian dilengkapi dengan hasil penilaian berdasarkan pertanyaan langsung
dan laporan pribadi (Tim Penyusun, 2007: 35)
Ada beberapa bentuk skala yang dapat digunakan untuk mengukur sikap, antara
lain:
1. Skala Likert
Skala ini disusun dalam bentuk suatu pernyataan dan diikuti oleh lima
respons yang menunjukkan tingkatan. Misalnya
SS = Sangat Setuju
S = Setuju
TB = Tidak Berpendapat
TS = Tidak Setuju
STS = Sangat Tidak Setuju
2. Skala pilihan ganda
Skala ini bentuknya seperti soal bentuk pilihan ganda yaitu suatu pernyataan
yang diikuti oleh sejumlah alternatif pendapat.
Contoh.
Dalam suatu upacara bendera
a. Setiap peserta harus dengan khidmat mengikuti jalannya upacara tanpa
terkecuali
b. Peserta diperbolehkan berbicara asal dalam batas-batas tertentu dan
tidak mengganggu jalannya upacara
c. Dalam keadaan terpaksa peserta boleh berbicara tetapi hanya dengan
berbisik
d. Peserta boleh berbicara asal tertib
3. Skala Thurstone
Skala Thurstone merupakan skala mirip buatan Likert karena merupakan
suatu instrumen yang jawabannya menunjukkan tingkatan. Pernyataan yang
diajukan kepada responden disarankan oleh Thurstone kira-kira 10 butir,
tetapi tidak kurang dari 5 butir
4. Skala Guttman
Skala ini sama dengan yang disusun oleh Bogardus, yaitu berupa tiga atau
empat buat pernyataan yang masing-masing harus dijawab “ya” atau “tidak”.
Pernyataan-pernyataan tersebut menunjukkan tingkatan yang berurutan
sehingga bila responden setuju pernyataan nomor 2, diasumsikan setuju
nomor 1. Selanjutnya jika responden setuju dengan pernyataan nomor 3,
berarti setuju pernyataan nomor 1 dan 2.
Contoh:
1. Saya mengizinkan anak saya bermain ke tetangga
2. Saya mengizinkan anak saya pergi ke mana saja ia mau
3. Saya mengizinkan anak saya pergi kapan saja dan ke mana saja
4. Anak saya bebas pergi ke mana saja tanpa minta izin terlebih dahulu
5. Semantic Differential
Instrumen yang disusun oleh Osgood dan kawan-kawan ini mengukur
konsep-konsep untuk tiga dimensi. Dimensi-dimensi yang ada diukur dalam
kategori: baik-tidak baik, kuat-lemah, dan cepat-lambat atau aktif-pasif, atau
dapat juga berguna-tidak berguna. Dalam buku Osgood dikemukakan adanya
3 faktor untuk menganalisis skalanya:
A. Evaluation (baik-buruk)
B. Potency (kuat-lemah)
C. Activity (cepat-lambat)
D. Familiarity (biasa-asing)
Contoh
Main Musik
Baik 1 2 3 4 5 6 7 Tidak baik
berguna 1 2 3 4 5 6 7 Tidak
berguna
aktif 1 2 3 4 5 6 7 Pasif
Cara ini dapat digunakan untuk mengetahui minat atau pendapat peserta
didik mengenai sesuatu kegiatan atau topik dari suatu mata pelajaran
6. Pengukuran Minat
Di samping menggunakan skala seperti dicontohkan di atas, minat juga dapat
diukur dengan cara seperti berikut
A. Mengunjungi perpustakaan
SS S B AS TS STS
B. Sandiwara SS S B AS TS STS
Pilihan: senang, sampai dengan sangat tidak senang dapat ditentukan
sendiri seberapa suka. Boleh juga diteruskan sampai 11 skala
F. Cara Memberi skor untuk Domain Psikomotor
Dalam domain psikomotor yang diukur adalah penampilan dan kinerja. Untuk
mengukurnya dapat dilakukan dengan cara menggunakan tes tindakan melalui
simulasi, unjuk kejra atau tes identifikasi. Salah satu instrumen yang dapat
digunakan adalah skala penilaian yang terentang dari sangat baik (5), baik (4),
cukup baik (3), kurang baik (2), sampai pada hasil tidak baik (1)
G. Pengolahan Data Hasil Tes: PAP dan PAN
Setelah diperoleh skor setiap peserta didik, guru hendaknya tidak tergesa-gesa
menentukan prestasi belajar (nilai) peserta didik yang didasarkan pada angka
yang diperoleh setelah membagi skor dengan jumlah soal, karena cara tersebut
dianggap kurang proporsional. Misalnya, seorang peserta didik memperoleh
skor 60, sementara skala yang digunakan untuk mengisi buku raport adalah
skala 0-10 atau skala 0 – 5, maka skor tersebut harus dikonversikan terlebih
dahulu menjadi skor standar sebelum ditetapkan menjadi nilai akhir.
1. Penilaian Acuan Patokan (PAP)
Pendekatan ini menitikberatkan pada apa yang dapat dilakukan oleh peserta
didik. Dapat pula dikatakan penilaian ini dititikberatkan pada kemampuan-
kemampuan apa yang telah dicapai oleh peserta didik setelah menyelesaikan
satu bagian kecil dari suatu keseluruhan program.
Dengan demikian PAP meneliti apa yang dapat dikerjakan oleh peserta didik,
bukan membandingkan seorang peserta didik dengan teman sekelasnya,
melainkan dengan suatu kriteria atau patokan yang spesifik. Kriteria yang
dimaksud adalah suatu pengalaman tingkat belajar yang diharapkan tercaai
sesudah selesai kegiatan belajar, atau sejumlah kompetensi dasar yang telah
ditetapkan terlebih dahulu sebelum kegiatan belajar berlangsung. Misalnya,
kriteria itu menggunakan 75% atau 80%. Bagi peserta didik yang
kemampuannya berada di bawah kriteria yang telah ditetapkan dinyatakan
belum berhasil dan harus mendapatkan remedial.
1 10 1 10
0 0
Apabila guru dapat menyusun soal dengan tepat, dan keadaan peserta
didiknya bukan peserta didik dengan kemampuan terpilih, maka aka nada
Sebagian kecil peserta didik yang memperoleh nilai rendah dan Sebagian
kecil lagi memperoleh nilai tinggi, sedangkan Sebagian besar mencapai nilai
rata-rata. Jika hasil ulangan digambarkan dalam kurva, akan terlihat sebagai
kurva normal seperti gambar di bawah ini.
10 8
5
3
2 2
Dengan melihat pada grafik tersebut tampak bahwa walaupun agak kasar,
kurva yang berbentuk agak mendekati bentuk kurva normal, dimana
Sebagian terbesar peserta didik akan memperoleh skor sedang sehingga
dalam kurva akan menumpuk di tengah.
b. Standar Relatif
2. Standar Nilai
3.Teknik Pengolahan Dan Pengubahan (Konversi) Skor Hasil Tes Hasil Belajar
Menjadi Nilai
Skor dan nilai pada dasarnya mempunyai pengertian yang berbeda, perlu dijelaskan
terlebih dahulu mengenai perbedaannya. Hal ini didasarkan pada pertimbangan
bahwa kadang-kadang orang menganggap bahwa skor itu mempunyai pengertian
yang samadengan nilai, padahal pengertian seperti itu belum tentu benar.Menurut
Sudijono (2013: 309), Skor adalah hasil pekerjaan menyekor (= memberikan angka)
yang diperoleh dengan jalan menggunakan angka-angka bagi setiap butir item yang
oleh tes telah dijawab dengan betul, dengan memperhitungkan bobot
jawabanbetulnya. Sedangkan yang dimaksud dengan nilai adalah angka (bisa juga
huruf), yangmerupakan hasil ubahan dari skor yang sudah dijadikan satu dengan
skor-skor lainnya,serta disesuaikan peraturannya dengan standar tertentu. Itulah
sebabnya mengapa nilaisering disebut skor standar (Standard score). Ada dua hal yang
perlu dipahami bahwa dalam pengolahan dan pengubahan skor mentah menjadi
nilai itu ada dua cara yang dapat ditempuh :
a.Bahwa pengolahan dan pengubahan skor mentah menjadi nilai itu dilakukan
denganmengacu atau mendasarkan diri pada kriterium atau criterion (= patokan).
Cara pertama ini sering dikenal dengan istilah criterion referenced evaluation.
b. Bahwa pengolahan dan pengubahan skor mentah menjadi nilai itu dilakukan
denganmengacu atau mendasarkan diri pada norma atau kelompok. Cara kedua ini
seringdikenal dengan istilah norm reference evaluation.
1. Mengurutkan data
Data tinggi badan dari 30 Top Model Wanita diurutkan dari data terkecil hingga
terbesar. Berikut merupakan hasil pengurutan data:
No Tinggi No. Tinggi No Tinggi No Tinggi No Tinggi
Badan Badan Badan Badan Badan
1 170 7 175 13 179 19 180 25 184
2 172 8 176 14 179 20 180 26 185
3 172 9 177 15 179 21 181 27 185
4 175 10 177 16 179 22 181 28 185
5 175 11 178 17 180 23 182 29 186
6 175 12 179 18 180 24 182 30 187
2. Menentukan range atau jangkauan dari data tersebut
Range atau jangkauan merupakan ukuran penyebaran atau ukuran dispersi dari
data. Jangkauan adalah selisih nilai terbesar dan terkecil dari data. Jangkauan
menunjukkan seberapa tersebarnya nilai-nilai dalam suatu deret. Jika
jangkauannya merupakan angka yang besar, maka nilai-nilai dalam deret
tersebut sangat tersebar; jika jangkauannya merupakan angka yang kecil, maka
nilai-nilai dalam deret tersebut dekat satu sama lain. Berikut merupakan
perhitungan range pada studi kasus ini:
Range = Data Terbesar – Data Terkecil Range = 187 – 170 = 17
3. Menentukan jumlah kelas
Kelas-kelas adalah kelompok nilai data atau variabel dari suatu data acak. Dalam
menentukan jumlah kelas menggunakan Aturan Sturgess, yakni aturan
dalam statistika yang diturunkan dari distribusi binomial, digunakan untuk
menentukan banyaknya kelas pada distribusi frekuensi data berkelompok,
dengan rumus:
k = 1+3,3 log n
Dimana:
k = jumlah kelas
n = jumlah data
Berikut merupakan perhitungan jumlah kelas pada studi kasus ini:
k = 1+3,3 log 30
k = 5,874 = 6
4. Menentukan panjang interval kelas
Panjang interval kelas atau luas kelas adalah jarak antara tepi atas kelas dan tepi
bawah kelas. Berikut merupakan rumus dalam menentukan panjang interval
kelas:
C = R/k
Dimana:
C = lebar kelas
R = range
k = jumlah kelas
Berikut merupakan perhitungan panjang interval kelas pada studi kasus ini:
C = 17/5,874
C = 2,894 = 3
Sehingga didapatkan interval kelas
5. Menentukan tepi bawah dan tepi atas kelas
Dalam menentukan tepi bawah dan tepi atas kelas, dilakukan dengan
mengurangi 0,5 pada batas kelas bawah dan menambahkan 0,5 pada batas kelas
atas. Prinsip dasarnya adalah batas kelas harus memiliki nilai tempat desimal
yang sama dengan data, tetapi tepi bawah dan tepi atas kelas harus memiliki satu
tambahan nilai tempat desimal dan berakhir di 5. Contoh pada studi kasus ini,
yaitu:
Tepi bawah = kelas bawah – 0,5 = 170 – 0,5 = 169,5
Tepi atas = kelas atas + 0,5 = 172 + 0,5 = 172,5
Batas kelulusan
Batas kelulusan hasil penilaian mempunyai kaitan erat dengan PAP dan PAN.
Dengan demikian, ada batas kelulusan yang berorientasi pada PAN, yakni batas lulus
actual dan batas lulus ideal. Batas lulus tersebut mengisyaratkan penggunaan nilai
rata-rata kelas dan simpangan baku. Di samping itu ada pula batas kelulusan yang
berorientasi PAP, yakni batas lulus purposive (ditentukan berdasarkan kriteria
tertentu).
Batas lulus aktual
Batas lulus aktual didasarkan atas nilai rata-rata aktual atau nilai rata-rata yang
dapat dicapai oleh kelompok peserta didik. Unsur yang diperlukan untuk
menetapkan batas lulus aktual adalah nilai rata-rata aktual dan simpangan baku
aktual. Biasanya skor yang dinyatakan lulus adalah skor di atas (Ẋ + 0,25SD). Dimana
nilai rata-rata kelas dan SD adalah simpangan baku atau standar deviasi.
Contoh:
Misalkan tes matematika berbentuk pilihan ganda sebanyak 60 pertanyaan. Setiap
pertanyaan yang dijawab benar diberi skor satu sehingga skor maksimal yang
mungkin dicapai peserta didik sebanyak 60. Kemudian dihitung nilai rata-rata
semua peserta didik yang ada di kelas tersebut, misalnya 25 dan simpangan bakunya
(SD) adalah 8,0. Dengan demikian, skor yang dinyatakan lulus adalah, 25 +0,25(8,0)
= 27. Skor di atas 27 dinyatakan lulus sedangkan skor di bawah 27 dinyatakan gagal
atau tidak lulus.
Batas lulus ideal.
Batas lulus ideal hampir sama dengan batas lulus aktual, yaitu menentukan batas
lulus dengan menggunakan nilai rata-rata dan simpangan baku ideal. Nilai rata-rata
dan simpangan baku dalam batas lulus ideal mudah dihitung yakni menggunakan
aturan sebagai berikut:
Nilai rata-rata ideal adalah setengah dari maksimum skor. Simpangan baku ideal
adalah sepertiga dari nilai rata-rata ideal.
Contoh:
Kembali kepada contoh dalam batas dalam batas lulus aktual. Skor maksimum yang
mungkin dicapai dari tes matematika adalah 60. Rata-rata idealnya adalah setengah dari
60, yakni 30, sedangkan simpangan bakunya adalah sepertiga dari rata-rata ideal, yakni
10. Batas lulusnya adalah 30 + 0,25(10) = 32,25.
Batas lulus purposif.
Batas lulus purposive mengacu pada penilaian acuan patokan sehingga tidak perlu
menghitung nilai rata-rata dan simpangan baku. Dalam hal ini ditentukan kriterianya,
misalnya 75%. Artinya skor yang dinyatakan lulus adalah skor di atas 75% dari skor
maksimum. Dalam contoh di atas maka batas lulusnya adalah 75% dari 60, yakni 45. Skor
yang besarnya di atas 45 dinyatakan lulus dan yang berada di bawahnya dinyatakan gagal.
Makin tinggi kriteria kelulusannya, maka makin tinggi pula kualitas hasil belajar yang
dituntutnya. Sebaliknya, makin rendah kriterianya, makin rendah pula kualitas hasil
belajar yang dihasilkannya.
Ketiga batas lulus di atas sering digunakan oleh para guru di sekolah terutama dalam
penilaian sumatif atau ujian akhir tahun.
Kecenderungan memusat dan keragaman.
Ukuran kecenderungan memusat
Ada tiga ukuran kecenderungan memusat yang paling banyak digunakan, yakni modus,
median, dan mean (rata-rata)
Modus adalah skor yang paling banyak frekuensinya sehingga tidak perlu dihitung, cukup
dilihat dari persebaran skor, kemudian dicari skor mana yang pemunculannya paling
sering. Oleh sebab itu, modus merupakan ukuran kecenderungan memusat yang paling
sederhana. Median adalah titik tengah dari data yang telah diurutkan sehingga membatasi,
setengahnya berada di bawahnya dan setngaj lagi berada di atasnya. Mean adalah rata-rata
diperoleh dengan menjumlahkan seluruh skor dibagi dengan banyaknya subjek. Secara
sederhana rumusnya: ,
= rata-rata (mean)
= jumlah seluruh skor
N = banyaknya subjek
Dapat juga dihitung dengan menggunakan rumus:
Dengan menggunakan tabel distribusi tabel distribusi skor, kita dapat menghitung atau
mencari nilai rata-rata dan median dengan lebih praktis. Rumus untuk mencari nilai
rata-rata dari data yang dikelompokkan antara lain adalah:
(1)
(2)
= 40,67
Dengan menggunakan rumus kedua diperlukan tabel distribusi tersendiri yang unsur-
unsurnya berbeda dengan tabel di atas. Dalam tabel tersebut deviasi nol ditempatkan pada
kelompok nilai yang mempunyai frekuensi terbanyak, yaitu pada kelompok 40 – 44.
Dengan demikian, pada kelompok skor di bawahnya, deviasi menjadi bilangan negatif
yang diurutkan mulai dari -1. Sedangkan skor di atasnya, deviasi menjadi bilangan positif,
diurutkan mulai dari 1. Notasi “u” dalam rumus adalah titik tengah dari kelompok skor
yang memiliki deviasi nol, yakni 42.
Kelompok skor Frekuensi Deviasi fd
(i =5) (f) (d)
20 – 24 1 -4 -4
25 – 29 2 -3 -6
30 – 34 4 -2 -8
35 – 39 6 -1 -6
40 – 44 8 0 0
45 – 49 5 1 5
50 – 54 2 2 4
55 – 59 1 3 3
60 - 64 1 4 4
Keterangan:
f = frekuensi
d = deviasi (penyimpangan skor dari rata-rata)
rumus mencari rata-rata adalah:
Dimana
= median yang dicari
L1 = batas bawah kelas median
i = interval
= jumlah frekuensi kelas yang lebih rendah dari kelas median
fmed = frekuensi kelas median
N = banyaknya subjek
Tabel distribusi frekuensi skor
Frekuensi skor F cf
20 – 24 1 30
25 – 29 2 29
30 – 34 4 27
35 – 39 6 23
40 – 44 8 17
45 – 49 5 9
50 – 54 2 4
55 – 59 1 2
60 - 64 1 1
Keterangan:
cf adalah frekuensi kumulatif, diperoleh dengan menjumlahkan frekuensi dari bawah ke
atas:
1 + 1 = 2, 2 + 2 = 4, 4 + 5 = 9, 9 + 8 = 17, 17 + 6 = 23, 23 + 4 = 27, 27 + 2 = 29, 29 + 1 =
30
Kelas median ada pada kelompok skor 40 – 44 sebab setengah dari n, yakni ½ (30) = 15
ada cf 17. L1 dihitung dari batas bawah kelompok skor 40 – 44, yakni 39,5. Interval
adalah 5. Frekuensi median adalah 8. adalah 9
Ukuran Keragaman
Ukuran keragaman yang paling sederhana adalah “rank”, yakni selisih skor tertinggi
dengan skor terendah. Sedangkan ukuran keragaman lain yang paling banyak digunakan
adalah simpangan baku dan variansi. Variansi adalah kuadrat dari simpangan baku.
Notasi simpangan baku adalah s, sedangkan notasi variansi adalah s 2. Simpangan adalah
penyimpangan nilai dari rata-ratanya. Makin besar simpangan, makin beragam nilai atau
skor yang diperoleh peserta didik. Sebaliknya, makin kecil simpangan berarti skor-skor
tersebut atau skor yang dicapai cenderung homogen atau merata. Tes yang baik tentunya
mempunyai simpangan baku yang kecil.
Cara menghitung simpangan baku ada untuk data yang tidak dikelompokkan
menggunakan rumus sebagai berikut:
X = skor yang dicapai
= rata-rata
X ) )2
7 7–7=0 0
8 8–7=1 1
9 9–7=2 4
6 6 – 7 = -1 1
5 5 – 7 - -2 4
X = 35, n = 5, = 35/5 = 7
Contoh:
Tabel distribusi skor
Kelompok skor f d Fd fd2
i=5 (d x fd)
20 – 24 1 -4 -4 16
25 – 29 2 -3 -6 18
30 – 34 4 -2 -8 16
35 – 39 6 -1 -6 6
40 – 44 8 0 0 0
45 – 49 5 1 5 5
50 – 54 2 2 4 8
55 – 59 1 3 3 9
60 - 64 1 4 4 16
Dengan diketahuinya simpangan baku, variansi dapat dihitung, yakni kuadrat dari
simpangan baku. Dalam contoh di atas, variansinya adalah (8,75) 2 = 76,56.
Nilai rata-rata dan simpangan baku sangat diperlukan untuk mengolah data hasil tes
maupun untuk keperluan analisis lebih lanjut. Untuk keperluan penilaian, rata-rata
dan simpangan baku dapat digunakan dalam:
a. Menentukan batas kelulusan, terutama batas lulus aktual dan batas lulus
ideal
b. Membuat konversi nilai
c. Mengubah skor mentah ke dalam skor baku seperti skor z dan skor T.
d. Menentukan atau menghitung korelasi, signifikansi, dan lain-lain.
Oleh sebab itu, pemahaman dan keterampilan menghitung nilai rata-rata dan
simpangan baku sangat diperlukan.
Skor Baku (skor z dan skor T)
Jika ingin membandingkan dua sebaran skor yang berbeda standar yang
digunakannya, misalnya yang satu menggunakan nilai standar sepuluh dan yang
satunya lagi standar 100, sebaliknya dilakukan transformasi atau mengubah skor
mentah ke dalam skor baku. Ada dua macam skor baku, yakni skor z dan skor T. skor
z dapat dihutung dengan membagi selisih skor dan nilai rata-ratanya dengan
simpangan bakunya.
Contoh:
Martina memperoleh skor 75 dari skor maksimum 100. Rata-rata kelas atau mean
adalah 60 dan simpangan bakunya 10.
Skor z Martina adalah (75-60)/10 = 1,5
Misalkan kita akan membandingkan dua skor yang berbeda rentangannya. Skor
pertama menggunakan rentangan 0- 10 dan yang satunya lagi menggunakan
rentangan 0 – 100. Martina memperoleh skor matematika 6,5 dalam standar 0 – 10.
Rata-rata kelas adalah 6. Simpangan bakunya adalah 0,8.
Sedangkan skor Bahasa inggris sebesar 80 dari rentangan 0 – 100. Rata-rata kelas
untuk Bahasa inggris adalah 75 dengan simpangan baku 10.
Pertanyaannya: dalam pelajaran manakah Martina lebih unggul?
Untuk menjawab pertanyaan tersebut kita gunakan skor z.
Skor z untuk matematika adalah (6,5 – 6) / 0,8 = 0,625
Skor z untuk Bahasa inggris adalah ((80 – 75) / 10 = 0,50
Dengan membandingkan skor z di atas dapat disimpulkan bahwa Martina lebih
unggul dalam hal Matematika daripada Bahasa Inggris.
Kelemahan skor z adalah berhadapan dengan bilangan negative dan bilangan
pecahan sehingga kurang praktis. Untuk itu dapat digunakan skor baku lainnya yaitu
skor T. Sko T diperoleh dengan mengalikan skor z kepada bilangan 10, kemudian
ditambah dengan bilangan 50 sehingga diperoleh skor dalam rentangan 0 – 100.
Contoh di atas, adalah mengenai skor z Martina dalam Matematika dan Bahasa
Inggris, jika digunakan skor T, maka skor Martina menjadi:
Skor T matematika adalah (0,625 x 10) + 50 = 56,25
Skor T bahasa inggris adalah (0,5 x 10) + 50 = 55
Konversi Nilai
a. Konversi tanpa menggunakan nilai rata-rata dan simpangan baku
Cara ini sangat sederhana, yakni dengan menentukan kriteria sebagai dasar
untuk melakukan konversi nilai. Misalnya dengan menggunakan kriteria dalam
bentuk persentase.
Tabel Kriteria Nilai Konversi
Persentase Nilai konversi
jawaban
Huruf Standar 10 Standar 4
(%)
90 - 99 A 9 4
80 – 89 B 8 3
70 – 79 C 7 2
60 – 69 D 6 1
Contoh penggunaanya
Misalnya peserta didik diberikan tes matematika dalam bentuk tes objektif
pilihan ganda sebanyak 60 soal. Jawaban yang benar diberi skor satu sehingga
skor maksimal yang dicapai peserta didik adalah 60. Berdasarkan kriteria di atas,
konverso nilai dalam standar huruf, standar 10, dan standar empat adalah
sebagai berikut.
Tabel Kriteria Nilai Konversi
Skor Mentah Nilai Konversi
54 – 59/60 A 9/10 4
48- 53 B 8 3
42 – 47 C 7 2
36 - 41 D 6 1
60 – 64 2 2 4 8
55 – 59 3 3 6 18
50 – 54 4 0 0 0
45 – 49 5 -1 -3 3
40 – 44 3 -2 -6 12
35 – 39 2 -3 -6 18
30 – 34 1 -4 -4 16
i=5 N = 20 ∑= -7 ∑= 67
M= = = 50,25
= = 8,98
Dengan demikian, perolehan nilai dari 20 orang peserta didik adalah sebagai
berikut:
69 = A (4) 49 = C (2)
68 = A (4) 48 = C (2)
62 = B (3) 46 = C (2)
60 = B (3) 45 = D (1)
56 = B (3) 43 = D (1)
55 = B (3) 41 = D (1)
53 = C (2) 40 = D (1)
52 = C (2) 39 = D (1)
51 – C (2) 37 = D (1)
50 = C (2) 30 = Gagal
Jika menggunakan batas lulus ideal, tidak dituntut perhitungan nilai rata-rata dan
simpangan baku. Batas lulus dan konversi nilai didasarkan atas batas lulus ideal,
nilai rata-rata ideal, dan simpangan baku ideal.
a) Konversi dengan menggunakan persen
Skor maksimum adalah 90, maka konversi nilai sebagai berikut
Tabel Kriteria Konversi Nilai
Skor Skor dicapai Standar Standar Standar
maksimum
Persentase 10 huruf 4
Skor = 90
(%)
90 - 99 81 – 89 9 A 4
80 – 89 72 – 80 8 B 3
70 – 79 63 – 71 7 C 2
60 – 69 54 – 62 6 D 1
Kurang dari Kurang dari Gagal Gagal Gagal
60 54
Nilai 10 diberikan pada skor 90 (benar semua)
Dari kriteria di atas, nilai yang dinyatakan lulus adalah peserta didik yang
mendapat skor di atas 54, yaitu ada enam orang.
b) Konversi nilai ke dalam standar 10
Berdasarkan batas lulus ideal, nilai rata-rata idealnya adalah setengah dari skor
maksimum, yaitu ½ (90) = 45, simpangan baku (S) ideal adalah sepertiga dari
rata-rata ideal, yaitu 1/3 (45) = 15. Dengan demikian maka nilai dalam standar
10 menjadi:
skor mentah standar 10
45 + 2,25 (15) 78,55 (dibulatkan 79) 10
45 + 1,75 (15) 71,25 (dibulatkan 71) 9
45 + 1,25 (15) 63,75 (dibulatkan 64) 8
45 + 0,75 (15) 56,25 (dibulatkan 56) 7
45 + 0,25 (15) 48,75 (dibulatkan 49) 6 (batas lulus)
45 - 0,25 (15) 41,25 (dibulatkan 41) 5
45 - 0,75 (15) 33,75 (dibulatkan 34) 4
45 - 1,25 (15) 26,25 (dibulatkan 26) 3
45 - 1,75 (15) 18,75 (dibulatkan 19) 2
45 - 2,25 (15) 11,25 (dibulatkan 11) 1
Dengan demikian, perolehan nilai dari 20 orang peserta didik adalah sebagai
berikut:
69 = 8 49 = 6
68 = 8 48 = 5
62 = 7 46 = 5
60 = 7 45 = 5
56 = 7 43 = 5
55 = 6 41 = 5
53 = 6 40 = 4
52 = 6 39 = 4
51 = 6 37 = 4
50 = 6 30 = 3
c) Konversi nilai ke dalam standar huruf dan 4
Seperti dalam standar 10 butir b) di atas, nilai rata-rata dan simpangan baku yang
digunakan untuk konversi ini adalah nilai rata-rata dan simpangan baku ideal.
Dalam hal ini M = 45, dan S = 15. Atas dasar itu maka konversi nilai sebagai berikut:
Tabel Kriteria Standar Huruf
Skor mentah Kelompok skor Standar huruf Standar 4
(batas bawah)
Dengan demikian, perolehan nilai dari 20 orang peserta didik adalah sebagai
berikut:
69 = A (4) 49 = C (2)
68 = A (4) 48 = C (2)
62 = B (3) 46 = C (2)
60 = B (3) 45 = C (2)
56 = B (3) 43 = C (2)
55 = B (3) 41 = C (2)
53 = B (3) 40 = C (2)
52 = C (2) 39 = C (2)
51 – C (2) 37 = D (1)
50 = C (2) 30 = D (1)
Pengolahan Data Hasil Non Tes
1. Pengolahan data hasil wawancara dan kuisioner
Dari data hasil wawancara dan atau kuisioner pada umumnya dicari frekuensi
jawaban responden untuk setiap alterlatif yang ada pada setiap soal. Frekuensi
yang paling tinggi ditafsirkan sebagai kecenderungan jawaban alat ukur tersebut.
sebaliknya, frekuensi yang paling rendah dapat ditafsirkan sebagai
kecenderungan jawaban yang tidak menggambarkan pendapat kebanyakan
responden. Sebagai contoh:
Melalui kuisioner ataupun wawancara diungkapkan pandangan peserta didik
mengenai guru diharapkan dalam:
1) Kemampuan mengajar
2) Hubungan dengan peserta didik
Kuisioner atau wawancara diajukan kepada 40 orang peserta didik dengan
pertanyaan sebagai berikut:
1) Guru yang saya harapkan adalah guru yang:
a. Menguasai bahan pelajaran atau pandai dalam bidang ilmunya.
b. Cara menjelaskan bahannya dapat saya pahami sekalipun tidak begitu
pandai.
c. Pandai dalam bidang ilmunya dan dapat menjelaskannya kepada peserta
didik dengan baik
2) Pada waktu mengajarkan bahan pelajaran:
a. Sebaiknya dimulai dari yang umum kemudian dibahas secara khusus.
b. Sebaiknya dimulai dari yang khusus, kemudian menuju kepada yang
umum.
c. Dimulai dari mana saya asal dijelaskan secara sistematis
3) Menurut pendapat saya, hubungan guru dengan peserta didik di dalam kelas:
a. Harus menjaga jarak agar tidak kehilangan wibawa
b. Tidak perlu menjaga jarak asal dalam batas-batas pendidikan
c. Mencerminkan hubungan orang tua dengan anak-anaknya.
4) Untuk membina hubungan guru dengan peserta didik, sebaiknya guru
berusaha untuk:
a. Memahami pribadi para peserta didiknya.
b. Melibatkan diri dalam berbagai kegiatan yang dilaksanakan oleh peserta
didik.
c. Bergaul dengan peserta didik dalam berbagai kesempatan.
Kuisioner yang telah diisi oleh peserta didik kemudian diperiksa dan diolah dengan
menghitung frekuensi jawaban seluruh peserta didik terhadap setiap pertanyaan
tersebut. misalnya hasil pemeriksaaan tersebut adalah sebagai berikut:
Tabel Frekuensi Jawaban Peserta Didik
Mengenai Masalah Kemampuan Guru Mengajar (n = 40)
Masalah yang diungkapkan f % Peringkat jawaban
1. Kemampuan mengajar
1.1 kemampuan mengajar
a. Menguasai bahan 4 10 3
b. Mampu menjelaskan bahan 12 30 2
c. Menguasai bahan dan mampu 24 60 1
menjelaskannya
1.2 Prosedur mengajarkan bahan
pelajaran 10 25 2
a. Dimulai dari yang umum 6 15 3
b. Dimulai dari yang khusus 24 60 1
c. Harus sistematis
Dari data di atas dapat ditafsirkan bahwa kemampuan guru mengajar yang
diharapkan oleh peserta didik adalah guru yang menguasai bahan pelajaran dan
dapat menjelaskannya agar dapat dipahami para peserta didik, sedangkan prosedur
mengajar yang diharapkan oleh peserta didik harus sistematis. Cara lain dalam
mengolah data di atas adalah dengan menggunakan chi kuadrat (2) dengan rumus:
2 = ∑
2 = ∑
Jawaban f0 fc f0 fc
1 Penguasaan bahan V
4 Penguasaan kelas V
A. Kesimpulan
Penilaian merupakan sebuah proses yang didesain untuk membantu guru
menemukanhal-hal yang telah dipelajari siswa di dalam kelas dan tingkat
keberhasilannya dalampembelajaran. Dalam pelaksanaannya, terdapat 2 metode
pendekatan dalam mengolah hasilevaluasi tersebut, yakni metode Pendekatan
Penilaian Acuan Patokan (PAP) danPendekatan Penilaian Acuan Norma (PAN).
Keduanya memiliki kesamaan, yang berbedahanya pada penghitungan Standar
deviasinya.Tes hasil belajar yang dilakukan secara tertulis dapat dibedakan menjadi
dua golongan,yaitu: tes hasil belajar (tertulis) bentuk uraian (subjective test = essay
test) dan hasil tesbelajar (tertulis) bentuk obyektif (objective test). Pengolahan hasil
penilaian merupakan suatu teknik mengolah data hasil pembelajaran siswa menjadi
suatu bentuk apresiasi berupa angka, huruf, atau deskripsi selama waktu
pembelajaran yg telah dilaluinya.
B. Saran
Hendaknya seorang tenaga pengajar dapat mengaplikasikan evaluasi terhadap
kegiatan belajar mengajar yang dilakukan di suatu lembaga pendidikan karena
dengan adanya evaluasi ini akan dapat menunjang kualitas dan mutu pendidikan
kita. Sebagaimana evaluasi hasil belajar dan pembelajaran yang telah diuraikan di
atas sangatlah penting karena dengan adanya hal tersebut kita dapat
belajar bagaimana cara mengevaluasi dari kegiatan belajarmengajar apakah sudah
dapat mencapai tujuan yang diinginkan.
DAFTAR PUSTAKA
Arifin, Zainal. 2006. Konsep Guru tentang Evaluasi dan Aplikasinya dalam Proses
Pembelajaran. Tesis. Bandung: Program Pascasarjana UPI
--------------------2009. Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya.
Depdiknas. 2001. Pedoman Umum Penyusunan Silabus Berbasis Kemampuan Dasar
Siswa Sekolah Menengah Umum (SMU). Jakarta, Dikmenum
Gronlund, E. Norman. 1984. Constructing Achievement Test. London: Prentice Hall
Tim Penyusun. 2007. Pedoman Sistem Penilaian Pendidikan Agama Islam Sekolah
Menengah Atas (SMA). Jakarta: Departemen Agama Republik Indonesia.