DISUSUN OLEH:
MATAKULIAH :
EVALUASI PEMBELAJARAN
DOSEN PENGAMPUH :
(STKIP-PGRI)LUBUKLINGGAU
TAHUNAKADEMIK
2021
A. TEKNIK PEMERIKSAAN HASIL TES HASIL BELAJAR
Dalam praktek, tes hasil belajar dapat diselenggarakan secara tertulis (=tes tertulis),
dengan secara lisan (= tes lisan)dan dengan tes perbuatan. Adanya perbedaan pelaksanaan tes
hasil belajar tersebut sudah barang tentu menuntut adanya pembedaan pula dalam
pemeriksaan hasil-hasilnya. Bagaimana cara melakukan pemeriksaan atau koreksi dalam
rangka penilaian hasil-hasil yang diperoleh dari ketiga jenis tes tersebut.
Tes hasil belajar yang diselenggarakan secara tertulis dapat dibedakan menjadi dua
golongan, yaitu : tes hasil belajar (tertulis)bentuk uraian (subjective test= essay test) dan tes
hasil belajar(tertulis)bentuk obyektif(objective test) . Karena kedua bentuk tes hasil belajar itu
memiliki karakteristik yang berbeda, sudah barang tentu teknik pemeriksaan hasil-hasilnya
pun berbeda pula.
Dalam pelaksanaan pemeriksaan hasil-hasil tes uraian ini ada dua hal yang perlu
dipertimbangkan, yaitu : (1). Apakah nantinya pengolahan dan penentuan nilai hasil tes
uraian itu akan didasarkan pada standar muthlaknya atau (2) apakah nantinya pengolahan dan
penentuan nilai hasil tes subyektif itu akan didasarkan pada standar relatif.
Apabila nantinya pengolahan dan penentuan nilai hasil tes uraian itu akan didasarkan
pada standar muthlak(dimana penentuan nilai secara muthlak akan didasarkan pada prestasi
individual),maka prosedur pemeriksaannya adalah sebagai berikut :
1) Membaca setiap jawaban yang diberikan oleh testee untuk setiap butir soal tes uraian
dan membandingkannya dengan pedoman/ancar-ancar jawaban betul yang sudah
disiapkan
2) Atas dasar hasil pembandingan antara jawaban testee dengan pedoman/ancar ancar
jawaban betul yang telah disiapkan itu, tester lalu memberikan skor untuk setiap buti
soal dan menuliskannya dibagian kiri dari jawaban testee tersebut
3) Menjumlahkan skor-skor yang telah diberikan kepada testee (yang nantinya akan
dijadikan bahan dalam pengolahan dan penentuan nilai lebih lanjut)
Adapun apabila nantinya pengolahan dan penentuan nilai akan didasarkan pada standar
relatif (dimana penentuan nilai akan didasarkan pada prestasi kelompok), maka prosedur
pemeriksaannya adalah sebagai berikut :
1. Memeriksa jawaban atas butir soal nomor satu yang diberikan oleh seluruh testee
sehingga diperoleh gambaran secara umum mengenai keseluruhan jawaban yang ada.
Dengan begitu testee dapat mengetahui keseluruhan jawaban yang ada, termasuk
lengkap atau tidak.
2. Memberikan skor terhadap jawaban soal nomor satu untuk seluruhtestee , misalnya
contoh untuk jawaban lengkap diberi skor 2, kurang lengkap skor 1 dan jawaban
menyimpang diberi skor 0
3. Setelah pemeriksaan atas jawaban butir soal nomor satu dari seluruh teestee dapat
diselesaikan, lalu dilanjutkan dengan pemeriksaan terhadap jawaban butir soal 2,
dengan cara yang sama dan ulangin pemberian skor pada butir soal selanjutnya
4. Setelah jawaban atas seluruh butir soal yang diberikan oleh seluruh testee dapat
diselesaikan, akhirnya dilakukanlah penjumlahan skor (yang nantinya akan dijadikan
bahan dalam pengolahan dan penentuan nilai)
Memeriksa atau mengoreksi jawaban soal-soal tes objektif pada umumnya dilakukan
dengan jalan menggunakan kunci jawaban. Ada beberapa macam kunci jawaban yang dapat
digunakan untuk mengoreksi jawaban soal tes objektif yaitu: (1) kunci berdamping(strip
keys), (2) Kunci sistem karbon(carbon system keys), (3)kunci sistem tusukan (pinprick
system keys), dan (4)kunci berjendela (windows keys). Contoh dari keempat jenis kunci
jawaban soal tes objektif itu adalah sebagai berikut :
Kunci jawaban berdampingan ini terdiri atas jawaban- jawaban betul yang ditulis
dalam satu kolom yang lurus dari atas kebawah. Kunci jawaban jenis pada kolom 1,yang
disusun lurus dari keatas kebawah. Adapun cara menggunakannya ialah dengan meletakkan
kunci jawaban tersebut berjajar dengan lembar jawaban yang akan diperiksa. Cocokkanlah
jawaban –jawaban yang diberikan testee dengan jawaban-jawaban yang tercantum pada kunci
jawaban. Jawaban yang cocok dengan kunci jawaban diisi /ditulis dengan tanda(+),
sedangkan jawaban-jawaban yang tidak cocok diisi tanda (-)
1. B - 1. S
2. B + 2. B
3. S - 3. B
4. S + 4. S
5. S - 5.B
2. Kunci sistem karbon(carbon syistem keys)
Wujud fisik dari kunci jawaban sistem karbon adalah sebagai berikut:
Lembar Jawaban
Nomor B S
1. X
2. X
3. X
4. X
5. X
Kunci jawaban
Nomor B S
1. X
2. X
3. X
4. X
5. X
Diatas ini adalah contoh hasil pekerjaan testee, dimana testee diminta membubuhkan
tanda silang(X) pada salah satu huruf abjad yang menurut nya jawaban yang betul. Kunci
jawaban ini diletakkan diatas lembaran jawaban yang sudah ditumpangi karbon. Kunci
jawaban yang telah dibubuhi tanda berupa lingkaran –lingkaran untuk setiap jawaban yang
betul.Jawaban testee yang berada pada luar lingkaran adalah salah . Sedangkan jawaban
dalam lingkaran adalah benar.
Apabila kunci berjendela ini akan kita gunakan untuk mengoreksi jawaban testee, maka
prosedur kerja yang kita tempuh adalah sebagai berikut :
Adapun wujud fisik dari kunci berjendela itu adalah seperti terlihat dibawah ini:
No B S
1. ▀▀
2. ▀▀ No B S
3. ▀▀ 1. I
4. ▀▀ 2. I
5. ▀▀ 3. I
4. I
5. I
Demikian seterusnya, dan penguji dapat saja menambahkan unsur-unsur lain yang dirasa
perlu dijadikan bahan penilaisan, seperti : kesopanan atau tingkah laku testee dalam
menghadapi penguji, kerapian dalam berpakaian, kedisiplinan waktu, dan sebagainya.
3. Teknik pemeriksaan dalam Rangka Menilai Hasil Tes perbuatan
Jika pada tes tertulis pemeriksaan hasilnya dilakukan dengan membaca lembar-lembar
jawaban testee, dan pada tes lisan pemeriksaan itu dilakukan lewat jawaban-jawaban lisan
yang diberikan oleh testee terhadap butir butir soal atau pertanyaan yang diajukan secara
lisan kepada mereka, maka pada tes perbuatan , “pemeriksaan” hasil-hasilnya dilakukan
dengan menggunakan observasi (pengamatan). Sasaran yang diamati adalah :tingkah laku,
perbuatan, sikap, dan sebagainya. Untuk dapat menilai hasil tes perbuatan itu diperlukan
adanya instrumen tertentu dan setiap gejala yang muncul diberi skor-skor tertentu pula.
Berikut ini adalah contoh instrumen yang dipergunakan dalam mengamati calon guru yang
melaksanakan praktek mengajar. Aapek-aspek yang diamati meliputi 7 unsur , dengan skor
minimum 1(paling jelek) dan skor maksimum 5(paling baik)
4. Pemberian motivasi 1 2 3 4 5
7. Kualitas penjelasan-penjelasan 1 2 3 4 5
Pemberian skor (= scoring) merupakan Langkah pertama dalam peroses pengolahan hasil tes,
yaitu proses pengubahan jawaban-jawaban soal tes menjadi angka-angka dengan kata lain,
pemberian skor itu merupakan Tindakan kuantifikasi terhadap jawaban-jawaban yang
diberikan oleh testee dalam suatu tes hasil belajar.
Cara pembuatan skor terhadap hasil tes hasil belajar pada umumnya disesuaikan
dengan bentuk soal-soal yang dikeluarkan dalam tes tersebut; apakah tes uraian ( essay test )
ataukah tes obyektif (objective test ).
Pada tes uraian, pemberian skor umumnya mendasarkan diri kepada bobot (= wight)
yang diberikan untuk setiap butir soal, atas dasar tingkat kesukarannya, atau atas dasar
banyak sedikitnya unsur yang harus terdapat dalam jawaban yang dianggap paling baik
(paling betul).
Pada tes obyektif, untuk memberikan skor umumnya digunakan rumus correction for
guessing atau sering dikenal dengan istilah system denda.
Untuk tes obyektif bentuk true-false misalnya, setiap item skor maksimum 1 (satu).
Apabila seorang testee menjawab betul satu item sesuai dengan kunci jawaban, maka
kepadanya diberikan skor 1. Apabila dijawab salah maka skornya 0 (nihil).
Adapun cara menghitung skor terakhir dari seluruh item bentuk true-false , dapat
digunakan dua macam rumus, yaitu (1) rumus yang memperhitungkan denda, dan (2) rumus
yang mengabaikan atau meniadakan denda. Penggunaan rumus-rumus itu sepenuhnya
diserahkan kepada kebijaksanaan tester, apakah dalam tes hasil belajar tersebut kepada testee
alan dikenai denda (bagi jawaban yang salah), ataukah tidak.
0–1
Dimana :
R= Jumlah Jawaban betul, yaitu jawaban yang sesuai dengan kunci jawaban ( R adalah
singkatan dari Right = Betul )
W= Jumlah jawaban salah, yaitu jawaban yang tidak sesuai dengan kunci jawaban (w
adalah singkatan dari Wrong = Salah)
O= option atau alternatif (=kemungkinan jawaban), di mana pada tes obyektif bentuk true
false ini kemungkinan jawabannya hanya dua, yaitu B (Betul) atau S (Salah).
1= Bilangan Konstan
Adapun rumus skor akhir yang tidak memperhitungkan denda adalah sebagai berikut.
S=R
Dimana :
Contoh.
Dalam tes hasil belajar bidang studi Ushul Figh yang diikuti oleh 40 orang siswa
Madrasah ‘ Aliyah diajukan 80 butir item tes obyektif, 20 butir diantaranya adalah tes
obyektif bentuk true-false, dengan ketentuan bahwa untuk setiap butir item yang dijawab
betul diberikan bobot 1 dan untuk setiap butir item yang dijawab salah diberikan bobot 0.
Dalam tes tersebut seorang siswa Bernama basirun dapat menjawab dengan betul
sebanyak 15 butir item (R=15); berarti jawaban yang salah = 20 – 15 (W = 5); sedangkan
optionnya = 2 (0 = 2).
Apabila terhadap jawaban salah itu dikenai sanksi berupa denda, maka skor akhir
yang diberikan kepada Basirun adalah :
Sedangkan apabila terhadap jawaban salah itu tidak dikenai sanksi berupa denda, maka skor
yang diberikan kepada Basirun itu adalah :
S = R = 15
Untuk tes obyektif bentuk matching,fill in dan completion, perhitungan skor akhir
pada umumnya tidak memperhitungkan sanksi berupa denda, sehingga rumus yang
digunakan adalah :
Dengan kata lain, skor yang diberikan kepada testee adalah sama dengan jumlah jawaban
betulnya.
Contoh :
Tes hasil belajar bjdang studi al-Quran-Hadits menyajikan 20 butir item bentuk
matching, 20 butir item bentuk fill in dan 20 butir item bentuk completion. Untuk butir-butir
soal bentuk matching siswa bernama Chumaidi menjawab betul 8 butir, bentuk fill in dijawab
betul 10 butir, sedangkan bentuk completion dijawab betul sebanyak 4 butir.
Dengan demikian skor yang diberikan kepada siswa Bernama Chumaidi adalah
sebagai berikut :
Adapun untuk tes obyektif bentuk multiple choice items dapat digunakan salah satu
dari dua buah rumus, yaitu rumus dengan denda atau rumus tanpa denda.
Rumus perhitungan skor dengan denda adalah :
S=R
Dimana :
1= Bilangan konstan.
Contoh :
Tes hasil belajar bidang studi Aqidah-Akhlaq menyajikan 40 butir item bentuk
multiple choice item, yang msing-masing itemnya dilengkapi dengan 5 buah option. Siswa
Bernama Dardiri dapat menjawab dengan betul sebanyak 32 butir item (R = 32), sehingga
jawaban salahnya adalah = 40 – 32 (W = 8).
Dengan demikian apabila pemberian skor akhir diperhitungkan sanksi berupa denda,
maka skor yang diberikan kepada siswa Bernama Dardiri itu adalah :
= 32 – 2
= 30
Jika tidak dikenai sanksi berupa denda, maka skor yang diberikan kepada siswa Bernama
Dardiri itu adalah S = R = 32.
Suatu hal yang perlu di catat ialah, bahwa karena tes obyektif bentuk multiple choice
item itu terdiri dari berbagai model yang masing-masing memiliki derajat kesukaran yang
berbeda , maka bobot jawaban betul yang diberikan belum tentu 1, melainkan bisa saja
diberikan bobot 1 ½ , 2, 2 ½, 3, 4 atau 5 misalnya.
Sehubungan dengan itu, maka apabila dalam pemberian skor itu ditentukan bobot
(=weight) yang berbeda-beda maka kedua rumus yang telah disebutkan di atas perlu
dimodifikasi menjadi sebagai berikut :
Contoh :
Tes hasil belajar bidang studi Bahasa arab menyajikan 50 butir item tes obyektif
bentuk multiple choice dengan rincian sebagai berikut :
Hal 10 2
Total 50 –
Misalkan dalam tes hasil belajar tersebut siswa Bernama Erlina, dari 50 butir item tes
tersebut dapat menjawab betul sebagai berikut :
Melengkapi berganda 4
Analisis kasus 3
Apabila dalam pemberian skor itu digunakan sanksi berupa denda, maka skor yang
diberikan kepada siswa Bernama Erlina adalah sebagai berikut :
No-
mor
01–10 Melengkapi 5 8 2 1
5 Pilihan
5 Pilihan
21–30 Melengkapi 5 4 6 1½
Berganda
31–40 Analisis 5 7 3 2
Hubungan
Antarhal
41–50 Analisis 5 3 7 4
Kasus
Total 15,25
Adapun apabila dalam pemberiaan skor dilakukan tanpa memperhitungkan denda,
maka dengan menggunakan rumus , skor yang diberikan kepada Erina adalah sebagai
berikut :
Total = 49
Kalau saja dalam tes hasil belajar tersebut seorang siswa dapat menjawab dengan
betul untuk keseluruhan item (50 butir item), maka skor yang diberikan kepada siswa tersebut
adalah:
Total = 100
- Untuk butir soal nomor 1 dapat dijawab dengan dengan sempurna, sehingga
diberikan skor 10
- Untuk butir soal nomor 2 hanya dijawab betul sebagian, sehingga skor yang
diberikan skor 5
- Untuk butir soal nomor 3 hanya sekitar seperempat bagian saja yang didapat dengan
betul, sehingga diberikan skor 2,5
- Untuk butir soal nomor 4 dijawab betul sekitar separuhnya, sehingga diberikan
dengan skor 5
- Untuk butir soal nomor 5 dijawab betul sekitar tiga perempatnya , sehingga
diberikan skor 7,5
Dengan demikian untuk kelima butir soal tes uraian tersebut, tes tersebut
mendapatkan skor sebesar = 10 + 5 + 2,5 + 5 + 7,5 = 30 . Angka 30 belum dapat
nilai, karena 30 tersebut merupakan skor mentah(raw score), yang untuk dapat disebut
nilai masih memerlukan pengolahan atau pegubahan (= konversi)
Adapun yang dimaksud dengan nilai adalah angka(bisa juga huruf), yang merupakan
hasil ubahan dari skor yang sudah dijadikan satu dengan skor –skor lainnya, serta disesuaikan
pengaturannya dengan standar tertentu. Itulah sebabnya mengapa nilai sering disebut skor
standar. Nilai pada dasarnya adalah angka atau huruf yang melambangkan : seberapa jauh
atau seberapa kemampuan yang telah ditunjukkan oleh testee terhadap materi atau bahan
yang diteskan , sesuai dengan tujuan instruksional khusus yang telah ditentukan.
Nilai, pada berdasarkan juga melambangkan penghargaan yang diberikan oleh testeer
kepada testee atas jawaban betul yang diberikan oleh testee dalam tes hasil belajar. Artinya,
makin banyak jumlah butir soal daapat dijawab dengan betul, maka penghargaan yang
diberikan oleh testeer kepada testee akan semakin tinggi dan sebaliknya.
2. Pengolahan dan Pengubahan Skor Mentah Hasil Tes Hasil Belajar Menjadi Nilai
Standar
Ada dua hal penting yang perlu dipahami dalam pengolahan dan pengubahan skor
mentah menjadi skor standar atau nilai, yaitu :
1. Bahwa dalam pengolahan dan pengubahan skor mentah menjadi standar ada dua cara
yang dapat ditempuh yaitu :
a. Bahwa pengolahan dan pengubahan skor mentah menjadi skor standar(nilai) itu
dilakukan dengan mengacu atau mendasarkan diri pada kriterium ( = patokan).
Ciri pertama ini sering dikenal dengan istilah criterion referenced evaluation,
yang dalam dunia pendidikan dikenal istilah penilaian beracuan patokan(PAP).
b. Bahwa pengolahan dan pengubahan skor menjadi nilai dilakukan dengan
mengacuh atau mendasarkan diri pada norma atau kelompok. Cara kedua ini
dikenal dengan istilah norm referenced evaluation, yang dalam dunia pemdidikan
dikenal istilah penilaian ber-acuan norma(PAN) atau penilaian ber-acuan
kelompok(PAK).
2. Bahwa pengolahan dan Pengubahan skor mentah menjadi nilai itu dapat
menggunakan berbagai macam skala, seperti : Skala lima (stanfive), yaitu nilai
standar berskla lima atau dikenal istilah nilai huruf A , B , C , D ,dan E . Skala
sembilan ( stanine) yaitu nilai standa berskala standar sembilan dimana rentangan
nilainya mulai dari 1 sampai 9(tidak ada nilai 0 dan tidak ada nilai 10). Skala sebelas
(stanel = standart eleven = eleven point scale) yaitu rentanagn nilai mulai dari 0
sampaii dengan 10. Zscore (nilai standar z) dan Tscore(nilai standar T)
Nilai standar dipergunakan pada lembaga pendidikan tingkat dasar dan tingkat menegah
adalah nilai standar berskala sebelas(stanel), sedangkan pada tingkat tinggi pada
umumnya digunakan nilai standar berskala lima atau nilai huruf.
a. Pengolahan dan Pengubahan Skor Mentah Hasil Tes Belajar menjadi Nilai
Standar dengan Mengacu atau Mendasarkan Diri Pada Kriterium(criterion
referenced evaluation)
1. Hal-hal yang harus dipelajari oleh testee adalah mempunyai struktur hierarkis tertentu
dan bahwa masing-masing taraf harus dikuasai secara baik sebelum testee tadi maju
atau sampai pada taraf selanjutnya.
Contoh :
Dalam memperlajari mata kuliah statistik pendidikan untuk sampai pada pemahaman
tentang t-test mahasiswa terlebih dahulu harus memahami konsep dasar tentang
standart error of mean(SEm). Konsep dasar ini tidak mungkin dapat dipahami secara
baik sebelum mahasiswa memahami konsep dasar tentang deviasi standar.
Selanjutnya sebelum mahasiswa memahami lebih dahulu konsep dasar tentang
simpangan(deviation)dan simpangan rata–rata(avarage, deviation, atau mean
deviation). Dan tidak mungkin mahasiswa untuk dapat memahami secara baik tentang
apa yang disebut simpangan. Sebelum mereka memahami lebih dahulu konsep dasar
rata-rata hitung yang sudah memiliki bekal pengetahuan tentang cara-cara membuat
tabel dan lainnya.
2. Evaluator dapat mengidentifikasi masing-masing taraf itu sampai tuntas , atau
setidaknya mendekati tuntas , sehingga dapat disusun alat pengukurnya.
Contoh:
Dalam mencari nilai rata-rata hitung , dapat dilakukan dengan identifikasi sebagai
berikut :
a. Apakah pembuatan tabel distribusi frekuensi dari data kuantitatif yang akan
dihitungnya sudah betul?
b. Jika tabel distribusi frekuensi sudah betul, apakah tidak ada kekeliruan dalam
menetapkan midpoint bagi setiap interval nilainya?
Apabila dalam menentukan nilai hasil tes belajar itu digunakan acuan kriterium, hal ini
mengandung arti bahwa nilai yang akan diberikan pada testee harus didasarkan pada standar
muthlak(standar absolut) artinya, pemberian nilai pada testee dilaksanakan dengan jalan
membandingkan antara skor mentah hasil tes yang dimiliki oleh masing-masing individu
dengan skor maksimum ideal(SMI) yang mungkin dapat dicapai oleh testee kalau dijawab
semua benar. Karena itu makan pada penentuan nilai mengacu pada kriterium, tinggi
rendahnya atau besar kecilnya nilai yang diberikan kepada masing-masing testee, muthlak
ditentukan jumlah skor yang didapat . Mengacu pada kiterium ini juga disebut penentuan
nilai secara teoritik.
Contoh :
Seorang dosen merencanakan tes hasil belajar . Soal-soal yang dikeluarkan dalam tes tersebut
terdiri dari 75 butir soal objektf dan 1 butir soal tes uraian dengan rincian sebagai berikut:
76 Tes Uraian 1 10 10
No
Urut Skor
siswa
1. 60
2. 40
3. 80
4. 30
5. 75
6. 52
7. 59
8. 71
9. 41
10. 58
11. 61
12. 56
13. 53
14. 63
15. 85
16. 54
17 60
18. 49
19. 55
20. 43
N SKO NILAI
O R
1. 60 60/120 X 100 = 50
2. 40 40/120 X 100 = 33
3. 80 80/120 X 100 = 67
4. 30 30/120 X 100 = 25
5. 75 75/120 X 100 = 62
6. 52 52/120 X 100 = 43
7. 59 59/120 X 100 = 49
8. 71 71/120 X 100 = 59
9. 41 41/120 X 100 = 34
10. 58 58/120 X 100 = 48
11. 61 61/120 X 100 = 51
12. 56 56/120 X 100 = 47
13. 53 53/120 X 100 = 44
14. 63 63/120 X 100 = 52
15. 85 85/120 X 100 =71
16. 54 54/120 X 100 = 45
17. 60 60/120 X 100 = 50
18. 49 49/120 X 100 = 41
19. 55 55/120 X 100 = 46
20. 43 43/120 X 100 = 36
Nilai 80 keatas = A
Angka persentasi tersebut mengenai tingkat kedalam atau tingkat penguasaan testee
terhadap materi tes. Karena nilai hasil tes yang ditentukan menggunakan standar muthlak
mengacu pada kriterium atau patokan maka testeer dapat mengetahui, siswa manakah yang
tingkat penguasaannya tergolong tinggi , sedang, dan rendah. Penilaian beracuan patokan
dimana dalam nilai hasil tes digunakan standar muthlak sangatlah cocok diterapkan pada tes -
tes formatif dimana testeer dapat mengetahui sudah sampai sejauh manakah siswanya
tebentuk setelah program pengajaran dalam jangka waktu tertentu.
Kelemahan dari penentuan nilai beracuan kriterium adalah bahwa butir-butir soal
yang dikeluarkan dalam tes hasil belajar terlalu sukar, maka dalam tes tersebut testee
sepandai apapun akan mendapatkan nilai yang rendah . Sebaliknya jika buti-butir soal
tersebut dikeluarkan sangat mudah ,maka testee sebodoh apapun akan berhasil meraih nilai
yang tinggi, sehingga gambaran tentang tingkat kemampuan atau penguasaan testee terhadap
materi tes tidak dapat diperoleh sesuai dengan kenyataan sebenarnya. Dalam hubungan ini
maka penilaian beracuan kriterium yang menggunakan standar muthlak sebaiknya diterapkan
pada tes hasil belajar apabila sudah bersifat standar dalam artian bahwa hasil tes belajar itu
sudah mengalami uji coba secara berulang-ulang dan telah memberikan bukti yang nyata
bahwa tes tersebut sudah memiliki sifat handal baik dilihat dari segi derajat kesulitan
itemnya, validitasnya, reliabilitas, serta daya pembeda itemnya.
b. Pengolahan dan Pengubahan Skor Mentah Hasil Tes Belajar Menjadi Nilai
Standar dengan Mendasarkan Diri atau mengacu Pada Norma atau kelompok
Pengolahan dan Pengubahan Skor Mentah Hasil Tes Belajar Menjadi Nilai Standar
dengan Mendasarkan Diri atau mengacu Pada Norma atau kelompok sering dikenal PAN atau
PAK . Penilaian ini mendasarkan diri pada asumsi sebagai berikut :
1. Bahwa setiap populasi peserta didik yang sifatnya heterogen(berbeda jenis kelamin ,
beda latar belakang dan lainnya), akan selalu didapati kelompok “baik”(kelompok
tinggi,atas, atau kelompok anak pandai), Kelompok “sedang” ( kelompok
tengah,cukup) , dan kelompok “kurang”(kelompok bawah, rendah serta kelompok
bodoh) . Asumsi ini menganduung makna bahwa pada setiap kegiatan pengukuran
dan penilaian hasil belajar peserta didik, sebagian besar dari peserta didik tersebut
nilai-nilai hasil belajarnya terkonsentrasi atau memusat disekitar nilai
pertengahan(nilai rata-rata), dan hanya sebagian saja yang nilainya sangat tinggi atau
sangat rendah.
2. Bahwa tujuan evaluasi hasil belajar adalah untuk menentukan posisi relatif dai para
peserta didik dalam hal yang sedang dievaluasi itu , yaitu : apakah seorang peserta tes
posisi relatif nya berada “diatas’ ataukah “dibawah”
Penilaian beracuan norma atau peniilaian beracuan kelompok atau dikenal istilah
penentuan nilai secara relatif atau standar relatif. Dikatakan demikian, sebab dalam
penentuan niai hasil tes, skor mentah hasil tes yang dicapai oleh testee diperbandingkan
dengan skor mentah yang dicapai testee lainnya, sehingga kualitas yang dimiliki oleh
testee akan sangat tergantung pada kualitas kelompoknya.
Dengan menggunakan standar relatif maka akan dapat terjadi, bahwa testee yang
sebenarnya pada kelompok 1 tergolong “hebat” (karena berhasil meraih skor hasil tes
yang tinggi)sehingga dia tergolong pada testee yang kategori “sangat pandai”,jika
dimasukkan dalam kelompok II, maka testee tersebut masuk dalam kelompok ”sedang”
dan sebagainya.
Istilah lain yang sering diberikan kepada penentuan nilai beracuan kelompok adalah :
penentuan nilai secara aktual, penentuan nilai secara empirik, atau penentuan nilai secara
das sein. Dikatakan penentuan nilai secara aktual, sebab disini penentuan nilai itu
didasarkan kepada distribusi skor yang secara aktual( menurut kenyataan)dicapai oleh
testee dalam suatu tes hasil belajar. Dikatakan penentuan nilai secara empirik atau
penentuan nilai secara das sein, sebab disini penentuan nilai dilakukan memperhatikan
atau mempertimbangkan hasil-hasil tes secara empirik yaitu skor-skor tes sebagaimana
dapat dilihat, diamati, atau disaksikan dalam praktek dilapangan,setelah tes tersebut dapat
berakhir,dan tidak mendasarkan diri pada patokan-patokan yang bersifat teoritik atau
ideal. Misalnya salah satu contoh relatif, siswa A mengikuti tes untuk mata berpelajaran
fisika berhasil meraih nilai 7, sedangkan rata-rata nilai kelas adalah 5 maka siswa A
tersebut tergolong kategori “pandai” , sebab nilai yang dicapai lebih tinggi dari nilai rata-
rata .
Apabila dalam penentuan nilai standar diguunakan standar relatif, maka prestasi
kelompok dapat dihitung dengan menggunakan metode statistik,dimana prestasi
kelompok atau nilai rata-rata kelas itu adalah identik dengan rata-rata hitung yang dapat
diperoleh dengan dipergunakan salah satu rumus dibawah ini :
(1). Mx = ΣX Atau
(2) Mx = ΣfX
(1). SDx =
Setelah diperoleh nilai rata-rata (M) dan Standar Deviasi (Sd), selanjutnya skor skor tes
tersebut dikonversi atau diubah menjadi nilai standar. Dalam evaluasi hasil belajar ada
beberapa jenis nilai standar seperti :
1. Nilai standar berskala lima (stanfive), yaitu nilai standar berskla lima atau dikenal
istilah nilai huruf A , B , C , D ,dan E .
2. Skala sembilan ( stanine) yaitu nilai standa berskala standar sembilan dimana
rentangan nilainya mulai dari 1 sampai 9(tidak ada nilai 0 dan tidak ada nilai 10).
3. Skala sebelas (stanel = standart eleven = eleven point scale) yaitu rentanagn nilai
mulai dari 0 sampaii dengan 10.
4. Zscore (nilai standar z) dan
5. Tscore(nilai standar T)
1. Pengubahan Skor Mentah Hasil Tes Menjadi Nilai Standar Berskala Lima
Pengubahan Skor Mentah Hasil Tes Menjadi Nilai Standar Berskala Lima, menggunakan
patokan sebagai berikut :
A
Mean +1,5 SD
B
Mean+0,5 SD
C
Mean -0,5 SD
D
Mean -1,5SD
E
Skor tanda/jari f
70-74 I 1
65-69 I 1
60-64 III 3
55-59 IIIII 5
24-29 IIII 4
20-24 II 2
15-19 I 1
Total 80 = N
Tabel 7.3 Perhitungan untuk mencari mean dan standar deviasi oleh 80 mahasiswa
70-74 1 72 +6 +6 36
65-69 1 67 +5 +5 25
60-64 3 62 +4 +12 48
55-59 5 57 +3 +15 45
50-54 9 52 +2 +18 36
45-49 15 47 +1 +15 15
35-39 13 37 -1 -13 13
30-34 8 32 -2 -16 32
25-29 4 27 -3 -12 36
20-24 2 22 -4 -8 32
15-19 1 17 -5 -5 25
Mx = M' + i . ∑ f x'
N
= 42 + 5 . 17
80
= 42 + 1,0625 = 43,0625
N N
Langkah ketiga, Mengubah skor-skor mentah menjadi nilai standar skala lima ,
dengan menggunakan paton seperti berikut :
A
Mean +1,5 SD = 43,0625 + (1,5)(10,2985) = 58,51025
B
Mean+0,5 SD = 43,0625 + (0,5)(10,2985) = 48, 21175
C
Mean -0,5 SD = 43,0625 – (0,5)(10,2985) = 37,91325
D
Mean -1,5 SD = 43,0625 – (1,5) (10,2985) = 27,61475
E
Dapat diketahui bahwa nilai C merupakan nilai minimal bagi peserta didik yang
dapat dinyatakan lulus dalam ujian maka dengan menggunakan standar mutlak , jumlah
peserta tes yang dinyatakan lulus adalah 2 oranf(2,50%)adapun sisanya yaitu 78 (97,50 %)
yang tidak lulus.
2. Pengubahan Skor Mentah Hasil Tes Menjadi Nilai Standar Berskala Sembilan
Jika skor –skor mentah hasil tes menjadi nilai standar berskala sembilan, maka patokan
yang dipergunakan adalah :
9
M+ 1,75 SD
8
M +1,25 SD
7
M + 0,75 SD
6
M + 0,25 SD
5
M - 0,25SD
4
M – 0,75 SD
3
M - 1,25 SD
2
M – 1,75 SD
1
Skala sembilan ( stanine) yaitu nilai standa berskala standar sembilan dimana rentangan
nilainya mulai dari 1 sampai 9(tidak ada nilai 0 dan tidak ada nilai 10).Nilai standar tersebut
tidak lazim digunakan di Indonesia
3. Pengubahan Skor Mentah Hasil Tes Menjadi Nilai Standar Berskala Sebelas
(stanel = standart eleven = eleven point scale)
Nilai Standar Berskala Sebelas (stanel = standart eleven = eleven point scale) yaitu
rentanagan nilai mulai dari 0 sampaii dengan 10. Jadi disini akan didapati 11 butir soal
standar yaitu nilai 0 – 10. Diindonesia , Nilai Standar Berskala Sebelas ini umumnya
digunakan pada lembaga tingkat dasar dan tingkat menengah . Pengubahan Skor Mentah
Hasil Tes Menjadi Nilai Standar Berskala Sebelas berpatokan sebagai berikut:
10
M+ 2,25 SD
9
M +1,75 SD
8
M + 1,25 SD
7
M + 0,75 SD
6
M + 0,25 SD
5
M – 0,25 SD
4
M - 0,75 SD
3
M – 1,25 SD
2
M – 1,75 SD
1
M – 2,25 SD
0
Contoh :
Misalkan dalam stkip pgri lubuklinggau studi pendidika fisikadiikuti 200 orang mahasiswa,
dimana SMI = 100, diperoleh penyebaran frekuensi skor-skor mentah sebagai berikut :
54-56 5
51-53 11
48-50 23
45-47 38
42-44 54
39-41 36
36-38 19
33-35 9
30-32 2
27-29 1
Total N = 200
Untuk mengubah skor mentah menjadi hasil tes adapun langkah yang harus ditempuh :
Tabel 7.3 Perhitungan untuk mencari mean dan standar deviasi oleh 200 mahasiswa
57-59 2 58 +5 +10 50
54-56 5 55 +4 +20 80
51-53 11 52 +3 +33 99
48-50 23 49 +2 +46 92
45-47 38 46 +1 +38 38
39-41 36 40 -1 -36 36
36-38 19 47 -2 -38 76
33 -35 9 32 -3 -27 81
30-32 2 31 -4 -8 32
27-29 1 28 -5 -5 25
Mx = M' + i . ∑ f x'
N
= 43 + 3 . 33
200
= 43 + 0,495 = 43,495
SD = 5,212
o Langkah kedua, mengkonversi skor mentah menjadi nilai standar berskala sebels
dengan berpatokan :
10
M+ 2,25 SD = 43,495 + (2,25)(5,212) =43,495 + 11,727= 55,222
9
M +1,75 SD = 43,495 + (1,75)(5,212) =43,495 + 9, 121= 55,616
8
M + 1,25 SD = 43,495 + (2,25)(5,212) =43,495 + 6,515 = 50,01
7
M + 0,75 SD = 43,495 + (2,25)(5,212) =43,495 + 3,909 = 47,004
6
M + 0,25 SD = 43,495 +( 0,25)(5,212) =43,495 + 1,303= 44,798
5
M – 0,25 SD= 43,495 - (0,25)(5,212) =43,495 - 1,303 = 42,192
4
M - 0,75 SD = 43,495 - (0,75)(5,212) =43,495 - 3,909 = 39,586
3
M – 1,25 SD= 43,495 - (1,25)(5,212) =43,495 - 6,515 = 36,980
2
M – 1,75 SD= 43,495 - (1,75)(5,212) =43,495 - 9,121 = 34,374
1
M – 2,25 SD = 43,495 - (2,25)(5,212) =43,495 - 11,727= 31,768
0
59 ke Atas 10
53-55 9
51-52 8
48-50 7
45-47 6
43-44 5
40-42 4
37-39 3
35-36 2
32-34 1
31 Ke Bawah 0
o Langkah keempat melakukan konversi skor mentah yang dimiliki oleh masing masing
individu,menjadi nilai berskala sebelas stanel.
Misalkan siswa dengan no urut 1,2,3,4,dan 5 masing-masing memiliki skor mentah
sebesar 38, 59, 45, 52, dan 44,nilai stanel yang dapat diberikan pada kelima siswa
tersebut adalah sebagai berikut :
No Skor Nilai 4.Pengubahan Skor Mentah Hasil Tes Menjadi Nilai Standar
Urut mentah Stanel Z(Z score)
maha Nilai Standar Z(Z score)umumnya dipergunakan untuk
siswa mengubah skor-skor mentah diperoleh dari berbagai jenis
1. 38 3
pengukuranyang berbeda-beda. Misalnya pada tes seleksi
2. 59 10
3. 45 6 peneimaan pramugara-pramugari diikuti 0 orang testee,
4. 52 8 dalam tes mana testee yang dihadapkan pada lima jenis tes
5. 44 5 yaitu: Tes bahasa inggris,(X1), Tes IQ (X2), Tes
kepribadian (X3), Tes sikap(X4), Tes jasmani dan Rohani
(X5). Maka skor-skor mentah yang diperoleh dari lima jenis tes cara pengukuran dan
penilaian yang berbeda lihat pada tabel 7.7 itu adalah sangatlah bervariasi. Berhubung dengan
itu maka untuk dapat menentukan siapakah 10 testee tersebut dipandang lebih unggul dari
testee lainnya diperlukan adanya skor atau nilai yang bersifat baku(standar), diman dengan
nilai standar kita dapat dapat mengetahui kedudukan relatif.