Anda di halaman 1dari 294

Evaluasi Pembelajaran

KATA PENGANTAR

Puji Syukur kami panjatkan pada Tuhan Yang Maha


Kuasa, bahwa Jurusan Ilmu Sosial Politik Fakultas
Ilmu Sosial Universitas Negeri Jakarta untuk pertama
kalinya dapat menerbitkan buku-buku bahan ajar untuk
mahasiswa, dimana buku ini diharapkan akan menjadi
pegangan mahasiswa sebagai salah satu media dan refensi
belajar dalam menempuh perkuliahannya, meskipun tidak
menutup kemungkinan untuk pihak lain baik mahasiswa
di luar Jurusan Ilmu Sosial Politik Fakultas Ilmu Sosial
Universitas Negeri Jakarta maupun masyarakat umum
untuk menjadikan buku ini sebagai sumber belajar.
Para penulis telah berusaha keras untuk menyelesaikan
penyusunan buku ini, untuk itu kami selaku lembaga
yang bertanggung jawab dalam penerbitan buku ini
mengucapkan banyak terima kasih atas segala dedikasinya
dan berkerja sama dengan baik untuk terbitnya buku-buku
bahan ajar ini.
Ucapan terima kasih juga kami sampaikan kepada
Rektor Universitas Negeri Jakarta, Pembantu Rektor I
Universitas Negeri Jakarta, Dekan Fakultas Ilmu Sosial
Universitas Negeri Jakarta, Kepala Laboratorium Sosial
Politik Universitas Negeri Jakarta, serta pihak-pihak lain
yang tidak kami sebutkan yang telah memberikan bantuan
moril maupun materilnya sehingga buku ini dapat terbit.
Kepada mahasiswa semoga buku bahan ajar ini dapat
menjadikan inspirasi dan motivasi untuk belajar lebih

iii
Evaluasi Pembelajaran

baik dan menjadi manusia pembelajar, sehingga dapat


mencapai cita-citanya dikemudian hari. Amin.
Kami sadar bahwa dalam penerbitan buku-buku bahan
ajar ini tidak luput dari berbagai kekurangan sehingga
dengan lapang dada akan kami terima berbagai masukan
yang bersifat konstruktif dan edukatif bagi perbaikan
penerbitan buku-buku bahan ajar di tahun berikutnya.
Terima kasih.

Jakarta , Februari 2011


Ketua Jurusan Ilmu Sosial Politik
Fakultas Ilmu Sosial Universitas Negeri Jakarta

Dra. Hj. Etin Solihatin, M.Pd


NIP. 19660101.198903.2.003

iv
Evaluasi Pembelajaran

DAFTAR ISI

HALAMAN JUDUL ~ i
KATA PENGANTAR ~ iii
DAFTAR ISI ~ v

BAB I.
PENGERTIAN, ACUAN, DAN PRINSIP PENILAIAN ~ 1
A. Tujuan Pembelajaran ~ 1
B. Materi Pokok ~ 1
C. Uraian Materi ~ 1
1. Pengertian Pengukuran, Penilaian, dam Evaluasi ~ 1
2. Acuan Penilaian ~ 5
3. Prinsip-prinsip penilaian ~ 9
BAB II.
PROSEDUR, JENIS, TEKNIK, DAN INSTRUMEN
PENILAIAN ~ 19
A. Tujuan Pembelajaran ~ 19
B. Pokok Bahasan ~ 19
D. Uraian Materi ~ 19
1. Kajian Materi Pembelajaran ~ 19

v
Evaluasi Pembelajaran

2. Memilih Teknik Penilaian ~ 20


3. Perumusan Kisi – kisi ~ 20
BAB III.
PENGEMBANGAN INSTRUMEN PENILAIAN ~ 43
A. Tujuan Pembelajaran ~ 43
B. Materi Pokok ~ 43
C. Uraian Materi ~ 43
A. Pengembangan Instrumen Tes ~ 43
B. Pengembangan Instrumen Notes ~ 96
BAB IV.
VALIDITAS DAN RELIABILITAS INSTRUMEN ~ 119
A. Tujuan Pembelajaran ~ 119
B. Pokok Bahasan ~ 119
C. Uraian Materi ~ 119
1. Validitas ~ 119
2. Reliabilitas ~ 126
3. Ragam pengujian Validitas ~ 129
4. Ragam Pengujian Reliabilitas Tes ~ 147
BAB V.
TARAF KESUKARAN, DAYA PEMBEDA, DAN DAYA
KECOH (ANALISIS TES) ~ 163
A. Tujuan Pembelajaran ~ 163
B. Materi Pokok ~ 163
C. Uraian Materi ~ 163

vi
Evaluasi Pembelajaran

1.Pengantar ~ 163
a. Taraf kesukaran ~ 168
b. Daya Pembeda ~ 171
c. Pola Jawaban Soal (Daya Kecoh atau Distraktor)
~ 181
BAB VI.
PENGOLAHAN DATA ~ 185
A. Tujuan Pembelajaran ~ 185
B. Materi Pokok ~ 185
C. Uraian Materi ~ 186
1. Jenis-Jenis Acuan/Norma ~ 186
2. Jenis Skala Nilai ~ 187
3. Proses Penilaian Berdasarkan Norma Absolut ~ 192
4. Proses Penilaian Berdasarkan Norma Relatif ~ 200
BAB VII.
PELAKSANAAN, PEMANFAATAN DAN TINDAK LANJUT
~ 219
A. Tujuan Pembelajaran ~ 219
B. Materi Pokok ~ 219
C. Uraian Materi ~ 220
A. Pelaksanaan penilaian ~ 220
B. Pelaporan Hasil Penilaian ~ 223
C. Pemanfaatan Hasil Penilaian ~ 224
D. Tindak Lanjut ~ 230

vii
Evaluasi Pembelajaran

BAB VIII
PERUBAHAN SKOR MENJADI NILAI ~ 233
A. Acuan / Norma / Standar ~ 233
B. Jenis Skala Nilai ~ 235
C. Proses Penilaian Berdasarkan Norma Absolut ~ 242
D. Proses Penilaian Berdasarkan Norma Relatif ~ 252
DAFTAR PUSTAKA ~ 279

viii
Evaluasi Pembelajaran

BAB I
PENGERTIAN, ACUAN, DAN
PRINSIP PENILAIAN

A. TUJUAN PEMBELAJARAN
Setelah mempelajari materi ini diharapkan mahasiswa
memiliki kompetensi berikut:
1. Menjelaskan pengertian penilaian, pengukuran
dan evaluasi
2. Membedakan Penilaian Acuan Kriterian (PAK) dan
Penilaian Acuan Norma (PAN)
3. Menyimpulkan prinsip-prinsip penilaian
B. MATERI POKOK
Untuk mencapai tujuan tersebut maka materi pokok
atau subpokok bahasan yang akan diberikan adalah:
1. Pengertian Pengukuran, Penilaian, dan Evaluasi
2. Acuan Penilaian (PAK dan PAN)
3. Prinsip-prinsip Penilaian
C. URAIAN MATERI
1. Pengertian Pengukuran, Penilaian, dan Evaluasi
Penggunaan istilah pengukuran, penilaian,
dan evaluasi dalam pendidikan sering menimbulkan
kekacauan pengertian. Walaupun ketiga kata
1
Untuk mencapai tujuan tersebut maka materi pokok atau subpokok bahasan yang akan
diberikan adalah:
1. Pengertian Pengukuran, Penilaian, dan Evaluasi
2. Acuan Penilaian (PAK dan PAN)
Evaluasi Pembelajaran
3. Prinsip-prinsip Penilaian
tersebut mempunyai hubungan yang erat, dalam arti
memiliki keterkaitan satu sama lain, namun ketiganya
C. URAIAN MATERI
mempunyai pengertian yang berbeda.
1. Pengertian Pengukuran,
Penilaian,
Pengukuran dan Evaluasi
adalah proses menerapkan alat
ukur
Penggunaan terhadap
istilah sesuatu
pengukuran, obyek,dan
penilaian, bisaevaluasi
barangdalam
maupun
pendidikan sering
menimbulkan gejala menurut
kekacauan aturan-aturan
pengertian. Walaupuntertentu.
ketiga Pengukuran
kata tersebut mempunyai
hubungan yang erat, dalam artidalam
(measurement) memiliki keterkaitanmenggunakan
pendidikan satu sama lain,alat
namun ketiganya
mempunyai pengertian
ukur berupayang tes
berbeda.
maupun non tes.
Pengukuran
adalah prosesseorang
Apabila menerapkan
gurualat ukur terhadap
memberikan sesuatu
ujian obyek, bisa barang
kepada
maupun gejala menurut aturan-aturan tertentu. Pengukuran (measurement) dalam
siswa, kemudian
pendidikan menggunakan alat ukurmemeriksa hasil ujian
berupa tes maupun tersebut dan
non tes.
memberikan skor (dalam rentang 0 sampai 100)
Apabila seorang guru memberikan ujian kepada siswa, kemudian memeriksa hasil
sebagai berikut:
ujian tersebut dan memberikan skor (dalam rentang 0 sampai 100) sebagai berikut:
Tabel 1. Daftar Perolehan Skor Tes Siswa

No Nama Skor tes Keterangan

1 Ali Akbar 80

2 Aminah 75

3 Badaruddin 78

dst .......................... ...

maka, proses maka, proses


menyatakan menyatakan
aspek-aspek aspek-aspek
tertentu tertentu
dari hasil ujian siswadari
ke dalam bentuk
hasil ujian
angka-angka itulah yang siswa ke dalam
dinamakan bentukProses
pengukuran. angka-angka
pengukuran itulah
kemampuan siswa
yang
dilakukan secara dinamakan
tidak pengukuran.
langsung, artinya Proses
berapa skor pengukuran
yang diperoleh seorang siswa baik
kemampuan siswa dilakukan secara tidak langsung,
1
artinya berapa skor yang diperoleh seorang siswa
baik mengenai kemampuan kognitif, afektif, maupun
psikomotornya dilakukan melalui sistem pengujian
dengan mengerjakan tes atau tugas-tugas lain, dan
hasil pekerjaan tes maupun tugas-tugas itulah yang

2
Evaluasi Pembelajaran

diberi skor. Proses pengukuran dalam pendidikan


merupakan tahap awal dalam proses penilaian.
Istilah penilaian (assessment) dalam pendidikan
merupakan proses pengumpulan dan pengolahan
informasi untuk mengukur dan menetapkan tingkat
pencapaian hasil belajar siswa. Informasi yang
telah dikumpulkan melalui pengukuran diolah
menjadi data yang digunakan untuk menetapkan
tingkat pencapaian standar kompetensi yang telah
ditentukan. Berdasarkan informasi yang telah diolah
tersebut kemudian diputuskan dalam bentuk nilai
yang bersifat kualitatif seperti baik sekali, baik,
cukup, kurang, dan kurang sekali, atau, secara lebih
tegas keputusan tersebut bisa dalam bentuk lulus
atau tidak lulus. Atau berbentuk kuantitatif, seperti
10, 9, 8, 7, 6 atau bentuk kuantitatif lainnya. Proses
mengolah data (skor) menjadi nilai ini yang disebut
penilaian. Jadi, pengukuran adalah proses yang
menghasilkan skor (kuantitatif), sedangkan penilaian
adalah proses yang menghasilkan nilai (kualitatif,
atau bersifat kuantitatif). Berdasarkan penjelasan di
atas, tampak jelas adanya hubungan yang sangat erat
antara penilaian dan pengukuran dalam pendidikan.
Penilaian tanpa melalui proses pengukuran akan
sangat subyektif dan sulit dipertanggungjawabkan.
Secara umum penilaian hasil belajar bertujuan
untuk: (a) mengetahui tingkat pencapaian kompetensi
siswa, (b) mengukur pertumbuhan dan perkembangan
kemampuan siswa, (c) mendiagnosis kesulitan
belajar siswa, (d) mengetahui hasil pembelajaran, (e)
mengetahui pencapaian kurikulum, (f) mendorong
siswa untuk belajar, dan (g) mendorong guru agar
memiliki kemampuan mengajar lebih baik.
3
Evaluasi Pembelajaran

Penilaian hasil belajar oleh guru dilakukan secara


berkesinambungan untuk memantau proses,
kemajuan, dan perbaikan hasil dalam bentuk ulangan
harian, ulangan tengah semester, ulangan akhir
semester, dan ulangan kenaikan kelas. Penilaian oleh
guru digunakan untuk menilai pencapaian kompetensi
peserta didik, bahan penyusunan laporan kemajuan
hasil belajar, dan memperbaiki proses pembelajaran.
Sekedar untuk diketahui, selain penilaian
hasil belajar oleh pendidik terdapat penilaian hasil
belajar yang dilakukan oleh satuan pendidikan dan
pemerintah. Penilaian hasil belajar oleh satuan
pendidikan bertujuan menilai pencapaian standar
kompetensi lulusan untuk semua mata pelajaran.
Standar kompetensi lulusan adalah kualifikasi
kemampuan lulusan yang mencakup sikap,
pengetahuan, dan keterampilan.
Penilaian hasil belajar oleh Pemerintah bertujuan
untuk menilai pencapaian kompetensi lulusan
secara nasional pada mata pelajaran tertentu dalam
kelompok mata pelajaran ilmu pengetahuan dan
teknologi dan dilakukan dalam bentuk ujian nasional.
Di samping penilaian sebagai terjemahan dari
assessment terdapat istilah evaluasi (evaluation)
yang merupakan penilaian terhadap keseluruhan
program pendidikan mulai dari perencanaan program,
pelaksanaan program (termasuk di dalamnya
pelaksanaan penilaian), serta hasil-hasil yang dicapai
oleh program pendidikan. Evaluasi pendidikan
adalah kegiatan pengendalian, penjaminan, dan
penetapan mutu pendidikan terhadap berbagai
komponen pendidikan pada setiap jalur, jenjang, dan

4
Evaluasi Pembelajaran

jenis pendidikan. Begitu luasnya cakupan evaluasi


pendidikan sehingga dengan demikian penilaian
pendidikan merupakan bagian kecil saja dari evaluasi
pendidikan.
Hubungan antara pengukuran, penilaian dan
evaluasi dapat dilihat dalam gambar berikut.
Gambar 1. Hubungan Pengukuran, Penilaian,
dan Evaluasi

Evaluasi
(Evaluation)
Penilaian
(Assessment)
Pengukuran
(Measurement)

Keterangan gambar:
- Pengukuran merupakan tahap awal dalam proses penilaian.
- Penilaian merupakan salah satu aspek dari$ evaluasi pendidikan.
- Evaluasi merupakan penilaian terhadap keseluruhan program pendidikan.

2. Acuan Penilaian
2. Acuan
Penilaian
Pengambilan keputusan terhadap hasil
belajar siswa dilakukan
Pengambilan keputusan berdasarkan
terhadap hasilpertimbangan
belajar siswa dilakukan
pertimbangan tertentu sebagai acuan penilaian untuk
tertentu sebagai acuan penilaian untuk menetapkan menetapkan pencapai
siswa.
pencapaian hasil belajar siswa.
Pada umumnya dikenal dua macam acuan penilaian, yaitu Acuan Krit
Pada umumnya dikenal dua macam acuan
Reference) dan Acuan Norma (Norm Reference). Meskipun demikian
menambahkan satu acuan lagi yang disebut Acuan Perbuatan Sendiri (Sel
Standard). 5
a. Penilaian Acuan Kriteria. Dinamakan demikian karena digunakan k
yang bersifat mutlak (tetap) sehingga dinamakan juga sebagai Standar M
Evaluasi Pembelajaran

penilaian, yaitu Acuan Kriteria (Criterion Reference)


dan Acuan Norma (Norm Reference). Meskipun
demikian ada pula yang menambahkan satu acuan
lagi yang disebut Acuan Perbuatan Sendiri (Self
Performance Standard).
a. Penilaian Acuan Kriteria. Dinamakan demikian
karena digunakan kriteria tertentu yang bersifat
mutlak (tetap) sehingga dinamakan juga sebagai
Standar Mutlak, artinya standar yang tidak bisa
ditawar-tawar lagi dan tidak dipengaruhi oleh
prestasi kelompok siswa. Kriteria keberhasilan
siswa telah ditentukan sebelumnya dengan
menetapkan standar penguasaan minimal,
misalnya untuk dapat dinyatakan lulus suatu mata
pelajaran tertentu siswa harus menguasai sekurang-
kurangnya 60 % dari kompetensi yang ditetapkan.
Acuan tersebut untuk kurun waktu berikutnya bisa
terus ditingkatkan seiring dengan upaya untuk
meningkatkan kualitas lulusan sehingga semakin
mendekati pencapaian kompetensi ideal (100%).
Apabila suatu sekolah pada awal tahun pelajaran
telah menetapkan bahwa untuk dapat dinyatakan
lulus suatu mata pelajaran dipersyaratkan misalnya
standar penguasaan minimal 70% atau dengan
kata lain dengan rentangan penilaian 0 sampai
dengan 10 kriteria kelulusannya adalah 7,00, maka
bagi siswa yang belum mencapai kriteria tersebut
dinyatakan tidak lulus. Sedangkan siswa yang
telah mencapai nilai 7,00 atau lebih dinyatakan
lulus. Oleh karena Penilaian Acuan Kriteria ini tidak
memperhatikan prestasi rata-rata kelompok siswa,
melainkan berdasarkan pencapaian kompetensi
siswa secara individual, maka secara ekstrim bisa

6
Evaluasi Pembelajaran

saja terjadi semua siswa satu kelas tidak lulus


karena memang semuanya tidak dapat mencapai
standar penguasaan minimal yang telah ditetapkan
sebelumnya, atau terjadi sebaliknya siswa lulus
semua karena semua telah mencapai standar
penguasaan minimal. Asumsi penggunaan acuan
kriteria adalah:
a) Semua orang bisa belajar apa saja, hanya
waktu yang diperlukan berbeda.
b) Skor/nilai yang diperoleh dari suatu tes/
tugas menunjukkan tingkat pencapaian
standar kompetensi atau kompetensi dasar
yang telah ditentukan.
c) Standar kompetensi harus ditentukan
terlebih dahulu.
d) Hasil penilaian: Lulus dan Tidak Lulus;
Kompeten dan Tidak Kompeten.

b. Penilaian Acuan Norma. Istilah lain yang sering


digunakan adalah Penilaian Standar Relatif.
Keberhasilan seorang siswa ditentukan oleh
posisinya di antara kelompok siswa yang mengikuti
ujian. Dengan kata lain keberhasilan seorang siswa
dipengaruhi oleh prestasi rata-rata kelompok.
Misalnya, ujian pada suatu kelas diperoleh nilai
rata-rata 45 (dari rentangan 0 s.d. 100), maka siswa
yang memperoleh nilai 45 atau lebih dinyatakan
lulus, sedangkan siswa yang memperoleh di bawah
45 dinyatakan tidak lulus. Pada kelas yang lain
nilai rata-rata kelas misalnya 65, maka siswa yang
mendapatkan nilai di bawah 65 dinyatakan tidak

7
Evaluasi Pembelajaran

lulus. Dengan demikian kriteria keberhasilan siswa


pada masing-masing kelas atau kelompok siswa
tidak sama. Keberhasilan seorang siswa baru dapat
ditentukan setelah prestasi kelompok diketahui.
Asumsi penggunaan acuan norma adalah:
a) Kemampuan orang berbeda-beda
b) Tes harus bisa membedakan orang
c) Baik buruknya butir soal/tugas dilihat dari
tingkat kesulitan dan daya beda.
d) Hasil penilaian dibandingkan dengan
kelompoknya.
e) Penentuan nilai menggunakan distribusi
normal.
Seiring dengan pemberlakuan Permendiknas
No. 22 Tahun 2006 tentang Standar Isi yang masih
tetap berbasis kompetensi, dengan penekanan pada
keberhasilan siswa untuk menguasai kompetensi yang
standarnya telah ditetapkan, maka konsekuensinya
acuan penilaian yang paling tepat adalah Penilaian
Acuan Kriteria (Acuan Mutlak/Patokan). Dengan
demikian standar ketuntasan pencapaian kompetensi
harus ditentukan lebih dulu sebagai patokan untuk
penentuan hasil penilaian lulus atau tidak lulus.
Dengan menggunakan Acuan Kriteria yang diterapkan
secara konsisten dari waktu ke waktu, sementara
secara bersamaan dilakukan perbaikan pada sistem
pendidikan secara menyeluruh maka akan terwujud
hasil lulusan yang berkualitas tinggi.
Peraturan Pemerintah Nomor 19 Tahun 2005
menegaskan tentang sejumlah standar yang berkaitan
dengan penilaian sebagai berikut: (a) Standar penilaian
8
Evaluasi Pembelajaran

pendidikan adalah standar nasional pendidikan


yang berkaitan dengan mekanisme, prosedur, dan
instrumen penilaian hasil belajar peserta didik (b)
Standar isi adalah ruang lingkup materi dan tingkat
kompetensi yang dituangkan dalam kriteria tentang
kompetensi tamatan, kompetensi bahan kajian,
kompetensi mata pelajaran, dan silabus pembelajaran
yang harus dipenuhi oleh peserta didik pada jenjang
dan jenis pendidikan tertentu, (c) Standar proses
adalah standar nasional pendidikan yang berkaitan
dengan pelaksanaan pembelajaran pada satu satuan
pendidikan untuk mencapai kompetensi lulusan. Pada
akhirnya ditentukan standar kompetensi lulusan,
yaitu kualifikasi kemampuan lulusan yang mencakup
sikap, pengetahuan, dan keterampilan.
3. Prinsip-prinsip Penilaian
a. Validitas dan Reliabilitas
Valid berarti cocok, sahih, atau sesuai. Penilaian
dikatakan valid apabila penilaian itu benar-benar
dapat memberikan informasi atau bukti-bukti yang
sesuai dengan apa yang seharusnya dinilai. Untuk
mengetahui panjang suatu benda digunakan
meteran, untuk mengetahui panas badan
digunakan thermometer, untuk mengetahui berat
benda digunakan timbangan. Meskipun demikian
tidak semua meteran cocok untuk mengukur
panjang benda. Meteran kain yang biasa digunakan
oleh penjahit tentu tidak valid untuk mengukur
panjangnya lapangan. Timbangan untuk beras
tentu tidak valid digunakan untuk menimbang
emas.

9
benda digunakan timbangan. Meskipun demikian tidak semua meter
mengukur panjang benda. Meteran kain yang biasa digunakan oleh
tidak valid untuk mengukur panjangnya lapangan. Timbangan untuk b
valid digunakan untuk menimbang emas.
Evaluasi Pembelajaran

Gbr 2. Alat ukur dan peruntukkannya

Untuk mengukur suhu/panas.

thermometer

Untuk menimbang emas.

timbangan

Untuk menakar isi air/minyak.


literan

penggaris

Untuk mengukur panjang/lebar

Demikian pula dalam pendidikan. Tidak semua


Demikian
jenis pula dalam
instrumen pendidikan.
penilaian valid Tidak
untuksemua jenis instrumen penila
mengukur
kemampuan siswa. Validitas suatu instumen penilaian sa
mengukur kemampuan siswa. Validitas suatu instumen
pada tujuan dan situasi penilaian. Salah satu validitas penilaian a
penilaian sangat tergantung pada tujuan dan
kurikuler, yaitu valid dan tidak validnya penilaian ditinjau dari isi ku
situasi penilaian.
membuat instrumen Salah satuagar
penilaian validitas penilaian
valid harus menyesuaikan denga
adalah
yang validitas
berlaku. kurikuler, yaitu valid
Ketika kurikulum dan menggunakan
sekolah tidak pende
validnya penilaian
kompetensi ditinjau
yang telah dari isistandar
menetapkan kurikulum.
kompetensi, kompete
sejumlah
Untuk indikator
membuat pencapaiannya
instrumen sertaagar
penilaian materi
valid pelajarannya, m
harus menyesuaikan dengan isi kurikulum yangkurikulum terseb
penilaian harus benar-benar menyesuaikan dengan isi
itu dalam
berlaku. menyusun
Ketika instrumen
kurikulum penilaian
sekolah perlu dilakukan analisis te
menggunakan
pencapaian kompetensi, analisis tentang bobot taksonominya (ko
pendekatan berbasis sehingga
ataukah psikomotor), kompetensi
instrumenyangpenilaian
telah yang dibuat
menetapkan
kurikulum. standar
Perlu juga kompetensi,
diperhatikan kompetensi
meskipun indikator
dasar dan sejumlah indikator pencapaiannya
menitikberatkan pada pencapaian aspek psikomotor, sertatidak berarti ba
penilaiannya
materi hanya menilai
pelajarannya, makapsikomotor,
instrumen tetapi perlu pula memperhatik
penilaian
pendidikan
harus yang lain, menyesuaikan
benar-benar yaitu pengetahuan dengan
dan sikap. Begitu
isi pula seteru
kompetensinya ada pada afektif, maka aspek pengetahuan da
diperhatikan. Dengan demikian penilaian dapat dilakukan secara kom
10

5
Evaluasi Pembelajaran

kurikulum tersebut. Oleh karena itu dalam


menyusun instrumen penilaian perlu dilakukan
analisis tentang indikator pencapaian kompetensi,
analisis tentang bobot taksonominya (kognitif,
afektif, ataukah psikomotor), sehingga instrumen
penilaian yang dibuat sesuai dengan kurikulum.
Perlu juga diperhatikan meskipun indikator
kompetensinya menitikberatkan pada pencapaian
aspek psikomotor, tidak berarti bahwa semua alat
penilaiannya hanya menilai psikomotor, tetapi
perlu pula memperhatikan aspek tujuan pendidikan
yang lain, yaitu pengetahuan dan sikap. Begitu
pula seterusnya bila bobot kompetensinya ada
pada afektif, maka aspek pengetahuan dan sikap
perlu diperhatikan. Dengan demikian penilaian
dapat dilakukan secara komprehensif. Oleh karena
itu setiap indikator pencapaiannya perlu dinilai
dengan beberapa soal ujian (tiga soal atau lebih).
Reliabel, artinya dapat dipercaya/diandalkan.
Hasil penilaian akan konstan atau tetap, tidak
menunjukkan perubahan-perubahan yang
mencolok bila diterapkan pada siswa yang relatif
mempunyai kemampuan yang sama. Agar penilaian
memperoleh tingkat reliabilitas yang tinggi perlu
diperhatikan antara lain:
a. Dalam menyusun alat penilaian, perumusan
pertanyaan-pertanyaan atau tugas-tugas
dengan kalimat yang sederhana dan
jelas. Hindari pertanyaan atau tugas yang
ambiguous (pertanyaan atau tugas yang
memungkinkan banyak tafsiran). Jumlah
pertanyaannya mencukupi, sebab dengan
pertanyaan atau tugas yang jumlahnya
11
Evaluasi Pembelajaran

mencukupi akan mempertinggi reliabilitas


penilaian.
b. Pelaksanaan penilaian harus dikondisikan
sebaik-baiknya, antara lain waktu yang
disediakan harus cukup dan terjadwal
secara ketat, situasi tempat yang kondusif
untuk penyelenggaraan ujian seperti
ketenangannya, pengaturan tempat
duduknya dengan jarak yang cukup
sehingga kegiatan saling mencontoh dan
menyontek dapat dihindari. Pelaksanaan
penilaian perlu pengawasan yang baik.
b. Penilaian yang Obyektif, Terbuka dan Mendidik
Obyektivitas penilaian dapat tercapai bila faktor
pelaksana penilaian mulai dari pengawas ujian,
pemeriksa hasil ujian, maupun pembuat keputusan
penilaian tidak ikut mempengaruhi pencapaian
hasil penilaian yang sebenarnya. Jawaban tes
maupun tugas telah ditentukan kunci-kunci
skoringnya, sehingga dengan demikian diperiksa
oleh siapapun hasilnya akan sama saja. Obyektivitas
penilaian yang berupa tes dapat diperoleh antara
lain dengan cara:
a) Rumuskan pertanyaan-pertanyaan secara
spesifik dan tepat.
b) Hindari pertanyaan-pertanyaan yang
ambiguous (bermakna ganda, mem-
bingungkan).
c) Memeriksa hasil pekerjaan siswa dengan
menggunakan kunci-kunci jawaban.
d) Dalam menentukan skor yang dicapai siswa
12
Evaluasi Pembelajaran

gunakan kunci-kunci penskoran.


Prinsip keterbukaan dalam penilaian berarti bahwa
kriteria penilaian bisa diketahui oleh siapa saja yang
memerlukannya, baik siswa sendiri, orang tua,
maupun pihak-pihak lain yang berkepentingan.
Dengan kriteria yang transparan serta didukung
bukti-bukti yang cukup maka keputusan tentang
tingkat pencapaian kompetensi siswa diharapkan
dapat memuaskan semua pihak.
Penilaian harus bersifat mendidik, karena tujuan
penilaian salah satunya adalah untuk mengetahui
pencapaian hasil belajar siswa (penguasaan
kompetensi) sehingga hasil penilaian pada
hakekatnya merupakan penghargaan terhadap
prestasi siswa. Hasil penilaian perlu ditindaklanjuti
dengan program pengayaan bagi siswa yang telah
mencapai penguasaan kompetensi serta program
perbaikan bagi siswa yang belum mencapai
penguasaan kompetensi. Dengan demikian
penilaian akan memotivasi siswa untuk berprestasi,
bukan semata-mata untuk memperoleh nilai bagus
(motivasi ekstrinsik), melainkan lebih didorong
oleh kebutuhan bahwa penguasaan kompetensi
itu memang sangat diperlukan bagi dirinya
dan untuk masa depannya (motivasi intrinsik).
Pencapaian kompetensi inklusif di dalamnya
adalah pencapaian kecakapan hidup (life skill)
yang meliputi kecakapan mengenal potensi diri,
kecakapan berpikir, kecakapan sosial, kecakapan
akademik, dan kecakapan vokasional, sehingga
penilaian harus mengkondisikan siswa agar terlatih
menghadapi persoalan hidup dan secara proaktif
dan kreatif terbiasa mencari dan menemukan
13
Evaluasi Pembelajaran

solusi untuk mengatasinya.


2. Penilaian Autentik dan Berkesinambungan
Kata autentik berarti asli. Dalam kaitannya dengan
penilaian autentik, maka di samping penilaian
itu bersifat asli juga mengandung pengertian
nyata, alamiah, dan bermakna. Oleh karena itu
dalam penilaian autentik data dikumpulkan dan
diperoleh dari kegiatan nyata yang dikerjakan
siswa pada saat proses pembelajaran berlangsung.
Jadi penilaian autentik bukanlah penilaian pada
saat siswa mengerjakan tes saja, melainkan
penilaian terhadap kemajuan belajar siswa dari
proses, bukan hanya hasil, dengan berbagai cara.
Karakteristik penilaian autentik bila dikaitkan
dengan pencapaian kompetensi meliputi:
(1) penilaian autentik merupakan bagian dari
proses pembelajaran yang dilaksanakan
selama dan sesudah proses pembelajaran
berlangsung,
(2) penilaian autentik mencerminkan hasil
proses belajar pada kehidupan nyata,
tidak berdasarkan pada kondisi yang ada
di sekolah, mengukur performansi dan
keterampilan, bukan hafalan,
(3) penilaian autentik dengan menggunakan
bermacam-macam instrumen,
(4) penilaian autentik dilakukan secara
berkesinambungan, membandingkan
prestasi siswa saat ini dengan prestasinya
yang lalu,
(5) menilai semua aspek tujuan pendidikan
14
Evaluasi Pembelajaran

secara terintegrasi, komprehensif/holistik,


(6) dapat digunakan sebagai umpan balik
dalam proses pembelajaran.
Penilaian autentik dan berkesinambungan perlu
dilakukan melalui: (1) pengamatan terhadap
perubahan perilaku dan sikap untuk menilai
perkembangan afeksi dan kepribadian peserta
didik, dan (2) ujian, ulangan, dan/atau penugasan
untuk mengukur aspek kognitif peserta didik.
Kurikulum berbasis kompetensi menerapkan
sistem penilaian berkesinambungan, yaitu: (1)
penilaian mengukur pencapaian semua kompetensi
dasar yang merupakan penjabaran lebih lanjut dari
standar kompetensi yang telah ditetapkan secara
sistematis dalam kurikulum sekolah; (2) penilaian
dapat dilakukan pada satu atau lebih kompetensi
dasar melalui ulangan harian, ulangan tengah
semester, ulangan akhir semester, ujian sekolah,
maupun ujian nasional; (3) hasil penilaian dianalisis
dan ditindaklanjuti melalui program remedial dan
program pengayaan; (4) penilaian mencakup aspek
kognitif, psikomotor, dan afektif; dan (5) aspek
afektif diukur dengan menggunakan teknik non-
test seperti pengamatan, skala sikap, kuesioner,
wawancara, inventori, dan portofolio.
3. Keterlaksanaan
Penilaian yang baik harus memperhatikan prinsip
keterlaksanaan yang meliputi beberapa hal sebagai
berikut: (1) kesiapan pihak-pihak yang terkait
dengan penyelenggaraan penilaian, terutama
adalah kesiapan guru. Guru matapelajaran harus

15
Evaluasi Pembelajaran

mempunyai kemampuan untuk melakukan


penilaian seperti yang dimaksud dalam panduan
penilaian pada matapelajaran yang diampunya. Di
samping guru, para pihak yang masih terkait secara
langsung secara birokrasi dengan penyelenggaraan
sekolah, misalnya di tingkat daerah mulai dari
Kepala Sekolah, Pengawas, Dinas Pendidikan
Kota/Kabupaten/Provinsi, sebagai bagian dari
pengampu (stakeholder) pendidikan wajib
bersama-sama secara konsisten sesuai dengan
kewenangan dan tanggung jawabnya masing-
masing ikut menyukseskan penyelenggaraan
penilaian pendidikan. Sedangkan pihak-pihak
lain (masyarakat luas) perlu mendapatkan akses
informasi tentang paradigma baru sistem penilaian
pendidikan dalam kurikulum baru sehingga bisa
memahami dan memberikan dukungan terhadap
sistem penilaian yang diterapkan di sekolah; (2)
kesiapan siswa sebagai sasaran penilaian pendidikan
untuk mengikuti proses pembelajaran secara tertib
dan teratur serta mengikuti prosedur penilaiannya
yang akhirnya bermuara pada penentuan nilai
hasil belajarnya; (3) dukungan administrasi
penyelenggaraan ujian, seperti perlengkapan alat-
alat penilaian baik yang berupa tes maupun yang
bukan tes, pemberian skor terhadap pekerjaan
siswa, pengolahan skor, mendokumentasikan
hasil, penetapan nilai, pelaporan hasil, serta tidak
lanjutnya; (4) perencanaan waktu ujian oleh guru
dan sekolah untuk ulangan harian dan ulangan
tengah semester, ulangan akhir semester dan
ulangan kenaikan kelas; (5) payung peraturan
tentang penyelenggaraan sistem penilaian hasil

16
Evaluasi Pembelajaran

belajar siswa yang dipakai pegangan bagi para


penyelenggara ujian dalam menjalankan tugasnya;
dan (6) dukungan pembiayaan penyelenggaraan
penilaian sesuai dengan tingkat kebutuhan.

17
Evaluasi Pembelajaran

18
Evaluasi Pembelajaran

BAB II
PROSEDUR, JENIS, TEKNIK, DAN
INSTRUMEN PENILAIAN

A. TUJUAN PEMBELAJARAN
Mahasiswa diharapkan dapat mendeskripsikan
prosedur, jenis, teknik dan instrument penilaian.
B. POKOK BAHASAN
1. Prosedur penilaian
2. Jenis penilaian
3. Teknik dan instrument tes.
C. URAIAN MATERI
1. Kajian Materi Pembelajaran
Tahap pertama yang harus dilakukan guru
sebagai penilai adalah mempelajari dan mengkaji
materi pembelajaran dari satu atau lebih kompetensi
dasar. Kajian materi ini dapat dilakukan melalui
beberapa referensi untuk memperoleh bahan secara
komprehensif dari beragam sumber dengan bertolak
pada kompetensi yang diharapkan.

19
ini dapat dilakukan melalui beberapa referensi untuk memperoleh bahan secara
komprehensif dari beragam sumber dengan bertolak pada kompetensi yang diharapkan.

Evaluasi Pembelajaran

TEKNIK PENILAIAN

Tes lisan Tes tulis Tes praktek

Individu Uraian Objektif Individu


kelompok kelompok

Berstruktur Benar salah


Bebas Pilihan ganda
Terbatas Isian pendek

Gambar 2. Ragam Teknik Penilian

9
2. Memilih Teknik Penilaian
Tahap kedua guru memilih atau menentukan
teknik penilaian sesuai dengan kebutuhan pengukuran.
Secara garis besar, teknik penilaian dapat digolongkan
menjadi dua, yaitu penilaian melalui tes dan non tes.
Pada umumnya guru menggunakan teknik yang
pertama, yaitu dengan tes. Dalam menentukan
keakuratan perlu dipertimbangkan pemilihan teknik,
yaitu tingkat keakuratan dan kepraktisan penyusunan
dalam setiap butir soal. Pemberian nilai dengan cara
tes lebih mudah dibandingkan dengan non tes.
3. Perumusan Kisi – Kisi
Tahap ketiga merumuskan dan membuat matrik
kisi-kisi sesuai dengan teknik penilaian yang telah
ditentukan. Kisi-kisi merupakan deskripsi mengenai
informasi dan ruang lingkup dari materi pembelajaran
yang digunakan sebagai pedoman untuk menulis soal
atau matriks soal menjadi tes. Pembuatan kisi-kisi

20
Evaluasi Pembelajaran

memiliki tujuan untuk menentukan ruang lingkup


dalam menulis soal agar menghasilkan perangkat
tes yang sesuai dengan indikator.
Kisi kisi dibuat berdasarkan kompetensi dasar
dan indikator yang ingin dicapai serta bentuk tes
yang akan diberikan kepada peserta didik. Tes dapat
berbentuk tes objektif benar-salah, pilihan ganda
atau tes uraian serta non tes berupa penilaian afektif
dan psikomotorik.
Kisi-kisi berfungsi sebagai pedoman dalam
penulisan soal dan perakitan tes. Dengan adaya kisi-
kisi penulisan soal menjadi terarah, komprehensif
dan representatif. Dengan pedoman kepada kisi-kisi
penyusunan soal menjadi lebih mudah dan dapat
menghasilkan soal-soal yang sesuai dengan tujuan
tes.
1. Syarat penyusunan Kisi – kisi adalah,
a. Dapat mewakili isi silabus atau kurikulum.
b. Komponen-komponennya rinci, jelas dan
mudah dipahami.
c. Materi yang hendak ditanyakan dapat
dibuat soalnya sesuai bentuk soal yang
ditetapkan.
d. Sesuai dengan indikator.
2. Komponen kisi – kisi terdiri dari:
a. Komponen Identitas
1) Satuan Pendidikan.
2) Mata Pelajaran
3) Semester/Tahun Ajaran.
21
Evaluasi Pembelajaran

4) Jumlah soal.
5) Bentuk soal.
6) Standar Kompetensi.
7) Kompetensi Dasar.
8) Indikator
Dalam pembuatan kisi-kisi harus memenuhi
kemampuan kognitif, afektif dan psikomotorik yang
mengacu kepada teori Bloom sebagai berikut:
1. Cakupan yang diukur dalam ranah Kognitif
adalah:
a. Ingatan (C1) yaitu kemampuan seseorang
untuk mengingat. Ditandai dengan
kemampuan menyebutkan simbol, istilah,
definisi, fakta, aturan, urutan, metode.
b. Pemahaman (C2) yaitu kemampuan
seseorang untuk memahami tentang
sesuatu hal. Ditandai dengan kemampuan
menerjemahkan, menafsirkan,
memperkirakan, menentukan,
menginterprestasikan.
c. Penerapan (C3), yaitu kemampuan berpikir
untuk menjaring & menerapkan dengan
tepat tentang teori, prinsip, simbol pada
situasi baru/nyata. Ditandai dengan
kemampuan menghubungkan, memilih,
mengorganisasikan, memindahkan,
menyusun, menggunakan, menerapkan,
mengklasifikasikan, mengubah struktur.
d. Analisis (C4), Kemampuan berfikir

22
Evaluasi Pembelajaran

secara logis dalam meninjau suatu


fakta/ objek menjadi lebih rinci. Ditandai
dengan kemampuan membandingkan,
menganalisis, menemukan,
mengalokasikan, membedakan,
mengkategorikan.
e. Sintesis (C5), Kemampuan berpikir untuk
memadukan konsep-konsep secara
logis sehingga menjadi suatu pola yang
baru. Ditandai dengan kemampuan
mensintesiskan, menyimpulkan,
menghasilkan, mengembangkan,
menghubungkan, mengkhususkan.
f. Evaluasi (C6), Kemampuan berpikir
untuk dapat memberikan pertimbangan
terhadap sustu situasi, sistem nilai, metoda,
persoalan dan pemecahannya dengan
menggunakan tolak ukur tertentu sebagai
patokan. Ditandai dengan kemampuan
menilai, menafsirkan, mempertimbangkan
dan menentukan.
2. Aspek Afektif
Aspek afektif tidak dapat diukur seperti halnya
ranah kognitif, karena dalam ranah afektif
kemampuan yang diukur adalah:
a. Menerima (memperhatikan), meliputi
kepekaan terhadap kondisi, gejala,
kesadaran, kerelaan, mengarahkan
perhatian
b. Merespon, meliputi merespon secara diam-
diam, bersedia merespon, merasa puas

23
Evaluasi Pembelajaran

dalam merespon, mematuhi peraturan


c. Menghargai, meliputi menerima suatu
nilai, mengutamakan suatu nilai, komitmen
terhadap nilai
d. Mengorganisasi, meliputi
mengkonseptualisasikan nilai, memahami
hubungan abstrak, mengorganisasi sistem
suatu nilai
e. Karakteristik suatu nilai, meliputi falsafah
hidup dan sistem nilai yang dianutnya
3. Aspek Psikomotorik
Psikomotorik meliputi (1) gerak refleks, (2)
gerak dasar fundamen, (3) keterampilan
perseptual; diskriminasi kinestetik, diskriminasi
visual, diskriminasi auditoris, diskriminasi taktis,
keterampilan perseptual yang terkoordinasi,
(4) keterampilan fisik, (5) gerakan terampil, (6)
komunikasi non diskusi (tanpa bahasa-melalui
gerakan) meliputi: gerakan ekspresif, gerakan
interprestatif.
4. Penulisan Butir Soal
Tahap keempat, Guru menulis dan membuat
butir-butir soal yang sesuai dengan kisi-kisi dan
bentuk soal yang telah ditentukan. Bila Guru
menggunakan teknik non tes, maka diperlukan
untuk membuat pedoman pengisian instrumen.
Misalnya untuk observasi atau wawancara.
5. Penimbangan
Dalam tahap ini, butir soal dan atau pedoman
yang telah disusun Guru, ditimbang secara
24
Evaluasi Pembelajaran

rasional (analisis rasional oleh Guru); dibaca,


ditelaah dan dikaji kembali butir-butir soal dan
atau pedoman yang dibuat telah memenuhi
persyaratan.
6. Perbaikan
Pedoman diperbaiki sesuai dengan hasil
penimbangan, bagian-bagian mana yang perlu
dikurangi atau ditambah kalimat atau kata-
katanya perbaikan inipun biasanya didasarkan
kepada pemikiran peserta didik untuk memahami
isi dari kalimat yang diberikan, hal ini mengandung
arti bahwa kalimat yang disusun hendaknya
mudah di pahami oleh para peserta didik.
7. Uji-coba dan Penggandaan
Uji-coba terhadap tes/soal yang dibuat adalah
untuk menentukan apakah butir soal yang
dibuat telah memenuhi kriteria yang dituntut,
sudahkah mempunyai tingkat ketetapan,
ketepatan, tingkat kesukaran dan daya pembeda
yang memadai. Untuk bentuk non tes kriterianya
dituntut adalah tingkat ketepatan (validitas)
dan ketetapan (reliabilitas) sehingga diperoleh
perangkat alat tes ataupun non tes yang baku
(standar)
8. Diuji (diteskan)
Setelah diperoleh perangkat alat tes ataupun
non tes yang memenuhi persyaratan sudah
barang tentu perangkat alat ini diorganisasikan,
disusun berdasarkan pada bentuk-bentuk atau
model-model soal bagi perangkat tes, dan
untuk perangkat non tes.Setelah perangkat

25
Evaluasi Pembelajaran

tes maupun non tes digandakan kemudian siap


untuk diujikan.
9. Pemberian Skor
Lembar jawaban peserta didik dikumpulkan dan
disusun berdasarkan nomer induk peserta didik
untuk memudahkan dalam memasukkan skor
peserta didik. Kemudian dilakukan pemberian
skor sesuai dengan kunci jawaban, sehingga
diperoleh skor setiap peserta didik. Untuk
bentuk soal objektif diberi skor 1 jika benar
dan 0 jika salah, sedangkan skor bentuk essay
bergantung kepada tingkat kesulitan soal. Untuk
menafsirkan siapa yang lulus dan tidak lulus
bergantung pada batas lulus yang dipergunakan
oleh Guru.
10. Putusan
Setelah pengelolaan, sampai pada menafsirkan,
Guru memperoleh putusan akhir dari kegiatan
penilaian. Putusan yang diambil diharapkan
obyektif sesuai dengan aturan.
B. Jenis Penilaian
Penilaian memiliki beberapa jenis bergantung
pada jenis klasifikasinya. Ada yang bergantung
pada cakupan kompetensi yang diukur, sasaran
pelaksanaan, dan fungsi penilaian yang dilakukan.
1. Jenis penilaian berdasarkan cakupan kompetensi
yang diukur.
Berdasarkan cakupan kompetensi yang diukur,
penilaian kelas dapat diklasifikasi menjadi
ulangan harian dan ulangan umum.

26
Evaluasi Pembelajaran

a. Ulangan harian
Ulangan harian adalah penilaian yang
dilakukan untuk menilai pencapaian satu
atau lebih kompetensi dasar atau hasil
belajar. Jumlah ulangan harian dalam satu
semester diserahkan kepada guru atau
berdasarkan ketentuan sekolah.
b. Ulangan Tengah Semester
Ulangan tengah semester adalah penilaian
yang dilakukan untuk menilai pencapaian
kompetensi dasar pada tengah semester,
baik pada semester ganjil maupun
semester genap. Ulangan tengah semester
dilakukan apabila guru telah melaksanakan
pembelajaran setengah dari seluruh
kompetensi dasar yang seharusnya dicapai.
Proporsi kompetensi yang diujikan dalam
ulangan umum diserahkan kepada guru
dengan memperhatikan kompetensi
esensial.
c. Ulangan Akhir Semester
Ulangan akhir semester adalah penilaian
yang dilakukan untuk menilai pencapaian
kompetensi dasar pada akhir semester
ganjil. Ulangan akhir semester dilakukan
apabila guru telah menyelesaikan
pembelajaran yang mencakup seluruh
kompetensi dasar pada semester ganjil.
Proporsi kompetensi yang diujikan dalam
ulangan akhir semester diserahkan kepada
guru dengan memperhatikan kompetensi

27
Evaluasi Pembelajaran

esensial.
d. Ulangan Kenaikan Kelas
Ulangan kenaikan kelas adalah penilaian
yang dilakukan untuk menilai pencapaian
kompetensi dasar pada akhir semester
genap. Ulangan akhir semester dilakukan
apabila guru telah menyelesaikan
pembelajaran yang mencakup seluruh
kompetensi dasar pada semester genap.
Proporsi kompetensi yang diujikan dalam
ulangan kenaikan kelas kepada guru dengan
memperhatikan kompetensi esensial.
2. Jenis penilaian berdasarkan sasaran
Berdasarkan sasaran, penilaian dapat diklasifikasi
atas penilaian individual dan penilaian
kelompok.
a. Penilaian Individual
Penilaian individual adalah penilaian
yang dilakukan untuk menilai pencapaian
kompetensi atau hasil belajar secara individu
atau perorangan.
b. Penilaian Kelompok
Penilaian kelompok adalah penilaian
yang dilakukan untuk menilai pencapaian
kompetensi atau hasil belajar secara
kelompok.
3. Jenis penilaian berdasarkan atas fungsinya
Berdasarkan fungsinya penilaian dibedakan
menjadi beberapa jenis:

28
Evaluasi Pembelajaran

a. Penilaian formatif, yaitu ditujukan untuk


memperbaiki proses pembelajaran.
b. Penilaian sumatif, ditujukan untuk keperluan
menentukan angka kemajuan atau hasil
belajar siswa.
c. Penilaian penempatan (placement),
ditujukan untuk menempatkan siswa
dalam situasi pembelajaran atau program
pendidikan yang sesuai.
d. Penilaian diagnostik, ditujukan untuk
membantu memecahkan kesulitan belajar
yang dialami oleh siswa.
Khusus untuk tes, jenis-jenis tes dapat dilihat
berdasarkan fungsinya, waktunya, keperluannya
dan kebakuannya. Gambaran dan uraian masing-
masing jenis tes terlihat ada bagan 3 beserta
uraian di bawahnya.

29
Evaluasi Pembelajaran

Bagan 3. Jenis-jenis Tes 1

Tes Formatif

Tes Diagnostik
Berdasarkan Fungsinya
Tes Tengah Semester Kesiapan

Tes Sumatif Kemampuan

Penguasaan
Tes Awal

Berdasarkan waktunya
Tes Akhir

Tes Hasil Belajar Tes Daya Tahan

Psycho Tes Tes Kesehatan


Berdasarkan keperluannya Tes Bakat Tes Minat

Tes Kepribadian

Tes-tes lain

Tes Baku
Berdasarkan kebakuannya
Tes Buatan Guru

1. Jenis Tes Berdasarkan Fungsi


a. Tes formatif
Tes ini diselenggarakan beberapa kali dalam satu semester, bisa
dilaksanakan setiap akhir pelajaran atau setiap selesai satu pokok bahasan
tergantung pada guru yang melaksanakan. Manfaat tes ini untuk mengetahui

1
Afandi, dkk., Pengantar Evaluasi Pendidikan di Sekolah, Bandung: Paramantha, 1983, hh. 21-29

16

30
Evaluasi Pembelajaran

1. Jenis Tes Berdasarkan Fungsi


a. Tes formatif
Tes ini diselenggarakan beberapa kali dalam
satu semester, bisa dilaksanakan setiap akhir
pelajaran atau setiap selesai satu pokok bahasan
tergantung pada guru yang melaksanakan. Manfaat
tes ini untuk mengetahui apakah siswa sudah
menguasai materi pelajaran yang baru diberikan.
Guru juga bisa memberikan tes formatif per satu
atau dua pokok bahasan. Dalam satu semester nilai
tes formatif bisa dua, tiga, bahkan 12 jika dalam
satu semester guru memberikan tes formatif
setiap tatap muka. Tes ini hampir sama dengan
kuis atau tes mengenai unit pelajaran yang secara
tradisional dipakai guru, namun lebih menekankan
pada (1) pengukuran terhadap pencapaian hasil
pembelajaran dalam pokok bahasan tertentu. (2)
Menggunakan hasil tes tersebut untuk memperbaiki
kegiatan pembelajaran yang akan datang. Tujuan
tes ini adalah untuk mengidentifikasi keberhasilan
dan kegagalan belajar siswa untuk melakukan
penyesuaian dalam proses pembelajaran. Jika
sebagian besar siswa gagal menjawab perangkat
tes yang diberikan, maka bahan pelajaran yang
bersangkutan harus diulang kepada siswa yang
bersangkutan. Jika jumlahnya kecil maka dapat
digunakan tertentu untuk setiap siswa yang gagal,
seperti: tugas membaca buku lain, pembelajaran
berprogram atau penggunaan alat audio visual.
Metode yang digunakan sebaiknya sesuai dengan
perangkat tes yang tidak dapat dikerjakan siswa,
sehingga yang bersangkutan dapat segera
memperbaiki kesalahan belajar yang telah
31
Evaluasi Pembelajaran

dilakukan sebelumnya.
b. Tes Sumatif
Pada akhir seluruh rangkaian pembelajaran
dilakukan tes untuk mengetahui sejauh mana siswa
telah menguasai materi pelajaran sesuai dengan
standar kompetensi dan kompetensi dasar yang
telah direncanakan. Dua pertanyaan yang pantas
untuk dijawab adalah: 1) Apakah siswa sudah
menguasai seluruh materi pelajaran yang diberikan
sehingga dapat diberikan materi berikutnya? 2)
Berapa nilai yang pantas diberikan kepada setiap
siswa sesuai dengan penguasaan materi tersebut?
THB yang diberikan pada akhir proses
pembelajaran bertujuan untuk melihat kualitas
dan kuantitas penguasaan bahan pelajaran oleh
siswa dengan pemberian nilai kepada siswa
disebut tes sumatif atau yang sekarang disebut
ujian akhir semester. Tes ini mempunyai lingkup
luas dan mencoba mengukur penguasaan suatu
bagian yang dianggap mencakup semua latihan
dan berbagai tugas yang diberikan selama proses
pembelajaran berlangsung. Meskipun hasilnya
digunakan untuk pemberian nilai, tes ini dapat
memberikan sumbangan pada proses pembelajaran
yang akan datang dengan memberikan informasi
untuk menilai efektivitas dan efisiensi proses
pembelajaran.
Dengan demikian seperangkat tes yang
direncanakan dan disusun dengan baik, akan
memberikan motivasi kepada siswa agar belajar
dengan baik pula.

32
hasilnya digunakan untuk pemberian nilai, tes ini dapat memberikan sum
pada proses pembelajaran yang akan datang dengan memberikan informa
menilai efektivitas dan efisiensi proses pembelajaran.
Evaluasi Pembelajaran

TesDengan demikian seperangkat


ini diberikan tes yang direncanakan
pada mahasiswa pada dan disusun
akhir semester
baik, akan ketika
memberikan materi
motivasi pelajaran
kepada siswa agar sudah
belajar dengan baik p
diberikan seluruhnya pada mahasiswa. Karena
Tes ini diberikan pada mahasiswa pada akhir semester ketik
itu tes sumatif, biasanya disebut UAS (Ujian Akhir
pelajaran sudah diberikan seluruhnya pada mahasiswa. Karena itu tes
Semester) sesuai dengan kuantitas materi ujian
biasanya
yang palingdisebut
banyakUASdibandingkan
(Ujian Akhir Semester)
dengansesuai
materi dengan kuantita
ujian
ujianlain, maka
yang kualitasnya
paling pun diharapkan
banyak dibandingkan denganpaling
materi ujian lain
bagus. Konsekuensi
kualitasnya pun diharapkanlogisnya “nilai”nya
paling bagus. juga
Konsekuensi logisnya “nilai”
dihargai paling tinggi dibanding dengan ujian dan
dihargai paling tinggi dibanding dengan ujian dan tugas lain. Untuk men
tugas lain. Untuk mendapatkan nilai akhir dengan
nilai akhir dengan rumus :
rumus :

A + B + 2C
————— = NA
4

Keterangan :
A = Nilai tugas-tugas
B = Nilai ujian tengah semester
C = Nilai ujian akhir

NA = Nilai Akhir

c. Tes diagnostik
Tes yang diberikan diagnosa, artinya jika
b. Tes diagnostik
siswa ada kesulitan dalam mengikuti proses
Tes yangdapat
pembelajaran diberikan diagnosa,melalui
diketahui artinya jika
tes siswa
ini. ada kesulita
Dengan
mengikutidemikian setelah tesdapat
proses pembelajaran diagnostik
diketahuidiberikan
melalui tes ini. Dengan d
pada
setelah tes diagnostik diberikan pada siswa, gurusiswa
siswa, guru akan menemukan kesulitan akan menemukan
dan dapat memperbaiki atau meningkatkan proses
siswa dan dapat memperbaiki atau meningkatkan proses pembelajaran
pembelajaran dengan strategi yang lebih dapat
strategi yang lebih dapat diterima siswa dengan kemampuan penerimaa
diterima siswa dengan kemampuan penerimaan

33
18
Evaluasi Pembelajaran

materi yang dimiliki siswa. Tes diagnostik bisa


dilakukan kapan saja jika guru menganggap perlu
untuk melaksanakannya.
Tes diagnostik dilakukan untuk mengetahui
dengan pasti bagian mana yang tidak dimengerti. Tes
diagnostik diberikan pada siswa untuk mengetahui
tingkat kesulitan siswa dalam rangka perbaikan.
Program pembelajaran. tes remedial diberikan
pada siswa setelah mengetahui materi yang belum
dipahami siswa dan guru akan mengulangnya pada
bagian yang tidak dimengerti tersebut namun tidak
merubah program selanjutnya.
Tes diagnostik memusatkan perhatian
pada sumber kesulitan siswa, dengan demikian
kesulitan belajar segera dapat ditemukan dan
segera diperbaiki. Jika tes formatif menentukan
apakah siswa sudah menguasai materi setiap
pokok bahasan secara menyeluruh maka tes
diagnostik disusun untuk mengkaji sebab-sebab
kesulitan belajar yang belum terpecahkan dengan
materi tes yang dengan lebih spesifik. Tidak semua
kesulitan belajar dapat diatasi oleh tes formatif
dan diagnostik, tes ini hanya merupakan alat bantu
untuk mengidentifikasi dan mendiagnosis kesulitan
belajar tertentu, sehingga langkah perbaikan yang
tepat dapat dilakukan dalam waktu relatif cepat
dan tepat guna.
2. Jenis Tes Berdasarkan Waktu
a. Tes awal
Tes awal diberikan kepada siswa sebelum
perkuliahan dimulai. Kegunaan tes tersebut untuk

34
Evaluasi Pembelajaran

mengetahui seberapa jauh kemampuan, kesiapan


dan penguasaan siswa terhadap materi yang
akan diberikan. Setelah guru tahu kemampuan
dan penguasaan rata-rata mahasiswa sampai di
mana, guru bisa memberikan pelajaran dimulai
dari materi yang belum diketahui siswa agar
materi benar-benar memberi manfaat dan dapat
mencapai tujuan pembelajaran. karena itu tes awal
sebaiknya dilakukan guru sebelum mengajar untuk
memberikan batasan materi yang akan diberikan
pada semester itu.
Dua hal penting yang harus diketahui guru
sebelum memulai pembelajarannya: 1) Sejauh
mana keterampilan dan kemampuan yang telah
dimiliki siswa sebelum dimulai pembelajaran? 2)
Seberapa tinggi hasil belajar yang telah dicapai
siswa sehubungan dengan pembelajaran yang
akan diberikan?
b. Tes Akhir
Tes akhir sama dengan tes sumatif
3. Jenis Tes Berdasarkan Keperluan
a. Tes Hasil Belajar
Tes yang diberikan setelah siswa selesai
diberikan pembelajaran dan tidak selalu dilakukan
di kelas saja. Tes hasil belajar tidak hanya meliputi
ranah kognitif. Misalnya tes akhir untuk calon pilot,
orang yang belajar menyetir mobil, pelatihan,
kursus-kursus: komputer, kecantikan, bahasa dan
lain sebagainya.

35
Evaluasi Pembelajaran

b. Psycho tes
Tes diberikan kepada yang memerlukan
dalam arti tidak usah bagi yang bermasalah saja,
bisa juga diberikan kepada orang yang mau
mengetahui kondisi psikisnya. Mungkin karena
seseorang yang memiliki tingkat kecemasan tinggi
ingin mengetahui kondisi psikisnya. Bisa juga orang
yang baru melalui masalah pelik yang menimpanya
dan lain sebagainya. Tes ini sangat berguna untuk
mengontrol kejiwaan seseorang.
c. Tes Bakat
Tes ini jelas untuk mengetahui bakat
seseorang. Biasanya dilakukan terhadap siswa usia
taman kanak-kanak agar orang tuanya tidak salah
memasukkan anak ke sekolah tertentu. Kadang-
kadang orang tua memilih sekolah atau jurusan
menurut keinginannya tanpa melihat bakat anak.
Tes ini sebaiknya dilakukan oleh orang tua, agar
yakin anaknya memasuki sesuai dengan bakat
yang dimiliki.
d. Tes Kepribadian
Tes seperti ini biasanya dilakukan terhadap
calon ratu kecantikan. Ada juga guru-guru pribadi
yang dipanggil ke rumah sering dites seperti ini.
Ini penting apalagi jika anak yang akan menjadi
siswanya sepenuhnya diserahkan pada guru oleh
orang tuanya. Meskipun hanya seorang guru tetapi
kalau tidak mempunyai pribadi yang baik tetap
sajak akan berbahaya bagi siswanya.

36
Evaluasi Pembelajaran

e. Tes lain-lain
Termasuk dalam tes ini misalnya tes daya
tahan, untuk mengikuti suatu pertandingan
berat seperti tinju, berenang, gulat, sepak bola
long march dan lain-lain. Tes kesehatan biasanya
diperuntukkan bagi calon jemaah haji, calon
mahasiswa, calon tentara dan lain-lain. Kemudian
ada tes minat biasanya berdampingan dengan tes
bakat. Sebab siswa yang hanya punya bakat tanpa
minat agak sulit untuk sukses. Demikian juga bagi
siswa sangat berminat tapi sangat tidak berbakat
akan sangat tidak mudah dapat meraih sukses.
4. Jenis Tes Berdasarkan Kebakuan
a. Tes Baku
Tes baku adalah tes yang telah dibakukan.
Artinya tes tersebut sudah sahih dan ajeg
karena telah diujicoba, bahkan biasanya untuk
meyakinkan dilakukan berkali-kali pengujian. Tes
baku disusun oleh para ahli di bidangnya. Karena
telah diujicobakan maka tes ini dapat digunakan
berkali-kali pada responden yang diasumsikan sama
kondisi psikologis dan usianya. Contoh tes baku
misalnya: tes kecerdasan. Tes baku yang disusun
oleh orang Amerika di sana dan diujicobakan
terhadap anak-anak di Amerika tentu tidak cocok
jika diberlakukan untuk orang Indonesia, meskipun
pada usia yang sama, kondisi psikologisnya tetap
berbeda. Jelasnya setiap tes baku yang akan
digunakan sebagai alat evaluasi tetap saja harus
dilihat kemungkinannya.

37
Evaluasi Pembelajaran

b. Tes Buatan Guru


Tes ini diharapkan akan cocok digunakan
untuk siswa dari guru yang bersangkutan. Agar
tes benar-benar menjaring perilaku siswa sesuai
dengan tujuan yang ingin dicapai, maka guru
sebagai pembuat tes harus jujur dan mengikuti tata
cara pembuatan tes seperti yang telah dijelaskan
terdahulu. Hasil belajar siswa akan jelek jika guru
membuat soal semena-mena tanpa melihat kisi-
kisi tes, apalagi jika guru nekat menanyakan materi
yang belum diajarkan. Karena itu tes buatan guru
sering tidak mematuhi persyaratan tes yang baik.
5. Lembar Jawaban Tes
Berbagai bentuk tes yang telah dikemukakan,
beberapa diantaranya akan lebih praktis jika disediakan
lembar jawaban. Hal ini lebih memudahkan, baik bagi
siswa yang mengerjakan tes maupun bagi guru yang
memeriksanya. Namun berbagai jenis tes di atas
tidak semuanya dapat dibuatkan lembar jawaban
seperti tes esei misalnya tetap saja memerlukan
kertas kosong untuk lembar jawabannya. Di bawah
ini disajikan beberapa lembar jawaban kosong antara
lain:
a) Pilihan ganda

38
tes esei misalnya tetap saja memerlukan kertas kosong untuk lembar jawabannya.
Di bawah ini disajikan beberapa lembar jawaban kosong antara lain:
Evaluasi Pembelajaran
a) Pilihan ganda
Nama : …………………
Kelas : …………………
Mata kuliah : …………………
Hari/tanggal ujian : …………………
Nilai : …………………

1. a b c d 11. a b c d 21. a b c d
2. a b c d 12. a b c d 22. a b c d
3. a b c d 13. a b c d 23. a b c d
4. a b c d 14. a b c d 24. a b c d
5. a b c d 15. a b c d 25. a b c d
6. a b c d 16. a b c d 26. a b c d
7. a b c d 17. a b c d 27. a b c d
8. a b c d 18. a b c d 28. a b c d
9. a b c d 19. a b c d 29. a b c d
10. a b c d 20. a b c d 30. a b c d

Pemeriksaan untuk tes ini sangat mudah, guru


Pemeriksaan untuk tes ini sangat mudah, guru dapat mengambil blanko lembar
dapat mengambil blanko lembar jawaban
jawaban tes yang
tesmasih kosong,
yang dan mengisinya
masih kosong,berdasarkan kunci jawaban tes.
dan mengisinya
berdasarkan
Kemudian pemeriksaan kunci dengan
dapat dilakukan jawaban
mudah tes. Kemudian
dan cepat, karena semua
pemeriksaan
jawaban terkumpul dapat
pada satu lembar dilakukan
kertas. Pada setiap dengan mudah
lembar jawaban tes harus
dan cepat, karena semua jawaban terkumpul
pada satu lembar kertas. Pada setiap lembar
jawaban tes harus 22 ada ruang tempat mengisi
nama siswa, kelas, hari tes diberikan, dan sekor
yang dicapai seperti contoh di bawah ini.
b) Jawaban singkat :

39
ada ruang tempat mengisi nama siswa, kelas, hari tes diberikan, dan sekor yang
dicapai seperti contoh di bawah ini.

Evaluasi Pembelajaran
b) Jawaban singkat :
Nama : …………………
Kelas : …………………
Mata kuliah : …………………
Hari/tanggal ujian : …………………
Nilai : …………………

1. ………………… 11. ………………… 21. …………………


2. ………………… 12. ………………… 22. …………………
3. ………………… 13. ………………… 23. …………………
4. ………………… 14. ………………… 24. …………………
5. ………………… 15. ………………… 25. …………………
6. ………………… 16. ………………… 26. …………………
7. ………………… 17. ………………… 27. …………………
8. ………………… 18. ………………… 28. …………………
9. ………………… 19. ………………… 29. …………………
10. ………………… 20. ………………… 30. …………………

c) Benar salah
c) Benar salah
Nama : …………………
Kelas : …………………
Mata kuliah : …………………
Hari/tanggal ujian : …………………
Nilai : …………………

1. B – S 26. B – S
2. B – S 27. B – S
3. B – S 28. B – S
4. B – S 29. B – S
5. B – S 30. B – S
6. B – S 31. B – S
7. B – S 32. B – S
8. B – S 33. 23
B–S
9. B – S 34. B – S
40
10. B – S 35. B – S
11. B – S 36. B – S
5. B – S 30. B – S
6. B – S 31. B – S
7. B – S 32. B – S
Evaluasi Pembelajaran
8. B – S 33. B – S
9. B – S 34. B – S
10. B – S 35. B – S
11. B – S 36. B – S
12. B – S 37. B – S
13. B – S 38. B – S
14. B – S 39. B – S
15. B – S 40. B – S
16. B – S 41. B – S
17. B – S 42. B – S
18. B – S 43. B – S
19. B – S 44. B – S
20. B – S 45. B – S
21. B – S 46. B – S
22. B – S 47. B – S
23. B – S 48. B – S
24. B – S 49. B – S
25. B – S 50. B – S

24

41
Evaluasi Pembelajaran

42
Evaluasi Pembelajaran

BAB III
PENGEMBANGAN INSTRUMEN
PENILAIAN

A. TUJUAN PEMBELAJARAN
Setelah mahasiswa menyelesaikan bab ini diharapkan
dapat mengembangkan instrumen penilaian tes dan
nontes.
B. MATERI POKOK
1. Pengembangan instrumen penilaian tes
2. Pengembangan instrumen penilaian nontes
C. URAIAN MATERI
A. Pengembangan Instrumen Tes
1 Prinsip-prinsip dasar Tes Hasil Belajar
a. Tes Hasil Belajar harus mampu mengukur hasil
belajar sesuai dengan standar kompetensi.
Langkah-langkah untuk menentukan tes terdiri
dari :
1) Mengidentifikasi standar kompetensi
2) Mengidentifikasi kompetensi dasar
3) Merumuskan indikator pencapaian
kompetensi
4) Merencanakan tes
43
Evaluasi Pembelajaran

Dengan demikian THB harus mampu


mengukur tingkah laku khusus yang
diharapkan akan diperlihatkan oleh siswa-
siswa pada akhir proses pembelajaran
berdasarkan standar kompetensi dan
kompetensi dasar
b. THB harus mampu mengukur sampel
yang representatif, artinya mencerminkan
situasi yang diwakilinya.
c. THB harus mencakup semua jenis
pertanyaan yang paling sesuai dengan
yang diharapkan. Kunci THB yang berhasil
guna ialah memilih jenis pertanyaan yang
tepat guna dan menyusunnya secermat
mungkin sehingga dapat memancing
jawaban yang diharapkan dan menghindari
semua respon negatif yang tidak relevan.
d. THB harus direncanakan dengan
matang agar hasilnya sesuai dengan
penggunaannya dan standar kompetensi.
Misalnya: 1) Untuk mengukur perilaku
siswa pada awal proses pembelajaran (pre
test) 2) Kemajuan belajar yang dicapai
selama belajar 3) Masalah belajar selama
pembelajaran 4) hasil belajar pada akhir
pembelajaran (post test).
e. THB harus mempunyai keterandalan tinggi
serta penafsiran yang cermat, artinya jika
sekor seperangkat tes yang diperoleh
oleh siswa dalam THB hampir sama antara
tes pertama dan tes kedua maka sekor
tes demikian dapat disebut memiliki
44
Evaluasi Pembelajaran

keterandalan yang tinggi.


f. THB bisa dipakai untuk memperbaiki hasil
belajar siswa, THB akan berpengaruh
positif terhadap belajar jika mencerminkan
tujuan pembelajaran dan mengukur
jumlah sampel dan di dalamnya terdapat
pertanyaan yang sesuai dengan hasil
belajar, serta disesuaikan dengan tujuan
penggunaan hasilnya.
Bagian ini akan membahas tentang tes sebagai
alat evaluasi. Namun sebelumnya perlu diketahui
bahwa tes bukan satu-satunya alat evaluasi. Ada
sesuai dengan hasil belajar, serta disesuaikan dengan tujuan penggunaan
dua macam alat evaluasi seperti tampak dalam
hasilnya.
baganinidiakan
Bagian bawah ini. tentang tes sebagai alat evaluasi. Namun
membahas
sebelumnya perlu diketahui bahwa tes bukan satu-satunya alat evaluasi. Ada dua
macam alat evaluasi seperti tampak dalam bagan di bawah ini.

Bagan 1
ALAT EVALUASI

Lisan

Verbal

Tes Tulisan

Keterampilan
p
Non verbal
Olahraga
Menjahit
Alat
Evaluasi

Bukan Tes

P.Observasi P. Wawancara Angket Skala Penilaian

45
Dengan demikian jelas bahwa untuk memberikan penilaian tidak selalu harus
menggunakan berbagai tes. Penilaian dapat juga dilakukan melalui observasi,
wawancara dan skala penilaian.
Jika penilaian dilakukan dengan tes untuk apa hasil tes tersebut?
Evaluasi Pembelajaran

Dengan demikian jelas bahwa untuk memberikan


penilaian tidak selalu harus menggunakan berbagai
tes. Penilaian dapat juga dilakukan melalui
observasi, wawancara dan skala penilaian.
Jika penilaian dilakukan dengan tes untuk apa hasil
tes tersebut?
Hasil tes sangat berguna untuk mengambil
berbagai keputusan seperti tes :
1. Pemilihan
Pemilihan dimaksud untuk berbagai
kebutuhan yang berhubungan dengan
pemilihan misalnya: tes untuk calon ketua
partai, ketua organisasi, ketua yayasan,
kepala rumah sakit, calon pegawai dan
lain-lain. Bentuk tes seperti ini bisa lisan
bisa tulisan.
2. Penempatan
Tes seperti ini biasanya diberikan kepada
siswa yang akan mengikuti kursus seperti
kursus bahasa Inggris misalnya. Sebelum
dimulai calon peserta dites dulu untuk
menentukan di tingkat berapa/mana
siswa akan ditempatkan. Bisa juga kepada
calon kursus keterampilan, dites minat,
bakat agar penempatannya sesuai dengan
keinginan dan talenta yang dimiliki calon
peserta.
3. Remedial
Tes khusus yang disebut tes remedial
diberikan kepada siswa setelah guru

46
Evaluasi Pembelajaran

selesai memberikan sebagian besar materi


pelajaran. Tes ini untuk mengetahui tingkat
penguasaan siswa terhadap materi yang
telah diberikan dan materi yang belum
dimengerti dan atau dikuasai siswa. Setelah
itu guru akan mengulang menjelaskan
kembali bagian yang belum dimengerti
siswa tersebut secara parsial.
4. Pemberian Bimbingan Konseling
Tes ini diberikan kepada seluruh siswa
baru agar tidak salah pada saat diberikan
bimbingan konseling. Ini sangat penting
karena setiap siswa berbeda kebutuhannya.
Ada yang nakal karena kurang perhatian
dari orang tua, ada siswa kurang bimbingan
agamanya, sehingga ragu apakah Tuhan itu
ada karena belum pernah melihat bentuk
fisiknya. Ada anak yang malas belajar
karena lingkungan rumah yang kurang
kondusif. Karena itu pemberian bimbingan
konseling disesuaikan dengan kebutuhan
siswa yang bersangkutan. Bimbingan akan
sia-sia jika diberikan pada siswa yang tidak
membutuhkan, bahkan mungkin akan
menimbulkan kejenuhan.
5. Peningkatan Program
Tes diberikan kepada peserta yang telah
mengikuti program tertentu. Sebelum
dilanjutkan pada program berikutnya,
para peserta dites dulu agar peserta
dapat mengikuti program lanjutan setelah
menguasai dengan baik program yang
47
Evaluasi Pembelajaran

sudah berjalan. Kalau tidak diberikan


tes dikuatirkan peserta tidak mampu
mengikuti program berikutnya. Apalagi jika
program tersebut materinya merupakan
pengembangan dari program sebelumnya
atau mengacu sepenuhnya pada program
sebelumnya.
6. Pelaksanaan Evaluasi
Tes diberikan benar-benar untuk
kepentingan pelaksanaan evaluasi artinya
untuk mengetahui evaluasi bidang apa
saja baik umum maupun khusus dan dapat
diberikan tes tulis atau lisan.
2. Bentuk Tes Hasil Belajar
Selanjutnya ada beberapa jenis tes yang dapat
digunakan sebagai alat evaluasi dalam menilai keberhasilan
pembelajaran seperti tampak pada bagan di bawah ini.
1. Obyektif
Sebutan demikian diberikan karena penilaiannya
dapat dilakukan benar-benar objektif, tanpa
ada unsur subjektivitas penilai. Penilaian bisa
dilakukan oleh siapa saja, tidak harus oleh
pembuat soal. Kunci jawaban yang pasti tidak
dapat diganggu gugat memberi kemudahan
kepada pemeriksa, bahkan dapat diperiksa
oleh komputer. Tes objektif memiliki beberapa
kelebihan jika dibandingkan tes esei, meskipun
beberapa kelemahannya sulit dihindarkan.
Jenis tes objektif terdiri dari :

48
Evaluasi Pembelajaran

1) benar salah
Tes benar salah adalah jenis tes yang
menawarkan dua option jawaban yaitu
benar atau salah dan menyuruh siswa
untuk memilih satu jawaban pasti. Tes
benar salah sering dianggap mudah
dijawab karena hanya memiliki jawaban
yaitu benar atau salah. Penyusunan
tesnya juga sering dianggap lebih mudah
karena soalnya terdiri dari pernyataan
dengan pilihan jawaban satu diantara
dua jawaban. Padahal tidak demikian
halnya, penyusun soal diharapkan mampu
membuat kalimat yang meragukan siswa.
Siswa juga dihadapkan pada pilihan
jawaban yang hampir sama sehingga
meragukan pilihan seperti bentuk
soal terdahulu, bentuk tes benar salah
mempunyai kelebihan dan kekurangan
seperti tes-tes lainnya
Tes benar-salah harus tampak dengan
meyakinkan bahwa pernyataan yang
benar adalah benar sebenar-benarnya
dan pernyataan yang salah adalah salah
sesalah-salahnya. Jangan membuat soal
yang berada di antara benar dan salah.
Contoh soal:
Petunjuk : Lingkari huruf B jika pernyataan
di bawah ini benar dan lingkari S jika salah
(bobot soal : 1)

49
Evaluasi Pembelajaran

 Yang kurang baik:


* Untuk mengukur tingkat kecerdasan
emosi siswa SD sebaiknya menggunakan
tes yang dibuat khusus oleh guru-guru
Sd.
 Yang baik:
* Untuk mengukur tingkat
kecerdasan emosi siswa SD sebaiknya
menggunakan tes baku karena sudah
diuji kebenarannya.
2) Pilihan Ganda
Pada saat ini tes pilihan ganda merupakan tes
yang paling banyak dipergunakan, karena melalui
tes ini dirasakan lebih mudah untuk mencapai
tujuan pembelajaran secara menyeluruh. Tes ini
dianggap mampu mencakup materi yang luas,
dapat merangsang kemampuan kognitif siswa
meliputi ingatan, pemahaman, penerapan,
analisis, sintesis sampai evaluasi. Dewasa ini
tampaknya hampir semua disiplin ilmu dan hampir
semua strata meminati tes pilihan ganda dalam
melaksanakan penilaian. Tes pilihan ganda terdiri
dari tubuh yang dapat berupa pertanyaan atau
pernyataan dan option jawaban yang terdiri dari
empat pilihan. Jawaban dipilih satu yang paling
benar. Penyusunan soal pilihan ganda makan
waktu lama karena tidak mudah menentukan
pilihan jawaban. Namun memeriksanya relatif
lebih mudah dan lebih cepat daripada jawaban
soal esei. Jawaban pilihan ganda harus sama
persis dengan kunci jawaban yang tersedia dan

50
Evaluasi Pembelajaran

dalam waktu singkat dapat memeriksa dengan


jumlah banyak. Berbeda dengan soal esei yang
jawabannya harus langsung diperiksa oleh
pembuat soal meskipun kata kunci jawaban
sebagai acuan tetap harus dipersiapkan.
Dalam membuat tes pilihan ganda disediakan
beberapa option jawaban yang harus dipilih.
Dalam memberikan option disarankan untuk
menyajikan beberapa option yang benar-benar
mirip sehingga peserta tes merasa bingung untuk
menentukan jawaban yang benar. Mengenai
pengecoh yang disajikan harus setara sehingga
tidak terlalu tampak sebagai jawaban pengecoh.
Contoh soal:
Petunjuk: Lingkari huruf di depan jawaban yang
anggap paling benar (bobot soal : 1)
 Yang kurang baik:
* Di bawah ini nama-nama Presiden Republik
Indonesia, kecuali:
a. Soekarno
b. Soeharto
c. BJ Habibie
d. Megawati
 Yang baik:
* Di bawah ini adalah nama-nama mantan
Menteri Pendidikan Nasional, kecuali:
a. Wardiman
b. Haryono Isman

51
Evaluasi Pembelajaran

c. Bambang Sudibyo
d. Malik Fajar
3) Asosiasi Pilihan Ganda
Tes ini hampir sama dengan tes pilihan ganda
namun pilihan jawabannya terdiri dari beberapa
alternatif yang membentuk satu pengertian.
Contoh soal:
Petunjuk : Berilah tanda silang (X) pada huruf :
(bobot soal 2)
A : Jika jawaban nomor 1, 2, dan 3 benar
B : Jika jawaban nomor 1 dan 3 benar
C : Jika jawaban nomor 2 dan 4 benar
D : Jika hanya nomor 4 yang benar
E : Jika semuanya benar
 Yang kurang baik
* Anda diminta untuk menyebutkan nama-
nama yang bukan wakil presiden RI
(1) Moh. Hatta
(2) Sri Sultan Hamengkubuwono IX
(3) Megawati Soekarno Putri
(4) M. Jusuf Kalla
Kunci jawaban : tidak ada
 Yang baik
* Nama-nama di bawah ini termasuk unsur-
unsur negara:

52
Evaluasi Pembelajaran

(1) Rakyat
(2) Wilayah
(3) Pemerintah
(4) Pengakuan kedaulatan
Kunci jawaban : E
4) Menjodohkan
Penampilan tes menjodohkan berlainan dengan
tes-tes yang lain. Halaman tes dibagi dua vertikal,
kolom kiri ditulis pertanyaan dan kolom kanan
ditulis jawaban yang jumlahnya lebih banyak.
Siswa diminta untuk menjodohkan jawaban yang
ada di kolom kanan dengan pertanyaan di kolom
kiri. Teknik penulisannya pada ujung pertanyaan
diberi titik-titik dan pada awal jawaban diberi
huruf A, B, C dan seterusnya, sehingga ketika
ada jawaban yang cocok maka huruf yang ada di
depan jawaban dituliskan pada titik-titik yang ada
di ujung pertanyaan, demikian seterusnya. Tes
menjodohkan termasuk pada tingkat kesulitan
mudah karena jawabannya sudah tersedia dan
pilihannya tidak terlalu banyak. Apalagi kalau
jawabannya tidak satu jenis, misalnya dari 10
jawaban ada nama kota, sungai, orang, suku,
agama dan lain sebagainya. Misalnya dari sepuluh
soal tiga jawaban nama kota, yang dua nama
sungai, tiga nama orang, dua nama jembatan, hal
ini harus dihindari.
Untuk menyusun tes menjodohkan lebih baik
dibuat pertanyaan sejenis agar dapat mengurangi
jawaban yang ditebak-tebak.

53
Evaluasi Pembelajaran

Contoh soal:
 Yang kurang baik:
Petunjuk: Jodohkanlah jawaban yang ada di
sebelah kanan dengan di sebelah kiri. Caranya
dengan menuliskan huruf yang ada di depan
jawaban benar menurut anda di kolom kanan
pada titik-titik di kolom kiri. (bobot soal : 1).

(……) 1. Presiden RI ke 3 A. UNPAR
(……) 2. Nama Universitas di Bandung B. PBB
(……) 3. Nama lembaga dunia C. Habibi
(……) 4. Kota kembang D. Bandung
(……) 5. Perdana Menteri Inggris E. Lembang
Perempuan F. UNPAD
G. Tony Blair
H. Suharto
I. ASEAN
J. Margaret Tacher

™ Yang baik:

Petunjuk: Yang
Tulislah baik:
huruf di depan jawaban yang paling tepat di
antara jawaban yang telahTulislah
Petunjuk: disediakanhuruf
di kolomdisebelah
depankananjawaban
(bobot soal :
1).
* Nama-nama yang paling
di bawah tepatmenjabat
ini pernah di antara jawaban
menteri : yang telah
(……) 1. disediakan
Kehutanan di kolom A.sebelah kanan (bobot soal :
Nur Mahmudi
(……) 2. 1).Pendidikan B. I Gede Ardike
(……) 3. Polkam C. Susilo Bambang Yudoyono
(……) 4. * Nama-nama di
Perhubungan D.bawah ini pernah menjabat
Malik Fajar
(……) 5. menteri
Pariwisata : E. Agum Gumelar
(……) 6. Luar Negeri F. Hasan Wirayuda
(……) 7. Kehakiman G. M.A Rahman
(……) 8. Agama H. S.A Al Munawar
(……) 9. Sekneg I. Bambang Kesowo
J. Bambang Suyono
K. Adi Sasono
L. Sulistio
M. Erwin Djaelani

5) Sebab Akibat
Soal sebab akibat terdiri dari dua kalimat yang dihubungkan dengan
kata54sebab. Kedua kalimat tersebut merupakan pernyataan dan alasan yang
bisa dua-duanya benar atau dua-duanya salah. Keduanya bisa berhubungan
satu sama lain atau masing-masing berdiri sendiri.
™ Yang baik:
Petunjuk: Tulislah huruf di depan jawaban yang paling tepat di
antara jawaban yang telah disediakan di kolom sebelah kanan (bobot soal :
1). Evaluasi Pembelajaran
* Nama-nama di bawah ini pernah menjabat menteri :
(……) 1. Kehutanan A. Nur Mahmudi
(……) 2. Pendidikan B. I Gede Ardike
(……) 3. Polkam C. Susilo Bambang Yudoyono
(……) 4. Perhubungan D. Malik Fajar
(……) 5. Pariwisata E. Agum Gumelar
(……) 6. Luar Negeri F. Hasan Wirayuda
(……) 7. Kehakiman G. M.A Rahman
(……) 8. Agama H. S.A Al Munawar
(……) 9. Sekneg I. Bambang Kesowo
J. Bambang Suyono
K. Adi Sasono
L. Sulistio
M. Erwin Djaelani

5) Akibat
5) Sebab Sebab Akibat
Soal sebab akibat terdiri dari dua kalimat yang dihubungkan dengan
kata sebab.
SoalKedua
sebab akibat
kalimat terdiri
tersebut dari duapernyataan
merupakan kalimat dan
yangalasan yang
dihubungkan
bisa dua-duanya dengan
benar atau kata sebab.
dua-duanya Kedua kalimat
salah. Keduanya bisa berhubungan
satu samatersebut
lain atau merupakan
masing-masingpernyataan
berdiri sendiri.dan alasan yang
bisa dua-duanya benar atau dua-duanya salah.
Contoh soal:
PetunjukKeduanya bisa
: Berilah tanda berhubungan
silang satu
(X) pada huruf sama
: (bobot soallain
2) atau
A. Jika masing-masing
pernyataan benar, berdiri sendiri.
alasan benar, dan keduanya memiliki hubungan
sebab-akibat.
Contoh
B. Jika soal:
pernyataan benar, alasan benar dan keduanya tidak memiliki
hubungan sebab-akibat.
Petunjuk : Berilah tanda silang (X) pada huruf :
C. Jika pernyataan benar, tetapi alasannya salah
D. Jika (bobot
pernyataan soal 2)dan alasan benar
salah
E. Jika keduanya salah
A. Jika pernyataan benar, alasan benar,
dan keduanya 31
memiliki hubungan sebab-
akibat.
B. Jika pernyataan benar, alasan benar dan
keduanya tidak memiliki hubungan sebab-
akibat.
C. Jika pernyataan benar, tetapi alasannya
salah
D. Jika pernyataan salah dan alasan benar

55
Evaluasi Pembelajaran

E. Jika keduanya salah


 Yang kurang baik
* Sumpah Pemuda diucapkan oleh para
pemuda Indonesia di dalam Kongres Pemuda
tanggal 28 Oktober 1928, sebab hanya para
pemuda yang sanggup bersumpah.
Kunci jawaban : C
 Yang baik
* Sukarno Hatta dilarikan ke Rengasdengklok
pada bulan Agustus 1945, sebab golongan
pemuda takut mereka akan terpengaruh oleh
Jepang.
Kunci jawaban : A
6) Isian
Tes ini meminta siswa untuk melengkapi
pernyataan yang belum lengkap, biasanya kata-
katanya singkat dan jawabannya merupakan
kata kunci yang benar-benar melengkapi
pernyataan yang belum berarti tanpa kata kunci
tersebut. Bentuk tes ini biasanya diberi titik-titik
pada akhir kalimat pertanyaan dan jawabannya
langsung ditulis pada titik-titik tersebut. Panjang
jawaban rata-rata hampir sama. Usahakan dalam
membuat soal ini agar kalimatnya pendek-pendek
dan mudah dimengerti oleh siswa. Bahasanya
jangan berbelit-belit, gunakan bahasa yang baik,
jelas, benar, sederhana, komunikatif, singkat dan
tidak mengundang salah faham siswa. Pembuat
soal harus hati-hati dalam menyusun soal ini
karena jawabannya pasti dan tidak dapat direka-

56
Evaluasi Pembelajaran

reka atau dikira-kira. Di sini tidak ada jawaban :


apa mungkin, boleh jadi, dan barangkali.
Tes isian hampir sama dengan tes jawaban
singkat, ada satu jawaban pasti sebagai kata
kunci.
Contoh soal:
Petunjuk: Isilah titik-titik di bawah ini dengan
jawaban yang benar (bobot soal : 1)
 Yang kurang baik:
* Pewaris tunggal tahta kerajaan Inggris ialah
…………….
(diisi : Pangeran……….?, tidak bisa dijawab
karena tidak ada pewaris tunggal, masih ada
pewaris kedua dan seterusnya).
 Yang baik:
* Proklamator Kemerdekaan Negara Republik
Indonesia ialah ……
(diisi : Soekarno-Hatta)
7) Cerita
Tes ini diberikan kepada siswa melalui cerita
pendek yang diharapkan dapat dimengerti
siswa dengan cepat. Jawabannya biasanya siswa
disuruh memilih satu jawaban paling tepat dari
pilihan yang telah tersedia seperti pada jawaban
pilihan ganda. Tes cerita mengacu kepada tujuan
instruksional khusus untuk menguasai ranah
kognitif aspek analisis dan evaluasi. Tes tersebut
sering digunakan untuk tes penalaran, tingkat
kecerdasan, kecerdasan emosi dan kecerdasan

57
Evaluasi Pembelajaran

spiritual.
Tes ini dapat diberikan kepada seluruh strata dari
SD hingga Perguruan Tinggi, bahkan bagi siswa
TK, asal disesuaikan dengan tingkat kemampuan
bahasa siswa seperti kata Bruner (1963).
Meskipun tes ini berupa cerita, tidak berarti
dibenarkan jika menceritakan hal-hal yang ingin
dikemukakan dengan panjang lebar. Bahasa yang
baik, benar dan jelas tetap harus dipertahankan.
Kalimat usahakan pendek-pendek, agar tidak
membuat siswa salah menafsirkan substansi
soal. Intinya soal jangan dipersulit dengan bahasa
yang berbelit-belit, tetapi substansi soal harus
membuat siswa mengaktifkan kemampuan
penalarannya seoptimal mungkin.
Contoh soal:
Petunjuk: Lingkari huruf di depan jawaban yang
anda anggap paling benar (bobot soal 2,5)
 Yang kurang baik
* Arya dan Sofia mau menjemput kakaknya
bernama Fathan yang sakit tipus ketika di rumah
neneknya di Ponorogo. Fathan sudah seminggu
berada di Ponorogo, jadi kata kedua adiknya
kakak itu harus perhatikan. Kalau dibiarkan
di Ponorogo sakitnya akan bertambah parah,
karena itu harus segera dijemput. Jarak dari
rumah tempat tinggal Arya dan Sofia dengan
rumah nenek sama dengan jarak dari rumah
Arya ke sekolah Fathan yaitu 30 KM. Arya dan
Sofia tidak bisa pergi sama-sama karena mereka
berdua sangat sibuk dengan kegiatan masing-

58
Evaluasi Pembelajaran

masing. Akhirnya diputuskan untuk pergi masing-


masing dan ketemu di rumah nenek. Seharusnya
yang jemput bisa saja sendirian, tetapi Fathan
pasti tidak akan mau pulang. Di samping itu
fathan juga minta agar sahabat karibnya yang
bernama Gibran diajak serta ke Ponorogo untuk
menjemputnya, repot sekali. Belum lagi Tantry,
kakaknya yang sulung membujuk untuk segera
pulang melalui telepon. Akhirnya diputuskan :
Putry dan Gibran naik mobil dengan kecepatan
60 KM per jam dan berangkat pukul 14.30 WIB
sedangkan Agam dan Tantry mengendarai motor
dengan kecepatan 30 KM per jam dan berangkat
pukul 14.00 WIB.
Pertanyaannya adalah: pukul berapa Arya,
Tantry, Sofia dan Gibran tiba di rumah nenek di
Ponorogo?
A. Pukul 16.30 WIB
B. Pukul 14.30 WIB
C. Pukul 15.00 WIB
D. Pukul 15.30 WIB
Kunci jawaban : C
Catatan :
Betapa soal cerita ini sangat membingungkan
“tester” karena ceritanya yang berbelit-belit,
padahal bisa lebih dipersingkat.
 Yang baik
* Tantry dan tiga orang sepupunya menang
jackpot di Family 100 sebesar Rp 11.000.000

59
Evaluasi Pembelajaran

ditambah berbagai hadiah lain berupa barang.


Mereka ingin sekali membagi rata uang tersebut
tetapi mereka ingat ada 14 orang penggembira
yang perlu dibagi. Kalau setiap pemain mendapat
Rp 2.400.000,- berapa para penggembira
menerima bagian masing-masing?
A. Rp 250.000
B. Rp 200.000
C. Rp 150.000
D. Rp 100.000
Kunci jawaban : D
Catatan :
Soal ini lebih jelas, singkat, padat, dan terarah
8) Gambar
Tes ini biasanya diberikan kepada siswa SD s/d
SLTP. Dari satu gambar yang diperlihatkan kepada
siswa dapat dibuat 3 s/d 5 soal, tentu soal tersebut
harus sesuai dengan gambar yang diperlihatkan
di halaman bagian atas. Tes ini sangat menarik
dan bermanfaat terutama untuk meningkatkan
motivasi berprestasi siswa. Melalui gambar
yang disajikan siswa lebih bersemangat untuk
menjawab dan dapat mengusir rasa jenuh siswa
apalagi dalam mata pelajaran yang dianggap
“membosankan” siswa.
Contoh soal:
Petunjuk: Lingkarilah huruf di depan jawaban
yang kamu anggap paling benar (bobot soal 1)

60
bersemangat untuk menjawab dan dapat mengusir rasa
jenuh siswa apalagi dalam mata pelajaran yang dianggap “membosankan”
siswa.
Contoh soal:
Petunjuk: Lingkarilah huruf di depan jawaban yang kamu anggap
Evaluasi paling benar
Pembelajaran
(bobot soal 1)
 Yang kurang baik
™ Yang kurang baik

gambar

1) Jika guru matematika sedang mengajar saya selalu memperhatikan,


karena:
1) Jika guru matematika sedang mengajar
a.saya
Matematika
selaluitumemperhatikan,
pelajaran bergengsi karena:
b. Matematika pelajaran yang paling penting
c. Matematika
a. di-UAN-kan
Matematika itu pelajaran bergengsi
2) Tiap hari saya pergi sekolah karena:
b. orang tua
a. Disuruh Matematika pelajaran yang paling
b. Senang ketemu teman-teman
c. Lumayan dapatpenting
uang jajan
c. Matematika
34 di-UAN-kan
2) Tiap hari saya pergi sekolah karena:
a. Disuruh orang tua
b. Senang ketemu teman-teman
c. Lumayan dapat uang jajan
3) Saya sering bolos sekolah karena:
a. Bolos itu menyenangkan
b. Bisa pergi ke mal
c. Tidak ada beban pikiran

Kunci jawaban:
1) c 2) b 3) a

61
jenuh siswa apalagi dalam mata pelajaran yang dianggap “membosankan”
siswa.
Contoh soal:
Petunjuk: Lingkarilah huruf di depan jawaban yang kamu anggap paling benar
Evaluasi Pembelajaran
(bobot soal 1)
2
 Yang baik
™ Yang kurang baik

gambar

1) Jika guru matematika sedang mengajar saya selalu memperhatikan,


1) Saya selalu memperhatikan apa yang
karena:
a. Matematika itu pelajaran bergengsi
diterangkan guru:
b. Matematika pelajaran yang paling penting
c. Matematika
a. di-UAN-kan
Supaya selalu mendapat nilai yang
2) Tiap hari saya pergi sekolah karena:
bagus
a. Disuruh orang tua
b. Senang ketemu teman-teman
c. Lumayan dapat
b. Supaya
uang jajantidak dimarahi oleh guru
c. Supaya34tidak dimarahi orang tua
2) Saya berusaha mendapat nilai-nilai yang
bagus supaya:
a. Menjadi juara kelas
b. Hati puas dan bangga
c. Menyenangkan Bapak dan Ibu
3) Jika mengerjakan ulangan di kelas saya
merasa:
c. Supaya
a. Puas jika hasilnya sama dengan yang
lalu
b. Takut jika hasilnya tidak baik
c. Dapat mengerjakan lebih baik dari
sebelumnya
2
Siti Rahayu Haditono, Achievement Motivation, Parent’s Educational Level and
Child Rearing (Prentice in Four Occupational Group (Yogyakarta: Universitas
Gadjah Mada, 1979), pp. 157-173

62
Evaluasi Pembelajaran

4) Jika sedang mengerjakan pekerjaan di


kelas ada teman minta tolong:
a. Saya tolong dahulu teman tadi
b. Saya selesaikan dahulu pekerjaan
c. Kadang-kadang saya tolong dahulu
teman saya
Kunci jawaban :
1) a
2) a
3) c
4) b
9) Anchor Item
Tes ini dibuat jika guru memiliki dua atau lebih
kelas paralel. Biasanya jam pelajaran ujian tidak
dilaksanakan secara bersama sesuai dengan jam
tatap muka. Untuk menghindari hal-hal yang
tidak diinginkan guru dapat membuat tes seperti
ini. Manfaat bentuk seperti ini antara lain agar
siswa yang berbeda kelas dan waktu ujiannya,
belakangan tidak mencoba untuk meminta
informasi tentang soal yang telah diujikan.
Soal untuk siswa yang ujian pada jam pertama,
ketiga dan ketujuh, tidak ada yang persis sama.
Siswa tetap akan bekerja keras sesuai dengan
kemampuan yang dimiliki siswa, tidak hanya
akan mencari soal-soal ujian yang telah diberikan
pada jam pelajaran sebelumnya.
Penyusunan tes dengan anchor item dibuat
terhadap tes pilihan ganda, misalnya seperangkat

63
Evaluasi Pembelajaran

tes yang terdiri dari masing-masing 60 butir soal


9)
untuk tiga kelas, maka 20 soal menyangkut
Anchor Item
konsep-konsep
Tes ini dibuat jika guru dasar
memiliki mengenai materi
dua atau lebih kelas paralel.yang
Biasanya
jam pelajaran
bersangkutan harus dikuasai setiap siswa. Makatatap
ujian tidak dilaksanakan secara bersama sesuai dengan jam
muka. Untuk menghindari hal-hal yang tidak diinginkan guru dapat membuat
40ini.
tes seperti soal lainnya
Manfaat bentukdibuat
seperti iniberbeda namun
antara lain agar siswa tingkat
yang berbeda
kesulitan,
kelas dan waktu ujiannya,daya pembeda
belakangan dan daya
tidak mencoba pengecoh
untuk meminta informasi
tentang ketiga
soal yang telah diujikan.
perangkat soalSoal
itu untuk
tetapsiswa
harusyang ujian pada jam
setara.
pertama, ketiga dan ketujuh, tidak ada yang persis sama. Siswa tetap akan
bekerja keras sesuai dengansoal
Penyusunan kemampuan
sepertiyang dimiliki siswa, tidak hanya
ini memang agakakan
mencari soal-soal ujian yang telah diberikan pada jam pelajaran sebelumnya.
menyulitkan
Penyusunan guru,
tes dengan anchortetapi di terhadap
item dibuat sisi lain siswa
tes pilihan ganda,
misalnya akan teruji dengan benar dan tetap memiliki
seperangkat tes yang terdiri dari masing-masing 60 butir soal untuk
tiga kelas, maka 20 soal menyangkut konsep-konsep dasar mengenai materi
kemampuan yang sama dalam menguasai
yang bersangkutan harus dikuasai setiap siswa. Maka 40 soal lainnya dibuat
berbedakonsep-konsep
namun tingkat kesulitan, tertentu.
daya pembedaHal daninidaya
merupakan
pengecoh ketiga
perangkat soal itu tetap
manfaat lainharus
darisetara.
penyusunan tes dengan anchor
Penyusunan soal seperti ini memang agak menyulitkan guru, tetapi di
sisi lainitem. Penomoran
siswa akan teruji dengan soal
benaryang sama
dan tetap sebagai
memiliki anchoryang
kemampuan
item hendaknya diberikan acak, 20 soal anchor
sama dalam menguasai konsep-konsep tertentu. Hal ini merupakan manfaat
lain dari penyusunan tes dengan anchor item. Penomoran soal yang sama
item seperti di bawah dengan jumlah 60 soal.
sebagai anchor item hendaknya diberikan acak, 20 soal anchor item seperti di
bawah
dengan jumlah 60 soal. TABEL 5
KISI-KISI SEPERENGKAT TES AKHIR DENGAN ANCHOR ITEM
No No. Soal Anchor Item Kelas
II.1 II.2 II.3 II.4
1 1, 21 4, 24 3, 33 4, 33
2 3, 23 6, 26 6, 36 7, 36
3 5, 25 8, 28 9, 39 10, 39
4 7, 27 10, 30 12, 42 13, 42
5 9, 29 12, 32 15, 45 16, 45
6 11, 31 14, 34 18, 48 19, 48
7 13, 33 16, 36 21, 51 22, 51
8 15, 35 18, 38 24, 54 25, 54
9 17, 37 20, 40 27, 57 28, 57
10 19, 39 22, 42 30, 60 31, 60

Catatan :
1. Nomor-nomor
Catatan di: atas adalah soal-soal yang sama persis yang disebut soal
anchor item di setiap kelas sebanyak 20 butir soal dari 60 butir soal secara
1. Nomor-nomor di atas adalah soal-soal yang
keseluruhan.
2. Nomor-nomor lain di luar nomor tersebut substansi soal berbeda namun
sama persis yang disebut soal anchor item
tingkat kesulitan, daya pembeda, dan daya pengecoh harus tetap setara
di setiap
supaya dapat mengukurkelas sebanyak
hasil belajar 20 butir
siswa dengan sahihsoal dari 60
dan reliabel.

64 36
Evaluasi Pembelajaran

butir soal secara keseluruhan.


2. Nomor-nomor lain di luar nomor tersebut
substansi soal berbeda namun tingkat
kesulitan, daya pembeda, dan daya
pengecoh harus tetap setara supaya dapat
mengukur hasil belajar siswa dengan sahih
dan reliabel.
3. Soal yang sama diletakkan pada nomor acak
dan tidak diletakkan pada nomor urut 1 s/d
30, tetapi setiap kelas berbeda, nomor soal
yang sama meskipun jumlahnya tetap 20
butir.
Contoh soal untuk dua kelas dengan jumlah soal
sejarah Indonesia masing-masing 10 butir dengan
4 butir anchor item.
Petunjuk : Lingkarilah huruf di depan jawaban
yang kamu anggap paling benar (bobot soal 1)
 Yang kurang baik
Butir soal untuk kelas II-1
Nomor 1 s/d 4 sama persis dengan butir untuk
soal kelas II-2
Nomor 5 s/d 10 tidak sama.
1) Antara sejarah di satu pihak dengan ilmu-
ilmu sosial dan humaniora di lain pihak….
A. memiliki hubungan fungsional
B. tidak memiliki hubungan apa-apa
C. memiliki hubungan generik-species
D. memiliki hubungan diakronis-sinkronis

65
Evaluasi Pembelajaran

E. memiliki hubungan kausalitas


2) “Belajar dari sejarah”. Ungkapan yang
menunjukkan salah satu guna sejarah yakni
:
A. kreatif
B. edukatif
C. aplikatif
D. rekreatif
E. inspiratif
3) Sejarah akademik dan sejarah normatif
berbeda karena ….
A. sejarah akademik bersifat faktual
sementara sejarah normatif bersifat
naratif
B. sejarah akademik bersifat faktual
sementara sejarah normatif bersifat
teoretik
C. sejarah akademis bersifat ‘das sein’
sementara sejarah normatif bersifat
‘das sollen’
D. sejarah akademik ditujukan untuk
mahasiswa jurusan sejarah sementara
sejarah normatif untuk kepentingan
politis
E. sejarah akademik tunduk pada
patokan empiris-teoretik sementara
sejarah normatif tunduk pada patokan
ideologis.

66
Evaluasi Pembelajaran

4) Kisah dua orang serdadu Inggris yang melihat


sebuah botol berisikan air setengahnya,
sehingga serdadu yang satu menyatakan,
“Ah, airnya setengah kosong”, dan serdadu
yang satu lagi mengatakan “Ah, airnya
setengah penuh”, menunjukkan bahwa
dalam masalah interpretasi terkait erat di
dalamnya unsur….
A. periodesasi dalam sejarah
B. objektivitas dalam sejarah
C. subjektivitas dalam sejarah
D. waktu suatu peristiwa terjadi
E. ketidaksengajaan dalam sejarah
5) Pernyataan yang bukan merupakan
pembenaran pandangan sejarah tiga
dimensi tentang keterkaitan masa lampau,
masa kini, dan masa datang adalah…
A. historia vitae magistra
B. fakta sejarah bersifat pilihan
C. belajar sejarah untuk menjadi orang
bijaksana
D. bangsa yang besar adalah bangas yang
menghargai pahlawan mereka
E. masa depan ditentukan masa kini dan
masa kini hasil perkembangan masa
lampau
6) Setiap obyek dan kesaksian yang dapat
menjelaskan peristiwa manusia disebut…..

67
Evaluasi Pembelajaran

A. fakta sejarah
B. cerita sejarah
C. sumber sejarah
D. penjelasan sejarah
E. interpretasi sejarah
7) Penulisan sejarah dari dua orang sejarawan
meskipun menggunakan bahan dan sumber
yang sama, tidak disebabkan faktor di bawah
ini, yaitu perbedaan ……
A. pendapat sejarawan
B. latar belakang sejarawan
C. dalam pengambilan kesimpulan
D. penafsiran terhadap fakta sejarah
E. dalam metode penelitian sejarahnya
8) Periodesasi yang paling mudah dibuat
adalah berdasarkan katagori…..
A. urutan waktu
B. sejarah sosial
C. sejarah politik
D. urutan kejadian
E. urutan pergantian dinasti
9) Salah satu wujud akulturasi Pra Hindu-
Budha dengan masa Hindu-Budha di bidang
pemerintahan adalah…..
A. lahirnya bentuk kerajaan di Indonesia
B. kepala suku sebagai pemimpin
68
Evaluasi Pembelajaran

kelompok
C. berkembangnya sistem musyawarah
dalam pemerintahan
D. terjadinya pemilihan untuk menentukan
seseorang menjadi raja
E. terjalinnya hubungan diplomatik antara
kerajaan-kerajaan di India Selatan – di
Indonesia
10) Semula Pergerakan Nasional Indonesia
bersifat moderat, kemudian menjadi lebih
radikal. Hal ini disebabkan oleh:
A. berkembangnya sosialisasi di
Indonesia
B. sikap pemerintah Hindia Belanda
sangat keras
C. pemuda Indonesia berhasil
menghimpun kekuatan
D. bangsawan memberi dukungan kepada
pergerakan nasional
E. larangan pemerintah Hindia Belanda
untuk membentuk partai
Butir soal untuk kelas II-2
Nomor 1 s/d 4 sama persis dengan butir untuk
soal kelas II-1
Nomor 5 s/d 10 tidak sama.
1) Antara sejarah di satu pihak dengan ilmu-
ilmu sosial dan humaniora di lain pihak….
A. memiliki hubungan fungsional
69
Evaluasi Pembelajaran

B. tidak memiliki hubungan apa-apa


C. memiliki hubungan generik-species
D. memiliki hubungan diakronis-sinkronis
E. memiliki hubungan kausalitas
2) “Belajar dari sejarah”. Ungkapan yang
menunjukkan salah satu guna sejarah yakni:
A. kreatif
B. edukatif
C. aplikatif
D. rekreatif
E. inspiratif
3) Sejarah akademik dan sejarah normatif
berbeda karena ….
A. sejarah akademik bersifat faktual
sementara sejarah normatif bersifat
naratif
B. sejarah akademik bersifat faktual
sementara sejarah normatif bersifat
teoretik
C. sejarah akademis bersifat ‘das sein’
sementara sejarah normatif bersifat
‘das sollen’
D. sejarah akademik ditujukan untuk
mahasiswa jurusan sejarah sementara
sejarah normatif untuk kepentingan
politis
E. sejarah akademik tunduk pada

70
Evaluasi Pembelajaran

patokan empiris-teoretik sementara


sejarah normatif tunduk pada patokan
ideologis.
4) Kisah dua orang serdadu Inggris yang melihat
sebuah botol berisikan air setengahnya,
sehingga serdadu yang satu menyatakan,
“Ah, airnya setengah kosong”, dan serdadu
yang satu lagi mengatakan “Ah, airnya
setengah penuh”, menunjukkan bahwa
dalam masalah interpretasi terkait erat di
dalamnya unsur….
A. periodesasi dalam sejarah
B. objektivitas dalam sejarah
C. subjektivitas dalam sejarah
D. waktu suatu peristiwa terjadi
E. ketidaksengajaan dalam sejarah
5) Pernyataan yang tidak termasuk dalam
kriteria sejarah bersifat pilihan peristiwa
masa lampau adalah ……
A. kebutuhan bangsa hari ini
B. kesadaran aktualitas sejarawan
C. materi kurikulum pembelajaran
D. keprihatinan intelektual masa kini
E. relevansi masa lampau dengan masa
kini
6) Sumber sejarah ialah bahan-bahan yang
dapat digunakan untuk mengumpulkan…..
A. data sejarah
71
Evaluasi Pembelajaran

B. cerita sejarah
C. informasi sejarah
D. fakta-fakta sejarah
E. bukti-bukti penting sejarah
7) Salah satu prinsip yang harus tetap dipegang
dalam penulisan sejarah adalah waktu :
A. sekarang
B. lampau
C. yang akan datang
D. yang lalu dan sekarang
E. lampau, sekarang dan akan datang
8) Periodesasi dan historiografi sangat perlu
karena……
A. banyaknya peristiwa yang terjadi
B. luasnya tempat di mana kejadian
berlangsung
C. banyaknya manusia berdomisili di
suatu tempat
D. panjangnya rentangan perjalanan
sejarah umat manusia
E. tradisi kalangan sejarawan untuk
melakukan pembabakan sejarah
9) Salah satu akulturasi Hindu dan Budha di
Indonesia tampak dari….
A. urutan raja-raja yang memerintah
Mataram

72
Evaluasi Pembelajaran

B. pendirian Lingga dan Yoni oleh raja


Sanjaya
C. pembuatan candi Borobudur oleh
Samaratungga
D. perkawinan Rakai Pikatan dan
Pramodawardhani
E. pembangunan candi Prambanan oleh
Rakai Pikatan
10) Faktor pendorong lahirnya pergerakan
nasional Indonesia adalah…
A. angin kebebasan melalui politik pintu
terbuka
B. peranan kaum bangsawan yang
memperjuangkan nasib rakyat
C. pengaruh kemenangan Rusia terhadap
Jepang tahun 1904-1905
D. kondisi politik, ekonomi dan sosial
budaya yang diskriminatif pada masa
Belanda
E. adanya pembelaan untuk memperbaiki
nasib bangsa Indonesia oleh Multatuli

73
Evaluasi Pembelajaran

TABEL 6
KUNCI JAWABAN UNTUK KELAS

II-1 II-2
1. E 1. E
2. B 2. B
3. E 3. E
4. C 4. C
5. B 5. C
6. C 6. A
7. D 7. E
8. E 8. D
9. A 9. D
10. B 10. D

™ Yang baik Yang baik


Butir soal untuk kelas II-1
Butir
1) Antara sejarahsoal untuk
di satu pihakkelas II-1ilmu-ilmu sosial dan humaniora
dengan
di lain pihak….
1) Antara sejarah di satu pihak dengan ilmu-
A. memiliki hubungan fungsional
ilmu sosial
B. tidak memiliki danapa-apa
hubungan humaniora di lain pihak….
C. memiliki hubungan generik-species
A. memiliki hubungan fungsional
D. memiliki hubungan diakronis-sinkronis
E. memiliki hubungan
B. tidakkausalitas
memiliki(anchor item 1)apa-apa
hubungan
2) Pernyataan yangC. bukan
memiliki hubungan
merupakan generik-species
pembenaran pandangan sejarah
tiga dimensi tentang keterkaitan masa lampau, masa kini, dan masa
datang adalah… D. memiliki hubungan diakronis-sinkronis
A. historia vitae magistra
E. bersifat
B. fakta sejarah memiliki hubungan kausalitas (anchor
pilihan
item 1)
C. belajar sejarah untuk menjadi orang bijaksana
D. bangsa yang besar adalah bangsa yang menghargai pahlawan
2) Pernyataan yang bukan merupakan
mereka
E. masa depanpembenaran
ditentukan pandangan
masa kini dan sejarah
masa kini tiga
hasil
perkembangan masa lampau
dimensi tentang keterkaitan masa lampau,
3) “Belajarlah dari sejarah”. Ungkapan yang menunjukkan salah satu
guna sejarahmasa
yakni…… kini, dan masa datang adalah…
A. kreatif
B. edukatif
74 C. aplikatif
D. rekreatif

42
Evaluasi Pembelajaran

A. historia vitae magistra


B. fakta sejarah bersifat pilihan
C. belajar sejarah untuk menjadi orang
bijaksana
D. bangsa yang besar adalah bangsa yang
menghargai pahlawan mereka
E. masa depan ditentukan masa kini dan
masa kini hasil perkembangan masa
lampau
3) “Belajarlah dari sejarah”. Ungkapan yang
menunjukkan salah satu guna sejarah
yakni……
A. kreatif
B. edukatif
C. aplikatif
D. rekreatif
E. inspiratif (anchor item 2)
4) Sumber sejarah ialah bahan-bahan yang
dapat digunakan untuk mengumpulkan…..
A. data sejarah
B. cerita sejarah
C. informasi sejarah
D. fakta-fakta sejarah
E. bukti-bukti penting sejarah
5) Sejarah akademik dan sejarah nofmatif
berbeda karena….

75
Evaluasi Pembelajaran

A. sejarah akademik bersifat faktual


sementara sejarah normatif bersifat
naratif
B. sejarah akademik bersifat faktual
sementara sejarah normatif bersifat
teoretik
C. sejarah akademis bersifat ‘das sein’
sementara sejarah normatif bersifat
“das sollen”
D. sejarah akademik ditujukan untuk
mahasiswa jurusan sejarah sementara
sejarah normatif untuk kepentingan
politis
E. sejarah akademik tunduk pada
patokan empirik-teoretik sementara
sejarah normatif tunduk pada patokan
ideologis. (anchor item 3)
6) Penulisan sejarah dari dua orang sejarawan
meskipun menggunakan bahan dan sumber
yang sama, tidak disebabkan faktor di bawah
ini, yaitu perbedaan ……
A. pendapat sejarawan
B. latar belakang sejarawan
C. dalam pengambilan kesimpulan
D. penafsiran terhadap fakta sejarah
E. dalam metode penelitian sejarahnya
7) Kisah dua orang serdadu Inggris yang melihat
sebuah botol berisikan air setengahnya,
sehingga serdadu yang satu menyatakan,

76
Evaluasi Pembelajaran

“Ah, airnya setengah kosong”, dan serdadu


yang satu lagi mengatakan “Ah, airnya
setengah penuh”, menunjukkan bahwa
dalam masalah interpretasi terkait erat di
dalamnya unsur…..
A. periodesasi dalam sejarah
B. objektivitas dalam sejarah
C. subjektivitas dalam sejarah
D. waktu suatu peristiwa terjadi
E. ketidaksengajaan dalam sejarah
(anchor item 4)
8) Periodesasi yang paling mudah dibuat
adalah berdasarkan katagori…..
A. urutan waktu
B. sejarah sosial
C. sejarah politik
D. urutan kejadian
E. urutan pergantian dinasti
9) Salah satu wujud akulturasi Pra Hindu-
Budha dengan masa Hindu-Budha di bidang
pemerintahan adalah…..
A. lahirnya bentuk kerajaan di Indonesia
B. kepala suku sebagai pemimpin
kelompok
C. berkembangnya sistem musyawarah
dalam pemerintahan
D. terjadinya pemilihan untuk menentukan

77
Evaluasi Pembelajaran

seseorang menjadi raja


E. terjalinnya hubungan diplomatik antara
kerajaan-kerajaan di India Selatan – di
Indonesia
10) Semula Pergerakan Nasional Indonesia
bersifat moderat, kemudian menjadi lebih
radikal. Hal ini disebabkan oleh:
A. berkembangnya sosialisasi di
Indonesia
B. sikap pemerintah Hindia Belanda
sangat keras
C. pemuda Indonesia berhasil
menghimpun kekuatan
D. bangsawan memberi dukungan kepada
pergerakan nasional
E. larangan pemerintah Hindia Belanda
untuk membentuk partai
Butir soal untuk kelas II-2
1) Pernyataan yang tidak termasuk dalam
kriteria sejarah bersifat pilihan peristiwa
masa lampau adalah ……
A. kebutuhan bangsa hari ini
B. kesadaran aktualitas sejarawan
C. materi kurikulum pembelajaran
D. keprihatinan intelektual masa kini
E. relevansi masa lampau dengan masa
kini

78
Evaluasi Pembelajaran

2) Sumber sejarah ialah bahan-bahan yang


dapat digunakan untuk mengumpulkan…..
A. data sejarah
B. cerita sejarah
C. informasi sejarah
D. fakta-fakta sejarah
E. bukti-bukti penting sejarah
3) Salah satu prinsip yang harus tetap dipegang
dalam penulisan sejarah adalah waktu :
A. sekarang
B. lampau
C. yang akan datang
D. yang lalu dan sekarang
E. lampau, sekarang dan akan datang
4) Antara sejarah di satu pihak dengan ilmu-
ilmu sosial dan humaniora di lain pihak…
A. memiliki hubungan fungsional
B. tidak memiliki hubungan apa-apa
C. memiliki hubungan generik-species
D. memiliki hubungan diakronis-sinkronis
E. memiliki hubungan kausilitas (anchor
item 1)
5) Periodesasi dan historiografi sangat perlu
karena……
A. banyaknya peristiwa yang terjadi

79
Evaluasi Pembelajaran

B. luasnya tempat di mana kejadian


berlangsung
C. banyaknya manusia berdomisili di
suatu tempat
D. panjangnya rentangan perjalanan
sejarah umat manusia
E. tradisi kalangan sejarawan untuk
melakukan pembabakan sejarah
6) “Belajarlah dari sejarah”. Ungkapan yang
menunjukkan salah satu guna sejarah
yakni……
A. kreatif
B. edukatif
C. aplikatif
D. rekreatif
E. inspiratif (anchor item 2)
7) Salah satu akulturasi Hindu dan Budha di
Indonesia tampak dari…..
A. urutan raja-raja yang memerintah
Mataram
B. pendirian Lingga dan Yoni oleh raja
Sanjaya
C. pembuatan candi Borobudur oleh
Samaratungga
D. perkawinan Rakai Pikatan dan
Pramodawardhani
E. pembangunan candi Prambanan oleh

80
Evaluasi Pembelajaran

Rakai Pikatan
8) Sejarah akademik dan sejarah nofmatif
berbeda karena….
A. sejarah akademik bersifat faktual
sementara sejarah normatif bersifat
naratif
B. sejarah akademik bersifat faktual
sementara sejarah normatif bersifat
teoretik
C. sejarah akademis bersifat ‘das sein’
sementara sejarah normatif bersifat
“das sollen”
D. sejarah akademik ditujukan untuk
mahasiswa jurusan sejarah sementara
sejarah normatif untuk kepentingan
politis
E. sejarah akademik tunduk pada
patokan empirik-teoretik sementara
sejarah normatif tunduk pada patokan
ideologis. (anchor item 3)
9) Faktor pendorong lahirnya pergerakan
nasional Indonesia adalah…
A. angin kebebasan melalui politik pintu
terbuka
B. peranan kaum bangsawan yang
memperjuangkan nasib rakyat
C. pengaruh kemenangan Rusia terhadap
Jepang tahun 1904-1905
D. kondisi politik, ekonomi dan sosial

81
Evaluasi Pembelajaran

budaya yang diskriminatif pada masa


Belanda
E. adanya pembelaan untuk memperbaiki
nasib bangsa Indonesia oleh Multatuli
10) Kisah dua orang serdadu Inggris yang melihat
sebuah botol berisikan air setengahnya,
sehingga serdadu yang satu menyatakan,
“Ah, airnya setengah kosong”, dan serdadu
yang satu lagi mengatakan “Ah, airnya
setengah penuh”, menunjukkan bahwa
dalam masalah
E. adanya pembelaan interpretasi
untuk memperbaiki terkaitIndonesia
nasib bangsa erat dioleh
dalamnya
Multatuli unsur…..
10) Kisah dua orang A. serdadu
periodesasi dalam
Inggris yang sejarah
melihat sebuah botol berisikan
air setengahnya, sehingga serdadu yang satu menyatakan, “Ah, airnya
setengah kosong”,B. dan
objektivitas
serdadu yangdalam sejarah
satu lagi mengatakan “Ah, airnya
setengah penuh”, menunjukkan bahwa dalam
C. subjektivitas dalam sejarah masalah interpretasi
terkait erat di dalamnya unsur…..
A. periodesasi D.
dalam sejarah
waktu suatu peristiwa terjadi
B. objektivitas dalam sejarah
C. subjektivitasE. ketidaksengajaan
dalam sejarah dalam sejarah
(anchor
D. waktu suatu peristiwa item 4)
terjadi
E. ketidaksengajaan dalam sejarah (anchor item 4)

TABEL 7
KUNCI JAWABAN UNTUK KELAS
II-1 II-2
1. E 1. C
2. B 2. A
3. B 3. E
4. C 4. E
5. E 5. D
6. D 6. B
7. E 7. D
8. E 8. E
9. A 9. D
10. B 10. C

82
b) Esei
Yang dimaksud tes esei ialah butir soal yang mengandung pernyataan
yang jawabannya harus dilakukan dengan cara mengekspresikan peserta tes.
Evaluasi Pembelajaran

3. Esei
Yang dimaksud tes esei ialah butir soal yang
mengandung pernyataan yang jawabannya harus
dilakukan dengan cara mengekspresikan peserta
tes. Ciri yang paling menonjol, ialah kebebasan
sepenuhnya pada peserta tes untuk menjawab,
karena pertanyaan yang ditujukan menuntut untuk
dijawab sesuai pengetahuan siswa. Dalam menjawab
diperlukan kemampuan menghasilkan, memadukan
dan menyatakan gagasan, hal ini tidak dapat dijangkau
oleh tes objektif.
Kelemahan-kelemahan tes esei
Pernyataan yang dimasukkan dalam tes uraian
hanya sedikit, dengan demikian sampel hasil
belajar siswa terbatas pada beberapa bidang.
Kelemahan kedua adalah jawaban tergantung
pada kemampuan menulis siswa. Cara menyatakan
sesuatu dengan cara yang kurang baik, kesalahan
dalam penggunaan tanda baca, ejaan dan tatabahasa
umumnya mengurangi skor jawaban uraian. Di pihak
lain, kepandaian menyatakan sesuatu cenderung
mempertinggi skor bagi jawaban uraian. Kelemahan
ketiga mengenai pemberian sekor yang subjektif, sulit
sekali memberikan sekor yang benar-benar objektif
di dalam penyekoran tes uraian.
Adapun kelebihan tes uraian antara lain : (a)
dapat digunakan untuk mengukur hasil belajar yang
kompleks dan komprehensif (b) menekankan kepada
pengukuran kemampuan mengintegrasikan berbagai
sumber informasi ke dalam suatu pola pikir yang
disertai dengan keterampilan pemecahan masalah,
(c) lebih meningkatkan motivasi peserta tes untuk
83
Evaluasi Pembelajaran

belajar, dan (d) memudahkan guru untuk menyusun


butir soal.
Menurut Gronlund (1985) ada beberapa prinsip
kontribusi tes esai antara lain:
Prinsip 1 : Tulislah petunjuk umum yang jelas,
dan petunjuk khusus untuk setiap
butir soal harus dapat dipahami oleh
peserta.
Prinsip 2 : Gunakan tes uraian untuk mengukur
hasil belajar yang tepat
Prinsip 3 : Informasikan sebelumnya bahwa tes
yang akan datang akan menggunakan
tes uraian untuk persiapan peserta
tes.
Prinsip 4 : Batasi ruang lingkup tes dengan jelas
agar peserta tes mengetahui dengan
pasti bahan yang harus dipelajari.
Prinsip 5 : Kurangi menggunakan butir soal untuk
mengukur kemampuan mengingat
Prinsip 6 : Kemampuan dan keterampilan menulis
peserta harus menjadi pertimbangan
utama.
Prinsip 7 : Waktu yang tersedia harus diperkirakan
cukup, tidak kurang dan tidak lebih.
Prinsip 8 : Pergunakan kata-kata deskriptif,
seperti tulislah garis besar, berilah
ilustrasi, bandingkanlah, dan lain-lain.
Prinsip 9 : Dalam setiap butir soal harus dijelaskan
bobot yang akan diperoleh.

84
Evaluasi Pembelajaran

Tabel 8
Tabel 8
3
Ikhtisar Pembanding
Ikhtisar TesObjektif
Pembanding Tes Objektif danUraian
dan Tes Tes Uraian
3

Tes Objektif Tes Uraian

Taksonomi hasil Baik untuk mengukur Tidak efisien untuk meng-


yang hendak hasil belajar pada taraf ukur hasil penguasaan hasil
diukur pengetahuan, pemahaman, penguasaan pengetahuan,
aplikasi dan analisis dari baik untuk mengukur
taksonomi, tidak cukup pemahaman, aplikasi dan
untuk sintesis dan evaluasi analisis hasil belajar,
hasil belajar paling baik untuk sintesis
dan evaluasi hasil belajar

Sampel isi/bahan Penggunaan jumlah butir Penggunaan jumlah butir


pertanyaan yang besar pertanyaan yang relatif
menghasilkan liputan yang kecil menyebabkan liputan
luas, yang memung- yang sempit, yang tidak
kinkan pengadaan sampel memungkinkan pengadaan
tentang isi bahan yang sampel yang representatif
representatif tentang isi bahan

Mempersiapkan Kegiatan mempersiapkan Kegiatan mempersiapkan


butir pertanyaan butir pertanyaan yang baik butir pertanyaan yang baik
sukar dan makan waktu adalah sukar, tetapi lebih
mudah dari proses mem-
persiapkan tes objektif

Penempatan skor Objektif, sederhana, dan Subjektif, sukar dan kurang


sangat dapat dipercaya dapat dipercaya

Faktor yang Kemampuan membaca dan Kemampuan menulis dan


menyesatkan menerka “membual”.
hasil sekor murid

Efek yang Merangsang siswa untuk Merangsang siswa untuk


mungkin timbul mengingat, menafsirkan mengorganisasikan, me-
terhadap kegiatan dan menganalisa gagasan madukan dan menyatakan
belajar orang lain gagasannya sendiri.

Tes ini lebih cocok untuk mendeskripsikan atau memecahkan masalah


3
dan sangat “Constructing
Gronlund, cocok untuk menilai aspek Test”,
Achievement kognitif siswa. Dalam
Menyusun menjawab
Tes Hasil Belajar, tes
terjemahan Bistok Sirait, (Semarang: IKIP Semarang Press, 1985), h. 35
3
Gronlund, “Constructing Achievement Test”, Menyusun Tes Hasil Belajar, terjemahan Bistok Sirait,
(Semarang: IKIP Semarang Press, 1985), h. 35 85
48
Evaluasi Pembelajaran

Tes ini lebih cocok untuk mendeskripsikan atau


memecahkan masalah dan sangat cocok untuk
menilai aspek kognitif siswa. Dalam menjawab tes
esei siswa dapat mengekspresikan pendapat dan
pikirannya dengan bebas. Kadang-kadang karena
kebebasan yang diberikan kepada siswa, jawaban jadi
melebar dan jauh sasaran yang ditentukan, hal ini pula
yang menjadi salah satu kelemahan tes esei. Dalam
menjawab soal esei siswa juga dapat mengorganisasi
pikirannya, menganalisis suatu masalah, memberi
interpretasi, berpikir logis dan kritis.
Dalam membuat soal tes hindari pertanyaan yang
hanya bersifat ke”apa”an saja, karena jika pertanyaan
hanya menggunakan kata apa saja, materi yang
ditanyakan hanya sekitar ingatan saja. Disarankan
untuk bertanya tentang ke”bagaimana”an sesuatu
atau ke”mengapaan”annya, sebab dengan bertanya
tentang bagaimana dan mengapa maka jawabannya
akan menggunakan pemahaman, interpretasi, bahkan
analisis siswa tentang pertanyaan yang diajukan.
Contoh soal:
Petunjuk: Jawablah pertanyaan di bawah ini dengan
singkat dan jelas (bobot soal : 5)
 Yang kurang baik:
* Apa yang dimaksud dengan reformasi?
(pertanyaan ini hanya mengundang jawaban tentang
definisi reformasi, hanya aspek ingatan saja).
 Yang baik:
* Mengapa pada tahun 1998 terjadi reformasi
di Indonesia dan manfaat apa yang dapat diambil
bangsa Indonesia? (pertanyaan ini mengundang
86
Evaluasi Pembelajaran

pemahaman, interpretasi bahkan sampai analisis


siswa).
4. Jawaban Singkat
Dalam tes jawaban singkat, penyusun soal hanya
meminta jawaban yang benar-benar singkat tapi tepat
dan sulit sekali bahkan tidak bisa digambarkan dengan
kata-kata lain. Jawaban bisa hanya terdiri dari satu
atau dua kata saja. Tapi yakin jawaban tersebut yang
dikehendaki penilai. karena itu dalam penyusunan
tes ini harus extra hati-hati agar jawabannya sangat
tepat dan tidak ada protes dari para pakar bidang
studi yang bersangkutan. Penyusun tes harus
mampu hanya bertanya tentang sesuatu yang pasti,
penting dan tidak pernah diragukan karena tidak ada
jawaban lain selain yang dimaksud. Dengan demikian
pertanyaan harus jelas, tegas, menggunakan bahasa
yang sederhana sehingga tidak menimbulkan salah
penafsiran terutama dari peserta tes.
Contoh soal:
Petunjuk : Isilah titik-titik di bawah ini dengan jawaban
singkat hanya terdiri satu atau dua kata saja. (bobot
soal : 1)
 Yang kurang baik:
* Kota di Pulau Jawa yang sangat terkenal sebagai
pembuat kecap adalah………………..
(Pertanyaan ini bisa membingungkan karena banyak
kota pembuat kecap di Indonesia, kecap merk apa?
ABC, Potret, Bango, Bintang Menjangan dan lain-
lain).

87
Evaluasi Pembelajaran

 Yang baik:
* Kota di Pulau Jawa yang sangat terkenal sebagai
pembuat kecap merk Menjangan adalah ……………
(Pasti jawabannya Majalengka, karena di Pulau
Jawa hanya kota tersebut pembuat kecap merk
Menjangan).
Dari penjelasan tentang tes esei dan tes objektif
di atas ternyata keduanya memiliki kelemahan
dan kelebihan masing-masing. Dari pengalaman di
lapangan tampaknya tes obyektif dan tes esei sering
dipergunakan sehari-hari, dibandingkan dengan tes-
tes lain, meskipun tes pilihan ganda tetap memiliki
tempat nomor satu. Untuk itu perlu diperhatikan
perbedaan kedua tes tulis tersebut seperti tampak
pada bagan di bawah ini.

88
Evaluasi Pembelajaran

Bagan 2
TES TULIS

TES TULIS

Esei Objektif

Kelebihan

1. Pembuatannya relatif mudah 1. Materi luas


2. Pemecahan dapat diukur 2. Praktis
3. Langkah jawaban jelas 3. Penilai siapa saja

Kelemahan

1. Materi sempit 1. Kemungkinan menebak


2. Tidak menyeluruh 2. Tidak berpendapat
3. Subjektivitas 3. Tidak berkreasi
4. Penilai harus guru 4. Pembuatan relatif sukar

5. 5. Penyusunan
Penyusunan Tes Tes
Sebelum menyusun tes perlu diketahui tentang syarat-syarat tes yang baik

seperti di bawah Sebelum
ini : menyusun tes perlu diketahui tentang
syarat-syarat
a. Tes harus tes yang
benar dan sesuai (valid) baik seperti di bawah ini :
Tes yang sesuai dan benar artinya tes tersebut sesuai dengan tujuan
a. Tes
instruksional dan harus benar
benar-benar danmengukur
mampu sesuai (valid)
apa yang akan diukur. Ketika
hendak mengukur kemampuan ranah kognitif, jangan sampai memberikan soal
Tes yang
yang mengukur ranah sesuai dan benar
afektif. Cara artinya
yang harus tes tersebut
ditempuh adalah ketika
sesuai dengan tujuan
51 instruksional dan benar-
89
Evaluasi Pembelajaran

benar mampu mengukur apa yang akan diukur.


Ketika hendak mengukur kemampuan ranah
kognitif, jangan sampai memberikan soal
yang mengukur ranah afektif. Cara yang harus
ditempuh adalah ketika penyusunan tes harus
selalu mengacu pada kurikulum. Substansi tes
harus benar-benar menguji materi yang telah
diberikan kepada siswa, hindari materi yang
belum pernah diberikan kemudian ditanyakan
dalam tes.
b. Tes harus dapat diandalkan (reliable)
Tes harus reliabel artinya dapat diandalkan,
ajeg, karena mampu menilai dengan tepat dan
tetap. Jika tes tersebut dipergunakan untuk
group yang sama semua kondisi dan situasinya
dapat memberikan hasil yang sama. Misalnya
seperangkat tes yang diberikan di Jakarta Timur,
karena penyusunan dan pengujiannya diberikan
di sana, maka tes tersebut bisa digunakan di
Jakarta Barat, Jakarta Pusat, Jakarta Selatan dan
Jakarta Utara. Jika hasilnya sama atau hampir
sama, baru tes tersebut dikatakan ajeg.
c. Tes Objektif
Tes dikatakan objektif apabila hasil tes siswa bisa
dinilai secara objektif. Unsur subjektivitas penilai
harus dapat dihindari. Apapun bentuk tesnya,
kunci jawaban sudah jelas dan pasti. Kriteria
penilaian sudah dibuat bersama-sama dengan
penyusunan soal.
d. Menggambarkan perilaku siswa
Tes yang akan dibuat harus benar-benar

90
Evaluasi Pembelajaran

mampu menggambarkan tingkat kemampuan


dan penguasaan siswa tentang materi yang
telah diajarkan. Apakah siswa berperilaku
sesuai dengan yang diharapkan dalam tujuan
instruksional umum dan khusus setelah mengikuti
tes? Ini sangat penting untuk diperhatikan.
e. Tes Bersifat Menyeluruh
Penting sekali memberikan tes kepada siswa yang
sifatnya menyeluruh. Tes yang harus menguji
parsial tidak akan dapat menggambarkan
secara umum kemampuan siswa. Misalnya akan
menguji siswa dalam ranah kognitif. Misalnya
tes dalam mata pelajaran sejarah, jangan hanya
aspek ingatan saja yang dipertanyakan. Tes
harus dapat menilai kemampuan pemahaman
dan analisis, sebab materi sejarah tidak semua
berbentuk hafalan, banyak peristiwa sejarah
yang memerlukan pemecahan, interpretasi dan
analisis siswa.
f. Tes Memiliki Daya Pembeda
Syarat yang tidak kalah pentingnya adalah
daya pembeda. Penyusunan tes hendaknya
dimulai dari yang mudah, sedang dan sulit. Tes
yang demikian akan memberikan petunjuk
tentang siswa yang cerdas, kurang cerdas, cepat
menangkap pelajaran, tidak mau belajar dan
lain sebagainya. Ringkasnya tes yang demikian
mampu membedakan kemampuan peserta tes.

91
Evaluasi Pembelajaran

6. Langkah Penyusunan Tes


a. Menentukan tujuan tes
Tes dimaksud dibuat untuk menentukan
kemampuan awal siswa, mengetahui kemajuan
belajar, mendiagnosis kesulitan belajar dan
mengukur penampilan siswa pada akhir
pelajaran. Setiap jenis pemakaian tes menurut
karakternya menuntut beberapa perubahan
dalam penyusunan tes.
b. Berpedoman pada kisi-kisi tes
Sebelum menyusun tes terlebih dahulu harus
dibuat rancangan tes berupa kisi-kisi yang akan
menjadi acuan selama penyusunan tes sampai tes
itu dikontrol kembali sebelum digunakan. Kisi-kisi
ini sangat penting untuk menjaga agar penyusun
tes tidak membuat tes seenaknya, tetapi selalu
berpegang pada garis yang telah ditentukan
sehingga dapat mencegah seandainya penyusun
tes “lari” terlalu jauh dari tujuan instruksional
khusus sebagai pedoman penyusunan tes. Untuk
itu di sini diberikan contoh kisi-kisi seperti tampak
pada bagan 4.

92
kisi-kisi yang akan menjadi acuan selama penyusunan tes sampai tes itu dikontrol
kembali sebelum digunakan. Kisi-kisi ini sangat penting untuk menjaga agar
penyusun tes tidak membuat tes seenaknya, tetapi selalu berpegang pada garis
yang telah ditentukan sehingga dapat mencegah seandainya penyusun tes “lari”
terlalu jauh dari tujuan instruksional khusus sebagaiEvaluasi
pedoman penyusunan tes.
Pembelajaran
Untuk itu di sini diberikan contoh kisi-kisi seperti tampak pada bagan 4.
TABEL 9
KISI-KISI TES HASIL BELAJAR KELAS 2 SLTP SEMESTER I
MATA PELAJARAN IPS
WAKTU : 40 MENIT

Ranah Jumlah
Kognisi Afeksi
No. Urut

Pemahaman
Penerapan
Pokok Bahasan Nomor Butir Soal

Butir
Ingatan

Kognisi

Konasi
Afeksi
1 Pergerakan Nasional 3 3 1 1 2 1, 5, 7, 9, 26, 28, 29, 33, 47, 48 10 20

2 Sumpah Pemuda 1 1 1 1 1 2, 3, 21, 22, 27 5 10

3 Pendudukan Jepang 2 1 2 4, 6, 40, 43, 44 5 10

4 Proklamasi 3 2 2 1 1 1 12, 13, 15, 18, 25, 31, 34, 35, 49, 50 10 20
Kemerdekaan

5 Menyusun 1 1 1 1 1 8, 11, 14, 19, 23 5 10


Kelengkapan Negara

6 Sejarah Terbentuknya 2 1 1 1 24, 36, 39, 41, 42 5 10


PBB

7 Konferensi Asia Afrika 2 3 2 1 2 10, 16, 17, 20, 30, 32, 37, 38, 45, 46 10 20

50 100

c. Perhatikan syarat-syarat
53 tes
Langkah selanjutnya adalah memenuhi semua
syarat-syarat dalam penulisan tes seperti sudah
dikemukakan di atas.
d. Fungsi tes
Selanjutnya perhatikan apa fungsi penulisan tes
tersebut, apakah untuk tes remedial, diagnostik,

93
Evaluasi Pembelajaran

formatif, sumatif, penempatan, saringan masuk


sekolah dan lain-lain.
e. Tulis petunjuk yang jelas
Kemudian tulis petunjuk cara mengerjakan soal
sejelas-jelasnya berikut bobot yang diberikan
agar siswa tahu apa yang akan terjadi dengan
nilai ujiannya. Secara umum berikan petunjuk
umum yang jelas untuk hal-hal yang bersifat
umum, seperti tulis nama dan nomor ujianmu
dan lain-lain. Kemudian cantumkan petunjuk
khusus mengenai cara mengerjakan soal menurut
bentuk soal yang diberikan. Jelasnya meskipun
materi sama tapi jika bentuk soal berbeda
tentu berbeda cara mengerjakannya, karena itu
setiap bentuk soal diganti, maka petunjuknya
dicantumkan berikut bobotnya. Misalnya soal
pilihan ganda tentu berbeda petunjuknya dengan
soal menjodohkan dan jawaban singkat, juga
akan mempunyai bobot yang berbeda.
f. Bahasa yang baik dan benar
Dalam menyusun soal pemakaian bahasa sangat
menentukan, karena itu gunakan bahasa yang
baik dan benar, sederhana, komunikatif, tidak
bertele-tele dapat mencerminkan apa yang ingin
ditanyakan oleh penyusun.
g. Tidak ada jebakan
Usahakan agar menghindari soal yang sifatnya
jebakan, karena tujuan penyusunan tes adalah
untuk mengetahui tingkat penguasaan siswa
dalam mata pelajaran tertentu. Tes ini sama
sekali tidak dimaksudkan untuk jebak-jebakan.

94
Evaluasi Pembelajaran

h. Jumlah soal lebih banyak


Persediaan soal harus banyak, jika akan membuat
50 soal, buat saja 100 soal kalau diuji coba
mungkin akan terjaring antara 50-60 soal. Di
samping itu seandainya setelah dibaca sekali lagi
merasa kurang sreg, nanti langsung bisa diganti
oleh soal yang ada.
i. Buat kunci jawaban
Setiap soal hendaknya langsung dibuat kunci
jawabannya. Jika ada soal uraian tetap dibuat
kunci jawaban berupa kata-kata kunci yang harus
ada dalam jawaban peserta tes
j. Tes paralel
Sebaiknya disediakan tes paralel, bila terjadi
sesuatu pada tes yang telah disediakan segera
bisa diganti. Hal ini wajib dilakukan bagi guru yang
mengajar di kelas paralel, untuk menghindari
kebocoran soal
k. Buat lembar jawaban
Jangan lupa mempersiapkan lembar jawaban
pada setiap penyusunan tes sesuai dengan
bentuk soal. Lembar jawaban sangat membantu
pemeriksa jawaban.
l. Simpan dulu
Sangat baik jika penyusunan soal dibuat jauh-
jauh hari sebelum soalnya digunakan. Jika soal
disimpan dulu beberapa hari, biasanya baru
ditemukan kekurangannya setelah dibaca ulang.
Dengan demikian masih ada kesempatan untuk
memperbaiki dan menambah atau mengurangi
95
Evaluasi Pembelajaran

soal-soal yang perlu direvisi dan disempurnakan.


m. Dibaca teman
Lebih baik lagi kalau ada teman sejawat yang
berkenan membaca dan menyempurnakan soal-
soal yang telah jadi. Bagaimanapun dua atau
tiga kepala akan lebih baik daripada hanya satu
kepala yang memikirkan soal-soal tersebut.
n. Pengujian (kalau mungkin)
Yang paling baik kalau memungkinkan
diujicobakan terhadap soal-soal tersebut. Caranya
dengan memberikan pada sekelompok siswa
yang telah menempuh mata pelajaran tersebut,
kemudian diperbaiki, hasilnya diujicoba lagi agar
diketahui daya pembeda, tingkat kesulitan dan
distrakta pilihan untuk soal-soal pilihan ganda.
Untuk soal lain agar diketahui keajegan dan
kesahihannya.
B. Pengembangan Instrumen Nontes
Sebelum membahas teknik pengembangan instrumen
penilaian nontes, terlebih diketahui skala pengukuran yang
seringkali mendasari penyusunan instrumen penilaian
nontes.
1. Skala Pengukuran
Taksonomi prosedur pengukuran meliputi empat
skala pengukuran yaitu :
a. Nominal
Skala pengukuran ini merupakan yang
paling sederhana, yang menempatkan objek
berdasarkan kategori objek yang bersangkutan.

96
Evaluasi Pembelajaran

Contohnya untuk jenis kelamin: laki-laki dan


perempuan. Untuk menempatkan objek tersebut
diperlukan kriteria tertentu yang sifatnya
kualitatif tidak kuantitatif. Jadi dalam skala
nominal tidak dapat
mengolah data secara matematis, artinya
angka-angka yang ada tidak dapat dikali, dibagi,
ditambah, dan dikurang. Misalnya jika 3 laki-laki
ditambah 6 perempuan tidak mungkin menjadi
9 orang banci. Masing-masing kategori saling
lepas satu sama lain, saling berbeda dan memiliki
ciri masing-masing, tidak ada hubungan yang
menunjukkan saling keterikatan dan keterkaitan,
berurutan atau yang satu lebih dari yang lain.
Untuk objek skala nominal dapat diberikan
angka, tetapi fungsinya bukan numerik yang
berurutan, misalnya yang nomor 2 berarti lebih
tinggi atau lebih rendah dari nomor 1, angka 1, 2,
3 dan sebagainya hanya merupakan label saja.
Misalnya laki-laki diberi nomor 1 dan perempuan
nomor 10 atau sebaliknya. Maka semua laki-
laki identitasnya 1 dan perempuan 10 demikian
selanjutnya. Jika laki-laki mau diganti dengan
3 dan perempuan 2 bisa saja tanpa mengubah
apa-apa hanya lambang saja. Misalnya panitia
memberi nomor kepada peserta Miss Universe
maka nomor tersebut baru menunjuk pada
identitas peserta, sama sekali tidak menjamin
bahwa nomor 48 tidak akan mendapat gelar
apapun karena hanya ada 7 jenis gelar yang
diperebutkan. Sebaliknya nomor dada 1 bukan
merupakan kepastian akan mendapatkan gelar
Miss Universe. Semua nomor hanya untuk

97
Evaluasi Pembelajaran

kategori peserta dan tidak menjanjikan apa-apa.


b. Ordinal
Melalui skala pengukuran ini dapat diketahui
tentang kelebihan atau kekurangan atau
persamaan posisi satu objek dengan objek lain
tanpa menentukan jarak yang sama. Posisi
tersebut misalnya untuk menunjukkan ranking
tentang prestasi siswa dalam satu kelas. Ranking
1 s/d 10 biasa disebut 10 besar artinya kesepuluh
siswa tadi memiliki prestasi tertinggi di kelasnya
yang bisa berjumlah 40 s/d 45 orang. Namun
jarak ranking 1, 2, 3 dan seterusnya tidak usah
sama, misalnya nilai ranking pertama: 95, kedua:
88, ketiga: 87, keempat: 85, kelima: 80 dan
seterusnya. Jadi skala ordinal menunjuk pada
urutan ke 1, ke 2, ke 3, ke 4, ke 5 dan tidak usah
berjarak sama. Meskipun demikian skala ordinal
disusun berdasarkan pengukuran empiris dan
menunjukkan bahwa sekor ranking pertama
lebih tinggi dari kedua dan seterusnya sampai
ranking kesepuluh memiliki angka terendah.
Urutan dimaksud tidak ada kriteria yang
menyebutkan bahwa ke 1 harus sekian, ke 2
sekian dan seterusnya. Meskipun nilai kesatu
100, kedua 82, ketiga 81, keempat 75 dan kelima
70 dan seterusnya tetap saja individu-individu
yang memiliki angka seperti itu termasuk dalam
skala ordinal.
c. Interval
Ciri skala ini adalah jarak yang sama pada urutan
objek yang diukur dengan titik asal yang tidak
tetap. Urutan tersebut berdasarkan atribut yang
98
Evaluasi Pembelajaran

diwakili tidak hanya berdasarkan jarak yang sama


tetapi juga sifat yang sama dari atribut yang
diukur. Karena itu perbandingan urutan yang
satu dengan yang lain tidak mempunyai arti.
Selanjutnya karena titik asal tidak ditetapkan
dengan pasti maka angka-angka tersebut tidak
dapat dikali atau dibagi. Misalnya diberikan 40
soal yang tingkat kesulitannya dari mudah ke sulit
dengan bobot soal 2. Siswa A mendapat sekor 30,
siswa B 40 dan siswa C 60. Jika data tersebut bisa
dibagi atau dikali, maka asumsi siswa C memiliki
kepandaian dua kali lipat siswa A mungkin bisa
dibenarkan. Namun, ketika diberikan 8 soal lagi
dengan tingkat kesulitan tinggi dengan bobot
soal 2,5 dan hanya terjawab 4 soal oleh siswa C
terjawab 2 soal oleh siswa A dan 1 soal oleh siswa
B, maka sekor siswa C menjadi 70, sedangkan
sekor siswa A menjadi 35 dan sekor B menjadi
42,5. Jadi asumsi bahwa siswa C memiliki
kepandaian dua kali lipat siswa A tidak berlaku
lagi. Dengan demikian perbandingan sekor data
tidak mempunyai arti tetapi perbedaan posisi
sekor yang diukur berdasarkan skala interval itu
tetap ada.
d. Rasio
Skala ini memiliki harga 0 (nol) yang mutlak,
dengan interval yang sama karena itu skala
rasio sering disebut sebagai skala tertinggi.
Sebagai contoh misalnya gaji pegawai A yang
menerima Rp 2.155.000 dan B Rp 2.329.000
kemudian C Rp 2.560.000 itulah nilai mutlak yang
diterima masing-masing pegawai. Gaji tersebut
merupakan gaji bersih yang diterima setelah
99
Misalnya diberikan 40 soal yang tingkat kesulitannya dari mudah ke sulit
Evaluasi Pembelajaran
dengan bobot soal 2. Siswa A mendapat sekor 30, siswa B 40 dan siswa C 60.
Jika data tersebut
mendapatbisa dibagi atau dikali,
berbagai maka asumsi
potongan dan siswa C memiliki
tunjangan,
kepandaian dua kali lipat siswa A mungkin bisa dibenarkan. Namun, ketika
tetapi
diberikan 8 soal gaji pokok
lagi dengan pegawai
tingkat kesulitan negeri
tinggi denganatau
bobot swasta
soal 2,5 dan
tetap
hanya terjawab saja
4 soal olehmengacu pada 2aturan
siswa C terjawab soal olehtertentu
siswa A danyang1 soal
oleh siswa mempunyai
B, maka sekor jarak
siswa C interval sama. Misalnya untuk A
menjadi 70, sedangkan sekor siswa
menjadi 35 dan sekor B menjadi 42,5. Jadi asumsi bahwa siswa C memiliki
golongan 3 dengan masa kerja 10 tahun tidak
kepandaian dua kali lipat siswa A tidak berlaku lagi. Dengan demikian
perbandingansama
sekor dengan
data tidak golongan
mempunyai arti 3 dengan masa kerja
tetapi perbedaan 4
posisi sekor
yang diukur tahun danskala
berdasarkan seterusnya. Karyawan
interval itu tetap ada. yang belum
d. Rasio diangkat pegawai negeri, belum mendapatkan
Skalagaji tetap, harga
ini memiliki jadi 0gajinya 0 mutlak,
(nol) yang rupiah dengan
dari interval
negara,yang
sama karenameskipun
itu skala rasio sering disebut
mendapat honorsebagai skaladari
bukan tertinggi. Sebagai
negara.
contoh misalnya gaji pegawai A yang menerima Rp 2.155.000 dan B Rp
DenganC Rp
2.329.000 kemudian demikian
2.560.000data
itulah rasio mempunyai
nilai mutlak nilai
yang diterima 0
masing-
mutlak dengan interval yang sama.
masing pegawai. Gaji tersebut merupakan gaji bersih yang diterima setelah
mendapat berbagai potongan dan tunjangan, tetapi gaji pokok pegawai negeri
e. Guttman
atau swasta tetap saja mengacu pada aturan tertentu yang mempunyai jarak
interval sama. Misalnya untuk golongan 3 dengan masa kerja 10 tahun tidak
Skala yang digunakan untuk mengukur jawaban
sama dengan golongan 3 dengan masa kerja 4 tahun dan seterusnya. Karyawan
yang belumterhadap pernyataan
diangkat pegawai yangmendapatkan
negeri, belum menawarkan duajadi
gaji tetap,
kemungkinan yaitu benar salah, baik buruk,
gajinya 0 rupiah dari negara, meskipun mendapat honor bukan dari negara.
Dengan demikian data rasio mempunyai nilai 0 mutlak dengan interval yang
positif negatif, tinggi rendah dan lain-lain.
sama.
Setuju dan tidak setuju adalah dua interval yang
e. Guttman ditawarkan dalam skala Guttman sekor 1 untuk
Skala yang digunakan untuk mengukur jawaban terhadap pernyataan
jawaban setuju dan sekor 0 untuk jawaban tidak
yang menawarkan dua kemungkinan yaitu benar salah, baik buruk, positif
setuju.
negatif, tinggi rendah dan lain-lain. Setuju dan tidak setuju adalah dua interval
yang ditawarkan dalam skala Guttman sekor 1 untuk jawaban setuju dan sekor
0 untuk jawaban tidak setuju.
TABEL 16
CONTOH SOAL PENGGUNAAN SKALA GUTTMAN
Pernyataan Setuju Tidak Setuju Sekor

1 Pernyerangan Amerika ke Iraq � 1


20 Maret 2003 sangat tidak
terpuji

2 � 0
Total Sekor 1

57
100
Evaluasi Pembelajaran

f. Likert
Skala ini biasanya digunakan untuk mengukur
aspek psikologis seperti: minat, bakat, sikap,
kecemasan, kelelahan, persepsi, motivasi,
kreativitas dan lain-lain. Bentuk pernyataan
f. Likert berupa angket terdiri pernyataan positif dan
Skala ini biasanya digunakan untuk mengukur aspek psikologis
negatif.
seperti: minat, bakat, sikap, kecemasan, kelelahan, persepsi, motivasi,
kreativitas dan lain-lain. Bentuk pernyataan berupa angket terdiri pernyataan
positif dan Sekor
negatif. untuk jawaban pernyataan positif adalah
5, 4, 3, 2 dan
Sekor untuk jawaban 1. Sedangkan
pernyataan untuk
positif adalah 5, 4, 3,jawaban negatif
2 dan 1. Sedangkan
untuk jawaban negatif adalah 1, 2, 4 4, 5. 4
3,
adalah 1, 2, 3, 4, 5 .
TABEL 17
CONTOH PENGGUNAAN SKALA LIKERT

Bentuk No. Pernyataan SS S R TS STS Sekor

+ 1 Saya berusaha mengerjakan tugas v 5


dengan baik

2 Menyontek itu pekerjaan yang v 5


menyenangkan

Total Sekor 10

Keterangan :
SS : Sangat setuju
S : Setuju
R : Ragu-ragu
T : Tidak setuju
STS : Sangat tidak setuju

g. Thurstone
g. Thurstone
Skala ini disusun berdasarkan skala interval dengan rentang
atau
1 s/d 11 Skala iniJumlah
1 s/d 13. disusun berdasarkan
butir sekitar 40 dengan timskala interval
penilai yang terdiri
dari sekitardengan
20 orang ahli. Penilaian berdasarkan konten
rentang 1 s/d 11 atau 1 s/d 13. Jumlahdan konstruk dari
variabel yang hendak diukur. Setiap butir pernyataan memiliki kunci sekor
butirakan
yang jika diurut sekitar 40 dengan
menghasilkan nilai yangtim penilai
berjarak sama. yang terdiri
Contoh : dari sekitar 20 orang ahli. Penilaian berdasarkan
Masalah banjir di Jakarta menjadi tugas utama Gubernur DKI
x x
konten
x
dan konstruk
x x x
dari
x
variabel
x x
yangx
hendak
x
4 1 2 3 4 5 6 7 8 9 10 11
Consuelo G. Sevilla, et. al., Pengantar Metode Penelitian (Jakarta: UI Press,
Sangat Sangat
1993), h. 194.
tidak setuju setuju
101
menyenangkan

Total Sekor 10

Keterangan :
Evaluasi Pembelajaran
SS : Sangat setuju
S : Setuju
diukur.
R Setiap butir pernyataan memiliki kunci
: Ragu-ragu
T : Tidak setuju
sekor yang jika diurut akan menghasilkan nilai
STS : Sangat tidak setuju
yang berjarak sama.
g. Thurstone
Skala ini disusun berdasarkan skala interval dengan rentang
Contoh :
1 s/d 11 atau 1 s/d 13. Jumlah butir sekitar 40 dengan tim penilai yang terdiri
dari sekitar 20 orang ahli. Penilaian berdasarkan konten dan konstruk dari
Masalah
variabel yang banjir
hendak di Jakarta
diukur. menjadi
Setiap butir pernyataantugas
memiliki utama
kunci sekor
Gubernur
yang jika
Contoh :
DKI
diurut akan menghasilkan nilai yang berjarak sama.

Masalah banjir di Jakarta menjadi tugas utama Gubernur DKI


x x x x x x x x x x x
1 2 3 4 5 6 7 8 9 10 11
Sangat Sangat
tidak setuju setuju

h. Semantik Differensial
Consuelo
4
Skala iniet. al.,menggunakan
G. Sevilla, skala
Pengantar Metode Penelitian (Jakarta: interval
UI Press, 1993), h. 194. yang

mengukur sikap dan58 berbagai karakteristik


tertentu. Bentuknya berupa garis kontinum
seperti skala Thurstone dengan rentang 1-7 dan
data yang diperoleh data interval. Jawaban yang
palingDifferensial
h. Semantik positif berada di sebelah kanan garis (sekor
7) dan
Skalajawaban ini menggunakanyang paling skalanegatifinterval di sebelah kiri
yang mengukur sikap da
gariskarakteristik
berbagai (sekor 1), dapat juga diletakkan
tertentu. Bentuknya berupa sebaliknya. garis kontinum seper
skala Thurstone dengan rentang 1-7 dan data yang diperoleh data interva
Contoh:
Jawaban yang paling positif berada di sebelah kanan garis (sekor 7) da
jawaban yang paling negatif
masalah rencana di sebelah Pornografi
Undang-undang kiri garis (sekor
dan 1), dapat jug
diletakkan sebaliknya.
Pornoaksi di Indonesia
Contoh masalah rencana Undang-undang Pornografi dan Pornoaksi
Indonesia
y y y y y y y
1 2 3 4 5 6 7
Sangat sangat
tidak setuju setuju

i. Rating
i. Rating SkalesSkales
DalamDalamskala
skalaini, parapenilai
ini,para penilai(raters)
(raters)terdiri
terdiri dari
dari para ahli yan
dianggap mampu memberikan penilaian terhadap karakter kemampuan profe
atau gaya kepemimpinan seseorang dan sebagainya. Dalam pelaksanaanny
102 sangat diharapkan kejujuran dan objektivitas tinggi dari para raters untu
memberikan penilaian apa adanya. Hal ini sangat penting untuk menghinda
“hello effect”, jangan sampai penilaian dipengaruhi oleh pendapat priba
yang telah mengetahui kondisi objek yang dinilainya. Karena itu pemiliha
Skala ini menggunakan skala interval yang mengukur sikap dan
berbagai karakteristik tertentu. Bentuknya berupa garis kontinum seperti
skala Thurstone dengan rentang 1-7 dan data yang diperoleh data interval.
Jawaban yang paling positif berada di sebelah kanan garis (sekor 7) dan
jawaban yang paling negatif di sebelah kiri garis (sekorPembelajaran
Evaluasi 1), dapat juga
diletakkan sebaliknya.
Contoh para
masalahahli yangUndang-undang
rencana dianggap mampu
Pornografi memberikan
dan Pornoaksi di
Indonesia
penilaian terhadap karakter kemampuan
y y y y y y y
profesi
1 2atau 3gaya4 kepemimpinan
5 6 7 seseorang
dan sebagainya. Dalam pelaksanaannya
Sangat sangat sangat
tidak setuju setuju
diharapkan kejujuran dan objektivitas tinggi dari
para raters untuk memberikan penilaian apa
i. Rating Skales
adanya. Hal ini sangat penting untuk menghindari
Dalam skala ini, para penilai (raters) terdiri dari para ahli yang
dianggap“hello effect”,penilaian
mampu memberikan janganterhadapsampai penilaian
karakter kemampuan profesi
dipengaruhi oleh pendapat pribadi yang
atau gaya kepemimpinan seseorang dan sebagainya. Dalam telah
pelaksanaannya
sangat diharapkan kejujuran dan objektivitas tinggi dari para raters untuk
mengetahui kondisi objek yang dinilainya. Karena
memberikan penilaian apa adanya. Hal ini sangat penting untuk menghindari
itu pemilihan
“hello effect”, raters
jangan sampai disarankan
penilaian dipengaruhiagar dilakukan
oleh pendapat pribadi
yang telah mengetahuimungkin.
seselektif kondisi objek yang dinilainya.
Contoh penilaianKarena itu pemilihan
seperti di
raters disarankan agar dilakukan seselektif mungkin. Contoh penilaian seperti
di bawahbawah
ini. ini.
TABEL 18
PENILAIAN TINGKAT KOMPETENSI GURU 5
Penilaian
No Indikator Tinggi Sedang Rendah Sekor
3 2 1
1 Menguasai bahan � 3
2 Menguasai landasan kependidikan � 2
3 Menyusun program pembelajaran � 3
4 Melaksanakan program pembelajaran � 2
5 Menilai proses dan hasil belajar � 3
6 Menyelenggarakan program � 1
bimbingan dan penyuluhan
7 Menyelenggarakan administrasi � 1
sekolah
8 Mengembangkan kepribadian � 1
98 Berinteraksi dengan sejawat dan � 3
5
Raka Joni dalammasyarakat
Ali Imron, Pembinaan Guru di Indonesia (Jakarta: Pustaka Jaya, 1995), h. 165

10 Menyelenggarakan penelitian 59 � 2
sederhana untuk kepentingan
mengajar
Total Sekor 21

5
Raka Joni dalamInstrumen
2. Pengembangan Ali Imron, Penilaian
Pembinaan Guru
Non Tesdi Indonesia (Jakarta: Pustaka
Jaya,Penilaian
1995), h.non
165tes adalah penilaian kelas yang berupa penilaian yang berbentuk
pengamatan, angket (kuesioner), skala sikap, penilaian proyek, penilaian103
unjuk
kerja, penilaian produk, dan portofolio.

a. Pengamatan
Evaluasi Pembelajaran

2. Pengembangan Instrumen Penilaian Non Tes


Penilaian non tes adalah penilaian kelas yang
berupa penilaian yang berbentuk pengamatan, angket
(kuesioner), skala sikap, penilaian proyek, penilaian unjuk
kerja, penilaian produk, dan portofolio.
a. Pengamatan
Pengamatan adalah alat penilaian kelas yang
dilakukan oleh guru atau siswa dengan cara
mengamati perilaku siswa.
Contoh aspek yang diamati pada pelajaran
Matematika adalah :
• Ketelitian
• Kecepatan siswa
• Kemandirian siswa
Contoh aspek yang diamati pada pelajaran
Bahasa Indonesia adalah :
• Kerapihan tulisan
• Kesantunan bahasa
Contoh aspek yang diamati pada pelajaran
Pendidikan Kewarganegaraan adalah :
• Kedisiplinan
• Tanggung jawab
• Kerja sama
• Kebersihan dan kerapihan

104
adalah :
x Kedisiplinan
x Tanggung jawab
x Kerja sama
x Kebersihan dan kerapihan Evaluasi Pembelajaran

Tabel 3. Contoh Lembar Pengamatan

Mata Pelajaran : Pkn


Kompetensi dasar : Melaksanakan tanggung
jawab di sekolah
Jenis Kegiatan : Pelaksanaan tugas piket
kelas

No. Nama Siswa Sikap Terhadap Tugas Ket


Tepat Tidak
Terlambat
Waktu Piket
1. Arman 60 9
2. Yulfah 9
3 Zaenal 9
Dst ……...

b. Angket
b. Angket
Angket adalah alat penilaian kelas yang berupa daftar tertulis untuk
Angket
menjaring adalah
informasi alat penilaian
tentang sesuatu kelas
yang tidak bisa yang
diamati berupa
langsung oleh
daftar tertulis untuk menjaring informasi tentang
guru. Untuk mengisinya memerlukan bantuan orang lain, misalnya orang
tua atau anak itu sendiri, karena yang diamati perilaku atau keadaan siswa
sesuatu yang tidak bisa diamati langsung oleh
yang ada di rumah, seperti latar belakang siswa, kesehatan siswa, perilaku
siswa diguru. Untuk
rumah, dan mengisinya memerlukan bantuan
sebagainya.
orang lain, misalnya orang tua atau anak itu
Contoh Angket
Nama sendiri, : karena yang diamati perilaku atau
Kelas keadaan : siswa yang ada di rumah, seperti latar
Berilah tanda ( x ) pada huruf a, b, atau c sesuai dengan keadaan yang
belakang siswa, kesehatan siswa, perilaku siswa
sebenarnya yang dilakukan di rumah.
1. Padadiwaktu
rumah, dan sebagainya.
mengerjakan PR yang mengerjakan adalah …
a. orangtua / kakak
b. dibantu orangtua / kakak
c. sendiri
2. Yang membersihkan tempat tidur adalah …
a. orangtua
b. kakak
c. sendiri 105
3. Pada waktu belajar di rumah …
a. harus disuruh baru belajar
b. belajar sesuai kemauan sendiri
Evaluasi Pembelajaran

Contoh Angket
Nama :
Kelas :
Berilah tanda ( x ) pada huruf a, b, atau c sesuai
dengan keadaan yang sebenarnya yang dilakukan
di rumah.
1. Pada waktu mengerjakan PR yang
mengerjakan adalah …
a. orangtua / kakak
b. dibantu orangtua / kakak
c. sendiri
2. Yang membersihkan tempat tidur adalah …
a. orangtua
b. kakak
c. sendiri
3. Pada waktu belajar di rumah …
a. harus disuruh baru belajar
b. belajar sesuai kemauan sendiri
c. tidak belajar
4. Pada waktu makan …
a. harus disuapi
b. makan sendiri
c. kadang disuapi, kadang makan sendiri
5. Pada waktu pulang sekolah …
a. sering terlambat

106
Evaluasi Pembelajaran

b. jarang terlambat
c. tepat waktu
c. Skala sikap
Sikap merupakan suatu konsep psikologi yang
kompleks. Sikap berakar pada perasaan. Ada
pakar psikologi Anastasi ( 1982 ) mendefinisikan
sikap sebagai kecenderungan untuk bertindak
secara suka atau tidak suka tehadap suatu
objek.
Siswa secara individu yang memiliki sikap perlu
dihargai dan dinilai. Untuk penilaiannya dapat
dilakukan dengan menggunakan skala sikap.
Skala sikap adalah alat penilaian kelas yang
berupa sejumlah pernyataan sikap tentang suatu
yang jawabannya dinyatakan secara berskala,
misalnya skala empat, lima atau tujuh.
Langkah – langkah pengembangan skala dapat
mengikuti teknik sebagai berikut :
1) Menentukan obyek sikap yang akan
dikembangkan skalanya, misalnya sikap
terhadap kebersihan.
2) Memilih dan membuat daftar dari konsep
dan kata sifat yang relevan dengan
obyek penilaian sikap, misalnya menarik,
menyenangkan, mudah dipelajari, dan
sebagainya.
3) Memilih kata sifat yang tepat dan akan
digunakan dalam skala.
4) Menentukan skala dan penskoran

107
3) Memilih kata sifat yang tepat dan akan digunakan dalam skala.
4) Menentukan skala dan penskoran

Evaluasi Pembelajaran

Tabel 4. Contoh Penilaian dengan Skala Sikap

Mata Pelajaran : IPS


Kelas / Semester :…
Nama :…
Materi : Kebersihan
Berilah tanda cek (9 ) pada kolom yang tersedia untuk setiap pernyataan !

Skala
No Pernyataan Skor
SS S RG TS STS
1. Kebersihan rumah menjadi
9 5
tanggung jawab orang tua.
2. Rumah sebaiknya dirawat
9 5
kebersihannya setiap hari.
3. Kebersihan ruang kelas
menjadi tanggung jawab 9 3
anggota kelas.
4. Ruang kelas perlu dijaga
9 4
kebersihannya setiap hari.
5. Setiap siswa melaksanakan 62
9 5
piket dengan tanggung jawab.
6. Ketua kelas tidak perlu
melaksanakan tugas piket
9 3
karena sudah bertugas
mengatur kegiatan kelas.
7. Anak yang lalai melaksanakan
tugas piket tidak perlu 9 1
mendapat sanksi.
8. Yang bertugas menjaga
kebersihan sekolah adalah 9 5
penjaga sekolah.
9. Membuan kertas yang kecil
9 4
tidak perlu ditempat sampah.
10. Kebersihan pangkal kesehatan 9 5
Jumlah 40

Keterangan :
Keterangan :
1) SS
1) SS= Sangat
= SangatSetuju
Setuju
S = Setuju
S RG= Setuju
= Ragu – ragu
TS = Tidak Setuju
RG STS
= Ragu – ragu
= Sangat tidak setuju
TS = Tidak Setuju
2) Untuk
STS sikap yang
= Sangat positif
tidak skornya adalah :
setuju
Skor 5 untuk SS
Skor 4 untuk S
Skor 3 untuk RG
Skor 2 untuk TS
108 Skor 1 untuk STS
Untuk sikap yang negatif skornya adalah :
Skor 5 untuk STS
Skor 4 untuk TS
Keterangan :
1) SS = Sangat Setuju Evaluasi Pembelajaran
S = Setuju
2) Untuk sikap yang positif skornya adalah :
RG = Ragu – ragu
TS 5 untuk
Skor = Tidak
SS Setuju
STS = Sangat tidak setuju
Skor 4 untuk S
Skor 3 untuk RG
2) Untuk sikap yang positif skornya adalah :
Skor 2 untuk TS
Skor 5 untuk SS
Skor 1 untuk
SkorSTS
4 untuk S
Untuk sikapSkoryang
3 untuk RG skornya adalah :
negatif
Skor 2 untuk TS
Skor 5 untuk
Skor STS
1 untuk STS
SkorUntuk sikapTS
4 untuk yang negatif skornya adalah :
Skor 5 untuk STS
Skor 3 untuk
Skor RG
4 untuk TS
Skor 2 untuk S3 untuk RG
Skor
Skor 2 untuk S
Skor 1 untuk
SkorSS
1 untuk SS
3) Untuk menentukan nilai akhir adalah :
3) Untuk menentukan nilai akhir adalah :
Skor
Perolehan
Nilai = x 100
Skor
Maksimal

Nilai = 40 x 100 = 80
50
63

Kisi-kisi Instrumen Sikap Siswa


Terhadap Pelajaran Sejarah

Materi Pokok Pergerakan Konfere


Dimensi Nasional Asia-Afr
Kognisi 1 6
Afeksi 2, 4 109 3
Konasi 7 5
50

Evaluasi Pembelajaran

Kisi-kisi Instrumen Sikap Siswa


Terhadap Pelajaran Sejarah

Materi Pokok Pergerakan Konferensi


Dimensi Nasional Asia-Afrika
Kognisi 1 6
Afeksi 2, 4 3
Konasi 7 5

INSTRUMEN SIKAP

Jawaban
No Pertanyaan
S SS R TS STS
1 Saya akan menjadi anggota suatu
organisasi untuk memperoleh
pengalaman berdiplomasi karena
dari peristiwa sejarah ternyata
perjuangan diwujudkan melalui
diplomasi
2 Saya tidak akan bertindak seperti
kaum elit nasional dalam
menghadapi pemerintah Belanda,
terhadap penjajah dari manapun
pada masa sekarang dan di masa
depan
3 Saya tidak simpati pada Nehru
karena terlalu dekat dengan
Inggris
4 Sebagai rakyat Indonesia saya
akan bertindak tegas menghadapi
kaum penjajah sebagaimana
dilakukan rakyat Indonesia
terhadap penjajah Belanda
5 Konferensi Asia-Afrika peserta-
nya cukup banyak, oleh karena
itu saya mendukung usaha
yang akan menghimpun peserta
sebanyak-banyaknya jika 64kon-
ferensi serupa dilaksanakan lagi
6 Bagi saya tidak benar bahwa
mengucapkan sumpah merupakan
hal mudah, tapi melaksanakan-
nya yang sulit
7 Sebagai bangsa Indonesia saya
bangga Konferensi Asia-Afrika I
dilaksanakan di Bandung pada
tahun 1955.

110
d. Penilaian proyek
Proyek adalah suatu tugas yang harus diselesaikan oleh siswa dalam periode /
waktu tertentu. Proyek ini digunakan sebagai sarana untuk mengembangkan
dan memonitor keterampilan siswa di dalam merencanakan, melaksanakan dan
Evaluasi Pembelajaran

d. Penilaian proyek
Proyek adalah suatu tugas yang harus diselesaikan
oleh siswa dalam periode / waktu tertentu.
Proyek ini digunakan sebagai sarana untuk
mengembangkan dan memonitor keterampilan
siswa di dalam merencanakan, melaksanakan
dan melaporkan hasil kegiatan.
Contoh proyek antara lain melakukan
pengamatan pertumbuhan dan perkembangan
tanaman, percobaan pengaruh sinar matahari
terhadap pertumbuhan dan perkembangan
tanaman, perkembangbiakan tanaman melalui
pencangkokan, dan lain-lain.
Dalam pedoman ini topik yang menjadi contoh
proyek adalah perkembangbiakan tanaman
melalui pencangkokan. Siswa diberi tugas untuk
menanam tumbuhan dengan cara mencangkok.
Tugas yang dilaksanakan mulai dari pencangkokan
sampai tanaman itu ditanam dan tumbuh.
Langkah – langkahnya antara lain :
1) Persiapan
- Pemilihan tanaman yang akan dicangkok
- Menyiapakan sabut kelapa atau plastik
- Menyiapkan tanah / pupuk
- Menyiapkan pisau yang bersih
- Menyiapkan tali pengikat
2) Pelaksanaan / pemeliharaan
- Pelaksanaan pencangkokan

111
Evaluasi Pembelajaran

- Pemeliharaan menyiram setiap hari


- Pengamatan pertumbuhan akar
- Persiapan tempat untuk menanam
tumbuhan yang sedang dicangkok
- Memotong dan menanam cangkokan yang
sudah tumbuh akarnya dan menanam
- Menyiram tanaman setiap hari
3)
- Pelaporan
Menyiram tanaman setiap hari
3) Pelaporan
- - Pengamatan
Pengamatan / pencatatan
/ pencatatan pertumbuhan
pertumbuhan
- Pelaporan hasil
- - Tanaman
Pelaporan
tidakhasil
tumbuh
- Tanaman tumbuh
- Tanaman tidak tumbuh
- Tanaman tumbuh

Tabel 5. Contoh Pelaksanaan Penilaian Proyek


Mata Pelajaran : Ilmu Pengetahuan Alam
Kelas / Semeter : VI
Jenis Kegiatan : Menanam tanaman melalui
Pencangkokan

Pelaksanaan / Pelaporan
Nama Persiapan
No Pemeliharaan / Hasil Nilai
Siswa 0 – 20
0 – 40 0 – 40

112
e. Penilaian hasil kerja ( produk )
Penilaian hasil kerja adalah penilaian terhadap keterampilan siswa dalam
membuat suatu produk benda tertentu dan kualitas produk tersebut. Hasil kerja
Evaluasi Pembelajaran

e. Penilaian hasil kerja ( produk )


hasil kerja adalah penilaian terhadap keterampilan
siswa dalam membuat suatu produk benda
tertentu dan kualitas produk tersebut. Hasil
kerja yang dimaksud disini misalnya produk
kerja siswa yang terbuat dari kain, kertas, metal,
kayu, plastik, keramik dan hasil karya seni yang
berupa lukisan, gambar dan patung. Produk lain
misalnya adalah peta, globe, rakitan elektronik,
diorama, bagan, grafik, karangan, puisi, dan lain
sebagainya.
Dalam penilaian hasil produk siswa terdapat dua
tahapan penilaian, yaitu :
1) Penilaian tentang pemilihan dan cara
penggunaan alat dan prosedur kerja siswa.
2) Penilaian tentang kualitas, teknis, dan
estetik hasil/karya siswa.
Contoh penilaian produk adalah sebagai
berikut :
Mata Pelajaran : Ilmu Pengetahuan Alam
Kompetensi dasar : Rangkaian listrik seri
dan pararel
Indikator : Siswa dapat
membuat rangkaian listrik seri dan pararel
yang dipasangkan pada miniatur rumah
yang terbuat dari kardus / karton atau stik
es krim.
Buatlah miniatur rumah yang terbuat
dari karton/ kardus atau stik es krim yang
dilengkapi dengan rangkaian listrik secara
113
Evaluasi Pembelajaran

seri dan pararel lampu yang ada di setiap


ruangan.
Pelaksanaannya :
Persiapan :
1. Bahan
- Kabel
- Fiting dan bohlam 5 buah
- Saklar 5 buah
- Batu baterai 2 buah dan dudukannya
- Kardus/karton atau stik es krim
2. Alat
- Gunting
- Lem
- Isolatip
Proses :
 Pembuatan miniatur rumah
 Pemasangan rangkaian listrik pada miniatur
rumah
Hasil :
 Rangkaian listrik menyala sesuai yang
diharapkan
 Keindahan / kebersihan miniatur rumah
 Kualitas hasil pekerjaan siswa

114
ƒ Rangkaian listrik menyala sesuai yang diharapkan
ƒ Keindahan / kebersihan miniatur rumah
ƒ Kualitas hasil pekerjaan siswa
Evaluasi Pembelajaran

Tabel 6. Contoh Lembar Penilaian Produk

Hasil
Persiapan Pelaksanaan
No. Nama Siswa 0- Nilai
0 -20 0 – 40
40
1. Ibrahim 20 20 30 70
2. Rahman 20 30 30 80

67

f. Penilaian Portofolio
Portofolio adalah suatu kumpulan atau berkas
f. pilihan yang
Penilaian dapat memberikan informasi bagi
Portofolio
suatu penilaian. Kumpulan
Portofolio adalah suatu kumpulanatau hasil pilihan
atau berkas kerja yang dapat
tersebut
informasi berisi pekerjaan
bagi suatu siswa
penilaian. selama atau
Kumpulan waktu hasil kerja ter
tertentu
pekerjaan yang
siswa dapat
selama memberi informasi
waktu tertentu bagi memberi inf
yang dapat
penilaian yang
penilaian yang obyektif,
obyektif,yang
yangmenunjukkan
menunjukkan apaapa
yang dapat dila
yang dapat dilakukan siswa dalam lingkungan Hasil ker
dalam lingkungan dan suasana belajar yang dialami.
menjadi
dan ukuranbelajar
suasana tentang seberapa baik tugas
yang dialami. yang
Hasil diberikan kepad
kerja
dilaksanakanmenjadi
dimaksud sesuai dengan tujuan
ukuran pembelajaran
tentang yang ada dalam k
seberapa
Dalam penilaian di kelas portofolio dapat digunakan untuk menca
baik tugas yang diberikan kepada siswa telah
tujuan antara lain :
dilaksanakan
1) Menghargai sesuai dengan tujuan
perkembangan pembelajaran
yang dialami siswa.
2) Mendokumentasikan proses pembelajaran yang berlangsung.
115 terbaik.
3) Memberi perhatian pada prestasi kerja siswa yang
4) Merefleksikan kesanggupan mengambil resiko dan
eksperimentasi.
Evaluasi Pembelajaran

yang ada dalam kurikulum.


Dalam penilaian di kelas portofolio dapat
digunakan untuk mencapai beberapa tujuan
antara lain :
1) Menghargai perkembangan yang dialami
siswa.
2) Mendokumentasikan proses pembelajaran
yang berlangsung.
3) Memberi perhatian pada prestasi kerja siswa
yang terbaik.
4) Merefleksikan kesanggupan mengambil
resiko dan melakukan eksperimentasi.
5) Meningkatkan efektifitas proses
pengajaran.
6) Bertukar informasi dengan orang tua, wali
siswa dan guru lain.
7) Membina dan mempercepat pertumbuhan
konsep diri positif pada siswa.
Bentuk Portofolio
Portofolio ini berbentuk dokumen yang disimpan
dalam booksfile atau binder dan setiap siswa
memiliki satu booksfile/binder.

116
Evaluasi Pembelajaran

Tabel 7. Contoh Format Penilaian portofolio

Mata Pelajaran : Matematika


Nama : Achmad Abubakar
Kelas :VB
Periode Penilaian : Juli 2005 – Juni 2007

No Prestasi/Karya/Tugas/ Nilai/ Catatan khusus Ketrgn


Kegiatan Predikat
1 Lomba Matematika Juara I Menyisihkan Piagam
Tingkat Kab. Aceh 30 siswa wakil dari
Barat kec. lain. Akan Bupati
dikirim ke tkt.
Propinsi
dst ................................ ............. ......................... ...........

Meulaboh, .................
Guru,
Nilai Akumulasi:
90 (Sangat Baik)

Siti Fatimah, S.Pd

117
Evaluasi Pembelajaran

118
Evaluasi Pembelajaran

BAB IV
VALIDITAS DAN RELIABILITAS
INSTUMEN

A. TUJUAN PEMBELAJARAN
Mahasiswa diharapkan mampu menjelaskan konsep
validitas dan reliabilitas serta penerapannya dalam
instrumen/seperangkat tes.
B. POKOK BAHASAN
1. Konsep Validitas dan Reliabilitas
2. Menghitung Validitas dan Reliabilitas instrumen
C. URAIAN MATERI
1. Validitas
Validitas menunjuk pada sejauh mana suatu
alat ukur mampu mengukur secara tepat pada apa
yang mau diukur. Validitas merupakan pengujian
yang paling mendasar dan mencakup beberapa
pertimbangan sebagai acuan terhadap reliabilitas.1
Artinya jika suatu tes tidak mempunyai validitas yang
tinggi, maka kesahihan tes tersebut masih diragukan.
Sebagai contoh jika seorang guru membuat tes
pelajaran sejarah yang tujuan instruksional umumnya

1
Thomas L. Good & Jere E. Brophy, Educational Psychology, (New York:
Longman, 1990), h. 687

119
Evaluasi Pembelajaran

untuk menanamkan rasa kebangsaan dan nilai-nilai


cinta tanah air jika hal ini tidak tercapai berarti tes
tersebut tidak valid karena tidak dapat mengukur
apa yang ingin diukur.
Validitas tidak hanya ditujukan untuk mengukur
ketepatan tes tetapi juga digunakan untuk mengukur
instrumen penelitian. Dalam instrumen penelitian
validitas harus mampu mengungkapkan data sesuai
dengan masalah yang diungkapkan secara tepat dan
benar seperti situasi dan kondisi yang sebenarnya.
Misalnya jika seorang peneliti hendak mengukur
tentang sikap siswa terhadap Pancasila, maka
instrumen tentang sikap siswa harus benar-benar
mampu mengukur tentang sikap siswa terhadap
Pancasila. Apapun yang hendak diukur oleh peneliti,
apakah itu tingkat kecemasan seseorang, penalaran
formal siswa, motivasi berprestasi, minat dan bakat
siswa dan aspek psikologis lain maka instrumen yang
memiliki validitas tinggi akan mampu menjawab apa
yang ingin diukur. Oleh sebab itu sebelum instrumen tes
buatan sendiri diturunkan perlu dihitung validitasnya.
Hal yang perlu diperhatikan dalam penyusunan
instrumen, harus menggunakan alat ukur yang tepat.
Jika hendak mengukur ukuran badan seorang calon
Miss Universe menggunakan timbangan emas tentu
tidak akan tepat dan benar, meskipun calon sang ratu
tampak sangat langsing dengan berat badan yang
ringan. Demikian juga jika hendak mengukur tentang
kemampuan seseorang tentang bakatnya dalam
menjahit, disodorkan instrumen yang isinya tentang
apa makanan kesukaannya, meskipun keduanya sama-
sama mengukur minat. Jika instrumen tersebut diuji
validitasnya tentu tidak akan mampu memberikan

120
Evaluasi Pembelajaran

data yang akurat sebagai data penelitian.


Tujuan penggunaan tes harus selalu menjadi
bahan pertimbangan pembuat tes. Misalnya suatu
tes diberikan kepada siswa untuk mengetahui tingkat
kecemasan siswa dalam menghadapi pelajaran fisika.
Perlu dipertanyakan apakah tes itu untuk sekelompok
siswa usia SLTP atau usia SLTA? Apakah tes tersebut
khusus untuk seluruh siswa SLTP dan SLTA? Atau
hanya bagi kelompok tertentu dalam satu sekolah
karena disinyalir ternyata guru fisika di kelas 2 lebih
“galak” (padahal sebenarnya lebih disiplin) daripada
guru fisika di kelas 3 yang jauh lebih lemah lembut
(padahal tidak tegas)? Di samping tujuan, fungsi tes
juga harus diperhatikan, untuk apa tes itu diberikan?
Apakah untuk tes penempatan pada kelas berikutnya
atau hanya ingin mengetahui tingkat kemampuan
kognitif siswa saja. Dengan demikian jelas bahwa
tes yang valid itu harus dikatakan valid untuk siapa
(pribadi atau kelompok) yang akan diukur. Sangat
tidak mungkin seperangkat tes dapat digunakan dan
diperuntukkan bagi siapa saja, kapan saja dan di mana
saja seperti coca cola. Tes intelegensi bagi siswa SD
usia dini di Amerika yang sudah baku dan memiliki
validitas tinggi, artinya mempunyai varians kesalahan
kecil belum tentu cocok bagi anak Indonesia siswa SD
usia sama. Intinya kesahihan seperangkat tes tidak
dapat berlaku untuk semua tujuan yang akan diukur
apalagi untuk melakukan tes dalam aspek psikologi
yang lebih banyak memiliki varians kesalahan, karena
aspek tersebut tidak menyangkut fisik yang dapat
dilihat dengan kasat mata. Pernah terjadi seorang
promovendus fisika ditanya promotor tentang
keadaan mentalnya, dengan spontan menjawab

121
tes. Misalnya suatu tes diberikan kepada siswa untuk mengetahui tingkat
kecemasan siswa dalam menghadapi pelajaran fisika. Perlu dipertanyakan apakah
tes itu untuk sekelompok siswa usia SLTP atau usia SLTA? Apakah tes tersebut
khusus untuk seluruh siswa SLTP dan SLTA? Atau hanya bagi kelompok tertentu
dalam satu
Evaluasi sekolah karena disinyalir ternyata guru fisika di kelas 2 lebih “galak”
Pembelajaran
(padahal sebenarnya lebih disiplin) daripada guru fisika di kelas 3 yang jauh lebih
lemahsedang
lembut (padahal
beradatidak tegas)?
dalam Di samping
kondisi primatujuan,
siapfungsi tes Tanpa
diuji. juga harus
diperhatikan, untuk apa tes itu diberikan? Apakah untuk tes penempatan pada
kelas terasa
berikutnyakeringat bercucuran
atau hanya ingin mengetahuidaritingkatseluruh
kemampuan tubuhnya
kognitif siswa
dan disertasi
saja. Dengan demikian jelas pun basah
bahwa kuyup
tes yang valid itukarena tangannya
harus dikatakan valid untuk
siapa (pribadi atau kelompok) yang akan diukur. Sangat tidak mungkin
yang gemetar penuh keringat. Agak sulit memang
seperangkat tes dapat digunakan dan diperuntukkan bagi siapa saja, kapan saja
dan diuntuk mengukur
mana saja seperti cocaaspek psikologis,
cola. Tes karena
intelegensi bagi siswa kejujuran
SD usia dini di
Amerikarespondenpun sangat penting.
yang sudah baku dan memiliki validitas tinggi, artinya mempunyai
varians kesalahan kecil belum tentu cocok bagi anak Indonesia siswa SD usia
sama. IntinyaSuatu
kesahihantes/istrumen
seperangkat tes dikatakan valid untuk
tidak dapat berlaku apabila semuates/
tujuan
yang akan diukur apalagi untuk melakukan tes dalam aspek psikologi yang lebih
instrumen tersebut cermat dan akurat dalam mengukur
banyak memiliki varians kesalahan, karena aspek tersebut tidak menyangkut fisik
aspek
yang dapat yang
dilihat akankasat
dengan diukur. Katakan
mata. Pernah saja
terjadi seorang
seorang dokter
promovendus fisika
ditanya promotor tentang keadaan mentalnya, dengan
yang peneliti ingin meneliti kemampuan profesional spontan menjawab sedang
berada dalam kondisi prima siap diuji. Tanpa terasa keringat bercucuran dari
seluruhteman
tubuhnya sejawatnya.
dan disertasi punDokter tersebut
basah kuyup bingungyang
karena tangannya dalam
gemetar
penuhmenentukan alatmemang
keringat. Agak sulit ukur danuntukbertanya
mengukur pada seniornya.
aspek psikologis, karena
kejujuran respondenpun sangat penting.
Dokter senior itu mengusulkan dua perangkat
Suatu tes/istrumen dikatakan valid apabila tes/instrumen tersebut cermat
instrumen
dan akurat dengan
dalam mengukur aspekindikator yangKatakan
yang akan diukur. berbeda seperti
saja seorang dokter
yang tampak
peneliti ingin meneliti kemampuan profesional
dalam tabel 1 dan 2 di bawah ini: teman sejawatnya. Dokter
tersebut bingung dalam menentukan alat ukur dan bertanya pada seniornya.
Dokter1. seniorInstrumen
itu mengusulkanpertama:
dua perangkat instrumen dengan indikator yang
berbeda seperti tampak dalam tabel 1 dan 2 di bawah ini:
1. Instrumen pertama:
TABEL 10
KISI-KISI ANGKET
KEMAMPUAN PROFESI DOKTER

No. Responden
Pilihan 1 2 3 4 5
Indikator
Jabatan Konsulen � �
Residen �
Dokter Baru 71 � �
Ya � �
Praktek sore
Tidak � � �
Sering � � � �
Seminar
Jarang �

TABEL 11
KISI-KISI ANGKET
122 KEMAMPUAN PROFESI DOKTER II
No. Responden
Pilihan 1 2 3 4 5
Indikator
Tidak � � �
Sering � � � �
Seminar
Jarang �
Evaluasi Pembelajaran

TABEL 11
KISI-KISI ANGKET
KEMAMPUAN PROFESI DOKTER II
No. Responden
Pilihan 1 2 3 4 5
Indikator
Selalu tepat �
Diagnose medis Sering tepat � � �
Sering meleset �
Selalu tepat �
Tindakan medis Sering tepat � � �
Sering meleset �
Banyak � � � �
Jumlah pasien Sedang
Sedikit �

Dari dua angket di atas, yang kedua lebih tepat karena untuk mengukur
dokterDari
profesi dua
bukan dariangket di atas,
kegiatannya sebagiyang kedua
seminaris atau lebih tepat
tiap hari praktek
sore dan berpangkat konsulen. Kompetensi profesi dokter lebih jelas jika dilihat
karena untuk mengukur profesi dokter bukan dari
dari kemampuannya mendiagnose, memberikan tindakan medis dan makin
kegiatannya
banyak sebagi
pasien yang minta tolongseminaris
menandakan ataupasien tiap hari praktek
yang datang merasa puas
dengan tindakan penyembuhan yang dilakukan
sore dan berpangkat konsulen. Kompetensi profesi dokter tersebut sehingga
memberitahu orang lain untuk berobat pada dokter tersebut. Maka alat ukur
dokter
dengan lebih indikator
menggunakan jelas jika
dalamdilihat
kisi-kisidari
keduakemampuannya
lebih tepat dan cermat
mendiagnose,
sebagai memberikan
alat ukur yang dimaksud peneliti. tindakan medis dan
Secara umum pengujian validitas dapat dilihat pada bagan di
makin
bawah ini.
banyak pasien yang minta tolong menandakan
pasien yang datang merasa puas dengan tindakan
penyembuhan yang dilakukan VALIDITAS
dokter ISItersebut
sehingga memberitahu72 orang lain untuk berobat
pada dokter tersebut. Maka alat ukur dengan
menggunakan indikator dalam kisi-kisi kedua lebih
tepat dan cermat sebagai alat ukur yang dimaksud
peneliti.
Secara umum pengujian validitas dapat dilihat
pada bagan di bawah ini.

123
dengan tindakan penyembuhan yang dilakukan dokter tersebut sehingga
memberitahu orang lain untuk berobat pada dokter tersebut. Maka alat ukur
dengan menggunakan indikator dalam kisi-kisi kedua lebih tepat dan cermat
sebagai alat ukur yang dimaksud peneliti.
Evaluasi Pembelajaran
Secara umum pengujian validitas dapat dilihat pada bagan di
bawah ini.

VALIDITAS ISI
(CONTENT VALIDITY)
72

PENGUASAAN MATERI

GBHN – KISI-KISI

ANALISIS LOGIKA

MEWAKILI BUTIR o PROPORSIONAL

VALIDITAS
VALIDITAS KONSTRUK
(CONSTRUCT VALIDITY)
KETEPATAN ALAT UKUR

SESUAI DENGAN KONSEPTUAL


TUJUAN, PENGAMBILAN
KEPUTUSAN

- INDIKATOR DARI KONSTRUK


- HOMOGEN, KONSISTEN, KONVERGEN
MIS : TES MASUK - LENGKAP o UTUH

VALIDITAS EMPIRIS

VALIDITAS INTERNAL VALIDITAS EKSTERNAL


(INTERNAL VALIDITY) (EXTERNAL VALIDITY)

VALIDITAS KONKUREN VALIDITAS PREDIKTIF


(CONCURRENT VALIDITY) (PREDICTIVE VALIDITY)

Gambar 1. Jenis-jenis Validitas Instrumen


CONTOH :
124 73
Evaluasi Pembelajaran

Gambar 1. Jenis-jenis Validitas Instrumen


CONTOH :
Cara menghitung validitas kuesioner dengan 19 item
2
Caradalam uji coba
menghitung validitasdengan 14 responden.
kuesioner dengan 19 item dalam uji coba dengan 14
2
responden.
Item Max Tot
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Subyek X Y

A 4 4 2 1 0 1 1 4 3 3 4 2 0 1 1 1 4 1 2 39 20 59
B 4 3 3 1 2 4 1 4 2 3 3 4 1 0 0 0 4 1 3 39 20 59
C 3 3 2 4 2 4 0 0 3 2 2 4 4 1 1 0 3 0 4 21 20 41
D 4 4 4 4 4 3 0 0 3 4 4 2 2 4 4 3 2 1 4 16 40 56
E 2 4 2 3 3 4 4 4 4 4 4 4 2 4 3 4 2 0 4 17 44 57
F 4 4 4 4 4 4 3 4 4 3 4 4 3 4 4 4 2 2 3 16 52 68
G 3 3 3 3 3 4 2 3 4 3 3 4 2 3 2 3 3 4 3 42 16 58
H 1 1 2 2 2 1 4 3 3 3 2 3 4 3 4 1 0 4 3 30 16 46
I 4 4 0 4 4 0 4 3 4 2 2 4 4 4 3 2 4 4 4 12 48 60
J 0 0 1 4 0 3 4 0 1 0 0 2 2 0 0 3 4 0 2 14 12 26
K 4 1 4 0 3 4 4 1 4 3 2 0 2 2 2 4 4 2 0 18 28 46
L 4 2 3 4 3 3 4 3 2 0 4 3 0 2 3 3 3 4 1 30 20 50
M 3 3 3 4 4 4 2 2 2 4 4 4 4 4 4 0 4 4 4 15 48 63
N 0 4 0 2 1 2 1 3 0 4 0 0 1 4 4 4 2 2 2 16 20 36

Rumus yang digunakan

N6 XY – (6X) (6Y)
rXY =
{N6X² - (6X)²} {N6Y² - (6Y)²}

14 x 22.347 – (408 x 725)


rXY =
(14 x 14.324 – 408²) (14 x 39.289 – 725²)

312.858 – 295.800
=
(200.536 – 166.464) (550.046 – 525.625)

16.736 16.736
= =
34.072 x 24.421 832.072.321

16.736
=
28.845,66

rXY = 0,580
Selanjutnya tabel harga kritik dari r Product Moment pada derajat kepercayaan
95% atau alpha D = 0,05 dengan (N-1) = 14-1 = 13, yang ternyata menunjukkan
0,553. Dengan demikian berarti 0,580 > 0,553 (signifikan).

2
Hadari
2
Nawawi,
Hadari Nawawi, dkk.,dkk., Instrumen
Instrumen Penelitian
Penelitian Bidang Bidang Sosial
Sosial (Yogyakarta: (Yogyakarta:
Gajah Mada Gajah
University Press, 1992),
h. 185-187
Mada University Press, 1992), h. 185-187
74
125
Evaluasi Pembelajaran

2. Reliabilitas
Reliabilitas tes menunjuk pada sejauh mana
suatu alat pengukur secara ajeg, secara handal
mengukur apa yang diukurnya. Menurut Good
reliabilitas tes atau keterandalan tes merupakan salah
satu syarat dari perangkat tes yang benar.3
Tes-tes yang baik bagaimanapun juga, harus
memiliki reliabilitas tinggi didapat dari soal-soal yang
dibuat dengan baik. Faktor-faktor lain yang dapat
mempengaruhi reliabilitas, menurut (Kebisyzn &
Barich, (1984); Mehrens & Lehmann, (1978) meliputi:
1) Waktu tes
Semua hal berjalan seimbang, tes yang lebih
lama biasanya lebih reliabel dibandingkan
tes yang singkat, karena mencakup sampel
yang lebih luas dari pengetahuan atau
kemampuan objektif yang telah diajarkan.
2) Heterogenitas dan grup siswa reliabilitas
cenderung lebih tinggi bila sekor mempunyai
range yang besar, karena kesalahan
pengukuran kecil pada perbandingan
terhadap perbedaan range dan “true
scores”.
3) Kesulitan soal
Reliabilitas menjadi tinggi bila soal-soal pada
umumnya berada pada tingkat kesulitan
sedang karena hal ini menyebabkan sekor
tersebar pada range yang lebih besar,
dengan perbandingan sekor yang akan
3
Thomas L. Good & Jere E. Brophy., op. cit., h. 689.

126
Evaluasi Pembelajaran

didapat bila soal-soal terlalu mudah atau


terlalu sukar.
4) Objektivitas penilaian
Reliabilitas dari suatu tes yang dapat dinilai
secara objektif cenderung lebih tinggi,
karena penilaian subjektif, dan penampilan
ekuivalen dari siswa dapat dinilai berbeda.
Seperangkat tes dikatakan baik dan benar jika
memiliki derajat keterandalan yang tinggi artinya
tes tersebut akan memberikan hasil yang sama jika
diberikan pada subjek sama dengan kondisi sama
tetapi hal itu hanya bisa dilakukan terhadap hal-
hal yang tidak mungkin berubah. Misalnya untuk
mengukur panjang pensil 2B yang belum diserut
warna biru merek Pilot dipakai alat ukur meteran.
Kapanpun dan di manapun meteran itu digunakan
untuk mengukur pensil merek yang sama dan belum
diserut tetap akan memperlihatkan hasil yang sama.
Seperti disebut di atas menurut Good (1990:689)
ada faktor-faktor lain yang mempengaruhi reliabilitas
seperti: waktu tes, heterogenitas, kesulitan soal
dan objektivitas penilaian. Hal tersebut bisa terjadi
bila objek yang akan diukur berupa aspek-aspek
psikologis. Untuk mengukur perhatian orang
tua, kenakalan remaja, kemarahan, kesabaran,
kecermatan, kepribadian dan aspek psikologi lain
banyak sekali faktor-faktor yang mempengaruhi. Hal
ini antara lain disebabkan karena perilaku dari objek
yang bersangkutan selalu mengalami perubahan.
Untuk mengukur kreativitas misalnya hari ini diukur
siswa A termasuk dalam siswa yang sangat kreatif
karena dia sedang dalam kondisi prima. Keesokan
127
Evaluasi Pembelajaran

harinya diukur dengan alat yang sama bisa saja siswa


A termasuk ke dalam siswa apatis, bahkan menjawab
pertanyaan guru pun dia sangat enggan. Hal ini bisa
disebabkan oleh kondisi yang menimpa siswa A pada
malam hari sebelum tes yang kedua dilaksanakan.
Contoh yang lebih jelas misalnya untuk
mengukur ½ kg kopi digunakan timbangan sebagai
alat ukur. Bila kopi yang sama dua hari kemudian diukur
dengan timbangan yang sama dan beratnya masih
tetap ½ kg maka timbangan tersebut merupakan alat
ukur yang reliabel. Namun, tidak demikian halnya
dengan timbangan lain untuk menimbang bayi,
yang digunakan pada hari pertama terhadap lima
orang bayi. Berat badan bayi A, B, C, D dan E masing-
masing 6,2 kg, 5,7 kg, 8,5 kg 9 kg dan 4,1 kg. Pada
hari kedua, kelima bayi tadi ditimbang kembali dan
ternyata berbeda beratnya, kecuali satu orang bayi.
Perbedaan pun beragam, ada yang naik 3 ons, turun
2 ons dan lain sebagainya meskipun bayi E tetap 4,1
kg. Interpretasinya bukan berarti timbangannya
sebagai alat ukur tidak reliabel, tetapi subjek yang
diukurnya yang tidak dapat memberikan kepastian.
Kemungkinan diantara bayi-bayi itu ada yang belum
makan atau sebaliknya baru saja makan dan banyak
minum susu sehingga menyebabkan perbedaan
antara 2-3 ons naik atau turun.
Selanjutnya jika suatu instrumen diuji berulang-
ulang tetap menunjukkan hasil yang sama, berarti
instrumen tersebut reliabel. Artinya memiliki keajegan,
stabil, konsisten. Hasil yang sama dari tes tidak berarti
nilai yang sama pada setiap tes. Hasil tes pertama
dengan hasil tes berikutnya dikorelasikan dan didapat
hasil korelasi yang signifikan. Cara lain dapat dibuat
128
Evaluasi Pembelajaran

dua perangkat tes yang paralel kemudian dua-duanya


diuji dan dikorelasikan. Tes tersebut dapat dikatakan
ajeg atau konsisten jika keduanya menunjukkan hasil
korelasi positif dan signifikan.
Berbeda dengan validitas, reliabilitas hanya bisa
dihitung dengan statistik. Kemudian instrumen/tes
yang memiliki validitas tinggi belum tentu mempunyai
reliabilitas tinggi. Hubungan keduanya bebas satu
sama lain, berdiri sendiri-sendiri.
3. Ragam Pengujian Validitas
a. Isi
Validitas isi digunakan untuk mengukur
sejauh mana tes mencerminkan apa yang akan
diukur dari kemampuan siswa sehubungan dengan
tujuan pembelajaran yang ingin dicapai. Validitas isi
mengukur lebih pada ranah kognitif siswa seperti
yang tercantum dalam kurikulum. Penilaiannya harus
dicocokkan dengan Tujuan Instruksional Khusus (TIK).
Karena itu isi tes hendaknya sesuai dengan pokok-
pokok bahasan yang diberikan kepada siswa. Cara
penilaian validitas isi dapat dilakukan oleh beberapa
judges kalau bisa 3 atau 5 orang, usahakan jangan
meminta judges dalam jumlah genap agar tidak sulit
menarik kesimpulan jika ada dua pendapat yang
berlainan bisa ada penengah.
Tim penilai dimaksud terdiri dari para pakar di
bidangnya. Untuk kepentingan tes mata pelajaran
di SLTP dan di SMU, dapat diminta bantuan 3 atau 5
orang teman sejawat untuk bersama-sama meneliti
kesesuaian tes dengan TIK. Beri kesempatan kepada
penilai agar memberikan penilaian sejujur-jujurnya. Jika

129
Evaluasi Pembelajaran

validitas isi ini digunakan untuk instrumen penelitian,


para pakar penilai dapat diambil dari berbagai
komponen, misalnya dari guru, dosen pembimbing
dan pakar bidang studi. Baik guru sebagai pembuat tes
maupun mahasiswa yang membuat instrumen harus
jujur jika tes atau instrumennya tidak valid, sebab
validitas isi suatu tes dikatakan sahih kalau isinya
sesuai dengan substansi yang dikehendaki TIK. Butir-
butir yang ada dalam tes merupakan perpanjangan
tangan dari TIK yang ditentukan sebelumnya.
Validitas isi tidak bisa diukur dengan angka, karena
hasil penilaiannya berupa penyesuaian substansi tes
dengan TIK yang diambil dari kurikulum. Isi tes harus
mencerminkan substansi yang terkandung di dalam
TIK, karena itu pada waktu menyusun tes harus selalu
mengacu pada “Blue Print” yang dibuat sesuai dengan
TIK. Misalnya dalam TIK pada pertemuan pertama
perkuliahan metode penelitian disebutkan bahwa
setelah mengikuti perkuliahan ini mahasiswa dapat:
1) menjelaskan hakikat penelitian ilmiah minimal 80%
benar, 2) membedakan ciri penelitian kualitatif dan
kuantitatif minimal 80% benar. Maka butir-butir tes
harus mencerminkan tentang kedua hal tersebut di
atas, agar mahasiswa memiliki kemampuan kedua
hal tersebut di atas. Dengan demikian tes tersebut
harus dapat mengukur pokok bahasan yang dibahas
pada setiap pertemuan dengan benar.
Menurut Gronlund seperti ditulis Sirait
(1985:231) dapat dibuat dengan :
1) Mengidentifikasi topik setiap pokok
bahasan dan hasil tingkah laku yang akan
diukur sesuai dengan yang tercantum dalam

130
Evaluasi Pembelajaran

kompetensi dasar.
2) Membuat tabel spesifikasi yang memperinci
dengan cermat contoh butir pertanyaan
yang akan digunakan dalam perangkat tes
3) Membuat butir-butir tes yang sangat
mendekati tabel spesifikasi dimaksud.4
Dengan melakukan ketiga prosedur di atas
diharapkan dapat menjamin kesahihan isi tes.
Pembuat tes harus menghindari butir tes yang “lari”
dari spesifikasi tes yang telah dibuat sebagai acuan.
Lebih penting lagi tabel spesifikasi harus dibuat
berdasarkan Blue Print yang disusun mengacu pada
kompetensi dasar.
b. Konstruksi
Masih tetap mengacu pada kompetensi dasar
tetapi berbeda dengan validitas isi yang mengukur
tes dari substansi soal, validitas konstruksi menitik
beratkan pada tes yang setiap butirnya membangun
setiap aspek berpikir yang disebutkan dalam
kompetensi dasar. Validitas ini biasanya dipakai
untuk mengukur kesahihan aspek psikologis seperti
minat, bakat, kelelahan, intelegensia dan lain-lain.
Dengan demikian validitas konstruksi ini tidak berarti
membangun phisik seperti jembatan, rumah dan
lain sebagainya, tetapi bangun pengertian di sini
artinya sejauh mana tes dapat diartikan menurut
bangun pengertian itu. Jadi validitas konstruk
tidak membangun secara phisik kelihatan mata,

4
Donal Ary, LuChaser Lucy and Razavich, Introduction to Research in
Education terjemahan Arif Furhan, “Pengantar Penelitian dalam Pendidikan”,
(Surabaya: Usaha Nasional, 1982), hal. 77

131
Evaluasi Pembelajaran

tetapi bangun pengertian konsep. Misalnya dalam


kompetensi dasar tertulis: mahasiswa akan dapat
menjelaskan proses “evaluasi diri” minimal 80%
benar. Tes menyiratkan tentang bangun pengertian
evaluasi diri.
Selanjutnya untuk menguji validitas konstruksi
digunakan:
1) Pengujian validitas konvergen
2) Pengujian validitas diskriminan
3) Pengujian stabilitas dan keajegan.
Pelaksanaan uji validitas konvergen melalui uji
empirik, yaitu dengan cara mengkorelasikan sekor
total dengan sekor faktor, diasumsikan bahwa antara
sekor total dengan sekor faktor terdapat korelasi
yang signifikan.
Kemudian untuk pengujian validitas diskriminan
dengan cara mengkorlasikan tiap-tiap faktor, artinya
sekor faktor yang satu dikorelasikan dengan sekor
faktor yang lain, diasumsikan bahwa masing-masing
faktor tidak berkorelasi secara signifikan. Ini berarti
bahwa tiap faktor secara khusus mengukur aspek
tertentu.
Sedangkan pengujian stabilitas dan keajegan
melalui cara tes ulang dan pengujian konsistensi
dengan uji belah dua. Untuk stabilitasnya dapat
dilakukan dengan cara membandingkan hasil tes
antar kelompok.5
Mengenai validitas konstruk atau validitas
5
M. Chabib Thoha, Teknik Evaluasi Pendidikan (Jakarta: Rajawali Pres, 1990),
h. 111.

132
Evaluasi Pembelajaran

bangun pengertian Ary mencontohkan ketika Dall


mulai membuat skala kematangan sosial Vineland
yang merumuskan bangun pengertian kematangan
sosial sebagai suatu gabungan unsur yang saling
berkaitan meliputi: menolong diri sendiri, kesibukan,
komunikasi dan hubungan sosial. Unsur-unsur
tersebut merupakan aspek dari bangun pengertian
itu yang harus dimasukkan dalam tes tentang
kematangan sosial.6
Validitas bangun pengertian merupakan
perpaduan antara pendekatan logis dan empiris.
Misalnya jika seorang peneliti ingin mengukur aspek
“kelelahan” siswa melalui tes, maka komponen yang
diukur tidak hanya kelelahan siswa secara phisik,
perlu juga dimasukkan komponen kelelahan psikis.
Namun demikian, jika peneliti hanya mau mengukur
komponen phisik saja, maka tes harus benar-benar
dibuat khusus untuk mengukur kelelahan phisik
siswa. Melalui tes yang diberikan, peneliti menguji
validitas bangun pengertian kelelahan yang butir-
butir tesnya tetap mengacu pada “blue print” yang
diturunkan dari kompetensi dasar.
Dengan demikian butir-butir tes untuk
mengukur komponen-komponen tentang kelelahan
tersebut merupakan pendekatan logis dari validitas
bangun pengertian.
c. Empiris
Pendekatan empiris dari validitas bangun
pengertian (Ary, 289-290) meliputi: 1) Secara internal
6
Donald Ary, dkk, Introduction to Research in Education, terjemahan Arief
Furchan, Pengantar Penelitian dalam Pendidikan (Surabaya: Usaha Nasional,
1982), h. 289.

133
Evaluasi Pembelajaran

hubungan di dalam tes itu hendaknya seperti yang


diramalkan oleh bangun pengertian tersebut, 2)
secara eksternal hubungan antara sekor tes dengan
pengamatan lain dari kematangan sosial seperti
kesibukan, menolong diri sendiri, daya penggerak,
komunikasi dan lain-lain, hendaknya selalu konsisten
dengan bangun pengertian dimaksud. Untuk
mengukur validitas empiris biasanya makan waktu
lama karena pengamatan dilakukan terhadap
individu-individu. Sekor tingkah laku yang dicapai tiap
individu diteliti dengan cermat kecocokannya dengan
bangun pengertian dalam tes yang divalidasi. Dengan
demikian tingkah laku individu yang mengerjakan tes
merupakan pengujian secara empiris, itu sebabnya
disebut demikian.7
d. Kriteria
Sesuai dengan namanya, jika seperangkat tes
divalidasi dengan menggunakan validasi ini maka
kesahihan tes tersebut tinggi jika hasil validasinya
memiliki kesesuaian dengan kriteria tertentu yang
digunakan untuk pengujian validitas tes tersebut.
Kriteria dapat bersifat internal dan eksternal. Dengan
kriteria internal dimaksudkan bahwa yang menjadi
permasalahan validitas butir suatu instrumen dilihat
dari instrumen secara keseluruhan sebagai satu
kesatuan. Artinya seperangkat tes instrumen yang
terdiri dari beberapa butir itu menjadi kriteria dalam
memvalidasi setiap butir. Dengan demikian hasil ukur
setiap butir yang ada dalam instrumen dikorelasikan
dengan hasil ukur instrumen secara keseluruhan.
Setiap butir dianggap valid kalau sekor butir koefisien
7
Loc. Cit.

134
Sesuai dengan namanya, jika seperangkat tes divalidasi dengan
menggunakan validasi ini maka kesahihan tes tersebut tinggi jika
hasil validasinya memiliki kesesuaian dengan kriteria tertentu yang digunakan
untuk pengujian validitas tes tersebut. Kriteria dapat bersifat internal dan
eksternal. Dengan kriteria internal dimaksudkan bahwa yang menjadi
Evaluasi Pembelajaran
permasalahan validitas butir suatu instrumen dilihat dari instrumen secara
korelasinya dengan
keseluruhan sebagai secara total
satu kesatuan. Artinyainstrumen
seperangkat tessecara
instrumen yang
terdiri dari
positif danbeberapa butir itu menjadi kriteria dalam memvalidasi setiap butir.
signifikan.
Dengan demikian hasil ukur setiap butir yang ada dalam instrumen
dikorelasikan
Untukdengan
menghitung
hasil ukurkoefisien korelasi
instrumen secara tersebutSetiap butir
keseluruhan.
dianggap valid kalau sekor butir koefisien korelasinya dengan secara total
digunakan rumus statistik yang sesuai dengan jenis
instrumen secara positif dan signifikan.
sekor Untuk
butir instrumen
menghitungyang bersangkutan.
koefisien korelasi tersebut digunakan
rumus statistik yang sesuai dengan jenis sekor butir instrumen yang
bersangkutan.
Jika sekor butir kontinum maka digunakan
rumusJika r Product Moment
sekor butir kontinumseperti di bawahrumus
maka digunakan ini : r Product Moment
seperti di bawah ini :
N (6XY) – (6X) (6Y)
r =
{N (6X²) – (6X)²} {N (6Y²) – (6Y)²

Keterangan :
Keterangan :
r = rKoefisien
= Koefisien korelasi
korelasi sekor
sekor butir butirsekor
dengan dengan
total sekor
instrumen secara
keseluruhan
total instrumen secara keseluruhan
N = Jumlah data
X = N Sekor butir instrumen
= Jumlah data
Y = Sekor total instrumen
XJika
= sekor
Sekor butir dikotomi
butir yaitu 0,1 digunakan koefisien korelasi biserial
instrumen
(r bis) dengan rumus seperti di bawah ini :
Y = Sekor total instrumen
7
Loc. Cit.
Jika sekor butir dikotomi 79
yaitu 0,1 digunakan
koefisien korelasi biserial (r bis) dengan rumus seperti
di bawah ini :
Xi – Xt pi
r bis(i) =
St qi

Keterangan :
r bis (i) = koefisien korelasi biserial antara sekor butir soal nomor i dengan
sekor total
Xi = Rata-rata sekor total responden yang menjawab benar butir soal
nomor i.
Xt = Rata-rata sekor total semua responden
St = Standar deviasi sekor total semua responden
pi = Proporsi jawaban yang benar untuk butir soal nomor i
qi = Proporsi jawaban yang salah untuk butir soal nomor i
Nilai koefisien korelasi dari tiap-tiap butir tes baik yang sekornya
kontinum maupun dikonomi, biasa disebut r hitung (rh) dibandingkan dengan 135r
tabel (rt) jika rh > rt misalnya tentukan pada D = 0,05 maka koefisien korelasi
butir signifikan artinya butir tersebut dianggap valid seara empiris.8 Yang
dimaksud dengan sekor kontinum jika nilai sekor terdiri dari 1 s/d 5 atau 11,
Evaluasi Pembelajaran

Nilai koefisien korelasi dari tiap-tiap butir tes


baik yang sekornya kontinum maupun dikonomi,
biasa disebut r hitung (rh) dibandingkan dengan r
tabel (rt) jika rh > rt misalnya tentukan pada α = 0,05
maka koefisien korelasi butir signifikan artinya butir
tersebut dianggap valid seara empiris.8 Yang dimaksud
dengan sekor kontinum jika nilai sekor terdiri dari 1 s/d
5 atau 11, misalnya pada waktu mendapatkan sekor
dikembangkan instrumen dengan skala Likert (sekor
1-5) atau Thurstone (sekor 1-11) sehingga nilai yang
didapat akan heterogen. Sedangkan nilai dikotomi
misalnya hanya nol (0) dan satu (1). Misalnya untuk
tes nilainya 0 jika salah dan 1 jika benar.
Ringkasnya, Validitas internal dapat dilihat pada
gambar 2.

8
Djaali, dkk, Pengukuran dalam Bidang Pendidikan (Jakarta: PPS UNJ, 2000),
hh. 77-78.

136
Evaluasi Pembelajaran

VALIDITAS INTERNAL

INSTRUMEN SEBAGAI SUATU KESATUAN

SEKOR BUTIR DIKORELASIKAN DENGAN SEKOR TOTAL

DATA KONTINUM DATA DIKOTOMI

Rumus r Product Moment dari Pearson Rumus Korelasi r biserial

N (6XY) – (6X) (6Y) Xi – Xt pi


r = r bis(i) =
{N (6X²) – (6X)²} – {N(6Y²) – (6Y)²} st qi

Keterangan : Keterangan :
X = skor butir item r bis(i) = koefisien korelasi biserial antara
Y = skor total skor butir soal no. i dengan skor total
Xi = rata-rata skor total responden yang
menjawab benar butir soal no. i
Xt = rata-rata skor total semua responden
Kriteria : rh > rt (D = 0,05) o pi = proporsi jawaban yang benar untuk butir
soal nomor i
valid secara empiris qi = proporsi jawaban yang salah untuk butir
nomor i.

Gambar 2. Validitas Internal

Berbeda dengan validitas internal, validitas


81
eksternal diukur berdasarkan kriteria eksternal.
Artinya tes yang dikembangkan dikorelasikan dengan
sekor tes yang sudah baku atau yang dianggap
sudah baku. Misalnya untuk mengukur intelegensia

137
Evaluasi Pembelajaran

siswa TK, guru membuat tes dan diujikan pada


siswanya. Hasil pengujiannya dikorelasikan dengan
tes intelegensi bagi siswa usia TK yang sudah baku.
Selanjutnya hasil tes tersebut dikorelasikan dengan
kriteria rt pada α = 0,05. Jika hasilnya menunjukkan rh
> rt (α = 0,05) maka tes buatan guru dianggap valid.
Makin tinggi rh dibandingkan dengan rt makin tinggi
pula validitasnya, berarti validitas tes buatan guru
tersebut semakin baik.
Validitas eksternal terdiri dari dua jenis yaitu: 1)
validitas kongkuren (concurrent validity). 2) validitas
prediktif (predictive validity).
e. Kongkuren
Validitas kongkuren dilakukan jika yang
diperlukan untuk menguji validitas soal-soal UAN.
Soal yang direncanakan untuk UAN mata pelajaran
matematika diujicobakan terhadap sejumlah siswa
dan sekor hasil uji coba dikorelasikan dengan sekor
UAN yang telah lalu. Jika r¬h > rt maka soal UAN yang
dikembangkan dianggap valid memiliki concurrent
validity atau validitas setara, sekor tes saat ini setara
dengan sekor tes yang telah lalu dengan penampilan
sama.
f. Prediktif
Validitas prediktif dilakukan terhadap soal-
soal tes masuk, misalnya tes bagi calon mahasiswa
Akademi Perawat. Tes yang akan dikembangkan diuji-
cobakan dan sekor tes masuk dikorelasikan dengan
indeks prestasi nilai semester satu di Akademi
Perawat. Jadi indeks prestasi tersebut dijadikan
kriteria eksternal untuk mengukur tes masuk yang

138
Evaluasi Pembelajaran

akan memprediksi penampilan mahasiswa Akademi


Perawatan. Jika ternyata rh > rt, misalnya ditentukan
pada α = 0,05 maka tes tersebut dianggap valid.
Selain kedua validitas kriteria di atas Thoha
menyebut validitas kriteria yang lain yaitu: 3) validitas
pengukuran serentak.9 Validitas ini dilakukan terhadap
dua tes berbeda misalnya tes tulis dan tes lisan. Materi
yang diujikan sama, waktunya sama, dosennya sama,
mahasiswanya diasumsikan homogen. Jika setiap
sekor dari masing-masing soal dikorelasikan, yaitu
sekor tes tulis (X) dan sekor tes lisan (Y) dan hasil rh
> r pada α = 0,05 maka tes tersebut dianggap valid.
Validitas tes ini disebut validitas kriteria serentak
karena dilakukan serentak secara bersamaan, hanya
bentuk tesnya berbeda.
Adapun rumus yang digunakan untuk ketiga
validitas tersebut menggunakan rumus r Product
Moment seperti pada pengujian validitas internal.
Hasil korelasinya yaitu rh dibandingkan dengan rt
seperti biasa jika rt > rt maka tes ini valid pada taraf
kepercayaan 95% atau α = 0,05.
Selanjutnya menurut Nawawi10 rumus r Product
Moment yang dilanjutkan dengan Spearman Brown
kurang tepat digunakan untuk jumlah sampel kecil,
karena cenderung tidak mengikuti normalitas data
populasinya. Di bawah ini diberikan contoh rumus
lain yang dapat digunakan yaitu rumus korelasi tata
jenjang (rank order correlation) yang dipandang lebih
tepat.
9
M. Chabib Thoha, op. cit., h. 82
10
H. Hadari Nawawi, dkk, Instrumen Penelitian Bidang Sosial (Yogyakarta:
Gajah Mada University Press, 1992), h. 188

139
Selanjutnya menurut Nawawi 10 rumus r Product Moment yang
dilanjutkan dengan Spearman Brown kurang tepat digunakan untuk jumlah
sampel kecil, karena cenderung tidak mengikuti normalitas data populasinya. Di
bawah ini diberikan contoh rumus lain yang dapat digunakan yaitu rumus
Evaluasi Pembelajaran
korelasi tata jenjang (rank order correlation) yang dipandang lebih tepat.

TABEL 12
CONTOH RUMUS KORELASI TATA JENJANG
Ranking Ranking Diference
Subyek X Y D²
(X) (Y) (D)
1 20 59 6.0 10,5 -4,5 20,25
2 20 59 6,0 10,5 -4,5 20,25
3 20 41 6,0 3,0 3,0 9,00
4 40 56 10,0 7,0 3,0 9,00
5 44 57 11,0 8,0 3,0 9,00
6 52 68 14,0 14,0 0,0 0,00
7 16 58 2,5 9,0 -6,5 40,25
8 16 46 2,5 4,5 -2,5 4,00
9 48 60 12,5 12,0 0,5 0,25
10 12 26 1,0 1,0 0,0 0,00
11 28 46 9,0 4,5 4,5 20,25
12 20 50 6,0 6,0 0,0 0,00
13 48 63 12,5 13,0 -0,5 0,25
14 20 36 6,0 2,0 4,0 16,00
Jumlah 408 725 116,0 116,0 0,0 891,00

Rumus :

66D²
Uxy = 1 –
N (N² - 1)

Perhitungan:

6 x 148,5
Uxy =1 –
14 (14² - 1)

891
=1 –
10 14 (196 - 1)
H. Hadari Nawawi, dkk, Instrumen Penelitian Bidang Sosial (Yogyakarta: Gajah Mada University Press,
1992), h. 188
891
=1 – 83
14 x 195

891
=1 –
2.730

= 1 – 0,237

Uxy = 0,673

140Penyusunan tingkatan:
Salah satu hal yang dapat menimbulkan masalah khusus penilaian adalah
penyusunan tingkatan. Masalah terhadap subjek adalah mengindikasikan aturan
yang tepat dari elemen-elemen, dapat berupa kronologis atau logis. Urutan yang
benar dari lima elemen yang dilambangkan A, B, C, D, E mungkin adalah 5, 3,
Evaluasi Pembelajaran

Penyusunan tingkatan:
Salah satu hal yang dapat menimbulkan masalah
khusus penilaian adalah penyusunan tingkatan.
Masalah terhadap subjek adalah mengindikasikan
aturan yang tepat dari elemen-elemen, dapat berupa
kronologis atau logis. Urutan yang benar dari lima
elemen yang dilambangkan A, B, C, D, E mungkin
adalah 5, 3, 2, 1, 4. Masalah telah diasumsikan ke
suatu tes komersil sebagai lima item, dengan kunci
sekor untuk item pertama 5, kedua 3, berikutnya
2, berikutnya 1 dan terakhir 4. Pertimbangkan apa
yang terjadi pada siswa yang merespon 4. 2. 1. 5.
3. Dia tidak menjawab benar satupun. Tetapi dia
memiliki informasi yang lebih baik tentang susunan
dari sepuluh pasang elemen daripada siswa yang
menjawab 1, 3, 4, 5, 2 dan mendapat jawaban 1 poin
benar dan siswa yang mendapat 2 poin benar dengan
menjawab 1, 3, 2, 4, 5. Seseorang dapat secara siap
mencari contoh-contoh ketidaksamarataan.
Ringkasan validitas eksternal dapat dilihat pada
gambar 3.

141
Evaluasi Pembelajaran

VALIDITAS EKSTERNAL

- VALIDITAS EMPIRIS BERDASARKAN EKSTERNAL


- BESARAN SEBAGAI HASIL STATISTIKA

VALIDITAS PREDIKTIF VALIDITAS KONKUREN

TES MASUK o IPSMI SEKOR CALON SEKOR NILAI


SOAL UAN UAN

Gambar 3. Validitas Eksternal

Uraian tentangtentang
Uraian validitasvaliditas
ini akaniniditutup
akan dengan
ditutup faktor-faktor
dengan yang
mempengaruhi validitas :
faktor-faktor
1. Petunjuk yang
yang kurang mempengaruhi validitas :
terarah
Sebelum 1. siswa mengerjakan
Petunjuk yangtes, selalu terarah
kurang ada petunjuk cara mengerjakan tes
dengan singkat, tegas dan jelas. Artinya jangan ada petunjuk yang
meragukan bagi
Sebelum
siswa. siswa mengerjakan
Harus dicantumkan tes,
bobot selalu
soal berapaada
agar siswa
dapat memperioritaskan
petunjuk soal mana
cara yang dikerjakan tes
mengerjakan lebih dengan
dulu jika ada soal
yang dianggap sulit atau kendala lain. Di samping itu, dengan petunjuk yang
singkat, ketenangan
jelas akan memberikan tegas dan jelas.
kepada siswaArtinya
dan kepadajangan
pengawas yang
tidak digangguadaolehpetunjuk
pertanyaanyang meragukan
siswa tentang petunjukbagi siswa.
pengerjaan.
Harus dicantumkan bobot soal berapa
agar siswa dapat memperioritaskan soal
mana yang dikerjakan lebih dulu jika ada
soal yang dianggap
85 sulit atau kendala lain.
Di samping itu, dengan petunjuk yang jelas
142
Evaluasi Pembelajaran

akan memberikan ketenangan kepada siswa


dan kepada pengawas yang tidak diganggu
oleh pertanyaan siswa tentang petunjuk
pengerjaan.
2. Struktur kalimat yang terlalu berbelit-belit
Hal ini sangat penting, sebab kosa kata dan
struktur kalimat yang berbelit-belit akan
sangat menyulitkan siswa. bagaimana siswa
akan menjawab dengan baik jika maksud
pertanyaannya saja tidak dapat dimengerti
oleh siswa.
3. Tingkat kesulitan dan daya pembeda
Analisis butir soal perlu dilakukan untuk
mengetahui tingkat kesulitan dan daya
pembeda, agar substansi soal tetap terjaga
dan tujuan instruksional dapat dicapai. Soal
yang terlalu sulit atau terlalu mudah dengan
daya pembeda sangat rendah akan sia-sia.
Soal seperti itu tidak akan mencerminkan
perilaku siswa yang diharapkan akan
mengalami perubahan permanen. Setelah
selesai mengikuti proses pembelajaran.
4. Analisis butir pernyataan/pertanyaan yang
tidak jelas
Setiap butir pernyataan atau pertanyaan
harus disusun dengan baik dan benar.
Pernyataan dimulai dari yang paling mudah
sampai yang paling sulit. Demikian juga
disusun dari ranah kognitif C1, C2, C3, dan
seterusnya, kemudian baru berpindah pada
afektif dan seterusnya.

143
Evaluasi Pembelajaran

5. Butir-butir yang tidak mampu mengukur


tingkah laku
Hasil belajar siswa yang tinggi menunjukkan
tingkat penguasaan materi yang tinggi.
Namun kondisi tersebut belum berarti
proses pembelajaran sudah berhasil sebab
penguasaan siswa terhadap substansi materi
pelajaran yang diberikan tanpa perubahan
perilaku siswa belum sepenuhnya berhasil.
Oleh karena itu dalam butir-butir soal harus
tercermin pengukuran ranah afektif, di
samping pencapaian ranah kognitif. Dalam
mata pelajaran tertentu, seperti berbagai
keterampilan, bahkan perlu pengukuran
ranah psikomotor
6. Pernyataan/pertanyaan terlalu pendek
Butir soal, baik pertanyaan maupun
pernyataan hendaknya jangan terlalu
pendek sehingga butir tersebut kehilangan
maknanya. Usahakan panjang kalimat
setiap butir pertanyaan atau pernyataan
dapat menggambarkan apa yang akan
diukur, jangan terlalu panjang atau terlalu
pendek. Usahakan setiap kosa kata dalam
butir tes memiliki arti sendiri dan dapat
dipertanggung jawabkan dan tetap berada
pada prosedur yang seharusnya.
7. Pertanyaan terlalu mudah
Materi jawaban jangan terlalu jelas diarahkan
dalam pertanyaan. Meskipun siswa
diharapkan untuk menjawab pertanyaan

144
Evaluasi Pembelajaran

dengan benar, tidak berarti gambaran


jawaban sudah tersirat. Berikan kesempatan
kepada siswa untuk menggunakan logikanya,
jangan terlalu “memanjakan” siswa dengan
butir soal yang terlalu mudah sehingga
jawaban dapat ditebak.
8. Pelaksanaan proses pembelajaran
Proses pembelajaran yang terjadi tidak
sesuai dengan tujuan yang akan dicapai.
Misalnya materi yang diberikan tidak selesai
tepat waktu, penggunaan metode dan
media yang kurang tepat, sehingga siswa
tidak mampu menyerap materi. Ketika tes
yang dibuat berdasarkan TIK diberikan, siswa
tidak mengerti dan tidak dapat mengerjakan
soal dengan baik dan benar.
9. Prosedur pengukuran
Kesalahan yang terjadi pada waktu
pelaksanaan pengukuran akan sangat
berpengaruh terhadap validitas tes. Misalnya
salah mencatat, menjumlah, menghitung.
Belum lagi kekeliruan pada saat pemberian
sekor, tes pilihan ganda seharusnya diberi
sekor 1 dan tes esai 5, malah terbalik.
Kekeliruan pemberian sekor bisa terjadi
karena salah tulis, bisa juga karena guru
atau pembuat tes belum begitu mengerti.
Misalnya semua bentuk soal diberi sekor 1,
ini pasti akan mengacaukan validasi.
10. Reaksi siswa
Kondisi siswa sebagai responden uji coba

145
Evaluasi Pembelajaran

juga tak kalah penting. Respons siswa


akan bergantung pada kondisi dan situasi
yang sedang dialami, baik secara individu
maupun klasikal. Pada umumnya siswa
akan merespons dengan baik kalau tes yang
diberikan sesuai dengan pengetahuan yang
dimiliki dan disukai. Jika mata pelajaran PMP
menyangkut pokok bahasan reformasi, siswa
akan menyambut gembira. Tetapi ketika
mata pelajaran kimia dengan Redoksnya,
hati siswa pun mulai kecut dan ciut sehingga
responnya terhadap tes jadi negatif. Belum
lagi faktor internal dan eksternal dari siswa
yang dapat mempengaruhi validasi tes.
11. Karakteristik kelompok
Kelompok siswa sebagai satu group yang
merupakan kesatuan dan kriteria yang
dipakai sebagai acuan dalam penyusunan
tes pula diperhitungkan. Kelompok siswa
IPA mungkin lebih cocok diberi soal isian dan
tes jawaban singkat dengan menggunakan
kriteria sesuai selera siswa IPA. Kemudian
kelompok IPS barangkali lebih senang
dengan tes esai dan soal cerita. Menurut
kelompok ini mungkin jawaban hanya
dapat diekspresikan melalui klarifikasi yang
panjang lebar. Cara berpikir siswa IPA yang
logis analitis mungkin dianggap terlalu kaku
oleh siswa IPS. Perhitungan melalui rumus
yang mengasyikkan bagi siswa IPA, bisa
diangap “ribed” oleh siswa IPS. Demikianlah
berbagai faktor yang secara langsung atau
tidak langsung, dapat mempengaruhi
146
Evaluasi Pembelajaran

validitas tes.
4. Ragam Pengujian Reliabilitas Tes
a. Ulang
Reliabilitas ini melakukan pengujian terhadap
seperangkat tes sebanyak dua kali atau lebih secara
berturut-turut. Jarak tidak dapat dipastikan, namun
dapat disesuaikan dengan tujuan yang ingin dicapai.
Tujuannya untuk mengetahui koefisien stabilitas
tes. Dalam pelaksanaan pengukurannya dilakukan
terhadap objek yang sama dan hasil yang sama,
hanya waktunya yang berbeda. Jarak waktu tes
hendaknya ditentukan waktu yang tepat, artinya
kalau waktu antara tes pertama dengan tes kedua dan
tes berikutnya – kalau ada – terlalu dekat akibatnya
mungkin jawaban tes kedua hanya merupakan
pengulangan dari tes pertama, di samping itu resiko
tentang kompetensi tester telah berubah dapat
diperkecil. Sebaliknya jika jaraknya terlalu jauh,
dikhawatirkan kompetensi tester telah berubah,
baik pengetahuan dan wawasannya maupun cara
berpikirnya. Perubahan tersebut membawa resiko
tinggi karena tes yang pernah dikerjakannya beberapa
waktu lalu akan menjadi sangat mudah dikerjakan
akibatnya keterandalan tes menjadi rendah,
konsekuensi logisnya tes itu tidak dapat digunakan.
Karena itu jika jarak tes I, II dan III agak jauh, maka
harus dijaga agar homogenitas tester tetap sama.
Namun jika hasil pengukuran I, II dan III konsisten
maka hasil tersebut merupakan pencerminan dari
keadaan sebenarnya. Selanjutnya tes tersebut dapat
digunakan sebagai alat ukur untuk mengukur objek
yang akan diukur dan tes tersebut akan mampu
147
Evaluasi Pembelajaran

menjelaskan kondisi sebenarnya mengenai objek


yang ingin diukur. Misalnya untuk mengukur tes
motivasi berprestasi siswa SD digunakan tes yang
dibuat berdasarkan teori Heckhausen, bahwa
motivasi berprestasi ditandai dengan tes keunggulan
diri, tes keunggulan tugas dan standar keunggulan
orang lain. Setelah tes tersebut diujikan kepada tiga
kelompok tes dan hasilnya sama meskipun waktu
pemberian tes berbeda-beda, maka tes tersebut
mempunyai keterandalan tinggi dan dapat digunakan
untuk siswa lain dengan kondisi yang sama di mana
saja, karena tes tersebut dapat diandalkan.
b. Format sejajar
Reliabilitas yang akan dilakukan terhadap tes ini
lebih banyak menggunakan tenaga, waktu, pemikiran
dan kecermatan dibandingkan dengan reliabilitas
tes ulang. Pertama-tama dibuat dua perangkat tes
yang paralel, yang pertama tes yang akan diberikan
pada siswa dan tes yang kedua berfungsi sebagai
pengontrol. Keduanya harus sama dalam jumlah,
ranah yang akan diukur, tingkat kesulitan, dan
disusun dari soal-soal yang mudah kepada yang
sulit. Kedua soal tetap mengacu pada TIK dengan
pokok bahasan yang sama. Letak perbedaannya
pada pertanyaan atau pernyataan yang diajukan dan
waktu memberikan tes yang diusahakan tidak terlalu
lama jaraknya. Subjek tes tetap harus sama sebagai
gambaran kasar dapat dilihat pada tabel di bawah ini

148
diukur, tingkat kesulitan, dan disusun dari soal-soal yang mudah kepada yang
sulit. Kedua soal tetap mengacu pada TIK dengan pokok bahasan yang sama.
Letak perbedaannya pada pertanyaan atau pernyataan yang diajukan dan waktu
memberikan tes yang diusahakan tidak terlalu lama jaraknya. Subjek tes tetap
Evaluasi Pembelajaran
harus sama sebagai gambaran kasar dapat dilihat pada tabel di bawah ini
TABEL 13
KISI-KISI MATA PELAJARAN SEJARAH
KELAS II SLTP
Pokok Ranah Kognitif
No. Soal
Bahasan C1 C2 C3 C4 C5 C6

1 Proklamasi � 1A, 1B
kemerdekaan

� 2A, 2B

� 3A, 3B

Contoh soal: Contoh soal:


88 proklamasi kemerdekaan
1A. Perumusan teks
Indonesia berlangsung di tempat kediaman
….
a. Jendral Sutomo
b. Laksda Arsuko
c. Marsekal Naeda
d. Laksda Maeda
Kunci jawaban : d. Laksda Maeda
1B. Proklamasi kemerdekaan Indonesia
berlangsung di halaman rumah kediaman
….
a. Drs. Moh. Hatta
b. Ir. Soekarno
c. Mr. Moh. Yamin
d. Mr. Achmad Soebardjo
Kunci jawaban : b. Ir. Soekarno

149
Evaluasi Pembelajaran

2A. Mengapa bendera pusaka tidak dikibarkan


pada detik-detik proklamasi di istana
negara?
2B. Mengapa naskah proklamasi hanya ditanda
tangani oleh dua orang saja yaitu Soekarno
Hatta?
Rambu-rambu kunci jawaban :
2A. Bendera yang asli sudah sangat tua, kalau
terus dikibarkan setiap tahun, dikhawatirkan
akan makin cepat rusak.
2B. Soekarno Hatta pada saat itu sangat terkenal
sebagai duet pemimpin bangsa Indonesia
sehingga semuanya setuju Soekarno-Hatta
menandatangani naskah proklamasi.
Dari soal IA dan IB di atas jelas bahwa ranah
yang akan dicapai, pokok bahasan serta substansi
soal sama, tetapi pertanyaannya tidak boleh sama. No
1A s/d 50A misalnya adalah calon tes yang akan diuji
reliabilitasnya, sedangkan soal 1B s/d 50B calon tes
yang akan berfungsi sebagai tes pengontrol. Sekor
dari hasil pengukuran berupa distribusi nilai kedua
tes dikorelasikan dengan rumus r Product Moment.
Jika rh > rt pada taraf signifikansi 95% atau α = 0,05
maka tes tersebut dapat diandalkan.
c. Belah Dua (Split Half)
Teknik belah dua untuk reliabilitas tes ini dapat
dilakukan dengan berbagai cara dan menggunakan
beberapa rumus. Dalam melaksanakan teknik belah
dua ini yang pertama harus dilakukan adalah membagi
tes menjadi dua bagian. Pertama tes dibedakan
antara tes yang nomornya ganjil dan genap. Selain
150
1A s/d 50A misalnya adalah calon tes yang akan diuji reliabilitasnya, sedangk
soal 1B s/d 50B calon tes yang akan berfungsi sebagai tes pengontrol. Sekor da
hasil pengukuran berupa distribusi nilai kedua tes dikorelasikan dengan rumu
Product Moment. Jika rh > rt pada taraf signifikansi 95%
Evaluasi atau D = 0,05 maka t
Pembelajaran
tersebutitudapat
bisadiandalkan.
juga tes dibelah berdasarkan butir soal
positif dan negatif. Cara lain yang bisa dilakukan
c. Belah Dua (Split Half)
adalah
Teknikmembelah
belah dua dua nomor
untuk soal bagian
reliabilitas tes ini atas
dapat dan
dilakukan deng
bagian
berbagai bawah.
cara dan Reliabilitas
menggunakan dengan
beberapa caraDalam
rumus. belahmelaksanakan
dua tekn
ini pada prinsipnya membagi seperangkat tes dalam
belah dua ini yang pertama harus dilakukan adalah membagi tes menjadi d
bagian.dua bagian
Pertama tesyang setara.
dibedakan Kemudian
antara tes yangkedua
nomornyabelahanganjil dan gena
Selain itu
itu bisa juga tes dibelah
dikorelasikan denganberdasarkan
rumus rbutir soal positif
Product Moment dan negatif. Ca
lain yang bisa dilakukan adalah membelah
kemudian dilanjutkan dengan menggunakan rumus dua nomor soal bagian atas d
bagianSpearman
bawah. Reliabilitas dengan cara
Brown karena belah dua
reliabilitas ini pada
harus prinsipnya memba
dilakukan
seperangkat tes dalam dua bagian
terhadap tes secara keseluruhan. yang setara. Kemudian kedua belahan i
dikorelasikan dengan rumus r Product Moment kemudian dilanjutkan deng

menggunakan Misalnya untuk korelasi
rumus Spearman Brown diantara
karenabelahan ganjil
reliabilitas harus dilakuk
terhadap
dan tesgenap
secara keseluruhan.
r½ ½ = 0,60 (dihitung dengan rumus r
MisalnyaMoment)
Product untuk maka
korelasi
: diantara belahan ganjil dan gen
r½ ½ = 0,60 (dihitung dengan rumus r Product Moment) maka :
2 r½½ (2) (0,60) 1,20
rxx = = = = 0,75
1 + r ½½ 1 + 0,60 1,60
89
Cara penghitungan dari r Product Moment
yang dilanjutkan dengan rumus Spearman Brown ini
dilakukan dengan asumsi bahwa kedua tes paralel.
Jika tes tidak dilanjutkan maka korelasi belum secara
keseluruhan.
Reliabilitas tes belah dua sebaiknya
digunakan terhadap tes yang memiliki banyak
butir tes, seandainya hanya 20 butir tes, tidak perlu
menggunakan prosedur ini. Karena 20 butir tes
akan menjadi 10 butir-10 butir untuk setiap individu
berarti sekor individu pada bagian soal yang genap
dan ganjil hampir identik maka variansi kesalahan
setiap individu menjadi lebih kecil dan korelasinya
sempurna. Prosedur belah dua juga tidak cocok untuk
tes-tes yang waktunya dibatasi, karena biasanya

151
Evaluasi Pembelajaran

pembatasan waktu itu menampilkan tes-tes yang


tingkat kesulitannya rendah agar dijawab secepatnya
oleh tester. Akibatnya sekor tes tergantung kepada
kecepatan menjawab, dengan demikian sulit sekali
hasil pengukuran tesnya dipercaya. Untuk menjadi
Cara penghitungan
perhatian bagi para r Product Moment
daripengguna teknik yang belahdilanjutkan
dua dengan
rumus Spearman Brown ini dilakukan dengan asumsi bahwa kedua tes paralel.
adalah
Jika pada
tes tidaksaat sebelum
dilanjutkan melakukan
maka korelasi pembagian
belum secara keseluruhan.tes
menjadi dua bagian,
Reliabilitas tes tersebut
tes belah dua sebaiknya harus berjumlah
digunakan terhadap tes yang
memiliki banyak butir tes, seandainya hanya 20 butir tes, tidak perlu
genap agar dapat
menggunakan dibagi
prosedur dua. Selanjutnya
ini. Karena 20 butir tes akankesetaraan
menjadi 10 butir-10 butir
tes yang
untuk dibagi dua harus
setiap individu tetap
berarti sekor dijaga,
individu jangan
pada sampai
bagian soal yang genap dan
ganjil
terlupakan. hampir identik maka variansi kesalahan
Selain rumus Spearman Brown, rumus- setiap individu menjadi lebih
kecil dan korelasinya sempurna. Prosedur belah dua juga tidak cocok untuk tes-
rumus lainwaktunya
tes yang juga bisa digunakan
dibatasi, dalam
karena biasanya melaksanakan
pembatasan waktu itu menampilkan
tes-tes yang tingkat kesulitannya rendah 11 dijawab secepatnya oleh tester.
agar
reliabilitas tes, seperti di bawah ini.
Akibatnya sekor tes tergantung kepada kecepatan menjawab, dengan demikian
sulit
1) sekali
Rumus hasil Flanagan
pengukuran tesnya dipercaya. Untuk menjadi perhatian bagi
para pengguna teknik belah dua adalah pada saat sebelum melakukan pembagian
tes menjadi
Rumus dua bagian, tes tersebut
ini dapat harus berjumlah
digunakan genap yang
jika sekor agar dapat dibagi
dua. Selanjutnya kesetaraan tes yang dibagi dua harus tetap dijaga, jangan
sampaiterdiri dari
terlupakan. duarumus
Selain belah dan jumlah
Spearman sekor harus
Brown, rumus-rumus lain juga bisa
digunakangenap. Belahan reliabilitas
dalam melaksanakan pertama: sekordi bawah
tes, seperti belahanini. 11
1) Rumus Flanagan
ganjil dan belahan kedua sekor belahan
Rumus ini dapat digunakan jika sekor yang terdiri dari dua belah dan jumlah
genap
sekor atau
harus genap. sebaliknya
Belahan pertama: sekorsekor tersebut
belahan ganjil dan belahan kedua
sekor belahan genap atau sebaliknya
dimasukkan pada rumus di bawah ini. sekor tersebut dimasukkan pada rumus
di bawah ini.
V1 + V2
r11 = 2 1 –
Vt

r11 = reliabilitas instrumen


V1 = varians belahan pertama (varians sekor butir-butir ganjil)
V2 = varians belahan kedua (varians sekor butir-butir genap)
Vt = varians sekor total

Untuk rumus varians total :


(6X)²
6X² -
N
Vt =
N
11
Suharsimi Arikunto, Manajemen Penelitian, (Yogyakarta: PT. Rineka Cipta,
1990), hh. 227-229.

152 11
Suharsimi Arikunto, Manajemen Penelitian, (Yogyakarta: PT. Rineka Cipta, 1990), hh. 227-229.

90
Evaluasi Pembelajaran

2) Rumus Rulon
Sekor secara keseluruhan harus berjumlah
genap seperti pada rumus Flanagan.
Perbedaannya jika rumus Flanagan untuk
2) Rumus Rulon belahan ganjil-genap, maka rumus Rulon
Sekor secara keseluruhan harus berjumlah genap seperti pada rumus
untuk belahan
Flanagan. Perbedaannya awal-akhir,
jika rumus dengan
Flanagan untuk rumusnya
belahan ganjil-genap,
maka rumus sebagai berikut :
Rulon untuk belahan awal-akhir, dengan rumusnya sebagai
berikut :
Vd
r11 = 1 -
Vt

Keterangan :
r11 = reliabilitas instrumen
Vt = varians total atau varians sekor total
Vd = varians beda (variance difference)
d = sekor pada belahan awal dikurangi dengan sekor pada belahan akhir

3) Rumus KR20
3) Rumus KR20
Rumus ini dinamakan demikian sesuai dengan dua orang penemunya
Rumus
bernama Kuder ini dinamakan
dan Richadson. demikian
Sepasang ahli yang telahsesuai
banyakdengan
menemukan
rumus matematika. Berbeda dengan r Product
dua orang penemunya bernama Kuder dan Moment yang diikuti
Spearman Brown, Flanagan dan Rulon yang mengharuskan tes berjumlah
Richadson.
genap tidak demikian denganSepasang
KR20. Rumus ahli
ini yang telah banyak
bisa menghitung tes yang
menemukan rumus matematika. Berbeda
berjumlah ganjil. Rumus dimaksud adalah :
dengan
k
rS2 Product Moment yang diikuti
t - 6pq
r11 = Spearman Brown, Flanagan dan Rulon
yang S 2t
k – 1 mengharuskan tes berjumlah genap
Keterangan: tidak demikian dengan KR20. Rumus ini
bisainstrumen
r11 = reliabilitas menghitung tes yang berjumlah ganjil.
k = banyaknya Rumusbutir pertanyaan
dimaksud adalah :
2
S t = varians total
p = proporsi subjek yang menjawab butir dengan betul (proporsi subjek
yang mempunyai sekor 1)
q = proporsi subjek yang mendapat sekor 0 (q = 1-p)
Untuk tes yang berjumlah genap dapat digunakan rumus seperti contoh di
bawah ini:

k 2 pq
KR-20 = 1 -
k–1 s²t

40 2 x 9,7
= 153
39 75,91
rumus matematika. Berbeda dengan r Product Moment yang diikuti
Spearman Brown, Flanagan dan Rulon yang mengharuskan tes berjumlah
genap tidak demikian dengan KR20. Rumus ini bisa menghitung tes yang
berjumlah ganjil. Rumus dimaksud adalah :
Evaluasi Pembelajaran

k S2t - 6pq
r11 =
k–1 S 2t

Keterangan:
r11 = reliabilitas instrumen
k = banyaknya butir pertanyaan
S2t = varians total
p = proporsi subjek yang menjawab butir dengan betul (proporsi subjek
yang mempunyai sekor 1)
q = proporsi subjek yang mendapat sekor 0 (q = 1-p)
Untuk tes yang berjumlah genap dapat digunakan rumus seperti contoh di
bawah ini:

k 2 pq
KR-20 = 1 -
k–1 s²t

40 2 x 9,7
=
39 75,91
= 1,03 x 0,76
91
= 0,78

Dengan demikian tes di atas dapat diandalkan


Keterangan :
k = Jumlah butir soal
p = Proporsi jawaban yangb enar
q = Proporsi jawaban yang salah
s²r = Varians skor total semua responden

4) Rumus KR21 4) Rumus KR21


Bagi para pemakai rumus KR20, dapat lebih mudah lagi jika menggunakan
rumus KR21 karena
Bagitidak
paraperlupemakai rumus
lagi membuat tabel KR20, dapat
persiapan dan data
langsung dapat dimasukkan ke rumus.
lebih mudah lagi jika menggunakan rumus
KR21 karena tidak perlu lagi membuat
k M (k – M)
r11 = tabel persiapan
1 - dan data langsung dapat
k dimasukkan
–1 ke
k Srumus.
2
t

Keterangan:
r11154
= reliabilitas instrumen
k = banyaknya butir soal atau butir pertanyaan
M = rerata sekor seluruh butir (pertanyaan)
2
4) Rumus KR21
Bagi para pemakai rumus KR20, dapat lebih mudah lagi jika
= 1,03 x 0,76KR21 karena tidak perlu lagi membuat tabel persia
rumus
Evaluasi Pembelajaran
langsung dapat dimasukkan ke rumus.
= 0,78
k
Dengan demikian tes di atas dapat diandalkan
M (k – M)
Keterangan : r11 = 1 -
k = Jumlah butir soal k – 1 k S 2t
p = Proporsi jawaban yangb enar
q = Proporsi Keterangan:
jawaban yang salah
s²r = Varians skor
r11 =totalreliabilitas
semua responden
instrumen
k = banyaknya butir soal atau butir pertanyaan
4) Rumus KR21
M = rerata sekor seluruh butir (pertanyaan)
Bagi para pemakai 2rumus KR20, dapat lebih mudah lagi jika menggunakan
rumus KR21 karenaS t =tidak
varians
perlu total
lagi membuat tabel persiapan dan data
langsung dapat dimasukkan ke rumus.
5)5) Rumus
RumusAlphaAlpha Cronbach
Cronbach
Menurut
k Cronbach
M (k – M) rumus ini tepat digunakan untuk tes esei, n
r11 = Menurut
dan data yang
1 - Cronbach
diperoleh rumusskala
dengan ini sikap
tepat
seperti Likert,
Thurstone
k –digunakan
1 yang
untuksekornya berkisar : dari
k S t tes esei, non objektif tes
2
1-5; 4,1-11 dan lai
Tetapi
dan datadatayang
tes objektif
diperolehyangdengan
sifatnyaskala
dikotomi
sikaptidak cocok
Keterangan: ini. Berbeda dengan rumus lain yang dapat dihitung langsu
seperti Likert, Guttman dan Thurstone
r11 = reliabilitas yang
instrumen
didapat, rumus Alpha tidak demikian. Untuk menghit
yangsoal
k = banyaknyaseperangkat
butir sekornya
atautes,
butir berkisar
pertanyaan : dari 1-5; 4,1-11 dan
harus dihitung dulu varians pada tiap-tiap but
M = rerata sekor lain sebagainya.
seluruh Tetapi data tes objektif
butir (pertanyaan)
pada sekor total. Karena itu diperlukan kecermatan yang t
S2t = varians totalyang sifatnya dikotomi tidak cocok dengan
dimaksud adalah :
rumus ini. Berbeda dengan rumus lain yang
5) Rumus Alpha Cronbach
Menurut Cronbach dapat
rumus ini dihitung langsung
tepat kdigunakan dari
untuk SD 2 sekor yang
tes besei, non objektif tes
didapat,
dan data yang diperoleh rumus
dengan
r11 = skalaAlpha
sikap tidak demikian.
seperti
1 - Likert, Untukdan
Guttman
Thurstone yang sekornya berkisar : dari
menghitungk – reliabilits
1 1-5; 4,1-11
SDt dan
2
seperangkat lain sebagainya.
tes,
Tetapi data tes objektif yang sifatnya dikotomi tidak cocok dengan rumus
harus dihitung dulu varians pada tiap-tiap
ini. Berbeda dengan rumus lain yang dapat dihitung langsung dari sekor
Keterangan:
butir, dan varians pada sekor total. Karena
yang didapat, rumus 2Alpha tidak demikian. Untuk menghitung reliabilits
SD
seperangkat tes, harusb = jumlah
itu dihitung
diperlukan
duluvarians (standar
kecermatan
varians deviasi
pada tiap-tiap yang kuadrat
butir, butir)
tinggi.
dan varians
Sebagai
pada sekor total. Karena contoh dapat disajikan data baru sebagaimana
Rumusitu diperlukanadalah
dimaksud kecermatan
: yang tinggi. Rumus
dimaksud adalah : tabel 2.

k SDb2 92
r11 = 1 -
k–1 SDt2

Keterangan:
SDb2 = jumlah varians (standar deviasi kuadrat butir)
Sebagai contoh dapat disajikan data baru sebagaimana terlihat pada
tabel 2.
155
92
Evaluasi Pembelajaran

TABEL 14
TABEL ANALISIS UNTUK MENCARI
TABEL 14 RELIABILITAS TES
TABEL ANALISIS UNTUK MENCARI RELIABILITAS TES12BENTUK
BENTUK ESAI DENGAN RUMUS
ESAI DENGAN RUMUS ALPHAALPHA
12

Peserta Nomor Item Skor Kuadrat


Tes 1 2 3 4 5 Total s,t
A 5 7 3 5 7 27 729
B 8 8 6 8 9 39 1521
C 4 4 4 3 7 22 484
D 7 6 7 4 7 31 961
E 5 6 5 6 8 30 900
F 8 5 7 7 7 34 1156
G 6 5 6 7 7 31 961
H 4 3 5 4 5 21 441
I 8 7 7 8 7 37 1369
J 5 6 4 5 7 27 729
Jml.sk. 60 57 54 57 71 299 951
butir
Kuadrat 384 345 310 353 513
SDb 1,55 1,42 1,356 1,676 0,943
DFb2 2,4 2,01 1,84 2,81 0,89 9,95

Dari data tersebut dapat diketahui :


- k = 5 N = 10
- SDb2 = (varians butir) = 9,5
- SDt2 = (varians skor total) perlu dicari dengan rumus
(X)²
X² -
N
SDt2 =
N

(299)²
9251 -
10
=
10

89401
9251 -
10
=
10

12
310,9
Chabib Thoha, op. cit., h.=139 = 31,09
10 93

Setelah diketahui SDt² = 31,09 maka tinggal memasukkan ke dalam rumus


12
Alpha
Chabib : op. cit., h. 139
Thoha,
k SDb2
156 r11 = 1 -
k–1 SDt2

5 9,5
= 1 -
310,9
= = 31,09 Evaluasi Pembelajaran
10
Setelah diketahui SDt² = 31,09 maka tinggal
memasukkan ke dalam rumus Alpha :
Setelah diketahui SDt² = 31,09 maka tinggal memasukkan ke da
Alpha :
k SDb2
r11 = 1 -
k–1 SDt2

5 9,5
= 1 -
5–1 31,09

5
= (––– ) (1 - 030556
4

= 1,25 x 0,6944 = 0,868

Bila harga r11 Alpha ini dikorelasi dengan harga kritik


Bila harga
Moment, maka r11r11= Alpha ini dikorelasi
0,868 adalah lebih besardengan
pula dari 0,765 (99%
harga
= 10. kritik r Product Moment, maka r11 =
0,868 adalah lebih besar pula dari 0,765
13
5. Rumus-rumus untukNKasus
(99%) untuk = 10. Khusus Reliabilitas
a. Sekor Gabungan 13
5. Rumus-rumus Sekor untuk Kasus Khusus
gabungan adalah Reliabilitas
sekor total dari sekor-sekor
a. berdasarkan
Sekor Gabunganbobot tiap komponen. Reliabilitas sekor gabungan
fungsi dari reliabilitas, penyebaran sekor, interkorelasi dan bobot
komponen.
Sekor gabungan
Rumus untuk adalah sekor reliabilitas
menghitung total dari sebagai
sekor- berikut :
sekor komponen berdasarkan 6wj sj -bobot
2 2
6wj sjtiap
2 2
rj j' komponen.
Reliabilitasrsgsekor
= 1 gabungan
- merupakan fungsi dari
2 2
reliabilitas, penyebaran 6wsekor,
s
j j - 2 interkorelasi
6wj wk sj sk rjkdan bobot
relatif tiap komponen. Rumus untuk menghitung
Keterangan
reliabilitas :
sebagai berikut :
rsg = Koefisien reliabilitas skor gabungan
wj = Bobot relatif komponen j
wk = Bobot relatif komponen k
13
Saifuddin = Deviasi
sj Azwar, standardan
MA., Reliabilitas komponen j
Validitas, (Yogyakarta: Liberty, 1986),
hh. 39-41 sk = Deviasi standar komponen k
rjj' = Koefisien reliabilitas komponen masing-masing 157
rjk = Koefisien korelasi antara dua komponen yang berbeda

13
Saifuddin Azwar, MA., Reliabilitas dan Validitas, (Yogyakarta: Liberty, 1986), hh. 39-41
a. Sekor Gabungan
Sekor gabungan adalah sekor total dari sekor-sekor kompon
berdasarkan bobot tiap komponen. Reliabilitas sekor gabungan merupak
fungsi dari reliabilitas, penyebaran sekor, interkorelasi dan bobot relatif t
Evaluasi Pembelajaran
komponen. Rumus untuk menghitung reliabilitas sebagai berikut :
6wj2 sj2 - 6wj2 sj2 rj j'
rsg = 1 -
6wj2 sj2 - 2 6wj wk sj sk rjk

Keterangan :
rsg = Koefisien reliabilitas skor gabungan
wj = Bobot relatif komponen j
wk = Bobot relatif komponen k
sj = Deviasi standar komponen j
sk = Deviasi standar komponen k
rjj' = Koefisien reliabilitas komponen masing-masing
rjk = Koefisien korelasi antara dua komponen yang berbeda

13
Saifuddin Azwar, MA., Reliabilitas dan Validitas, (Yogyakarta: Liberty, 1986), hh. 39-41
Contoh :
TABEL 15 94
DISTRIBUSI SKOR KOMPONEN DAN SKOR GABUNGAN

Komponen test X
Subjek
I II III (I+2II+III)
A 6 2 3 13
B 8 4 6 22
C 10 6 8 30
D 10 5 7 27
E 9 4 7 24
F 5 2 3 12
G 7 3 4 17
H 6 2 4 14
I 9 6 7 28
J 9 5 8 27
N = 10 6Xj = 79 39 57 6X = 214
6J2 = 653 175 361 6X2 = 5000
wj = 1 2 1

Andaikata
reliabilitas
Andaikatamasing-masing komponen
reliabilitas telah dihitung,komponen
masing-masing yaitu :
r11’ = .81 r22’ = .79 dan r33’ = .86
Bobottelah
relatif dihitung,
komponen IIyaituadalah:2, karena itu skor pada komponen II dikalikan
2. Dengan teknik korelasi product moment, koefisien korelasi antar komponen
r11’ = .81
adalah: r22’ = .79 dan r33’ = .86
rI.II = .93 rI.III = .95 dan rII.III = .93
Bobot relatif komponen II adalah 2, karena itu
Deviasi standar masing-masing komponen dihitung dari data di atas adalah:
skor pada komponen
s1 = 1.7 s2 = 1.51 dan s3 = 1,9 II dikalikan 2. Dengan teknik
Sehingga diperoleh :
korelasi product moment, koefisien korelasi antar
6wj2 sj2 = (1)²(1.7)² + (2)² (1.51)² + (1)² (1.9)²
= 15.656
158
6wj2sj2rjj = (1)²(1.7)²(.81) + (2)²(1.51)²(1.51)²(.79)
+ (1)² (1.9)² (.86) = 12.679
6wjwksjskrjk = (1) (2) (1.7) (1.51) (.93) = 4.775
(1) (1) (1.7) (1.9) (.95) = 3.069
N = 10 6Xj = 79 39 57 6X = 214
6J2 = 653 175 361 6X2 = 5000
wj = 1 2 1
Evaluasi Pembelajaran
Andaikata reliabilitas
komponen adalah: masing-masing komponen telah dihitung, yaitu :
r11’ = .81 r22’ = .79 dan r33’ = .86
rI.II
Bobot= relatif
.93 komponen
rI.III = .95 dan 2,rII.III
II adalah karena= itu
.93skor pada komponen II
2. Dengan teknik korelasi product moment, koefisien korelasi antar k
Deviasi standar masing-masing komponen
adalah:
dihitungrdari= data
.93 di atas
r =adalah:
.95 dan r = .93
I.II I.III II.III
Deviasi
s1 = 1.7standar
s2 =masing-masing
1.51 dan s3 komponen
= 1,9 dihitung dari data di atas ada
s1 = 1.7 s2 = 1.51 dan s3 = 1,9
Sehingga diperoleh
Sehingga diperoleh : :
6wj2 sj2 = (1)²(1.7)² + (2)² (1.51)² + (1)² (1.9)²
= 15.656
6wj2sj2rjj = (1)²(1.7)²(.81) + (2)²(1.51)²(1.51)²(.79)
+ (1)² (1.9)² (.86) = 12.679
6wjwksjskrjk = (1) (2) (1.7) (1.51) (.93) = 4.775
(1) (1) (1.7) (1.9) (.95) = 3.069
(2) (1) (1.51) (1.9) (.93) = 5.336
+
13.170
15.656 – 12.679
rsg = 1 - = .93
15.656 + 2(13.179)
Inilah koefisien reliabilitas skor gabungan X
Inilah koefisien reliabilitas skor gabungan X yang terdiri dari tiga subtes
yang terdiri dari tiga subtes.
b. Ratings 95

Ratings adalah pemberian sekor terhadap


aspek tertentu baik dengan observasi langsung
maupun tidak langsung. Jika hanya seorang rater,
dapat dilakukan rater ulang seperti pada test retest
dan mengkorelasikannya dengan rumus rank order.
Ini membawa resiko penilaian yang berbeda jauh
dan membuat varians kesalahan yang disebabkan
oleh faktor ingatan rater. Penilaian yang subjektif
mengharuskan raters lebih dari satu dan jumlahnya
ganjil untuk penengah bila ada dua pendapat. Di

159
b. Ratings
Evaluasi Ratings adalah pemberian sekor terhadap aspek tertentu baik dengan
Pembelajaran
observasib.langsung
Ratings maupun tidak langsung. Jika hanya seorang rater, dapat
samping itu seperti
untukpada memperkecil
retest danvarians kesalahan
dilakukan rater ulang
Ratings adalah test
pemberian mengkorelasikannya
sekor terhadap aspek dengan
tertentu baik
rank order.
rumus dalam prosedurIni membawa
rating resiko penilaian
ulang, yaitu yangyang
rater berbeda
sama jauh dan
membuat observasi
varians objek langsung
kesalahan yang maupun
disebabkantidakolehlangsung. Jikarater.
faktor ingatan hanya seorang rate
Penilaian
dengan
dilakukan rater yang
ulang sama.
seperti pada test retest dan mengkorelasikannya
yang subjektif mengharuskan raters lebih dari satu dan jumlahnya ganjil untuk
penengah rumus
bila Di rank
ada duaorder.
bawah pendapat.Ini Dimembawa
ini rumus samping
Ebel yang resiko
itu untuk penilaian
dapat memperkecil
digunakan yang berbeda ja
varians
kesalahan membuat
untukdalam varians
prosedur rating
menghitung kesalahan yang
ulang, yaitu
estimasi disebabkan oleh
rater yangratings
reliabilitas sama denganfaktor
denganobjek yang rater. P
ingatan
sama. yang subjektif mengharuskan raters lebih dari satu dan jumlahnya ganj
kDiraters
bawah dan N subjek.
ini rumus Hasilnya
Ebelpendapat.
yang merupakan
dapatDidigunakan rata-
penengah bila ada dua samping untuk menghitung
itu untuk memperkecil
estimasirata interkorelasi
ratings ratings
dengan k antara
raters dan N semua
kesalahan dalam prosedur rating ulang, yaitu rater yangmerupakan
reliabilitas subjek. kombinasi
Hasilnya sama dengan obj
rata-ratapasangan
interkorelasiraters
sama. ratingsdan mean
antara semua reliabilitas raters dan mean
untuk seorang
kombinasi pasangan
reliabilitas untuk
rater. Rumusnya seorang rater.
14 Rumusnya sebagai
Di bawahsebagai ini rumusberikut:
Ebel yang dapat digunakan untuk men
berikut: 14
estimasi reliabilitas
ss² - sr² ratings dengan k raters dan N subjek. Hasilnya me
rata-rata
r11’ = interkorelasi ratings antara semua kombinasi pasangan raters da
reliabilitas 2
ss + (k-1) sr untuk
2 seorang rater. Rumusnya
berikut: 14
Keterangan : ss² - sr²
r11’ = koefisien
r reliabilitas
11’ = rating dari seorang rater
s22 = varians antar subjek, 2 Mk
ss + (k-1)
s sr2
sr2 = Varians residu, varians interaksi subjek(s) dan raters (t), yaitu Mkts
k = banyaknya raters
Keterangan :
c. Belahr11’
Tiga = koefisien reliabilitas rating dari seorang rater
c.
2
2Belah Tiga
sReliabilitas
= varians antar
ini untuk tes subjek, Mks butir tes ganjil sehingga tes
dengan jumlah
sr2 Reliabilitas
tidak bisa = Varians
dibelah residu,
duaini dan varians
harus interaksi subjek(s)
dibelahjumlah
untuk tes dengan tiga butir dan
tesraters
bagian. (t), yaitu
Setiap
k
bagian tidak
ganjil = banyaknya
perlu sama
sehingga
panjang ratersbisa dibelah dua dan harus
asal
tes tidak
diasumsikan memiliki isi homogen.
Formula yang dirumuskan Kristoff dengan melakukan estimasi
terhadapdibelah
c.varians tiga
sekor
Belah bagian.
murni
Tiga Setiap
sebagai bagian
berikut : tidak perlu sama
panjangs12asal s13 diasumsikan 13 smemiliki
s12 s23 ini suntuk
Reliabilitas isi homogen.
23 tes dengan jumlah butir tes ganjil sehin
2
s
tidak = bisa + dibelah + dua dan harus
Kristoffdibelah
dengantiga bagian.
T
Formula
s23 yang
s13 dirumuskan
s12
bagian tidak perlu sama panjang asal diasumsikan memiliki isi homog
melakukan estimasi terhadap varians sekor murni
Formula +yang
+ berikut
2 (s12 + s13 s23)
dirumuskan Kristoff dengan melakukan e
sebagai :
terhadap varians sekor murni sebagai berikut :
Keterangan :
sT2 = varians skor murni s12 s13 s12 s23 s13 s23
sT2 = Yj dan belahan
sjk = Kovarians belahan + Yk +
s23 reliabilits,
Kemudian sebagaimana rumusan s13 makas:12
rxx’ = sT2 / sX2
+ 2 (s12 + s13 + s23)
Keterangan :
2
Ibid., sh.T 44-47
Ibid., h.1444-47 = varians skor murni
14

sjk = Kovarians belahan96Yj dan belahan Yk


160 Kemudian sebagaimana rumusan reliabilits, maka :
rxx’ = sT2 / sX2
Evaluasi Pembelajaran

Keterangan :
sT2 = varians skor murni
sjk = Kovarians belahan Yj dan belahan Yk
Kemudian sebagaimana rumusan reliabilits, maka :
rxx’ = sT2 / sX2
Secara ringkas pengujian reliabilitas dapat
Secara dilihat
ringkaspada
pengujian
bagan direliabilitas
bawah ini.dapat dilihat pada bagan di
bawah ini.

BAGAN 4

RELIABILITAS

SEJAUH MANA HASIL PENGUKURAN DAPAT DIPERCAYA

RELIABILITAS KONSISTENSI RELIABILITAS KONSISTENSI


TANGGAPAN GABUNGAN ITEM

TEKNIK TES ULANG (A) RUMUS KUDER RICHARDSON


TEKNIK BELAH DUA (B) RUMUS ALPHA CHRONBACH
BENTUK EKIVALEN (C) RUMUS RELIABILITAS
HOYT o ANAVA

Uraian tentang reliabilitas ini akan ditutup dengan faktor-faktor yang


mempengaruhi pengukuran reliabilitas yaitu: 15

1. Panjang instrumen 161


Makin panjang instrumen, biasanya makin tinggi reliabilitasnya dan instrumen
yang panjang akan mampu mengukur lebih baik tingkah laku siswa dan
mengurangi resiko menebak.
Evaluasi Pembelajaran

Uraian tentang reliabilitas ini akan ditutup


dengan faktor-faktor yang mempengaruhi
15
pengukuran reliabilitas yaitu:
1. Panjang instrumen
Makin panjang instrumen, biasanya makin
tinggi reliabilitasnya dan instrumen yang
panjang akan mampu mengukur lebih baik
tingkah laku siswa dan mengurangi resiko
menebak.
2. Rentangan sekor
Makin besar variansi dan rentangan
sekor maka makin tinggi reliabilitas suatu
instrumen.
3. Tingkat kesulitan
Bagaimanapun soal yang terlalu sulit
atau terlalu mudah akan menyebabkan
penurunan reliabilitas tes.
4. Objektivitas
Objektivitas sangat penting di dalam
pengukuran reliabilitas
5. Cara yang digunakan
Berbagai cara yang dipergunakan seperti
metode uji ulang, bentuk ekuivalen, belah
dua dan KR ada hubungannya dengan besar
koefisien reliabilitas tes.

15
Toeti Soekamto, op. cit., hh. 23-27

162
Evaluasi Pembelajaran

BAB V
TARAF KESUKARAN, DAYA
PEMBEDA, DAN DAYA KECOH
(ANALISIS TES)

A. TUJUAN PEMBELAJARAN
Setelah mengikuti perkuliahan diharapkan mahasiswa
dapat:
1) Menghitung taraf sukar butir instrumen
2) Menghitung daya beda butir instrument
3) Menentukan daya kecoh opsi jawaban
B. MATERI POKOK
Untuk mencapai tujuan tersebut ditentukan materi
perkuliahan dengan sub-sub pokok bahasan sebagai
berikut:
1) Taraf sukar butir
2) Daya beda butir
3) Daya kecoh opsi jawaban
C. URAIAN MATERI
1. Pengantar
Salah satu kompetensi guru yang harus
dimiliki sebagai bukti keprofesionalannya adalah
163
Evaluasi Pembelajaran

kemampuan untuk melakukan penilaian dan


membuat alat penilaian. Pada umumnya guru sudah
mampu melakukan penilaian dengan baik, namun
pada umumnya guru belum terbiasa membuat alat
penilaian sendiri secara rutin. Sesungguhnya, guru
telah memiliki kemampuan membuat alat penilaian
namun karena tidak terbiasa membuat sendiri
sehingga keterampilan dan kemahiran membuat
tes atau alat penilaian lain menjadi berkurang atau
”keenakan” memnggunakan alat penilaian yang
sudah ada, baik dari buku atau alat penilaian yang
tersedia.
Oleh karena itu, seiring dengan perubahan
paradigma dan pola kinerja guru yang menuntut
profesionalitas sesuai perubahan paraturan
perundangan yang mengatur, maka guru harus
mulai dibiasakan membuat alat penilaian sendiri
yang digunakan dalam pembelajaran. Jika ini terjadi,
maka akan semakin meingkatkan kompetensi dan
profesionalitas guru. Untuk itu guru perlu memahami
beberapa hal. Selain prosedur, teknik dan cara
membuat instrumen sebagaimana telah dijelaskan
pada bagian terdahulu, guru juga harus menguasai
bagaimana cara mengetahui tes atau instrumen lain
yang berkualitas. Pada bagian 4 telah dipaparkan
bagaimana mengetahui validitas dan reliabilitas
sebuah instrumen dan pada bagian ini akan diketahui
bagaimana cara mengetahui kualitas instrumen,
khususnya kualitas sebuah tes.
Untuk mengetahui kualitas atau menilaian
sebuah tes ada beberapa cara yang dilakukan.
Suharsimi Arikunto (1993) menyatakan ada 4 cara
untuk menilai tes, yaitu:
164
Evaluasi Pembelajaran

a. Cara pertama meneliti secara jujur soal-soal


yang sudah disusun, kadang-kadang dapat
diperoleh jawaban tentang ketidakjelasan
perintah atau bahasa, taraf kesukaran dan
lain-lain keadaan soal tersebut.
Pertanyaan-pertanyaan tersebut antara lain:
(1) Apakah banyaknya soal untuk tiap
topik sudah seimbang?
(2) Apakah semua soal menanyakan bahan
yang telah diajarkan?
(3) Apakah soal yang kita susun
tidak merupakan pertanyaan
yang membingungkan ( dapat
disalahtafsirkan )?
(4) Apakah soal itu tidak sukar untuk
dimengerti?
(5) Apakah soal itu dapat dikerjakan oleh
sebagian besar siswa?
b. Cara kedua adalah mengadakan analisa
soal (item analysis). Analisa soal adalah
suatu prosedur yang sistematis, yang akan
memberikan informasi-informasi yang
sangat khusus terhadap butir tes yang kita
susun.
Manfaat mengadakan analisa soal :
(1) Membantu kita dalam
mengidentifikasikan butir-butir soal
yang jelek.
(2) Memperoleh informasi yang akan dapat

165
Evaluasi Pembelajaran

digunakan untuk menyempurnakan


soal-soal untuk kepentingan lebih
lanjut.
(3) Memperoleh gambaran secara selintas
tentang keadaan yang kita susun.
Analisa soal terutama dapat dilakukan untuk
tes obyektif.
Hal ini tidak berarti bahwa tes uraian tidak
dapat dianalisa, akan tetapi memang dalam
menganalisa butir tes uraian, belum ada
pedoman secara standar. Tentang kegunaan
dan cara mengadakan analisa soal akan
dibicarakan tersendiri di bagian lain.
c. Cara ketiga adalah mengadakan checking
validitas. Validitas yang paling penting dari
tes buatan guru adalah validitas kurikuler
(content validity). Untuk mengadakan
checking validitas kulikuler, kita harus
merumuskan tujuan setiap bagian pelajaran
secara khusus dan jelas sehingga setiap soal
dapat kita jodohkan dengan setiap tujuan
khusus tersebut.
Tes yang tidak mempunyai validitas kurikuler
atau walaupun mempunyai tetap kecil,
maka dapat juga terjadi jika salah satu atau
beberapa tujuan khusus tidak dicantumkan
dalam tabel spesifikasi. Semakin banyak
tujuan khusus yang tidak dicantumkan,
berarti validitas kulikulernya semakin kecil.
Dalam hal ini Terry D. Ten Brink, sebagaimana
dikutip Suharsimi Arikunto (1993)

166
Evaluasi Pembelajaran

mengemukakan pendapatnya demikian :


(1) Untuk tes yang dirancang akan
menggunakan norm refereced tidak
harus menuliskan setiap tujuan khusus,
tetapi cukup dengan tujuan-tujuan
yang esensial saja.
(2) Untuk tes yang dirancang akan
menggunakan criterion referenced,
maka setiap tujuan khusus harus
dicantumkan dalam table spesifikasi.
d. Cara keempat adalah dengan mengadakan
checking reliabilita. Salah satu indikator
untuk tes yang mepunyai reliabilitas yang
tinggi adalah bahwa kebanyakan dari soal-
soal tes itu mempunyai daya pembeda yang
tinggi.
Cara yang lain adalah dengan menganalisis butir
soal (item analysis) pada tes yang dibuat oleh guru.
Cara inilah yang merupakan materi pokok dari bagian
ini.
Telah dijelaskan bahwa analisis soal antara
lain bertujuan untuk mengadakan identifikasi soal-
soal yang baik, kurang baik dan soal yang jelek.
Dengan analisa soal dapat diperoleh informasi
tentang kejelekan sebuah soal dan ”petunjuk”
untuk mengadakan perbaikan. Mengetahui lebih
lanjut bagaimana cara menganalisis soal sebuah tes
maka akan dipelajari tentang taraf kesukaran, daya
pembeda, dan daya kecoh opsi jawaban. Dalam hal
ini Suharsimi Arikunto menjelaskan secara gamblang
tentang taraf kesukaran, daya beda, dan daya kecoh

167
Evaluasi Pembelajaran

opsi jawaban sebagai berikut:


a. TARAF KESUKARAN
Soal yang baik adalah soal yang tidak terlalu
mudah atau tidak terlalu sukar. Soal yang terlalu
mudah tidak merangsang siswa untuk mempertinggi
usaha memecahkannya. Sebaliknya soal yang terlalu
sukar akan menyebabkan siswa menjadi putus asa
dan tidak mempunyai semangat untuk mencoba lagi
karena di luar jangkauannya.
Seorang siswa akan menjadi hafal akan
kebiasaan guru-gurunya dalam hal pembuatan soal
ini. Misalnya saja guru A dalam memberikan ulangan
soalnya mudah-mudah, sebaliknya dengan guru B
kalau memberikan ulangan soalnya sukar-sukar.
Dengan pengetahuannya tentang kebiasaan ini, maka
siswa akan belajar giat jika menghadapi ulangan dari
guru B dan sebaliknya jika akan mendapat ulangan
dari guru A, tidak mau belajar giat atau bahkan
mungkin tidak mau belajar sama sekali.
Bilangan yang menunjukan sukar dan mudahnya
sesuatu soal disebut indeks kesukaran (difficulty
index). Besarnya indeks kesukaran antara 0,00
Bilangan yang menunjukan
sampai dengan 1,0.sukarIndeks
dan mudahnya
kesukaransesuatu soal disebut indeks kesukara
ini menunjukan
tarafBesarnya
(difficulty index). kesukaran soal.kesukaran
indeks Soal dengan
antaraindeks kesukaran
0,00 sampai dengan 1,0. Indek
0,0 menunjukan bahwa soal itu terlalu sukar,
kesukaran ini menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0,
sebaliknya indeks 1,0 menunjukan bahwa soalnya
menunjukan bahwa soalmudah.
terlalu itu terlalu sukar, sebaliknya indeks 1,0 menunjukan bahwa soalny
terlalu mudah.
0,0 1.0
Sukar mudah
Di dalam istilah evaluasi, indeks kesukaran ini diberi simbul P (p besar), singkatan da
kata ”proporsi”.
168 Dengan demikian maka soal dengan P = 0,70 lebih mudah jika dibandingka
dengan P = 0,20. sebaliknya soal dengan P = 0,30 lebih sukar daripada soal dengan P = 0,80.
Melihat besarnya bilangan indeks ini maka lebih cocok jika bukan disebut sebaga
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal disebut indek
(difficulty index). Besarnya indeks kesukaran antara 0,00 sampai dengan
kesukaran ini menunjukan taraf kesukaran soal. Soal
Evaluasi dengan indeks kes
Pembelajaran


menunjukan Di dalam
bahwa soal ituistilah
terlalu evaluasi, indeksindeks
sukar, sebaliknya kesukaran
1,0 menunjukan bah
ini diberi simbul P (p besar), singkatan dari kata
terlalu mudah.
”proporsi”. Dengan demikian maka soal dengan P =
0,0 1.0
0,70 lebih mudah jika dibandingkan dengan P = 0,20.
Sukardengan P = 0,30 lebih sukar daripada
sebaliknya soal mudah
Disoal dengan
dalam istilah Pevaluasi,
= 0,80.indeks kesukaran ini diberi simbul P (p besar), sin
Melihat
kata ”proporsi”. Denganbesarnya
demikianbilangan
maka soalindeks
denganini
P =maka lebihmudah jika di
0,70 lebih
dengancocok jika
P = 0,20. bukan disebut
sebaliknya sebagai
soal dengan indeks
P = 0,30 kesukaran
lebih sukar daripada soal dengan
tetapi indeks kemudahan atau indeks fasilitas, karena
Melihat
semakinbesarnya
mudahbilangan
soal itu,indeks ini maka
semakin besarlebih
pula cocok jika bukan dise
bilangan
indeks indeksnya.
kesukaran tetapi indeks
Akan kemudahan
tetapi telahatau indeks fasilitas,
disepakati bahwa karena semakin
walaupun
itu, semakin besar semakin tinggiindeksnya.
pula bilangan indeksnya menunjukan
Akan tetapi telahsoal
disepakati bahw
yang semakin mudah, tetapi tetap disebut indeks
semakin tinggi indeksnya menunjukan soal yang semakin mudah, tetapi tetap dis
kesukaran.
kesukaran.
Rumus mencari P adalah :
Rumus mencari P adalah :
P= B
JS
Dimana :
Dimana :
P = indeks kesukaran.
P
B = = banyaknya
indeks siswa
kesukaran.
yang menjawab soal itu dengan betul.
B
JS = = jumlah
banyaknya siswa
seluruh siswa yang
pserta tes.menjawab soal itu
dengan betul.
JS = : jumlah seluruh siswa pserta tes.
Latihan
Latihan :
Ada 20 orang dengan nama kode A s/d T yang mengajarkan tes yang ter
Ada 20 orang
soal. Jawaban dengan
tesnya nama
dianalisa kode A s/d
dan jawabannya T sepeti
tertera yangdibawah ini.
mengajarkan tes yang terdiri dari
(1 = jawaban betul; 0 = jawaban salah)
20 soal. Jawaban
tesnya dianalisa dan jawabannya tertera sepeti
dibawah ini.
(1 = jawaban betul; 0 = jawaban salah)
169
Evaluasi Pembelajaran

Nomor Soal sekor


siswa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 siswa
A 1 1 0 0 1 0 1 1 0 1 1 0 1 0 1 1 1 1 0 1 13
B 0 1 0 0 1 0 1 1 0 Nomor
0 1 Soal1 1 1 0 0 0 1 1 1 11 sekor
siswaC 1 1 2 1 30 40 51 61 17 18 09 110 011 1 121 130 141 15
1 16
0 17
1 18
1 19
1 20
14 siswa
A D 1 0 11 00 00 11 01 01 11 0 0 0 1 0 1 1 1 00
0 1 1 10 10 1
1 11 00 19 13
B E 0 1 11 00 00 11 00 11 11 00 10 1 1 1 1 1 1 1 10 01 01 0
1 11 01 114 11
C F 1 0 10 00 01 11 1 01 11 00 01 1 0 1 1 1 1 0 00 10 11 0 01 01 18 14
D G 0 1 10 00 01 10 10 10 11 00 10 0 0 1 1 1 1 1 11 01 01 0 11 11 013 9
E H 1 0 10 00 01 10 00 11 11 00 01 0 1 1 1 1 1 0 11 00 11 0
1 11 11 09 14
F I 0 1 01 01 11 11 10 10 11 00 10 1 1 1 1 1 1 1 01 01 00 1
1 10 10 017 8
G J 1 0 01 01 11 01 00 11 11 00 01 1 0 1 1 1 1 1 10 11 10 1
1 10 01 113 13
K 1 1 0 0 0 0 1 1 0 1 0 1 1 0 0 1 1 0 1 0 10
H 0 0 0 1 0 0 1 1 0 0 0 1 1 0 1 0 1 0 1 1 9
L 0 0 1 0 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 4
I M 1 1 10 10 10 11 00 11 1
1 0 1 1 1 1 1
1 1 1 1 1 0 1
10 11 0
1 0
1 1
1 1
13
17
J N 0 0 11 11 10 11 01 11 11 00 10 1 1 1 1 1 1 1 11 00 11 10 11 11 016 13
K O 1 1 11 00 00 01 00 11 01 10 11 0 0 1 1 1 1 0 01 00 11 1
1 10 01 012 10
L P 0 0 01 10 01 01 11 10 00 00 00 0 0 1 0 1 1 1 00 00 00 1
0 10 10 010 4
M Q 1 1 00 00 00 10 0 01 11 01 11 1 1 1 1 1 1 0 00 10 00 1 11 10 19 13
N R 0 0 11 10 01 11 10 11 11 00 11 1 1 1 1 1 1 0 10 10 00 1 01 11 111 16
O S 1 1 11 00 01 11 00 11 10 11 01 0 0 1 1 1 1 1 01 10 01 1
1 01 11 014 12
P T 0 0 11 00 11 11 10 11 10 00 00 0 0 1 1 1 1 1 10 00 00 1
0 00 11 110 10
Jumlah
Q 1 10 014 04 09 15
0 06 18
0 171 30 111 101 18 120 110 09 07 10
0 14
0 131 131 1 9
R 0Contoh
1 0penggunaan.
1 1 0 1 1 0 1 1 1 1 0 0 0 0 1 0 1 11
S
T
Contoh
0Misalnya
penggunaan.
1 1 0 1 1 0 1 1 1 0 0 1 1 1 1 0 1 1 0 1
1 0 jumlah
1 1 siswa
0 1peserta
1 0tes 0dalam
0 suatu
1 1kelas
1 ada
0 40
0 orang.
0 1 Dari
0 40
14
1 siswa
10
Jumlah 10 14 4berupa
9 15 6 18yang
17 dapat
3 11mengerjakan
10 18 20 soal
10 nomor
9 7 110 14 13 13 Maka
Misalnya jumlah siswa peserta tes dalam suatu kelas
tersebut 12 orang dengan betul.
Contoh
indekspenggunaan.
kesukarannya adalah :
ada 40 orang. Dari 40 siswa tersebut berupa 12 orang
Misalnya
P = Bjumlah siswa peserta tes dalam suatu kelas ada 40 orang. Dari 40 siswa
yang dapat mengerjakan soal nomor 1 dengan betul.
JS
tersebut berupa 12 orang yang dapat mengerjakan soal nomor 1 dengan betul. Maka
Maka indeks kesukarannya adalah :
P = kesukarannya
indeks 12 = 0,30adalah :

P = B40
Dari tabel yang disajikan di atas, dapat ditafsirkan bahwa :
JS
~ Soal nomor 1 mempunyai taraf kesukaran 10 = 0,5
P = 12 = 0,30 20
~ Soal nomor
409 adalah soal yang tersukar karena hanya dapat dijawab betul oleh 2
orang P = 2 = 0,1
Dari tabel yang disajikan di atas, dapat ditafsirkan bahwa :
20
~ ~Soal nomor
Soal nomor113
mempunyai taraf
adalah paling kesukaran
mudah 10 =siswa
karena seluruh 0,5 peserta tes, dapat menjawab.
Indeks kesukaran = 20 = 1,0 20
~ Soal nomor 9 adalah soal yang tersukar karena hanya dapat dijawab betul oleh 2
20
orang P = 2 = 0,1
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai
berikut : 20
~ Soal nomor 13 adalah paling mudah karena seluruh siswa peserta tes, dapat menjawab.
Indeks kesukaran = 20 = 1,0
20
Menurut ketentuan yang sering diikuti, indeks
103 kesukaran sering diklasifikasikan sebagai
berikut :
170

103
Evaluasi Pembelajaran

Menurut ketentuan yang sering diikuti, indeks


kesukaran sering diklasifikasikan sebagai berikut :
~ Soal dengan P : 0,00 sampai 0,30 adalah soal sukar
~ Soal dengan P : 0,30 sampai 0,70 adalah soal sedang
~ Soal dengan P : 0,70 sampai 1,00 adalah soal mudah

Walaupun demikian
Walaupun ada yangada
demikian berpendapat bahwa : soal-soal yang di
yang berpendapat
yaitu bahwa
soal-soal :yang
soal-soal
sedang, yang
adalahdianggap baik,
soal-soal yang yaitu soal-
mempunyai indeks kesukaran
soal
dengan 0,70.
yang sedang, adalah soal-soal yang mempunyai
indeks kesukaran 0,30 sampai dengan 0,70.
PerluPerlu diketahui
diketahui bahwa bahwa
soal-soal soal-soal yang
yang terlalu terlalu
mudah atau terlalu suka
mudah atau terlalu sukar, lalu tidak berarti tidak boleh
berarti tidak boleh digunakan. Hal ini tergantung dari penggunaannya. Jika d
digunakan. Hal ini tergantung dari penggunaannya.
banyak, kitadari
Jika menghendaki
pengikutyang lulus hanya
banyak, sedikit, kita ambil
kita menghendaki siswa yang palin
yang
lulus
ini maka hanya
lebih baik sedikit, kitabutir-butir
diambilkan ambil siswa yang
tes yang paling top.
sukar.
Untuk ini maka lebih baik diambilkan butir-butir
Sebaliknya jika kekurangan pengikut ujian, kita pilihkan soal-soal tes yang muda
yang sukar.
soal yang sukar akan menambah gairah belajar bagi siswa yang pandai, sedang
Sebaliknya jika kekurangan pengikut ujian, kita
yang terlalu mudah, akan membangkitkan semangat kepada siswa yang lemah.
pilihkan soal-soal yang mudah. Selain itu, soal yang
sukar akan menambah gairah belajar bagi siswa yang
pandai,
b. DAYA sedangkan soal-soal yang terlalu mudah,
PEMBEDA
akan membangkitkan semangat kepada siswa yang
Daya pembeda soal, adalah kemampuan suatu soal untuk membedakan
lemah.
yang pandai (berkemampuan tinggi) denga siswa yang bodoh (berkemamp
b. DAYA PEMBEDA
Angka yang menunjukan besarnya daya pembeda disebut indeks diskriminasi, d
Daya pembeda soal, adalah kemampuan suatu
besar). Seperti 1,00. hanya bedanya, indeks kesukaran tidak mengenal tanda neg
soal untuk membedakan antara siswa yang pandai
pada (berkemampuan
indeks diskriminasitinggi)
ada tanda
denganegatif.
siswaTanda
yang negatif
bodohpada indeks
(berkemampuan
digunakan jika suatu soalrendah).
”terbaik” Angka yangkualitas
menunjukan menunjukan
testee. Yaitu anak p
besarnya daya pembeda disebut
bodoh dan anak pandai disebut pandai.
indeks diskriminasi,
disingkat D (d besar). Seperti 1,00. hanya bedanya,
Denagan demikian ada tiga titik pada daya pembeda yaitu :
171
- 1,00 0,00 1,00
Daya pembeda Daya pembeda Daya pembeda
yang terlalu mudah, akan membangkitkan semangat kepada siswa yang lemah.

b.Evaluasi
DAYA PEMBEDA
Pembelajaran
Daya pembeda soal, adalah kemampuan suatu soal untuk membedakan antara siswa
indeks kesukaran tidak mengenal tanda negatif (-),
yang pandai (berkemampuan tinggi) denga siswa yang bodoh (berkemampuan rendah)
tetapi pada indeks diskriminasi ada tanda negatif.
Angka yang
Tandamenunjukan
negatifbesarnya
pada daya pembeda
indeks disebut indeks
diskriminasi diskriminasi, disingkat D (d
digunakan
jika suatu
besar). Seperti 1,00. soal
hanya”terbaik” menunjukan
bedanya, indeks kualitas
kesukaran tidak testee.
mengenal tanda negatif (-), tetap
Yaitu diskriminasi
pada indeks anak pandai ada disebut bodoh
tanda negatif. dannegatif
Tanda anak pada
pandaiindeks diskriminas
disebut pandai.
digunakan jika suatu soal ”terbaik” menunjukan kualitas testee. Yaitu anak pandai disebu
anakDengan
bodoh dan demikian
pandai disebut pandai. ada tiga titik pada daya
pembeda yaitu :
Denagan demikian ada tiga titik pada daya pembeda yaitu :

- 1,00 0,00 1,00


Daya pembeda Daya pembeda Daya pembeda
Negatif rendah Tinggi (positif)

Bagi sesuatu soal yang dapat dijawab benar


Bagi sesuatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh
oleh siswa pandai maupun siswa bodoh, maka soal
maka soal itu tidak baik karena tidak mempinyai daya beda. Demikian pula jika semua siswa
itu tidak baik karena tidak mempinyai daya beda.
baik pandai maupun pula
Demikian bodohjika
tidaksemua
dapat menjawab dengan
siswa baik benar. Soal
pandai tersebut tidak baik juga
maupun
bodoh
karena tidak tidak daya
mempunyai dapat menjawab
pembeda. dengan
Soal yang benar.
baik adalah Soal
soal yang dapat dijawab bena
tersebutyang
oleh siswa-siswa tidak
pandaibaik
saja. juga karena tidak mempunyai
daya pembeda. Soal yang baik adalah soal yang dapat
dijawab benar oleh siswa-siswa 104yang pandai saja.

Seluruh pengikut tes dikelompokan menjadi


2 kelompok saja, yaitu kelompok pandai atau
kelompok atas (upper group) dan kelompok bodoh
atau kelompok bawah (lower group).
Jika seluruh kelompok atas dapat menjawab
soal tersebut dengan benar, sedang seluruh
kelompok bawah menjawab salah, maka soal tersebut
mempunyai D paling besar, yaitu 1,00. sebaliknya jika
semua kelompok atas menjawab salah, tetapi semua
kelompok menjawab betul, maka nilai D nya – 1,00.
Tetapi jika siswa kelompok atas dan siswa kelompok
bawah sama-sama menjawab benar atau sama-sama
172
Jika seluruh kelompok atas dapat menjawab soal tersebut denga
kelompok bawah menjawab salah, maka soal tersebut mempunyai D
sebaliknya jika semua kelompok atas menjawab salah, tetapi sem
Evaluasi Pembelajaran
betul, maka nilai D nya – 1,00. Tetapi jika siswa kelompok atas da
menjawab salah, maka soal tersebut mempunyai
nilaicDsama-sama menjawab
0,00. Karena tidakbenar atau sama-sama
mempunyai menjawab salah, maka
daya pembeda
sama nilaicD
sekali. 0,00. Karena tidak mempunyai daya pembeda sama sekali.
Cara menentukan daya pembeda (nilai D) :
Cara
Untukmenentukan daya pembeda
ini perlu dibedakan antara(nilai D) : kecil
kelompok
(kurang dariini100)
Untuk dan
perlu kelompok
dibedakan besar
antara (100 orang
kelompok ke dari 100)
kecil (kurang
atas).
orang ke atas).
a) Untuk kelompok kecil
a) Untuk kelompok kecil
Seluruh kelompok
Seluruh kelompok testee
testee dibagi
dibagi dua sama
dua sama besar, 50% kelomp
besar, 50% kelompok besar (100 orang ke
atas).
atas).
Contoh :
Contoh :
Siswa Skor
A 9
B 8
C 7 kelompok atas (JA)
D 7
E 6

F 5
G 5
H 4 kelompok bawah (JB)
I 4
J 3

Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai


Seluruh pengikut tes, dideretkan mulai dari
skor teratas sampai terbawah, lalu dibagi 2.
b) Untuk kelompok besar
b) Untuk kelompok besar
Mengingat biaya dan waktu untuk menganalisa, maka untuk k
Mengingat biaya dan waktu untuk
hanya diambil kedua
menganalisa, makakutubnya saja, yaitu 27%
untuk kelompok skor teratas seb
besar
biasanya hanya diambil
dan 27% terbawah sebagai kedua kutubnya
kelompok saja,
bawah (JB).
173
JA = Jumlah Kelompok Atas
105
Evaluasi Pembelajaran

yaitu 27% skor teratas sebagai kelompok atas


(JA) dan 27% terbawah sebagai kelompok
bawah (JB).
JA = Jumlah Kelompok Atas
JB ==Jumlah
JB Jumlah Kelompok
Kelompok Bawah
Bawah

Contoh :
9
9
8
8
8 27% sebagai JA
.
.
.
_
.
.
.
_
.
.
.
2 27% sebagai JB
1
1
1
0

Rumus mencari D

B B
A B
D= = PA – PB
J J
A B

Dalam mana :
J = jumlah peserta tes
174
JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
2 27% sebagai JB
1
1
1
0
Evaluasi Pembelajaran

Rumus mencari D

B B
A B
D= = PA – PB
J J
A B

Dalam mana :
J = jumlah peserta tes
JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar.
BB = banyaknya peserta kelompok bawah yang menjawab soal itu benar.
B
A
PA= = proporsi peserta kelompok atas yang menjawab benar (ingat, P
J
A sebagai indeks kesukaran).
B
B
PA= = proporsi peserta kelompok bawah yang menjawab benar.
J
B

Contoh perhitungan
106 :
Dari hasil analisa tes yang terdiri dari 10 butir
soal yang dikerjakn oleh 20 orang siswa,
terdapat dalam tabel sebagai berikut :

175
terdapat dalam tabel sebagai berikut :

Evaluasi Pembelajaran

Tabel analisa 10 butir soal, 20 siswa.


Nilai Soal Skor
siswa kelompok 1 2 3 4 5 6 7 8 9 10 siswa
A B 1 0 1 0 0 0 1 1 1 0 5
B A 0 1 1 1 1 1 0 0 1 1 7
C A 1 0 1 0 1 1 1 1 1 1 8
D B 0 0 1 0 0 1 1 1 1 0 5
E A 1 1 1 1 1 1 1 1 1 1 10
F B 1 1 0 0 0 1 1 1 1 0 6
G B 0 1 0 0 0 1 1 1 1 1 6
H B 0 1 1 0 0 1 0 1 1 1 6
I A 1 1 1 0 0 1 1 1 1 1 8
J A 1 1 1 1 0 0 1 0 1 1 7
K A 1 1 1 0 0 1 1 1 1 0 7
L B 0 1 0 1 1 0 0 1 1 0 5
M B 0 1 0 0 0 0 0 1 1 0 3
N A 0 0 1 0 1 1 1 1 1 1 7
O A 1 1 0 1 1 1 1 1 1 1 9
P B 0 1 0 0 0 1 0 0 1 0 3
Q A 1 1 0 1 0 1 1 1 1 1 8
R A 1 1 1 1 0 1 1 1 1 0 8
S B 1 0 1 0 0 1 1 1 1 0 6
T B 0 1 0 1 0 1 1 1 1 0 6
Jumlah 11 15 12 8 6 16 15 17 20 10


Berdasarkan nama-nama siswa dapat kita
peroleh skor-skor sebagai berikut :
Berdasarkan nama-nama siswa dapat kita peroleh skor-skor sebagai berikut :
A=5 F=6 AK==57 F P= =63 K = 7 P = 3
B=7 G=6 BL== 75 GQ= =68 L = 5 Q = 8
C=8 H=6 CM==3
8 HR==68 M =3 R = 8
D=5 I=8 N=7 S=6
D=5 I=8 N=7 S=6
E = 10 J=7 O=9 T=6
E = 10 J = 7 O = 9 T = 6
Dari angka-angka yang belum teratur
kemudian dibuat array (urutan penyebaran),
dari skor yang paling tinggi ke skor yang
107
paling rendah.

176
Dari angka-angka yang belum teratur kemudian dibuat array (urutan
Evaluasi Pembelajaran
skor yang paling tinggi ke skor yang paling rendah.
Kelompok atas Kelompok bawah
Dari angka-angka yang
10 belum teratur kemudian6 dibuat array (urutan penyeb
skor yang paling tinggi ke skor yang paling rendah.
9 6
Kelompok atas Kelompok bawah
8 6
10 6
8 6
9 6
8
8 6
6

88 6 5
87 6 5
87 5 5
77 5 3
77 5 3
7 3
10 orang 10 orang
7 3
Array ini sekaligus menunjukan adanya kelompok atas (JA) dan kelo
Array ini 10sekaligus
orang 10 orang adanya
menunjukan
dengan pemiliknya sebagai berikut :
kelompok
Array ini atas (JA) adanya
sekaligus menunjukan dan kelompok (JA) dan kelompok
bawah
kelompok atas
J
dengan (JB) Kelompok
dengan
pemiliknya atas ( A) : sebagai
pemiliknya
sebagai berikut Kelompok bawah: (JB)
berikut
B=
Kelompok 7 (JA)
atas A = 5 (JB)
Kelompok bawah
BC==7 8 A =D5 = 5
CE==810 D =F5 = 6
EI ==10
8 F =G
6 =6
I J==8 7 G =H6 = 6
J=7 H=6
K=7 L=5
K=7 L=5
N=7 M=3
N=7 M=3
O=9 P=3
O=9 P=3
Q=8
Q=8 S=6
S=6

RR==8 8 T = T6 = 6
10orang
10 orang 10 orang
10 orang
Perhatikan
Perhatikan pada tabelanalisa
pada tabel analisa1010 butir
butir soalsoal 20 siswa.
20 siswa. 177
Dibelakang
Di belakang nama
namasiswa
siswadituliskan
dituliskanhuruf A atau
huruf B sebagai
A atau tandatanda
B sebagai kelompok. Ha
kelomp
B B
mempermudah menentukan
mempermudah menentukanA dan
danB. B B
Evaluasi Pembelajaran

Perhatikan pada tabel analisa 10 butir soal


20 siswa.
Di belakang nama siswa dituliskan huruf
A atau B sebagai tanda kelompok. Hal ini
untuk mempermudah menentukan BA dan
BB.
BA = banyaknya siswa yang menjawab
benar pada kelompok atas (A).
BB = banyaknya siswa yang menjawab
benar pada kelompok bawah (B)
Sudah disebutkan diatas bahwa soal yang
baik adalah soal yang dapat membedakan
antara
B anak pandai dengan anak bodoh,
A = banyaknya siswa yang menjawab benar pada kelompok atas (
dilihat
B
dari dapat dan tidaknya mengerjakan
= banyaknya
soal itu.
B siswa yang menjawab benar pada kelompok bawa
Sudah disebutkan diatas bahwa soal yang baik adalah soal ya
Marilah kita perhatikan tabel analisa lagi,
antara anak
khusus untukpandai dengan
butir anak bodoh,
soal nomor 1. dilihat dari dapat dan tid
itu.
~ Dari kelompok atas yang menjawab
betul 8 orang.
Marilah kita perhatikan tabel analisa lagi, khusus untuk butir soal
~ Dari kelompok bawah yang
~ Dari kelompok
menjawabatasbetul
yang menjawab
3 orang. betul 8 orang.
~ Dari kelompok
Kita terapkanbawah yang menjawab
dalam rumus betul 3 orang.
indeks
diskriminasi
Kita terapkan :dalam rumus indeks diskriminasi :
J J
A = 10 B = 10
PA = 0,8 PB = 0,3
B B
A =8 B =3
P
Maka D = A – PB
= 0,8 – 0,3
= 0,5
178
Dengan demikian maka indeks diskriminasi untuk soal nomor 1 ad
Sekarang kita perhatikan butir soal nomor 8 :
PAA = 0,8 PBB = 0,3
B B
A =8 P PB =3
Maka D = A – B
P
Maka D = A – PB = 0,8 – 0,3 Evaluasi Pembelajaran

=Dengan = 0,5
0,8 – 0,3demikian maka indeks diskriminasi
=untuk
0,5 soal nomor 1 adalah 0,5.

Sekarang kita perhatikan
Dengan demikian butir
maka indeks soal nomor
diskriminasi 8 soal nomor 1
untuk
: Sekarang
Dengan demikian kitaindeks
maka perhatikan butir soaluntuk
diskriminasi nomor 8 :nomor 1 adalah 0,5
soal
J
A =perhatikan
Sekarang kita 10 butir soal nomor 8 :
P
J
= 10 A = 0,8 maka D = PA – PB
A B
AP= 8 0,8
= maka D = PA – PB
A
B J =
A =8 B = 00 0,8 – 0,9
J B P =
B = 00 B= 9 B = 0,9 0,8 – 0,9= – 0,1
B P
B= 9 B = 0,9 = – 0,1

Butir soal ini jelek karena lebih banyak dijawab
Butir oleh
benar soal kelompok
ini jelek karena
bawahlebih banyak dijawab benar
dibandingkan
dengan
Butir soal jawaban
dibandingkan
ini jelek benar
dengan
karena lebihdari
jawaban kelompok
benar
banyak atas.
dari kelompok
dijawab benar atas.
olehInike
b
Ini
dibandingkan berarti
banyak
dengan bahwa
kelompok
jawaban bawahkemungkinan
benaryang kelompokbanyak
dari menjawab soal
atas.ini
Inidengan
berarticara
bahwm
kelompok bawah yang menjawab soal ini
banyak kelompok bawah yang menjawab soal ini dengan cara menebak.
dengan cara menebak.
Butir-butir soal yang baik adalah butir-butir
Butir-butir soal
soal yang
yang mempunyai
baik adalah indeks diskriminasi
butir-butir
0,4 sampai 0,7
soal yang mempunyai indeks diskriminasi
0,4 sampai 0,7

Klasifikasi daya pembeda :


D : 0,00 – – 0,20 : jelek (poor). 109
109
D : 0,20 – – 0,40 : cukup (satisfactory).
D : 0,40 – – 0,70 : baik (good).
D : 0,70 – – 1,00 : baik sekali (excellent).
D : negatif, semuanya tidak baik, jadi semua butir soal
yang mempunyai nilai D negatif sebaiknya dibuang
saja.
179
D : –negatif,
D : 0,40 semuanya
– 0,70 : baik (good). tidak baik, jadi semua butir soal yang mempunyai nilai
D : 0,70 – sebaiknya
– 1,00 : baikdibuang saja.
sekali (excellent).
D : negatif,
Evaluasisemuanya tidak baik, jadi semua butir soal yang mempunyai nilai D negatif
Pembelajaran
sebaiknya dibuang
Hubungan antarasaja.
Pantara
dan DP dan D
Hubungan
Untuk Untuk
melihat melihat
hubunganhubungan
antara P dan D, perlu
antara P dankita
D, telaah kembali rumus-rum
perlu kita
Hubungan antara P dan D
menentukannya. telah kembali rumus-rumus untuk menentukannya.
Untuk melihatB hubungan antara
B
P dan D, perlu kita telaah kembali rumus-rumus untuk
menentukannya.A B
D= (PA – PB). . . . . . . . . . . . . . . . . . . . . . . . (1)
B J B J
A A B B
D= (PA – PB). . . . . . . . . . . . . . . . . . . . . . . . (1)
J J
A B
B B B B
A+ B A+ A
PB =+ B B =
+ B
A JB A A 2J
P= + J=B A A
J J 2J
A + B ( B B
B)
A
A
=( B½A B
+B)
=½ ( J+A J
A)
J J
( A A)
P P
P P A
+ B
P =A + B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (2)
P= . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . (2)
2
2
Dari
Dari Dari
indeks indeks
indeks
kesukaran kesukaran
kesukaran
(P) dan(P) dan(P)
indeks dandiskriminasi
indeks indeks
diskriminasi diskriminasi
(D) dapat (D)
(D) dapathubungan
diperoleh diperoleh hubungan
sebagai
sebagai berikut :
dapat diperoleh hubungan sebagai berikut :
berikut :
Dmax Dmax
1,00 _ _1,00
_ _ ___ __ _ _ _ _ _ _ _
Dmax D
= max
2P.=. .2P.
(3) .0,80
. (3) 0,80
Sebagai contoh :
Sebagai contoh : 0,80 _ 0,80 _
Soal dengan P = 0,20
Soal dengan P = 0,20
Akan diberikan 0,60 _
Akan diberikan
Dmax = 0,40
0,60 _
Soal D max = 0,40
dengan P = 0,80 0,40
AkanSoal dengan P = 0,80
memberikan 0,40
Dmax Akan
= yangmemberikan
sama 0,20 _
Dmax = yang sama 0,20 _
0,00
0,20
0,00 0,50 0,80 1,00 P
0,20 0,50 0,80 1,00
Dari grafik terlihat bahwa soal-soal dengan nilai P =
0,50 memungkinkan untuk mendapat daya pembeda
110

180 110
Evaluasi Pembelajaran
Dari grafik terlihat bahwa soal-soal dengan nilai P = 0,50 memungkinkan untuk mendapat
yang paling tinggi.
daya pembeda yang paling tinggi.

Nilai-nilai P yang dianjurkan oleh penulis-penulis soal antara 0,30 dan 0,70,
namun harus di ingat bahwa soal-soal itu tidak berarti mempunyai daya pembeda
yang tinggi.

c. POLA
c. JAWABAN
POLA SOAL
JAWABAN SOAL
(DAYA KECOH (DAYA
ATAU KECOH
DISTRAKTOR) ATAU
DISTRAKTOR)
Yang dimaksud pola jawaban soal di sini adalah distribusi testee dalam hal menentukan
pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan
Yang dimaksud pola jawaban soal di sini adalah
menghitung banyaknya testee yang memilih pilhan jawaban a, b, c atau d atau yang tidak
distribusi testee dalam hal menentukan pilihan
memilih pilihan manapun (blangko).
jawaban pada soal bentuk pilihan ganda. Pola jawaban
Dalam istilah evaluasi disebut omit, disingkat O.
soal diperoleh dengan menghitung banyaknya testee
Dari pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi sebagai
yang
pengecoh memilih
dengan baik ataupilhan jawaban
tidak. Pengecoh yang a, b,dipilih
tidak c atau samadsekali
atauolehyang
testee
tidak
berarti bahwamemilih
pengecoh itu pilihan manapun
jelek, terlalu mencolok (blangko).
menyesatkan. Sebaliknya sebuah
distractor
(pengecoh)
Dalamdapat dikatakan
istilah berfungsi dengan
evaluasi baik apanila
disebut omit,distraktor tersebut
disingkat
mempunyai daya tarik yang besar bagi pengikut-pengikut tes yang kurang memahami
O.
konsep atau kurang menguasai bahan.
distraktor
Sesuatu Dari pola
dapat jawaban
diperlakukan soal
dengan dapat
3 cara : ditentukan apakah
a.pengecoh (distractor)
Diterima, karena sudah baik. berfungsi sebagai pengecoh
dengan baik atau
b. Ditolak, karena tidak baik. tidak. Pengecoh yang tidak dipilih
c.sama sekali
Ditulis kembali,oleh
karenatestee
kurang baik.berarti bahwa pengecoh itu
jelek, terlalu mencolok rumusan
Kekurangannya mungkin hanya teletak pada menyesatkan. Sebaliknya
kalimatnya sehingga hanya perlu
sebuah
ditulis distractor
kembali, dengan (pengecoh) dapat dikatakan
perubahan seperlunya.

berfungsi dengan baik


Menulis soal adalah suatu pekerjaan yang apanila
sangat sulit,distraktor
sehingga apabilatersebut
masih dapat

mempunyai
diperbaiki, daya saja,
sebaiknya diperbaiki tarik tidakyang
dibuang.besar bagi dapat
Suatu distraktor pengikut-
dikatakan
berfungsi baik jika paling sedikit dipilih oleh 5%
pengikut tes yang kurang memahami konsep atau pengikut tes.

kurang menguasai bahan.


Sesuatu distraktor dapat diperlakukan dengan
3 cara :
a. Diterima, karena
111 sudah baik.

b. Ditolak, karena tidak baik.

181
Evaluasi Pembelajaran

c. Ditulis kembali, karena kurang baik.


Kekurangannya mungkin hanya teletak pada
rumusan kalimatnya sehingga hanya perlu ditulis
kembali, dengan perubahan seperlunya.
Menulis soal adalah suatu pekerjaan yang
sangat sulit, sehingga apabila masih dapat diperbaiki,
sebaiknya diperbaiki saja, tidak dibuang. Suatu
distraktor dapat dikatakan berfungsi baik jika paling
sedikit dipilih oleh 5% pengikut tes.
Contoh penghitungan :
ContohDari analisis :sebuah item, polanya diketahui
penghitungan
Contoh penghitungan :
sebagai
Dari analisis sebuah: item, polanya diketahui sebagai berikut :
berikut
Dari analisis sebuah item, polanya diketahui sebagai berikut :
Pilihan jawaban a b c* d e Jumlah
Pilihan jawaban a b c* d e Jumlah
Kelompok atas 5 7 15 3 0 30
Kelompok atas 5 7 15 3 0 30
Kelompok bawah 8 8 6 5 3 30
Kelompok bawah 8 8 6 5 3 30
Jumlah 13 15 21 9 3 60
Jumlah 13 15 21 9 3 60
C, diberi tanda (*) adalah kunci jawaban
Dari pola jawaban soal ini dapat C, diberi
dicari : tanda (*) adalah kunci jawaban
Dari pola
Darijawaban soalsoal
pola jawaban iniini
dapat
dapatdicari
dicari ::
21
1) P = = 0,35
21
1) 60
P = = 0,35
60 15 6
P P
2) D = A – B = 15 6
P 30
P 30
2) D = A – B =
9
30 30
= = 0,30
30 9
= = 0,30
30
3) Distraktor : semua distraktornya sudah berfungsi dengan baik karena sudah d
lebih
3) dari
3) 5% pengikut
Distraktor
Distraktor : tes.
: semuasemua distraktornya
distraktornya sudah
sudah berfungsi dengan baik karen
4) Dilihatberfungsi
dari segi
lebih 5%dengan
dari omit (kolom baik
pengikut tes. karena
pilihan sudahadalah
paling kanan) diplih
baik. Sebuah item
oleh
baik jika lebihtidak
omitnya darilebih
5% pengikut tes. tes.
dari 10% pengikut
4) Dilihat dari segi omit (kolom pilihan paling kanan) adalah baik. Seb
182 (5% dari pengikut tes = 5% x 60 orang = 3 orang)
baik jika omitnya tidak lebih dari 10% pengikut tes.
Sebenarnya ketentuan ini hanya berlaku untuk tes pilihan ganda dengan alternat
(5% dari pengikut tes = 5% x 60 orang = 3 orang)
0,80. Tetapi demi praktisnya diberlakukan untuk semua.
Evaluasi Pembelajaran

4) Dilihat dari segi omit (kolom pilihan paling


kanan) adalah baik. Sebuah item dikatakan
baik jika omitnya tidak lebih dari 10% pengikut
tes.
(5% dari pengikut tes = 5% x 60 orang = 3
orang)
Sebenarnya ketentuan ini hanya berlaku
untuk tes pilihan ganda dengan alternatif
dan P = 0,80. Tetapi demi praktisnya
diberlakukan untuk semua.

183
Evaluasi Pembelajaran

184
Evaluasi Pembelajaran

BAB VI
PENGOLAHAN DATA

Pengolahan data adalah bagian penting dalam


proses penilaian yang dilakukan guru. Hal penting dalam
pengolahan data adalah merubah skor menjadi nilai. Skor
yang diperoleh siswa dari hasil ulangan harian, ulangan
tengah semester dan ulangan kenaikan kelas harus bisa
dirubah menjadi nilai. Oleh karena itu seorang guru harus
mampu mengolah data berupa skor menjadi nilai.
A. TUJUAN PEMBELAJARAN
Setelah mempelajari bagian ini diharapkan memiliki
kompetensi sebagai berikut.
1. Memahami dua acuan dalam penilaian, yaitu
penilaian acuan patokan dan penilaian acuan
norma.
2. Memahami berbagai jenis skala yang bisa digunakan
dalam merubah skor menjadi nilai
3. Terampil mengolah data dari skor menjadi nilai
dalam berbagai jenis skala
B. MATERI POKOK
Untuk mencapai tujuan tersebut, maka materi pokok
yang akan diuraikan dalam buku ini meliputi.
1. Jenis-jenis acuan/norma
2. Jenis-jenis skala nilai
185
Evaluasi Pembelajaran

3. Proses penilaian berdasarkan norma absolut


4. Proses penilaian berdasarkan norma relatif
C. URAIAN MATERI
1. Jenis-Jenis Acuan /Norma
Menurut Woodwort ada dua jenis norma
yang dapat digunakan untuk mengkonversikan
(mengubah) SKOR manjadi NILAI, yaitu :
a. Norma Absolut ( Cara pertama )
Caranya ialah dengan jalan membandingkan
Skor yang diperoleh seseorang dengan norma
absolut, atau standar yang absolut (dan sering pula
digunakan istilah PAP, yaitu singkatan dari Penilaian
Acuan Patokan).
Penilaian Acuan Patokan (PAP) terjemahan dari :
1. Criterion Referenced Evaluation ( CRE )
2. Competency Referenced Evaluation ( CRE )
3. Objective Referenced Evaluation ( ORE )
b. Norma Relatif ( Cara kedua ).
Caranya ialah dengan jalan membandingkan
Skor seseorang dengan Skor yang diperoleh oleh
orang-orang lain dalam tes tersebut. ( Norma relatif
sering pula disebut PAN ). Penilaian Acuan Norma
(PAN) terjemahan dari : Norm Referenced Evaluation
(NRE).
Jadi pada PAP (Penilaian Acuan Patokan),
penilaian yang dilakukan mengacu kepada suatu
kriteria pencapaian tujuan (instruksional) yang telah
dirumuskan sebelumnya . nilai-nilai yang diperoleh

186
Evaluasi Pembelajaran

siswa dihubungkan dengan tingkat pencapaian


pengauasaan (mastery) siswa tentang materi
pengajaran sesuai dengan tujuan (instruksional)yang
telah ditetapkan. Patokan yang digunakan bersifat
mutlak. nilai dari hasil PAP dapat dijadikan indicator
unuk mengetahui sampai dimana tingkat kemampuan
dan penguasaan siswa tentang materi pengajaran
tertentu.
Sedangkan pada PAP, penilaian yang dilakukan
mengacu kepada norma kelompok. Nilai-nilai yang
diperoleh siswa dibandingkan dengan nilai-nilai siswa
yang diperoleh siswa dibandingkan dengan nilai-nilai
siswa yang lain dalam kelompok itu. ( yang dimaksud
dengan “norma” disini adalah kapasitas atau prestasi
kelompok. Sedangkan yang dimaksud dengan
“kelompok” disini ialah semua siswa yang mengikuti
tes tersebut ). Jadi pengertian kelompok yang
dimaksud dapat berarti sejumlah siswa dalam suatu
kelas, sekolah, rayon atau propensi / wilayah. Patokan
yang digunakan bersifat relatif, dalam arti tidak tetap
atau selalu berubah-ubah disesyikan dengan kondisi
atau kebutuhan pada waktu itu. Nilai dari hasil
PAN tidak mencerminkan tingkat kemampuan dan
penguasaan siswa tentang materi pengajaran yang
diteskan, tetapi hanya menunjukkan kedudukkan
siswa di dalam ranking kelompoknya(Nurkancana,
1983: 79)
2. Jenis Skala Nilai
Di dalam mengolah Skor menjadi Nilai,
disamping kita menentukan Jenis Norma yang akan
kita gunakan, kita juga harus menentukan Jenis Skala
Nilainya (Thoha, 1991: 100). Jenis skala yang umum

187
Evaluasi Pembelajaran

digunakan yaitu :
1. Skala Lima ( rentangan 0 s/d 4 )
2. Skala Sembilan ( rentangan 1 s/d 9 )
3. Skala Sebalas ( rentangan 0 s/d 10 )
4. Skala Seratus ( rentangan 0 s/d 100 )
5. Skala Z Skor
6. Skala T Skor
Dalam buku ini skala Z dan T tidak diuraikan
Norma Absolut
Dalam Norma Absolut bisa kita gunakan/pilih salah
satu Jenis Skala Nilai beserta Pedoman Konversinya,
yaitu :
Norma Absolut Skala Lima.
Pedoman Konversi yang umum digunakan :
Tingkat Penguasaan - Nilai
90% - 100% - A=4
80% - 89% - B=3
65% - 79% - C=2
55% - 64% - D=1
0% - 54% - E = 0 = TL

Norma Absolut Skala Sembilan.


Pedoman Konversi :
Tingkat Penguasaan - Nilai
85% - 100% - 9
188
Evaluasi Pembelajaran

75% - 84% - 8
65% - 74% - 7
55% - 64% - 6
45% - 54% - 5
35% - 44% - 4
25% - 34% - 3
15% - 24% - 2
0% - 14% - 1

Norma Absolut Skala Sebelas.


Pedoman Konversi :
Tingkat Penguasaan - Nilai
95% - 100% - 10
85% - 94% - 9
75% - 84% - 8
65% - 74% - 7
55% - 64% - 6
45% - 54% - 5
35% - 44% - 4
25% - 34% - 3
15% - 24% - 2
5% - 14% - 1
0% - 4% - 0

189
0% - 4% - 0

Evaluasi Pembelajaran
Norma Absolut dengan Skala Seratus.
Norma Absolut dengan Skala Seratus.
Skala Seratus disebut juga Skala Persentil, yaitu skala yang berge
Skala Seratus disebut juga Skala Persentil, yaitu skala
sampai
yang dengan seratus.
bergerak antaraUntuk mengkonversikan
nol sampai Skor menjadi Nilai d
dengan seratus.
UntukSkala
Absolut mengkonversikan Skor menjadi
Seratus, menggunakan rumusNilai
: dengan
Norma Absolut Skala Seratus, menggunakan rumus :

X
P= X 100
SMI

Keterangan :
116
P = Persentil
X = Skor yang dicapai
SMI = Skor Maksimal Ideal

Norma Relatif
Dalam Norma Relatif bisa kita gunakan / pilih salah
satu Jenis Skala Nilai beserta Pedoman Konversinya,
yaitu:
Norma Relatif Skala Lima
Pedoman Konversi pada Norma Relatif Skala Lima
adalah sebagai berikut :
M + ( 1,5 SD ) ke atas = 4 = A
M + ( 0,5 SD ) ke atas = 3 = B
M – ( 0,5 SD ) ke atas = 2 = C
M – ( 1,5 SD ) ke atas = 1 = D
M – ( 1,5 SD ) ke atas = 0 = E = TL

190
Evaluasi Pembelajaran

Keterangan :
M = Mean ( Rata-rata )
SD = Standar Deviasi ( Simpangan Baku )

Norma Relatif Skala Sembilan


Pedoman Konversi pada Norma Relatif Skala Sembilan
adalah sebagai berikut :
M + ( 1,75 SD ) ke atas = 9
M + ( 1,25 SD ) ke atas = 8
M + ( 0,75 SD ) ke atas = 7
M + ( 0,25 SD ) ke atas = 6
M – ( 0,25 SD ) ke atas = 5
M – ( 0,75 SD ) ke atas = 4
M – ( 0,25 SD ) ke atas = 3
M – ( 1,75 SD ) ke atas = 2
M – ( 1,75 SD ) ke atas = 1

Norma Relatif Skala Sebelas


Pedoman Konversi pada Norma Relatif Skala Sebelas
adalah sebagai berikut :
M + ( 2,25 SD ) ke atas = 10
M + ( 1,75 SD ) ke atas = 9
M + ( 1,25 SD ) ke atas = 8
M + ( 0,75 SD ) ke atas = 7
M + ( 0,25 SD ) ke atas = 6
191
M + ( 1,25 SD ) ke atas = 8
M + ( 0,75 SD ) ke atas = 7
Evaluasi Pembelajaran
M + ( 0,25 SD ) ke atas = 6
M – ( 0,25 SD ) ke atas = 5
M – ( 0,25 SD ) ke atas = 5
M – ( 0,75 SD ) ke atas = 4
M – ( 0,75 SD ) ke atas = 4
M – ( 1,25 SD ) ke atas = 3
M – ( 1,25 SD ) ke atas = 3
M – ( 1,75 SD ) ke atas = 2
M – ( 1,75 SD ) ke atas = 2
M – ( 2,25 SD ) ke atas = 1
M – ( 2,25 SD ) ke atas = 1
M – ( 2,25 SD ) ke atas = 0
M – ( 2,25 SD ) ke atas = 0

Norma Relatif Skala Seratus / Persentil.


Norma Relatif
Untuk Skala Seratus / Persentil.
mengkonversikan Skala Seratus menjadi Nilai
dengan
Untuk Norma Relatif
mengkonversikan Skala Skala
SeratusSeratus, digunakan
menjadi Nilai dengan Norma Rela
rumus :
Seratus, digunakan rumus :
cfb  1 / 2 fp
P= X 100
N
Keterangan :
Keterangan :
P = Persentil N = Jumlah subjek
P = Persentil N = Jumlah subjek
cfb = cumulatif frekuensi below, yaitu jumlah frekuensi yang mendapat
cfb = cumulatif frekuensi below, yaitu jumlah
frekuensi skor
bawah yangyang akan dicari
mendapat skorpersentilnya.
di bawah skor yang
fp = frekuensi daerah persentil , yaitu jumlah frekuensi yang mendapat
akan dicari persentilnya.
fp dengan
= frekuensi
skor yang daerah persentil
akan dicari , yaitu jumlah
persentilnya.
frekuensi yang mendapat skor sama dengan skor
yang akan dicari persentilnya.
3. Proses Penilaian Berdasarkan Norma Absolut
Norma Absolut Skala Lima
Skala Lima adalah suatu pembagian tingkatan
yang terbagi atas lima kategori. Masing-masing
118
192
Evaluasi Pembelajaran

tingkatan dinyatakan dengan huruf : A, B, C, D, dan


E.
A adalah tingkatan yang tertinggi, B adalah
tingkatan dibawah A, dan seterusnya sampai E yang
merupakan tingkatan terendah.
Adapun langkah yang ditempuh dalam
mengkonversikan Skor menjadi Nilai dengan
menggunakan Norma Absolut Skala Lima adalah
sebagai berikut :
1. Mencari Skor Maksimal Ideal (SMI) dari tes yang
diberikan. SMI adalah Skor yang mungkin dicapai
apabila semua item dapat dijawab dengan benar.
SMI dicari dengan jalan menghitung jumlah item
yang diberikan serta bobot dari masing-masing
item.
Contoh (Pemberian Skor atas dasar bobot) :
Suatu tes hasil belajar terdiri dari item-item sebagai
berikut :
10 item B – S , masing-masing dengan bobot 1.
15 item Pilihan Ganda, dengan bobot 3.
15 item Menjodohkan, dengan bobot 2.
1 item Uraian, dengan bobot 5.
Maka skor Maksimal Ideal (SMI) dari tes tersebut
di atas adalah sebagai berikut:
Skor untuk B – S ………………= 10 x 1 = 10
Skor Untuk Pilihan Ganda …….= 15 x 3 = 45
Skor Untuk Menjodohkan …….= 15 x 2 = 30
Skor Untuk Uraian ……………= 1 x 5 = 5
193
Evaluasi Pembelajaran

Jumlah ( SMI ) = 90
2. Membuat Pedoman Konversi
Pedoman Konversi yang umum digunakan dalam
Norma Absolut Skala Lima adalah sebagai berikut:
Tingkat penguasaan Nilai
90% - 100% ……………… A=4
80% - 89% ……………… B=3
65% - 79% ……………… C=2
55% - 64%55%
-………………
64% ……………… DD= =1 1
0% - 54% ……………… E = 0 = TL
0% - 54% ……………… E = 0 = TL

3. Perhitungan
3. Perhitungan
Berdasarkan SMI tersebut, maka dapat dicari
Berdasarkan SMI tersebut, maka dapat dicari skor pada batas-
skor pada batas-batas kriteria tertentu, sebagai
tertentu,
berikut:sebagai berikut :
90
x90 81
Penguasaan 90% = 100

80
Penguasaan 80% = x90 72
100
65
Penguasaan 65% = x90 58,5 58( Pembula tan)
100
55
Penguasaan 55% = x90 49,5 50( Pembula tan)
100

4. Konversinya
Skor Nilai
194 81 – 90 …………………….. A = 4
72 – 80 …………………….. B = 3
58 – 71 …………………….. C = 2
Evaluasi Pembelajaran

4. Konversinya
Skor Nilai
81 – 90 …………………….. A = 4
72 – 80 …………………….. B = 3
58 – 71 …………………….. C = 2
50 – 57 …………………….. D = 1
0 – 49 …………………….. E = 0 = TL
Dengan menggunakan Konversinya, maka
berarti bahwa siswa yang memperoleh Skor 72 akan
mendapat Nilai B, sedangkan siswa yang mendapat
Skor 71 akan mendapat Nilai C.
Norma Absolut Skala Sembilan
1. Mencari Skor Maksimal Ideal dari tes yang diberikan.
Misalkan komposisi sama dengan contoh di atas,
yaitu SMI = 90. maka langkah berikutnya.
2. Membuat Pedoman Konversi
Adapun Pedoman Konversi Norma Absolut Skala
Sembilan adalah sebagai berikut :
Tingkat Penguasaan Nilai
85% - 100% ………………. 9
75% - 84% ………………. 8
65% - 74% ………………. 7
55% - 64% ………………. 6
45% - 54% ………………. 5
35% - 44% ………………. 4
25% - 34% ………………. 3
195
Evaluasi Pembelajaran

15% - 24% ………………. 2


0% - 14% ………………. 1
3. Perhitungan
Berdasarkan SMI tersebut diatas (90), maka skor
untuk batas-batas kriteria adalah sebagai berikut :
Penguasaan 85% =
Penguasaan 75% =
Penguasaan 65% =
Penguasaan 55% =
Penguasaan 45% =
Penguasaan 35% =
Penguasaan 25% =
Penguasaan 15% =
4. Konversinya
Skor Nilai
76 – 90 ……………………… 9
68 - 75 ……………………... 8
58 – 67 ……………………... 7
50 – 57 ……………………... 6
40 – 49 ……………………... 5
32 – 39 ……………………... 4
22 – 31 ……………………... 3
14 – 21 ……………………... 2
0 – 13 ……………………... 1

196
Evaluasi Pembelajaran

Dengan menggunakan Konversinya, maka berarti


siswa yang mendapat Skor 45 akan mendapat Nilai
5 dan siswa yang mendapat Skor 52 akan mendapat
Nilai 6.
Norma Absolut Skala Sebelas
1. Mencari Skor Makismal Ideal ( SMI ) dari tes yang
diberikan. Misalkan komposisi sama dengan contoh
di atas, yaitu SMI = 90. maka langkah berikutnya
ialah
2. Membuat Pedoman Konversi
Adapun Pedoman Konversi Norma Absolut Skala
Sebelas adalah sebagai berikut :
Tingkatan penguasaan Nilai
95% - 100% ………………. 10
85% - 94% ………………. 9
75% - 84% ………………. 8
65% - 74% ………………. 7
55% - 64% ……………… 6
45% - 54% ……………… 5
35% - 44% ……………… 4
25% - 34% ……………… 3
15% - 24% ……………… 2
5% - 14% ……………… 1
0% - 4% ……………… 0
3. Perhitungan
Berdasarkan SMI tersebut di atas ( 90 ), maka Skor

197
Evaluasi Pembelajaran

untuk batas-batas kriteria adalah sebagai berikut :


Penguasaan 95% =
Penguasaan 85% =
Penguasaan 75% =
Penguasaan 65% =
Penguasaan 55% =
Penguasaan 45% =
Penguasaan 35% =
Penguasaan 25% =
Penguasaan 15% =
Penguasaan 5% =
4. Konversinya
Skor Nilai
86 – 90 …………………….. 10
76 – 85 …………………….. 9
68 – 75 …………………….. 8
58 – 67 …………………….. 7
50 – 57 …………………….. 6
40 – 49 …………………….. 5
32 – 39 …………………….. 4
22 – 31 …………………….. 3
14 – 21 …………………….. 2
4 – 13 …………………….. 1
0 - 3 …………………….. 0

198
22 – 31 …………………….. 3
14 – 21 …………………….. 2
14 – 21 …………………….. 2
4 – 13 …………………….. 1
4 – 13 …………………….. 1
Evaluasi Pembelajaran
0 - 3 …………………….. 0
0 - 3menggunakan
Dengan …………………….. 0 maka berarti
Konversinya,
Dengan
siswa menggunakan
yang Konversinya,
mendapat Skor maka berarti siswa yang menda
87 akan maka
memperoleh
Dengan menggunakan Konversinya, berarti siswa yang m
memperoleh Nilai 10. sedangkan
Nilai 10. sedangkan siswa
siswa yang yang mencapai
mencapai Skor 3Skor 3 akan
memperoleh Nilai
akan mendapat nilai 0.10. sedangkan siswa yang mencapai Skor 3 a

Norma Absolut Skala Seratus


Norma Absolut Skala Seratus
Norma Absolut
Mencari Skala
Skor Seratus
Maksimal Ideal ( SMI ) dari tes yang
Mencari Skor Maksimal Ideal ( SMI ) dari tes yang dib
diberikan.
Mencari Skor Maksimalsama
Misalnya komposisis dengan
Ideal ( SMI contoh
) dari tes yang
komposisis
di atas, sama
yaitu dengan contoh
SMI = 90. di atas,
maka langkahyaituberikutnya
SMI = 90. maka la
komposisis
langsung sama Konversi
kepada dengan contoh di atas,
rumus (Kr), yaituyaitu
: SMI = 90. mak
langsung kepada Konversi rumus (Kr), yaitu :
langsung kepada Konversi rumus (Kr), yaitu :
X
P= x100
X
P=
SMI x100
SMI

Keterangan
Keterangan : :
Keterangan :
P P== Persentil
Persentil(Skala
(Skala Seratus
Seratusdisebut
disebutjuga
jugadengan
dengan SkalaPersentil, yai
Skala
P Persentil,
= Persentil (Skala
yaitu skalaSeratus disebut juga
yang bergerak dengan
antara Skala Persentil
0 s/d
bergerak
100. antara 0 s/d 100.
bergerak antara 0 s/d 100.
X X = =Skor
Skoryang
yangdicapai
dicapai
X = Skor yang dicapai
SMISMI
= Skor Maksimal
= Skor Maksimal Ideal
Ideal
SMI = Skor Maksimal Ideal
Contoh Penggunaan
Contoh Penggunaan Kr : Kr :
Contoh Penggunaan Kr :
Seorang pengikut
Seorang tes mendapat
pengikut Skor Skor
tes mendapat = 70,= sedang SMI = 90. mak
70, sedang
Seorang
SMI = 90.pengikut tes mendapat
maka Nilainya dapatSkor = 70, sebagai
dihitung sedang SMI = 90.
dihitung sebagai berikut :
berikut
dihitung: sebagai berikut :
X
P= x100
X
P=
SMI x100
SMI
70
P= x100
70
P=
90 x100
90
7000
P= 77,77 78( Pembula tan)
7000
P90
= 77,77 78( Pembula tan)
90
199
Evaluasi Pembelajaran

4. Proses Penilaian Berdasarkan Norma Relatif


Norma Relatif Skala Lima
Adapun langkah-langkah yang ditempuh dalam
mengkonversikan Skor menjadi Nilai dengan Norma
Relatif Skala Lima, adalah sebagai berikut :
1. Mencari rata-rata (Mean) dari Skor yang diperoleh
para pengikut tes dalam tes tersebut dengan
menggunakan prosedur dan rumus statistic.
2. Mencari Standar Deviasi (SD) dari Skor yang
diperoleh oleh para pengikut tes dalam tes
tersebut, juga menggunakan prosedur dan rumus-
rumus statistic.
3. Membuat Pedoman Konversi
Pedoman Konversi pada Norma Relatif Skala Lima
adalah sebagai berikut :
M + ( 1,5 SD ) ke atas = A
M + ( 0,5 SD ) ke atas = B
M – ( 0,5 SD ) ke atas = C
M – ( 1,5 SD ) ke atas = D
M – ( 1,5 SD ) ke atas = E = TL
4. Perhitungan
Contoh : LANGKAH-LANGKAH DALAM MENCARI
MEAN (M) DAN STANDAR DEVIASI (SD).
a. Data hasil belajar PKn yang diberikan kepada 32
orang siswa, pada suatu kelas yaitu :
46 39 32 31 43 32 44
37 24 38 58 17 48 38

200
Evaluasi Pembelajaran

51 49 40 45 41 25
42 30 35 36 35 20
34 11 28 27 33 53
Dari data tersebut di atas, susunlah Skor mulai dari
yang terbesar sampai dengan Skor yang terkecil,
seperti berikut
TABEL DISTRIBUSI FREKUENSI TUNGGAL
HASIL BELAJAR PKn
SKOR Tabulasi Frekuensi (f)
58 / 1
57 - 0
56 - 0
55 - 0
54 - 0
53 / 1
52 - 0
51 / 1
50 - 0
49 / 1
48 / 1
47 - 0
46 / 1
45 / 1
44 / 1
43 / 1
42 / 1
41 / 1
40 / 1
39 / 1
38 // 2
37 / 1
36 / 1
35 // 2
34 / 1
33 / 1
32 // 2

126
201
Evaluasi Pembelajaran

31 / 1
30 / 1
29 - 0
28 / 1
27 / 1
26 - 0
25 / 1
24 / 1
23 - 0
22 - 0
21 - 0
20 / 1
19 - 0
18 - 0
17 / 1
16 - 0
15 - 0
14 - 0
13 - 0
12 - 0
11 / 1

32
(N)

b. b. Menentukan
Menentukan Range
Range = Jarak = Jarak
sebar ( istilah sebar ).( istilah Wayan
Wayan Nurkancana
Nurkancana ). sebaran ( istilah yang dikemukakan oleh Saifuddin
= Jarak
Azwar )
= Jarak sebaran ( istilah yang dikemukakan oleh
= Rentang ( istilah yang dikemukakan oleh Dr. Sudjana, M.A,
Saifuddin Azwar ) beliau Rentang bisa dicari dengan jalan Data
M.Sc. Menurut

= Rentang terbesar dikurangi Data terkecil, hal 89 ).


( istilah yang dikemukakan oleh Dr.
Sudjana, M.A, M.Sc. 127 Menurut beliau Rentang bisa
dicari dengan jalan Data terbesar dikurangi Data
terkecil, hal 89 ).
Dalam hal ini (Range) lebih baik kita pakai
pendapat yang menyatakan bahwa, Range didapat
dengan rumus “Skor tertinggi ditambah setengah,

202
Evaluasi Pembelajaran

kemudian dikurangi oleh Skor terendah yang sudah


dikurangi dengan setengah”.
Dengan menggunakan prosedur dan yang telah
disebutkan di atas, maka :
Skor tertinggi : 58 = 58 + 0,5 = 58,5
Skor terendah: 11 = 11 - 0.5 = 10,5 –
Range = 48,5
c. Menentukan Data Tunggal atau Data Bergolong
(Distribusi frekuensi tunggal atau bergolongan)
Distribusi frekuensi tunggal digunakan apabila
Range dari pada Skor yang diperoleh sangat kecil,
tidak lebih dari 14).
Distribusi frekuensi bergolongan digunakan apabila
Range dari pada Skor yang diperoleh cukup besar
(Range dari 15 ke atas).
Catataan : Sesungguhnya tidak ada keharusan,
namun kalau memaksakan dimana Rangenya 15
ke atas menggunakan Distribusi frekuensi tunggal
akan mendapatkan banyak resiko, antara lain :
1. terlalu banyak menghabiskan ruang, waktu
dan tenaga.
2. kemungkinan salah dalam perhitungan juga
lebih besar.
Dalam masalah ini Range = 48 (cukup besar), berarti
menggunakan Distribusi frekuensi bergolongan
lebih baik, dan harus dibuat TABEL KERJA MENCARI
MEAN DAN STANDAR DEVIASI.

203
Evaluasi Pembelajaran

d. Menetapkan Interval (i)


Interval dinamakan juga dengan lebar kelas.
Mengenai banyaknya interval juga tidak ada
ketentuan yang mutlak.
Wayan Nurkancana dan PPN Sunartana cenderung
memilih interval dari salah satu bilangan berikut :
2, 3, 5, 10, 15 dan 25. (Wayan Nurkancana dan PPN
Sunartana, 1983 : 144).
Berdasarkan ancer-ancer (pedoman) bahwa :
Jumlah Kelas interval berkisar antara 7 s/d 15, maka
bilangan yang akan dipilih sebagai interval dapat
dicari sebagai berikut :

R 48 6
Interval maksimum : R 48 6 6
Interval maksimum : 7 7 67
7 7 7
R 48 3
Interval minimum : R 48 3 3
Interval minimum : 15 15 3 15
15 15 15
Diantara interval
Diantara intervalmaksimum
maksimum dan dan
interal minimum
interal akan terdapat salah sa
minimum
Diantara
akan interval maksimum dan interal minimum akan
kitaterdapat salah sa
dapatterdapat salah satu
kita pilih sebagai bilangan
interval yangkita
yang akan dapat
gunakan. Jadi yang dapa
pilih
dapatsebagai
kita pilihinterval
sebagai yang akan
interval yangkita
akangunakan. Jadi Jadi yang dapa
kita gunakan.
interval antara :
yang dapat
interval kita
antara : pilih ialah interval antara :
6 3
6 6 sampai dengan 3 3
6 7 sampai dengan 3 15
7 15
Sesuai dengan saran di atas, maka kita pilih interval 5 (Lima).
Sesuai dengan
Sesuai dengan saran
sarandi di
atas, maka
atas, kita kita
maka pilihpilih
interval 5 (Lima).
interval
5 (Lima).
e Menetapkan Kelas Interval / Class interval (Ci)
e Menetapkan
e Kelas
Menetapkan Interval
Kelas / Class
Interval / Classinterval
interval(Ci)
(Ci)
Kelas interal menunjukan banyaknya kelompok-kelompok Skor.
Kelas Kelas interal menunjukanbanyaknya
interal banyaknya kelompok-kelompok Skor.
banyaknya kelasmenunjukan kelompok-
interval, atau jumlah kelas interval.
kelompok Skor.interval,
banyaknya kelas Dinamakan juga banyaknya
atau jumlah kelas interval.kelas
1. Sebagai
interval, atau jumlahancer-ancer, bahwa jumlah kelas interval sebaikny
kelas interval.
1. Sebagai ancer-ancer, bahwa jumlah kelas interval sebaikny
7 s/d 15, maka Ci dalam hal ini bisa dicari dengan rumus se
204 7 s/d 15, maka Ci dalam hal ini bisa dicari dengan rumus se
:
:
e Menetapkan Kelas Interval / Class interval (Ci)
Kelas interal menunjukan banyaknya kelompok-kelompok S
Evaluasi
banyaknya kelas interval, atau jumlah kelasPembelajaran
interval.
1. Sebagai ancer-ancer,
1. Sebagai bahwa
ancer-ancer, jumlah
bahwa jumlahkelas
kelas interval seba
interval7sebaiknya berkisar antara 7 s/d 15,
s/d 15, maka Ci dalam hal ini bisa dicari dengan rum
maka Ci dalam hal ini bisa dicari dengan
:
rumus seperti dibawah ini :

Range 48 3
Rumus Ci = 9
int erval 5 5
3
=9 10 (Pembulatan)
5

f.
f. MenetapkanMenetapkan dimulainya
dimulainya (start) dari
(start) daripada Ci pertama.
pada Ci
pertama.Juga mengenai hal ini ada beberapa pendapat, namun lebi
Juga mengenai
pendapat yang hal ini ada bahwa
menyatakan beberapastart pendapat,
Kelas interval pertama
namun lebih baik menggunakan pendapat yang
kelipatan interval. Kesimpulannya ialah bahwa tiap-tiap Kelas in
menyatakan bahwa start Kelas interval pertama bisa
dengan
dimulai kelipatan
dengan interval, (dalam
kelipatan halKesimpulannya
interval. ini interval = 5).
ialah bahwa
Jadi tiap-tiap
Kelas interval KelasSkor
dengan interval harus dimulai
55, sedangkan yang terendah dimul
dengan kelipatan interval, (dalam hal ini interval =
5). Jadi Kelas interval dengan Skor 55, sedangkan
yang terendah dimulai dengan Skor 10.
g. RUMUS-RUMUS
Mencari Mean (M) dan Standar Deviasi (SD)
129

205
g. RUMUS-RUMUS
Evaluasi Pembelajaran
Mencari Mean (M) dan Standar Deviasi (SD)
I. Data Tunggal sekuruh skornya
berfrekuensi satu :
I. Data Tunggal seluruh skornya
6& berfrekuensi satu :
M
N
Keterangan :
6x 2
SD =
N
M = Mean = X Keterangan :
X = Skor SD = Standar Deviasi
N = Jumlah Frekuensi = Akar
6 = Jumlah
x = deviasi = simpangan atau skor
dikurangi mean = X- X
N = Jumlah Frekuensi
II. Data Tunggal skornya berfrekuensi
x2 = Kuadrat deviasi
satu atau lebih
6 f&
M II. Data Tunggal skornya berfrekuensi
N
Keterangan : satu atau lebih :

f = Frekuensi 6fx 2
SD =
III. Data bergolong Metode Panjang : N
Keterangan :

6 f& 6F ˜ Tt f = Frekuensi
M
N N
III. Data bergolong Metode Kodifikasi :
IV. Data bergolong Metode Kodifikasi :

2
§ 6fx ' · § 6fx ' 2 · § 6fx ' ·
M = M '  i¨¨ ¸¸ SD=i ¨¨ ¸¸  ¨¨ ¸¸
© N ¹ © N ¹ © N ¹

130

206
Evaluasi Pembelajaran

h. Menyusun Tabel Kerja :


h. Menyusun Tabel Kerja :
Metode Panjang.
i=

Ci SKOR X f fX x x2 fx2
(Tt) (X – M)

Metode Kodifikasi
i=

Ci SKOR f X x’ x’2 fx’ fx’2


(Tt)

Metode Pendek
i=

Ci SKOR f X x’ x’2 fx’ fx’2


(Tt)

Dalam menyusun Tabel Kerja dari Data bergolongan dengna Metode Panjang, dimulai
Dalam menyusun Tabel Kerja dari Data bergolongan
dengan menyusun :
dengan Metode Panjang, dimulai dengan menyusun
1. Kelas interval (Ci), yaitu kelompok nilai variabel. Misaalnya : 55 – 59, 50 – 54 dan
:
seterusnya.
1. Kelas interval (Ci), yaitu kelompok nilai
Adapun Ci 55 – 59, mencakup Skor 55, 56, 57, 58, 59. interval (i) atau lebar kelas
variabel. Misaalnya : 55 – 59, 50 – 54 dan
diperoleh dari batas kelas atas nyata dikurangi dengan batas kelas bawah nyata. Misalnya
seterusnya.
kita ambil kelas pertama, yaitu 55 – 59 (sesungguhnya kelas yang mewakili semua Skor

yang bergerak antara Adapun Ci59,5)
54,5 sampai 55 –angka
59, mencakup Skorkelas
59,5 disebut batas 55, atas
56, nyata,
57, dan
58,kelas
angka 54,5 disebut batas 59. bawah
interval (i)Jadi
nyata. atau
lebarlebar kelas
kelasnya/ diperoleh
interval = 59,5 – 54,5 =
5. dari batas kelas atas nyata dikurangi
2. Menulis Titik tengah dengan batas
(Tt), disebut kelasistilah
juga dengan bawah
Tandanyata. Misalnya
Kelas, yaitu variabel yang
kita ambil kelas pertama, yaitu 55 – 59
tepat terletak ditengah-tengah suatu kelas. Titik tengah diperoleh dari batas kelas bawah
(sesungguhnya kelas yang mewakili semua
ditambah dengan batas kelas atas lalu dibagi dua.
207
131
Evaluasi Pembelajaran

Skor yang bergerak antara 54,5 sampai


59,5) angka 59,5 disebut batas kelas atas
nyata, dan angka 54,5 disebut batas kelas
bawah nyata. Jadi lebar kelasnya/ interval =
59,5 – 54,5 = 5.
2. Menulis Titik tengah (Tt), disebut juga
dengan istilah Tanda Kelas, yaitu variabel
yang tepat terletak ditengah-tengah suatu
kelas. Titik tengah diperoleh dari batas
kelas bawah ditambah dengan batas kelas
atas lalu dibagi dua.
3. Menghitung frekuensi tiap-tiap Kelas
interval.
4. Perkalian antara frekuensi dengan Tt atau
fX.
5. Menghitung deviasi (x) dengan jalan Tt
dikurangi dengan Mean atau ( Tt – M ).
6. menghitung kuadrat deviasi (x2)
7. Perkalian antara frekuensi dengan kudrat
deviasi (fx2).

208
5. Menghitung deviasi (x) dengan jalan Tt dikurangi dengan Mean atau ( Tt – M ).
6. menghitung kuadrat deviasi (x2)
7. Perkalian antara frekuensi dengan kudrat deviasi (fx2).
Evaluasi Pembelajaran

TABEL KERJA HASIL BELAJAR PKn


( Mencari M dan SD dengan metode panjang)

Ci SKOR X f fx x x2 fx2
(Tt) (X – M)
1. 55 – 59 57 1 57 20,62 425,18 425,18
2. 50 – 54 52 2 104 15,62 243,98 487,96
3. 45 – 49 47 4 188 10,62 112,78 451,12
4. 40 – 44 42 5 210 5,62 31,58 157,90
5. 35 – 39 37 7 259 0,62 0,38 2,66
6. 30 – 34 32 6 192 - 4,38 19,18 115,08
7. 25 – 29 27 3 81 - 9,38 87,98 263,94
8. 20 – 24 22 2 44 - 14,38 206,78 413,56
9. 15 – 19 17 1 17 - 19,38 375,58 375,58
10. 10 - 14 12 1 12 -24,38 594,38 594,38
32 1164 3287,36
N ¦ fx ¦ fx 2

M =
¦ fx =
1164
= 36,375 = 36,38 ( Pembulatan ) (ada rumusnya)
N 32

SD= ¦ fx2 = 3287,36 = 102,73 = 10,1355 = 10,14 (Pembulatan)

N 32
TABEL KERJA HASIL BELAJAR PKn
(Mencari M dan SD dengan metode Kodifikasi)

Ci SKOR f X x’ x’2 fx’ fx’2


(Tt)

132

209
M = = = 36,375 = 36,38 ( Pembulatan ) (ada rumusnya)
N 32

SD= ¦ fx2 = 3287,36 = 102,73 = 10,1355 = 10,14 (Pembulatan)


Evaluasi Pembelajaran
N 32
TABEL KERJA HASIL BELAJAR PKn
(Mencari M dan SD dengan metode Kodifikasi)

Ci SKOR f X x’ x’2 fx’ fx’2


(Tt)
1. 55 – 59 1 57 +4 16 4 16
2. 50 – 54 2 52 132 +3 9 6 18
3. 45 – 49 4 47 +2 4 8 16
4. 40 – 44 5 42 +1 1 5 5
5. 35 – 39 7 37 0 0 0 0
6. 30 – 34 6 32 -1 1 -6 6
7. 25 – 29 3 27 -2 4 -6 12
8. 20 – 24 2 22 -3 9 -6 18
9. 15 – 19 1 17 -4 16 -4 16
10. 10 - 14 1 12 -5 24 -5 25
32 -4 132
(N) ( ¦ fx' ) (

¦ fx'2)

4  20
M = M’ + ( ¦ fx' ) i = 37 = ( ) 5 = 37 + ( )
32 32
N
= 32 + ( -0,625) = 36,375= 36,38 (Pembulatan)
2 2
6fx '2 § 6fx' · 132 §4·
SD = i  ¨ ¸ 5  ¨ ¸ =
N © N ¹ N © 2 ¹

=5 4,125  (0,125) 2 5 4,125  (0,015625)

=5 4,109375 = 5 (2,0271593) = 10, 135797 =


= 10,14 (Pembulatan)

TABEL KERJA HASIL BELAJAR PKn


210 (Mencari M dan SD dengan metode Pendek)
i=5
Ci SKOR f X x’ x’2 fx’ fx’2
= 10,14 (Pembulatan)

Evaluasi Pembelajaran

TABEL KERJA HASIL BELAJAR PKn


(Mencari M dan SD dengan metode Pendek)
i=5
Ci SKOR f X x’ x’2 fx’ fx’2
(Tt)
1. 55 – 59 1 57 +20 400 +20 400
2. 50 – 54 2 52 +30 225 +30 450
3. 45 – 49 4 47 133+40 100 +40 400
4. 40 – 44 5 42 +25 25 +25 125
5. 35 – 39 7 37 0 0 0 0
6. 30 – 34 6 32 -30 25 -30 150
7. 25 – 29 3 27 -30 100 -30 300
8. 20 – 24 2 22 -30 225 -30 450
9. 15 – 19 1 17 -20 400 -20 400
10. 10 - 14 1 12 -25 625 -25 625
32 -20 3300
(N) ( ¦ fx' ) ( ¦ fx'2)

§ 6fx ' 2 · §  20 ·
M = M’ + ¨¨ ¸¸ 37  ¨ ¸ 37  (0,625)
© N ¹ © 32 ¹
= 36,375 = 36,38 (Pembulatan)
2 2
6fx '2 § 6fx' · 3300 §  20 ·
SD=  ¨ ¸  ¨ ¸ =
N © N ¹ 32 © 32 ¹

= 103,125  (0,625) 2 103,125  (0,390625)

= 102 ,73438 = 10,135797 = 10,14 (Pembulatan)

Dalam menggunakan prosedur dan rumus-rumus statistik dapat diketahui bahwa :


M = 36,38
SD = 10,14

M + ( 1,5 SD ) = 36,38 + ( 1,5 x 10,14 = 51,59 = 52 ( Skor )


211
M + ( 0,5 SD ) = 36,38 + ( 0,5 x 10,14 = 41,45 = 41 “
M – ( 0,5 SD ) = 36,38 – ( 0,5 x 10,14 = 31,31 = 31 “
Evaluasi Pembelajaran

Dalam menggunakan prosedur dan rumus-rumus


statistik dapat diketahui bahwa :
M = 36,38
SD = 10,14
M + ( 1,5 SD ) = 36,38 + ( 1,5 x 10,14 = 51,59 = 52 (
Skor )
M + ( 0,5 SD ) = 36,38 + ( 0,5 x 10,14 = 41,45 = 41

M – ( 0,5 SD ) = 36,38 – ( 0,5 x 10,14 = 31,31 = 31

M – ( 1,5 SD ) = 36,38 – (1,5 x 10,14 = 21,17 = 21 “
(5)
Konversinya :
52 ke atas = A = 4
41 – 51 = B = 3
31 – 40 = C = 2
21 – 30 = D = 1
21 ke bawah = E = 0 = TL
Dengan menggunakan Pedoman Konversi ini,
maka anak yang mencapai Skor 46, Nilainya adalah
: B ( karena 46 termasuk ke dalam Konversi antara
41 – 51 ).
Norma Relatif Skala Sembilan
Adapun langkah yang ditempuh untuk
menkonversikan Skor menjadi Nilai dengan Norma
Relatif Skala Sembilan adalah sebagai berikut:

212
Evaluasi Pembelajaran

(1) Mencari angka rata-rata ( M )


(2) Mencari Standar Deviasi ( SD )
(3) Menggunakan Pedoman Konversi 1 – 9.
Pedoman Konversi pada Norma Relatif
Skala Sembilan adalah sebagai berikut :
M + ( 1,75 SD ) ke atas = 9
M + ( 1,25 SD ) ke atas = 8
M + ( 0,75 SD ) ke atas = 7
M + ( 0,25 SD ) ke atas = 6
M – ( 0,25 SD ) ke atas = 5
M – ( 0,75 SD ) ke atas = 4
M – ( 1,25 SD ) ke atas = 3
M – ( 1,75 SD ) ke atas = 2
M – ( 1,75 SD ) ke atas = 1
(4) Perhitungan
Contoh :
Misalkan data seperti contoh di atas ( lihat
halaman 27 ) yaitu Hasil Belajar PKn yang
diberikan kepada 32 orang siswa, dimana
dapat diketahui : M = 36,38 dan SD = 10,14.
Dengan demikian dapat dihitung sebagai
berikut :
36,38 + ( 1,75 x 10,14 ) = 54,125 dibulatkan =
54
36,38 + ( 1,25 x 10,14 ) = 49,055 dibulatkan =
49

213
Evaluasi Pembelajaran

36,38 + ( 0,75 x 10,14 ) = 43,985 dibulatkan =


44
36,38 + ( 0,25 x 10,14 ) = 38,915 dibulatkan =
39
36,38 + ( 0,25 x 10,14 ) = 33,845 dibulatkan =
34
36,38 + ( 0,75 x 10,14 ) = 28,775 dibulatkan =
29
36,38 + ( 1,25 x 10,14 ) = 23,705 dibulatkan =
24
36,38 + ( 1,75 x 10,14 ) = 18,635 dibulatkan =
19
(5) Konversinya

54 ke atas = 9
49 – 53 = 8
44 – 48 = 7
39 – 43 = 6
34 – 38 = 5
29 – 33 = 4
24 – 28 = 3
19 ke bawah = 1
Norma Relatif Skala Sebelas
Adapun langkah yang ditempuh untuk
mengkonversikan Skor menjadi Nilai dengan Norma
Relatif Skala Sebelas adalah sebagai berikut :

214
Evaluasi Pembelajaran

(1) Mencari angka rata-rata atau Mean (M)


(2) Mencari Standar Deviasi (SD
(3) Menggunakan Pedoman Konversi 0 – 10
Pedoman Konversi pada Norma Relatif Skala
Sebelas adalah sebagai berikut :
M + ( 2,25 SD ) ke atas = 10
M + ( 1,75 SD ) ke atas = 9
M + ( 1,25 SD ) ke atas = 8
M + ( 0,75 SD ) ke atas = 7
M + ( 0,25 SD ) ke atas = 6
M – ( 0,25 SD ) ke atas = 5
M – ( 0,75 SD ) ke atas = 4
M – ( 1,25 SD ) ke atas = 3
M – ( 1,75 SD ) ke atas = 2
M – ( 2,25 SD ) ke atas = 1
(4) Perhitungan :
Contoh :
Misalkan data seperti contoh di atas ( lihat halaman
27 ), yaitu Hasil Belajar PKn yang diberikan kepada
32 orang siswa, dimana dapat diketahui : M = 36,38
dan SD = 10,14 dengan demikian dapat dihitung
sebagai berikut :
36,38 + ( 2,25 x 10,14 ) = 59,195 dibulatkan = 59
36,38 + ( 1,75 x 10,14 ) = 54,125 dibulatkan = 54
36,38 + ( 1,25 x 10,14 ) = 49,055 dibulatkan = 49

215
Evaluasi Pembelajaran

36,38 + ( 0,75 x 10,14 ) = 43,985 dibulatkan = 44


36,38 + ( 0,25 x 10,14 ) = 38,915 dibulatkan = 39
36,38 + ( 0,25 x 10,14 ) = 33,845 dibulatkan = 34
36,38 + ( 0,75 x 10,14 ) = 28,775 dibulatkan = 29
36,38 + ( 1,25 x 10,14 ) = 23,705 dibulatkan = 24
36,38 + ( 1,75 x 10,14 ) = 18,635 dibulatkan = 19
36,38 + ( 2,25 x 10,14 ) = 13,565 dibulatkan = 14
(5) Konversinya :
59 ke atas = 10
54 – 58 = 9
49 – 53 = 8
44 – 48 = 7
39 – 43 = 6
34 – 38 = 5
29 – 33 = 4
24 – 28 = 3
14 – 18 = 2
14 ke bawah = 1
Norma Relatif Skala Seratus
Untuk mengkonversikan Skor menjadi Nilai
dengan Norma Relatif Skala Seratus ( Persentil )
digunakan rumus sebagai berikut :

cfb  1 / 2 fp
P= x100
N
Keterangan :
216
P = Persentil
cfb = cumulatif frekuensi below, yaitu jumlah frekuensi yang mendapat
Evaluasi Pembelajaran

Keterangan :
P = Persentil
cfb  1 / 2 fp
P = cfb = cumulatif
x100 frekuensi below, yaitu jumlah
N frekuensi yang mendapat Skor di bawah
Keterangan : Skor yang akan dicari persentilnya.
P N = Jumlah subjek
= Persentil
cfb Contoh : frekuensi below, yaitu jumlah frekuensi yang mendapat Skor d
= cumulatif
yang akandata
Misalkan dicari persentilnya.
seperti contoh di atas ( lihat halaman
N 27 ): yaitu
= Jumlah Hasil Belajar PKn yang diberikan kepada
subjek
32 orang siswa. Maka persentil bagi siswa yang
memperoleh Skor 46 dapat dicari sebagai berikut :
Contoh :
(1) Susunlah Skor mulai dari yang terbesar
Misalkan data seperti contoh di atas ( lihat halaman 27 ): yaitu Hasil Belaj
sampai dengan yang terkecil, seperti
diberikan kepada 32 orang siswa.dalam
tercantum Maka persentil
halaman bagi
28siswa yang memperoleh S
( TABEL
DISTRIBUSI
dicari sebagai berikut : FREKUENSI TUNGGAL HASIL
BELAJAR PKn).
(1) Susunlah Skor mulai dari yang terbesar sampai dengan yang terkecil, sepe
(2)
dalam Ternyata
halaman 28 (jumlah
TABELfrekuensi yang mendapat
DISTRIBUSI FREKUENSI TUNGG
skor dibawah Skor 46 ada 26 ( dua puluh
BELAJAR PKn).
enam ). Sedangkan jumlah frekuensi yang
(2) Ternyata jumlah frekuensiSkor
mendapat yangsama
mendapat skorSkor
dengan dibawah Skor 46 ada 26
46 ada
1 ( satu
enam ). Sedangkan ). Adapun
jumlah jumlah
frekuensi yang subjek ( NSkor
mendapat ) ada
sama dengan Sk
32 ( tiga puluh dua ).
satu ). Adapun jumlah subjek ( N ) ada 32 ( tiga puluh dua ).
Jadi Nilai siswa yang memperoleh Skor 46 :
Jadi Nilai siswa yang memperoleh Skor 46 :
cfb  1 / 2 fp 26  1 / 2 x1
P= x100 x100
N 32
26,5 2650
= x100 82,81 = 83 (Pembulatan)
32 32

217
Evaluasi Pembelajaran

218
Evaluasi Pembelajaran

BAB VII
PELAKSANAAN, PEMANFAATAN
DAN TINDAK LANJUT PENILAIAN

A. TUJUAN PEMBELAJARAN
Setelah mempelajari bab 6 ini diharapkan mahasiswa
memiliki kompetensi berikut:
1. menjelaskan langkah-langkah pelaksanaan
penilaian
2. membuat laporan haril penilaian
3. mendeskripsikan pemanfaatan hasil penilaian
untuk berbagai kepentingan
4. menjelaskan tindak lanjut hasil penilaian
B. MATERI POKOK
Untuk mencapai kompetensi di atas maka, materi
yang akan disajikan adalah:
1. Langkah-langkah Pelaksanaan penilaian
2. Pelaporan hasil penilaian
3. Pemanfaatan hasil penilaian untuk berbagai
keperluan
4. Tindak lanjut Penilaian

219
Evaluasi Pembelajaran

C. URAIAN MATERI
A. Pelaksanaan penilaian
1. Persiapan Administrasi
Fokus pada setiap jenis penilaian adalah
siswa, artinya setiap langkah dalam pelaksanaan
penilaian terkonsentrasi pada kepedulian terhadap
kepentingan siswa, supaya siswa dapat mengerjakan
instrumen penilaian secara akurat sesuai dengan
tujuan penilaian. Kepentingan siswa ini perlu
diakomodasi pada perlakuan terhadap instrumen
penilaian, perilaku penilai dan pengawas penilaian
(guru), ruangan tempat penilaian berlangsung dan
persiapan siswa secara fisik dan psikologis secara
baik.
a. Instrumen Penilaian
Instrumen penilaian tertulis disiapkan
tanpa kesalahan pengetikan, dikemas
dalam sampul instrumen tertutup. Penilaian
lisan dipandu dengan pertanyaan yang
jelas, lugas dan terarah pada masalah
yang ditanyakan, disiapkan dalam bentuk
pedoman pertanyaan. Instrumen penilaian
perilaku disusun sesuai dengan langkah-
langkah yang harus dikerjakan secara rinci
dan akurat, disiapkan dalam bentuk lembar/
kartu panduan kerja atau praktek.
b. Penilai dan Pengawas
Setiap penilai atau guru perlu:
1) Mendapatkan pelatihan cara
melaksanakan atau menerapkan

220
Evaluasi Pembelajaran

setiap jenis instrumen penilaian


secara profesional.
2) Disiapkan sebagai pribadi yang
mampu bertanggung jawab dalam
memfasilitasi setiap kegiatan
penilaian, yang menjadikan siswa
mampu mengerahkan kemampuan
kognitif, afektif dan psikomotornya
sesuai dengan tuntutan setiap item
instrumen.
3) Memiliki pemahaman tentang
tujuan dan maksud penilaian
diselenggarakan.
4) Menampilkan diri sebagai orang
yang mudah berkomunikasi, penuh
perhatian, responsif pada kebutuhan
siswa, mengingatkan siswa untuk
memperhatikan butir-butir penting
dalam evaluasi.
5) Menampilkan ketelitian di dalam
membagikan dan menggunakan
instrumen penilaian dan di dalam
mengumpulkan kembali lembar
jawaban atau lembar kerja setelah
penilaian berlangsung.
c. Penyiapan Ruangan atau Tempat Penilaian
Berlangsung
Ruangan atau tempat penilaian perlu
ditata sesuai dengan tuntutan dan tujuan
penggunaan setiap jenis (instrumen)
penilaian.

221
Evaluasi Pembelajaran

Misal:
Instrumen penilaian yang mengambil bentuk
tes objektif dan atau essay membutuhkan
ruang dengan pengaturan tempat duduk
yang memungkinkan peserta bekerja
sendiri, dengan cara ini akurasi prestasi
peserta mengerjakan penilaian dapat dijaga
tingkat objektivitasnya.
Jadi pengelolaan atau penataan ruangan
atau tempat penilaian perlu disesuaikan
dengan tuntutan akurasi pengukuran
kemampuan peserta dari setiap instrumen
penilaian yang telah dikembangkan sesuai
dengan tujuan penilaian.
d. Peserta Penilaian (Siswa).
Setiap siswa perlu diamati, bahwa: (a) mereka
sungguh-sungguh sebagai peserta penilaian
yang akan dilaksanakan, (b) mereka siap
mengerjakan atau melaksanakan penilaian
sesuai dengan jenis instrumen penilaian,
(c) mereka telah mengerti setiap tuntutan
maupun instruksi cara mengerjakan setiap
jenis penilaian.
2. Pelaksanaan Penilaian
Jika persiapan administrasi sudah lengkap,
maka pelaksanaan penilaian akan dapat berjalan
dengan baik. Akan tetapi dalam pelaksanaan
penilaian, terutama pada penilaian tertulis, masih
tetap memperhatikan beberapa hal berikut:
a. Menciptakan kondisi agar siswa bisa
berkonsentrasi untuk mengerjakan tes
222
Evaluasi Pembelajaran

secara optimal. Hindari gangguan atau


kegaduhan yang mengganggu konsentrasi
siswa.
b. Hindari komunikasi dan kontak yang tidak
perlu, kecuali untuk memberikan penjelasan
yang berkait dengan soal tes.
c. Jangan memberi bantuan dalam bentuk
apa pun yang berkait dengan jawaban tes.
Usahakan agar siswa menjawab tes sesuai
dengan kemampuannya.
d. Lakukan penyesuaian seperlunya bila ada
gangguan, agar pelaksaan tes tetap berjalan
dengan tertib dan lancar.
e. Usahakan agar siswa mengecek jawaban
apabila telah selesai sebelum waktu yang
ditentukan. Diusahakan pula agar siswa yang
selesai lebih dulu, menunggu sampai waktu
tes selesai. Dengan demikian, siswa yang
bersangkutan bisa melakukan pengecekan
ulang dan tidak mengganggu konsentrasi
siswa lain, kecuali untuk ulangan harian.
B. Pelaporan Hasil Penilaian
Pelaksanaan dan terutama hasil penilaian perlu
dilaporkan kepada pihak sekolah. Laporan itu dapat
berisi: (a) Laporan tentang berbagai peristiwa waktu
pelaksanaan penilaian berlangsung, (b) Laporan hasil
penilaian dalam bentuk daftar nilai, kualifikasi dan
kedudukan peserta dalam kelompok yang diolah
berdasarkan tes objektif dan esai serta analisis narasi
indikator kualifikasi kemampuan dan pengembangan
siswa yang diperoleh dari hasil penilaian non tes.

223
Evaluasi Pembelajaran

Setelah diadministrasikan secara baik kemudian


sekolah melaporkan hasil penilaian pada pihak atau
orang yang berkepentingan dengan hasil penilaian
siswa, seperti siswa itu sendiri, orang tua, pengambil
keputusan kelulusan, dan pengambil keputusan
untuk mendapatkan bea siswa.
C. Pemanfaatan Hasil Penilaian
Pemanfaatan hasil penilaian merupakan
ujung dari aktivitas penilaian dalam proses
pembelajaran. Sedikitnya ada empat pihak yang
dapat memanfaatkan hasil penilaian pembelajaran,
yakni guru, sekolah, peserta didik, dan orang tua.
Bagi guru, hasil penilaian dapat dimanfaatkan
sebagai umpan balik tentang kemampuan mengajar.
Sejauhmana upaya pembelajaran yang telah
dilakukan guru itu berhasil atau gagal. Bagi sekolah,
khususnya kepala sekolah, hasil penilaian belajar dan
pembelajaran dapat dimanfaatkan sebagai informasi
untuk pengambilan putusan. Bagi peserta didik, hasil
penilaian dapat dimanfaatkan sebagai dasar titik
tolak untuk meningkatkan upaya belajar, sedangkan
bagi orang tua, hasil penilaian dapat dimanfaatkan
untuk memotivasi dan menentukan srategi untuk
membantu anaknya berprestasi dalam belajar. Oleh
karena itu, hasil penilaian dapat dimanfaatkan baik
oleh pihak guru, sekolah, peserta didik maupun orang
tua untuk meningkatkan kualitas pembelajaran.
Perlu diperhatikan bahwa kerjasama antara
guru, kepala sekolah, dan orang tua serta peserta
didik dalam memanfaatkan hasil penilaian sangat
penting bagi kemajuan belajar peserta didik sendiri.
Membangun komunikasi dan saling bertukar informasi

224
Evaluasi Pembelajaran

di antara empat pihak khususnya yang terkait dengan


hasil penilaian akan banyak memberikan kontribusi
bagi perkembangan belajar peserta didik.
Dalam pembelajaran berbasis kompetensi,
pemanfaatan hasil belajar merupakan langkah dalam
sistem penilaian yang sangat penting baik bagi guru,
sekolah, peserta didik maupun orang tua. Untuk
mengetahui apakah peserta didik telah menguasai
kompetensi, maka dapat dibuktikan dengan cara
mengkaji hasil penilaian baik dalam aspek kognitif,
afektif maupun psikomotor. Tiga domain kompetensi
ini dapat dijadikan kriteria dalam mengkaji hasil
penilaian pembelajaran.
Sebagai langkah terakhir dalam proses
penilaian, hasil penilaian pembelajaran seyogyanya
dapat dimanfaatkan oleh guru sesuai dengan
tujuan penilaian itu sendiri, yakni untuk mengetahui
perkembangan hasil belajar sebagai umpan balik
(feed back) dan melakukan tindak lanjut (follow
up). Dua tujuan penilaian ini hanya dapat dilakukan
manakala proses penilaian sudah dilaksanakan dan
hasilnya telah diproses. Dua tujuan penilaian inipun
saling mendukung, artinya bahwa umpan balik tidak
akan bermanfaat apabila tidak ada tindak lanjut dan
sebaliknya tindak lanjut tidak dapat dilakukan apabila
belum ada umpan balik. Oleh karena itu, pemanfaatan
hasil penilaian pada dasarnya merupakan bagian
dari rangkaian penilaian yang saling terkait dan
berkesinambungan.
Pemanfaatan hasil penilaian untuk guru,
sekolah, peserta didik dan orang tua secara lebih rinci
diuraikan sebagai berikut.

225
Evaluasi Pembelajaran

1. Pemanfaatan hasil penilaian untuk guru


Guru adalah pelaksana penilaian kelas
untuk mengetahui sejauhmana kemajuan
yang telah dicapai atau kegagalan yang
dialami peserta didik dalam belajar. Selain
itu, guru pun dapat mengetahui bagaimana
posisi prestasi seseorang dalam kelompok
dan kelasnya dibandingkan dengan prestasi
siswa lainnya. Dalam melaksanakan
fungsinya, guru akan memanfaatkan
hasil penilaian sebagai pendorong
untuk meningkatkan kemampuan dan
memperbaiki kinerja dalam pembelajaran.
Guru yang inovatif akan selalu
berupaya untuk meningkatkan kualitas
profesionalnya apabila hasil penilaian
terhadap prestasi belajar peserta didik
rendah. Dengan demikian, hasil penilaian
dapat dimanfaatkan untuk meningkatkan
profesionalitas guru.
Dalam melakukan refleksi terhadap
kinerjanya, guru akan memanfaatkan hasil
penilaian sebagai bahan analisis. Setiap
ranah kognitif, afektif, dan psikomotor yang
dijadikan sebagai indikator penilaian akan
dikaji relevansi dan tingkat ketercapaiannya
dengan kompetensi dasar yang ditetapkan.
Dengan cara demikian, kemajuan dan
kegagalan peserta didik dalam belajar dapat
diketahui sehingga guru dapat melakukan
remedial yang disesuaikan dengan data
hasil analisis bagi masing-masing individu
peserta didik.
226
Evaluasi Pembelajaran

2. Pemanfaatan hasil penilaian untuk


sekolah
Sekolah sebagai suatu sistem merupakan
kesatuan yang terintegrasi dari berbagai
unsur terkait termasuk unsur guru
dan peserta didik. Bagi sekolah, hasil
penilaian dapat dimanfaatkan oleh kepala
sekolah sebagai dasar untuk pengambilan
kebijakan sekolah. Misalnya, tingginya
tingkat kegagalan siswa dalam ujian,
akan mendorong kepala sekolah untuk
mengeluarkan kebijakan mengadakan
belajar tambahan, memberi perhatian
yang lebih besar pada peningkatan kualitas
proses pembelajaran, atau menyediakan
fasilitas belajar yang lebih memadai.
3. Pemanfaatan hasil penilaian untuk peserta
didik
Selain guru, hasil penilaian belajar perlu
diketahui dan dimanfaatkan oleh peserta
didik. Oleh karena itu, informasi yang
lengkap tentang hasil penilaian kemampuan
dirinya dalam proses pembelajaran
perlu disampaikan kepada mereka. Agar
informasi itu dapat dimanfaatkan secara
optimal, maka para peserta didik perlu
mendapat bimbingan dari guru maupun
orang tuanya bagaimana memanfatakan
hasil belajar tersebut. Dengan bimbingan
dari guru dan orang tua para siswa dapat
memanfaatkan hasil penilaian untuk: 1)
mengetahui kemajuan hasil belajar dalam

227
Evaluasi Pembelajaran

rentang waktu tertentu; 2) mengetahui


materi pelajaran yang belum dikuasai; 3)
menyadari kompetensi yang belum tercapai;
4) mendorong diri untuk belajar lebih baik;
5) memperbaiki strategi belajar.
Agar peserta didik dapat memanfaatkan
hasil penilaian secara optimal, maka laporan
hasil penilaian yang diberikan kepada
peserta didik seyogyanya mengandung
aspek-aspek berikut: 1) uraian singkat
tentang kompetensi yang telah tercapai
dan belum tercapai oleh peserta didik;
2) kekuatan dan kelemahan kemampuan
peserta didik dalam mempelajari mata
pelajaran; 3) menggunakan bahasa yang
dapat memotivasi siswa untuk belajar lebih
keras; dan 4) informasi tentang minat dan
bakat peserta didik.
4. Pemanfaatan hasil penilaian untuk orang
tua
Sebagai stakeholder, orang tua memiliki
peran yang penting bagi kemajuan belajar
anaknya. Keberhasilan atau kegagalan
belajar peserta didik dipengaruhi pula
oleh sejauhmana peran orang tua dalam
membantu anaknya belajar. Informasi
hasil belajar yang lengkap tentang anaknya
akan sangat membantu orang tua untuk
memecahkan masalah belajar yang dihadapi
anaknya. Dengan informasi tersebut,
orang tua dapat memotivasi anaknya untuk
belajar lebih sungguh-sungguh bahkan

228
Evaluasi Pembelajaran

dapat membantu bagaimana strategi dan


teknik belajar yang tepat untuk mencapai
prestasi yang optimal.
Agar bantuan orang tua terhadap anaknya
tepat guna, maka informasi yang diperoleh
orang tua harus lengkap dan akurat.
Informasi hendaknya meliputi tentang
kekuatan dan kelemahan yang dimiliki
oleh anak baik dalam aspek kognitif,
afektif, maupun psikomotor. Informasi
hendaknya mencakup prestasi anaknya
dibandingkan dengan teman sekelasnya
dan dengan kompetensi dasar yang harus
dicapai. Informasi pun hendaknya meliputi
keterangan tentang minat dan bakat
peserta didik. Secara singkat pemanfaatan
hasil penilaian untuk orang tua digunakan
untuk: 1) memotivasi anaknya belajar; 2)
memfasilitasi anaknya belajar; 3) memberi
umpan balik kepada guru dan sekolah; 4)
membantu sekolah dalam fasilitas belajar.
5. Pemanfaatan hasil penilaian untuk
penentuan kelulusan
Selain untuk guru, sekolah, peserta didik
dan orang tua, pemanfaatan hasil penilaian
digunakan pula untuk menentukan
kelulusan. Tiga ranah, kognitif, afektif,
dan psikomotor dijadikan kriteria penilaian
untuk menentukan kelulusan peserta didik.
Namun, perlu diperhatikan bahwa skor
dari tiga ranah ini tidak dapat digabungkan
untuk menentukan kelulusan peserta

229
Evaluasi Pembelajaran

didik. Ranah afektif, khususnya, memiliki


karakteristik yang berbeda dengan ranah
kognitif dan psikomotor sehingga cara
penilaian, alat penilaian, dan pemanfaatan
penilaian untuk menentukan kelulusan pun
berbeda. Untuk menentukan kelulusan
seorang peserta didik, misalnya, minimum
harus mencapai skor 75 hasil penilaian
ranah kognitif dan psikomotor demikian
pula untuk ranah afektif.
D. TINDAK LANJUT
Hasil penilaian kelas di analisis untuk
mendapatkan umpan balik tentang berbagai
komponen dalam proses pembelajaran dan untuk
menentukan kegiatan tindak lanjut yang tepat.
Analisis hasil penilaian kelas dilakukan dengan
memperhatikan pada ulangan harian, tes perbuatan,
tugas pekerjaan rumah, portofolio dan ulangan umum.
Analisis ini diutamakan untuk mencari latar belakang
dan fakta penyebab mengapa siswa mendapat nilai
tertentu. Analisis ini dilakukan dengan mencari nilai
rata – rata kelas tiap mata pelajaran.
Tindak lanjut diberikan sebagai suatu tindakan
terhadap umpan balik yang diterima dari pelaksanaan
penilaian kelas. Tindak lanjut yang diberikan antara
lain :
a. Remedial
Apabila nilai rata – rata kelas dari suatu mata
pelajaran kurang dari 6,0. maka pelajaran
itu perlu diulang untuk seluruh peserta didik
dan seluruh kompetensi.

230
Evaluasi Pembelajaran

Apabila nilai rata – rata berkisar antara


6,0 sampai 7,99 dan ada sebagian siswa
yang mendapat nilai kurang dari 6,0 maka
pelajaran diulang untuk siswa tertentu dan
untuk kompetensi yang belum dikuasai.
b. Pengayaan
Jika nilai rata – rata kelas dari suatu mata
pelajaran mencapai lebih dari 8,0 maka
siswa dalam satu kelas diberikan pengayaan
materi. Bila yang mendapat lebih dari 8,0
hanya beberapa siswa saja, maka yang
mendapatkan pengayaan hanya siswa yang
mendapat nilai 8,0 saja.
Bentuk tindak lanjut lain yang perlu dilakukan
peserta didik dalam rangka menindaklanjuti hasil
pelaksanaan penilaian kelas adalah tindakan
memperbaiki proses, metode, dan alat pembelajaran
bila terjadi kegagalan pencapaian daya serap kurang
dari 60 %.

231
Evaluasi Pembelajaran

232
Evaluasi Pembelajaran

BAB VIII
PERUBAHAN SKOR MENJADI
NILAI

Pengantar
Merubah skor menjadi nilai adalah suatu hal yang
penting yang harus dilakukan oleh seorang guru. Skor
yang diperoleh siswa dari hasil ulangan harian atau
ulangan semesteran harus bisa dirubah menjadi nilai.
Perubahan skor menjadi nilai dapat dilakukan dengan
menggunakan dua sistem yaitu sistem penilaian acuan
normatif dan sistem acuan patokan. Baik sistem acuan
normatif maupun acuan patokan digunakan berbagai
skala baik skala lima, skala sembilan, skala sebelas, skala
persentil, skala Z-skor, dan skala T-skor. Semua jenis skala
tersebut memiliki kelebihan dan kekurangannya masing-
masing.
• ACUAN / NORMA / STANDAR
Menurut Woodwort ada dua jenis norma yang dapat
digunakan untuk mengkonversikan (mengubah)
SKOR manjadi NILAI, yaitu :
• Norma Absolut ( Cara pertama )
Caranya ialah dengan jalan membandingkan
Skor yang diperoleh seseorang dengan
norma absolut, atau standar yang absolut

233
Evaluasi Pembelajaran

(dan sering pula digunakan istilah PAP, yaitu


singkatan dari Penilaian Acuan Patokan).
Penilaian Acuan Patokan (PAP) terjemahan
dari :
• Criterion Referenced Evaluation (
CRE)
• Competency Referenced Evaluation (
CRE )
• Objective Referenced Evaluation (
ORE )
• Norma Relatif ( Cara kedua ).
Caranya ialah dengan jalan membandingkan
Skor seseorang dengan Skor yang diperoleh
oleh orang-orang lain dalam tes tersebut.
( Norma relatif sering pula disebut PAN ).
Penilaian Acuan Norma (PAN) terjemahan
dari : Norm Referenced Evaluation (NRE).
Jadi pada PAP (Penilaian Acuan Patokan),
penilaian yang dilakukan mengacu
kepada suatu kriteria pencapaian tujuan
(instruksional) yang telah dirumuskan
sebelumnya . nilai-nilai yang diperoleh siswa
dihubungkan dengan tingkat pencapaian
pengauasaan (mastery) siswa tentang
materi pengajaran sesuai dengan tujuan
(instruksional)yang telah ditetapkan.
Patokan yang digunakan bersifat mutlak.
nilai dari hasil PAP dapat dijadikan indicator
unuk mengetahui sampai dimana tingkat
kemampuan dan penguasaan siswa tentang
materi pengajaran tertentu.
234
Evaluasi Pembelajaran

Sedangkan pada PAP, penilaian yang


dilakukan mengacu kepada norma kelompok.
Nilai-nilai yang diperoleh siswa dibandingkan
dengan nilai-nilai siswa yang diperoleh siswa
dibandingkan dengan nilai-nilai siswa yang
lain dalam kelompok itu. ( yang dimaksud
dengan “norma” disini adalah kapasitas atau
prestasi kelompok. Sedangkan yang dimaksud
dengan “kelompok” disini ialah semua siswa
yang mengikuti tes tersebut ). Jadi pengertian
kelompok yang dimaksud dapat berarti
sejumlah siswa dalam suatu kelas, sekolah,
rayon atau propensi / wilayah. Patokan yang
digunakan bersifat relatif, dalam arti tidak
tetap atau selalu berubah-ubah disesyikan
dengan kondisi atau kebutuhan pada waktu
itu. Nilai dari hasil PAN tidak mencerminkan
tingkat kemampuan dan penguasaan siswa
tentang materi pengajaran yang diteskan,
tetapi hanya menunjukkan kedudukkan siswa
di dalam ranking kelompoknya(Nurkancana,
1983: 79)
• JENIS SKALA NILAI
Di dalam mengolah Skor menjadi Nilai, disamping
kita menentukan Jenis Norma yang akan kita
gunakan, kita juga harus menentukan Jenis Skala
Nilainya (Thoha, 1991: 100). Jenis skala yang umum
digunakan yaitu :
• Skala Lima ( rentangan 0 s/d 4 )
• Skala Sembilan ( rentangan 1 s/d 9 )
• Skala Sebalas ( rentangan 0 s/d 10 )

235
Evaluasi Pembelajaran

• Skala Seratus ( rentangan 0 s/d 100 )


• Skala Z Skor
• Skala T Skor
• Norma Absolut
Dalam Norma Absolut bisa kita gunakan/pilih salah
satu Jenis Skala Nilai beserta Pedoman Konversinya,
yaitu :
• Norma Absolut Skala Lima.
Pedoman Konversi yang umum digunakan :
Tingkat Penguasaan - Nilai
90% - 100% - A=4
80% - 89% - B=3
65% - 79% - C=2
55% - 64% - D=1
0% - 54% - E = 0 = TL
• Norma Absolut Skala Sembilan.
Pedoman Konversi :
Tingkat Penguasaan - Nilai
85% - 100% - 9
75% - 84% - 8
65% - 74% - 7
55% - 64% - 6
45% - 54% - 5
35% - 44% - 4
25% - 34% - 3
236
Evaluasi Pembelajaran

15% - 24% - 2
0% - 14% - 1
• Norma Absolut Skala Sebelas.
Pedoman Konversi :
Tingkat Penguasaan - Nilai
95% - 100% - 10
85% - 94% - 9
75% - 84% - 8
65% - 74% - 7
65% - 74% - 7
55% - 55%
64%- 64% - - 66

45% - 45%
54%- 54% - - 55
35% - 35%
44%- 44% - - 4
4
25% - 25%
34%- 34% - - 3
15% - 15%
24%- 24% - - 2
5% - 14%
5% - 14% - - 11
0% - 4%-
0% 4% - - 00

• Norma Absolut dengan Skala Seratus.


x Norma Absolut dengan
Skala Skaladisebut
Seratus Seratus. juga Skala Persentil,
Skala Seratus disebut
yaitu skalajuga
yangSkala Persentil,
bergerak yaitunol
antara skala yang bergerak an
sampai
dengan
sampai dengan seratus.seratus. Untuk mengkonversikan
Untuk mengkonversikan Skor menjadi Nilai denga
Skor menjadi Nilai dengan Norma Absolut
Absolut Skala Seratus, menggunakan rumus :
Skala Seratus, menggunakan rumus :

P=
Keterangan :
P = Persentil
237
X = Skor yang dicapai
SMI = Skor Maksimal Ideal
Evaluasi Pembelajaran
P=
P=
Keterangan :
Keterangan :
til P = Persentil
P = Persentil
ang dicapai X = Skor yang dicapai
X = Skor yang dicapai
Maksimal Ideal SMI = Skor Maksimal Ideal
SMI = Skor Maksimal Ideal

ut dengan Skala Z Skor.


• Norma Absolut dengan Skala Z Skor.
1.5 Norma Absolut dengan Skala Z Skor.
Mengkonversikan Skor menjadi Nilai, dengan
kan Skor menjadi Nilai, dengan rumus :
Mengkonversikan
rumus : Skor menjadi Nilai, dengan rumus :

P=
P=
Keterangan
Keterangan : :
ng dicapai
X =yang
X = Skor Skordicapai
yang dicapai
deal (Angka rata-rata ideal)
Mi = Mean Ideal (Angka rata-rata
Mi = Mean Ideal (Angka rata-rata ideal) ideal)

Mi =

SDi = Standar Deviasi Ideal

dar Deviasi Ideal


SDi =

= Norma absolut dengan Skala T Skor.


x
• Norma absolut dengan Skala T Skor.
Mengkonversikan
lut dengan Skala T Skor. MengkonversikanSkor menjadi Nilai, dengan menggunakan r
Skor menjadi Nilai, dengan
rsikan Skor menjadi Nilai,menggunakan rumus sebagai
dengan menggunakan berikutberikut
rumus sebagai : :
T = 50 +

T = 50 +
238 x Norma Relatif

Norma Relatif Dalam Norma Relatif bisa kita gunakan / pilih salah satu J
Evaluasi Pembelajaran

• Norma Relatif
Dalam Norma Relatif bisa kita gunakan / pilih salah
satu Jenis Skala Nilai beserta Pedoman Konversinya,
yaitu :
• Norma Relatif Skala Lima
Pedoman Konversi pada Norma Relatif Skala
Lima adalah sebagai berikut :
M + ( 1,5 SD ) ke atas = 4 = A
M + ( 0,5 SD ) ke atas = 3 = B
M – ( 0,5 SD ) ke atas = 2 = C
M – ( 1,5 SD ) ke atas = 1 = D
M – ( 1,5 SD ) ke atas = 0 = E = TL
Keterangan :
M = Mean ( Rata-rata )
SD = Standar Deviasi ( Simpangan Baku )
• Norma Relatif Skala Sembilan
Pedoman Konversi pada Norma Relatif Skala
Sembilan adalah sebagai berikut :
M + ( 1,75 SD ) ke atas = 9
M + ( 1,25 SD ) ke atas = 8
M + ( 0,75 SD ) ke atas = 7
M + ( 0,25 SD ) ke atas = 6
M – ( 0,25 SD ) ke atas = 5
M – ( 0,75 SD ) ke atas = 4
M – ( 0,25 SD ) ke atas = 3

239
25 SD ) ke atas = 3
75 SD ) ke atas = Pembelajaran
Evaluasi 2
75 SD ) ke atas = 1 M – ( 1,75 SD ) ke atas = 2
M – ( 1,75 SD ) ke atas = 1
if Skala Sebelas • Norma Relatif Skala Sebelas
Pedoman
n Konversi pada Norma Relatif SkalaKonversi pada Norma
Sebelas adalah sebagaiRelatif
berikutSkala
:
Sebelas adalah sebagai berikut :
25 SD ) ke atas = 10
M + ( 2,25 SD ) ke atas = 10
75 SD ) ke atas = 9
M + ( 1,75 SD ) ke atas = 9
25 SD ) ke atas = 8
M + ( 1,25 SD ) ke atas = 8
75 SD ) ke atas = 7
M + ( 0,75 SD ) ke atas = 7
25 SD ) ke atas = 6
M + ( 0,25 SD ) ke atas = 6
25 SD ) ke atas = 5
M – ( 0,25 SD ) ke atas = 5
75 SD ) ke atas = 4
M – ( 0,75 SD ) ke atas = 4
25 SD ) ke atas = 3
M – ( 1,25 SD ) ke atas = 3
75 SD ) ke atas = 2
M – ( 1,75 SD ) ke atas = 2
25 SD ) ke atas = 1
M – ( 2,25 SD ) ke atas = 1
25 SD ) ke atas = 0
M – ( 2,25 SD ) ke atas = 0
• Norma Relatif Skala Seratus / Persentil.
ma Relatif Skala Seratus / Persentil.
Untuk mengkonversikan Skala Seratus
menjadi
engkonversikan Skala Seratus NilaiNilai
menjadi dengan Norma
dengan NormaRelatif
RelatifSkala
Skala
Seratus, digunakan rumus :
digunakan rumus :

P=
gan :
Keterangan :
rsentil N = Jumlah subjek
P = Persentil N = Jumlah subjek
umulatif frekuensi below, yaitu jumlah frekuensi yang mendapat skor di
240 akan dicari persentilnya.
awah skor yang
ekuensi daerah persentil , yaitu jumlah frekuensi yang mendapat skor sama
Evaluasi Pembelajaran

cfb = cumulatif frekuensi below, yaitu jumlah


frekuensi yang mendapat skor di bawah skor
yang akan dicari persentilnya.
fp = frekuensi daerah persentil , yaitu jumlah
frekuensi yang mendapat skor sama dengan
skor yang akan dicari persentilnya.
• Norma Relatif dengan Skala Z Skor.
engan Skala Z Skor. Untuk menkonversikan Skor menjadi Nilai
onversikan
atif dengan Skor
Skalamenjadi dengan
Z Skor. Nilai Norma
dengan Relatif
Norma Skala
Relatif Z Skor,
Skala digunakan
Z Skor,
rumus :
umus :
menkonversikan Skor menjadi Nilai dengan Norma Relatif Skala Z Skor,
kan rumus :
Z=
: Z=
Keterangan :
yang:dicapai
ngan
X = Skor yang dicapai
( Rata-rata
Skor )
yang dicapai
M = Mean ( Rata-rata )
ar Deviasi
Mean ( Simpangan
( Rata-rata ) Baku )
SD = Standar Deviasi ( Simpangan Baku )
Standar Deviasi ( Simpangan Baku )
engan Skala T Skor. • Norma Relatif dengan Skala T Skor.
konversikan Skor menjadi Nilai
atif dengan Skala T Skor. Untuk dengan Norma Relatif Skala
mengkonversikan SkorT Skor,
menjadi
umus :
mengkonversikan NilaiNilai
Skor menjadi dengan Norma
dengan NormaRelatif
RelatifSkala
Skala TT Skor,
digunakan rumus :
kan rumus :
T = 50 +
T = 50 +
T = 50 + ( Z Skor ) x10
T = 50 + ( Z Skor ) x10

241
NILAIAN BERDASARKAN NORMA ABSOLUT
S PENILAIAN
Norma BERDASARKAN
Absolut Skala Lima NORMA ABSOLUT
Evaluasi Pembelajaran

C. PROSES PENILAIAN BERDASARKAN NORMA


ABSOLUT
• Norma Absolut Skala Lima
Skala Lima adalah suatu pembagian tingkatan yang
terbagi atas lima kategori. Masing-masing tingkatan
dinyatakan dengan huruf : A, B, C, D, dan E.
A adalah tingkatan yang tertinggi, B adalah
tingkatan dibawah A, dan seterusnya sampai E yang
merupakan tingkatan terendah.
Adapun langkah yang ditempuh dalam
mengkonversikan Skor menjadi Nilai dengan
menggunakan Norma Absolut Skala Lima adalah
sebagai berikut :
• Mencari Skor Maksimal Ideal (SMI) dari
tes yang diberikan. SMI adalah Skor yang
mungkin dicapai apabila semua item dapat
dijawab dengan benar. SMI dicari dengan
jalan menghitung jumlah item yang diberikan
serta bobot dari masing-masing item.
Contoh (Pemberian Skor atas dasar bobot) :
Suatu tes hasil belajar terdiri dari item-item
sebagai berikut :
10 item B – S , masing-masing dengan bobot
1.
15 item Pilihan Ganda, dengan bobot 3.
15 item Menjodohkan, dengan bobot 2.
1 item Uraian, dengan bobot 5.
Maka skor Maksimal Ideal (SMI) dari tes
tersebut di atas adalah sebagai berikut:
242
Maka skor Maksimal Ideal (SMI) dari tes tersebut di at
Skor untuk B – S ………………= 10 x 1 = 10
Skor Untuk PilihanEvaluasi
Ganda Pembelajaran
…….= 15 x 3 = 45
Skor untuk Skor
B – SUntuk
………………=
Menjodohkan 10 x…….=
1 = 10 15 x 2 = 30
Skor UntukSkor
Pilihan Ganda
Untuk …….=
Uraian 15 x 3 = 45 1 x 5 = 5
……………=
Skor Untuk Menjodohkan …….= 15 x 2( SMI
Jumlah = 30 ) = 90
Skor Untuk Uraian ……………= 1 x 5 = 5
Jumlah ( SMI ) = 90
x Membuat Pedoman Konversi
• Membuat Pedoman Konversi
Pedoman Konversi yang umum digunakan dalam
Pedoman Konversi yang umum digunakan
adalah sebagai
dalam Norma berikut : Skala Lima adalah
Absolut
sebagaiTingkat
berikutpenguasaan
: Nilai
Tingkat penguasaan Nilai A = 4
90% - 100% ………………
90% - 100% 80%
……………… A=4 B=3
- 89% ………………
80% - 89% 65%
……………… B=3 C=2
- 79% ………………
65% - 79% 55%
……………… C=2 D=1
- 64% ………………
55% - 64% 0%
……………… D = 1 E = 0 = TL
- 54% ………………
0% - 54% ……………… E=0=
TL
• Perhitungan
x Perhitungan
Berdasarkan SMI tersebut, maka dapat dicari
Berdasarkan
skor pada SMI tersebut,
batas-batas maka dapat dicari
kriteria tertentu,
sebagai
tertentu,berikut
sebagai:berikut :

Penguasaan 90% =

Penguasaan 80% =

243
Evaluasi Pembelajaran

Penguasaan 65% =

Penguasaan 55% =

• Konversinya
x Konversinya
Skor Nilai
Skor Nilai
81 – 90 …………………….. A = 4
81 – 90 …………………….. A = 4
72 – 80 …………………….. B = 3
72 – 80 …………………….. B = 3
58 – 71 …………………….. C = 2
58 – 71 …………………….. C = 2
50 – 5750……………………..
– 57 ……………………..
D=1 D=1
0 – 49 0……………………..
– 49 …………………….. E = 0 = TL
E = 0 = TL
Dengan
Dengan menggunakan
menggunakan Konversinya,
Konversinya, maka
maka berarti bahwa siswa yang
berarti bahwa siswa yang memperoleh Skor
Skor 72 akan mendapat Nilai B, sedangkan siswa yang mendapat Skor 71 ak
72 akan mendapat Nilai B, sedangkan siswa
Nilai C. yang mendapat Skor 71 akan mendapat Nilai
C.
• x Norma Absolut
Norma Skala Sembilan
Absolut Skala Sembilan
x • Mencari
MencariSkorSkor
Maksimal Ideal dari
Maksimal Idealtes dari
yang tes
diberikan.
yang Misalkan kom
diberikan.
dengan Misalkan
contoh di atas, yaitukomposisi sama
SMI = 90. maka dengan
langkah berikutnya.
contoh di atas, yaitu SMI = 90. maka langkah
x Membuat Pedoman Konversi
berikutnya.
Adapun Pedoman Konversi Norma Absolut Skala Sembilan adalah sebag
• Membuat Pedoman Konversi
Tingkat Penguasaan Nilai
Adapun Pedoman Konversi Norma Absolut
Skala85% - 100% ……………….
Sembilan 9
adalah sebagai berikut :
75% - 84% ………………. 8
Tingkat Penguasaan Nilai
65% - 74% ………………. 7
85% - 100% ………………. 9
55% - 64% ………………. 6

244 45% - 54% ………………. 5


35% - 44% ………………. 4
25% - 34% ………………. 3
Evaluasi Pembelajaran

75% - 84% ………………. 8


65% - 74% ………………. 7
55% - 64% ………………. 6
45% - 54% ………………. 5
35% - 44% ………………. 4
25% - 34% ………………. 3
15% - 24% ………………. 2
0% - 14% ………………. 1
• Perhitungan
x Berdasarkan
Perhitungan SMI tersebut diatas (90),
maka skor
Berdasarkan SMI untuk batas-batas
tersebut diatas (90), makakriteria
skor untukadalah
batas-batas kriteria ada
sebagai berikut
sebagai berikut : :

Penguasaan 85% =

Penguasaan 75% =

Penguasaan 65% =

Penguasaan 55% =

Penguasaan 45% =

Penguasaan 35% =

Penguasaan 25% =

Penguasaan 15% =
x Konversinya
Skor Nilai
245
76 – 90 ……………………… 9
68 - 75 ……………………... 8
Evaluasi Pembelajaran

• Konversinya
Skor Nilai
76 – 90 ……………………… 9
68 - 75 ……………………... 8
58 – 67 ……………………... 7
50 – 57 ……………………... 6
40 – 49 ……………………... 5
32 – 39 ……………………... 4
22 – 31 ……………………... 3
14 – 21 ……………………... 2
0 – 13 ……………………... 1
Dengan menggunakan Konversinya, maka
berarti siswa yang mendapat Skor 45 akan
mendapat Nilai 5 dan siswa yang mendapat
Skor 52 akan mendapat Nilai 6.
• Norma Absolut Skala Sebelas
• Mencari Skor Makismal Ideal ( SMI ) dari tes yang
diberikan. Misalkan komposisi sama dengan
contoh di atas, yaitu SMI = 90. maka langkah
berikutnya ialah
• Membuat Pedoman Konversi
Adapun Pedoman Konversi Norma Absolut Skala
Sebelas adalah sebagai berikut :
Tingkatan penguasaan Nilai
95% - 100% ………………. 10
85% - 94% ………………. 9

246
Tingkatan penguasaan Nilai
95% - 100% ………………. 10
Evaluasi Pembelajaran
85% - 94% ………………. 9
75% - 84% ………………. 8
75% - 84% ………………. 8
65% - 74%65%
………………. 7
- 74% ………………. 7
55% - 64%55%
……………… 6
- 64% ……………… 6
45% - 54%45%
……………… 5
- 54% ……………… 5
35% - 44%35%
……………… 4
- 44% ……………… 4
25% - 34%25%
……………… 3
- 34% ……………… 3
15% - 24%15% - 24% ………………
……………… 2 2

5% - 14% ………………
5% - 14% ……………… 1 1

0% - 0% - 4% ………………
4% ……………… 0 0

• Perhitungan
x Perhitungan
Berdasarkan SMI tersebut di atas ( 90 ), maka
Berdasarkan
Skor untukSMI tersebut di kriteria
batas-batas atas ( 90 adalah
), maka Skor untuk batas-batas
sebagai
berikut :
sebagai berikut :

Penguasaan 95% =

Penguasaan 85% =

Penguasaan 75% =

Penguasaan 65% =

Penguasaan 55% =

Penguasaan 45% =

Penguasaan 35% =
247

Penguasaan 25% =
Penguasaan 55% =

Evaluasi Pembelajaran
Penguasaan 45% =

Penguasaan 35% =

Penguasaan 25% =

Penguasaan 15% =

Penguasaan 5% =

• Konversinya
x Konversinya
Skor Nilai
Skor Nilai
86 – 90 …………………….. 10
86 – 90 …………………….. 10
76 – 85 …………………….. 9
76 – 85 …………………….. 9
68 – 75 …………………….. 8
68 – 75 …………………….. 8
5858– –6767……………………..
…………………….. 7 7
5050– –5757……………………..
…………………….. 6 6
4040– –4949……………………..
…………………….. 5 5
3232
– 39
– 39……………………..
…………………….. 4 4
2222 – 31
– 31 ……………………..
…………………….. 3 3
1414 – 21
– 21 ……………………..
…………………….. 2 2
4 –413
– 13 ……………………..
…………………….. 1 1
0 - 0 -3 ……………………..
3 …………………….. 0 0
Dengan menggunakan Konversinya, maka berarti siswa yang mendap
Dengan menggunakan Konversinya, maka berarti
memperoleh
siswa Nilai 10. sedangkan
yang mendapat siswamemperoleh
Skor 87 akan yang mencapai Skor 3 akan m
Nilai 10. sedangkan siswa yang mencapai Skor 3
akan mendapat nilai 0.

248
Evaluasi Pembelajaran

• Norma Absolut Skala Seratus


orma Absolut Skala Seratus
Mencari
x Skor Maksimal Ideal ( Skala
Norma Absolut SMI ) Seratus
dari tes yang
Skor Maksimal Ideal ( SMIMisalnya
diberikan. ) dari komposisis
tes yang diberikan.
sama denganMisalnya
contoh
Mencari Skor Maksimal Ideal ( SMI ) dari tes ya
a dengan contoh di diatas,
atas,yaitu
yaituSMI
SMI== 90.
90. maka
maka langkah
langkah berikutnya
berikutnya
langsung
komposisis kepada
samaKonversi
dengan rumus
contoh (Kr), yaituyaitu
di atas, : SMI = 90. m
Konversi rumus (Kr), yaitu :
langsung kepada Konversi rumus (Kr), yaitu :

P=
P=
Keterangan :
PKeterangan
= Persentil
: (Skala Seratus disebut juga dengan
(Skala Seratus disebutSkala
jugaPersentil,
dengan Skala
yaituPersentil,
skala yangyaitu skala yang
bergerak antara 0
P =
s/d 100. Persentil (Skala Seratus disebut juga dengan Skala Persen
antara 0 s/d 100.
X = Skor bergerak antara 0 s/d 100.
yang dicapai
dicapai
X ==Skor
SMI SkorMaksimal
yang dicapai
Ideal
simal Ideal
SMI = Skor
Contoh MaksimalKrIdeal
Penggunaan :
aan Kr :
Contoh Penggunaan
Seorang pengikut tesKrmendapat
: Skor = 70, sedang
ut tes mendapat Skor = 70, sedang SMI = 90. maka Nilainya dapat
SMI = 90.pengikut
Seorang maka Nilainya dapat Skor
tes mendapat dihitung sebagai
= 70, sedang SMI = 9
berikut : berikut :
dihitung sebagai berikut :

P=

P=

P=

orma Absolut Skala Z Skor


x Norma Absolut Skala Z Skor
Skor adalah suatu ukuran yang menyatakan penyimpangan suatu Skor 249
Skala Z Skor adalah suatu ukuran yang menyatakan pe
a dalam kelompok tersebut dalam suatu penyimpangan baku.
terhadap rata-rata dalam kelompok tersebut dalam suatu penyimp
angkah-langkah yang ditempuh untuk mengkonversikan Skor menjadi
Evaluasi Pembelajaran

• Norma Absolut Skala Z Skor


Skala Z Skor adalah suatu ukuran yang menyatakan
penyimpangan suatu Skor terhadap rata-rata dalam
kelompok tersebut dalam suatu penyimpangan
baku.
Adapun langkah-langkah yang ditempuh untuk
mengkonversikan Skor menjadi Nilai dengan Skala
Z Skor adalah sebagai berikut :
• Mencari Skor Maksimal Ideal (SMI).
• Menari angka rata-rata ideal/Mean Ideal (Mi).
cara mencari Mi = ½ x Mi
Skor Maksimal Ideal (SMI).
Keterangan : Mi = Mean Ideal
angka rata-rata ideal/Mean
Ideal
SMI (Mi).Makismal
= Skor cara mencari
IdealMi = ½ x Mi
gan : Mi = Mean Ideal• Mencari Standar Deviasi Ideal (SDi). Cara
SMI = Skor Makismal mencari
Ideal SDi = 1/3 x Mi
Standar Deviasi Ideal• (SDi).
Mengkonversikan Skor
Cara mencari SDi menjadi
= 1/3 x Mi Nilai dengan
rumus sebagai berikut :
nversikan Skor menjadi Nilai dengan rumus sebagai berikut :

Z=

Contoh :
omposisi sama dengan ontoh di atas. Misalkan pula salah seorang siswa
Misalkan komposisi sama dengan ontoh
tersebut memperoleh Skor
di 33. maka
atas. Nilai Siswa
Misalkan pula tersebut dapat dihitung
salah seorang siswa :
pengikut tes tersebut memperoleh Skor 33.
maka Nilai Siswa tersebut dapat dihitung :

250
Contoh :
Misalkan komposisi sama dengan ontoh di atas. Misalkan pula
Evaluasi
pengikut tes tersebut memperoleh SkorPembelajaran
33. maka Nilai Siswa t
SMI = 90

Mi =

SDi =

Z=

• Norma Absolut Skala T Skor


x Norma Absolut Skala T Skor
Penggunaan Skala Z Skor mempunyai kelemahan-
Penggunaan Skala Z Skor mempunyai kelemahan-kele
kelemahan:
x Karena skala ini menggunakan angka pecahan
• Karena skala ini menggunakan angka pecahan
perhitungan. perhitungan.
yang agak menyulitkan
Karenabeberapa
• Karena xdalam dalam beberapa
hal hal skalainiini mengguna
skala
menggunakan bilangan negatif
kadang-kadang yang kadang-
lupa menuliskannya.
kadang lupa menuliskannya.
Untuk mengatasi kelemahan tersebut, dikembangkan j
Untuk menghindari
mengatasiadanyakelemahan
pecahan, maka hasil tersebut,
dari (Skor dikurang
dikembangkan jenis skala yang lain. Untuk
dengan Standar Deviasi Ideal, kemudian dikalikan dengan 1
menghindari adanya pecahan, maka hasil dari (Skor
dikurangiadanya
Mean bilangan negatif,
Ideal) terus hasil dengan
dibagi kali tersebut ditambah dengan 5
Standar
Deviasi Ideal,
Skor. kemudian dikalikan dengan 10. dan
untuk menghindari adanya bilangan negatif, hasil
Rumus selengkapnya adalah sebagai berikut :
kali tersebut ditambah dengan 50. skala ini disebut
Skala T Skor.
Rumus selengkapnya adalah sebagai berikut :

T = 50 + (
ntoh di atas, siswa yang mendapat Skor 33, Nilainya dapat dicari sebagai

251

+(
Evaluasi Pembelajaran T = 50 + (
Adacontoh
Ada contoh di
di atas,
atas, siswa
siswa yang
yang mendapat
mendapat Skor
Skor33,
33, Nilainya dapa
berikutNilainya
: dapat dicari sebagai berikut :

T = 50 + (

= 50 + (

= 50 + (

= 50 + (
= 50 + (-8)
= 50 – 8
= 42

D. PROSES PENILAIAN BERDASARKAN NORMA


RELATIF
D. PROSES
1 NormaPENILAIAN
Relatif Skala BERDASARKAN
Lima NORMA RELATIF
1 Norma Relatif
Adapun Skala Lima yang ditempuh dalam
langkah-langkah
mengkonversikan Skor menjadi
Adapun langkah-langkah yang Nilai dengan
ditempuh Norma
dalam mengkonversika
Relatif Skala Lima, adalah sebagai berikut :
Nilai dengan Norma Relatif Skala Lima, adalah sebagai berikut :
• Mencari rata-rata (Mean) dari Skor yang
x Mencari rata-rata
diperoleh(Mean)
para dari Skor yang
pengikut diperoleh
tes dalam tespara pengikut
tersebut
tersebut dengan dengan menggunakan
menggunakan prosedur
prosedur dan rumus statistic.
dan rumus statistic.
x Mencari Standar Deviasi (SD) dari Skor yang diperoleh oleh para pen
• Mencari Standar Deviasi (SD) dari Skor yang
tes tersebut, juga menggunakan
diperoleh prosedur dan
oleh para pengikut tes rumus-rumus
dalam tes statistic.
x Membuat tersebut, juga menggunakan prosedur dan
Pedoman Konversi
252 Pedoman Konversi pada Norma Relatif Skala Lima adalah sebagai ber

M + ( 1,5 SD ) ke atas = A
Evaluasi Pembelajaran

rumus-rumus statistic.
• Membuat Pedoman Konversi
Pedoman Konversi pada Norma Relatif Skala
Lima adalah sebagai berikut :
M + ( 1,5 SD ) ke atas = A
M + ( 0,5 SD ) ke atas = B
M – ( 0,5 SD ) ke atas = C
M – ( 1,5 SD ) ke atas = D
M – ( 1,5 SD ) ke atas = E = TL
• Perhitungan
Contoh : LANGKAH-LANGKAH DALAM
MENCARI MEAN (M) DAN STANDAR DEVIASI
(SD).
a. Data hasil belajar PKn yang diberikan
kepada 32 orang siswa, pada suatu kelas
yaitu :
46 39 32 31 43 32 44
37 24 38 58 17 48 38
51 49 40 45 41 25
42 30 35 36 35 20
34 11 28 27 33 53
Dari data tersebut di atas, susunlah Skor
mulai dari yang terbesar sampai dengan Skor
yang terkecil, seperti berikut

253
Dari data tersebut di atas, susunlah Skor mulai dari yang terbesar sampai dengan
Skor yang terkecil, seperti berikut
Evaluasi Pembelajaran

TABEL DISTRIBUSI FREKUENSI TUNGGAL


HASIL BELAJAR PKn
SKOR Tabulasi Frekuensi (f)
58 / 1
57 - 0
56 - 0
55 - 0
54 - 0
53 / 1
52 - 0
51 / 1
50 - 0
49 / 1
48 / 1
47 - 0
46 / 1
45 / 1
44 / 1
43 / 1
42 / 1
41 / 1
40 / 1
39 / 1
38 // 2
37 / 1
36 / 1
35 // 2
34 / 1
33 / 1
32 // 2
31 / 1
30 / 1
29 - 0
28 / 1
27 / 1
26 - 0

254 25 / 1
24 / 1
23 - 0
22 - 0
30 / 1
29 - 0
28 / 1
Evaluasi Pembelajaran
27 / 1
26 - 0
25 / 1
24 / 1
23 - 0
22 - 0
21 - 0
20 / 1
19 - 0
18 - 0
17 / 1
16 - 0
15 - 0
14 - 0
13 - 0
12 - 0

11  / 1
 
32
( N )

b. Menentukan Range = Jarak sebar ( istilah Wayan Nurkancana ).


b. Menentukan Range = Jarak sebar ( istilah
= Jarak sebaran ( istilah yang dikemukakan oleh Saifuddin
Wayan Nurkancana
Azwar ) ).
= Jarak sebaran
= Rentang ( istilah
( istilah yang yang
dikemukakan dikemukakan
oleh Dr. Sudjana, M.A,

oleh Saifuddin Azwar )


M.Sc. Menurut beliau Rentang bisa dicari dengan jalan Data
terbesar dikurangi Data terkecil, hal 89 ).
Dalam hal ini
= (Range)
Rentanglebih (baik
istilah yang
kita pakai dikemukakan
pendapat oleh
yang menyatakan Dr.
bahwa,
Sudjana,
Range didapat dengan M.A,
rumus “Skor M.Sc.
tertinggi Menurut
ditambah setengah,beliau Rentang
kemudian dikurangi
bisasudahdicari
oleh Skor terendah yang dikurangi dengan jalan
dengan setengah”. Data terbesar
dikurangi
Dengan menggunakan prosedur dan Data terkecil,
yang telah disebutkanhal 89maka
di atas, ). :
Skor tertinggi : 58 = 58 + 0,5 = 58,5
Dalam hal ini (Range) lebih baik kita pakai
Skor terendah : 11 = 11 - 0.5 = 10,5 –
pendapat yang menyatakan bahwa, Range
Range = 48,5
didapat dengan rumus “Skor tertinggi
c.
ditambah setengah, kemudian dikurangi oleh
Menentukan Data Tunggal atau Data Bergolong
Skor terendah yang sudah dikurangi dengan
(Distribusi frekuensi tunggal atau bergolongan)
255
Distribusi frekuensi tunggal digunakan apabila Range dari pada Skor yang
diperoleh sangat kecil, tidak lebih dari 14).
Evaluasi Pembelajaran

setengah”.
Dengan menggunakan prosedur dan yang
telah disebutkan di atas, maka :
Skor tertinggi : 58 = 58 + 0,5 = 58,5
Skor terendah : 11 = 11 - 0.5 = 10,5 –
Range = 48,5
c. Menentukan Data Tunggal atau Data
Bergolong
(Distribusi frekuensi tunggal atau
bergolongan)
Distribusi frekuensi tunggal digunakan
apabila Range dari pada Skor yang diperoleh
sangat kecil, tidak lebih dari 14).
Distribusi frekuensi bergolongan digunakan
apabila Range dari pada Skor yang diperoleh
cukup besar (Range dari 15 ke atas).
Catatan : Sesungguhnya tidak ada keharusan,
namun kalau memaksakan dimana Rangenya
15 ke atas menggunakan Distribusi frekuensi
tunggal akan mendapatkan banyak resiko,
antara lain :
• terlalu banyak menghabiskan ruang,
waktu dan tenaga.
• kemungkinan salah dalam perhitungan
juga lebih besar.
Dalam masalah ini Range = 48 (cukup
besar), berarti menggunakan Distribusi
frekuensi bergolongan lebih baik, dan harus
dibuat TABEL KERJA MENCARI MEAN DAN
256
Catataan : Sesungguhnya tidak resiko,
mendapatkan banyak ada keharusan,
antara lainnamun
: kala
Rangenya 15 ke menghabiskan
x terlalu banyak atas menggunakan
ruang, Distribusi
waktu dan
mendapatkan banyak
x kemungkinan resiko,
salah dalam antara lain : juga lebi
perhitungan
Evaluasi Pembelajaran
terlalu banyak menghabiskan ruang, waktu dan t
Dalam xmasalah
STANDAR DEVIASI. ini Range = 48 (cukup besar), berarti
x kemungkinan
frekuensi bergolongan salahdan
lebih baik, dalam perhitungan
harus juga lebih
dibuat TABEL KE
d. Menetapkan Interval (i)
DANDalam masalah
STANDAR ini Range = 48 (cukup besar), berarti m
DEVIASI.
Interval dinamakan juga dengan lebar kelas.
frekuensi bergolongan
Mengenai banyaknya lebih baik, dan
interval jugaharus
tidakdibuat
ada TABEL KE
DAN STANDAR
ketentuan yang DEVIASI.
d. Menetapkan mutlak.
Interval (i)
Wayan Interval dinamakan dan
Nurkancana juga dengan lebar kelas. Mengenai
PPN Sunartana
cenderung
d. memilih
tidak Menetapkan
ada ketentuan yanginterval
Interval (i)
mutlak. dari salah satu
bilangan berikut : 2, 3, 5, 10, 15 dan 25. (Wayan
Interval dinamakan dan
Wayan Nurkancana jugaPPN
dengan lebar kelas.
Sunartana Mengenai
cenderung memili
Nurkancana dan PPN Sunartana, 1983 : 144).
tidak ada berikut
bilangan ketentuan
: 2,yang
3, 5,mutlak.
10, 15 dan 25. (Wayan Nurkancana da
Berdasarkan ancer-ancer (pedoman) bahwa
Wayan Nurkancana dan PPN Sunartana cenderung memili
:144).
Jumlah Kelas interval berkisar antara 7 s/d
bilangan
15, berikut
Berdasarkan
maka : 2,ancer-ancer
bilangan 3,yang
5, 10,akan
15(pedoman)
dan 25. (Wayan
dipilih bahwaNurkancana
sebagai da
: Jumlah Kela
interval
7 s/d 15, dapat
144). dicari sebagai
maka bilangan yang akanberikut
dipilih :sebagai interval dapat
Berdasarkan ancer-ancer (pedoman) bahwa : Jumlah Kelas
7Interval
s/d 15, maksimum
maka bilangan
: yang akan dipilih sebagai interval dapat d

Interval
Interval maksimum
minimum :

Diantara interval
Diantara maksimum
interval maksimumdan interal
danminimum
interalakan terdapat
Interval
minimum minimum
dapat kita pilih :
akansebagai
terdapat salah
interval satu
yang akanbilangan
kita gunakan. Jadi y
yang dapat
Diantara
interval kita
interval
antara pilih sebagai
: maksimum interval
dan interal yangakan terdapat
minimum
akan kita gunakan. Jadi yang dapat kita pilih
dapat kita pilih sebagai interval yang akan kita gunakan. Jadi ya
ialah interval antara :
interval
6 sampaiantara :
dengan 3

Sesuai dengan saran di atas, maka kita pilih interval 5 (Lima).
6 sampai dengan 3
Sesuai
e dengan saran
Menetapkan di atas,
Kelas maka/ kita
Interval Classpilih interval
interval (Ci)5 (Lima).
Sesuai dengan saran di atas, maka kita pilih
interval 5 (Lima).
e Menetapkan Kelas Interval / Class interval (Ci)

257
Evaluasi Pembelajaran

e Menetapkan Kelas Interval / Class interval


(Ci)
Kelas interal menunjukan banyaknya
kelompok-kelompok Skor. Dinamakan
Kelas interal menunjukan banyaknyajuga
kelompok-kelom
banyaknya kelas interval, atau jumlah kelas
banyaknya
interval. kelas interval, atau jumlah kelas interval.
x Sebagai
• Sebagai ancer-ancer,
ancer-ancer, bahwabahwa jumlah kelas inter
jumlah
kelas interval7 sebaiknya berkisar
s/d 15, maka antara
Ci dalam 7 s/d
hal ini bisa dicari deng
15, maka Ci dalam hal ini bisa dicari dengan
:
rumus seperti dibawah ini :

Rumus Ci =

=9 10 (Pembulatan)
f. Menetapkan dimulainya (start) dari pada Ci
pertama.
f. Menetapkan dimulainya (start) dari pada Ci pertama.
Juga Juga
mengenai
mengenaihalhal ini ada beberapa
ini ada beberapa pendapat, nam
pendapat, namun lebih baik menggunakan
pendapat
pendapatyang yangmenyatakan
menyatakan bahwa
bahwastartstart
Kelas interval p
Kelas interval
kelipatan pertama
interval. bisa dimulai
Kesimpulannya dengan
ialah bahwa tiap-tiap K
kelipatan interval. Kesimpulannya ialah
dengan kelipatan interval, (dalam hal ini interval = 5).
bahwa tiap-tiap Kelas interval harus dimulai
Jadi Kelaskelipatan
dengan interval dengan Skor(dalam
interval, 55, sedangkan
hal ini yang terenda
interval = 5).
Jadi Kelas interval dengan Skor 55, sedangkan
g. RUMUS-RUMUS
yang terendah dimulai dengan Skor 10.
Mencari Mean (M) dan Standar Deviasi (SD)
g. RUMUS-RUMUS
xMencari Mean (M) dan Standar Deviasi (SD)

258 x Data Tunggal sekuruh skornya berfrekuensi satu :


Mencari Mean (M) dan Standar Deviasi (SD)
x Evaluasi Pembelajaran

x Data
• Data Tunggal
Tunggal sekuruh
sekuruh skornya
skornya berfrekuensi satu :
berfrekuensi
satu :

Keterangan :

M = Mean =
X = Skor
N = Jumlah Frekuensi
= Jumlah

II. Data Tunggal skornya berfrekuensi satu atau


lebih
II. Data Tunggal skornya berfrekuensi satu atau lebih

Keterangan :

f = Frekuensi
III. Data bergolong Metode Panjang :

IV. Data bergolong Metode Kodifikasi :

259
M=
Evaluasi Pembelajaran

IV. Data bergolong Metode Kodifikasi :

M=

x Data Tunggal seluruh skornya berfrekuensi satu :

SD =
Keterangan :
SD = Standar Deviasi

= Akar

x = deviasi = simpangan atau skor dikurangi mean = X-


N = Jumlah Frekuensi
x2 = Kuadrat deviasi

II. II.
Data
DataTunggal
Tunggal skornya berfrekuensi
skornya berfrekuensi satusatu
atauatau
lebih :
lebih :

SD =
Keterangan :
f = Frekuensi

III. Data bergolong Metode Kodifikasi :


260
SD =
Keterangan :
f = Frekuensi
Evaluasi Pembelajaran

III. Data bergolong Metode Kodifikasi :

SD=i

h. Menyusun Tabel Kerja :


Metode Panjang.
i=

Ci SKOR X f fX x x2 fx2


(Tt) (X – M)

Metode Kodifikasi
i=

Ci SKOR f X x’ x’2 fx’ fx’2


(Tt)

Metode Pendek
i=

Ci SKOR f X x’ x’2 fx’ fx’2


(Tt)

Dalam menyusun Tabel Kerja dari Data bergolongan dengna Metode Panjang,
dimulai dengan menyusun :
x Kelas interval (Ci), yaitu kelompok nilai variabel. Misaalnya : 55 – 59, 50 – 54 dan
seterusnya.
Adapun Ci 55 – 59, mencakup Skor 55, 56, 57, 58, 59. interval (i) atau lebar kelas
diperoleh dari batas kelas atas nyata dikurangi dengan batas kelas bawah nyata.
Misalnya kita ambil kelas pertama, yaitu 55 – 59 (sesungguhnya kelas yang mewakili
261
semua Skor yang bergerak antara 54,5 sampai 59,5) angka 59,5 disebut batas kelas
atas nyata, dan angka 54,5 disebut batas kelas bawah nyata. Jadi lebar kelasnya/
Evaluasi Pembelajaran

Dalam menyusun Tabel Kerja dari Data


bergolongan dengna Metode Panjang,
dimulai dengan menyusun :
• Kelas interval (Ci), yaitu kelompok nilai
variabel. Misaalnya : 55 – 59, 50 – 54 dan
seterusnya.
Adapun Ci 55 – 59, mencakup Skor 55, 56, 57,
58, 59. interval (i) atau lebar kelas diperoleh
dari batas kelas atas nyata dikurangi dengan
batas kelas bawah nyata. Misalnya kita ambil
kelas pertama, yaitu 55 – 59 (sesungguhnya
kelas yang mewakili semua Skor yang
bergerak antara 54,5 sampai 59,5) angka
59,5 disebut batas kelas atas nyata, dan
angka 54,5 disebut batas kelas bawah nyata.
Jadi lebar kelasnya/ interval = 59,5 – 54,5 = 5.
• Menulis Titik tengah (Tt), disebut juga
dengan istilah Tanda Kelas, yaitu variabel
yang tepat terletak ditengah-tengah suatu
kelas. Titik tengah diperoleh dari batas kelas
bawah ditambah dengan batas kelas atas
lalu dibagi dua.
• Menghitung frekuensi tiap-tiap Kelas
interval.
• Perkalian antara frekuensi dengan Tt
atau fX.
• Menghitung deviasi (x) dengan jalan Tt
dikurangi dengan Mean atau ( Tt – M ).
• menghitung kuadrat deviasi (x2)
• Perkalian antara frekuensi dengan
kudrat deviasi (fx2).
262
Evaluasi Pembelajaran

TABEL KERJA HASIL BELAJAR PKn


( Mencari M dan SD dengan metode panjang)

Ci SKOR X f fx x x2 fx2


 (Tt) (X – M)
1. 55 – 59 57 1 57 20,62 425,18 425,18
2. 50 – 54 52 2 104 15,62 243,98 487,96
3. 45 – 49 47 4 188 10,62 112,78 451,12
4. 40 – 44 42 5 210 5,62 31,58 157,90
5. 35 – 39 37 7 259 0,62 0,38 2,66
6. 30 – 34 32 6 192 - 4,38 19,18 115,08
7. 25 – 29 27 3 81 - 9,38 87,98 263,94
8. 20 – 24 22 2 44 - 14,38 206,78 413,56
9. 15 – 19 17 1 17 - 19,38 375,58 375,58
10. 10 - 14 12 1 12 -24,38 594,38 594,38
 32 1164  3287,36
N
 

M = = = 36,375 = 36,38 ( Pembulatan ) (ada rumusnya)

SD= = = = 10,1355 = 10,14 (Pembulatan)


N 32

263
Evaluasi Pembelajaran

TABEL KERJA HASIL BELAJAR PKn


(Mencari M dan SD dengan metode Kodifikasi)

Ci SKOR f X x’ x’2 fx’ fx’2


(Tt)
1. 55 – 59 1 57 +4 16 4 16
2. 50 – 54 2 52 +3 9 6 18
3. 45 – 49 4 47 +2 4 8 16
4. 40 – 44 5 42 +1 1 5 5
5. 35 – 39 7 37 0 0 0 0
6. 30 – 34 6 32 -1 1 -6 6
7. 25 – 29 3 27 -2 4 -6 12
8. 20 – 24 2 22 -3 9 -6 18
9. 15 – 19 1 17 -4 16 -4 16
10. 10 - 14 1 12 -5 24 -5 25
 32  -4 132
(N) (
( 

M = M’ + ( i = 37 = ( ) 5 = 37 + (
N
= 32 + ( -0,625) = 36,375= 36,38 (Pembulatan)

SD = =

=5 5

=5 = 5 (2,0271593) = 10, 135797 =


= 10,14 (Pembulatan)

264
Evaluasi Pembelajaran

TABEL KERJA HASIL BELAJAR PKn


(Mencari M dan SD dengan metode Pendek)
i=5
Ci  SKOR f X x’ x’2 fx’ fx’2
(Tt)
1. 55 – 59 1 57 +20 400 +20 400
2. 50 – 54 2 52 +30 225 +30 450
3. 45 – 49 4 47 +40 100 +40 400
4. 40 – 44 5 42 +25 25 +25 125
5. 35 – 39 7 37 0 0 0 0
6. 30 – 34 6 32 -30 25 -30 150
7. 25 – 29 3 27 -30 100 -30 300
8. 20 – 24 2 22 -30 225 -30 450
9. 15 – 19 1 17 -20 400 -20 400
10. 10 - 14 1 12 -25 625 -25 625
 32  -20 3300
( N ) (
( 


M = M’ +
= 36,375 = 36,38 (Pembulatan)

SD= =

= = 10,135797 = 10,14 (Pembulatan)

265
Evaluasi Pembelajaran

Dalam menggunakan prosedur dan rumus-


rumus statistik dapat diketahui bahwa :
M = 36,38
SD = 10,14
M + ( 1,5 SD ) = 36,38 + ( 1,5 x 10,14 = 51,59 = 52
( Skor )
M + ( 0,5 SD ) = 36,38 + ( 0,5 x 10,14 = 41,45 =
41 “
M – ( 0,5 SD ) = 36,38 – ( 0,5 x 10,14 = 31,31 =
31 “
M – ( 1,5 SD ) = 36,38 – (1,5 x 10,14 = 21,17 = 21

( 5 ) Konversinya :
52 ke atas = A = 4
41 – 51 = B = 3
31 – 40 = C = 2
21 – 30 = D = 1
21 ke bawah = E = 0 = TL
Dengan menggunakan Pedoman Konversi
ini, maka anak yang mencapai Skor 46,
Nilainya adalah : B ( karena 46 termasuk ke
dalam Konversi antara 41 – 51 ).
2. Norma Relatif Skala Sembilan
Adapun langkah yang ditempuh untuk
menkonversikan Skor menjadi Nilai dengan Norma
Relatif Skala Sembilan adalah sebagai berikut:

266
Evaluasi Pembelajaran

• Mencari angka rata-rata ( M )


• Mencari Standar Deviasi ( SD )
• Menggunakan Pedoman Konversi 1 – 9.
Pedoman Konversi pada Norma Relatif Skala
Sembilan adalah sebagai berikut :
M + ( 1,75 SD ) ke atas = 9
M + ( 1,25 SD ) ke atas = 8
M + ( 0,75 SD ) ke atas = 7
M + ( 0,25 SD ) ke atas = 6
M – ( 0,25 SD ) ke atas = 5
M – ( 0,75 SD ) ke atas = 4
M – ( 1,25 SD ) ke atas = 3
M – ( 1,75 SD ) ke atas = 2
M – ( 1,75 SD ) ke atas = 1
• Perhitungan
Contoh :
Misalkan data seperti contoh di atas ( lihat
halaman 27 ) yaitu Hasil Belajar PKn yang
diberikan kepada 32 orang siswa, dimana
dapat diketahui : M = 36,38 dan SD = 10,14.
Dengan demikian dapat dihitung sebagai
berikut :
36,38 + ( 1,75 x 10,14 ) = 54,125 dibulatkan =
54
36,38 + ( 1,25 x 10,14 ) = 49,055 dibulatkan =
49

267
Evaluasi Pembelajaran

36,38 + ( 0,75 x 10,14 ) = 43,985 dibulatkan =


44
36,38 + ( 0,25 x 10,14 ) = 38,915 dibulatkan =
39
36,38 + ( 0,25 x 10,14 ) = 33,845 dibulatkan =
34
36,38 + ( 0,75 x 10,14 ) = 28,775 dibulatkan =
29
36,38 + ( 1,25 x 10,14 ) = 23,705 dibulatkan =
24
36,38 + ( 1,75 x 10,14 ) = 18,635 dibulatkan =
19
• Konversinya
54 ke atas = 9
49 – 53 = 8
44 – 48 = 7
39 – 43 = 6
34 – 38 = 5
29 – 33 = 4
24 – 28 = 3
19 ke bawah = 1
3. Norma Relatif Skala Sebelas
Adapun langkah yang ditempuh untuk
mengkonversikan Skor menjadi Nilai dengan Norma
Relatif Skala Sebelas adalah sebagai berikut :

268
Evaluasi Pembelajaran

• Mencari angka rata-rata atau Mean (M)


• Mencari Standar Deviasi (SD)
• Menggunakan Pedoman Konversi 0 – 10
Pedoman Konversi pada Norma Relatif Skala
Sebelas adalah sebagai berikut :
M + ( 2,25 SD ) ke atas = 10
M + ( 1,75 SD ) ke atas = 9
M + ( 1,25 SD ) ke atas = 8
M + ( 0,75 SD ) ke atas = 7
M + ( 0,25 SD ) ke atas = 6
M – ( 0,25 SD ) ke atas = 5
M – ( 0,75 SD ) ke atas = 4
M – ( 1,25 SD ) ke atas = 3
M – ( 1,75 SD ) ke atas = 2
M – ( 2,25 SD ) ke atas = 1
• Perhitungan :
Contoh :
Misalkan data seperti contoh di atas ( lihat
halaman 27 ), yaitu Hasil Belajar PKn yang
diberikan kepada 32 orang siswa, dimana
dapat diketahui : M = 36,38 dan SD = 10,14
dengan demikian dapat dihitung sebagai
berikut :
36,38 + ( 2,25 x 10,14 ) = 59,195 dibulatkan =
59
36,38 + ( 1,75 x 10,14 ) = 54,125 dibulatkan =

269
Evaluasi Pembelajaran

54
36,38 + ( 1,25 x 10,14 ) = 49,055 dibulatkan =
49
36,38 + ( 0,75 x 10,14 ) = 43,985 dibulatkan =
44
36,38 + ( 0,25 x 10,14 ) = 38,915 dibulatkan =
39
36,38 + ( 0,25 x 10,14 ) = 33,845 dibulatkan =
34
36,38 + ( 0,75 x 10,14 ) = 28,775 dibulatkan =
29
36,38 + ( 1,25 x 10,14 ) = 23,705 dibulatkan =
24
36,38 + ( 1,75 x 10,14 ) = 18,635 dibulatkan =
19
36,38 + ( 2,25 x 10,14 ) = 13,565 dibulatkan =
14
• Konversinya :
59 ke atas = 10
54 – 58 = 9
49 – 53 = 8
44 – 48 = 7
39 – 43 = 6
34 – 38 = 5
29 – 33 = 4
24 – 28 = 3

270
29 – 33 = 4
24 – 28 = 3 Evaluasi Pembelajaran
14 – 18
14 – 18 =
= 22
14 ke bawah = 1 =
14 ke bawah 1
4. Norma Relatif Skala Seratus
4. Norma
UntukRelatif Skala Seratus
mengkonversikan Skor menjadi Nilai dengan
Norma
Untuk mengkonversikan Skor( Persentil
Relatif Skala Seratus ) digunakan
menjadi Nilai dengan Norma Rela
rumus sebagai berikut :
Persentil ) digunakan rumus sebagai berikut :

P=
Keterangan :
Keterangan :
P = Persentil
P = Persentil
cfb = cumulatif frekuensi below, yaitu jumlah frekuensi yang menda
cfb = cumulatif frekuensi below, yaitu jumlah
Skor yang
frekuensi akan
yang dicari persentilnya.
mendapat Skor di bawah Skor yang
akan dicari persentilnya.
N = Jumlah subjek
N = Jumlah subjek
Contoh :
Misalkan data seperti contoh di atas ( lihat halaman
27 ): yaitu Hasil Belajar PKn yang diberikan kepada
32 orang siswa. Maka persentil bagi siswa yang
memperoleh Skor 46 dapat dicari sebagai berikut :
• Susunlah Skor mulai dari yang terbesar sampai
dengan yang terkecil, seperti tercantum
dalam halaman 28 ( TABEL DISTRIBUSI
FREKUENSI TUNGGAL HASIL BELAJAR PKn).
• Ternyata jumlah frekuensi yang mendapat
skor dibawah Skor 46 ada 26 ( dua puluh
enam ). Sedangkan jumlah frekuensi yang
mendapat Skor sama dengan Skor 46 ada 1
271
tercantum
diberikan kepada 32dalam halaman
orang siswa. 28persentil
Maka ( TABEL bagiDISTRIBUSI FREKUEN
siswa yang memperoleh S
HASIL
dapat dicari BELAJAR
sebagai berikut : PKn).
x Susunlah
xEvaluasi Ternyata Skor mulaifrekuensi
jumlah
Pembelajaran dari yang terbesar
yang sampai
mendapat dengan
skor yangSkor
dibawah terkecil,
46 ad
tercantum
enam ).(dalam
satu ).halaman
SedangkanAdapun 28jumlah
jumlah ( frekuensi
TABEL DISTRIBUSI
subjek
yang ) ada FREKUENSI
32 (Skor samaTUN
( Nmendapat den
tiga puluh
HASIL BELAJAR dua ).
PKn).
1 ( satu ). Adapun jumlah subjek ( N ) ada 32 ( tiga puluh dua ).
x Jadi Nilai
Ternyata siswa
jumlah yang memperoleh
frekuensi yang mendapatSkor 46 :
skor dibawah Skor 46 ada 26 ( dua
Jadi Nilai siswa yang memperoleh Skor 46 :
enam ). Sedangkan jumlah frekuensi yang mendapat Skor sama dengan Skor
1 ( satu ). Adapun jumlah subjek ( N ) ada 32 ( tiga puluh dua ).
P=
Jadi Nilai siswa yang memperoleh Skor 46 :

P= = = 83 (Pembulatan)

5. Norma Relatif Skala Z Skor


5. Norma
= Relatif Skala Z Skor = 83 (Pembulatan)
Rumus Z Skor Norma Relatif sama saja dengan
Rumus
rumus ZZ Skor Skor Norma
NormaRelatif sama Yang
Absolut. saja dengan
berbeda rumus Z Skor
5.Yang
Norma hanyalah dalam
Relatif Skala
berbeda Zmencari
hanyalahSkordalamMmencari
dan SD nya.
M danKalau
SDdalam
nya. Kalau dalam
rumus Z Skor Norma Absolut, M dan
Rumus Z Skor Norma Relatif sama saja dengan rumus SD nya dicari
Z Skor Norma A
Normaberdasarkan
Absolut, M Skor
dan SD nya dicari
Maksimal berdasarkan
Ideal Skortes
dari sesuatu Maksimal Ideal
Yang berbeda hanyalah dalam mencari M dan SD nya. Kalau dalam rumus Z
; sedangkan
sedangkan dalam dalam
rumus rumus
Z SkorZ Skor
NormaNorma Relatif,
Relatif, M danM SD nya dic
Norma Absolut,
dan SD M nyadan SD nya
dicari dicari berdasarkan
berdasarkan SkorSkor
distribusi Maksimal
yangIdeal dari sesua
distribusi Skor yang
riil dicapai olehriil dicapai
para oleh paratersebut.
pengikut pengikut tes tersebut.
sedangkan dalam rumus Z Skor Norma tesRelatif, M dan SD nya dicari berda
distribusiContoh : riil dicapai oleh para pengikut tes tersebut.
Skor yang
Contoh :
Misalkan saja distribusi Skor yang dicapai oleh para
siswa
Misalkan
Contoh : pengikut tesSkor
saja distribusi sama dengan
yang contoh
dicapai di atas,
oleh para siswa pengikut t
dimana M = 36,38 dan SD nya = 10,14. maka Z Skor
contohuntuk
Misalkan di
sajaatas, dimana
yangMmendapat
distribusi
siswa = 36,38
Skor yang dan
dicapai SD46
oleh
Skor nya
para =siswa
dapat10,14. maka tes
pengikut
dicari Z Skor
sama u
contoh di atas,
sebagai
mendapat dimana
Skor M := 36,38
berikut
46 dapat dicaridan SD nya
sebagai = 10,14.
berikut : maka Z Skor untuk sisw
mendapat Skor 46 dapat dicari sebagai berikut :

Z= (Pembulatan)
Z= (Pembulatan)

(Wayan Nurkancana dan PPN. Sunartana, 1983 :


93)
272
Evaluasi Pembelajaran

6. Norma Relatif Skala T Skor


Rumus
(Wayan Nurkancana dan T Skor
PPN. untuk
Sunartana, 1983 Norma
Relatif juga sama
: 93)
dengan rumus T Skor untuk Norma Absolut. Jadi
yang berbeda hanyalah dalam mencari M dan SD
6. saja.Skala T Skor
Norma Relatif
Contoh
Rumus :
T Skor untuk Norma Relatif juga sama dengan rumus T Skor untuk
Norma Absolut. Jadi yang berbeda hanyalah dalam mencari M dan SD saja.
Misalkan pula bahwa distribusi Skor yang dicapai
Contoh :
oleh para siswa pengikut tes sama dengan contoh
Misalkan pula bahwa distribusi Skor yang dicapai oleh para siswa pengikut tes sama
di atas, maka T Skor untuk siswa yang mencapai
dengan contoh di atas,
Skor 46maka T Skor
adalah untuk siswa
sebagai yang mencapai
berikut : Skor 46 adalah sebagai
berikut :

T = 50 + x 10

= 50 + x 10 = 50 + x 10 =

= 50 + = 50 + 9,4871795 = 59,4871795 = 59,48 = 59


Contoh : KEGUNAAN Z SKOR DALAM MENENTUKAN KEJUARAAN
( Menentukan prestasi / Kejuaraan seseorang apabila kebetulan jumlah Skornya
sama ).
TABEL SKOR UNTUK 3 MATA PELAJARAN DARI 2 ORANG SISWA
Mata Pelajaran Bahasa Matematika IPS Jumlah
Nama Indonesia
Nurul Huda 65 55 70 190
Salamun 70 60 60 190

Pengolahan Skor menjadi Z Skor ini sering kali dirasakan perlunya, karena dengan
Pengolahan Skor menjadi Z Skor ini sering kali
hanya melihat Skor saja kita belum dapat memberikan tafsiran yang baik dan tepat. Atau
dirasakan perlunya, karena dengan hanya melihat
dengan kata lain,
Skordengan hanyabelum
saja kita mengetahui Skormemberikan
dapat saja dapat menimbulkan tafsiran
tafsiran yangyang
salah mengenai kecakapan
baik seseorang.
dan tepat. Atau dengan kata lain, dengan hanya
Misalkan kita lihat
mengetahui Skor Hasil Tes dari
sajaseorang
dapatanak bernama Nurul tafsiran
menimbulkan Huda sebagai
berikut :
273
Evaluasi Pembelajaran

yang salah mengenai kecakapan seseorang.


Misalkan kita lihat Hasil Tes dari seorang anak
bernama Nurul Huda sebagai berikut :
Bahasa Indonesia = 65
Matematika = 55
IPS = 70
Dengan melihat sepintas lalu Hasil Tes itu, mungkin
dengan cepat kita mempunyai kesan bahwa Nurul
Huda cukup dalam Bahasa Indonesia, kurang dalam
Bahasa Matematika,
Indonesia = 65 dan cukup baik dalam IPS. Apakah
Matematika
kesan kita = 55terhadap ikepandaian Nurul Huda itu
IPS benar?. Ini sukar untuk menjawabnya, jika kita tidak
= 70
mengetahui data lain yang berhubungan dengan
Denganpenilaian, seperti
melihat sepintas bagaimana
lalu Hasil Skor
Tes itu, mungkin yang
dengan cepatdiperoleh
kita mempunyai
kesan bahwa teman-teman
Nurul Huda cukup dalam sekelasnya, berapa
Bahasa Indonesia, kurangbesarnya Nilaidan
dalam Matematika,
rata-rata
cukup baik dalam (Mean)
IPS. Apakah kesantiap
kita mata
terhadappelajaran
ikepandaianitu dari
Nurul seluruh
Huda itu benar?.
murid
Ini sukar untuk yang diatas,
menjawabnya, jika kitadan
tidaksebagainya.
mengetahui data lain yang berhubungan
dengan penilaian,
Untuk sepertidapat
bagaimanalebih
Skor yang diperoleh teman-teman
mengetahui sekelasnya,
bagaimana
berapa besarnya Nilai rata-rata Nurul
kecakapan (Mean) tiap mata pelajaran
Huda itu itu dari seluruh murid
sebenarnya jikayang
dibandingkan
diatas, dan sebagainya. dengan teman-temannya sekelas,
kita perlu
Untuk dapat memngeahui
lebih mengetahui besarnya
bagaimana kecakapan Mean danitu
Nurul Huda standar
sebenarnya
Deviasi
jika dibandingkan dariteman-temannya
dengan tiap mata pelajaran
sekelas, kitaitu.
perlu memngeahui besarnya
Mean dan standar Deviasi dari tiap mata pelajaran itu.
Misalkan, sekarang kita ketahui bahwa :
Mata Pelajaran Mean Standar Deviasi
Bahasa Indonesia 60 4
Matematika 45 4
IPS 75 5

Dengan membandingkan Skor yang dicapai Nurul Huda itu dengan Meannya,
sepintas lalu kita telah melihat bahwa Nurul Huda bukan sangat pandai dalam IPS, malah
ia lebih
274baik dalam Matematika dan Bahasa Indonesia jika dibandingkan dengan rata-rata
kelas / teman-temannya.
Dengan demikian tafsiran kita yang terdahulu ternyata tidak benar atau tidak tepat.
Evaluasi Pembelajaran

Dengan membandingkan Skor yang dicapai Nurul


Huda itu dengan Meannya, sepintas lalu kita telah
melihat bahwa Nurul Huda bukan sangat pandai
dalam IPS, malah ia lebih baik dalam Matematika
dan Bahasa Indonesia jika dibandingkan dengan
rata-rata kelas / teman-temannya.
Dengan demikian tafsiran kita yang terdahulu
ternyata tidak benar atau tidak tepat. Untuk dapat
mengetahui bagaimana kedudukan Nurul Huda yang
sebenarnya di dalam kelompok teman-teman itu,
maka disamping Mean perlu pula kita mengetahui
Standar Deviasi dari tiap mata pelajaran itu.
Dengan mempergunakan Mean dan Standar Deviasi
itulah kita dapat menjabarkan atau mengubah Skor-
skor yang diperoleh Nurul Huda itu menjadi Z Skor.

Rumusnya : Z =
Rumusnya
Dengan
Dengan : Z = rumus
menggunakan
menggunakan rumus tersebut
tersebut di atas
atas kita
kita dapat me
dapatDengan
mengubah Skor yang dicapai Nurul Huda tadi
dicapai Nurul Huda menggunakan
tadi ke dalam Zrumus tersebutberikut
Skor, sebagai di atas: kita dapa
ke dalam Z Skor, sebagai berikut :
dicapai Nurul Huda tadi ke dalam Z Skor, sebagai berikut :
Bahasa Indonesia =
Bahasa Indonesia =
Matematika =
Matematika =
IPS =
IPS
Melihat hasil Z Skor =tersebut di atas kita dapat mengatakan b
Melihat
Huda kurang pandaihasil Z Skor
dalam tersebut di atas
IPS dibandingkan kita teman-teman
dengan dapat mengata
se
lebih Huda
pandaikurang
dalam pandai dalamdan
Matematika IPSBahasa
dibandingkan dengan teman-tem
Indonesia.
275
lebih pandai dalam
Di samping Matematika
itu, Z Skor tersebutdan
di Bahasa Indonesia.
atas sering pula dipergunaka
Di dengan
prestasi anak sampinganak
itu,yang
Z Skor
laintersebut di atas sering
dalam beberapa pula diperg
mata pelajaran :
Evaluasi Pembelajaran

Melihat hasil Z Skor tersebut di atas kita dapat


mengatakan bahwa justru Nurul Huda kurang
pandai dalam IPS dibandingkan dengan teman-
teman sekelasnya, dan jauh lebih pandai dalam
Matematika dan Bahasa Indonesia.
Di samping itu, Z Skor tersebut di atas sering pula
dipergunakan membandingkan prestasi anak
dengan anak yang lain dalam beberapa mata
pelajaran :
Misalkan : Teman Nurul Huda tadi yang bernama
Salamun. Hasil Tes yang dicapai Salamun, sebagai
berikut :
Bahasa Indonesia = 70
Matematika = 60
IPS = 60
PERTANYAAN KITA. Siapa diantara kedua anak
tersebut yang sebenarnya lebih baik prestasinya ?
Nurul Huda atau Salamun ? jika kita hanya melihat
sepintas lalu atau hanya melihat jumlah Skor dari
kedua hasil tes masing-masing, tentu kita akan
mengatakan Nurul Huda sama pandai dengan
Salamun. ( karena jumlah Skor Nurul Huda : 65 +
55 + 70 = 190, dan jumlah Skor Salamun : 70 + 60 +
60 = 190 ). Tetapi kesimpulan kita itu belum tentu
benar.
Dengan menggunakan Z Skor kita dapat mengetahui
siapa sebenarnya lebih baik atau lebih tinggi
prestasinya.
Setelah memperhatikan Z Skor dari Salamun, yaitu
:

276
Evaluasi Pembelajaran

Bahasa Indonesia =
Bahasa Indonesia =

Matematika =
Matematika =

IPS =
IPS =
Maka kita dapat membandingkan jumlah Z Skor, baik dari Nurul Huda maup
Maka kitaMaka dapatkitamembandingkan jumlahjumlah
dapat membandingkan Z Skor,Z Skor, baik d
Salamun.
baik dari Nurul Huda maupun dari Salamun.
Salamun.
PERBANDINGAN JUMLAH Z SKOR

PERBANDINGAN JUMLAH Z S
Z Skor Nurul Huda :
Bahasa Indonesia = +1,25
Z Skor
Matematika Nurul Huda :
= +2,50
IPS = -1
Bahasa Indonesia = +1,25
Jumlah = +2,75
Matematika = +2,50
Z Skor Nurul Huda :
IPS = -1
Bahasa Indonesia = +2,5
Matematika Jumlah
= +3,75 = +2,75
IPS Z Skor Nurul
= -3 Huda :
Jumlah = +3,25
Bahasa Indonesia = +2,5
Matematika
Dengan = +3,75 di atas, dapat diambil
melihat hasil tersebut
kesimpulan bahwa prestasi
IPS melihat = -3 Salamun ternyata lebih
Dengan hasil tersebut di atas, dapat diambil kesimpulan bahwa p
baik daripada Nurul Huda.
Jumlah
Salamun ternyata lebih = +3,25
baik daripada Nurul Huda.
Dengan menggunakan Z Skor, kita bekerja dengan
Dengan menggunakan Z Skor, kita bekerja dengan angka-angka tidak bu
angka-angka tidak bulat dan tanda-tanda plus-
tanda-tanda plus-minus. Maka untuk mempermudahnya, kita dapat memgguna
minus. Maka untuk mempermudahnya, kita dapat
Skor. T Skor dapat dicari
memggunakan denganTcara
T Skor. mengalikan
Skor Z Skor dengan
dapat dicari dengan 10, kemudian di
50. Dengan melihat hasil tersebut di atas, dapat diambil
277
Salamun ternyata lebih baik daripada Nurul Huda.
T = 50 +Dengan xmenggunakan
10 Z Skor, kita bekerja dengan a
Salamun ternyata lebih baik daripada Nurul Huda.
Dengan menggunakan Z Skor, kita bekerja dengan angka-angka
tanda-tanda
Evaluasi plus-minus.
Pembelajaran Maka untuk mempermudahnya, kita dapat m
Skor. cara
T Skor dapat dicari Zdengan
mengalikan Skor cara mengalikan
dengan Z Skor dengan 10, kem
10, kemudian
50. ditambah 50.

T = 50 + x 10

Contoh :
Z Skor Bahasa Indonesia : + 1,25 = T Skor : 62,5
Z Skor IPS :-1 = T Skor : 40

278
Evaluasi Pembelajaran

DAFTAR PUSTAKA

A.M. Affandi & Santosa Murwani. Pengantar Evaluasi


Pendidikan di Sekolah, Bandung: Penerbit
Paramitha, 1983.
Ardhana, Wayan. Beberapa Metode Statistik Untuk
Penelitian Pendidikan. Surabaya : Usaha Nasional,
1982.
Arifin, Zaenal. Evaluasi Instruksional. Prinsip-Teknik-
Prosedur. Bandung : CV. Remadja Karya, 1988.
Arikunto, Suharsimi. 1993. Dasar-dasar Evaluasi Pendidikan.
Jakarta: Bumi Aksara.
Arikunto, Suharsimi. Manajemen Penelitian, Yogyakarta:
Rineka Cipta, 1990.
Ary Donald, Lucy Chaser and Razavich. Introduction to
Research in Education terjemahan Arief Furhan,
“Pengantar Penelitian dalam Pendidikan”,
Surabaya: Usaha Nasional, 1982.
Azwar, Saifudin. Tes Prestasi. Fungsi dan Pengembangan
Pengukuran Prestasi Belajar. Yogyakarta : Liberty,
1987.
Azwar, Saifuddin, MA. Reliabilitas dan Validitas, Yogyakarta:
Liberty, 1986.
Bloom, Benjamin S., et al. (1981). Evaluation to Improve
Learning. New York: McGraw Hill Book Company.

279
Evaluasi Pembelajaran

Bloom, Benjamin.S., dkk., 1991. Handbook on Formative


and Sumative Evaluation of Student Learning. New
York: McGraw Hill
Buchori, M. Teknik-teknik Evaluasi dalam Pendidikan.
Bandung : Jemmars, 1983.
Cronbach, Lee J. Essentials of Psychological Testing, New
York: Harper & Row Publishing, edisi keempat,
1984.
Devies, Ivor K. Pengelolaan Belajar. Penerjemah Sudarsono
Sudirdjo dkk. Jakarta : Rajawali Pers, 1986.
Djaali, dkk. Pengukuran dalam Bidang Pendidikan, Jakarta:
Program Pascasarjana Universitas Negeri Jakarta,
2000.
Faisal, Sanapiah. Menyusun Angket, Surabaya, Usaha
Nasional, 1981.
Farmer, James A. & Papagiannis, George (1975), Program
Evaluation Functional Education for Family Life
Planning, New York: World Education, 1414 Sixth
Avenue, Library of Congress.
Good, Thomas L. Jere E. Brophy, Educational Psychology,
New York: Logman, 1990.
Gronlund, Norman E. Measurement and Evaluation in
Teaching, New York: MacMillan Publishing Co. Inc.,
1976.
Guba, Egon G & Yvonna S. Lincoln. Effective Evaluation,
San Fransisco:
Jossey – Bass Publishers, 1985.
Hadi, Sutrisno, Statistik. Jilid I, II, III, Yogyakarta : Yayasan
Penerbitan Fakultas Psikologi UGM, 1982.

280
Evaluasi Pembelajaran

Hamalik, Oemar. Teknik Pengukuran dan Evaluasi


Pendidikan. Bandung : Mandar Maju, 1989.
Henerson, Marlene E., et al. (1978). How to Measure
Attitudes, London: Sage Publications, Beverly.
McAshan, H.H. (1979). Competency Based Education and
Behavioral Objectives. USA: Educational Technology
Publication.
Mehrens, William A. & Lehmann, Irvin J. (1978), Measurement
and Evaluation in Education and Psychology, New
York: Holt, Rinehart and Winston.
Mouly, George J. (1973). Psychology of Effective Teaching.
New York: Holt, Rinehhart and Winston, Inc.
Mulyasa, E. (2002). Kurikulum Berbasis Kompetensi.
Bandung: PT Remaja Rosda Karya.
Nawawi, Hadari, dkk. Instrumen Penelitian Bidang Sosial,
Yogyakarta: Gajah University Press, 1992.
Noeng Moehadji. Pengukuran Kepribadian, Yogyakarta:
Rake Sarasin, 1992.
Nurkencana, Wayan dan PPN. Sunartana. Evaluasi
Pendidikan. Surabaya : Usaha Nasional, 1983.
Evaluasi Hasil Belajar. Surabaya : Usaha Nasional, 1992.
Pasaribuan, Amudi. Pengantar Statistik. Jakarta : Ghalia
Indonesia, 1983.
Popham, W. James. Modern Educational Measurement,
Englewood Cliff, New Jersey: Prentice Hall Inc.,
1981.
Purwanto, Ngalim. Prinsip-prinsip & Teknik Evaluasi
Pengajaran. Bandung : Remadja Karya, CV, 1984.

281
Evaluasi Pembelajaran

Print, Murray et al. (1999). Civic Education for Civil Society.


London: Asian Academic Press.
Pusat Penilaian Pendidikan.(2003). Penilaian Tingkat Kelas:
Pedoman Bagi Guru SD/MI, SMP/MTs, SMA/MA,
dan SMK. Balitbang, Depdiknas RI.
Rafi’I, Suryatana. Teknik Evaluasi. Bandung : Angkasa,
1985.
Republik Indonesia. Peraturan Pemerintah No. 19 Tahun
2005 tentang Standar Nasional Pendidikan.
Republik Indonesia. Undang-Undang No. 20 Tahun 2003
Tentang Sistem Pendidikan Nasional.
Ringness, Thomas A. (1975). The Affective Domain in
Education. Boston-Toronto: Little, Brown and
Company.
Sevilla, Consuelo G., et al. Pengantar Metode Penelitian,
Jakarta: UI Press, 1993.
Shaver, J.P. 1991. Handbook of Research on Social Studies
Teaching and Learning. New York: Macmillan
Publishing Company.
Slameto. Evaluasi Pendidikan. Jakarta: PT. Bina Aksara,
1988.
Soekamto, Toeti. Instrumen Pengukuran, DPS IKIP Jakarta,
1990.
Stambul, Conny Semiawan. Prinsip-prinsip dan Teknik
Pengukuran dan Penilaian di dalam Dunia Pendidikan.
Jakarta : PT Mutiara Sumber Widya, 1986.
Sudijono, Anas. Pengantar Statistik Pendidikan. Jakarta :
CV. Rajawali, 1987.
Sudjana. Metode Statistika. Bandung : Tarsito, 1986.
282
Evaluasi Pembelajaran

Sudjana, Nana dan Ibrahim. Penelitian dan Penilaian


Pendidikan. Bandung : Sinar Baru, 1989.
Sudjana, Nana. Penilaian Hasil Proses Belajar Mengajar.
Bandung : PT. Remadja Rosdakarya, 1991.
Sudjana, Nana dan Ediyono. Menyusun Karya Tulis Ilmiah.
Untuk memperoleh angka kridit ( petunjuk untuk
guru ). Bandung : Sinar Baru, 1991.
Suparman I. A. Stastik Sosial. Jakarta : CV. Rajawali, 1983.
Suryabrata, Sumadi. Pengembangan Tes Hasil Belajar,
Jakarta: Rajawali Press, 1987.
Sutomo. Teknik Penilaian Pendidikan. Surabaya : PT. Bina
Ilmu, 1985.
Thoha, M. Chatib, MA. Teknik Evaluasi Pendidikan, Jakarta:
PT. Raja Grafindo Persada, 1990.
Throndike & Hagen. Measurement and Evaluatuon in
Psychology and Education, New York: Chichester –
Brisbane – Toronto, John Wiley & Sons, 1977.

283
Evaluasi Pembelajaran

284

Anda mungkin juga menyukai