Buku Penilaian Pembelajaran Evila

Evila Ramadhanty
PENILAIAN PEMBELAJARAN
Penilaian
Pembelajaran
Pedoman Penilaian Praktis bagi Pendidik
Evila Ramadhanty
UNIVERSITAS NEGERI YOGYAKARTA

2017
Penilaian
Pembelajaran
Pedoman Penilaian Praktis bagi Pendidik
Disusun Oleh :
Evila Ramadhanty
(16108244031)
KATA PENGANTAR
Puji syukur kehadirat Allah SWT yang telah

memberikan nikmat dan karunia-Nya di antaranya
berupa kesempatan dan kemampuan untuk
menyelesaikan penulisan buku ini. Buku yang berjudul
“Penilaian Pembelajaran” ini disusun dalam rangka
memenuhi tugas mata kuliah Penilaian Pembelajaran SD
yang diampu oleh Bapak Hieronimus Sujati, M.Pd.
Penyusunan buku ini tidak terlepas dari bantuan
berbagai pihak, untuk itu pada kesempatan ini
disampaikan ucapan terimakasih sebesar-besarnya
kepada yang terhormat:
1. Bapak Hieronimus Sujati, M.Pd selaku dosen mata
kuliah Penilaian Pembelajaran SD
2. Orang tua yang telah memberikan dukungan dan
suport dalam keberhasilan penyusunan buku ini
3. Teman-teman yang telah membantu dalam
penyusunan buku ini
4. Pihak pihak lain yang tidak dapat kami sebutkan
satu per satu.
Meski telah disusun secara maksimal, namun saya
menyadari bahwa buku ini masih jauh dari kata
sempurna. Karenanya penulis mengharapkan kritik dan
saran yang membangun dari pembaca sekalian. Semoga
i
buku ini betul – betul bermanfaat dalam menyiapkan
calon guru SD ataupun Guru SD yang berkualitas.
Demikian yang dapat sampaikan, semoga
pembaca dapat mengambil manfaat dari karya ini dan
dapat menerapkan berbagai teori dan pengembangya di
SD.
Kulonprogo, 30 Desember 2017
Penulis
ii
DAFTAR ISI
KATA PENGANTAR................................................... i
DAFTAR ISI ................................................................... iii
BAB I. Pengukuran (Measurement), Penilaian

(Assessment), Dan Evaluasi (Evaluation) 1
A. Pengukuran (Measurement) .................... 1
B. Penilaian (Assessment) ................................ 5
C. Evaluasi (Evaluation) .................................. 9
BAB II. Macam-Macam Penilaian ......................... 15

A. Macam Penilain ............................................ 15
BAB III. Tujuan, Teknik, dan Alat Penilaian ....... 33

A. Tujuan Penilaian .......................................... 33
B. Teknik Penilaian ........................................... 46
C. Alat/ Instrumen Penilaian .......................... 57
BAB IV. Penilaian Autentik ..................................... 62

A. Definisi Autentik Assessment ..................... 62
B. Karakteristik Penilaian Autentik ............. 69
C. Tujuan dan Prinsip - Prinsip Penilaian
Autentik ......................................................... 73
iii
D. Fitur Penilaian Autentik (Features Of
Authentic Assessment) ................................ 82
E. Cakupan Penilaian Autentik .................. 85
F. Alternatif Penilaian Autentik .................... 92
G. Manfaat Penggunaan Penilaian
Autentik ......................................................... 96
BAB V. Perencanaan Penilaian ............................ 100

A. Pengertian ..................................................... 100
B. Macam - Macam Perencanaan
Penilaian ........................................................ 112
C. Tujuan Perencanaan Penilaian ................ 121
D. Langkah - Langkah Perencanaan
Penilaian ........................................................ 122
E. Standar Perencanaan Penilaian .............. 131
BAB VI. Kontruksi Tes Hasil Belajar Siswa ........... 136

A. Pengertian ..................................................... 136
B. Tujuan, Fungsi, dan Prinsip ........................ 138
C. Hal - Hal yang Harus Diperhatikan........ 143
D. Langkah - Langkah Mengkontruksi
Hasil Tes Belajar Siswa ............................... 149
BAB VII. Analisis Butir Soal ....................................... 154

A. Definisi Analisis Butir Soal .......................... 154
B. Tujuan dan Fungsi Analisis Butir Soal ..... 158
iv
C. Karakteristik Analisis Butir Soal ................ 162
D. Macam - macam Analisis Butir Soal ....... 166
BAB VIII. Pengembangan Instrumen Penilaian

Ranah Afektif ............................................ 194
A. Penjelasan Penilaian Afektif ..................... 194
B. Karakteristik .................................................. 198
C. Konsep ............................................................. 201
D. Tujuan ............................................................. 204
E. Langkah - Langkah Pengembangan
Instrumen Afektif ......................................... 205
BAB IX. Penilaian untuk Kerja (Performance

Assessment) .............................................. 229
A. Pengertian Penilaian Unjuk Kerja
(Performance Assessment) ........................ 229
B. Karakteristik Penilaian Unjuk Kerja
(Performance Assessment) ...................... 230
C. Pengembangan Penilaian Unjuk Kerja . 234
D. Teknik Penilaian Unjuk Kerja................... 237
DAFTAR PUSTAKA .................................................... 245
v
BAB I
PENGUKURAN (MEASUREMENT),
PENILAIAN (ASSESSMENT), DAN
EVALUASI (EVALUATION)
A. PENGUKURAN (MEASUREMENT)
Serriven (David, 2006:2) menyatakan bahwa
pengukuran adalah penentuan besaran kuantitas,
biasanya pada skala uji yang dirujuk kriteria atau skala
numerik kontinu. Dalam konteks tertentu, kita
memperlakukan pengamat sebagai instrumen yang
membutuhkan kalibrasi atau validasi. Pengukuran
adalah komponen evaluasi standar yang umum dan
terkadang besar, namun merupakan bagian yang
sangat kecil dari logikanya, yaitu pembenaran untuk
kesimpulan evaluatif. Selaras dengan pernyataan James
(1990:21), pengukuran adalah proses pengumpulan data
melalui pengamatan empiris yang digunakan untuk
mengumpulkan informasi yang relevan dengan tujuan
yang telah ditentukan. Singkatnya pengukuran adalah
penilaian numerik pada fakta-fakta dari objek yang
hendak diukur menurut kriteria atau satuan-satuan
tertentu (William & Jurs, 1990).
Pengukuran adalah pengamatan dengan
pengumpulan kuantifikasi sistematis dan pengumpulan
informasi. Pengukuran menyiratkan baik proses atau
kuantifikasi dan hasilnya (David Payne, 2003:6).
Pengukuran, Penilaian, dan Evaluasi | 1

Menurut Orindo (1998:2) pengukurandapat didefinisikan
sebagai proses dimana informasi tentang atribut atau
karakteristik benda ditentukan dan dibedakan. Wiersma
dan Jurs (1985) menyebutkan bahwa secara teknis,
pengukuran adalah pengalihan dari angka ke objek
atau peristiwa sesuai dengan aturan yang memberikan
makna angka secara kuantitatif. Guilford (Griffin & Nix,
1991:3) mendefinisikan pengukuran adalah menugaskan
nomor atau mengukur hal-hal ke seperangkat aturan.
Pengukuran lebih kompleks dan skala skor baku
sederhana yang mungkin tidak memadai untuk tugas
intinya (Mislevy, 1996:150). Pengukuran adalah
penentuan besarnya kuantitas, biasanya pada sebuah
kriteria yang direferensikan terus-menerus menguji skala
atau pada skala numerik. Pengukuran adalah
komponen evaluasi standar yang umum dan terkadang
besar, tetapi merupakan bagian kecil dari logika, yaitu
pembenaran untuk kesimpulan evaluatif atau dapat
disebut pula pengukuran merupakan pemanfaatan dari
mengatasi materi ujian atau rangsangan lain atau
pengumpulan dan analisis ahli atau menempuh
penilaian dengan tujuan untuk membuat kesimpulan
dan akhirnya tiba di keputusan berdasarkan prinsip
kesimpulan (David William, 2006:16).
Pengukuran merupakan proses mendapatkan
deskripsi numerik tentang tingkat prosesi seseorang yang
memiliki karakteristik tertentu (jawab pertanyaan
"Berapa banyak") (Yogesh, 2007:11).Pengukuran
diartikan sebagai proses untuk menentukan luas atau
kuantitas sesuatu (Wondt, Edwin and G.W. Brown, 1975:1),
dengan pengertian lain pengukuran adalah suatu usaha
2 | Pengukuran, Penilaian, dan Evaluasi

untuk mengetahui keadaan sesuatu spt adanya yg
dapat dikuantitaskan, hal ini dapat diperoleh dengan
jalan tes atau cara lain (Chabib, 1991:2). Menurut William
A.Mehrens dan Irlin J. Lehmann (1973:4) pengukuran
dapat diperoleh dari observasi, skala penilaian, atau
perangkat lain untuk memperoleh informasi.
Pengertian lain menurut Charles Secolsky dan D.
Brian Denison (2012:18) pengukuran adalah
pemanfaatan respon terhadap item uji atau rangsangan
lainnya dan atau pengumpulan dan analisis penilaian
ahli atau penilaian untuk tujuan membuat kesimpulan
dan akhirnya sampai pada keputusan berdasarkan
kesimpulan tersebut. Sedangkan pendapat Cangelosi
(1995:21) pengukuran adalah proses pengumpulan data
melalui pengamatan empiris yang digunakan untuk
mengumpulkan informasi yang relevan dengan tujuan
yang telah ditentukan.
Menurut Ign. Masidjo (1995:14) pengukuran sifat
suatu objek adalah suatu kegiatan menentukan
kuantitas suatu objek melalui aturan-aturan tertentu
sehingga kuantitas yang diperoleh benar-benar mewakili
sifat dari suatu objek yang dimaksud. Pengukuran juga
dapat didefinisikan sebagai seperangkat aturan untuk
mengubah perilaku menjadi kategori atau angka.
Membangun instrumen untuk mengukur variabel sains
sosial melibatkan beberapa langkah, termasuk
mengkonseptualisasikan perilaku yang secara
operasional menentukan variabel, menyusun item yang
menunjukkan perilaku, mengelola item rancangan
untuk mencoba sampel, menyempurnakan instrumen
berdasarkan analisis item, dan melakukan keandalan

dan studi validitas studi ini diperlukan untuk memastikan
bahwa skor pada instrumen konsisten dan memiliki bukti
yang mewakili konstruksi secara memadai. Dua
pendekatan teoritis mendominasi bidang pengukuran:
teori uji klasik dan teori respon barang (Petrosko,
2005:47).
Menurut Kerlinger (1996:687) pengukuran
adalah membandingkan sesuatu yang diukur dengan
alat ukurnya dan kemudian menerapkan angka
menurut sistem aturan tertentu. Sutrisno Hadi (1997)
menambahkanpengukuran dapat diartikan sebagai
suatu tindakan untuk mengidentifikasikan besar-
kecilnya gejala. Sementara menurut Remmers dkk
(1960) menyatakan bahwa pengukuran merupakan
suatu kegiatan atau proses untuk menetapkan luas,
dimensi, dan kualitas dari sesuatu dengan pasti dengan
cara membandingkannya terhadap ukuran tertentu.
Thorndike dan Hagen (1996:25) mendefinisikan
pengukuran sebagai "proses kuantifikasi pengamatan
(atau deskripsi) tentang kualitas atau atribut dari
sesuatu pribadi." Mark D. Shermis & Francis J DI Vesta
(1953:2) mengatakan bahwa asesmen (penilaian)
merupakan (a) prosedur yang ditetapkan, desain untuk
memberikan informasi tentang pertumbuhan dan
prestasi pengembangan siswa, dibandingkan dengan
standar.Griffin & Nix (1991:3), The Task Group Asessment
and Testing (TGAT) mendiskripsikan asesmen sebagai
semua cara yang digunakan untuk menilai unjuk kerja
individu atau kelompok. Penilaian adalah suatu
tindakan untuk memberikan interpretasi terhadap hasil
pengukuran dengan menggunakan norma-norma

tertentu untuk mengetahui tinggi-rendahnya atau baik
buruknya aspek tertentu (Sugihartono, 2013:130).
Jadi kesimpulannya suatu proses atau kegiatan
yang dilakukan secara sistematis untuk mendapatkan
informasi yang berupa data numerik berdasar skala uji
dengan tujuan yang telah ditentukan.
Contohnya seorang guru memberikan 10 soal
kepada siswanya. Ternyata siswanya mampu menjawab
8 dari 10 soal tersebut dengan benar. Sehingga anak
tersebut mendapat skor sebesar 8.
B. PENILAIAN (ASSESSMENT)
English and H.B English (1958) mendefinisikan
penilaian sebagai "metode untuk mengevaluasi
kepribadian di mana seseorang yang tinggal dalam
kelompok di bawah kondisi fisik dan sosial yang sebagian
terkontrol, bertemu dan memecahkan berbagai masalah
yang berkaitan dengan kehidupan, termasuk masalah
jiwa, dan yang diamati dan dinilai.Menurut Mark Shermis
(1953:2), penilaian adalah (a) sebuah pengaturan
prosedur (b) dirancang untuk menyatakan informasi
tentang perkembangan, pertumbuhan dan prestasi
siswa. Sedangkan menurut Bill Hiutt dkk (2001:11),
penilaian mengacu pada pengumpulan data untuk
menggambarkan atau lebih memahami suatu masalah,
pengukuran adalah proses kuantifikasi data penilaian.
Lebih lengkapnya Erwin (1991:20) menjabarkan bahwa
penilaian adalah dasar sistematis untuk membuat
kesimpulan tentang pembelajaran dan pengembangan
siswa. Ini adalah proses mendefinisikan, memilih,
merancang, mengumpulkan, menganalisa, menafsirkan,

dan menggunakan informasi untuk meningkatkan
pembelajaran dan pengembangan siswa.
Penilaian adalah suatu proses untuk
memperoleh informasi yang digunakan untuk membuat
keputusan tentang peserta didik, kurikulum, program,
dan kebijakan pendidikan (Anthony J. Nitko, 1996:4).
Hampir sama dengan perndapat sebelumya, Stark &
Thomas (1994:46) berpendapat bahwa penilaian
didefinisikan proses memberikan informasi tentang siswa
perorangan, tentang kurikulum dan program, tentang
institusi, atau keseluruhan sistem institusi.Penilaian sering
digunakan sebagai sinonim untuk evaluasi di mana
penilaian (biasanya dikaitkan dengan evaluasi)
dibangun ke dalam konteks hasil numerik. Skor baku
pada tes yang tidak diketahui isi atau validitas konstruk
tidak akan dinilai; Hanya ketika ujian itu misalnya
kompetensi matematis dasar yang melaporkan hasil
merupakan penilaian dalam arti yang tepat, dan tentu
saja penilaian validitas adalah komponen evaluatif
utama dalam hal ini. Bagian lain dari gerakan penilaian,
yang sangat didukung di sekolah dan akademi, adalah
beralihnya dari pengujian kertas dan pensil ke sesuatu
yang lebih menghakimi dan global (Serriven, 1991:60).
Dalam buku Classroom Assesment in Action
definisi penilaian (lihat misalnya, Atkin, Black, & Coffey,
2001; Popham, 2008, Stiggins & Chappuis, 2006) yang
diperluas ke definisi penilaian kelas yang menyediakan
kerangka kerja untuk pengajaran, disebutkan bahwa
penilaian, adalah (a) seperangkat prosedur, (b)
dirancang untuk memberikan informasi tentang
perkembangan, pertumbuhan, dan prestasi siswa, (c) jika

dibandingkan dengan standar. Penilaian adalah
berpusat pada siswa karena pembelajaran dimulai
dengan apa yang guru bawa ke situasi belajar. Mereka
mengidentifikasi apa yang mereka ketahui dan apa
yang perlu mereka ketahui melalui negosiasi kelompok.
Mereka memutuskan sumber daya apa yang akan
mereka gunakan dan bagaimana memperoleh informasi
yang diperlukan. Mereka mengajukan solusi atas isu-isu
yang mereka identifikasi dan mengajukan lebih banyak
pertanyaan dan masalah. Penilaian ini memungkinkan
lebih banyak pilihan dan konstruksi siswa dalam
menentukan apa yang disajikan sebagai bukti
pembelajaran. Dengan kata lain, penilaian bergerak dari
"guru terstruktur" menjadi "siswa terstruktur" (Mueller,
2003:54).
Penilaian adalah proses mengumpulkan dan
mendiskusikan informasi dari berbagai sumber dan
beragam untuk mengembangkan pemahaman
mendalam tentang apa yang siswa ketahui, pahami, dan
dapat lakukan dengan pengetahuan mereka sebagai
hasil dari penelitian mereka. pengalaman pendidikan;
Prosesnya berujung pada saat hasil penilaian digunakan
untuk memperbaiki pembelajaran selanjutnya (E.Huba
and Freed, 2000:94). T. Dary Erwin (1991:20)
berpendapat bahwa penilaian adalah dasar sistematis
untuk membuat kesimpulan tentang pembelajaran dan
pengembangan siswa. Ini adalah proses mendefinisikan,
memilih, merancang, mengumpulkan, menganalisa,
menafsirkan, dan menggunakan informasi untuk
meningkatkan pembelajaran dan pengembangan siswa.
Pernyataan tersebut kemudian diperkuat pendapat dari

Catherine dkk, (1999:46) bahwa penilaian adalah
pengumpulan, peninjauan, dan penggunaan sistematis
tentang program pendidikan yang dilakukan untuk
meningkatkan pembelajaran dan pengembangan siswa.
Penilaian melibatkan penggunaan data empiris pada
pembelajaran siswa untuk memperbaiki program dan
memperbaiki pembelajaran siswa (Allen, 2004).
Menurut Shermis dan Francis (2011:2) penilaian
adalah seperangkat prosedur atau langkah-langkah
yang dibuat untuk menyediakan informasi tentang
perkembangan, pertumbuhan, dan prestasi siswa
dibandingkan dengan suatu standar pengukuran
tertentu.Penilaian adalah proses mengumpulkan
informasi tentang siswa dan kelas untuk maksud-
maksud pengambilan keputusan instruksional (Richard I.
Arends, 2008: 217). Sejalan dengan NSW Departement of
Education (Arthur, 1996:324) penilaian adalah proses
mengumpulkan fakta-fakta dan membuat keputusan
tentang kebutuhan siswa, kekuatan, kemampuan, dan
kemajuannya.
Griffin & Nix (1991:3), The Task Group Asessment
and Testing (TGAT) mendiskripsikan asesmen sebagai
semua cara yang digunakan untuk menilai unjuk kerja
individu atau kelompok. Menurut Sugihartono dkk
(2013:130) penilaian merupakan suatu tindakan untuk
memberikan interpretasi terhadap hasil pengukuran
dengan menggunakan norma/pedoman tertentu untuk
menentukan tinggi-rendahnya atau baik-buruknya
aspek tertentu. Angelo dan Croos (Abidin, 2014),
memperjelas dengan pernyataan bahwa penilaian
merupakan sebuah proses yang didesain untuk

membantu guru menemukan hal-hal yang telah
dipelajari siswa di dalam kelas dan tingkat
keberhasilannya dalam pembelajaran.
Jadi kesimpulannya, penilaian adalah sebuah

prosedur yang digunakan untuk mengumpulkan
informasi baik berupa data yang bersifat kuantitatif
maupun kualitatif sehingga dapat diketahui sejauh
mana pemahaman suatu masalah.
Contohnya, seorang siswa mengerjakan soal
posttest. Siswa tersebut mampu mengerjakan kelima soal
yang diberikan guru secara benar. Sehingga siswa
tersebut mendapat nilai 100. Artinya siswa tersebut telah
menguasai materi yang disampaikan oleh guru.
C. EVALUASI (EVALUATION)
Menurut Bill Huitt dkk (2001:11) evaluasi
mengacu pada perbandingan data dengan standar
untuk menilai nilai atau kualitas. Evaluasi adalah proses
keberlanjutan tentang pengumpulan dan penafsiran
informasi untuk menilai (assess) keputusan-keputusan
yang dibuat dalam merancang suatu system pengajaran
(Oemar Hamalik, 2002:210).
Menurut Anne Anastasi (Chabib, 1991:1) Evaluasi
sebagai "proses sistematis untuk menentukan sejauh
mana tujuan instruksional dicapai oleh murid”.
Stufflebeam dan Shinkfield (1985:159) evaluasi adalah
proses penggambaran, memperoleh, dan memberikan
informasi deskriptif dan menghakimi tentang nilai dan
manfaat dari beberapa tujuan, rancangan, pembuatan,
melayani kebutuhan akan akuntabilitas, dan

mendorong pemahaman fenomena yang terlibat.
Evaluasi adalah suatu proses untuk
menggambarkan evaluan (orang yang dievaluasi) dan
menimbang makna dan nilainya Guba dan Lincoln
(1985:35). Menurut Sax (1980:18) evaluasi adalah suatu
proses dimana pertimbangan atau keputusan suatu nilai
dibuat dari berbagai pengamatan, latar belakang serta
pelatihan dari evaluator. Kata kunci dari istilah 'evaluasi'
mengacu pada proses penentuan nilai, nilai, atau nilai
sesuatu, atau produk dari proses itu. Istilah yang
digunakan untuk merujuk pada proses ini atau sebagian
darinya meliputi: menilai, menganalisis, menilai,
mengkritik, memeriksa, menilai, memeriksa, menilai,
menilai, menilai, meninjau, mempelajari, menguji,
mengukur. Proses evaluasi biasanya melibatkan
beberapa identifikasi standar kelayakan, nilai, atau nilai
yang relevan; beberapa penyelidikan terhadap kinerja
evaluasi terhadap standar ini; dan beberapa integrasi
atau sintesis hasil untuk mencapai evaluasi keseluruhan.
Ini kontras dengan proses pengukuran, yang juga
melibatkan perbandingan pengamatan terhadap
standar, dalam hal itu (i) pengukuran secara khas tidak
berkaitan dengan prestasi, hanya dengan sifat 'deskriptif
murni dan (ii) sifat-sifat tersebut bersifat unidimensional,
yang menghindari kebutuhan untuk langkah integrasi.
Proses integrasi terkadang menghakimi, terkadang
akibat perhitungan kompleks, sangat umum hibrida
keduanya. Singkatnya (evaluasi) adalah sine qua non
pemikiran cerdas dan tindakan, dan khususnya praktik
profesional (Seriven, 1991:266).
Beberapa definisi evaluasi mempunyai acuan

dalamthe Encyclopedia of Evaluation Mathison (2005),
Fournier (2005, p.140) menjelaskan definisi evaluasi
secara umum: Evaluasi adalah proses penyelidikan
terapan untuk mengumpulkan bukti yang berpuncak
pada kesimpulan tentang keadaan, nilai, manfaat, nilai,
kepentingan, atau kualitas program, produk, orang,
kebijakan, proposal, atau rencana. Kesimpulan yang
dibuat dalam evaluasi mencakup aspek empiris (ada
sesuatu yang terjadi) dan aspek normative (penilaian
tentang nilai sesuatu). Ini adalah nilai murni yang
membedakan evaluasi dari jenis penyelidikan lainnya,
seperti penelitian sains dasar, epidemologi klinis,
jurnalisme investigative, atau polling public.
Dalam Standar Evaluasi Program Edisi ke-2
(Joint Committee, 1994:3) mendefinisikan evaluasi
sebagai sebuah penyelidikan sistematis tentang nilai atau
kelebihan suatu objek. Disini, ‘objek’ mengacu pada
program yang sedang ditinjau. Menurut David (2003:6)
evaluasi menggambarkan proses umum untuk membuat
keputusan. Stufflebeam dan Shinkfield mengutip The
Joint Committee's (1994) mendefinisikan bahwa evaluasi
adalah penilaian sistematis terhadap nilai atau kelebihan
suatu objek. Sedangkan evaluasi pendidikan adalah
proses membuat penilaian tentang prestasi, nilai, atau
nilai program pendidikan (Gall, Gall and Borg 2007:559).
Dalam buku The Program Evaluation
Standards yang ditulis oleh Donald B. Yarbrough dkk.
juga mengutip Joint Committee on Standards for
Educational Evaluation (JCSEE, 1994) bahwa definisi
evaluasi sebagai "penyelidikan sistematis nilai atau
manfaat dari sebuah objek". Evaluasi adalah proses

penyelidikan terapan untuk mengumpulkan dan
mensintesis bukti yang berpuncak pada kesimpulan
tentang keadaan, nilai, manfaat, nilai, kepentingan,
atau kualitas program, produk, orang, kebijakan,
proposal, atau rencana. Kesimpulan yang dibuat dalam
evaluasi mencakup aspek empiris (ada sesuatu yang
terjadi) dan aspek normatif (penilaian tentang nilai
sesuatu). Ini adalah fitur nilai yang membedakan
evaluasi dari jenis penyelidikan lainnya, seperti penelitian
sains dasar, epidemiologi klinis, jurnalisme investigatif,
atau polling publik (Fournier, 2005:139).
Ending Purwanti (2008:6) Berpendapat bahwa
evaluasi adalah proses pemberian makna atau
penetapan kualitas hasil pengukuran dengan cara
membandingkan angka hasil pengukuran tersebut
dengan kriteria tertentu. Encyclopedia of Evaluation
(Mathison, 2005), evaluasi adalah suatu penerapan
proses menyelidiki untuk mengumpulkan dan mensintesis
yang berpuncak pada kesimpulan tentang keadaan,
nilai, manfaat, kepentingan, atau kualitas suatu
program, produk, orang, kebijakan, proposal, atau
rencana. Menurut Mehrens & Lehmann (1978:5) evaluasi
adalah suatu proses merencanakan, memperoleh, dan
menyediakan informasi yang sangat diperlukan untuk
membuat alternatif-alternatif keputusan.
Menurut Stufflebeam dalam Worthen Dan
Sanders (1979:129) dalam evaluasi ada beberapa unsur
yang terdapat dalam evaluasi yaitu: adanya sebuah
proses (process) perolehan (obtaining), penggambaran
(delineating), penyediaan (providing) informasi yang
berguna (useful information) dan alternatif keputusan.

Evaluasi telah didefinisikan oleh Stuff Lebeam dkk (1971)
sebagai "proses penggambaran, perolehan, dan
pemberian informasi yang berguna untuk menilai
alternatif keputusan." Evaluasi adalah penyelidikan
sistematis terhadap manfaat atau nilai dari suatu objek
untuk tujuan mengurangi ketidakpastian dalam
pengambilan keputusan objek itu (Mertens, 1998:26).
Mengevaluasi didefinisikan sebagai membuat
keputusan berdasarkan kriteria dan standar (Bloom,
2017:125). Arikunto (2005:129) berpendapat bahwa
evaluasi adalah proses penggambaran, pencarian, dan
pemberian informasi yang sangat bermanfaat bagi
pengambilan keputusan dalam menentukan alternatif
keputusan. Evaluasi adalah salah satu rangkaian
kegiatan dalam meningkatkan kualitas, kinerja atau
produktivias suatu lembaga dalam melaksanakan
programnya (Rasyid dan Mansur, 2009).
Headley and Mitchel (1995) mendefinisikan
evaluasi sebagai penelitian terapan yang dilakukan
keluar untuk membuat atau mendukung mengenai satu
atau lebih program layanan. M.Q. Patton (2008)
mengatakan bahwa evaluasi dapat digunakan untuk
mengurangi ketidakpastian mengenai keputusan yang
ada yang harus dilakukan, namun banyak faktor lain
yang mempengaruhi keputusan program seperti
ketersediaan sumber daya dan iklim politik. Evaluasi
adalah salah satu rangkaian kegiatan dalam
meningkatkan kualitas, kinerja atau produktivias suatu
lembaga dalam melaksanakan program nya (Mardapi,
2004).

Menurut Bill Huitt dkk (2001:11) evaluasi mengacu
pada perbandingan data dengan standar untuk menilai
nilai atau kualitas. Hampir sama dengan pernyataan Bill
Huitt dkk, Oemar Hamalik (2002:210) menyebutkan
bahwa evaluasi adalah proses keberlanjutan tentang
pengumpulan dan penafsiran informasi untuk menilai
(assess) keputusan-keputusan yang dibuat dalam
merancang suatu system pengajaran. Evaluasi juga
dapat diartikan sebagai proses sistematis untuk
menentukan sejauh mana tujuan instruksional dicapai
oleh murid (Anne Anastasi, 1978: 6 dalam Toha 1991:1).
Jadi kesimpulannya, evaluasi adalah proses
berkelanjutan dari pengumpulan informasi untuk
membandingkan data dengan standar yang telah
ditentukan agar dapat ditentukan sebuah keputusan
yang akan dilaksanakan pada kegiatan selanjutnya.
Contohnya, setelah dilakukan penilaian guru
menemukan lebih dari setengah siswa dalam kelas
mendapatkan nilai dibawah kkm. Untuk itu guru
memutuskan melakukan kegiatan remedial.

BAB II
MACAM-MACAM PENILAIAN
A. MACAM PENILAIAN
Menurut Brookhart dkk dalam buku How to Asses
Higher-Order Thinking Skills in Your Classroom
menjelaskan bahwa terdapat 2 macam penilaian yaitu :
penilaian Formatif dan penilaian Sumatif. Penilaian
formatif menerima umpan balik dalam bentuk
komentar yang memerlukan analisis, evaluasi atau
penciptaan mengenai peikiran itu sendiri. (h. 57).
Penilaian Sumatif adalah penilaian dengan beberapa
pilihan pertanyaan yang dinilai benar atau salah, dan
rubric penilaiannya digunakan untuk pertanyaan esai
dan kinerja. Penilaian sumatif lebih memperhatikan nilai
dari pada komentar umpan balik tertulis atau lisan. (h.
58).
Sedangkan menurut Marzano & Robert J dalam
buku Classroom assessment and grading that work juga
menyebutkan bahwa terdapat dua macam penilaian,
yaitu penilaian formatif dan penilaian sumatif. Penilaian
formatif didefinisikan sebagai suatu pengetahuan yang
sedang terjadi atau yang sedang dilakukan dan
dipelajari. Penilaian sumatif didefinisikansebagai suatu
pengetahuan yang terjadi pada akhir episode
pembelajaran. misalnya, di akhir kursus ( McMillan,
2000)
Macam-Macam Penilaian | 15
Menurut Sudijono dalam bukunya berjudul
Pengantar Evaluasi Pendidikan. Menerangkan bahwa
hanya ada dua macam penilain yaitu penilaian formatif
dan penilaian sumatif. Penialain formatif adalah
penilaian hasil belajar yang bertujuan untuk
mengetahui, sudah sejauh manakah peserta didik “telah
terbentuk” (sesuai dengan tujuan pengajaran yang telah
ditentukan) setelah mereka mengikuti proses
pembelajaran dalam jangka waktu tertenttu. Peru
diketahui bahwa istilah “formatif” itu berasal dari kata
“form” yang berarti bentuk (hal 71). Penilaian sumatif
adalah penilaian yang dilaksanakan setelah sekumpulan
program pelajaran selesai diberikan. Dengan kata lain
peilaian yang dilaksanakan setelah seluruh unit
pelajaran selesai diajarkan. Adapun tujuan utama dari
penilaian sumatif ini adalah untuk menentukan nilai
yang melambangkan keberhasilan peserta didik setelah
mereka menempuh program pengajaran dalam jangka
waktu tertentu. (hal 23)
Menurut Siregar, Eveline & Nara, Hartini dalam

bukunya Teori Belajar dan Pembelajaran juga
menjelaskan hanya ada dua macam penilaian yaitu
penilaian formatif dan penilaian sumatif. Penilaian
formatif dengan maksud memantau sejauh manakah
suatu proses pendidikan telah berjalan sebagai mana
yang telah direncanakan. Biasanya diberikan secara
periodic selama pembelajaran untuk memantau
kemajuan belajar siswa dan memperoleh balikan untuk
guru dan siswa. (hal. 156). Penilaian sumatif dilakukan
unutk mengetahui sejauh manakah peserta didik dapat
16 | Macam-Macam Penilaian
berpindah dari satu unit pembelajaran ke unit
berikutnya. Biasanya diberikan pada akhir suatu
program pembelajaran atau suatu unit pembelajaran
dan hasilnya digunakan untuk menentukan seberapa
jauh siswa menguasai tujuan pembelajaran. (hal. 156-
157)
National Research Council dalam buku

Classroom Assessment and the National Science Education
Standars. Washington menejelaskan terdapat dua
macam penilaian yaitu penilaian formatif dan penilaian
sumatif. Penilaian Formatif, mengacu pada penilaian
yang memberikan informasi kepada siswa dan guru yang
digunakan untuk memperbaiki pengajaran dan
pembelajaran. Ini sering tidak resmi dan terus berlanjut,
meski tidak perlu dilakukan. Data dari penilaian sumatif
dapat digunakan secara formatif. Penilaian Sumatif,
mengacu pada penilaian kumulatif, biasanya terjadi di
akhir cakupan unit atau topik, yang bermaksud
menangkap apa yang telah dipeajari siswa, atau kualitas
pembelajaran, dan nilai kinerja terhadap beberapa
standar. Meskipun kita sering memikirkan penilaian
sumatif sebagai tes objektif tradisional, ini tidak perlu
terjadi. Misalnya, ringkasan penilaian dapat diikuti dari
kumpulan bukti yang dikumpulkan dari waktu ke
waktu, seperti dalam kumpulan karya siswa (h.25)
Dari sekian banyak sumber yang menyebutkan
bahwa terdapat dua macam penilaian, terdapat juga
pengertian lain yang hampir serupa tentang penilaian
formatif dan penilaian sumatif. Seperti yang
diungkapkan oleh QAA (2006) bahwa penilaian formatif
merupakan bagian integral dari proses belajar mengajar.
Ini tidak memberikan kontribusi pada tanda akhir yang
diberikan untuk modul; Sebaliknya, hal itu berkontribusi
untuk belajar melalui pemberian umpan balik. Ini harus
menunjukkan apa yang baik tentang sebuah karya dan
mengapa ini bagus; itu juga harus menunjukkan apa
yang tidak begitu bagus dan bagaimana pekerjaan bisa
diperbaiki. Umpan balik formatif yang efektif akan
mempengaruhi apa yang dilakukan oleh siswa dan guru
selanjutnya.
Sedangkan menurut Catherine Garrison and

Michael Ehringhaus, Ph. D penilaian formatif adalah
bagian dari proses saat dimasukkan ke dalam praktik
kelas, ini menyediakan informasi yang dibutuhkan untuk
menyeseuaikan pengajaran dan belajar saat mereka
sedang terjadi. Dalam arti ini, penilaian formatif
memberi tahu guru dan siswa tentang pemahaman
peserta didik pada saat kapan penyesuaian tepat waktu
dapat dilakukan. Penyesuaian ini membantu
memastikan siswa mencapai target pembelajaran
berbasis target yang ditargetkan dalam kerangka waktu
yang ditetapkan. Meskipun strategi penilaian formatif
muncul dalam berbagai format, ada beberapa cara
berbeda untuk membedakannya dari penilaian sumatif.
Menurut Wahyudi dalam Jurnal UPI Penilaian
formatif adalah penilaian yang dilakukan pada setiap
akhir pembahasan suatu pokok bahasan / topik, dan
dimaksudkan untuk mengetahui sejauh manakah suatu
proses pembelajaran telah berjalan sebagaimana yang
direncanakan.
Sedangkan penilaian sumatif menurut Catherine
Garrison and Michael Ehringhaus, Ph. D adalah penilaian
sumatif diberikan secara berkala tentukan pada titik
tertentu dalam waktu apa siswa tahu dan tidak tahu
Banyak rekan sumatif penilaian hanya dengan tes
standar seperti penilaian negara, namun juga digunakan
pada dan merupakan bagian penting dari program
distrik dan kelas. Kuncinya adalah memikirkan penilaian
sumatif sebagai sarana untuk mengukur, pada suatu
titik waktu tertentu, belajar siswa relatif terhadap
standar isi. Meski informasinya Diperoleh dari jenis
penilaian ini penting, bisa hanya membantu dalam
mengevaluasi aspek pembelajaran tertentu proses.
Karena mereka tersebar dan terjadi sesudahnya instruksi
setiap beberapa minggu, bulan, atau setahun sekali,
Penilaian sumatif adalah alat untuk membantu
mengevaluasi efektivitas program, tujuan perbaikan
sekolah, penyelarasan kurikulum, atau penempatan
siswa di program khusus Penilaian sumatif juga terjadi
Jauh menyusuri jalur belajar untuk memberikan
informasi di tingkat kelas dan untuk melakukan
penyesuaian instruksional dan intervensi selama proses
pembelajaran. Dibutuhkan Penilaian formatif untuk
mencapai hal ini.
Sedangkan menurut Wahyudi dalam Jurnal UPI
penilaian sumatif adalah penilaian yang dilakukan pada
setiap akhir satu satuan waktu yang didalamnya
tercakup lebih dari satu pokok bahasan, dan
dimaksudkan untuk mengetahui sejauhmana peserta
didik telah dapat berpindah dari suatu unit ke unit
berikutnya.
Lebih jelas lagi diungkapkan dalam buku

Classroom Assessment in terkait dua macam penilaian
yang telah disebut di atas yakni :
1. Penilaian Sumatif
Penilaian sumatif sering didasarkan pada
keyakinan bahwa mereka secara otomatis memperbaiki
pembelajaran sebagai hasilnya penghargaan atau
hukuman yang memotivasi siswa. Meskipun penilaian
sumatif telah menjadi bagian pendidikan yang abadi
dan melayani kebutuhan kebijakan, konsep penilaian
formatif memberikan perspektif yang sangat penting
bagi kelas berfungsi (Harlen, 2006). Bertanggung jawab
tinggi (akuntabilitas) penilaian, seperti di seluruh negara
bagian. Pemeriksaan menyeluruh, digunakan untuk
mengidentifikasi status prestasi siswa; misalnya, nilai tes
digunakan untuk menentukan apakah sekolah lolos
atau gagal menyatakan prestasi standar. Penilaian
kemudian digunakan untuk menentukan kelayakan
untuk dana tambahan atau sumber daya. Karakteristik
yang menonjol adalah finalitas penilaian, interpretasi,
implikasi, atau keputusan tentang sekolah atau siswa.
Penilaian sumatif itu hanya berdasarkan tes; hari ini
mungkin didasarkan pada esai, guru peringkat, dan
indeks kinerja lainnya.
Guru dan sekolah harus melakukan beberapa
penilaian sumatif. Prestasi siswa, pekerjaan, dan status
prestasi diringkas untuk catatan sekolah. Laporan
dibutuhkan oleh konselor sekolah untuk bantuan dalam
mengidentifikasi kebutuhan belajar khusus dari masing-
masing siswa. Guru masa depan akan mengacu pada
siswa, pekerjaan masa lalu untuk menilai kesiapan
belajar topik baru. Orang tua ingin diberi laporan
pendidikan anak-anak mereka. Semua pemangku
kepentingan, termasuk siswa, memiliki minat dalam
informasi yang diberikan dalam ringkasan catatan siswa
prestasi. Tapi tujuan ini dicapai dengan penilaian sumatif
membutuhkan ukuran pencapaian pendidikan yang
melampaui skor sederhana sebagai rangkuman prestasi
belajar siswa.
2. Penilaian Formatif
Berbeda dengan penilaian sumatif, penilaian
formatif terdiri dari penilaian yang terintegrasi dengan
instruksi pembuatan keputusan instruksional (Linn, 1989)
selama perjalanan petunjuk. Untuk melakukannya
memerlukan tingkat informasi mengenai instruksi dan
pembelajaran tentang: cara proses perkembangan
mempengaruhi pembelajaran, proses pengembangan
kurikulum dan tujuan yang berbeda, tingkat
perkembangan, sifat tujuan instruksional dan metode
untuk mencapainya, cara metode pengajaran
pembelajaran yang berbeda, cara belajar siswa, proses
yang digunakan siswa dalam lingkungan belajar yang
berbeda (Linn, 1989)
Penilaian formatif didasarkan pada kesimpulan
bahwa penilaian bukan tujuan itu sendiri tapi bisa
digunakan secara konstruktif oleh guru dan pendidik
pada setiap saat selama pengajaran untuk
mengidentifikasi apakah dan di mana pengajaran dan
pembelajaran bisa dilakukan ditingkatkan. Idenya
adalah bahwa setiap atau semua penilaian
menyediakan dasar untuk mempertimbangkan retensi
atau perubahan. Penilaian dilakukan dengan siswa dan
guru yang bekerja secara kooperatif, guru
mempertahankan sebuah pendekatan yang
menghasilkan hasil memuaskan, merevisi instruksi untuk
meningkatkan keefektifannya, atau saat acara
menuntutnya memberikan sebuah instruksional
komponen yang tidak efektif. Belajar dengan cara ini
dimaksudkan untuk memiliki efek terus menerus
peningkatan pengajaran.
Hal berbeda diungkapkan oleh Luongo-Orlando,

Kathrine (2003) yang menjelaskan bahwa penilaian
terbagi menjadi tiga macam, yakni:
1. Penilaian Diagnostik
Penilaian Diagnostik merupakan penilaian yang
terjadi pada awal tahun sekolah, atau periode waktu
ketika sedang mengalami kesulitan siswa. Dengan
mengumpulkan data dan membuat penilaian, guru
dapat menentukan pengetahuan siswa, kemampuan,
sikap, gaya belajar, motivasi tingkat, bunga, kekuatan,
dan instruksi yang di butuhkan dalam rangka mendesain
program efektif
Penilaian Formatif merupakan merupakan
bagian integral dari proses pembelajaran saat siswa
terlibat dalam kegiatan instruksional dan tugas penilaian
selama tahun ajaran. Teknik, terutama observasi, daftar
periksa, konferensi dan diskusi digunakan untuk
menawarkan umpan balik kepada siswa tentang
pelajaran yang sedang berjalan atau mengembangkan
keterampilan. Informasi yang dikumpulkan melalui
penilaian formatif digunakan untuk menentukan
kemajuan siswa, meningkatkan kinerja dan
memodifikasi instruksi.
Penilaian sumatif berlangsung pada akhir studi,
kursus, jangka waktu atau periode waktu ketika siswa
dipersiapkan untuk mendemostrasikan pemahaman
dan penerapan tujuan kurikulum mereka. Data yang
dikumpulkan digunakan untuk menilai nilai pekerjaan
siswa.
Hampir sama dengan apa yang diungkapkan
oleh Luongo-Orlando, Kathrine, macam penilaian
menurut Sawyer, David B. dalam buku Fundamental
Aspects of Interpreter Education : Curriculum and
Assessment terdapat tiga macam penilaian yang perlu
diketahui yaitu:
Penilaian formatif merupakan penilaian yang
berlangsung selama pengajaran dan digunakan pada
dasarnya untuk memberi umpan balik ke dalam proses
belajar-mengajar (H-106)
Penilaian summatif terjadi pada akhir sebuah
pembelajaran dan digunakan untuk memberikan
informasi tentang berapa banyak siswa yang telah
belajar dan
seberapa baik pembelajaran telah berhasil (H-106)
3. Penilaian Ipsatif
Penilaian ipsatif merupakan penilaian di mana
siswa mengevaluasi pembelajaran dibandingkan dengan
pembelajaran sebelumnya (h.106)
Lebih jauh lagi, Overall, Lyn and Margaret

Sangster dalam bukunya. Assesment: A Practical Guide
for Primary Teachers menjelaskan bahwa terdapat
empat macam penilaian yakni
1. Sumatif
Penilaian sumatif dapat disamakan dengan
mengambil gambar dari sebuah situasi. Informasi
dikumpulkan dan dianalisis. Contoh penilaian sumatif
adalah akhir dari tes topik, ujian akhir tahun, ujian GCSE,
laporan akhir tahun dan tes ejaan. Tes sumatif diberikan
pada akhir pekerjaan yang telah ditetapkan. Tes sumatif
adalah tes ingatan untuk mengukur seberapa banyak
murid tahu. Tes sumatif lebih berguna saat menguji apa
yang diketahui dan dapat dipelajari siswa, seperti ujian
mengenai masalah yang harus dipecahkan. Apapun
bentuk yang mereka sajikan, tidak ada tindak lanjut
keberhasilan dan kegagalan. Hasilnya berdiri sebagai
rambu di sepanjang jalan pencapaian pendidikan. (hal.
19-20)
2. Formatif
Dalam banyak hal penilaian formatif hampir
serupa dengan penilaian sumatif. Cara mengumpulkan
data serupa. Tetapi memiliki tujuan yang berbeda.
Tujuan penilaian formatif adalah untuk menindaklanjuti
atas hasil yang telah diperoleh. Dalam tes formatif
beberapa tindakan diambil. Penilaian formatif saat ini
memiliki tingkat pengembalian yang lebih luas daripada
penilaian sumatif. Interaksi menit demi menit antara
guru dan murid dan antara murid sendiri juga dapat
didefinisikan sebagai tes formatif karena terjadi selama
proses pembelajaran. (hal. 20-21)
3. Diagnostik
Terkadang informasi yang rinci sangat
dibutuhkan dalam fokus pengetahuan. Mungkin seorang
anak sedang berjuang ataukah mengerjakan segala
sesuatu dengan mudahnya. Guru kemudian
memutuskan untuk mengumpulkan data secara
mendalam sehingga dia dapat mengatasi masalah.
Tindakan yang akan diambil, juga merupakan penilaian
formatif. Penilaian diagnostik bisa menyita waktu yang
banyak. Tes diagnostik digunakan apabila ada
hambatan dalam proses belajar. (hal. 21)
4. Ipsatif
Penilaian Ipsatif adalah ketika kemajuan dinilai
dari kinerja sebelumnya. Keputusan akhir disesuaikan
dengan prestasi individu, seperti yang dikatakan
Torrance dan Pryor (1998, hal.36), apa yang mereka
lakukan sekarang mewakili kemajuan nyata bagi anak
itu. Ini adalah jenis penilaian formatif lainnya. Jika Anda
yakin bahwa anak-anak membangun pengetahuan
baiknya berdasarkan dan terkait dengan pengetahuan
sebelumnya maka penilaian ipsatif akan menjadi bagian
penting dalam siklus pengajaran Anda. Peta konsep, di
mana anak-anak mengidentifikasi apa yang mereka
ketahui dan apa yang perlu mereka ketahui selanjutnya,
akan menjadi ilustrasi yang bagus tentang respons
terhadap penilaian ipsatif. (hal. 25)
Di dalam buku Evaluasi pengajaran karya

Nasution, noehi dan Adi suryanto terdapat sedikit
perbedaan dari pendapat sebelumnya. Noehi Nasution
dan Adi Suryanto mengungkapkan bahwa setidaknya
terdapat 5 macam penilaian, yaitu:
Penilaian formatif adalah penilaian hasil belajar
yang bertujuan untuk mengetahui, sudah sejauh
manakah peserta didik “telah terbentuk” (sesuai dengan
tujuan pengajaran yang telah ditentukan) setelah
mereka mengikuti proses pembelajaran dalam jangka
waktu tertentu. Perlu diketahui bahwa istilah “formatif”
itu berasal dari kata “form” yang berarti
“bentuk”. (Sudijono, 2005 : 71)
Penilaian formatif ini biasa dilaksanakan di

tengah-tengah perjalanan program pengajaran, yaitu
dilaksanakan pada setiap kali satuan pelajaran atau sub
pokok bahasan berakhir atau dapat diselesaikan.
Penilaian Formatif juga berguna dalam menganalisis
materi pembelajaran, dan prestasi belajar siswa, dan
efektifitas guru (Wally Guyot:1978)
Penilaian sumatif adalah penilaian yang
dilakukan pada setiap akhir satu satuan waktu yang
didalamnya tercakup lebih dari satu pokok bahasan,
dan dimaksudkan untuk mengetahui sejauh mana
peserta didik telah dapat berpindah dari suatu unit ke
unit berikutnya.
Adapun tujuan utama dari penilaian sumatif ini
adalah untuk menentukan nilai yang melambangkan
keberhasilan peserta didik setelah mereka menempuh
program pengajaran dalam jangka waktu tertentu.
(Sudijono, 2007: 23) Seperti halnya penilaian formatif
yang dikatakan Ahmad Rohani dan Abu Ahmadi dalam
bukunya “Pengelolaan Pengajaran”, (Rohani dan
Ahmadi, 1991: 176-179),
Penilaian diagnostik adalah penilaian yang
bertujuan untuk mengetahui kelemahan-kelemahan
siswa serta faktor-faktor penyebabnya. Pelaksanaan
penilaian semacam ini biasanya bertujuan untuk
keperluan bimbingan belajar, pengajaran remedial,
menemukan kasus-dasus dan lain-lain. Soal-soalnya
disusun sedemikian rupa agar dapat ditemukan jenis
kesulitan belajar yang dihadapi oleh para siswa.
4. Penilaian Selektif
Penilaian selektif adalah penilaian yang
dilaksanakan dalam rangka menyeleksi atau menyaring.
Memilih siswa untuk mewakili sekolah dalam lomba-
lomba tertentu termasuk jenis penilaian selektif. Untuk
kepentingan yang lebih luas penilaian selektif misalnya
seleksi penerimaan mahasiswa baru atau seleksi yang
dilakukan dalam rekrutmen tenaga kerja.
5.
Penilaian Penempatan
Penilaian penempatan adalah penilaian yang
ditujukan untuk mengetahui keterampilan prasyarat
yang diperlukan bagi suatu program belajar dan
penguasaan belajar seperti yang diprogramkan sebelum
memulai kegiatan belajar untuk program itu. Dengan
perkataan lain, penilaian ini berorientasi kepada
kesiapan siswa untuk menghadapi program baru dan
kecocokan program belajar dengan kemampuan
siswa,dan penilaian dilaksanakan bilamana ada
kebutuhan untuk menempatkan setiap murid pada
program pendidikan / program belajar mengajar yang
sesuai dengan kemampuannya.
Di dalam buku Model dan Metode Pembelajaran

di Sekolah. Muhammad Afandi juga mengungkapkan
bahwa terdapat 5 macam penilaian yang perlu
diketahui hampir sama dengan apa yang dijelaskan oleh
Nasution, noehi dan Adi suryanto, yaitu:
Penilaian ini dimaksudkan untuk memantau
kemajuan belajar peserta didik selama proses belajar
berlangsung, untuk memeberikan balikan (feedback)
bagi penyempurnaan program pembelajaran, serta
untuk mengetahui kelemahankelemahan yang
memerlukan perbaikan, sehingga hasil belajar peserta
didik dan proses pembelajaran guru menjadi lebih baik.
Tujuan utama penilaian formatif adalah untuk
memperbaiki proses pembelajaran, bukan untuk
menentukan kemampuan peserta didik. (hal.125)
Penilaian sumatif berarti penilaian yang
dilakukan jika satuan pengalaman belajar atau seluruh
materi pelajaran di anggap telah selesai. Dengan
demikian ujian akhir semesteran dan ujian nasional
termasuk penilaian sumatif. Tujuannya yaitu untuk
menentukan nilai (angka) berdasarkan tingkatan hasil
belajar peserta didik yang selanjutnya dipakai sebagai
angka rapor. Dan juga dapat dipakai untuk perbaikan
proses pembelajaran secara keseluruhan. (hal.125)
3. Penilaian Penempatan
Penilaian penempatan ini tujuan utamanya
adalaha untuk mengetahui apakah peserta didik telah
memiliki ketrampilan-ketrampilan yang diperlukan
untuk mengikuti suatu program pembelajaran dan
sejauh mana peserta didik telah menguasai kompetensi
dasar sebagaimana yang tercantum dalam silabus dan
rencana pelaksanaan pembelajaran (RPP). (hal.126)
Penilaian ini dimaksudkan untyk mengetahui
kesulitan belajar peserta didik berdasarkan hasil
penilaian formatif sebelumnya. Dan penilaian ini
memerlukan sejumlah soal untuk satu bidang yang
diperkirakan merupakan kesulitan bagi peserta didik,
dan soal-soal itu bervariasi. (hal.126)
5. Penilaian Selektif
Adalah penilaian yang bertujuan untuk
keperluan seleksi, misalnya ujian saringan masuk ke
lembaga pendidikan tertentu. (hal.126)
Selain macam-macam penilaian di atas, juga

masih terdapat beberapa macam penilaian lain yaitu:
Authentic Assessment, Dynamic Assessment, Synoptic
Assessment, Criterion Referenced Assessment.
Penilaian otentik adalah upaya untuk
membantu guru di kelas dasar menerapkan
pembelajaran berbasis kinerja dan praktik penilaian
otentik di seluruh kurikulum (Luongo-Orlando,
Katherine. 2003). Penilaian autentik adalah kegiatan
menilai peserta didik yang menekankan pada apa yang
seharusnya dinilai, baik proses maupun hasil dengan
berbagai instrumen penilaian yang disesuaikan dengan
tuntutan kompetensi yang ada di Standar Kompetensi
(SK) atau Kompetensi Inti (KI) dan Kompetensi Dasar
(KD) (Kunandar,2013:35-36).
Penilaian dinamis mengukur apa yang dicapai
siswa saat diberi beberapa pengajaran dalam topik atau
bidang yang tidak mereka kenal. Contohnya mungkin
penilaian tentang seberapa banyak orang Swedia
belajar dalam blok pendek pengajaran kepada siswa
yang tidak memiliki pengetahuan sebelumnya tentang
bahasa tersebut. Hal ini dapat berguna untuk menilai
potensi pembelajaran spesifik tanpa adanya pencapaian
sebelumnya yang relevan, atau untuk menilai potensi
pembelajaran umum bagi siswa yang memiliki latar
belakang yang sangat tidak beruntung. Hal ini sering
digunakan sebelum badan utama pengajaran. Penilaian
dinamis secara tipikal kontras dengan penilaian statis. Ini
mencerminkan fakta bahwa penilaian dinamis berfokus
pada proses belajar, berbeda dengan penilaian
tradisional yang berfokus pada produk yang telah
dipelajari.
Penilaian sinoptik adalah penilaian yang
mendorong siswa untuk menggabungkan elemen
pembelajaran mereka dari berbagai bagian program
dan untuk menunjukkan akumulasi pengetahuan dan
pemahaman mereka tentang topik atau bidang subjek.
Penilaian sinoptik biasanya memungkinkan siswa untuk
menunjukkan kemampuan mereka untuk
mengintegrasikan dan menerapkan keterampilan,
pengetahuan dan pemahaman mereka dengan luas dan
mendalam dalam subjek. Ini dapat membantu untuk
menguji kemampuan siswa dalam menerapkan
pengetahuan dan pemahaman yang diperoleh di salah
satu bagian program untuk meningkatkan pemahaman
mereka di bagian lain program ini, atau di seluruh
program secara keseluruhan . Penilaian sinoptik dapat
menjadi bagian dari bentuk penilaian lainnya.
Criterion Referenced Assessment (Kriteria
penilaian) yang diacu Setiap prestasi siswa dinilai
berdasarkan kriteria tertentu. Pada prinsipnya tidak ada
perhitungan yang diambil tentang bagaimana siswa lain
melakukannya. Dalam praktiknya, pemikiran normatif
dapat mempengaruhi penilaian apakah kriteria tertentu
telah dipenuhi atau tidak. Keandalan dan validitas harus
diyakinkan melalui proses seperti moderasi, uji coba, dan
pengumpulan contoh.
Selain berbagai pendapat di atas, Gabel
(1993:388-390) mengkategerikan penilaian ke dalam
kedua kelompok besar yaitu penilaian tradisonal dan
penilaian alternative. Penilaian yang tergolong
tradisonal adalah tes benar-salah, tes pilihan ganda, tes
melengkapi dan tes jawaban terbatas. Sementara itu
yang tergolong ke dalam penilaian praktek, penilaian
proyek kuesioner, inventori daftar. Contoh : Penilaian
oleh teman sejawat atau sebaya, penilaian diri (self
assessment), portofolio, observasi, diskusi dan interview
(wawancara).
Dari paparan di atas, terdapat beberapa macam

penilaian yaitu: penilaian formatif, penilaian sumatif,
penilaian diagnostik, penilaian ipsativ, penilaian dinamik,
penilaian otentik, dsb. Dapat disimpulkan bahwa
terdapat berbagai macam penilaian dan berbeda-beda
menurut pendapat para ahli. Macam-macam penilaian
tersebut dapat digunakan tergantung dengan
kebutuhan dan apa yang ingin dicapai oleh guru dan
disesuaikan dengan kondisi di dalam kelas.
BAB III
TUJUAN, TEKNIK, DAN ALAT
PENILAIAN
A. TUJUAN PENILAIAN
Tujuan menurut KBBI adalah arah. Tujuan
merupakan sesuatu yang akan dicapai. Tentu dalam
sebuah penilaian itu juga mempunyai tujuan mengapa
diadakannya penilaian.
Tujuan asesmen oleh Sudjana (2005) yaitu sebagai
berikut:
a) Mendeskripsikan kecakapan belajar para siswa
sehingga dapat diketahui kelebihan dan
kekurangannya dalam berbagai bidang studi
atau mata pelajaran yang ditempuh;
b) Mengetahui keberhasilan proses pendidikan dan
pengajaran di sekolah, yakni seberapa jauh
keefektifannya dalam mengubah tingkah laku
para siswa ke arah tujuan pendidikan yang
diharapkan;
c) Menentukan tindak lanjut hasil asesmen, yakni
melakukan perbaikan dan penyempurnaan
dalam hal program pendidikan dan pengajaran
serta strategi pelaksanaannya;
d) Memberikan pertanggung jawaban
(accountability) dari pihak sekolah kepada
Tujuan, Teknik, dan Instrumen Penilaian | 33

pihak-pihak yang berkepentingan. Oleh karena
itu, penggunaan jenis assessment yang tepat akan
menentukan keberhasilan dalam memperoleh
informasi yang berkenaan dengan proses
pembelajaran
Penerima manfaat belajar dapat bervariasi.

namun, belajar idealnya adalah fokus dari semua
penilaian. Pada tahun 2006, Western and Nothern
Canadia Protocol for Collaboration in Education (WNCP)
mengemukakan sebuah dokumen yang merangkum tiga
tujuan penilaian, yaitu:
a) Penilaian untuk pembelajaran
Istilah "penilaian untuk belajar" sering digunakan
secara bergantian dengan "penilaian formatif"
sebagaimana dibuktikan oleh bab Black dan William
(sekitar tahun 2006) seputar praktik penilaian
formatif yang berjudul "penilaian untuk belajar di
kelas" dan Harlen's (2006) menyatakan penggunaan
istilah. Menurut Herlen, yang paling penting bukan
jenis penilaian yang digunakan, tapi tujuan
penggunaannya. Refleksi Black dan William
menangkap pembelajaran yang terfokus pada
penilaian formatif sambil memberikan rincian tentang
proses penilaian dan sifat konstruktivisnya. Taras
(2010) tidak setuju dan menjelaskan bahwa terlepas
dari bagaimana pekerjaan itu digunakan, "proses
penilaian formatif hanya dapat dikatakan telah
terjadi ketika umpan balik telah digunakan untuk
memperbaiki pekerjaan" (P.3021). Dia merasa bahwa
34 | Tujuan, Teknik, dan Instrumen Penilaian

asesmen formatif (penilaian untuk belajar) adalah
proses interaksi antara apa yang dia sebut sebagai
penilaian sumatif dan umpan balik namun ketika dia
mengacu pada penilaian sumatif, dia merujuk secara
khusus pada fakta bahwa sebuah keputusan harus
dibuat tentang melukis dan Pengetahuan, sama
seperti tahap evaluasi dalam siklus kita. Ini mungkin
sangat membantu untuk mengkonseptualisasikan
penilaian untuk belajar sebagai mewujudkan tujuan
utama penilaian (peningkatan pembelajaran),
namun terutama sebagai proses penilaian umum yang
diberlakukan karena didukung oleh tujuan penilaian
lainnya seperti penilaian pembelajaran atau penilaian
sumatif. Karena semua penilaian seharusnya untuk
pembelajaran, diharapkan kebutuhan penggunaan
terminologi pada akhirnya akan kuno.
b) Penilaian sebagai pembelajaran
Asepsi sebagai pembelajaran bersifat
formatif, namun secara khusus mengacu pada tugas
belajar metakognitif. Secara keseluruhan, tujuan
umum penilaian sebagai pembelajaran adalah untuk
akhirnya menjembatani dan mengalihkan
kepemilikan pembelajaran dari guru ke siswa dengan
kata lain dari externala ke pemantauan internal.
Contoh penilaian yang penting seperti pembelajaran
mencakup unsur-unsur apa yang oleh Boekaerts dan
Corno (2005) dan Clark (2012) diskusikan sebagai
pembelajaran mandiri dan apa yang Brookhart (2001)
deskripsikan sebagai penilaian diri siswa. Bockaerts
dan Corno melukis potret stdent yang mengatur diri

sendiri sebagai berikut: "Semua teoretikus
menganggap bahwa siswa yang mengatur
pembelajaran mereka bergerak secara aktif dan
konstruktif dalam proses pembangkitan makna dan
mereka menyesuaikan pemikiran, perasaan, dan
tindakan mereka sesuai kebutuhan. mempengaruhi
motivasi belajar mereka "(hal.201).
Meskipun mereka mengeksplorasi
peraturan diri siswa jauh lebih mendalam daripada
yang bisa kita dapatkan di sini, deskripsi ini dengan
indah menggambarkan intenet asesmen sebagai
pembelajaran. Dalam kata-kata Black dan William
(1998), "pengguna akhir informasi penilaian yang
diyakinkan untuk memperbaiki pembelajaran adalah
muridnya" (hal.142). Untuk alasan ini, penilaian
sebagai pembelajaran sangat penting bagi siswa
karena memengaruhi siswa, memotivasi mereka, dan
mendukung transisi akhirnya ke pelajar seumur hidup.
c) Penilaian pembelajaran
Penilaian pembelajaran sering digunakan
sebagai label lain untuk penilaian sumatif. Dengan
asumsi bahwa semua penilaian harus bersifat formatif
(yaitu, penilaian untuk pembelajaran), apakah
penilaian pembelajaran masih layak dijadikan tujuan
penilaian? Dalam peran tradisionalnya, penilaian
pembelajaran digunakan terutama untuk
pengambilan keputusan politik dan pendidikan,
sehingga berkonotasi pada tingkat kontrol yang besar
terhadap siswa (Taras, 2008). Oleh karena itu, ada
protes keras terhadap penilaian sumatif secara umum,

khususnya karena penelitian yang benar-benar
dirasakan dan aktual misusedespite yang
menunjukkan bahwa penilaian sumatif berskala besar
masih merupakan kebutuhan (Brookhart, 2003).
Newton (2007) menunjukkan bahwa dengan cara
istilah "sumatif" digunakan, ia tidak memiliki tujuan
dan hanya mencirikan jenis penilaian. Kebenaran yang
melekat dalam pernyataan ini terletak pada
pendekatan tradisional yang bermasalah terhadap
penilaian yang mengganggu siklus penilaian pada
tahap evaluasi atau mengocok informasi tersebut ke
lembaga organisasi eksternal tanpa umpan balik yang
dikembalikan kepada siswa. Seperti Taras (2008)
membedah masalah ini, dia menarik perhatian pada
fakta bahwa penghakiman secara alami terjadi dan
perlu, walaupun terkadang disalahgunakan. Namun
jika didekati dengan benar, penilaian pembelajaran
bisa menjadi alat yang berharga untuk merangkum
kumpulan rotasi siklus asesmen.
Konseptualisasikannya sebagai sampel inti geologi
yang mengkomunikasikan pembelajaran siswa selama
periode waktu tertentu. Ini berhasil mencapai
makroskop yang terjadi pada tingkat mikrokosmos di
kelas setiap saat. Bila digunakan dengan tepat,
umpan balik ini dapat memberi siswa pemahaman
yang lebih baik, pada tingkat organisasi dapat
memberi kesempatan belajar bagi guru dan
administrator untuk belajar bagaimana mendukung
pembelajaran siswa lebih lanjut, dan pada tingkat
politik / masyarakat dapat memberikan informasi
potensialnya, Bila digunakan dengan benar dapat
berkontribusi pada proses pembuatan keputusan
yang penting.
Pertanyaan yang kemudian muncul untuk
Anda adalah apakah Anda tahu secara persis apakah
sebenarnya tujuan dari penilaian kelas. Secara rinci
tujuan tersebut dapat dijabarkan sebagai berikut:
a. Dengan melakukan asesmen berbasis kelas ini

pendidik dapat mengetahui seberapa jauh
siswa dapat mencapai tingkat pencapai
kompetensi yang dipersyaratkan, baik selama
mengikuti pembelajaran dan setelah proses
pembelajaran berlangsung.
b. Saat melaksanakan asesmen ini, Anda sebagai
pendidik juga akan bisa langsung memberikan
umpan balik kepada peserta didik, sehingga
tidak pelu lagi menunda atau menunggu
ulangan semester untuk bisa mengetahui
kekuatan dan kelemahannya dalam proses
pencapaian kompetensi.
c. Dalam asesmen berbasis kelas ini, Anda juga
secara terus menerus dapat melakukan
pemantauan kemajuan belajar yang dicapai
setiap peserta didik, sekaligus Anda dapat
mendiagnosis kesulitan belajar yang dialami
peserta didik sehingga secara tepat dapat
menentukan siswa mana yang perlu
pengayaan dan siswa yang perlu pembelajaran
remedial untuk mencapai kompetensi yang
dipersyaratkan.

d. Hasil pemantauan kemajuan proses dan hasil
pembelajaran yang dilakukan terus menerus
tersebut juga akan dapat dipakai sebagai
umpan balik bagi Anda untuk memperbaiki
metode, pendekatan, kegiatan, dan sumber
belajar yang digunakan, sesuai dengan
kebutuhan materi dan juga kebutuhan siswa.
e. Hasil-hasil pemantauan tersebut, kemudian
dapat Anda jadikan sebagai landasan untuk
memilih alternatif jenis dan model penilaian
mana yang tepat untuk digunakan pada
materi tertentu dan pada mata pelajaran
tertentu, yang sudah barang tentu akan
berbeda. Anda sebagai pendidik yang tahu
persis pertimbangan pemilihannya
f. Hasil dari asesmen ini dapat pula memberikan
informasi kepada orang tua dan komite
sekolah tentang efektivitas pendidikan, tidak
perlu menunggu akhir semester atau akhir
tahun. Komunikasi antara pendidik, orang tua
dan komite harus dijalin dan dilakukan terus
menerus sesuai kebutuhan (Poerwanti, 2015)
Selanjutnya Sudjana (2005) menyebutkan bahwa
tujuan dari penilaian adalah:
1. Mendeskripsikan kecakapan belajar pada

siswa sehingga dapat diketahui kelebihan dan
kekurangan dalam berbagai bidang studi atau
mata pelajaran yang ditempuhnya.

2. Mengetahui keberhasilan proses pendidikan
dan pengajaran di sekolah, yakni seberapa
jauh keefektifannya dalam mengubah tingkah
laku para siswa ke arah tujuan pendidikan
yang diharapkan.
3. Menentukan tindak lanjut hasil penilaian,
yakni melakukan perbaikan dan
penyempurnaan dalam hal progam
pendidikan dan pengajaran serta strategi
pelaksanaannya.
4. Memberikan pertanggungjawaban
(accountability) dari pihak sekolah kepada
pihak-pihak yang berkepentingan.
Oleh karena itu, penggunaan jenis penilaian yang
tepat akan menentukan keberhasilan dalam
memperoleh informasi yang berkenaan dengan proses
pembelajaran. Senada dengan pernyataan Sudjana,
Iryanti (2004) mengemukakan bahwa penilaian yang
dilakukan terhadap siswa mempunyai tujuan antara
lain:
1. Mengetahui tingkat pencapaian siswa.

2. Mengukur pertumbuhan dan perkembangan
kemajuan siswa.
3. Mendiagnosis kesulitan belajar siswa.
4. Mengetahui hasil pembelajaran.
5. Mengetahui pencapaian kurikulum.
6. Mendorong siswa untuk belajar.
7. Umpan balik untuk guru supaya dapat mengajar
lebih baik lagi.

Dalam buku Classroom Assessment in Action
disebutkan “The purpose of assessment during learning
is to provide data that will be useful in monitoring
students’ progress and, in doing so, inform teaching
effectiveness” yang memiliki arti bahwa tujuan
asesmen selama belajar adalah untuk menyediakan
data yang akan berguna dalam memantau
kemajuan siswa dan, dengan berbuat demikian,
menginformasikan efektivitas pengajaran.
Jika siswa ditemukan, melalui penilaian, harus

berjuang dengan satu atau lebih aspek pelajaran,
rencana instruksional dapat dimodifikasi. Meskipun
pemahaman dapat ditargetkan dalam penilaian
yang Anda buat, tujuan lain mungkin penting,
termasuk tujuan seperti pengembangan sikap
terhadap metode ilmiah, apresiasi musik atau seni,
dan pengembangan keterampilan motorik baik
dalam menari, bermain olahraga, menggunakan
komputer, atau gambar. Ini juga dinilai bisa cukup
penting untuk dinilai. Misalnya, Anda mungkin ingin
tahu seberapa sukses pengajaran Anda dalam
mengubah sikap terhadap metode ilmiah atau
terhadap konservasi dan keberlanjutan.
Tujuan penilaian di kelas oleh guru hendaknya

diarahkan pada empat (4) tujuan berikut (Chittenden,
1991):
1. Penelusuran (Keeping track), yaitu untuk

menelusuri agar proses pembelajaran anak didik
tetap sesuai dengan rencana. Guru mengumpulkan
informasi sepanjang semester dan tahun pelajaran
melalui berbagai bentuk penilaian kelas agar
memperoleh gambaran tentang pencapaian
kompetensi oleh siswa.
2. Pengecekan (Checking-up), yaitu untuk mengecek
adakah kelemahan-kelemahan yang dialami anak
didik dalam proses pembelajaran. Melalui penilaian
kelas, baik yang bersifat formal maupun informal
guru melakukan pengecekan kemampuan
(kompetensi) apa yang siswa telah kuasai dan apa
yang belum dikuasai.
3. Pencarian (Finding-out), yaitu untuk mencari dan
menemukan hal-hal yang menyebabkan
terjadinya kelemahan dan kesalahan dalam proses
pembelajaran. Guru harus selalu menganalisis dan
merefleksikan hasil penilaian kelas dan mencari
hal-hal yang menyebabkan proses pembelajaran
tidak berjalan secara efektif.
4. Penyimpulan (Summing-up), yaitu untuk
menyimpulkan apakah anak didik telah mencapai
kompetensi yang ditetapkan dalam kurikulum
atau belum. Penyimpulan sangat penting
dilakukan guru, khususnya pada saat guru diminta
melaporkn hasil kemajuan belajar anak kepada
orang tua, sekolah, atau pihak lain seperti di akhir
semester atau akhir tahun ajaran baik dalam
bentuk rapor siswa atau bentuk lainnya.
Agar tujuan penilaian tersebut tercapai,

guru harus menggunakan berbagai metoda dan
teknik penilaian yang beragam sesuai dengan tujuan

pembelajaran dan karakteristik pengalaman belajar
yang dilaluinya. Tujuan dan pengalaman belajar
tertentu mungkin cukup efektif dinilai melalui tes
tertulis (paper-pencil test), sedangkan tujuan dan
pengalaman belajar yang lain (seperti bercakap dan
praktikum IPA) akan sangat efektif dinilai dengan tes
praktek (performance assessment). Demikian juga,
metoda observasi sangat efektif digunakan untuk
menilai aktivitas pembelajaran siswa dalam
kelompok, dan skala sikap (rating scale) sangat cocok
untuk menilai aspek afektif, minat dan motivasi anak
didik. Oleh sebab itu, guru hendaknya memiliki
pengetahuan dan kemahiran tentang berbagai
metoda dan teknik penilaian sehingga dapat memilih
dan melaksanakan dengan tepat metoda dan teknik
yang dianggap paling sesuai dengan tujuan dan proses
pembelajaran, serta pengalaman belajar yang telah
ditetapkan.
Di samping itu, karena tujuan utama dari

penilaian berbasis kelas yang dilakukan oleh guru
adalah untuk memantau kemajuan dan pencapaian
belajar siswa sesuai dengan matriks kompetensi
belajar yang telah ditetapkan, guru atau wali kelas
diharapkan mengembangkan sistem portofolio
individu siswa (student portofolio) yang berisi
kumpulan yang sistematis tentang kemajuan dan hasil
belajar siswa. Portofolio siswa memberikan gambaran
secara menyeluruh tentang proses dan pencapaian
belajar siswa pada kurun waktu tertentu. Portofolio
siswa dapat berupa rekaman perkembangan belajar

dan psikososial anak (developmental), catatan
prestasi khusus yang dicapai siswa (showcase), catatan
menyeluruh kegiatan belajar siswa dari awal sampai
akhir (comprehensive), atau kumpulan tentang
kompetensi yang telah dikuasai anak secara kumulatif
(exit). Portofolio ini sangat berguna baik bagi sekolah
maupun bagi orang tua serta pihak-pihak lain yang
memerlukan informasi secara rinci tentang
perkembangan belajar anak dan aspek psikososialnya
sehingga mereka dapat memberikan bimbingan dan
bantuan yang relevan bagi keberhasilan belajar anak.
Menurut Metter (2003) terdapat beberapa

tujuan/goal dari penilaian yang akan dijabarkan
sebagai berikut :
1. Merencanakan, melakukan, dan

mengevaluasi instruksi
Salah satu tujuan penilaian yang paling
mendasar dan penting adalah membantu dalam
membuat keputusan mengenai instruksi. Ini dapat
dibagi menjadi tiga jenis keputusan instruksional:
yang terjadi sebelum instruksi, instruksi yang terjadi
selama instruksi, dan instruksi yang mengikuti.
2. Mendiagnosis kesulitan siswa

Penilaian diagnostik, merupakan kegiatan
penting dalam membantu guru merencanakan
pengajaran, jika siswa sudah mengetahui beberapa
gagasan dan konsep dasar pada satu unit
pengajaran, guru dapat memutuskan untuk tidak

meliput materi tersebut atau mungkin hanya
menawarkan tinjauan singkat kepada siswa,
sebelum beralih konsep baru.Guru mungkin juga
memperhatikan bahwa siswa tertentu mengalami
jenis kesulitan yang umum, apakah masalah yang
bersifat akademis, emosional, atau sosial.
3. Menempatkan siswa
Guru kelas sering membuat keputusan
tentang penempatan siswa. Keputusan
penempatan dapat dilakukan berdasarkan
kemampuan akademis dan sosial (airasian, 2000).
4. Memberikan masukan kepada siswa

(formatif)
Tujuan penilaian lain yang sangat penting
adalah memberikan umpan balik kepada siswa
mengenai kemajuan akademis mereka. Evaluasi
formatif didefinisikan sebagai pengambilan
keputusan yang terjadi selama instruksi untuk
menentukan penyesuaian terhadap instruksi yang
harus dilakukan.
5. Mengkaji dan mengevaluasi

pembelajaran akademik (summative)
Ingat bahwa evaluasi sumatif berarti guru
menilai dan mengevaluasi pembelajaran siswa di
akhir matapelajaran, periode naik kelas, atau
tahun ajaran. Penugasan kelas ini biasanya
bagaimana guru berkomunikasi dengan orang lain
(yaitu, orang tua, administrator, dan guru lainnya,

serta siswa mereka sendiri) seberapa baik siswa
telah melakukan di bawah asuhan mereka.
B. TEKNIK PENILAIAN
Menurut Brookhart, Susan M. and Anthony, Nitko J.
(2007 : 5) ilihat dari tekniknya, asesmen proses dan hasil
belajar dibedakan menjadi dua macam yaitu dengan
Teknik Tes dan Non Tes namun pada umumnya pengajar
lebih banyak menggunakan tes sebagai alat ukur
dengan rasional bahwa tingkat obyektivitasevaluasi lebih
terjamin, hal ini tidak sepenuhnya benar. Anda bisa lebih
jauh mencermati pada unit-unit selanjutnya:
a. Teknik Tes adalah seperangkat tugas yang harus

dikerjakan oleh orang yang dites, danberdasarkan
hasil menunaikan tugas-tugas tersebut, akan dapat
ditarik kesimpulantentang aspek tertentu pada orang
tersebut. Tes sebagai alat ukur sangat
banyakmacamnya dan luas penggunaannya.
b. Teknik Non Tes adalah seperangkat tugas yang

dapat dilakukan dengan observasi baik secara
langsung ataupun tak langsung, angket ataupun
wawancara. Dapat pula dilakukan dengan Sosiometri,
teknik non tes digunakan sebagai pelengkap dan
digunakan sebagai pertimbangan tambahan dalam
pengambilan keputusan penentuan kualitas hasil
belajar, teknik ini dapat bersifat lebihmenyeluruh
pada semua aspek kehidupan anak. Dalam KBK
teknik nontes disarankanuntuk banyak digunakan.

Ada beberapa teknik dan alat penilaian yang
dapat digunakan guru sebagai sarana untuk
memperoleh informasi tentang keadaan belajar siswa.
Penggunaan berbagai teknik dan alat itu harus
disesuaikan dengan tujuan penilaian, waktu yang
tersedia, sifat tugas yang dilakukan siswa dan
banyaknya/jumlah materi pelajaran yang sudah
disampaikan. Teknik penilaian adalah metode atau
cara penilaian yang dapat digunakan guru untuk
mendapatkan informasi mengenai keadaan belajar
dan prestasi peserta didik. Teknik penilaian yang
memungkinkan dan dapat dengan mudah digunakan
oleh guru antara lain:
i). Tes Tertulis

Tes tertulis adalah tes yang soal-soalnya harus
dijawab peserta didik dengan memberikan
jawaban tertulis. Jenis tes tertulis secara umum
dapat dikelompokkan menjadi dua yaitu:
Tes Bentuk Uraian
Bentuk uraian dapat digunakan untuk
mengatur kegiatan-kegiatan belajar yang sulit
diukur oleh bentuk objektif. Disebut bentuk
uraian, karena menuntut peserta didik untuk
menguraikan, mengorganisasikan dan
menyatakan jawaban dengan kata-katanya
sendiri dalam bentuk, teknik, dan gaya yang
berbeda satu dengan yang lainnya. Dilihat dari
luas-sempitnya materi yang ditanyakan, maka
tes bentuk uraian ini dapat dibagi menjadi 2
bentuk, yaitu:
 Uraian Terbatas (Restricted Respons Items)
Dalam menjawab soal bentuk uraian
ini, peserta didik harus mengemukakan hal-hal
tertentu sebagai batas-batasnya. Walaupun
kalimat jawaban peserta didik itu beraneka
ragam, tetap harus ada pokok-pokok penting
yang terdapat dalam sistematika jawabannya
sesuai dengan batas-batas yang telah
ditentukan dan dikendaki dalam soalnya.
Contoh:
a. Jelaskan bagaimana prosedur
operasional sebuah pesawat komputer!
b. Sebutkan lima komponen dalam sistem
komputer!
 Uraian Bebas (Extended Respons Items)
Dalam bentuk ini peserta didik bebas
untuk menjawab soal dengan cara dan
sistematika sendiri. Peserta didik bebas
mengemukakan pendapat sesuai dengan
kemampuannya. Oleh karena itu, setiap
peserta didik mempunyai cara dan
sistematika yang berbeda-beda. Namun,
guru tetap mempunyai acuan atau patokan
dalam mengoreksi jawaban peserta didik
nanti. Contoh:
a. Bagaimana perkembangan komputer di

Indonesia, jelaskan secara singkat!
b. Bagaimana peranan komputer dalam
pendidikan!
Dalam menyusun soal bentuk uraian, ada
baiknya guru mengikuti petunjuk praktis berikut
ini.
 Setiap pertanyaan hendaknya menggunakan

petunjuk dan rumusan yang jelas dan mudah
dipahami.
 Jangan memberikan kesempatan kepada
peserta didik untuk memilih beberapa soal
dari sejumlah soal yang diberikan, sebab cara
demikian tidak memungkinkan untuk
memperoleh skor yang dapat dibandingkan.
 Instrumen soalnya dapat berupa:
menjelaskan, menelaah, mendeskripsikan,
membandingkan, mengemukakan kritik,
memecahkan masalah, dan lain sebagainya.
Terdapat kelebihan dan kekurangan yang

dimiliki pada soal bentuk uraian. Adapun
kelebihan bentuk soal uraian antara lain:
o Proses penyusunan soal relatif mudah.

o Memberikan kebebasan luas kepada peserta
didik untuk menyatakan tanggapannya.
o Dapat mengukur kemampuan
mengorganisasikan pikiran.
o Mengurangi faktor menebak dalam
menjawab.

Sedangkan kelemahan bentuk soal uraian
antara lain:
o Proses pengoreksian membutuhkan waktu
yang relatif lama.
o Ada kecenderungan dari guru bersikap
subjektif.
o Guru sering terkecoh dalam memberikan
nilai, karena keindahan kalimat dan
tulisannya.
Tes Bentuk Objektif

Tes objektif sering juga disebut tes dikotomi
(dichotomously scored item) karena jawabannya
antara benar atau salah dan skornya antara 1
atau 0. Tes objektif terdiri dari beberapa
bentuk, antara lain:
a.) Benar-Salah (True-False, or Yes-No)
Bentuk tes benar-salah (B-S) adalah
pernyataan yang mengandung dua
kemungkinan jawaban, yaitu benar atau
salah. Salah satu fungsi bentuk soal benar-
salah adalah untuk mengukur kemampuan
peserta didik dalam membedakan antara
fakta dengan pendapat. Bentuk soal seperti
ini lebih banyak digunakan unyuk
mengukur kemampuan mengidentifikasi
informasi berdasarkan hubungan yang
sederhana.
 Ada beberapa teknik/petunjuk praktis
dalam penyusunan soal bentuk B-S,

yaitu: Jumlah item yang benar dan salah
hendaknya sama.
 Berilah petunjuk cara mengerjakan soal
yang jelas dan memakai kalimat
sederhana.
 Hendaknya jumlah item cukup banyak,
sehingga dapat
dipertanggungjawabkan.
b.) Pilihan Ganda (Multiple Choice)
Soal tes bentuk pilihan ganda dapat
digunakan untuk mengukur hasil belajar
yang lebih kompleks dan berkenaan dengan
aspek ingatan, pengertian, aplikasi, analisis,
sintesis, dan evaluasi. Pilihan jawaban
(option) terdiri atas jawaban yang benar
atau paling benar, selanjutnya disebut kunci
jawaban dan kemungkinan jawaban salah
yang dinamakan pengecoh
(distractor/decoy/fails). Beberapa petunjuk
praktis dalam menyusun soal bentuk pilihan
ganda, yaitu:
 Harus mengacu pada kompetensi dasar
dan indikator soal.
 Jangan memasukkan materi soal yang
tidak relevan dengan apa yang sudah
dipelajari peserta didik.
 Pernyataan dan pilihan hendaknya
merupakan kesatuan kalimat yang
tidak terputus.

 Harus diyakini bahwa hanya ada satu
jawaban yang benar.Bila perlu beri
jawaban pengecohnya.
Terdapat kelebihan dan kekurangan yang
dimiliki pada soal bentuk pilihan ganda.
Kelebihan soal bentuk pilihan-ganda, antara lain:
o Cara penilaian dapat dilakukan dengan
mudah, cepat, dan objektif,
o Dapat mencakup ruang lingkup
bahan/materi yang luas,
o Mampu mengungkap tingkat kognitif
rendah sampai tinggi, dan
o Dapat digunakan berulang kali.
Sedangkan kelemahan dari soal bentuk pilihan
ganda antara lain:
o Proses penyusunan soal benar-benar
membutuhkan waktu yang lama,
o Memberi peluang siswa untuk menebak
jawaban, dan
o Kurang mampu meningkatkan daya nalar
siswa.
c.) Menjodohkan (Matching)
Soal tes bntuk menjodohkan terdiri atas
kumpulan soal dan kumpulan jawaban
yang keduanya dikumpulkan pada dua
kolom berbeda, yaitu kolom sebelah kiri
menunjukkan kumpulan persoalan, dan
kolom sebelah kanan menunjukkan
kumpulan jawaban. Bentuk soal seperti ini
sangat baik untuk mengukur kemampuan

peserta didik dalam mengidentifikasi
hubungan antara dua hal.
Untuk penyusunan soal bentuk ini perlu
memperhatikan teknik berikut:
 Sesuaiakan dengan kompetensi dasar
dan indikator.
 Kumpulan soal diletakkan di sebelah
kiri, dan jawaban di sebelah kanan.
 Gunakan kalimat singkat dan terarah
pada pokok persoalan.
d.) Melengkapi (Completion)
Soal bentuk melengkapi (completion)
dikemukakan dalam kalimat yang tidak
lengkap.
Contoh:Tempat sampah daur ulang dalam
komputer disebut.......
ii). Tes Lisan
Tes lisan yakni tes yang pelaksanaannya

dilakukan dengan mengadakan tanya jawab
secara langsung antara pendidik dan peserta didik.
Tes ini memiliki kelebihan dan kelemahan.
Kelebihannya antara sebagai berikut:
 Dapat menilai kemampuan dan tingkat

pengetahuan yang dimiliki peserta didik,
sikap, serta kepribadiannya karena
dilakukan secara berhadapan langsung.
 Bagi peserta didik yang kemampuan
berpikirnya relatif lambat sehingga sering
mengalami kesukaran dalam

memahami pernyataan soal, tes bentuk
ini dapat menolong sebab peserta didik
dapat menanyakan langsung kejelasan
pertanyaan yang dimaksud.
 Hasil tes dapat langsung diketahui
peserta didik.
Sedangkan kelemahan dari tes lisan
adalah sebagai berikut.
 Subjektivitas guru sering mencemari hasil

tes.
 Waktu pelaksanaan yang diperlukan
relatif cukup lama.
iii). Tes Perbuatan
Tes perbuatan yakni tes yang

penugasannya disampaikan dalam bentuk lisan
atau tertulis dan pelaksanaan tugasnya
dinyatakan dengan perbuatan atau unjuk kerja.
Penilaian tes perbuatan dilakukan sejak peserta
didik melakukan persiapan, melaksanakan tugas,
sampai dengan hasil yang dicapainya.Untuk
menilai tes perbuatan pada umumnya diperlukan
sebuah format pengamatan, yang bentuknya
dibuat sedemikian rupa agar pendidik dapat
menuliskan angka-angka yang diperolehnya
pada tempat yang sudah disediakan. Bentuk
formatnya dapat disesuaikan menurut keperluan.
Untuk tes perbuatan yang sifatnya individual,
sebaiknya menggunakan format pengamatan

individual. Untuk tes perbuatan yang
dilaksanakan secara kelompok digunakan format
tertentu yang sudah disesuaikan untuk keperluan
pengamatan kelompok.
 Teknik Non-Tes
Teknik non-tes sangat penting dalam
mengevaluasi siswa pada ranah afektif dan
psikomotor, berbeda dengan teknik tes yang
lebih menekankan asfek kognitif. Ada beberapa
macam teknik non-tes, yakni: pengamatan
(observation), wawancara (interview),
kuesioner/angket (quetionaire).
a. Observasi
Observasi adalah suatu proses pengamatan
dan pencatatan secara sistematis, logis,
objektif, dan rasional mengenai berbagai
fenomena untuk mencapai tujuan tertentu.
Dalam evaluasi pembelajaran, observasi
dapat digunakan untuk menilai proses dan
hasil belajar peserta didik, seperti tingkah
laku peserta didik pada waktu belajar,
berdiskusi, mengerjakan tugas, dan lain-lain.
Alat yang digunakan untuk melakukan
observasi disebut pedoman observasi.
b. Wawancara
Wawancara merupakan salah satu bentuk
alat evaluasi jenis non-tes yang dilakukan
melalui percakapan dan tanya jawab, baik
secara langsung maupun tidak langsung.Ada
beberapa teknik atau cara yang harus
diperhatikan dalam melaksanakan
wawancara, yaitu:
 Pewawancara harus mempunyai
background tentang apa yang akan
ditanyakan.
 Dalam mewawancarai jangan terlalu
kaku, tunjukkan sikap yang
bersahabat, bebas, ramah, terbuka, dan
dapat menyesuaikan diri.
 Hilangkan prasangka-prasangka yang
tidak baik.
 Pertanyaan hendaknya jelas, tepat, dan
denan bahasa yang sederhana.
 Hindari kevakuman pembicaraan yang
terlalu lama.
 Batasi waktu wawancara.
c. Angket (Quetioner)
Angket adalah sebuah daftar pertanyaan
yang harus diisi oleh orang yang akan diukur
(responden). Angket adalah alat penilaian
hasil belajar yang berupa daftar pertanyaan
tertulis untuk menjaring informasi tentang
sesuatu, misalnya tentang latar belakang
keluarga siswa, kesehatan siswa, tanggapan
siswa terhadap metode pembelajaran,
media, dan lain- lain. Angket umumnya
dipergunakan pada ranah afektif
d. Daftar Cek (Check List)
Daftar cek adalah deretan pertanyaan
singkat dimana responden yang dievaluasi

tinggal membubukan tanda centang (√)
pada aspek yang diamati sesuai dengan hasil
penilaiannya.
C. ALAT/INSTRUMEN PENILAIAN
1) Jenis Instrumen Penilaian
Berikut merupakan jenis instrumen penilaian antara lain:
a. Tes kemampuan standar (atau sering
disebut tes psikometri)
Tes ini dirancang untuk menjadi kurikulum
yang mandiri dan mengukur sifat yang lebih
tahan lama dan jangka panjang daripada
pencapaian pembelajaran, yaitu mengukur apa
yang dapat diketahui siswa daripada
pengetahuan yang diketahui.
b. Tes prestasi standar (atau sering sebagai
tes pencapaian)
Gunanya untuk mengukur apa yang
diketahui dan dapat digunakan siswa untuk
menilai, misalnya, pengetahuan dan
keterampilan siswa dalam melek huruf dan
berhitung, dan untuk menentukan kemajuan di
bidang ini.Dengan berjalan kaki informasi yang
dikumpulkan dari berbagai praktik penilaian
termasuk tes kemampuan dan pencapaian,
informasi lebih lanjut dapat dikumpulkan
melalui administrasi tes diagnostik untuk
memberikan pandangan yang lebih rinci
tentang kekuatan dan kebutuhan belajar siswa.

c. Tes diagnostik
Tes ini dirancang untuk memberikan
informasi spesifik tentang kekuatan dan
kebutuhan siswa dalam beberapa aspek
pembelajaran, misalnya, keterampilan
identifikasi kata atau pemahaman tentang
konsep bilangan.Selain itu, konselor bimbingan
dapat menggunakan hasil tes kemampuan dan
minat untuk membimbing dan mendukung
pengambilan keputusan siswa mengenai opsi
pilihan subjek dan opsi siklus senior dan untuk
mendukung pengembangan karir mereka,
termasuk perencanaan untuk pendidikan tinggi
dan / atau pendidikan lanjutan dan latihan.
2) Pemilihan instrumen penilaian
Sekolah hanya boleh menggunakan instrumen
penilaian yang sesuai dan memiliki tujuan yang jelas
dan pasti. Secara khusus, perawatan harus dilakukan
sehubungan dengan kesesuaian instrumen penilaian
yang digunakan dengan siswa dengan kebutuhan
pendidikan khusus (SEN) atau dengan siswa yang
belajar bahasa Inggris sebagai Bahasa Tambahan
(EAL).
Hasil penilaian seharusnya tidak dianggap definitif.
Kebutuhan siswa dan informasi kontekstual lainnya
harus selalu dipertimbangkan.Perlu dicatat bahwa
tidak semua instrumen yang tersedia untuk sekolah
memiliki norma Irlandia, dan beberapa belum direvisi
selama beberapa tahun. Perhatian harus diberikan oleh
pengguna untuk meneliti secara akurat kesesuaian,

reliabilitas dan validitas semua instrumen penilaian
yang dipilih untuk digunakan, dan untuk memastikan
bahwa versi yang digunakan paling mutakhir dan
sesuai untuk diberikan kepada kohort siswa tertentu.
Penggunaan instrumen penilaian di sekolah untuk
penilaian kepribadian tidak sesuai dan oleh karena itu
instrumen semacam itu tidak tercantum dalam daftar
di bawah ini.Petugas uji coba disarankan untuk
memeriksa secara dekat manual tes dan informasi
pendukung lainnya sebelum memilih tes. Dalam
memilih instrumen penilaian sekolah harus menyadari
kualifikasi yang dibutuhkan untuk mengelola,
mencetak, menafsirkan dan memberikan umpan balik
mengenai tes tertentu. Bila perlu, penerbit tes dapat
dihubungi untuk mendapatkan informasi lebih rinci
mengenai hal ini. National Educational Psychological
Service (NEPS) dan National Centre for Guidance in
Education (NCGE) juga memberikan informasi dan
saran tentang penggunaan dan kesesuaian instrumen
penilaian tertentu. Lihat daftar referensi yang berguna
di bawah ini.
Keterlibatan antara sekolah dasar dan pasca
sekolah dasar akan menginformasikan keputusan
seputar pemilihan dan waktu penilaian bagi siswa yang
baru mengikuti pendidikan pasca sekolah dasar.
Sekolah harus memanfaatkan Paspor Pendidikan
dengan sebaik-baiknya untuk mendukung pembagian
data yang relevan, termasuk hasil penilaian, saat siswa
mentransfer dari sekolah dasar ke sekolah pasca
sekolah dasar.

Mennurut Yessy (2015) yang dimaksud dengan alat
penilaian adalah instrument, perangkat, dokumen, dan
hal-hal lainnya yang dapat dipakai guru sebagai alat
untuk mengumpulkan hasil informasi. Dari berbagai
alat penilaian ada alat yang digunakan mengukur hasil
belajar siswa secara lebih tepat yang dapat dinamakan
alat pengukur. Alat pengukur ini dapat dianalogikan
dengan meteran yang digunakan untuk mengukur
panjang, lebar dan tinggi. Selain itu untuk menilai
pengetahuan siswa sebagai belajar adalah perangkat
tes presensi belajar selain itu untuk menilai apakah
keadaan belajar mahasiswa dapat juga digunakan
dokumen-dokumen lain, misalnya :
1. Buku catatan pribadi mahasiswa
Buku ini berisi data lengkap data pribadi
peserta didik termasuk di dalamnya data minat
dan bakat mereka, sikap dan kepribadian, watak
dan kebiasaanya.
2. Karangan, laporan, karya tulis
Hasil karya tulis, karangan dan laporan dari
peserta didik sangat bermanfaat bagi dosen terkait
penilaian verbal (kemampuan peserta didik dalam
mengunakan tata bahasa dalam mengerjaka tugas),
kemampuan ide-ide cemerlang, dan
mengekspresikan perasaannya .
3. Hasil peyelesaian tugas

Hasil kokulikuler merupakan hasil yang mana
dapat dinilai. Dan hasil penilaian tersebut dapat

dijadikan sebagai bahan masukan untuk
mengevaluasi peserta didik.
4. Hasil wawancara.
Pada sesekali waktu pendidik dapat melakukan
wawancara dengan peserta didik maupun dengan
wali untuk mengetahui hal hal tambahan yang
dibutuhkan.

BAB IV
PENILAIAN AUTENTIK
A. Definisi Autentik Assessment

Penilaian atau assesmen merupakan suatu
komponen penting dalam penyelenggaraan
pendidikan. Upaya meningkatkan kualitas
pendidikan dapat ditempuh melalui peningkatan
kualitas pembelajaran dan kualitas sistem
penilaiannya. Penilaian merupakan suatu kegiatan
yang sistematis untuk mengumpulkan, menganalisis
dan menyajikan informasi secara akurat dan
bermanfaat untuk menafsirkan keberhasilan belajar
siswa.
Sedangkan Stigins menjelaskan, bahwa
penilaian adalah proses pengumpulan informasi
tentang belajar siswa untuk perbaikan pembelajaran.
Wright dan Stones menuliskan “assement provides an
accounting of how much student learn in school and
what resources are expended on achieving those
learning outcome”. Penilaian dapat menjelaskan
seberapa jauh siswa belajar di sekolah dan sumber apa
saja yang diperlukan untuk mencapai hasil
pembelajaran tersebut. Sebagaimana dinyatakan
oleh Anthony J.Nitko (1996 : 4) bahwa penilaian adalah
suatu proses untuk memperoleh informasi yang
digunakan untuk membuat keputusan tentang
62 | Penilaian Autentik
peserta didik, kurikulum, program, dan kebijakan
pendidikan.
Sistem penilaian yang digunakan untuk
meningkatkan kualitas pendidikan adalah sistem
penilaian yang berkelanjutan. Dimana sistem
penilaian berkelanjutan memiliki prisnsip yaitu
menilai semua kompetensi dasar, menganalisis hasil
penilaian dan melakukan tindak lanjut yang berupa
program perbaikan atau program pengayaan. Sistem
penilaian yang biasa digunakan di Indonesia adalah
penilaian tradisional dengan menggunakan tes
objektif. Penilaian tradisional lebih tepat digunakan
untuk mengukur produk atau hasil belajar. Proses
pembelajaran yang dilalui tidak dapat diukur dengan
penilaian tradisional. Penggunaan penilaian
tradisional juga penting untuk mengukur tingkat
pemahaman peserta didik. Akan tetapi, penilaian
tradisional dengan menggunakan tes objektif tidak
dapat mengukur kompetensi peserta didik secara
keseluruhan. Selain itu, penggunaan tes objektif dalam
penilaian memiliki juga kelemahan lainnya, seperti
adanya kemuungkinkan faktor keberuntungan
peserta didik dalam memilih jawaban.
Sejalan dengan perkembangan ilmu
pengetahuan dan teknologi, Indonesia selalu
mengembangkan inovasi-inovasi baru untuk
mengimbangi perkembangan ilmu pengetahuan dan
teknologi yang semakin pesat. Salah satu inovasi
tersebut adalah memperbaharui kurikulum KTSP
menjadi kurikulum 2013 atau K13. Kurikulum 2013
menitikberatkan pada kompetensi sikap,
Penilaian Autentik | 63
pengetahuan, dan keterampilan. Ketiga komponen
tersebut secara eksplisit dinyatakan dalam kompetensi
inti yang harus dimiliki siswa. Kurikulum 2013 juga
mengatur kegiatan pembelajaran yang
mengutamakan pendekatan scientific (ilmiah) yaitu
mengamati, menanya, melatih, mencoba, menalar,
dan meng-komu- nikasikan. Perubahan yang
mendasar itu juga berdampak pada sistem penilaian
yang lebih mengarah ke penilaian otentik.
Penilaian otentik memiliki relevansi kuat
terhadap pendekatan scientific (ilmiah) dalam
pembelajaran sesuai dengan tuntutan kurikulum 2013.
Penilaian semacam ini mampu menggambarkan
peningkatan hasil belajar peserta didik, baik dalam
rangka mengobservasi, menalar, mencoba, mem-
bangun jejaring, dan lain-lain. Penilaian otentik
cenderung fokus pada tugas-tugas kompleks atau
kontekstual, memungkinkan peserta didik untuk
menunjukkan kompetensi mereka dalam
pengaturan yang lebih otentik. Karenanya, penilaian
otentik sangat relevan dengan pendekatan ilmiah
dalam pembelajaran.
Pada mulanya istilah autenetik assessment
atau penilaian otentik diperkenalkan oleh Grant
Wiggins (1990) yang menyatakan bahwa perlunya
kinerja ditampilkan secara efektif dan kreatif. Selain
itu tugas yang diberikan dapat berupa pengulangan
tugas atau masalah yang analog dengan masalah
yang dihadapi orang dewasa (warganegara,
konsumen, professional) di bidangnya. Pada saat itu
istilah tersebut digunakan untuk menyesuaikan
dengan apa yang dilakukan oleh orang dewasa
sebagai reaksi (menantang) penilaian berbasis sekolah
seperti mengisi titik-titik, tes tertulis, pilihan ganda, kuis
jawaban yang singkat. Jadi dikatakan otentik dalam
arti sesungguhnya dan realistis. Seperti halnya
dikatakan oleh Justin Allen bahwa Otentik sebagai
makna pada dasarnya itu sesuatu yang "nyata, benar
atau apa orang mengatakan itu" (ms. 6), ia
menyarankan istilah yang digunakan dalam berbagai
konteks sebagai benar atau nyata. Palm
menyimpulkan bahwa authenticityis yang
didefinisikan sebagai penilaian itu nyata dalam hal
proses dan produk, penilaian kondisi atau konteks
disajikan, dan benar hidup luar sekolah, kurikulum
dan praktek di ruang kelas atau belajar dan instruksi.
Sedangkan di Indonesia penilaian autentik
(authentic assesment) adalah suatu proses
pengumpulan, pelaporan dan penggunaan informasi
tentang hasil belajar siswa dengan menerapkan
prinsip-prinsip penilaian, pelaksanaan berkelanjutan,
bukti-bukti autentik, akurat, dan konsisten sebagai
akuntabilitas publik (Pusat Kurikulum, 2009).
Sebagaimana ditegaskan oleh (Nurhadi, 2004: 172)
yang menyatakan bahwa penilaian autentik adalah
proses pengumpulan informasi oleh guru tentang
perkembangan dan pencapaian pembelajaran yang
dilakukan oleh peserta didik melalui berbagai teknik
yang mampu mengungkapkan, membuktikan, atau
menunjukkan secara tepat bahwa tujuan
pembelajaran telah benar-benar dikuasai dan
dicapai.
Menurut John Mueller (2006) penilaian
autentik merupakan suatu bentuk penilaian yang
para siswanya diminta untuk menampilkan tugas
pada situasi yang sesungguhnya yang
mendemonstrasikan penerapan keterampilan dan
pengetahuan esensial yang bermakna. Pendapat
serupa dikemukakan oleh Richard J. Stiggins (1987),
bahkan Stiggins menekankan keterampilan dan
kompetensi spesifik untuk menerapkan keterampilan
dan pengetahuan yang dikuasai. Hal itu terungkap
dalam cuplikan kalimat berikut ini: “ performance
assessment call upon the examinee to demonstrate
specific skills and competencies, that is, to apply the
skills and knowledge they have mastered” (Stiggins,
1987:34)
Model penilaian autentik (authentic
assessment) pada saat ini banyak dibicarakan di dunia
pendidikan karena model penilaian otentik
direkomendasikan, atau bahkan harus ditekankan
penggunaannya dalam kegiatan penilaian hasil
belajar pada kegiatan pembelajaran. Hakikat
penilaian pendidikan menurut konsep authentic
assesment adalah proses pengumpulan berbagai data
yang bisa memberikan gambaran perkembangan
belajar siswa. Data yang dikumpulkan melalui
kegiatan penilaian (assesment) bukanlah untuk
mencari informasi tentang belajar siswa. Pembelajaran
yang benar seharusnya ditekankan pada upaya
membantu siswa agar mampu mempelajari (learning
how to learn), bukan ditekankan pada diperolehnya
sebanyak mungkin informasi di akhir periode
pembelajaran (Nurhadi, 2004: 168).
Penilaian autentik mementingkan penilaian
proses dan hasil sekaligus. Dengan demikian, seluruh
tampilan siswa dalam rangkaian kegiatan
pembelajaran dapat dinilai secara objektif, apa
adanya, dan tidak semata-mata hanya berdasarkan
pada hasil akhir (produk). Dalam penilaian
kemampuan bersastra misalnya, pebelajar mampu
menganalisis karakter tokoh dalam sebuah fiksi,
mempertanggungjawabkan kinerjanya tersebut
dengan argument yang tepat, atau membuat resensi
teks kesastraan. Masalah kinerja, performansi,
demonstrasi yang dimaksudkan tentu saja dalam
pengertian yang sesuai dengan karakteristik masing-
masing mata pelajaran. Tiap mata pelajaran tentu
memiliki kriteria kinerja yang belum tentu sama
dengan mata-mata pelajaran yang lain.
Kinerja hasil pembelajaran bahasa tentu tidak
sama dengan hasil pembelajaran matematika, teknik
otomotif, tata busana, seni musik, dan lain-lain.
Namun, pada prinsipnya semua mata pelajaran itu
haruslah melaksanakan penilaian dan salah satunya
dengan model penilaian autentik. Meskipun tiap mata
pelajaran berbeda karakteristik, baik yang termasuk
kategori ilmu-ilmu eksakta maupun sosial dan
humaniora, kesemuanya tampaknya dapat
menerapkan model penilaian autentik khususnya
yang berupa portofolio. Penilaian otentik merupakan
proses evaluasi yang melibatkan berbagai bentuk
kinerja pengukuran refleksi siswa belajar, prestasi,
motivasi, dan sikap instructionally-relevan kegiatan.
Contohnya yaitu penilaian kinerja, portofolio, dan
penilaian diri. Penilaian kinerja terdiri dari segala
bentuk penilaian di mana siswa konstruksi respon
secara lisan atau tertulis.
Penilaian Portofolio adalah sistematis koleksi
siswa bekerja bahwa dianalisis untuk menunjukkan
kemajuan seiring waktu berkaitan dengan tujuan
pengajaran. Penilaian menawarkan kesempatan bagi
siswa untuk belajar mengatur diri, dan tanggung
jawab menilai kemajuan nya sendiri. Penilaian yang
terintegrasi mengacu pada evaluasi beberapa
keterampilan atau penilaian bahasa dan konten
dalam aktivitas yang sama.
Berdasarkan penjelasan diatas, maka dapat
disimpulkan bahwa yang dimaksud dengan penilaian
otentik adalah kegiatan yang dilakukan oleh guru
untuk mengumpulkan informasi tentang
perkembangan dan pencapaian pembelajaran yang
dilakukan oleh peserta didik melalui berbagai teknik
yang mampu mengungkapkan, membuktikan, atau
menunjukkan secara tepat bahwa tujuan
pembelajaran telah benar-benar dikuasai dan dicapai
dengan menerapkan prinsip-prinsip penilaian,
pelaksanaan berkelanjutan, bukti-bukti autentik,
akurat, dan konsisten sebagai akuntabilitas publik.
B. Karakteristik Penilaian Autentik
Penilaian autentik adalah kegiatan menilai
peserta didik yang menekankan pada apa yang
seharusnya dinilai, baik proses maupun hasil dengan
berbagai instrumen penilaian yang disesuaikan
dengan tuntutan kompetensi yang ada di Standar
Kompetensi (SK) atau Kompetensi Inti (KI) dan
Kompetensi Dasar (KD) (Kunandar,2013:35-36). Dalam
pelaksanaannya di dunia pendidikan penilaian
autentik memiliki beberapa karakteristik. Adapun
beberapa karakteristik penilaian autentik, adalah
sebagai berikut:
1. Bisa digunakan untuk formatif maupun
sumatif, pencapaian kompetensi terhadap
satu kompetensi dasar (formatif) maupun
pencapaian terhadap standar kompetensi
atau kompetensi inti dalam satu semester
(sumatif)
2. Mengukur keterampilan dan performansi,
bukan mengingat fakta, menekankan
pencapaian kompetensi keterampilan (skill)
dan kinerja (performance), bukan kompetensi
yang sifatnya hafalan dan ingatan.
3. Berkesinambungan dan terintegrasi,
merupakan satu kesatuan secara utuh sebagai
alat untuk mengumpulkan informasi
terhadap pencapaian kompetensi siswa.
4. Dapat digunakan sebagai feed back, dapat
digunakan sebagai umpan balik terhadap
pencapaian kompetensi siswa secara
komprehensif.
Sedangkan menurut Santoso beberapa
karakteristik penilaian autentik adalah sebagai
berikut :
a. Penilaian merupakan bagian dari proses
pembelajaran.
b. Penilaian mencerminkan hasil proses belajar
pada kehidupan nyata.
c. Menggunakan bermacam-macam instrumen,
pengukuran, dan metode yang sesuai dengan
karakteristik dan esensi pengalaman belajar.
d. Penilaian harus bersifat komprehensif dan
holistik yang mencakup semua aspek dari tujuan
pembelajaran (Santoso, 2004).
Adapun Nurhadi juga mengemukakan
beberapa karakteristik authentic assesment, yakni:
a. Melibatkan pengalaman nyata (involves real-
world experience)
b. Dilaksanakan selama dan sesudah proses
pembelajaran berlangsung
c. Mencakup penilaian pribadi (self assesment) dan
refleksi
d. Aspek yang diukur keterampilan dan
performansi, bukan mengingat fakta
e. Berkesinambungan
f. Terintegrasi
g. Dapat digunakan sebagai umpan balik
h. Kriteria keberhasilan dan kegagalan diketahui
siswa dengan jelas (Nurhadi, 2004: 173).
Menurut Wiggins (1989), penilaian autentik
memiliki beberapa karakteristik umum.
Pertama, mereka dirancang untuk benar-
benar mewakili kinerja di lapangan. Siswa benar-
benar menulis - untuk khalayak yang sebenarnya -
daripada melakukan tes ejaan atau menjawab
pertanyaan tentang menulis. Mereka melakukan
eksperimen sains, daripada menghafal fakta terputus
tentang sains. Takss dikontekstualkan, tantangan
intelektual kompleks yang melibatkan penelitian
siswa sendiri atau penggunaan pengetahuan dalam
tugas "tidak terstruktur" yang memerlukan
pengembangan dan penggunaan keterampilan
meta-kognitif. Mereka juga memungkinkan ruang
yang sesuai untuk gaya belajar siswa, bakat, dan
minat untuk melayani sebagai sumber
pengembangan kompetensi dan untuk identifikasi
kekuatan (mungkin sebelumnya tersembunyi).
Kedua, kriteria yang digunakan dalam
penilaian berusaha untuk mengevaluasi kinerja
"penting" dibandingkan dengan standar kinerja yang
diartikulasikan dengan baik. Ini diungkapkan secara
terbuka kepada siswa dan orang lain di komunitas
belajar, bukan dirahasiakan dalam tradisi ujian
berdasarkan fakta yang tetap "aman".
Kriteria yang disarankan oleh tugas semacam
itu merupakan standar kinerja karena didasarkan
pada tujuan keseluruhan sekolah dan eksplisit, dan
beragam, mewakili berbagai aspek tugas, dan bukan
dikurangi menjadi dimensi tunggal atau kelas. Karena
kriteria berorientasi pada kinerja, mereka
membimbing pengajaran, pembelajaran, dan evaluasi
dengan cara yang menyinari tujuan dan proses
pembelajaran, menempatkan guru dalam peran
pelatih dan siswa dalam peran pemain, dan juga
evaluator diri.
Seperti yang disarankan di atas, penilaian diri
memainkan peran penting dalam tugas asli. Tujuan
utama penilaian autentik adalah untuk membantu
siswa mengembangkan kapasitas untuk mengevaluasi
pekerjaan mereka sendiri terhadap standar publik,
untuk merevisi, memodifikasi, dan mengalihkan
energinya, mengambil inisiatif untuk menilai
kemajuan mereka sendiri. Ini adalah aspek utama
dari self-directed work dan peningkatan self -
motivated yang dibutuhkan semua manusia dalam
situasi dunia nyata.
Akhirnya, para siswa sering diharapkan
mempresentasikan karyanya secara terbuka dan lisan.
Ini memperdalam pembelajaran mereka dengan
mengharuskan mereka merenungkan apa yang
mereka ketahui dan membingkainya dengan cara
yang orang lain juga dapat mengerti. Ini juga
memastikan penguasaan ide, konsep, atau topik
mereka terlihat asli.
C. Tujuan dan Prinsip-Prinsip Penilaian
Autentik
Penilaian autentik merupakan “a form of
assessment in which students are asked to perform real-
world tasks that demonstrate meaningful application
of essential knowledge and skills”. Jadi, penilaian
autentik merupakan suatu bentuk tugas yang
menghendaki pebelajar untuk menunjukkan kinerja
di dunia nyata secara bermakna yang merupakan
penerapan esensi pengetahuan dan keterampilan
(Mueller, 2008).
Tujuan penilaian autentik itu sendiri adalah
untuk:
1) menilai kemampuan individu melalui tugas
tertentu,
2) menentukan kebutuhan pembelajaran,
3) membantu dan mendorong siswa,
4) membantu dan mendorong guru untuk
mengajar yang lebih baik,
5) menentukan strategi pembelajaran,
6) akuntabilitas lembaga, dan
7) meningkatkan kualitas pendidikan (Santoso,
2004).
Penilaian autentik menjelaskan beberapa
bentuk penilaian yang mencerminkan siswa belajar,
prestasi, motivasi, dan sikap pada pembelajaran
kegiatan kelas yang relevan. Penilaian autentik pada
umumnya menyelesaikan tujuan berikut :
- Menekankan apa yang siswa tahu, daripada apa
yang mereka tidak tahu
- Memerlukan siswa untuk mengembangkan
tanggapan daripada memilih mereka dari pilihan
yang telah ditentukan
- Langsung mengevaluasi proyek holistik
- Menggunakan contoh karya siswa
mengumpulkan selama jangka waktu
- Berasal dari jelas kriteria yang dibuat dikenal
untuk siswa dan orang tua
- Elicits berpikir tingkat tinggi
- Memungkinkan untuk kemungkinan beberapa
penilaian manusia
- Berhubungan lebih dekat ke kelas belajar
- Teaches siswa untuk mengevaluasi mereka kerja
sendiri
- Considers perbedaan dalam belajar gaya,
menguasai bahasa, budaya dan pendidikan latar
belakang, dan tingkatan kelas
Penilaian otentik konsisten dengan praktik

kelas. Ini memiliki validitas instruksional dan kurikuler
karena prosedur penilaian dan konten berasal dari
pembelajaran sehari-hari siswa di sekolah. Dalam
prakteknya, ini berarti bahwa siswa ditanyai tentang
informasi yang berarti dan diminta untuk
memecahkan masalah yang relevan dengan
pengalaman pendidikan mereka Penilaian dalam
kurikulum 2013 mengacu pada Permendikbud No. 66
Tahun 2013 tentang Standar Penilaian Pendidikan,
berdasarkan Peraturan Menteri Pendidikan dan
Kebudayaan tujuan penilaian autentik adalah
sebagai berikut:
1. Perencanaan penilaian peserta didik sesuai
dengan kompetensi yang akan dicapai dan
berdasarkan prinsip-prinsip penilaian.
2. Pelaksanaan penilaian peserta didik secara
professional, terbuka, edukatif, efektif, efisien
dan sesuai dengan konteks sosial budaya.
3. Pelaporan hasil penilaian peserta didik secara
objektif, akuntabel, dan informatif.
Fungsi-fungsi penilaian autentik dalam
pendidikan menurut Masnur Muslich (2011: 8-11)
paling tidak dapat diklasifikasikan kedalam tiga
golongan yaitu:
a. Fungsi Pembelajaran
Penilaian autentik sangat penting perannya
dalam peningkatan mutu proses pembelajaran.
Dari proses penilaian dapat diperoleh informasi
tentang seberapa besar para peserta didik
berhasil mencapai kompetensi dasar yang telah
ditetapkan guru. Dengan demikian, hasil
penilaian memberikan umpan balik bagi guru
tentang seberapa besar ia berhasil
melaksanakan pembelajaran kepada peserta
didik untuk mencapai kompetensi dasar. Dan
guru dapat mengetahui pula kemampuan-
kemamapuan yang belum dikuasai dan sudah
dikuasi oleh peserta didik.
Informasi ini berguna bagi guru untuk
melakukan usaha perbaikan dan peningkatan
pembelajaran. Pada sisi lain, penilaian juga
memberikan fungsi motivasi kepada peserta
didik, dimana dalam diri peserta didik selalu ada
dorongan untuk memperoleh hasil yang baik
dalam setiap penilaian. Penilaian yang
dilaksanakan secara intensif dan teratur akan
menumbuhkan kebiasaan belajar yang baik.
b. Fungsi Administrasi
Penilaian autentik sangat diperlukan untuk
keputusan yang bersifat administratif. Secara
berkala kantor-kantor wilayah Depdiknas
biasanya menetukan kualifikasi setiap sekolah,
apakah termasuk baik, sedang atau kurang. Hal
ini diperlukan dalam rangka program
pembinaan dan pengembangan sekolah. Salah
satu informasi yang diperlukan adalah hasil
prestasi belajar para peserta didik. Bahkan dari
penilaian autentik dapat pula diketahui sejauh
mana kurikulum dilaksanakan di suatu sekolah.
Untuk sekolah yang memiliki banyak calon
peserta didik tetapi tidak banyak kursi yang
tersedia maka bisa memberikan tes masuk
sebagai seleksinya. Dari tes seleksi ini juga bisa
mempengaruhi akreditasi suatu sekolah. Setiap
akhir semester pihak sekolah membagikan buku
rapor. Buku ini sebagai laporan sekolah kepada
masing-masing orang tua peserta didik tentang
prestasi belajar anaknya selama satu semester
yang baru saja dilampauinya. Nilai-nilai rapor
hendaknya berdasarkan penilaian autentik
yang dilakukan secara cermat agar
memberikan informasi secara berguna bagi para
orang tua peserta didik, sebagai bahan
bimbingan dan pengarahan kepada anak-
anaknya.
Penilaian autentik juga berfungsi sebagai
penentuan kenaikan kelas dan tindak lanjut ke
studi yang lebih tinggi lagi. Sehingga penilaian
autentik harus dilandasi pada informasi yang
tepat tentang kemampuan peserta didik yang
sesungguhnya.
c. Fungsi Bimbingan
Di samping sekolah memberikan
serangkaian pengetahuan, keterampilan dan
sikap tertentu kepada peserta didik, sekolah pun
perlu informasi tentang bakat-bakat khusus
yang dimiliki peserta didik. Informasi bakat ini
dapat memberikan saran kepada orang tua
tentang bidang pelajaran atau bidang minat
pekerjaan yang lebih sesuai dengan bakat
peserta didik. Keserasian antara bakat dan jenis
pekerjaan merupakan salah satu unsur penting
dari keberhasilan seseorang dalam
kehidupannya.
Informasi tentang bakat khusus setiap
peserta didik dapat diperoleh dari penilaian
khusus. Untuk melakukan penilaiannya
diperlukan alat-alat ukur khusus dan dengan
cara khusus pula, bisa dengan orang-orang
profesional saat melakukan penilaian. Sekolah
bisa meminta bantuan pada lembaha pengujian
psikologis. Berdasarkan informasi tentang bakat
peserta didik tersebut, sekolah dapat
memberikan bimbingan dan pengarahan agar
peserta didik dapat mengarahkan bakatnya
secara maksimal, sebagaimana yang
diharapkan lembaga-lembaga pendidikan.
Ada banyak buku dan artikel tentang
penilaian autentik. Banyak penulis telah
mengabdikan hidup mereka untuk penilaian
examing, menawarkan kritik kuat terhadap tes
standar, dan memberikan alternatif yang masuk akal
untuk tes standar yang seragam. Penulis seperti Grant
Wiggins (1993, 19999), Alfie Kohn (2000, 2004), Ray
Horn dan Joe Kincheloe (2001), Mark Goldberg (2005),
dan Susan Ohanian (1999) telah menerbitkan banyak
buku dan artikel tentang topik ini. Wiggins (1998)
menyarankan standar penilaian autentik berikut ini :
1. Ini realistis. Tugas penilaian harus mengikuti
dengan cermat cara-cara di mana kemampuan
seseorang "diuji" dalam kata sebenarnya.
Misalnya, sebagai mantan penari, kami
mempraktikkan latihan menari seperti plies,
jetes, turns, dan sebagainya di kelas balet. Ini
hanyalah latihan. Tugas penilaian realistis akan
ditemukan dalam kinerja ballet sebenarnya. Di
Ballber Nutcracker Suite, anggaplah pemeran,
saya terpaksa menunjukkan apa yang bisa saya
lakukan. Ini adalah tes yang realistis, ukuran
penilaian yang autentik.
2. Hal ini membutuhkan penilaian dan inovasi.
Disini siswa harus menggunakan pengetahuan
dan keterampilan untuk memecahkan masalah.
3. Meminta siswa untuk melakukan subjek.
Kembali ke penari balet, penari harus
meletakkan semua langkah bersama dan
berperan dalam balet yang sebenarnya.
4. Ini mereplikasi atau menstimulasi "tes" aktual di
tempat kerja, kehidupan pribadi, dan
kehidupan sipil. Karena setiap siswa berada
pada tahap pertumbuhan dan perkembangan
yang unik pada waktu tertentu, mengapa
penilaian authentiv lebih masuk akal daripada
tes standar yang dibuat dengan mudah dapat
diapresiasi. Untuk satu hal, satu ukuran tidak
sesuai untuk semua siswa. Akal sehat pasti
menunjukkan hal ini.
5. Ini menilai kemampuan dan keterampilan siswa
untuk secara efektif dan efisien menggunakan
repertoar banyak keterampilan untuk
menyelesaikan masalah atau tugas. Dalam hal
mengakses lebih dari sekedar keterampilan
verbal atau matematis, penilaian autentik
bergantung pada semua kecerdasan yang dapat
dikembangkan seseorang.
6. Ini memungkinkan banyak kesempatan untuk
berlatih, berlatih, berkonsultasi, mendapatkan
umpan balik, dan memperbaiki pertunjukan
dan produksi aktual. Dengan demikian kita
memiliki kinerja, umpan balik, revisi kinerja,
umpan balik, kinerja, dan sebagainya. Dengan
kata lain, siswa harus belajar sesuatu dan
menjadi lebih baik dalam melakukan tugas
yang ada. Dalam banyak hal, ini adalah llike
para seniman yang memiliki kritik konstan
untuk perbaikan. Untuk menggunakan tarian
sebagai contoh sekali lagi, setelah setiap
pertunjukan, direktur bagian pertunjukan
biasanya membaca "catatan kritik" di akhir
setiap pertunjukan. Dengan demikian konsep
yang dibangun ke dalam feedback adalah
asumsi bahwa siswa akan bekerja untuk
meningkatkan performance test selanjutnya.
Penilaian autentik berbeda dari ukuran
standar dan alternatif karena mereka berbasis kinerja
dan mencakup keputusan dan perilaku nyata dalam
profesi dalam sebuah disiplin. Armstrong (1994)
mencirikan penilaian autentik sebagai hal yang sah
karena mereka secara intelektual menantang namun
responsif terhadap siswa dan sekolah. Penilaian
autentik tidak berfokus pada pengetahuan faktual
sebagai tujuan akhir. Sebaliknya, ini berfokus pada
kemampuan untuk menggunakan pengetahuan,
keterampilan, dan proses yang relevan untuk
memecahkan masalah terbuka selama tugas yang
berarti. Faktor kunci lain yang membedakan
penilaian autentik dari yang tradisional adalah bahwa
mereka memberi kesempatan kepada siswa untuk
mengintegrasikan berbagai jenis pembelajaran.
Baik formatif, sumatif, standar, autentik,
alternatif, atau diciptakan oleh guru atau spesialis
penilaian, tidak ada ukuran penilaian yang dapat
menangkap semua jenis dan tingkat pembelajaran
yang terjadi di kelas seni. Memang, jika setiap jenis
ukuran yang mungkin digunakan pada setiap produk
siswa, pembelajaran yang signifikan akan tetap tidak
terukur karena sifat pembelajaran yang sangat
kompleks yang rutin terjadi.
Membuat penilaian itu autentik juga
melibatkan pemahaman bahwa usaha perlu
difokuskan untuk membantu siswa belajar. Kita harus
jelas tentang apa yang ingin kita ketahui dan dapat
lakukan. Kita juga perlu memastikan bahwa tindakan
yang kita gunakan dan hasil yang kita dapatkan
secara akurat. mencerminkan apa yang benar-benar
diketahui dan dapat dilakukan oleh siswa. Dalam
penilaian autentik, kita harus ingat bahwa tujuan kita
adalah untuk meningkatkan kualitas pembelajaran
siswa dan memanfaatkan kekuatan siswa daripada
kelemahan mereka. Intinya dalam penilaian autentik
benar-benar tentang membantu siswa menetapkan
standar prestasi mereka sendiri yang tinggi.
Karena instrumen yang dirancang untuk
proyek ini terutama dibutuhkan untuk penilaian
kinerja, diputuskan bahwa pendekatan autentik akan
lebih sesuai dengan tujuan penilaian proyek. Penilaian
autentik memerlukan konstruksi item penilaian
alternatif (Armstrong, 1994). Penilaian alternatif
dianggap salah satu alternatif untuk apa yang
tradisional (tes objektif dan esai). Hal ini juga
difokuskan pada kinerja siswa, yang merupakan bukti
nyata dari apa yang dapat diketahui dan dapat
dilakukan siswa. Penilaian autentik memerlukan
kinerja yang benar, termasuk keputusan hidup nyata,
seperti perilaku estetika, arsitek, sejarawan seni dan
kritikus, seniman seperti seniman rakyat, orang-orang
yang bekerja dalam segala bentuk yang menghadapi
seni dalam kehidupan sehari-hari mereka, dan orang-
orang yang avokasionalnya. kegiatan berhubungan
dengan seni. Pembelajaran autentik dalam seni
menyiratkan aplikasi informasi yang relevan dan
bermanfaat, berlawanan dengan perolehan
pengetahuan faktual untuk kepentingannya sendiri.
Ini juga mengilhami perubahan dalam praktik
kurikuler dalam proses penilaian.
Penilaian autentik bukan tanpa kritiknya.
Sebagian besar kritik terhadap penilaian alternatif
berasal dari keinginan pengembang uji untuk
memiliki populasi yang stabil agar memperoleh data
keras yang dapat ditangani secara statistik dan dapat
dilaporkan sebagai prediktif atau sebagai skor yang
diacu norma. Ini mengharuskan siswa dan materi
pelajaran untuk diukur juga stabil dan mudah
ditebak. Masalahnya adalah, dalam usaha menilai
pertunjukan dalam kehidupan nyata, tujuan konten
biasanya.
D. Fitur Penilaian Aautentik (Features Of

Authentic Assessment)
Secara havedeliberately memilih untuk
menunjukkan dengan contoh seperti penilaian
autentik, karena definisi sederhana tidak menangkap
dinamika interpersonal dan kekuatan penilaian yang
autentik. Lebih jauh lagi, kita tahu bahwa apa yang
"asli" dalam bahasa anak sekolah atau dalam satu
keadaan mungkin tidak terlalu autentik di sekolah
atau negara lain. Mengapa? Karena penilaian
autentik ditentukan oleh kesesuaian situasional dari
praktik pengajaran dan pembelajaran. Tugas semua
guru adalah untuk membuat penilaian di kelas
mereka mencerminkan nilai harapan dalam
kurikulum mereka dan disesuaikan dengan metode
pembelajaran mereka sehingga siswa menganggap
penilaian tersebut asli dan adil. Meski mengalami
kesulitan mendefinisikan penilaian autentik dengan
satu cara, penting untuk mengidentifikasi beberapa
prinsip yang menjadi dasar pendekatan. Valencia,
Hiebert, dan Afflerbach (1994) memberikan diskusi
panjang dan contoh kelas tambahan tentang
penilaian autentik yang menampilkan beberapa fitur
berikut:
1. Penilaian autentik konsisten dengan
penerapan kelas. Ini memiliki validitas
instruksional dan kurikuler karena prosedur
penilaian dan konten berasal dari
pembelajaran sehari-hari siswa di sekolah.
Dalam praktiknya, ini berarti bahwa siswa
ditanyai tentang informasi yang benar dan
diminta memecahkan masalah yang relevan
dengan pengalaman pendidikan mereka.
2. Penilaian autentik mengumpulkan beragam
bukti tentang kemampuan belajar siswa dari
berbagai aktivitas. Alih-alih mengandalkan
satu tes tunggal atau sampel sisipan
pengetahuan siswa yang sempit, penilaian
autentik melibatkan pengumpulan waktu dari
banyak kegiatan akademik yang berbeda
(CalfeeQ Hiebert, 1990). Pengukuran kinerja ini
mencakup pembacaan dan retellings lisan,
multiplechoicetests tentang teks, tanggapan
tertulis terhadap literatur, penulisan kreatif,
buku catatan, dan jurnal (Winograd, Paris, Q
Bridge, 1991).
3. Penilaian autentik mendorong pembelajaran
dan pengajaran di antara para peserta.
Penilaian bersifat fungsional, pragmatis, dan
bermanfaat. Messick (1989) berpendapat
bahwa validitas untuk memasukkan sebuah
akun konsekuensi dari penilaian sehingga
menghasilkan efek yang diinginkan dan tidak
memiliki konsekuensi yang tidak disengaja
(bandingkan Linn, Baker, QDunbar, 1991).
Dengan demikian, penilaian autentik
berupaya mendorong pembelajaran dan
motivasi para promotor secara langsung dan
dinilai berdasarkan patokan tersebut.
4. Penilaian autentik mencerminkan nilai,
standar, dan kontrol lokal. Hal ini tidak
dipaksakan secara eksternal dengan norma
dan harapan dari populasi yang tidak
diketahui, juga kewenangan kontroversial
yang dikeluarkan dari para peserta. Penilaian
kebenaran dapat dimodifikasi oleh para guru
untuk memastikan kinerja optimal dari siswa
dan memberikan informasi yang berguna
kepada orang tua dan administrator. Apa yang
diukur dinilai di masyarakat, dan bagaimana
asasnya meyakinkan bahwa siswa
memberikan indikator kinerja mereka yang
andal.
E. Cakupan Penilaian Autentik

Ada tiga aspek yang dinilai autentik yaitu
kognitif, afektik, dan psikomotorik. Griffin dan
Peter (1991: 52-61) mengatakan bahwa aspek yang
dinilai memiliki karakteristik sendiri dan
membutuhkan bentiuk penilian yang berbeda.
Seperti penjelasan di bawah ini.
1. Kognitif
Aspek ini berhubungan dengan kemampuan
indivual yang ditunjukan siswa dengan
memperoleh hasil dari pembelajaran yang
telah ddilakukan.
Bentuk penilaian kognitif ini secara eksplisit
ataupun implisit harus mempresentasikan
tujuan capaian pembelajaran. Tes yang
dilakukan oleh guru dapat berupa ujian untuk
mengetahui pemahaman terhadp materi.
2. Afektif
Alport (dalam Griffin dan Peter, 1991: 56)
menyatakan bahwa afektif merupakan
bentuk integrasi dari beberapa karakter, yaitu
prediksi respons baik dan tidak baik, sikap
dibentuk, pengalaman, tercermin dalam
kegiatan sehari-hari.
Komponen yang dinilai pada sikap siswa
meliputi emosi, target, dan ketertarikan.
Indikator yang dapat digunakan pada skala
sikap misalnya baik-tidak baik, indikator pada
minat misalnya tertarik-tidak tertarik, dan
sebagainya.
3. Psikomotorik
Penilaian psikomotorik merupakan bentuk
pengukuran kemampuan fisik siswa yang
meliputi otot, kemampuan bergerak,
memanipulasi objek, dan koordinasi otot saraf.
Contohnya pada kemampuan otot kecil
(misalnya: mengetik) atau otot besar
(melompat).
Penilaian hasil belajar peserta didik dalam

konteks Kurtilas mencapai kompetensi sikap,
pengetahuan, dan keterampilan yang dilakukan
secara berimbang sehingga dapat digunakan
untuk menentukan posisi relatif setiap peserta didik
terhadap standar yang telah ditetapkan. Dalam
Permendikbud Nomor 66 Tahun 2013 dinyatakan
bahwa cakupan penilaian merujuk pada ruang
lingkup materi, kompetensi mata
pelajaran/kompetensi muatan/ kompetensi
program, dan proses. Sejalan dengan cakupan
tersebut, teknik dan instrumen yang digunakan
untuk penilaian kompetensi sikap, pengetahuan,
dan keterampilan adalah sebagai berikut;
1. Penilaian Kompetensi Sikap

Penilaian kompetensi sikap adalah
penilaian yang dilakukan guru untuk
mengukur tingkap pencapaian kompetensi
sikap dari peserta didik yang meliputi aspek
menerima atau memerhatikan (receiving atau
attending), merespon atau menanggapi
(responding), menilai atau menghargai
(valuing), mengorganisasi atau mengelola
(organization), dan berkarakter
(characterization).
Dalam Kurtilas kompetensi sikap dibagi
menjadi dua yakni sikap spiritual dan sikap
sosial. Bahkan kompetensi sikap masuk menjadi
kompetensi inti, yakni, Kompetensi Inti 1 (KI-1)
untuk sikap spiritual dan Kompetensi Inti 2 (KI-
2) untuk sikap sosial. Pada Kurtilas ini,
kompetensi sikap, baik sikap spiritual (KI-1)
maupun sikap sosial (KI-2) tidak diajarkan
dalam Proses Belajar Mengajar (PMB). Namun
meskipun kompetensi sikap dan sosial tersebut
tidak diajarkan, kompetensi tersebut harus
terimplementasikan dalam PMB melalui
pembiasaan dan keteladanan yang
ditunjukkan oleh peserta didik dalam
keseharian melalui dampak pengiring
(nurturant effect) dari pembelajaran.
Menurut Permendikbud Nomor 66 Tahun
2013 menjelaskan bahwa pendidikan
melakukan penilaian kompetensi sikap melalui
observasi, penilaian diri, penilaian “teman
sejawat” (peer evaluation) oleh peseta didik,
dan jurnal. Instrumen yang digunakan untuk
observasi, penilaian diri dan Penilaian antar
peserta didik adalah daftar cek atau skala
penilaian (rating scale) yang disertai rubik,
sedangkan pada jurnal berupa catatan
pendidik.
a) Observasi merupakan teknik penilaian yang
dilakukan secara berkesinambungan
dengan menggunakan indra, baik secara
langsung maupun tidak langsung dengan
menggunakan pedoman observasi yang
berisi sejumlah indikator perilaku yang
diamati.
b) Penilaian diri merupakan teknik penilai
dengan cara meminta peserta didik untuk
mengemukakan kelebihan dan
kekurangan dirinya dalam konteks
pencapaian kompetensi. Instrumen yang
digunakan berupa lembar penilaian diri.
c) Penilaian antar peserta didik merupakan
teknik penilaian dengan cara meminta
peserta didik untuk mengemukakan
kelebihan dan kekurangan dirinya dalam
konteks pencapaian kompetensi. Instrumen
yang digunakan berupa lembaran
penilaian antar peserta didik.
d) Jurnal merupakan catatan peserta didik di
dalam dan di luar kelas yang berisi informasi
hasil pengamatan tentang kekuatan dan
kelemahan peserta didik yang berkaitan
dengan sikap dan prilaku.
2. Penilaian Kompetensi Pengetahuan

Penilaian kompetensi pengetahuan atau
kognitif adalah penilaian yang dilakukan guru
untuk mengukur tingkat pencapaian atau
penguasaan peserta didik dalam aspek
pengetahuan yang meliputi ingatan atau
hafalan, pemahaman, penerapan atau aplikasi,
analisis, sintesis dan evaluasi. Dalam Kurtilas
kompetensi pengetahuan menjadi kompetensi
inti dengan kode Kompetensi Inti 3 (KI-3).
Kompetensi pengetahuan merefleksikan
konsep- konsep keilmuan yang harus dikuasi
oleh peserta didik melalui poses belajar
mengajar.20
Dalam Permendikbud Nomor 66 Tahun
2013 menjelaskan bahwa pendidikan menilai
kompetensi pengetahuan siswa melalui tes tulis,
tes lisan, dan penugasan. Instrumen tes tulis
yang biasa digunakan guru berupa soal pilihan
ganda, isian, jawaban singkat, benar salah,
menjodohkan, dan uraian yang dilengkapi
pedoman penskoran, instrumen test lisan
berupa daftar pertanyaan dan instrumen
penugasan berupa pekerjaan rumah dan/atau
proyek yang dikerjakan secara individu atau
kelompok sesuai dengan karakteristik tugas.
3. Penilaian Kompetensi Keterampilan

Penilaian kompetensi keterampilan adalah
penilaian yang dilakukan guru untuk
mengukur tingkat pencapaian kompetensi
keterampilan dari peserta didik yang meliputi
aspek imitasi, manipulasi, presisi, artikulasi, dan
naturalisasi. Kompetensi Inti (KI-4), yakni
keterampilan tidak dapat dipisahkan dengan
Kompetensi Inti 3 (KI-3), yakni pengetahuan.
Artinya kompetensi pengetahuan itu
menunjukkan peserta didik tahu akan
keilmuan dan kompetensi keterampilan itu
menunjuk peserta didik bisa (mampu) tentang
keilmuan tertentu tersebut. Dalam Kurtilas
kompetensi keterampilan menjadi Kompetensi
Inti 4 (KI-4).
Dalam Permendikbud Nomor 66 Tahun
2013 menjelaskan bahwa pendidikan menilai
kompetensi keterampilan melalui penilaian
kinerja, yaitu penilaian yang menuntut peserta
didik mendemonstrasikan suatu kompetensi
tertentu dengan menggunakan tes praktik,
proyek, dan penilaian portofolio. Instrumen
yang digunakan berupa daftar cek atau skala
penilaian (rating scale) yang dilengkapi rubrik.
Berdasarkan penjabaran di atas, instrumen
penilaian harus memenuhi persyaratan:
mempresentasikan kompetensi yang ada dinilai,
susunan penilaian memenuhi persyaratan teknis
sesuai dengan bentuk instrumen yang digunakan,
dan penggunaan bahasa yang baik dan benar
serta komunikatif sesuai dengan perkembangan
siswa.
Prinsip yang paling penting dari penilaian
autentik adalah dalam pembelajaran tidak hanya
menilai apa saja yang sudah diketahui oleh siswa,
tetapi juga menilai apa yang dapat dilakukan oleh
siswa setelah pembelajaran selesai. Sehingga
kualitas hasil belajar dan kerja siswa dalam
menyelesaikan tugas dapat terukur. Maka dari itu
dapat ditarik kesimpulan dalam melakukan
penilaian autentik ada tiga hal yang harus
diperhatikan, yakni:
1. Autentik dari instrumen yang digunakan,
menggunakan instrumen yang bervariasi yang
disesuaikan dengan karakteristik atau tuntutan
kompetensi yang ada dikurikulum.
2. Autentik dari aspek yang diukur, menilai
aspek-aspek hasil belajar secara komprehensif
meliputi kompetensi sikap, keterampilan dan
pengetahuan.
3. Autentik dari aspek kondisi siswa, menilai input
(kondisi awal siswa), proses (kinerja dan
aktivitas siswa dalam proses belajar mengajar),
dan output (hasil pencapaian kompetensi, baik
sikap, keterampilan maupun pengetahuan
siswa setelah mengikuti proses belajar
mengajar).
Melalui kurikulum 2013 penilaian autentik
menjadi penekanan dalam melakukan penilaian
hasil belajar siswa yang memperhatikan seluruh
minat, potensi dan prestasi siswa secara
menyeluruh. Penilaian juga dilakukan secara
sistematis dan berkesinambungan agar dapat
menggambarkan kemampuan para siswa yang
dievaluasi. Sangat penting untuk melibatkan siswa
dalam penilaian, sehingga siswa secara sadar dapat
mengenali perkembangan pencapaian hasil
pembelajaran mereka.
F. Alternatif Penilaian Autentik

Penilaian autentik adalah rencana yang
disengaja untuk menyelidiki perilaku alami anak-
anak. Informasi ditangkap melalui pengamatan
langsung dan rekaman, wawancara, skala penilaian,
dan contoh pengamatan permainan alami atau
difasilitasi dan keterampilan hidup sehari-hari anak-
anak. Ada empat perbedaan utama antara penilaian
autentik dan pengujian konvensional: di mana hal itu
dilakukan, apa yang dinilai, bagaimana hal itu
dilakukan, dan siapa yang melakukannya.
Pertama, perbedaan penting adalah konteks
(di mana) untuk penilaian. Penilaian autentik
bergantung pada informasi yang hanya dapat
diperoleh di lingkungan alami anak. Lingkungan ini
adalah rutinitas harian yang terus berlanjut dan
keadaan khas anak. Contoh lingkungan alam adalah
anak-anak yang bermain di tempat prasekolah
mereka sendiri, di rumah saat mandi, di tempat
penitipan anak, di supermarket, dan di gereja. Ini
berbeda dengan dekontekstualisasi, pengaturan yang
dibuat-buat yang menjadi ciri praktik psikometrik
konvensional. Lingkungan pengujian konvensional
biasanya menggunakan klinik atau pengaturan
"laboratorium" seperti ruang pengujian sekolah atau
ruang pemeriksaan rumah sakit.
Seperti yang ditunjukkan, pengujian
konvensional berfokus pada konten item standar
("apa") dan hanya memiliki sedikit penggunaan
instruksional. Sebaliknya, item untuk penilaian
autentik adalah perilaku nyata yang memiliki
kepentingan fungsional bagi anak-anak dan
kemajuannya (misalnya, melintasi ruangan,
mengkomunikasikan keinginan dan kebutuhan,
memilih apel dan bukan buah pir, dan memikirkan
bagaimana mainan bekerja). Perhatikan bahwa
semua ini adalah kompetensi yang berharga, dapat
diajar, dan dihargai secara sosial. Validasi lapangan
dan norma instrumen penilaian untuk individu
penyandang cacat harus menekankan standarisasi
fungsi daripada bentuk perilaku yang diteliti.
Pengujian konvensional mencatat respons
sempit anak terhadap objek dan prosedur standar dan
tidak mengizinkan akomodasi untuk kebutuhan
khusus ("bagaimana"). Penilaian autentik bergantung
pada pengamatan alami terhadap respons anak
terhadap rutinitas sehari-hari; Dalam konteks ini, anak
dapat menunjukkan kompetensi dengan cara apa
pun yang mungkin. Anak yang buta bisa
menunjukkan keabadian objek dengan menjelajahi
lingkungan dengan tekun dalam mencari mainan
tersembunyi; asli penilaian tidak mengharuskan anak
untuk hanya menunjukkan respons sempit untuk
menemukan dan melihat mainan tersembunyi di
bawah cangkir standar. Kandungan konten
mengundang pengajaran karena item tersebut
bersifat precursive atau merupakan bagian dari
kurikulum. Dengan pendekatan fungsional, lapangan
bermain untuk mendokumentasikan kemampuan
menjadi level dan noninferensial. Item psikometri
konvensional tidak membangun blok untuk
kompetensi masa depan, dan prosedur psikometrik
melarang "pengajaran untuk tes," dan karenanya
tidak peka terhadap kemajuan dan hasil fungsional.
Hanya profesional tertentu, seringkali psikolog,
diizinkan melakukan tes psikometri tradisional
("siapa"). Para profesional ini terutama bukan
anggota program anak yang tidak terpisahkan dan
kemungkinan besar adalah orang asing bagi anak-
anak mereka. Dalam kebanyakan kasus, profesional
asing ini melakukan tes sebagai individu dan bukan
sebagai anggota tim sejati. Di sisi lain, penilaian
autentik bergantung pada pengamatan orang
dewasa yang familiar dalam kehidupan anak untuk
menyediakan data konvergen tentang fungsi
kehidupan nyata. Susunan anggota keluarga,
pengasuh anak, guru, dan interdisipliner profesional
membentuk tim yang mengenal anak dengan baik
dan bekerja untuk membantu anak tersebut.
Dibutuhkan lebih banyak waktu, usaha,
keterlibatan, pelatihan guru, dan pengembangan
profesional guru untuk menerapkan teknik penilaian
autentik. Sejak tahun 1980 pendidik telah berteriak
untuk mengetahui lebih banyak tentang penilaian
autentik di setiap negara bagian di negara ini.
Mengapa? Sederhananya, karena itu masuk akal.
Apakah kita ingin anak-anak kita dinilai dan dinilai
dengan tes satu pukulan yang memberikan skor
sederhana, atau lebih baik kita menilai siswa dinilai
dan dinilai berdasarkan tugas kinerja yang tidak
hanya menunjukkan apa yang mereka langgeng tapi
juga apa yang dapat mereka lakukan? Alasan untuk
memilih penilaian autentik adalah solid dan jelas:
a. Penilaian autentik secara keseluruhan adalah
adil. Tidak ada satu kelompok ras atau etnis
yang dihukum dengan skor satu tembakan;
b. Penilaian autentik menceritakan banyak hal
tentang bagaimana siswa menghubungkan
pengetahuan konten ke masalah tertentu di
dunia sudent;
c. Penilaian autentik secara keseluruhan
memberikan umpan balik mengenai kemajuan
siswa;
d. Penilaian autentik menunjukkan bagaimana
seorang siswa mengkontruksi suatu produk atau
kinerja sehingga pertumbuhan siswa dapat
dilihat;
e. Penilaian autentik secara keseluruhan
memberikan umpan balik yang
berkesinambungan, memungkinkan siswa untuk
menyesuaikan dan meningkatkan kinerja;
f. Penilaian autentik memberi siswa suatu
kepentingan nyata dan partisipatif dalam proses
pembelajaran;
g. Penilaian autentik menghilangkan penekanan
pada menghafal fakta dan mengulanginya; dan
h. Penilaian autentik memungkinkan tugas kinerja
untuk evaluasi.
G. Manfaat Penggunaan Penilaian Autentik

Mengapa penilaian autentik kini disarankan
penggunaannya? Apakah model itu berbeda dan
menjanjikan hasil yang secara teoretis berbeda dengan
model penilaian tradisional? Jawabannya adalah
karena penilaian autentik menekankan capaian
pembelajar untuk menunjukkan kinerja, doing
something, kesiapan pembelajaran untuk berunjuk
kerja selepas mengikuti kegiatan pembelajaran tentu
lebih signifikan. Selain itu, ada beberapa manfaat lain
penggunaan penilaian autentik, sebagaimana
dikemukakan Mueller (2008), yaitu sebagai berikut.
Pertama, penggunaan penilaian autentik
memungkinkan dilakukannya pengukuran secara
langsung terhadap kinerja pembelajar sebagai
indikator capain kompetensi yang dibelajarkan.
Penilaian yang hanya mengukur capaian
pengetahuan yang telah dikuasai pembelajar hanya
bersifat tidak langsung. Tetapi, penilaian autentik
menuntut pembelajar untuk berunjuk kerja dalam
situasi yang konkret dan sekaligus bermakna yang
secara otomatis juga mencerminkan penguasaan dan
keterampilan keilmuannnya. Unjuk kerja tersebut
bersifat langsung, langsung terkait dengan konteks
situasi dunia nyata dan tampilannya juga dapat
diamati langsung. Hal itu lebih mencerminkan tingkat
capaian pada bidang yang dipelajari. Misalnya, dalam
belajar berbicara bahasa target, pembelajar tidak
hanya berlatih mengucapkan lafal, memilih kata, dan
menyusun kalimat, melainkan juga
mempratikkannya dalam situasi konkret dan dengan
topic aktual-realistik sehingga menjadi lebih
bermakna.
Kedua, penilaian autentik memberikan
kesempatan pembelajar untuk mengkonstruksikan
hasil belajarnya. Penilaian haruslah tidak sekadar
meminta pembelajar mengulang apa yang telah
dipelajari karena hal demikian hanyalah melatih
mereka menghafal dan mengingat saja yang kurang
bermakna. Dengan penilaian autentik pembelajar
diminta untuk mengkonstruksikan apa yang telah
diperoleh ketika mereka dihadapkan pada situasi
konkret. Dengan cara ini pembelajar akan menyeleksi
dan menyusun jawaban berdasarkan pengetahuan
yang dimiliki dan analisis situasi yang dilakukan agar
jawabannya relevan dan bermakna.
Ketiga, penilaian autentik memungkinkan
terintegrasikannya kegiatan pengajaran, belajar, dan
penilaian menjadi satu paket kegiatan yang terpadu.
Dalam pembelajaran tradisional, juga model penilaian
tradisional, antara kegiatan pengajaran dan penilaian
merupakan sesuatu yang terpisah, atau sengaja
dipisahkan. Namun, tidak demikian halnya dengan
model penilaian autentik. Ketiga hal tersebut, yaitu
aktivitas guru membelajarkan, siswa belajar, dan guru
menilai capaian hasil belajar pembelajar, merupakan
satu rangkaian yang memang sengaja didesain
demikian. Ketika guru membelajarkan suatu topik
dan pembelajar aktif mempelajari, penilaiannya
bukan semata berupa tagihan terhadap penguasaan
topik itu, melainkan pembelajar juga diminta untuk
berunjuk kerja mempraktikkannya dalam sebuah
situasi konkret yang sengaja diciptakan.
Keempat, penilaian autentik memberi
kesempatan pembelajar untuk menampilkan hasil
belajarnya, unjuk kerjanya, dengan cara yang
dianggap paling baik. Singkatnya, model ini
memungkinkan pembelajar memilih sendiri cara,
bentuk, atau tampilan yang menurutnya paling
efektif. Hal itu berbeda dengan penilaian tradisional,
misalnya bentuk tes pilihan ganda, yang hanya
memberi satu cara untuk menjawab dan tidak
menawarkan kemungkinan lain yang dapat dipilih.
Jawaban pembelajar dengan model ini memang
seragam, dan itu memudahkan kita mengolahnya,
tetapi itu menutup kreativitas pembelajar untuk
mengkreasikan jawaban atau kinerjanya. Padahal,
unsur kreativitas atau kemampuan berkreasi
merupakan hal esensial yang harus diusahakan
ketercapaiannya dalam tujuan pembelajaran.
BAB V
PERENCANAAN PENILAIAN
A. Pengertian
Menurut The Quality Assurance Division (2012)
perencanaan penilaian adalah dokumen yang
memberikan informasi tentang bagaimana penilaian
akan tersusun, apa yang dilibatkan dan kriteria
penilaian yang akan dinilai oleh kandidat. Sharon Tan
(2012: 27) Perencanan penilaian adalah dokumen
yang memberikan informasi tentang bagaimana
penilaian akan terstruktur, apa yang terlibat, dan
kriteria penilaian yang calon akan dinilai terhadap
Anda. Rencana penilaian dikembangkan dengan: 1)
Petunjuk yang jelas untuk persiapan untuk penilaian
dan dokumentasi penilaian misalnya mengatur
peralatan, pelaksanaan metode tertentu, waktu
untuk tanggapan, proses banding, daftar-
pembanding; 2) Penilaian petunjuk untuk panduan
penilai; 3) Alat penilaian disediakan misalnya peran
bermain script, jawaban untuk tes tertulis; 4) Catatan
penilaian dengan jelas ditunjukkan kriteria penilaian;
5) Sumber daya/referensi (Perpustakaan, web); 6)
Daftar istilah yang disediakan; dan 7) Kontrol versi.
Marchese (1978: 3-8) Rencana penilaian
merupakan dokumen yang menguraikan data
empiris apa yang akan dikumpulkan, oleh siapa yang
melaksanakan, timing penilaian untuk menilai setiap
100 | Perencanaan Penilaian

hasil pembelajaran (biasanya dalam multi-tahun-
siklus), proses yang dilakukan untuk meninjau data,
kebijakan dan prosedur untuk membimbing diskusi
dan umpan balik hasil beserta modifikasinya untuk
meningkatkan pembelajaran. Rencana penilaian
menggambarkan bagaimana proses penilaian akan
dilakukan oleh departemen. Rencana penilaian tidak
perlu besar dan terperinci, dan juga tidak perlu selaras
dengan penelitian belajar. Sebaliknya, rencana
penilaian harus bermakna, mudah dikelola, dan
berkelanjutan. Artinya, rencana penilaian harus
membahas isu-isu yang bermakna bagi fakultas,
mereka harus membangun metode penilaian yang
sudah ada, dan harus diintegrasikan ke dalam
pekerjaan fakultas reguler, seperti membahas temuan
penilaian sebagai bagian dari fakultas regular
pertemuan. Kami mendorong departemen untuk
berpikir kecil dan bila mungkin, untuk sampel siswa
dan untuk sampel pekerjaan siswa yang ada.
Menurut Departemen Pendidikan Nasional
Direktorat Jenderal Manejemen Pendidikan Dasar dan
Menengah Direktorat Pembinaan Sekolah Menengah
Atas (2008), perencanaan penilaian mencakup
penyusunan kisi-kisi yang memuat indikator dan
strategi penilaian. Strategi penilaian meliputi
pemilihan metode dan teknik penilaian, serta
pemilihan bentuk instrumen penilaian.
1. Perencanaan penilaian oleh pendidik
Secara teknis kegiatan pada tahap perencanaan
penilaian oleh pendidik sebagai berikut:
Perencanaan Penilaian | 101

a. Menjelang awal tahun pelajaran, guru mata
pelajaran sejenis pada satuan pendidikan
(MGMP sekolah) yaitu melakukan:
pengembangan indikator pencapaian KD,
penyusunan rancangan penilaian (teknik dan
bentuk penilaian) yang sesuai, pembuatan
rancangan program remedial dan pengayaan
setiap KD, penetapan Kriteria Ketuntasan
Minimal (KKM) masing-masing mata
pelajaran melalui analisis indikator dengan
memperhatikan karakteristik peserta didik
(kemampuan rata-rata peserta didik/intake),
karakteristik setiap indikator
(kesulitan/kerumitan atau kompleksitas), dan
kondisi satuan pendidikan (daya dukung,
misalnya kompetensi guru, fasilitas sarana
dan prasarana).
b. Pada awal semester pendidik
menginformasikan KKM dan silabus mata
pelajaran yang di dalamnya memuat
rancangan dan kriteria penilaian kepada
peserta didik.
c. Pendidik mengembangkan indikator
penilaian, kisi-kisi, instrumen penilaian
(berupa tes, pengamatan, penugasan, dan
sebagainya) dan pedoman penskoran.
2. Perencanaan penilaian oleh satuan
pendidikan
Perencanaan penilaian oleh satuan pendidikan
meliputi kegiatan sebagai berikut:

a. Melalui rapat dewan pendidik, satuan
pendidikan melakukan: pendataan KKM
setiap mata pelajaran, penentuan kriteria
kenaikan kelas (bagi satuan pendidikan yang
menggunakan sistem paket) atau penetapan
kriteria program pembelajaran (untuk satuan
pendidikan yang melaksanakan Sistem Kredit
Semester), penentuan kriteria nilai akhir
kelompok mata pelajaran agama dan
akhlak mulia, kelompok mata pelajaran
kewarganegaraan dan kepribadian,
kelompok mata pelajaran estetika, dan
kelompok mata pelajaran jasmani, olahraga,
dan kesehatan, dengan mempertimbangkan
hasil penilaian oleh pendidik, penentuan
kriteria kelulusan ujian sekolah, koordinasi
ulangan tengah semester, ulangan akhir
semester, dan ulangan kenaikan kelas.
b. Membentuk tim untuk menyusun instrumen
penilaian (untuk ulangan tengah semester,
ulangan akhir semester, dan ujian sekolah)
yang meliputi: pengembangan kisi-kisi
penulisan soal (di dalamnya terdapat
indikator soal), penyusunan butir soal sesuai
dengan indikator dan bentuk soal, serta
mengikuti kaidah penulisan butir soal,
penelaahan butir soal secara kualitatif,
dilakukan oleh pendidik lain (bukan
penyusun butir soal) pengampu mata
pelajaran yang sama dengan butir soal yang

ditelaahnya, perakitan butir-butir soal
menjadi perangkat tes.
3. Perencanaan Penilaian oleh Pemerintah
Perencanaan penilaian oleh pemerintah meliputi
kegiatan sebagai berikut:
a. Mengembangkan SKL untuk mata pelajaran
yang diujikan dalam UN;
b. Menyusun dan menetapkan spesifikasi tes UN
berdasarkan SKL;
c. Mengembangkan dan memvalidasi
perangkat tes UN;
d. Menentukan kriteria kelulusan UN.
Terry (2012: 21) mendefinisikan rencana penilaian
individu adalah sebuah rencana yang berisi daftar tes
khusus dan langkah-langkah yang akan digunakan
peserta didik yang telah disaring dan membutuhkan
penilaian lebih lanjut. Sedangkam Palomba (1999:
233) Rencana memberikan arah untuk tindakan dan
titik referensi penting untuk mengukur kemajuan.
Rencana dengan hati-hati dibangun menetapkan
tujuan untuk penilaian dan pertanyaan- pertanyaan
yang ditangani. Itu identifies sumber atau target
informasi, serta waktu-baris dan sumber daya yang
tersedia bahkan sebagai Kemasiswaan Difisi
mengingkatkan focus mereka pada penilaian hasil
pembelajaran, rencana dan kegiatan mereka terus
mengenali kebutuhan untuk jenis informasi lainnya.
Yang dilakukan dalam tahap perencanaan
penilaian adalah menentukan tujuan penilaian, acuan
penilaian, alat penilaian, dan jenis penilaian. Ada
beberapa kegiatan yang harus dilakukan dalam

perencanaan penilaian, diantaranya menentukan apa
yang akan dinilai, menentukan metode dan instrumen
penilaian, menentukan cara penyekoran untuk
menentukan nilai akhir. Jika perencanaan penilaian
tersebut telah dilakukan guru sebelum pelaksanaan
penilaian maka diharapkan nilai akhir tersebut dapat
dipertanggungjawabkan keobjektifannya dan
memberikan tindak lanjut dari pelaksanaan
penilaian. Perencanaan penilaian hasil belajar
Kurikulum 2013 dilakukan dengan pengkajian pada
penilaian aspek Sikap yang tertuang pada KI 1 (sikap
spiritualitas) dan KI 2 (sikap sosial), penilaian
pengetahuan yang tertuang pada KI 3, dan penilaian
keterampilan yang tertuang KI 4. Selanjutnya guru
mengkaji kompetensi dasar dan indikator yang harus
dicapai peserta didik. Perencanaan penilaian
dijabarkan kedalam rencana pelaksanaan
pembelajaran (RPP). Kesulitan dialami guru dalam
memahami Kompetensi Inti 1 dan 2 mengenai
kompetensi sikap.
Pada tahap perencanaan penilaian
memperhitungkan tujuan dari penilaian adalah hal
yang mutlak harus dilakukan karena memberikan
informasi mengenai suatu pokok bahasan. Dalam
merancang acuan dasar penilaian guru menggunakan
acuan patokan. Acuan patokan digunakan oleh guru
untuk menentukan standar kriteria ketuntasan
minimal. Aspek pengetahuan, keterampilan, dan
sikap selalu diperhitungkan. Perencanaan penilaian
yang dilakukan mengacu pada isi silabus mengenai
kompetensi dasar dan indikator yang harus dicapai

siswa. Rencana penilaian kemudian dijabarkan
kedalam rencana pelaksanaan pembelajaran. Dalam
merencanakan penilaian yang efektif melibatkan
beberapa hal: pertama, Melibatkan Stakeholders
(Langkah awal dalam perencanaan penilaianya itu
menentukan siapa yang relevan melakukan
penilaian); kedua Menetapkan tujuan (Menentukan
penilaian sesuai dengan tujuan penilaian yang telah
ditetapkan); ketiga, Merancang pendekatan
perencanaan penilaian yang matang. Yaitu
merancang pendekatan tepat dan matang dalam
melakukan penilaian yang disesuaikan dengan jenis
dan teknik penilaian; keempat, Membuat rencana
tertulis. Pengembangan dari dokumen perencanaan
Rencana penilaian yang berisi kesepakatan tentang
apa yang akan dinilai, memberikan arahan untuk
tindakan, dan menyediakan sarana untuk
menentukan apakah terjadi kemajuan atau tidak
dalam pembelajaran; dan kelima Penilaian waktu
(Menentukan rentang waktu penilaian, misalnya
dalam harian, setengah tahun atau dalam setahun)
(Rizar Abidin, p. 16-22).
Irvine Plans (2009: 1-2) Meskipun format yang
digunakan untuk rencana penilaian mungkin
berbeda, semua rencana penilaian harus membahas
bidang berikut:
1. Hasil belajar siswa seperti apa yang diharapkan
oleh fakultas agar semua jurusan mengetahui,
memahami dan mampu mengaplikasikannya
pada saat mereka lulus?

2. Keselarasan kurikuler-dimana siswa belajar di
jurusan berlangsung?
3. Apakah siswa memiliki kesempatan yang cukup
mencapai hasil belajar?
4. Mempelajari bukti- jenis bukti pembelajaran siswa
mana yang akan dikumpulkan dan dianalisis?
5. Bukti proses review-bagaimana fakultas
meninjau dan menggunakan temuan dari upaya
penilaian mereka untuk meningkatkan
pembelajaran siswa?
Menurut Charles & Denison (2012: 530)
perencanaan penilaian tidak boleh dilihat sebagai alat
ukur konklusif mengajar, tetapi harus diintegrasikan
ke dalam seluruh ajaran dan proses belajar. Rencana
pelajaran tidak lengkap dan risiko yang efektif jika
mereka tidak termasuk rencana untuk tujuan
penilaian. Penilaian dapat terjadi pada berbagai
interval dan mungkin dapat diintegrasikan ke dalam
pelajaran yang direncanakan untuk unit tertentu,
menandai periode, istilah, atau tahun. Ketika guru
mengembangkan penilaian dalam rencana pelajaran
mereka dapat lebih mudah membuat cetak biru
penilaian yang mencakup pemikiran tingkat tinggi
dan rendah-order. Berbagi cetak biru dengan siswa
guru memberikan kesempatan untuk membuat
penilaian lebih berpusat mahasiswa dan
memungkinkan siswa merasa lebih siap.
Carol and Tonya (2013: 17) Penilaian di kelas
secara efektif adalah fondasi perencanaan
instruksional yang berhasil. Ini adalah analog guru
untuk menggunakan diagnosa. Ini adalah proses

untuk memahami kebutuhan belajar siswa saat
ini,cukup baik untuk merencanakan proses dan hasil
instruksional terbaik untuk masing-masingpelajar
yang kesejahteraan akademisnya adalah tanggung
jawab guru. Dominic (2005: 115) Dalam penilaian
alternatif merencanakan itu penting untuk
menentukan jenis informasi apa yang akan
dikumpulkan. Informasi ini harus bervariasi sesuai
dengan jenis pengetahuan, keterampilan, nilai, dan
sikap yang ditekankan dalam kegiatan dan bidang
konten ditangani oleh kurikulum. Prosesnya
berorientasi pada produk, informasi harus dijadikan
bagian dari rencana penilaian setiap anak. Seperti
yang dinyatakan sebelumnya, materi pilihan guru dan
pilihan anak harus disertakan. Menurut Palomba
(2015: 16), untuk merencanakan penilaian yang efektif
dapat dilakukan dengan: melibatkan pemangku
kepentingan, menetapkan tujuan, Merancang
pendekatan perencanaan penilaian yang matang,
membuat rencana tertulis, dan penilaian waktu.
Nabisi Lapono (2016) Proses pembelajaran yang
mendidik adalah proses pembelajaran yang
dilaksanakan untuk membantu peserta didik
berkembang secara utuh, baik dalam dimensi kognitif
maupun dalam dimensi afektif dan psikomotorik.
Prinsip inilah yang menjadi dasar perencanaan
penilaian proses dan hasil pembelajaran. Bentuk
kegiatan penilaian yang perlu dirancang dalam
penilaian pembelajaran yang mendidik meliputi
penilaian unjuk kerja, penilaian sikap, penilaian
tertulis, penilaian proyek, penilaian produk, penilaian
portofolio, dan penilaian diri. Bentuk kegiatan
penilaian tersebut dirancang berdasarkan langkah-
langkah sebagai berikut:
1. Menentukan kompetensi atau aspek kemampuan
yang akan dinilai.
2. Menentukan kriteria penilaian yang akan
digunakan.
3. Merumuskan format penilaian, dapat berupa
pedoman penskoran, daftar tanda cek, atau skala
penilaian.
4. Meminta peserta didik untuk melakukan
penilaian diri.
5. Guru mengkaji sampel hasil penilaian secara acak,
untuk mendorong peserta didik supaya senantiasa
melakukan penilaian diri secara cermat dan
objektif.
6. Menyampaikan umpan balik kepada peserta
didik berdasarkan hasil kajian terhadap sampel
hasil penilaian yang diambil secara acak.
Menurut Shermis dan Mark, 2011: 27-51) Untuk
membuat penilaian Anda berhasil, Anda perlu untuk
rencana mereka baik di muka. Jelas Anda akan
mempertimbangkan konten unit instruksi dan tingkat
kinerja yang Anda harapkan dari murid-murid Anda.
Perencanaan penilaian yang baik
mempertimbangkan faktor-faktor seperti berikut:
a. Tujuan penilaian misalnya, jenis-jenis kesimpulan
untuk membuat pembelajaran siswa
b. Jenis penilaian yang terbaik akan melayani tujuan
c. Bagaimana hasil penilaian akan mempengaruhi
instruksi Anda
d. Kapan dan dengan frekuen siapa Anda ingin
mendapatkan langkah-langkah prestasi siswa
Anda
Langkah perencanaan penilaian proses serta
hasil belajar dan pembelajaran mencakup rencana
penilaian proses pembelajaran dan rencana penilaian
hasil belajar peserta didik. Rencana penilaian proses
serta hasil belajar dan pembelajaran merupakan
rancangan penilaian yang akan dilakukan oleh guru
untuk memantau proses, kemajuan, perkembangan
hasil belajar peserta didik sesuai dengan potensi yang
dimiliki dan kemampuan yang diharapkan secara
berkesinambungan. Penilaian belajar dan
pembelajaran juga dapat memberikan umpan balik
kepada guru agar dapat menyempurnakan
perencanaan dan proses pembelajaran. Dengan kata
lain, penyusunan perencanaan, pelaksanaan proses,
dan penilaian merupakan rangkaian program
pendidikan yang utuh, dan merupakan satu kesatuan
yang tidak bisa dipisahkan satu dengan yang lainnya.
Penilaian belajar dan pembelajaran perlu
direncanakan dengan baik agar hasil penilaian
tersebut dapat digunakan untuk:
a. mengetahui tingkat pencapai kompetensi selama
dan setelah proses pembelajaran berlangsung;
b. memberikan umpan bali bagi peserta didik agar
mengetahui kekuatan dan kelemahannya dalam
proses pencapaian kompetensi;
c. memantau kemajuan dan mendiagnosis kesulitan
belajar yang dialami peserta didik sehingga dapat
dilakukan pengayaan dan remedial;

d. memberikan umpan balik bagi guru dalam
memperbaiki metode, pendekatan, kegiatan, dan
sumber belajar yang digunakan;
e. memberikan piliha alternatif penilaian kepada
guru;
f. memberikan informasi kepada orang tua dan
komite sekolah tentang efektivitas pendidikan.
Di dalam perencanaan penilaian proses serta
hasil belajar dan pembelajaran tersebut perlu
dipertimbangkan fungsi penilaian pembelajaran,
yakni sebagai berikut.
1. Menggambarkan sejauhmana seorang peserta
didik telah menguasai suatu kompetensi.
2. Mengevaluasi hasil belajar peserta didik dalam
rangka membantu peserta didik memahami
dirinya, membuat keputusan tentang langkah
berikutnya, baik untuk pemilihan program,
pengembangan kepribadian maupun untuk
penjurusan (sebagai bimbingan).
3. Menemukan kesulitan belajar dan kemungkinan
prestasi yang bisa dikembangkan peserta didik
dan sebagai alat diagnosis yang membantu guru
menentukan apakah seseorang perlu mengikuti
remedial atau pengayaan.
4. Menemukan kelemahan dan kekurangan proses
pembelajaran yang sedang berlangsung guna
perbaikan proses pembelajaran berikutnya.
5. Sebagai kontrol bagi guru dan sekolah tentang
kemajuan perkembangan peserta didik.
Penilaian proses dan hasil belajar dan
pembelajaran dilakukan oleh guru untuk memantau

proses, kemajuan, perkembangan hasil belajar peserta
didik sesuai dengan potensi yang dimiliki dan
kemampuan yang diharapkan secara
berkesinambungan. Penilaian juga dapat
memberikan umpan balik kepada guru agar dapat
menyempurnakan perencanaan dan proses
pembelajaran. Oleh karena itu, dalam perencanaan
pembelajaran guru sudah merencanakan pula
penilaian yang akan dilakukannya.
Menurut Nabisi Lapono penyusunan
perencanaan, pelaksanaan proses, dan penilaian
pembelajaran merupakan rangkaian program
pendidikan yang utuh, dan merupakan satu kesatuan
yang tidak bisa dipisahkan satu dengan yang lainnya.
Perencanaan penilaian pembelajaran yang mendidik
diawali dengan kegiatan mengkaji standar
kompetensi lulusan dan mengidentifikasi indikator
pencapaian kompetensi dimaksud.Berdasarkan
indikator pencapaian kompetensi tersebut, guru
menyusun instrumen penilaian pembelajaran.
Instrumen penilaian pembelajaran tersebut harus
memenuhi persyaratan reliabilitas dan validitas
instrumen agar hasil penilaian yang diperoleh dapat
digunakan sebagai umpan balik bagi guru dalam
proses pembelajaran selanjutnya.
B. Macam-macam Perencanaan Penilaian

Perencanaan penilaian terdiri dari:
(Kementerian Pendidikan dan Kebudayaan, 2015: 19-
33)

1. Perencanaan Penilaian Sikap
Perencanaan penilaian sikap dilakukan
berdasarkan KI-1 dan KI-2. Pendidik merencanakan
dan menetapkan sikap yang akan dinilai dalam
pembelajaran sesuai dengan kegiatan
pembelajaran. Pada penilaian sikap di luar
pembelajaran pendidik dapat mengamati sikap
lain yang muncul secara natural.
Langkah-langkah perencanaan penilaian
sikap sebagai berikut:
a. Menentukan sikap yang akan diamati di sekolah
mengacu pada KI-1 dan KI-2.
b. Menentukan indikator sikap.
Contoh sikap pada KI-1 dan indikatornya :
Sikap Indikator
Ketaatan  perilaku patuh dalam
beribadah melaksanakan ajaran agama yang
dianutnya
 mau mengajak teman
seagamanya untuk
 melakukan ibadah bersama
 mengikuti kegiatan keagamaan
yang diselenggarakan sekolah
 melaksanakan ibadah sesuai
ajaran agama, misalnya shalat dan
puasa
 merayakan hari besar agama
 melaksanakan ibadah tepat
waktu
c. Menyusun format penilaian sikap Pendidik
menyiapkan format penilaian sikap yang
digunakan untuk mencatat hasil pengamatan.

Format penilaian sikap ini dibuat sedemikian rupa
agar proses penilaian sikap dapat dilakukan secara
mudah dan praktis
2. Perencanaan Penilaian Pengetahuan dan
Keterampilan
pembuatan pemetaan KD
Perencanaan pronta dan dari KI-3 dan
prosem KD-4
perencanaan
bentuk dan penetapan KKM
teknik penilaian
a. Program Tahunan (Prota)

Program Tahunan adalah rencana umum
pelaksanaan pembelajaran muatan pelajaran
berisi antara lain rencana penetapan alokasi
waktu satu tahun pembelajaran. Misalkan
suatu sekolah menetapkan jumlah hari belajar
efektif dalam satu tahun pelajaran paling
sedikit 200 hari dan paling banyak 245 hari.
Program Tahunan dipersiapkan dan
dikembangkan sebelum tahun pelajaran
karena Program Tahunan merupakan
pedoman bagi pengembangan program-
program berikutnya, seperti Program Semester,
Silabus, dan Rencana Pelaksanaan
Pembelajaran.
Langkah-langkah perancangan Program
Tahunan:

1) Menelaah jumlah tema dan subtema pada
suatu kelas.
2) Menandai hari-hari libur, permulaan tahun
pelajaran, minggu efektif pada kalender
akademik.
3) Menghitung jumlah Minggu Belajar Efektif
(MBE) dalam satu tahun.
4) Mendistribusikan alokasi waktu Minggu
Belajar Efektif (MBE) ke dalam subtema.
Komponen-komponen dalam menyusun
Program Tahunan:
1) Identitas (antara lain muatan pelajaran,
kelas, tahun pelajaran)
2) Format isian (antara lain tema, subtema,
dan alokasi waktu).
b. Program Semester (Prosem)
Program Semester merupakan penjabaran
dari program tahunan sehingga program
tersebut tidak bisa disusun sebelum tersusun
program tahunan. Langkah-langkah
perancangan program semester:
1) Menelaah kalender pendidikan dan ciri khas
satuan pendidikan berdasarkan kebutuhan
tingkat satuan pendidikan.
2) Menandai hari-hari libur, permulaan tahun
pelajaran, minggu pembelajaran efektif,
dan waktu pembelajaran efektif (per
minggu).
3) Menghitung jumlah Hari Belajar Efektif
(HBE) dan Jam Belajar Efektif (JBE) setiap
bulan dan semester dalam satu tahun.

4) Menghitung Jumlah Jam Pembelajaran (JP)
sesuai dengan ketentuan yang terdapat
pada struktur kurikulum yang berlaku.
JP Tematik = beban belajar dalam satu minggu – beban belajar
muatan pelajaran Pendidikan Agama dan Budi
Pekerti
Misalkan pada struktur kurikulum, beban
belajar kelas I dalam satu minggu sebanyak
30 JP, dengan demikian JP Tematik dapat
dihitung sebagai berikut:
JP Tematik Kelas I = 30 JP – 4 JP
= 26 JP
5) Mendistribusikan alokasi waktu yang
disediakan untuk suatu subtema serta
mempertimbangkan waktu untuk penilaian
serta review materi.
Program Semester berisikan garis-garis
besar mengenai hal-hal yang hendak
dilaksanakan dan dicapai dalam semester
tersebut. Pada umumnya program semester ini
berisikan:
1) Identitas (satuan pendidikan, muatan
pelajaran, kelas/semester, tahun pelajaran)
2) Format isian (tema, sub tema,
pembelajaran ke alokasi waktu, dan bulan
yang terinci per minggu, dan keterangan
yang diisi kapan pelaksanaan
pembelajaran berlangsung.

c. Pemetaan Kompetensi Dasar (KD)
Muatan Pelajaran.
Pemetaan kompetensi dasar ini digunakan
sebagai dasar perancangan kegiatan penilaian
baik yang bersifat harian, per tema, maupun
per semester.
d. Penentuan Kriteria Ketuntasan Minimal
(KKM)
Berikut ini merupakan contoh prosedur
penentuan KKM.
1) Hitung jumlah Kompetensi Dasar (KD) setiap
muatan pelajaran setiap kelas dalam satu
tahun pelajaran.
2) Tentukan komponen-komponen yang
termasuk aspek kompleksitas,intake, pendidik
dan daya dukung.
a) Komponen-komponen yang bisa
dimasukkan aspek kompleksitas, antara
lain jumlah KD dan karakterististik KD
muatan pelajaran (misalnya, tingkat
kesulitan, kedalaman dan keluasan KD).
b) Komponen-komponen yang bisa
dimasukkan aspek intake, antara lain hasil
observasi awal siswa, hasil belajar siswa dari
tahun pelajaran sebelumnya, dan nilai hasil
ujian sekolah dari tahun pelajaran
sebelumnya.
c) Komponen-komponen yang bisa
dimasukkan aspek pendidik dan daya
dukung, antara lain kompetensi pendidik

(nilai UKG), rasio pendidik dan murid
dalam satu kelas, akreditasi sekolah dan
sarana prasarana sekolah.
3) Tentukan nilai untuk setiap aspek dengan
skala 0-100 denganmempertimbangkan hal
berikut:
a) Karakteristik Mata/Muatan Pelajaran
(Kompleksitas) Karaktersitik
mata/muatan pelajaran memperhatikan
kompleksitas KD dengan mencermati kata
kerja yang terdapat pada KD tersebut dan
berdasarkan data empiris dari
pengalaman guru dalam membelajarkan
KD tersebut pada waktu sebelumnya.
Semakin tinggi aspek kompleksitas materi/
kompetensi, semakin menantang guru
untuk meningkatkan kompetensinya.
b) Karaktersitik Peserta Didik (Intake)
Karakteristik peserta didik (intake)
memperhatikan kualitas peserta didik
yang dapat diidentifikasi antara lain
berdasarkan hasil penilaian awal peserta
didik, dan nilai rapor sebelumnya. Semakin
tinggi aspek intake, semakin tinggi pula
nilai KKMnya.
c) Kondisi Satuan Pendidikan (Pendidik dan
Daya Dukung) Aspek guru dan daya
dukung antara lain memperhatikan
ketersediaan guru, kesesuaian latar
belakang pendidikan guru dengan mata
pelajaran yang diampu, kompetensi guru

(misalnya hasil Uji Kompetensi Guru), rasio
jumlah peserta didik dalam satu kelas,
sarana prasarana pembelajaran,
dukungan dana, dan kebijakan sekolah.
Semakin tinggi aspek guru dan daya
dukung, semakin tinggi pula nilai KKMnya.
4) Tentukan skor tiap aspek dengan rumus:
Skor komponen =
5) Tentukan KKM setiap KD dengan rumus:
KKM per KD =
6) Tentukan KKM setiap muatan pelajaran dengan

rumus:
KKM per KD =
Alimuddin (2014: 29-31) perencanaan penilaian

terdiri atas:
1. Perencanaan Penilaian Tes Praktik
Langkah yang harus dilakukan dalam
merencanakan tes praktik adalah: 1) menentukan
kompetensi yang penting untuk dinilai melalui tes
praktik, 2) menyusun indikator hasil belajar
berdasarkan kompetensi yang akan dinilai, 3)
menguraikan kriteria yang menunjukkan capaian

indikator hasil pencapaian kompetensi, 4) menyusun
kriteria ke dalam rubrik penilaian, 5) menyusun tugas
sesuai dengan rubrik penilaian, 6) Mengujicobakan
tugas jika terkait dengan kegiatan praktikum atau
penggunaan alat, 8) Memperbaiki berdasarkan hasil
uji coba jika dilakukan uji coba, 9) Menyusun
kriteria/batas kelulusan/batas standar minimal
capaian kompetensi peserta didik.
2. Perencanaan Penilaian Projek
Langkah-langkah yang harus dipenuhi
dalam merencanakan penilaian projek adalah: 1)
menentukan kompetensi yang sesuai untuk dinilai
melalui projek, 2) penilaian projek mencakup
perencanaan, pelaksanaan, dan pelaporan
projek, 3) menyusun indikator proses dan hasil
belajar berdasarkan kompetensi, 4) menentukan
kriteria yang menunjukkan capaian indikator
pada setiap tahapan pengerjaan projek, 5)
merencanakan apakah task bersifat kelompok
atau individual, 6) merencanakan teknik-teknik
dalam penilaian individual untuk tugas yang
dikerjakan secara kelompok, 7) menyusun tugas
sesuai dengan rubric penilaian.
3. Perencanaan Penilaian Portofolio
Langkah-langkah yang harus dilakukan
dalam merencanakan penilaian portofolio: 1)
menentukan kompetensi dasar (KD) yang akan
dinilai pencapaiannya melalui tugas portofolio
pada awal semester dan diinformasikan kepada
peserta didik, 2) merumuskan tujuan
pembelajaran yang akan dinilai pencapaiannya
melalui penilaian portofolio, 3) menjelaskan
tentang tujuan penggunaan, macam dan bentuk,
serta kriteria penilaian dari kinerja dan atau hasil
karya peserta didik yang akan dijadikan
portofolio. Penjelasan disertai contoh portofolio
yang telah pernah dilaksanakan, 4) menentukan
kriteria penilaian. Kriteria penilaian portofolio
ditentukan oleh guru atau guru dan peserta didik,
5) menentukan format pendokumentasian hasil
penilaian portofolio, minimal memuat topik
kegiatan tugas portofolio, tanggal penilaian, dan
catatan pencapaian (tingkat kesempurnaan)
portofolio, 6) menyiapkan map yang diberi
identitas: nama peserta didik, kelas/semester,
nama sekolah, nama mata pelajaran, dan tahun
ajaran sebagai wadah pendokumentasian
portofolio peserta didik.
C. Tujuan Perancanaan Penilaian

Nuts and Bolts (p.3) mengatakan bahwa tujuan
utama pengembangan dan pelaksanaan rencana
penilaian unit akademik adalah mendokumentasikan
pencapaian hasil belajar dan perbaikan program
secara terus menerus. Sedangkan menurut Overton
(2012) Tujuan utama pengembangan dan
pelaksanaan rencana penilaian adalah untuk
memeriksa seberapa baik sebuah unit memenuhi
tujuannya. Hal ini dilakukan oleh mengembangkan
rencana tahunan yang mendokumentasikan
pencapaian yang diharapkan hasil dan mendorong
perbaikan terus-menerus. Semua unit pendukung
harus menilai keefektifan operasi, proses dan program
mereka yang terus menerus. Langkah-langkah dalam
mengembangkan rencana penilaian adalah sebagai
berikut: (1) Kembangkan pernyataan tujuan, (2)
Tentukan hasil yang ditunjuk, (3) Rancanglah
tindakan untuk mengevaluasi hasil, (4) Tentukan
'target prestasi' yang merupakan kesuksesan, (5)
Terapkan rencana, (6) Temuan laporan, (7)
Mengembangkan rencana aksi (untuk target
pencapaian yang belum terpenuhi), (8) Menganalisis,
dan (9) Kembangkan rencana penilaian untuk siklus
penilaian berikutnya.
D. Langkah-langkah Perencanaan Penilaian

Panduan langkah-langkah untuk perencanaan
penilaian di kelas menurut Shermis dan Mark (2011:
27-51)
1. Nilai dan Interpretasi Siswa
Interpretasi penting untuk menandakan hasil
pembelajaran kepada orang tua dan siswa juga
untuk digunakan guru dalam
meningkatkanpembelajaran. Ada dua macam
interpretasi yang sangat penting untuk tahu
tentang membuat penilaian: kriteria dan norma.
Kriteria, direferensikan bahwa nilai dapat
digunakan untuk mengidentifikasi tingkatan dari
pencapaian tertentu.Norma direferensikan bahwa
nilai dapat digunakan untuk membandingkan nilai
individu dengan norma.

2. Menyiapkan kriteria penilaian
Dalam perencanaan penilaian, guru terlebih
dulu mempersiapkan kriteria penilaian, guru
menentukan tingkat kompetensi, kriteria apa yang
menentukan lulus atau gagal, dan poin cut-off
untuk tingkat penguasaan keterampilan guru
mencoba untuk mengukur (Popham, 1978a).
Untuk menggambarkan satu aplikasi, kartu
laporan direferensikan kriteria mungkin memiliki
unsur-unsur berikut:
 Daftar wilayah subjek-materi
 Kompetensi tertentu di bawah setiap daerah,
menggunakan kata tersebut sebagai
memahami (konsep dan prinsip-prinsip),
menggunakan (keterampilan menulis yang
baik), menjelaskan (sebab dan akibat),
memberikan kontribusi (untuk diskusi kelas),
selesai (tugas pekerjaan rumah), berinteraksi
(terampil dalam situasi sosial), dan
menciptakan (novel artistik desain)
 Skala rating, seperti 1 = penguasaan, 2 =
mendekati independen kinerja, 3 = membuat
kemajuan, 4 = kebutuhan perbaikan atau
perbaikan bantuan kriteria tingkat yang
ditetapkan oleh guru (untuk penilaian kelas)
atau sekolah (untuk pelaporan tingkat
kinerja). Kartu laporan dapat menggunakan
berbagai persyaratan untuk menunjukkan
tingkat keunggulan yang dicapai oleh siswa
yang bersangkutan; sebagai contoh:

Untuk kerja tes: "ujian esai yang terorganisasi
dengan baik."
Untuk proyek: "siswa membuat berorientasi
tema pameran."
Hal yang harus dilakukan ketika menentukan
kriteria penilaian :
a. Menyelaraskan penilaian dengan tujuan
Ketika digunakan dengan benar,
direferensikan kriteria penilaian mewakili
tujuan jelas dinyatakan. Mereka dapat
menjadi sangat berguna untuk program di
mana tujuan seperti mendominasi — misalnya,
membaca program keahlian, belajar tuntas
program dan program pembangunan ilmu
pengetahuan dan matematika. Karena
mereka didasarkan pada apa yang siswa
dapat melakukan, direferensikan kriteria
penilaian membantu guru membuat
keputusan instruksional. Tes ini juga berguna
untuk mendiagnosa kebutuhan siswa bantuan
perbaikan.
b. Menyelaraskan tes dan item tes dengan
kriteria
Interpretasi direferensikan kriteria
berkembang dengan baik tergantung pada
kejelasan yang tujuan yang tercantum. Jika
tujuan Anda kabur, penilaian Anda tidak akan
berguna. Demikian pula, Anda perlu
memastikan bahwa Anda tujuan atau kriteria
performa baik diwakili dalam item tes. Dengan
kata lain, harus ada baik korespondensi antara
tujuan dan barang-barang yang sebenarnya
pada tes.
c. Rencana dipertahannkan komunikasi
nilai
Perencanaan Anda juga harus mencakup
cara nilai akan dikomunikasikan dan
menjelaskan. Tingkat pencapaian Anda
memilih seperti cut-off untuk tingkat penilaian
(seperti Hebat, rata-rata, biasa-biasa saja atau
rendah kinerja) harus dipertahankan ketika
ditanya oleh administrator, orang tua, atau
siswa.
d. Membuat rencana untuk penilaian
Guru harus mengetahui jenis nilai yang
digunakan untuk laporan hasil tes dan
bagaimanaguru itudapat menafsirkan hasil
penilaian tersebut.Kerangka kerja yang dapat
digunakan guru dalam untuk membuat
perencanaan penilaian.
3. Model penilaian
Model penilaian kami terdiri dari komponen-
komponen ini:
1) Target tujuan. Meliputi apa yangingin
gurusampaikan pada pembelajaran? Apakah
target pembelajaran, hasil apa yang hendak
dicapai? Apakah perilaku, sikap, atau kognitif
manifestasi dari tujuan tersebut?
2) Metode pengajaran dan konten. Apa yang akan
guru lakukan untuk mencapai target yang
ditetapkan guru? Apa metode pengajaran,

pembelajaran tugas-tugas, dan konteks belajar
yang akan gurugunakan?
3) Tugas penilaian dan langkah-langkah.
Bagaimana guru tahu apakah target guru telah
dicapai? Apakah guru dianggap berbagai macam
alat penilaian? Pernahkah guru berpikir tentang
langkah-langkah yang baik formal maupun
informal dari siswa kemampuan atau prestasi?.
Tiga komponen tersebut harus seimbang, para
siswa harus berinteraksi sedemikian rupa bahwa
pembelajaran merupakan panduan kemajuan menuju
pencapaian tujuan dalam satu tangan, tapi dipandu
oleh tujuan pada yang lain.
Penilaian didasarkan pada pengamatan perilaku
atau keterampilan yang ditargetkan di tujuan. Hasil
yang diperoleh dari penilaian memberikan umpan balik
tentang kecukupan pembelajaran sehingga
pembelajaran atau tujuan dapat direvisi jika
diperlukan.
1) Langkah-langkah dalam penilaian dan
pelaporan
a. Menentukan produk akhir
 Mulailah dengan berfokus pada penilaian
pembelajaran dan proses belajarnya, tidak
mencetak atau memilih siswa kelas khusus.
 Menentukan tujuan. Memutuskan apa siswa
untuk mencapai. Dalam Selain untuk konten
pembelajaran, guru mungkin juga ingin
mempertimbangkan proses pembelajaran dan
sikap subjek.

b. Menyelaraskan pembelajaran dengan indikator
kemajuan belajar
 Menetapkan pedoman untuk unit
pembelajaran. Menyelaraskan tujuan dan
metode pengajaran dengan penilaian siswa
kemajuan menuju tujuan.
 Mengidentifikasi indikator atau pointer yang
menunjukkan tingkat kemajuan telah dibuat
dalam mencapai harapan.
2) Rencana untuk berkomunikasi penilaian
target dan prosedur
 Berbagi tujuan dengan siswa (orang tua,
administrator, dan lain). Jangan menyimpan
harapan tentang pembelajaran rahasia.
Jangan membuat kesalahan dengan
memegang pengetahuan ini dari siswa
sehingga guru dapat mengejutkan murid-
murid pada tes. Bahkanpelajar akan
mengambil minat pada apa yang guru
inginkan pada murid-muriduntuk
mencapainya. Meminta pendapat mereka
tentang bagaimana mereka dapat
menunjukkan apa yang mereka ketahui.
Membenarkan prosedur Anda menggunakan
berdasarkanpraktek-praktek baik penilaian.
Dalam proses Anda memberikan awal
pengalaman untuk mengembangkan
peraturan diri siswa belajar dan realistis
evaluasi diri-ini cacy.

3) Mengembangkan dan menentukan jadwal
langkah-langkah penilaian
 Untuk menilai berapa banyak siswa telah
belajar, baik mengukur kualitas dan kuantitas
prestasi. Selain tes kertas dan pensil tradisional,
mempertimbangkan berbasis kinerja penilaian
yang memerlukan demonstrasi apa yang siswa
dapat lakukan dengan pengetahuan mereka.
Mereka dapat mengirimkan komposisi,
pameran, proyek, laporan, demonstrasi, survei,
atau bahkan sebenarnya pekerjaan
pertunjukan.
 Buat set kriteria atau rubrik untuk melayani
sebagai jelas dasar untuk penilaian atau
penilaian. Itulah, daripada penilaian Proyek
secara keseluruhan (dengan nilaif melalui,
misalnya), kelas kualitas komponen individual.
Misalnya, jika kemampuan pemecahan
masalah yang harus dievaluasi, kinerja ukuran
mungkin didasarkan pada beberapa dimensi:
menggunakan sebelum pengetahuan, analisis
masalah, penggunaan sistematis strategi di tiba
di solusi, dan kecukupan solusi pernyataan.
 Membuat jadwal ketika penilaian
akandiberikan. Tepat untuk memberikan
penilaian pada kesimpulan unit instruksional,
tetapi sering kali guru-guru memberikan tes
daripada yang diperlukan. Mengelola tes pada
titik ketika siswa memiliki memiliki

kesempatan untuk menunjukkan peningkatan
belajar.
4) Menentukan Format penilaian
Dalam setiap contoh, memutuskan format
terbaik untuk penilaian mengukur, misalnya,
apakah itu akan menjadi ukuran kinerja, seperti
menunjukkan keterampilan, atau tes; dan jika
yang terakhir, Apakah ini akan menjadi objektif
atau esai berbasis.ketika penilaian berdasarkan
dimensi kinerja, sehingga guru harus membuat
keputusan tentang sample dimensi dan
menetapkan kriteria untuk mengevaluasi kualitas
kinerjanya.
5) Menggunakan umpan balik dari hasil
penilaian
Setelah penilaian dibuat, menggunakan umpan
balik menyediakan untuk peningkatan
pengajaran. Ketika penilaian diberikan sebelum
pembelajaran, mereka memberikan informasi
tentang kesiapan siswa mengikuti/memahami
pembelajaran. Apabila penilaian diberikan
selama belajar, memberikan informasi tentang
penyesuaian yang guru butuhkan untuk
membuat untuk memfasilitasi belajar. Ketika
diberikan pada akhir periode belajar (pelajaran,
unit, atau periode waktu), memberikan penilaian
dasar untuk mengevaluasi seberapa baik
harapan guru tentang Prestasi siswa telah
terpenuhi.

Maxam, Boyer-Stephens, dan Alff (1986)
merekomendasikan agar setiap tim evaluasi
mengikuti langkah-langkah spesifik ini dalam
menyusun rencana penilaian :
1. Tinjau kembali semua informasi penyaringan
dimasing-masing dari tujuh bidang (kesehatan,
pendengaran, dan keterampilan berbicara,
intelektual, akademik, kejuruan prevokasional)
2. Tentukan area apa yang perlu dievaluasi lebih
lanjut.
3. Tentukan pengumpulan data spesifik yang akan
digunakan (wawancara, observasi perilaku
informal atauteknik formal, tes standar)
4. Tentukan orang yang bertanggung jawab untuk
mengelola prosedur yang dipilih Orang-orang ini
harus dilatih atau disertifikasi jika instrument
penilaian meminta kualifikasi tertentu.
Dalam Perencanaan Penilaian Kelas memiliki tiga

fase utama, dan masing-masing fase terdiri dari tiga
tahap, yaitu: (Thomas & Patricia (1995: 35)
1. Tahap I Merencanakan Proyek Penilaian Kelas
a. Langkah 1 - Memilih kelas untuk melaksanakan
Proyek Penilaian Kelas
b. Langkah 2 - Berfokus pada "pertanyaan yang
dapat dinilai" tentang pembelajaran siswa
c. Langkah 3 - Merancang Proyek Penilaian Kelas
2. Tahap II Melaksanakan Proyek Penilaian Kelas
a. Langkah 1 - Mengajarkan pelajaran "target"
yang terkait dengan pertanyaan yang sedang
dinilai

b. Langkah 2 - Menilai pembelajaran dengan
mengumpulkan umpan balik pertanyaan itu
bisa dinilai
c. Langkah 3 - Menganalisis umpan balik dan
mengubah data menjadi informasi yang dapat
digunakan
3. Tahap III Menanggapi hasil Penilaian Kelas
a. Langkah 1 – Menafsirkan hasil dan merumuskan
respons yang tepat untuk memperbaiki
pembelajaran
b. Langkah 2 – Mengkomunikasikan hasilnya
kepada siswa dan mencoba jawabannya
c. Langkah 3 - Mengevaluasi Proyek Penilaian
Kelas
Menurut Angelo (1993: 34) berpendapat bahwa

terdapat beberapa tahap merencanakan proyek
penilaian kelas, antara lain :
a. Langkah 1: Memilih kelas untuk melaksanakan
Proyek Penilaian Kelas.
b. Langkah 2: Berfokus pada "pertanyaan yang dapat
dinilai" tentang pembelajaran siswa.
c. Langkah 3: Merancang Proyek Penilaian Kelas ke
jawablah bahwa "pertanyaan yang
dapat dinilai".
E. Standar Perencanaan Penilaian

Standar perencanaan penilaian oleh pendidik
merupakan prinsip-prinsip yang harus dipedomani
bagi pendidik dalam melakukan perancanaan

penilaian. BSNP (2011) menjabarkannya menjadi
tujuh point sebagai berikut:
1. Pendidik harus membuat rencana penilaian
secara terpadu dengan silabus dan rencana
pembelajarannya. Perencanaan penilaian
setidak-tidaknya meliputi komponen yang akan
dinilai, teknik yang akan digunakan serta kriteria
pencapaian kompetensi;
2. Pendidik harus mengembangkan kriteria
pencapaian kompetensi dasar (KD) sebagai dasar
untuk penilaian;
3. Pendidik menentukan teknik penilaian dan
instrumen penilaiannya sesuai indikator
pencapaian KD;
4. Pendidik harus menginformasikan se awal
mungkin kepada peserta didik tentang aspek-
aspek yang dinilai dan kriteria pencapaiannya;
5. Pendidik menuangkan seluruh komponen
penilaian ke dalam kisi-kisi penilaian;
6. Pendidik membuat instrumen berdasar kisi-kisi
yang telah dibuat dan dilengkapi dengan
pedoman penskoran sesuai dengan teknik
penilaian yang digunakan;
7. Pendidik menggunakan acuan kriteria dalam
menentukan nilai siswa.
Standar pelaksanaan penilaian oleh pendidik
Menurut pedoman umum penilaian yang disusun
oleh BSNP, standar pelaksanaan penilaian oleh
pendidik meliputi:

a. Pendidik melakukan kegiatan penilaian
sesuai dengan rencana penilaian yang telah
disusun diawal kegiatan pembelajaran;
b. Pendidik menganalisis kualitas instrumen
dengan mengacu pada persyaratan
instrumen serta menggunakan acuan kriteria;
c. Pendidik menjamin pelaksanaan ulangan
dan ujian yang bebas dari kemungkinan
terjadi tindak kecurangan;
d. Pendidik memeriksa pekerjaan peserta didik
dan memberikan umpan balik dan komentar
yang bersifat mendidik.
Menurut Kunandar (2014: 73) Standar
perencanaan penilaian hasil belajar yaitu sebagai
berikut:
1. Guru harus membuat rencana penilaian secara
terpadu dengan mengacu kepada silabus dan
rencana pembelajarannya. Perencanaan penilaian
setidak-tidaknya meliputi komponen yang akan
dinilai, teknik yang akan digunakan serta kriteria
pencapaian kompetensi;
2. Guru harus mengembangkankriteria pencapaian
Kompetensi Dasar (KD) sebagai dasar untuk
penilaian;
3. Guru menentukan teknik dan instrumen penilaian
sesuai indikator pencapaian KD;
4. Guru harus menginformasikan seawal mungkin
kepada peserta didik tentang aspek-aspek yang
dinilai dan kriteria pencapaiannya;
5. Guru menuangkan seluruh komponen penilaian
kedalam kisi-kisi penilaian;

6. Guru membuat instrumen berdasarkan kisi-kisi
yang telah dibuat dan dilengkapi dengan pedoman
penskoran sesuai dengan teknik penilaian yang
digunakan;
7. Guru menganalisis kualitas instrumen penilaian
dengan mengacu pada persyaratan instrumen
serta menggunakan acuan kriteria;
8. Guru menetapkan bobot untuk tiap-tiap
teknik/jenis penilaian baik untuk KI 1 dan 2 dan KI
3 dan 4 dan menetapkan rumus penentuan nilai
akhir hasil belajar peserta didik;
9. Guru menetapkan acuan kriteria yang akan
digunakan berupa nilai kriteria ketuntasan
minimal (KKM) untuk dijadikan rujukan dalam
pengambilan keputusan.
Berdasarkan beberapa penjelasan diatas dapat

disimpulkan bahwa perencanaan penilaian adalah
dokumen yang memberikan informasi tentang
bagaimana penilaian akan tersusun dan menggambarkan
bagaimana proses penilaian akan dilakukan yang
memiliki tujuan utamaya itu mendokumentasikan
pencapaian hasil belajar dan perbaikan program secara
terus menerus.
Perencanaan penilaian pembelajaran yang
mendidik diawali dengan kegiatan mengkaji standar
kompetensi lulusan dan mengidentifikasi indicator
pencapaian kompetensi yang akan dicapai oleh peserta
didik. Perencanaan penilaian yang baik yaitu penilaian
yang mempertimbangkan faktor-faktor yaitu tujuan
penilaian, jenis penilaian yang akan digunakan dan

menentukan target yang akan dicapai peserta didik.
Rencana penilaian disusun agar menjadi referensi guru
dalam menyelenggarakan penilaian keseluruhan proses
pembelajaran.

BAB VI
Konstruksi Tes
Hasil Belajar Siswa
A. Pengertian
Dalam bidang pendidikan, yang digunakan
sebagai ukuran untuk mengetahui sejauh mana anak
didik telah menguasai materi pelajaran yang sudah
diajarkan dan dipelajari adalah hasil belajar atau prestasi
belajar (Masrun dan Martaniah, 1973). Menurut Zainul dan
Nasoetion ( 1997: 28-31) tes hasil belajar adalah salah satu
alat ukur yang paling banyak digunakan untuk
menemukan keberhasilan seseorang dalam suatu proses
belajar mengajar atau untuk menentukan keberhasilan
suatu program pendidikan. Sebagaimana dinyatakan oleh
Gregory (2000: 35), bahwa tes prestasi belajar mengukur
tingkat pencapaian atau kesuksesan seseorang dalam
mempelajari suatu materi pelajaran tertentu.
Di dalam webster’s New Internasional Dictionary
diungkapkan bahwa prestasi adalah standart test untuk
mengukur kecakapan atau pengetahuan bagi seseorang
didalam satu atau lebih dari garis-garis pekerjaan atau
belajar. (Webster’s New Internasional Dictionary, 1951 : 20.).
Surya (2004:57) juga mengemukakan bahwa prestasi
belajar adalah seluruh kecakapan hasil yang dicapai
(achivement) yang diperoleh melalui proses belajar
berdasarkan test belajar. Hal ini juga ditegaskan oleh
Anastasi (1990) bahwa tes prestasi belajar merupakan tes
136 | Kontruksi Tes Hasil Belajar Siswa

yang mengukur pengetahuan yang dimiliki seseorang
sebagai akibat adanya program pendidikan maupun
program pelatihan. Melalui tes prestasi belajar dapat
diperoleh informasi mengenai perbedaan kemajuan atau
tambahan pengetahuan antar peserta didik.
Menurut Hamalik (2005:68) prestasi belajar
merupakan sesuatu yang dibutuhkan seseorang untuk
mengetahui kemampuannya setelah melakukan kegiatan
yang bersifat belajar, karena prestasi adalah hasil belajar
yang mengandung unsur penilaian, hasil usaha kerja dan
ukuran kecakapan yang dicapai suatu saat. Sedangkan
Gronlund (1977) menegaskan bahwa tes prestasi adalah
prosedur sistematis untuk menentukan jumlah yang telah
dipelajari siswa. Meski penekanannya adalah pada
pengukuran hasil pembelajaran, seharusnya tidak
disiratkan bahwa pengujian harus dilakukan hanya pada
akhir instruksi. Terlalu sering, pengujian acliievement
adalah dipandang sebagai aktivitas akhir-akhir atau
aktivitas akhir-kursus yang terutama digunakan untuk
menugaskan nilai kursus. Meskipun ini adalah fungsi
pengujian yang penting dan berguna. Seperti pengajaran,
tujuan utamanya pengujian adalah untuk memperbaiki
pembelajaran, dan dalam konteks yang lebih luas di sana
adalah sejumlah kontribusi spesifik yang dapat dibuatnya.
(2-3)
Sebagaimana dijelaskan oleh Tjundjing, (2001:71)
bahwa prestasi belajar merupakan hasil kegiatan belajar,
yaitu sejauh mana peserta didik menguasai bahan
pelajaran yang diajarkan, yang diikuti oleh munculnya
perasaan puas bahwa ia telah melakukan sesuatu dengan
baik. Hal ini berarti
Kontruksi Tes Hasil Belajar Siswa| 137

Chase (1978: 58), menyatakan bahwa tes hasil
belajar sebagai alat ukur/alat evaluasi untuk
mengungkap kemampuanaktual/hasil belajar siswa,
seharusnya memenuhi karakteristik atau syarat-syarat tes
hasil belajar yang baik atau berkualitas. Karakteristik tes
hasil belajar yang baik atau berkualitas meliputi: valid;
reliabel; sederhana baik dalam admistrasi, penyekoran
maupun interpretasinya; serta menyenangkan wujud
fisiknya mudah digunakan atau dilaksanakan
diskriminatif, objektivitas dan praktikabilitas dan
komprehensif.
Benyamin S Bloom (1956) menjelaskan, bahwa Tes
Prestasi Belajar adalah salah satu alat ukur hasil belajar
yang dapat mencakup semua kawasan tujuan
pendidikan. Ia membagi kawasan tujuan pendidikan
mejadi tiga bagian, yaitu kawasan kognitif, kawasan
afektif, dan kawasan psikomotorik.
B. Tujuan, Fungsi, dan Prinsip

Tes prestasi belajar dimaksudkan untuk mengukur
pencapaian siswa terhadap kompetensi dasar. Kompetensi
dasar adalah kompetensi minimal dalam mata pelajaran
yang harus dimiliki oleh lulusan (Depdiknas, 2008a: 25).
Selain itu membangun Tes Achievement amerupakan
panduan praktis dan komprehensif dalam merencanakan
dan mengembangkan tes prestasi untuk guru pendidikan
kejuruan. Teks juga bisa digunakan oleh pendidik sebagai
sumber untuk persiapan guru.
Menurut Wiersma W, Jurs G. (1990 : 169) tes prestasi
dimaksudkan untuk mengukur apa yang telah dipelajari
siswa atau keterampilan apa yang telah dikuasai siswa. Tes

yang direferensikan biasanya yang mengukur tingkat
prestasi murid di berbagai bidang dan keterampilan.
Menurut Ebel (dalam Azwar, 1987) fungsi tes prestasi
belajar adalah mengukur prestasi belajar siswa, dan
memberikan kontribusi atau sumbangan terhadap
program pengajaran, serta motivasi siswa dalam belajar.
Robert L.Ebel (1979) juga mengatakan bahwa fungsi
utama tes prestasi dikelas adalah mengukur prestasi
belajar para siswa. Adalah suatu kesalah fahaman bila
menggangap bahwa apa yang dapat dilakukan oleh tes
prestasi semata-mata memberikan angka untuk
dimasukkan kedalam rapor murid atau kedalam laporan
hasil study mahasiswa. Sesungguhnya prosedur tes guna
mengukur prestasi mengandung nilai-nilai pendidikan
yang sangat penting,dimana tes membantu para
guru/pendidik memberikan nilai yang valid dan akurat.
Terdapat persepsi yang sangat kuat dalam diri siswa
maupun mahasiswa dimana nilai yang baik merupakan
tanda keberhasilan belajar yang tinggi sedangkan nilai tes
dianggap sebagai satu-satunya indikator yang
mempunyai arti penting maka nilai itulah yang biasanya
menjadi target usaha mereka dalam belajar.
Sedangkan menurut Winkel (Zaenal Arifin, 1991 : 3-
4) prestasi belajar mempunyai fungsi utama, antara lain:
1. Prestasi belajar sebagai indikator kualitas dan
kuantitas pengetahuan yang telah dikuasai anak
didik.
2. Prestasi belajar sebagai lambang pemuas hasrat
ingin tahu.hal ini didasarkan pada asumsi bahwa
para ahli psikologi biasanya menyebut hal ini
sebagai tendensi keingintahuan (curiocity) dan

merupakan kebutuhan umum pada manusia,
termasuk kebutuhan pada anak didik dalam suatu
program pendidikan.
3. Prestasi belajar sebagai bahan informasi dalam
inovasi pendidikan. Asumsinya adalah bahwa
prestasi belajar dapat dijadikan pendorong bagi
anak didik dalam meningkatkan ilmu
pengetahuan dan teknologi, dan berperan sebagai
umpan balik, (feadback) dalam meningkatkan
mutu pendidikan.
4. Prestasi belajar sebagai indikator intern dan ekstern
dari suatu institusi pendidikan. Indikator intrn
dalam arti bahwa prestasi belajar dapat dijadikan
faktor produktivitas suatu institusi pendidikan.
Asumsinya adalah bahwa kurikulum yang
digunakan relevan dengan kebutuhan masyarakat
dan anak didik. Indikator ekstrn dalam arti tinggi
rendahnya prestasi belajar dapat dijadikan
indikator tingkat kesuksesan anak didik
dimasyarakat. Asumsinya adalah bahwa
kurikulum yang digunakan relevan pula dengan
pembangunan masyarakat.
5. Prestasi belajar dapat dijadikan indikator
terhadap daya serap (kecerdasan) anak didik.
Dalam proses belajar mengajar anak didik
merupakan masalah yang utama dan pertama
dan karena anak didiklah yang diharapkan dapat
menyerap seluruh materi pelajaran yang telah
diprogramkan dalam kurikulum.

Tes prestasi belajar mempunyai banyak fungsi yang
antara lain adalah untuk memperbesar pemahaman diri
peserta, dan menyediakan umpan balik tentang efektifitas
pengajaran.
1. Tes prestasi belajar mempunyai peranan yang sangat
besar di bidang pendidikan karena mempunyai fungsi,
yaitu : sebagai alat untuk mengadakan perbaikan
dalam pengajaran,
2. Memperkuat motivasi belajar peserta didik,
3. Memperbesar pemahaman diri peserta,
4. Menyediakan umpan balik tentang efektifitas
pengejaran, dan
5. Memperbesar retensi serta transfer belajar (Depdikbud,
1997).
Namun dalam pelaksanaanya terdapat banyak
kendala yang membuat tes prestasi belajar tidak mampu
memenuhi fungsinya, Salah satu penyebabnya berasal dari
pesertadidik (testee), yaitu persepsi mereka terhadap tes
prestasi belajar. Persepsi merupakan proses penginderaan
yang dilakukan oleh individu terhadap stimulus, kemudian
diorganisasikan sehingga individu menyadari dan mengerti
tentang apa yang dilihat (Dafidoff, 1991).
Selain tujuan dan fungsi, dalam mengkontruksi
hasil tes prestasi siswa pendidik harus sesuai dengan prinsip-
prinsip yang ada. Gronlund (1977) merumuskan beberapa
prinsip dasar dalam pengukuran prestasi, yakni:
1. Tes prestasi harus mengukur hasil belajar yang telah
dibatasi secara jelas sesuai dengan tujuan
instruksional.
2. Tes prestasi harus mengukur suatu sampel yang
representatif dari hasil belajar dan dari materi yang

dicangkup oleh program instruksional atau
pengajaran.
3. Tes prestasi harus berisi aitem-aitem denga tipe
yang paling cocok guna mengukur hasil belajar
yang diinginkan.
4. Tes prestasi harus dirancang sedemikian rupa agar
sesuai degna tujuan penggunaan hasilnya.
5. Realibilitas tes prestasi harus diusahakan setinggi
mungkin dan hasil ukurnya harus ditafsirkan
dengan hati-hati.
6. Tes prestasi harus dapat digunkan untuk
meningkatkan belajar para anak didik.
Dalam membangun sebuah tes prestasi agar sesuai
dengan tabel spesifikasi, pembuat uji dapat memilih dari
berbagai jenis item. Jenis disebut sebagai item objektif,
karena bisa dinilai secara obyektif. Artinya, pencetak skor
yang sama kompeten bisa mencetaknya secara
independen dan mendapatkan hasil yang sama. Item uji
objektif meliputi hal berikut item jenis seleksi: pilihan
ganda, benar-salah, dan cocok. Mereka juga sertakan item
tipe penawaran yang terbatas pada jawaban singkat
(severa1kata atau kurang), meskipun item tersebut tidak
sepenuhnya objektif. Item jenis penawaran lainnya,
pertanyaan esai, bersifat subyektif. Bahwa adalah,
penilaian subyektif pencetak gol masuk ke dalam
penilaian, dan, dengan demikian,skornya berbeda dari
satu pencetak gol yang lain, dan dari satu waktu ke waktu
lainnya untuk pencetak gol yang sama (h.34 gronlund)
Dasar-dasar penyusunan tes hasil belajar Menurut
Zainul dan Nasoetion ( 1997: 28-31) yaitu antara lainnya
sebagai berikut: 1. Tes Hasil Belajar harus dapat mengukur

apa yang dipelajari dalam proses belajar mengajar sesuai
dengan tujuan instruksional yang tercantum di dalam
kurikulum yang berlaku, 2. Tes Hasil Belajar disusun
sedemikian sehingga benar-benar mewakili bahan yang
telah dipelajari, 3. Pertanyaan Tes Hasil Belajar hendaknya
disesuaikan dengan aspek-aspek tingkat belajar yang
diharapkan, 4. Tes Hasil Belajar hendaknya disusun sesuai
dengan tujuan penggunaaan tes itu sendiri, karena tes
dapat disusun sesuai
C. Hal – Hal yang Harus Diperhatikan
Ada beberapa hal yang harus diperhatikan dalam
merencanakan suatu tes, yaitu seperti berikut ini (Mehren &
Lehman, 1984, p. 64): 1) Tujuan tes, 2)Pengetahuan,
keterampilan, sikap, atau lainnya yang ingin diukur, 3)
Tabel spesifikasi 4) Kesesuaian butir tes dengan tujuan, 5)
Format butir tes, 6) Lama waktu untuk tes, 7) Tingkat
kesukaran tes, 8) Tingkat pembedaan tes, 9) Susunan
format tes (bila lebih dari satu), 10) Susunan butir tes untuk
tiap format, 11) Persiapan mahasiswa, 12) Tempat menulis
jawaban tes 12) Cara penskoran 13) Penskoran tes esei dan
pilihan ganda, 14) Tabulasi skor tes, 15) Laporan hasil tes
Tes yang banyak digunakan di sekolah adalah tes
hasil belajar yang dilak¬sanakan di kelas. Tes ini
mempunyai beberapa tujuan: 1) menentukan tingkat
ke¬mampuan mahasiswa, 2) mengukur pertumbuhan dan
perkembangan mahasiswa, 3) merangking mahasiswa
berdasarkan kemampuannya, 4) mendiagnosis kesulitan
mahasiswa, 5) mengevaluasi hasil pengajaran, 6)
mengetahui efektivitas kurikulum (pencapaian
kurikulum), 7) memotivasi mahasiswa. Sebuah tes sering

kali bisa digunakan untuk beberapa tujuan, tetapi tidak
akan memiliki efektivitas yang sama untuk semua tujuan.
Selain itu untuk mengkonstruksi tes hasil belajar
siswa secara baik dan berkualitas bukanlah pekerjaan
mudah, apalagi mengkonstruksi tes hasil belajar bagi anak
tuna grahita yang memiliki kekhasan dan karakteristik
belajar yang unik. Oleh karena itu pendidik harus
memperhatikan beberapa karakteristik atau syarat
penting agar tes hasil belajar yang dibuatnya berkualitas,
diantaranya: validitas, reliabelitas, diskriminatif,
komprehensif, obyektif, ekonomis, dan mudah digunakan
atau dilaksanakan. dalam penelitian ini kajiannya hanya
difokuskan pada dua indikator utama kualitas tes yaitu
validitas (isi) dan reliabilitas (konsistesi internal) sebagai
fungsi dari pengetahuan guru tentang konstruksi tes hasil
Hal ini didasarkan pertimbangan obyektif untuk
memecahkan masalah-masalah praktis yang dihadapi
guru.
Dari beberapa indikator kualitas tes tersebut,
terutama adalah syarat validitas dan reliabelitas atau
relevansi dan keandalan (Cangelosi, 1995:24). Berdasarkan
pandangan para ahli tersebut, dan mengingat
kemampuan peneliti, kajian kualitas tes hasil belajar
dalam penelitian ini hanya difokuskan pada dua indikator
utama yaitu validitas (isi) dan reliabilitas tes (konsistensi
internal), mengingat dua indikator inilah yang paling
penting kaitannya dengan kemampuan dalam
mengkonstruksi tes hasil belajar yang baik atau berkualitas
tinggi.

Sedangkan menurut Gronlund (1982: 125) konsep
validitas tes secara umum dapat diklarifikasi menjadi
beberapa bagian, Antara lain sebagai berikut:
a. Merujuk kepada interpretasi hasil tes,
b. Disimpulkan berdasarkan fakta yang ada,
c. Digunakan untuk kepentingan tertentu, seperti
seleksi, penempatan, evaluasi pembelajaran, dan
d. Dinyatakan melalui tingkatan: tinggi, sedang, dan
rendah.
Dalam konteks asesmen , validitas merujuk pada
akurasi dan kecocokan interpretasi hasil asesmen ,
sedangkan reliabilitas merujuk kepada konsistensi hasil
asesmen (Gronlund, 1982:47). Sejalan dengan pendapat
tersebut, Semiawan, (1986:45) mengemukakan bahwa
validitas tes menunjuk pada pengertian apakah hasil tes
sesuai dengan kriteria yang telah dirumuskan dan hingga
mana tes itu telah mengukurnya.
Terdapat empat bentuk validitas tes: prediksi,
konkuren, konstruk, dan validitas isi. Dalam konteks
pengukuran tingkah laku hasil belajar, suatu pengukuran
dikatakan valid apabila instrumen pengukurnya benar-
benar mengukur konsep teori yang dianut bukan konsep
yang lain, dan konsepnya diukur secara tepat (Philips
dalam Suwarno, 1987:35).
Adapun Sirait (1989:207) untuk menentukan
validitas tes hasil belajar ada dua pendekatan:
a. pendekatan kurikuler, dan
b. pendekatan statistic (Sirait, 1989:207).
Berdasarkan pandangan para ahli tersebut, dapat
ditarik pengertian bahwa validitas tes merupakan
ketepatan instrumen penilaian untuk menilai konsep yang

seharusnya dinilai (diukur). Validitas tes memiliki
karakteristik: merujuk kepada interpretasi hasil
tes/asesmen, disimpulkan berdasarkan fakta yang tersedia,
digunakanuntuk kepentingan tertentu, dan dinyatakan
melalui tingkatan (tinggi, sedang, rendah).
Tes yang tidak memiliki validitas, dapat
berdampak terhadap kesimpulan yang dibuat
berdasarkan hasil tes tersebut tidak dapat dipercaya.
Dengan demikian, validitas sutu tes adalah penting dalam
mengembangkan dan/atau mengkonstruksi suatu tes hasil
belajar. Terdapat empat bentuk validitas tes, yaitu:
prediksi, konkuren, konstruk, dan validitas isi.
Validitas isi merupakan syarat kualitas tes yang
sangat penting terutama bagi para guru dalam
pengajaran di kelasnya. Mengingat pentingnya validitas isi
suatu tes, maka bagaimana upaya yang seharusnya
dilakukan guru agar tes yang dikonstruksinya memiliki
validitas isi. Suatu tes dikatakan memiliki validitas isi
apabila tujuan-tujuan pembelajaran suatu mata
pelajaran terwakili dalam tes. Hal senada dikemukakan
Wiersma (1990:183), bahwa validitas isi merupakan
perhatian utama suatu tes yang digunakan dalam
pengajaran di kelas, dan untuk mengetahuinya melalui
analisis logis.. Ahli lainnya, Best mengemukakan bahwa
suatu tes memiliki validitas logis apabila tes benar-benar
mengukur atau berhubungan secara spesifik dengan
fenomena yang diujikan.
Dengan kata lain, validitas isi suatu tes berkenaan
dengan pertanyaan sejauhmana aitem-aitem dalam tes
mencakup keseluruhan kawasan isi objek yang
mencerminkan ciri atribut yang hendak diukur, dan untuk

mengujinya melalui analisis rasional atau professional
judgment (Azwar, S., 1997). Gronlund (1982:127)
mengemukakan hal-hal penting dalam mengkonstruksi
tes hasil belajar agar memiliki validitas isi, yaitu:
a. mengidentifikasi topik-topik mata pelajaran dan
hasil belajar yang diukur,
b. mempersiapkan tabel spesifikasi/kisi-kisi, untuk
menentukan sampel item yang digunakan, dan
c. mengkonstruksi tes berdasarkan spesifikasi (kisi-
kisi). Agar suatu tes memiliki validitas isi perlu
direkomendasikan oleh para pakar/ahli dalam
bidangnya, mengenai cakupan tes tersebut.
Selanjutnya untuk membantu menilai validitas isi
suatu tes, diperlukan petunjuk sebagai berikut:
a. Ada kejelasan mengenai cakupan mata pelajaran
dan keluasan sampling,
b. Harus ada resume singkat mengenai keterangan
para ahli yang telah dikonsultasi untuk
mengevaluai kecocokan pertanyaan-pertanyaan
dan prosedur penyekoran serta suatu deskripsi
singkat mengenai prosedur judgement-nya,
c. Ada manual judgement item tes yang harus
menampakkan derajat kesesuaian diantara
mereka, dan
d. Berikan tanggal pada pernyataan-pernyataan
dalam manual yang berhubungan dengan sumber
informasi.
Ahli lainnya Kerlinger (1990:732), mengemukakan
validitas isi merupakan pertimbangan, penilaian dan
pengambilan keputusan tentang representasi item tes baik
oleh sendiri (guru) dan atau judgement para pakar. Setiap

item tes (butir soal) dinilai mengenai relevansinya dengan
karakteristik yang diujikan. Dengan demikian, item tes
yang secara akurat representatif, maka tes secara akurat
pula memiliki validitas isi. Tes yang tidak memiliki validitas
isi dapat berakibat:
a. siswa tidak dapat menunjukkan kemampuan yang
sesungguhnya,
b. item yang disajikan tidak relevan memungkinkan
siswa salah menjawab hanya karena isinya belum
diajarkan, sehingga skor tes tidak mengukur
performa siswa secara akurat terhadap materi
yang diukur (Wiersma & Jurs, 1990: 185).
Berdasarkan uraian tersebut, dapat ditarik
pengertian bahwa yang dimaksud validitas isi dalam
konteks penelitian ini adalah analisis logis atau rasional,
dalam pengertian proses mempertimbangan, menilai dan
mengambil keputusan tentang representasi item-item tes
baik dilakukan sendiri dan atau melalui judgement para
pakar dalam bidangnya. Setiap item tes dinilai mengenai
relevansinya dengan sifat/karakteristik yang diujikan,
yang dalam hal ini relevansinya dengan tujuan
pembelajaran khusus (indikator).
Selain hal penting yang telah disebutkan, Gronlund
(1982:127) mengemukakan hal-hal penting dalam
mengkonstruksi tes hasil belajar agar memiliki validitas isi,
yaitu:
1) Mengidentifikasi topik-topik mata pelajaran dan
2) Mempersiapkan tabel spesifikasi/kisi-kisi,untuk
menentukan sampel item yang digunakan, dan

3) Mengkonstruksi tes berdasarkan spesifikasi (kisi-
kisi).
Agar suatu tes memiliki validitas isi perlu
direkomendasikan oleh para pakar/ahli dalam bidangnya,
mengenai cakupan tes tersebut. Selanjutnya untuk
membantu menilai validitas isi suatu tes, diperlukan
petunjuk sebagai berikut:
1) Ada kejelasan mengenai cakupan mata pelajaran
2) Harus ada resume singkat mengenai keterangan
3) Ada manual judgement item tes yang harus
mereka,
4) Berikan tanggal pada pernyataan-pernyataan
dalam manual yang berhubungan dengan sumber
informasi (Karmel, 1978).
D. Langkah – langkah Mengkontruksi Hasil Tes

Belajar Siswa
Untuk mengukur suatu hasil belajar, dipesyaratkan
adanya tes yang akan digunakan. Dalam penyusunan tes
hasil belajar ada beberapa langkah yang harus
ditempuh sebagai berikut:
1. Menyusun Kisi-Kisi
a. Ruang lingkup dari pengetahuan yang akan diukur
sesuai dengan rencana pelajaran yang telah kita
tetapkan dalam kurikulum.

b. Proporsi jumlah item daripada tiap-tiap sub materi.
Proporsi jumlah item untuk tiap-tiap sub materi
hendaknya sesuai dengan proporsi daripada luas
masing-masing sub materi. Misalnya apabila dalam
suatu materi terdiri dari tiga sub dengan proporsi
25% : 40% : 35%, maka jumlah itemnya pun harus
mengikuti proporsi 25% : 40% : 35%.
c. Jenis pengetahuan atau aspek proses mental yang
hendak diukur. Ada beberapa klasifikasi yang
dapat digunakan untuk menggolongkan jenis-jenis
pengetahuan. Salah satunya adalah klasifikasi dari
Bloom yang membagi jenjang pengetahuan
menjadi enam tingkatan yaitu: ingatan,
pemahaman, penerapan, sintesis dan evaluasi.
Dalam mengadakan evaluasi hasil belajar sedapat
mungkin hendaknya diusahakan agar keenam
jenjang pengetahuan tersebut kita ukur. Mengenai
proporsi daripada masing-masing jenjang
pengetahuan tersebut tergantung kepada
urgensinya.
d. Bentuk tes yang digunakan hendaknya lebih dari
satu bentuk. Misalnya: pilihan ganda dengan
menjodohkan, atau essay dengan melengkapi dan
sebagainya.
2. Menulis Soal
Untuk menuliskan soal-soal/item-item tes yang
baik, maka kita harus berpedoman pada saran atau
petunjuk penyusunan item menurut taksonomi Bloom.
Menurut Bloom ada tiga ranah dalam hasil belajar,
yaitu ranah kognitif, ranah afektif dan ranah
psikomotor.

3. Menata Soal
Setelah soal yang diperlukan untuk suatu tindakan
evaluasi mencukupi maka langkah selanjutnya ialah
mengatur soal tersebut. Dalam pengaturan ini kita
kelompokkan soal-soal itu menurut bentuknya. Jadi
bukan menurut jenis materinya dan bukan pula
menurut jenjang pengetahuan yang hendak diukur.
Dengan demikian ada kelompok soal multiple-choice,
ada kelompok soal matching dan sebagainya. Di
samping pengaturan menurut bentuk itemnya, soal itu
hendaknya diatur pula menurut taraf kesukarannya.
4. Menetapkan Skor
Setelah pengaturan soal sel uraian kita lakukan,
langkah selanjutnya adalah menetapkan besarnya skor
yang diberikan untuk setiap item. Beberapa skor yang
akan diberikan untuk setiap jawaban yang diberikan
oleh anak - anak. Cara menskor yang banyak
dilakukan adalah memberikan skor satu (1) untuk
setiap jawaban yang betul. Tetapi kerap kali
diperlukan cara pemberian skor yang lain pula,
misalnya untuk menghindari terjadinya pemberian skor
yang terlampau rendah atau terlampau tinggi untuk
pertanyaan tertentu. Hal ini digunakan skor yang
sebelumnya telah ditetapkan besarnya, yaitu yang
mengenai prinsip pokok disediakan skor yang lebih
besar daripada pertanyaan yang kurang penting.
Pemberian skor yang bergantung kepada penting atau
tidaknya suatu pertanyaan disebut pemberian skor atas
dasar bobot (Witherington, 1976, hal. 68).

5. Reproduksi Tes
Setelah semua langkah tersebut di atas dilampaui,
maka langkah terakhir adalah mereproduksi tes
tersebut. Reproduksi ini dapat dalam bentuk ketikan
ataupun cetakan.Jumlah reproduksi kita sesuaikan
dengan jumlah kebutuhan.
Penulis membawa pembaca melalui lima langkah
spesifik untuk pengembangan tes prestasi yang efektif: (1)
merencanakan tes dengan mendefinisikan secara jelas
tujuan hasil belajar yang diinginkan; (2) menyusun tes
objektif, esai dan kinerja; (3) mengumpulkan sampel
sampel dari item uji ke dalam bentuk yang terorganisir
dengan baik dan efisien; (4) mengelola tes dan dengan
cermat menafsirkan hasilnya; dan (5) menggunakan hasil
tes untuk meningkatkan pembelajaran. Meskipun empat
bab mendeskripsikan metode untuk membangun
berbagai jenis item uji, pengorganisasian buku ini
sedemikian rupa sehingga mudah dipahami bahwa item
uji tulis hanya satu bagian dari keseluruhan proses
perencanaan dan pengembangan tes. Kekuatan
konstruksi dengan teks mencakup prinsip-prinsip contoh uji
yang jelas dengan jelas untuk menggambarkan prinsip-
prinsip ini dengan beberapa contoh latihan interpretasi
untuk meaaure tingkat pengetahuan yang lebih tinggi.
Sedangkan menurut Norman E. Gronlund.
(1982:148) terdapat lima langkah spesifik untuk
pengembangan tes prestasi yang efektif,
1) Merencanakan tes dengan mendefinisikan secara
jelas tujuan hasil belajar yang diinginkan;
2) Menyusun tes objektif, esai dan kinerja;

3) Mengumpulkan sampel sampel dari item uji ke
dalam bentuk yang terorganisir dengan baik dan
efisien;
4) Mengelola tes dan dengan cermat menafsirkan
hasilnya;
5) Menggunakan hasil tes untuk meningkatkan
pembelajaran.

BAB VII
ANALISIS BUTIR SOAL
A. Definisi Analisis Butir Soal

Tes merupakan suatu pernyataan, tugas atau
seperangkat tugas yang direncanakan untuk memperoleh
informasi tentang trait atau atribut pendidikan dan
psikologi. Setiap butir pertanyaan atau tugas tersebut
mempunyai jawaban atau ketentuan yang dianggap
benar. Tes dapat diklasifikasikan menurut bentuk, tipe dan
ragamnya (Asmawi Zainul, dkk :1997).
Guru dapat memberikan berbagai macam bentuk
tes kepada siswanya sesuai dengan kebutuhan, namun
sebelum tes diberikan kepada siswa perlu dilakukannya
analisis terhadap setiap butir soal yang akan diujikan.
Menurut Sudjana (1991:135) analisis kualitas tes merupakan
suatu pengkajian pertanyaan-pertanyaan tes agar
diperoleh perangkat pertanyaan yang memiliki kualitas
yang memadai. Sebagaimana dinyatakan oleh Azwar
(2000:130), bahwa analisis kualitas tes adalah pengujian
seluruh item tes yang didasarkan pada item empirik (data
yang diperoleh dari hasil pengenaan tes yang
sesungguhnya), agar diperoleh bukti mengenai kualitas
item-item tes. Suharsimi Arikunto, (2013: 220)
berpendapat bahwa analisis soal merupakan kegiatan
untuk mengkaji soal pada setiap item atau butirnya guna
mengetahui kualitas dari setiap butir soal tersebut. “Analisis
butir soal adalah suatu prosedur yang sistematis, yang
154 | Analisis Butir Soal
akan memberikan informasi-informasi yang sangat khusus
terhadap butir tes yang kita susun”.
Selain itu Tinambunan (1988) juga menyatakan
bahwa analisis kualitas tes merupakan pengujian
terhadap setiap butir tes agar diketahui kelebihan dan
kelemahan-kelemahan dari butir tes tersebut.
Sebagaimana ditegaskan oleh Daryanto (2008: 179)
analisis butir soal adalah kegiatan yang dilakukan untuk
mengidentifikasi soal-soal baik, kurang baik, dan soal jelek
dan memperoleh petunjuk untuk melakukan perbaikan.
Analisis kualitas tes merupakan suatu tahap yang
harus ditempuh untuk mengetahui derajat kualitas suatu
tes, baik tes secara keseluruhan maupun butir soal yang
menjadi bagian tes tersebut. Dalam penilaian hasil belajar,
tes diharapkan dapat menggambarkan sampel perilaku
dan menghasilkan nilai yang objektif serta akurat. Jika tes
yang digunakan guru kurang baik, maka hasil yang yang
diperoleh juga tentunya kurang baik. Hal ini dapat
merugikan peserta didik itu sendiri. Artinya, hasil yang
diperoleh peserta didik menjadi tidak objektif dan tidak
adil. Analisis kualitas tes berkaitan dengan pertanyaan
“apakah tes sebagai suatu alat ukur benar-benar
mengukur apa yang hendak dan seharusnya diukur?”,
“sampai mana tes tersebut dapat diandalkan dan
berguna?” Kedua pertanyaan ini sebenarnya menunjukan
pada dua hal pokok, yaitu validitas dan reliabilitas.
Kegiatan menganalisis butir soal merupakan suatu
kegiatan yang harus dilakukan guru untuk meningkatkan
mutu soal yang telah ditulis. Kegiatan ini merupakan
proses pengumpulan, peringkasan, dan penggunaan
informasi dari jawaban siswa untuk membuat keputusan
Analisis Butir Soal | 155
tentang setiap penilaian (Nitko, 1996: 308). Analisis butir
adalah proses menguji respon-respon siswa untuk masing-
masing butir tes dalam upaya menjustifikasi kualitas item.
Kualitas item, khususnya direpresentasi oleh daya beda
item, tingkat kesukaran item, dan khusus untuk tes pilihan
ganda tidak kalah pentingnya adalah keefektifan
pengecoh (Mehrens & Lehmann, 1984).
Suryabrata (1999) menyatakan bahwa analisis
butir soal mencakup telaah soal atau analisis kualitatif dan
analisis terhadap data empirik hasil ujicoba atau analisis
kuantitatif. Analisis butir soal secara kualitatif
menekankan penilaian dari ketiga segi yaitu materi,
konstruksi, dan bahasa. Namun demikian dalam
pembahasan ini dikhususkan untuk menjelaskan analisis
butir soal secara kuantitatif. Analisis ini dilakukan
berdasarkan data yang diperoleh secara empiris melalui
ujicoba dari suatu perangkat tes. Analisis kuantitatif sering
disebut dengan analisis item yang menghasilkan
karakteristik atau parameter butir dan tes, yaitu: tingkat
kesukaran, daya beda dan distribusi jawaban dan kunci
setiap butir, serta reliabilitas dan kesalahan pengukuran
(SEM) dalam tes.
Ada beberapa alasan mengapa diperlukan analisis
butir soal. Menurut (Asmawi Zainul, dkk :1997) alasan
tersebut antara lain :
a) Untuk mengetahui kekuatan dan kelemahan butir
tes, sehingga dapat dilakukan seleksi dan revisi butir
soal.

b) Untuk menyediakan informasi tentang spesifikasi
butir soal secara lengkap, sehingga akan lebih
memudahkan bagi pembuat soal dalam menyusun
perangkat soal yang akan memenuhi kebutuhan
ujian dalam bidang dan tingkat tertentu.
c) Untuk segera dapat mengetahui masalah yang
terkandung dalam butir soal, seperti: kemenduaan
butir soal, kesalahan meletakkan kunci jawaban,
soal yang terlalu sukar dan terlalu mudah, atau soal
yang mempunyai daya beda rendah. Masalah ini bila
diketahui dengan segera akan memungkinkan bagi
pembuat soal untuk mengambil keputusan apakah
butir soal yang bermasalah itu akan digugurkan
atau direvisi guna menentukan nilai peserta didik.
d) Untuk dijadikan alat guna menilai butir soal yang
akan disimpan dalam kumpulan soal.
e) Untuk memperoleh informasi tentang butir soal
sehingga memungkinkan untuk menyusun beberapa
perangkat soal yang paralel. Penyusunan perangkat
seperti ini sangat bermanfaat bila akan melakukan
ujian ulang atau mengukur kemampuan beberapa
kelompok peserta tes dalam waktu yang berbeda
Telah disinggung di depan bahwa analisis soal antara
lain bertujuan untuk mengadakan identifikasi soal-soal
yang baik, kurang lebih atau sedang dan soal yang tidak
baik. Dengan analisis soal dapat diperoleh informasi
tentang kekurangan sebuah soal tes dan “petunjuk” untuk
mengadakan perbaikan. Di samping itu, butir soal yang
telah dianalisis dapat memberikan informasi kepada
peserta didik dan guru. Untuk mendapatkan informasi

tentang karakteristik setiap butir soal perlu dilakukan
analisis soal, baik analisis kualitatif maupun analisis
kuantitatif. Hasil analisis soal dapat digunakan untuk
menguji apakah suatu soal akan berfungsi (analisis
kualitatif) atau telah berfungsi (analisis kuantitatif)
dengan baik. Jadi, ada dua cara yang dapat digunakan
dalam penelahaan butir soal yaitu penelahaan secara
kualitatif dan kuantitatif.
Maka berdasarkan penjelasan diatas dapat kita
simpulkan bahwa yang dimaksud dengan menganalisis
butir-butir soal tes adalah pengujian seluruh item tes yang
didasarkan pada item empirik (data yang diperoleh dari
hasil pengenaan tes yang sesungguhnya), agar diperoleh
bukti mengenai kualitas item-item tes baik berupa
kelebihan ataupun kelemahan dari butir tes tersebut.
Analisis tes dan butir soal merupakan suatu tahap yang
harus ditempuh untuk mengetahui derajat kualitas suatu
tes, baik tes secara keseluruhan maupun butir soal yang
menjadi bagian dari tes tersebut. Oleh karena itu, tes yang
digunakan guru harus memiliki kualitas yang baik. Analisis
tes berkaitan dengan pertanyaan apakah tes itu dapat
dijadikan sebagai alat ukur benar-benar mampu
mengukur apa yang hendak diukur, dan sampaimana tes
tersebut dapat diandalkan dan berguna.
B. Tujuan dan Fungsi Analisis Butir Soal

Analisis butir soal bertujuan untuk mengidentifikasi
soal yang baik dan soal yang jelek (Daryanto, 2008: 179).
Idealnya dalam melakukan analisis butir soal pada tes
ditinjau dari segi validitas, reliabilitas, daya pembeda,
tingkat kesukaran dan efektivitas pengecoh untuk pilihan
ganda.
Tujuan utama analisis butir soal dalam sebuah tes
yang dibuat guru adalah untuk mengidentifikasi
kekurangan-kekurangan dalam tes atau dalam
pembelajaran (Anastasi dan Urbina, 1997:184).
Berdasarkan tujuan ini, maka kegiatan analisis butir soal
memiliki banyak manfaat, di antaranya adalah: (1) dapat
membantu para pengguna tes dalam evaluasi atas tes
yang digunakan, (2) sangat relevan bagi penyusunan tes
informal dan lokal seperti tes yang disiapkan guru untuk
siswa di kelas, (3) mendukung penulisan butir soal yang
efektif, (4) secara materi dapat memperbaiki tes di kelas,
(5) meningkatkan validitas soal dan reliabilitas (Anastasi
and Urbina, 1997:172).
Aiken (1994 : 63) berpendapat bahwa kegiatan
analisis butir soal merupakan kegiatan yang penting
dalam penyusunan soal agar diperoleh butir soal yang
bermutu. Soal yang bermutu adalah soal yang dapat
memberikan informasi setepat-tepatnya tentang siswa
mana yang telah menguasai materi dan siswa mana yang
belum menguasai materi. Maka tujuan dari kegiatan ini
adalah:
1. Mengkaji dan menelaah setiap butir soal agar
diperoleh soal yang bermutu sebelum digunakan,
2. Meningkatkan kualitas butir tes melalui revisi atau
membuang soal yang tidak efektif,
3. Mengetahui informasi diagnostik pada siswa
apakah mereka telah memahami materi yang
telah diajarkan.

Selain itu analisis butir soal juga mempunyai
banyak manfaat sebgaimana diungkapkan oleh Anastasia
dan Urbina (1997) dalam Suprananto (2012), analisis butir
soal memiliki banyak manfaat, diantaranya yakni:
1. Membantu pengguna tes dalam mengevaluasi
kualitas tes yang digunakan,
2. Relevan bagi penyusunan tes informal seperti tes
yang disiapkan guru untuk siswa dikelas,
3. Mendukung penulisan butir soal yang efektif,
4. Secara materi dapat memperbaiki tes di kelas
5. Meningkatkan validitas soal dan reliabilitas.
Linn dan Gronlund (1995) dalam Suprananto (2012:

163), menambahkan bahwa pelaksanaan kegiatan analisis
butir soal, biasanya didesain untuk menjawab
pertanyaan-pertanyaan berikut:
1) Apakah fungsi soal sudah tepat?
2) Apakah soal telah memiliki tingkat kesukaran yang
tepat?
3) Apakah soal bebas dari hal-hal yang tidak relevan?
4) Apakah pilihan jawabannya efektif?
Selain itu, data hasil analisis butir soal juga sangat
bermanfaat sebagai dasar untuk:
1. Diskusi tentang efisien hasil tes,
2. kerja remedial,
3. peningkatan secara umum pembelajaran di kelas,
4. peningkatan keterampilan pada kontruksi tes.
Berdasarkan uraian di atas menunjukkan bahwa

analisis butir soal memberikan manfaat:

1. Menentukan soal-soal yang cacat atau tidak
berfungsi dengan baik,
2. Meningkatkan butir soal melalui tiga komponen
analisis yaitu, tingkat kesukaran, daya pembeda
dan pengecoh soal,
3. Merevisi soal yang tidak relevan degan materi yang
diajarkan, ditandai dengan banyaknya anak yang
tidak dapat menjawab butir soal tertentu.
Selain fungsi yang telah disebutkan diatas, kegiatan
analisis butir soal juga memiliki banyak manfaat, di
antaranya: (1) menentukan apakah suatu fungsi butir soal
sesuai dengan yang diharapkan, (2) memberi masukan
kepada siswa tentang kemampuan dan sebagai dasar
untuk bahan diskusi di kelas, (3) memberi masukan
kepada guru tentang kesulitan siswa, (4) memberi
masukan pada aspek tertentu untuk pengembangan
kurikulum, (5) merevisi materi yang dinilai atau diukur, (6)
meningkatkan keterampilan penulisan soal (Nitko, 1996:
308-309).
Menururt kusaeri dan Suprananto (2012 : 164)
kegiatan analisis pada setiap butir soal memberikan
manfaat bagi penyusun soal. Manfaat tersebut antara lain
yaitu :
1 Menentukan soal-soal yang cacat atau tidak berfungsi
dengan baik
2 Meningkatkan butir soal melalui tiga komponen analisis
yaitu tingkat kesukaran, daya pembeda,dan pengecoh
soal
3 Merevisi soal yang tidak relevan dengan materi yang
diajarkan, ditandai dengan banyaknya anak yang

tidak dapat menjawab butir soal tertentu (Kusaeri dan
Suprananto, 2012: 164)
Lebih lanjut Linn dan Gronlund (1995: 3 16-318)
menyatakan bahwa kegunaan analisis butir soal bukan
hanya terbatas untuk peningkatkan butir soal, tetapi ada
beberapa hal, yaitu bahwa data analisis butir soal
bermanfaat sebagai dasar: (1) diskusi kelas efisien tentang
hasil tes, (2) untuk kerja remedial, (3) untuk peningkatan
secara umum pembelajaran di kelas, dan (3) untuk
peningkatan keterampilan pada konstruksi tes.
Berbagai uraian di atas menunjukkan bahwa
analisis butir soal adalah: (1) untuk menentukan soal-soal
yang cacat atau tidak berfungsi penggunaannya; (2)
untuk meningkatkan butir soal melalui tiga komponen
analisis yaitu tingkat kesukaran, daya pembeda, dan
pengecoh soal, serta meningkatkan pembelajaran melalui
ambiguitas soal dan keterampilan tertentu yang
menyebabkan peserta didik sulit. Di samping itu, butir soal
yang telah dianalisis dapat memberikan informasi kepada
peserta didik dan guru.
C. Karakteristik Analisis Butir Soal

Untuk tes hasil belajar pada umumnya
dipertimbangkan tiga karakteristik butir soal, yaitu :
tingkat kesukaran, daya beda dan distribusi jawaban atau
berfungsi tidaknya pilihan jawaban (distraktor). Ketiga
karakteristik butir soal ini secara bersama-sama akan
menentukan mutu butir soal. Bila salah satu dari ketiga
karakteristik ini tidak memenuhi persyaratan maka mutu

butir soal akan turun. Tujuan pokok mencari daya beda
adalah untuk menentukan apakah butir soal tersebut
memiliki kemampuan membedakan kelompok dalam
aspek yang diukur, sesuai dengan perbedaan yang ada
pada kelompok itu.
Menurut John W (1982) terdapat beberapa
karakteristik atau syarat penting yang perlu diperhatikan
guru agar tes hasil belajar yang dibuatnya berkualitas,
diantaranya: validitas, reliabelitas, diskriminatif,
komprehensif, obyektif, ekonomis, dan mudah digunakan
atau dilaksanakan. dalam penelitian ini kajiannya hanya
difokuskan pada dua indikator utama kualitas tes yaitu
validitas (isi) dan reliabilitas (konsistesi internal) sebagai
fungsi dari pengetahuan guru tentang konstruksi tes hasil
Hal ini didasarkan pertimbangan obyektif untuk
memecahkan masalah-masalah praktis yang dihadapi
guru
Suatu tes dapat dikatakan baik apabila tes
tersebut memiliki ciri sebagai alat ukur yang baik. Adapun
kriteria soal tes yang baik antara lainnya yaitu : a) Memiliki
Validitas (keshahihan) yang cukup tinggi Suatu tes
dikatakan valid atau shahih jika tes tersebut mengukur
tujuan atau salah satu aspek tujuan yang peneliti ukur.
Salah satu metode penentuan kevalidan tes prestasi yaitu
mempelajari isi tes. Untuk penjelasan lebih lanjut akan
kami jelaskan pada sub berikutnya. b) Memiliki Reliabilitas
(keajegan / kestabilan) yang baik Tes dikatakan reliabel
jika mengukur secara konsisten. Reliabel tes tidak
ditentukan dengan mengujikan tes itu sendiri, namun tes
sebenarnya harus diuji cobakan untuk menghasilkan
informasi yang diinginkan.
Menurut Thoha (1996:142-143) suatu tes dapat
dikatakan baik apabila tes tersebut memiliki ciri atau
kriteria sebagai alat ukur yang baik. Kriteria tersebut
antara lain yaitu :
a) Memiliki Validitas (keshahihan) yang cukup tinggi
Suatu tes dikatakan valid atau shahih jika tes tersebut
mengukur tujuan atau salah satu aspek tujuan yang
peneliti ukur. Salah satu metode penentuan kevalidan
tes prestasi yaitu mempelajari isi tes. Untuk penjelasan
lebih lanjut akan kami jelaskan pada sub berikutnya.
b) Memiliki Reliabilitas (keajegan / kestabilan) yang baik
Tes dikatakan reliabel jika mengukur secara konsisten.
Reliabel tes tidak ditentukan dengan mengujikan tes itu
sendiri, namun tes sebenarnya harus diuji cobakan
untuk menghasilkan informasi yang diinginkan.
c) Kriteria tes Memiliki Nilai Objektivitas Objektivitas suatu
tes ditentukan oleh tingkat atau kualitas kesamaan
skor-skor yang diperoleh dengan tes tersebut meskipun
hasil tes itu dinilai oleh beberapa orang penilai. Untuk
itu diperlukan kunci jawaban tes (scoring key).
Kualitas objektivitas suatu tes dapat dibedakan

menjadi tiga tingkatan, antara lain :
1. Tinggi, yaitu jika hasil-hasil tes itu menunjukkan
tingkat kesamaan yang tinggi
2. Sedang, yaitu seperti tes yang sudah distandarisasi,
tetapi pandangan subjektif skor masih mungkin
muncul dalam penilaian dan interpretasinya.

3. Fleksibel, yaitu seperti beberapa jenis tes yang
digunakan oleh LBP (lembaga Bimbingan dan
Penyuluhan) untuk keperluan konseling.
Memiliki nilai Kepraktisan Kepraktisan suatu tes
juga penting diperhatikan. Suatu tes dikatakan
mempunyai kepraktisa yang baik jika kemungkinan
untuk menggunakan tes itu besar. Kriteria untuk
mengukur praktis tidaknya suatu tes dapat dilihat dari
:
1. Biaya yang diperlukan untuk menyelenggarakan
tes itu.
2. Waktu yang diperlukan untuk menyusun tes itu.
3. Sukar- mudahnya menyusun tes itu.
4. Sukar-mudahnya menilai tes itu.
5. Sulit-tidaknya menginterpretasikan (mengolah)
hasil tes itu.
6. Lamanya waktu yang diperlukan untuk
melaksanakan tes itu.
Lebih spesifik lagi dijelaskan oleh Suharsimi Arikunto
(2013: 72) yang menyatakan bahwa sebuah tes dapat
dikatakan baik sebagai alat pengukuran apabila
memenuhi persyaratan sebagai berikut:
1. Validitas
Sebuah data dapat dikatakan valid apabila sesuai
dengan keadaan senyatanya. Data yang dihasilkan
oleh instrumen yang benar, valid dan sesuai dengan
kenyataannya maka instrumen yang digunakan
juga valid. Sebuah tes dikatakan valid atau tepat
apabila tes tersebut dapat mengukur apa yang
hendak diukur.

2. Reliabilitas
Tes dikatakan reliabel apabila memberikan hasil
yang tetap walaupun diteskan berkali-kali. Dengan
kata lain, yang dimaksud dari reliabilitas adalah
ketetapan dari sebuah instrumen.
3. Objektivitas
Sebuah tes memiliki objektivitas apabila dalam
melaksanakan tes tersebut tidak ada faktor subjektif
yang memengaruhi.
4. Praktikabilitas
Sebuah tes dikatakan memiliki praktikabilitas yang
tinggi apabila tes tersebut bersifat praktis. Tes yang
praktis adalah tes yang mudah dalam berbagai hal
seperti praktis dalam pelaksanaannya, praktis
dalam pemeriksaannya, praktis dalam
pengadministrasiannya, dan dilengkapi petunjuk
yang jelas sehingga dapat diberikan oleh orang lain.
5. Ekonomis
Sebuah alat atau instrumen dikatakan ekonomis
apabila dalam pelaksanaannya tidak memerlukan
biaya yang mahal, waktu dan tenaga yang banyak.
D. Macam- Macam Analisis Butir Soal

Selanjutnya menurut Anastasia dan Urbina (1997)
dalam Suprananto (2012), analisis butir soal dapat
dilakukan secara kualitatif (berkaitan dengan isi dan
bentuknya) dan kuantitatif (berkaitan dengan ciri-ciri
statistiknya). Analisis kualitatif mencakup pertimbangan
validitas isi dan konstruksi, sedangkan analisis kuantitatif

mencakup pengukuran validitas dan reliabilitas butir soal,
kesulitan butir soal serta diskriminasi soal. Kedua teknik ini
masing-masing memiliki keunggulan dan kelemahan, oleh
karena itu teknik terbaik adalah menggunakan atau
memadukan keduanya.
Lebih lanjut dijelaskan oleh Suprananto (2012)
menegenai analisis secara kualitatif dan analisis melalui
kuantitatif :
A. Teknik Analisis Secara Kualitatif
Ada beberapa teknik yang dapat digunakan untuk
menganalisis butir soal secara kualitatif, yakni teknik
moderator dan panel. Teknik moderator merupakan
teknik berdiskusi yang didalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal
didiskusikan secara bersama dengan beberapa ahli, seperti
guru yang mengajarkan materi, ahli materi, penyusun
atau pengembang kurikulum, ahli penilaian, ahli bahasa
dan orang yang memiliki latar belakang psikologi. Teknik
ini sangat baik, karena didiskusikan dan ditelaah secara
bersama-sama, namun teknik tersebut memiliki
kelemahan karena memerlukan waktu lama untuk
mendiskusikan setiap satu butir soal.
Teknik berikutnya adalah teknik panel. Teknik pa
merupakan suatu teknik yang menelaah butir soal
berdasarkan kaidah penulisan butir soal. Kaidah itu
diantaranya materi, kontruksi, bahasa atau budaya,
kebenaran kunci jawaban atau pedoman penskoran.
Caranya beberapa penelaah diberikan butir-butir soal
yang akan ditelaah, format penelaahan dan pedoman
penilaian atau penelaahan. Tahap awal, semua orang

yang terlibat dalam kegiatan penelaahan disamakan
persepsinya, kemudian mereka bekerja sendiri-sendiri di
tempat berbeda. Para penelaah dipersilahkan
memperbaiki langsung pada teks soal dan memberikan
nilai pada setiap butir soal dengan kriteria soal baik, perlu
diperbaiki atau diganti (Suprananto, 2012)
Suryabrata (1999) dalam bukunya yang berjudul
Pengembangan Alat Ukur Psikologis membagi jenis analisis
butir soal secara kualitatif menjadi dua macam yaitu:
1) Analisis Butir Soal Ditinjau dari Materi,
Konstruksi, dan Bahasa
Pada prinsipya analisis butir soal secara kualitatif
dilaksanakan berdasarkan kaidah penulisan soal. Aspek
yang diperhatikan didalam penelaahan secara kualitatif
adalah telaah soal dari segi materi, konstruksi,
bahasa/budaya, dan kunci jawaban/pedoman
peskorannya. Tidak ada aturan yang baku untuk
menntukan jumlah alternatif jawaban. Di Indonesia
biasanya digunakan 3 atau 4 alternatif jawaban untuk
sekolah dasar dan 5 alternatif jawaban untuk sekolah
menengah. Semakin bnyak jumlah alternatif jawaban,
maka akan semakin berkurang pula faktor menebak
yang dilakukan peserta didik. Pengurangan faktor
menebak akan meningkatkan reliabilitas dan validitas
sepanjang alternatif jawaban dan soalnya dibuat bagus.
Berikut kutipan pedoman utama dalam pembuatan butir
soal bentuk pilihan ganda yang baik menurut Djemari
Mardapi:
1) Pokok soal harus jelas.
2) Pilhan jawaban homogen dalam arti isi.

3) Panjang kalimat pilihan jawaban relatif sama.
4) Tidak ada petunjuk jawaban benar.
5) Hindari menggunakan pilihan jawaban semua
benar atau semua salah.
6) Pilihan jawaban angka diurutkan.
7) Semua pilihan jawaban logis.
8) Jangan menggunakan negatif ganda.
9) Kalimat yang digunakan sesuai dengan tingkat
perkembangan peserta tes.
10) Bahasa Indonesia yang digunakan baku.
11) Letak pilihan jawaban benar ditentukan secara
acak.
Ada beberapa teknik yang dapat dilakukan untuk

menganalisis butir soal secara kualitatif, diantaranya
adalah teknik panel. Teknik panel merupakan teknik
menelaah butir soal berdasarkan kaidah penulisan butir
soal yaitu ditelaah dari segi materi, konstruksi dan bahasa
yang dilakukan oleh beberapa penelaah. Kriteria telaah
dari segi materi, konstruksi, dan bahasa adalah sebagai
berikut:
a) Materi
Dari segi materi yang harus diperhatikan adalah:
a) Kesesuaian soal dengan indikator , apabila soal
didasarkan atas kisikisi yang
b) memuat indikator soal harus sesuai dengan kisi-kisi.
c) Kesesuaian materi yang diukur dengan kompetensi
relevansi, kontinuitas, keterpakaian sehari-hari
tinggi.
d) Pilihan jawaban homogen dan logis.

e) Hanya ada satu kunci jawaban.
b) Konstruksi
a) Pokok soal dirumuskan dengan singkat, jelas, dan
tegas.
b) Rumusan pokok soal dan pilihan jawaban
merupakan pernyataan yang diperlukan saja.
c) Pokok soal tidak memberi petunjuk kunci jawaban.
d) Pokok soal bebas dari pernyataan yang bersifat
negative ganda.
e) Pilihan jawaban homogeny dan logis ditinjau dari
segi materi.
f) Gambar, grafik, tabel, diagram, atau sejenisnya
jelas dan berfungsi.
g) Panjang pilihan jawaban relatif sama.
h) Pilihan jawaban tidak menggunakan pernyataan
“semua jawaban diatas salah/benar” dan
sejenisnya.
i) Pilihan jawaban yang berbentuk angka/waktu
disusun berdasarkan urutan
besar kecilnya angka atau kronologisnya.
J) Butir soal tidak bergantung pada jawaban soal
sebelumnya.
c) Bahasa
a) Menggunakan bahasa yang sesuai dengan kaidah
bahasa Indonesia.
b) Menggunakan bahasa yang komunikatif.
c) Tidak menggunakan bahasa yang berlaku
setempat/ tabu.

d) Pilihan jawaban tidak mengulang kata/kelompok
kata yang sama, kecuali merupakan satu kesatuan
pengertian.
Untuk memudahkan penilaian maka dalam
penelitian ini penulis menggunakan form penilaian seperti
tercantum pada Lampiran 3. Kriteria keputusan yang
diambil dengan kategori diterima, direvisi, dan diolak
(diganti), dengan ketentuan sebagai berikut:
1) Item soal yang diterima adalah item soal yang
karakteristiknya memenuhi semua kriteria yang
ada.
2) Item soal yang direvisi adalah item soal yang
karakteristiknya tidak memenuhi kriteria minimal
pada aspek materi selain nomor 1 dan 3, pada
aspek konstruksi maksimal 3 kriteria, sedangkan
pada aspek bahasa tidak sesuai hanya satu kriteria
saja.
3) Item soal yang ditolak adalah item soal yang
karakteristiknya tidak memenuhi semua kriteria
penilaian pada aspek materi poin nomor 1 dan 3,
pada aspek konstruksi lebih dari tiga kriteria,
sedangkan pada aspek bahasa tidak sesuai lebih
dari satu kriteria yang ditentukan.
2) Analisis Distribusi Jenjang Ranah Kognitif
Taksonomi Bloom
Kualitas butir tes juga dilihat dari tingkat berfikir
yang diperlukan dalam mengerjakan soal. Selama ini
dikenal taksonomi Bloom untuk menunjukkan tingkatan
berfikir pada ranah kognitif. Menurut taksonomi Bloom
terdapat enam tingkatan ranah kognitif yaitu pengenalan

(C1), pemahaman (C2), aplikasi (C3), analisis (C4), sintesa
(C5), dan evaluasi (C6).
Pada taksonomi Bloom yang direvisi jumlah dan
jenis proses kognitif tetap sama seperti dalam taksonomi
yang lama, hanya kategori analisis dan evaluasi ditukar
urutannya dan kategori sintesis kini dinamai mencipta
(create). Seperti halnya taksonomi yang lama, taksonomi
yang baru secara umum juga menunjukkan penjenjangan,
dari proses kognitif yang sederhana ke proses kognitif yang
lebih kompleks. Namun demikian penjenjangan pada
taksonomi yang baru lebih fleksibel sifatnya. Artinya,
untuk dapat melakukan proses kognitif yang lebih tinggi
tidak mutlak disyaratkan penguasaan proses kognitif yang
lebih rendah. Berikut adalah taksonomi proses kognitif
yang baru:
a) Menghafal (Remember, C1):
Menarik kembali informasi yang tersimpan dalam
memori jangka panjang. Mengingat merupakan proses
kognitif yang paling rendah tingkatannya. Kategori ini
mencakup dua macam proses kognitif: mengenali
(recognizing) dan mengingat (recalling). Mengenali
(Recognizing): mencakup proses kognitif untuk menarik
kembali informasi yang tersimpan dalam memori
jangka panjang yang identik atau sama dengan
informasi yang baru. Bentuk tes yang meminta siswa
menentukan betul atau salah, menjodohkan, dan
pilihan berganda merupakan tes yang sesuai untuk
mengukur kemampuan mengenali. Istilah lain untuk
mengenali adalah mengidentifikasi (identifying).
Mengingat (Recalling): menarik kembali informasi yang

tersimpan dalam memori jangka panjang apabila ada
petunjuk (tanda) untuk melakukan hal tersebut. Tanda
di sini seringkali berupa pertanyaan. Istilah lain untuk
mengingat adalah menarik (retrieving).
b) Memahami (Understand, C2):
Mengkonstruk makna atau pengertian berdasarkan
pengetahuan awal yang dimiliki, mengaitkan informasi
yang baru dengan pengetahuan yang telah dimiliki,
atau mengintegrasikan pengetahuan yang baru ke
dalam skema yang telah ada dalam pemikiran siswa.
Karena penyususn skema adalah konsep, maka
pengetahuan konseptual merupakan dasar
pemahaman. Kategori memahami mencakup tujuh
proses kognitif: menafsirkan (interpreting), memberikan
contoh (exemplifying), mengkelasifikasikan (classifying),
meringkas (summarizing), menarik inferensi (inferring),
membandingkan (comparing), dan menjelaskan
(explaining).
c) Mengaplikasikan (Apply, C3):
Mencakup penggunaan suatu prosedur guna
menyelesaikan masalah atau mengerjakan tugas. Oleh
karena itu mengaplikasikan berkaitan erat dengan
pengetahuan prosedural. Namun tidak berarti bahwa
kategori ini hanya sesuai untuk pengetahuan
prosedural saja. Kategori ini mencakup dua macam
proses kognitif: menjalankan (executing) dan
mengimplementasikan (implementing).
d) Menganalisis (Analyze, C4):
Menguraikan suatu permasalahan atau obyek ke
unsur-unsurnya dan menentukan bagaimana saling

keterkaitan antar unsur-unsur tersebut dan struktur
besarnya. Ada tiga macam proses kognitif yang
tercakup dalam menganalisis: membedakan
(differentiating), mengorganisir (organizing), dan
menemukan pesan tersirat (attributting).
e) Mengevaluasi (Evaluate, C5):
Membuat suatu pertimbangan berdasarkan kriteria
dan standar yang ada. Ada dua macam proses kognitif
yang tercakup dalam kategori ini: memeriksa
(checking) dan mengritik (critiquing). Memeriksa
(Checking): Menguji konsistensi atau kekurangan suatu
karya berdasarkan kriteria internal (kriteria yang
melekat dengan sifat produk tersebut). Contoh:
Memeriksa apakah kesimpulan yang ditarik telah sesuai
dengan data yang ada. Mengkritik (Critiquing): menilai
suatu karya baik kelebihan maupun kekurangannya,
berdasarkan kriteria eksternal. Contoh: menilai apakah
rumusan hipotesis sesuai atau tidak (sesuai atau
tidaknya rumusan hipotesis dipengaruhi oleh
pengetahuan dan cara pandang penilai).
f) Mencipta (Create, C6): menggabungkan beberapa
unsur menjadi suatu bentuk kesatuan. Ada tiga macam
proses kognitif yang tergolong dalam kategori ini, yaitu:
membuat (generating), merencanakan (planning), dan
memproduksi
(producing). Membuat (generating): menguraikan
suatu masalah sehingga dapat dirumuskan berbagai
kemungkinan hipotesis yang mengarah pada
pemecahan masalah tersebut. Contoh: merumuskan
hipotesis untuk memecahkan permasalahan yang

terjadi berdasarkan pengamatan di lapangan.
Merencanakan (planning): merancang suatu metode
atau strategi untuk memecahkan masalah. Contoh:
merancang serangkaian percobaan untuk menguji
hipotesis yang telah dirumuskan. Memproduksi
(producing): membuat suatu rancangan atau
menjalankan suatu rencana untuk memecahkan
masalah. Contoh: mendesain (atau juga membuat)
suatu alat yang akan digunakan untuk melakukan
percobaan.
B. Teknik Analisis Secara Kuantitatif
Penelaahan soal secara kuantitatif adalah
penelaahan butir soal berdasarkan pada data empirik.
Data empirik ini diperoleh dari soal yang telah diujikan.
Ada dua pendekatan dalam analisis secara kuantitatif,
yaitu pendekatan secara klasik dan modern. Analisis butir
soal secara klasik adalah proses penelaahan butir soal
melalui informasi dari jawaban peserta tes guna
meningkatkan mutu butir soal yang bersangkutan dengan
menggunakan teori klasik. Kelebihan dari analisis ini yakni,
murah, sederhana, familiar, dapat dilaksanakan sehari-
hari dengan cepat menggunakan komputer dapat
menggunakan data dari beberapa peserta tes atau
sampel kecil. Hal tersebut telah dikemukakan oleh
Millman dan Greene (1993) dalam Suprananto, (2012).
Selanjutnya analisis butir soal secara modern adalah
penelaahan butir soal dengan menggunakan teori respon
butir atauItem Response Theory (IRT). Teori ini merupakan
suatu teori yang menggunakan fungsi matematika untuk
menghubungkan antara peluang menjawab benar suatu

butir dengan kemampuan siswa. Teori ini muncul karena
adanya beberapa keterbatasan pada analisis secara
klasik, yaitu:
1. Tingkat kemampuan dalam teori klasik adalah true
score. Artinya jika suatu tes sulit maka tingkat
kemampuan peserta tes akan rendah, sebaliknya
jika suatu tes mudah, maka tingkat kemampuan
peserta tes tinggi,
2. Tingkat kesukaran butir soal didefinisikan sebagai
proporsi peserta tes yang menjawab benar. Mudah
atau sulitnya butir soal tergantung pada
kemampuan peserta tes
3. Daya pembeda, reliabilitas dan validitas tes
tergantung pada kondsi peserta didik.
Suryabrata (1999) juga menjelaskan secara detai
mengenai analisis butir soal secara kuantitatif. Penjelasan
tersebut dipaparkan dalam bukunya yang berjudul
Pengembangan Alat Ukur Psikologis. Adapun penjelasan
mengenai analisis butir soal secara Kuantitatif menurut
Suryabrata yaitu :
a) Analisis Butir Soal Secara Kuantitatif
Penelaahan soal secara kuantitatif maksudnya
adalah penelaahan butir soal didasarkan pada data
empirik dari butir soal yang bersangkutan. Salah satu
pendekatan pada analisis butir soal secara kuantitatif
adalah pendekatan secara klasik. Pada pendekatan ini
proses penelaahan melalui informasi dari jawaban peserta
didik guna meningkatkan mutu butir soal yang
bersangkutan. Kelebihan analisis butir soal secara klasik

adalah murah, dapat dilaksanakan sehari-hari dengan
cepat, sederhana, familier dan dapat mengunakan data
dari beberapa peserta. Aspek yang perlu diperhatikan
dalam analisis butir soal secara klasik adalah telaah dari
segi reliabilitas, daya pembeda, tingkat kesukaran soal dan
penyebaran pilihan jawaban.
1) Validitas
Suatu alat penilaian dikatakan mempunyai validitas
yang tinggi apabila alat penilaian tersebut mampu
mengukur apa yang seharusnya diukur. Maksudnya,
validitas adalah syarat relatif suatu teknik evaluasi karena
bergantung pada tujuan yang hendak dicapai dari proses
evaluasi itu sendiri, jadi validitas bukanlah sebuah syarat
mutlak. Hasil telaah kualitatif sudah dapat mewakili item
soal yang memenuhi validitas isi. Arikunto (2010: 65)
menjelaskan bahwa “Secara garis besar ada dua macam
validitas, yaitu validitas logis dan validitas empiris”. Validias
logis biasanya menunjukkan kondisi valid suatu instrumen
berdasarkan hasil penalaran sesuai dengan persyaratan
yang ada. Termasuk di dalam jenis validitas logis adalah
validitas isi dan validitas konstruksi (construct validity).
Sedangkan yang dimaksud validitas empiris adalah
penentuan valid atau tidaknya suatu instrument
berdasarkan sudah pernah diuji dari pengalaman atau
belum. Terdapat empat bentuk validitas yaitu empiris,
yaitu: validitas isi (content validity), validitas konstruksi
(construct validity), validitas “ada sekarang” (concurrent
validity), dan validitas prediksi (predictive validity). Untuk
mengetahui tingkat validitas rasional pada setiap butir tes,
maka dapat dilakukan dengan cara mengadakan analisis

rasional, yaitu analisis berdasarkan pikiran-pikiran yang
logis, serta bahan-bahan apa saja yang perlu
dikemukakan dalam suatu tes. Jika penganalisisan secara
rasional itu menunjukan hasil yang membenarkan tentang
telah tercerminnya tujuan instruksional khusus itu di dalam
tes hasil belajar yang telah memiliki validitas isi maupun
validitas konstruksi.
Alat tes yang dianggap layak dan dapat
dipertanggungjawabkan validitas isinya apabila dalam
penyusunannya mendasarkan diri pada tabel kisi-kisi.
Validitas isi merujuk pada kesesuaian antara butir-butir
soal dengan tujuan dan bahan pengajaran. Karena tujuan
dan bahan pengajaran tersebut tercantum pada table kisi-
kisi sehingga tidak salah apabila dikatakan bahwa
penyusunan butir-butir soal yang mendasar pada tabel
kisi-kisi dianggap layak dan dapat
dipertanggungjawabkan validitas isinya. Secara sederhana
dapat dikatakan bahwa tes yang disusun tidak boleh
keluar dari isi mata pelajaran yang ada di dalam
kurikulum. Sebuah tes dikatakan memiliki validitas
konstruksi apabila setiap butir soal dalam tes tersebut
mampu mengukur setiap aspek berpikir, misalnya
ingatan, pemahaman, dan juga aplikasinya. Aspek-aspek
yang hendak diukur tersebut merupakan wujud dari
indicator dalam tabel kisi-kisi. Sebuah tes dikatakan
memiliki validitas “ada sekarang” (concurent validity) jika
hasilnya sesuai dengan pengalaman.
Analisis Kualitas Tes dan Butir Soal dapat dikatakan
valid (sahih) apabila benar-benar mampu mengukur
apa yang hendak diukur dengan tepat. Dalam validitas

terdapat dua unsur penting, yaitu validitas menunjukan
derajat, ada yang sempurna, ada yang sedang, da nada
pula yang rendah atau hirarki dan validitas selalu
dihubungkan dengan suatu tujuan yang spesifik karena
tidak ada validitas yang berlaku secara umum. Ada 3
faktor yang dapat mempengaruhi validitas hasil tes yaitu
:
1. Faktor Instrument Evaluasi
Instrument evaluasi yang kurang baik akan
menghasilkan hasil evaluasi yang kurang baik pula.
Untuk itu, dalam mengembangkan instrument
evaluasi, seorang evaluator harus memperhatikan hal-
hal yang mempengaruhi validitas instrument dan
berkaitan dengan prosedur penyusunan instrument.
Seperti silabus, kisi-kisi soal, petunjuk mengerjakan soal
dan pengisian lembar jawaban, kunci jawaban,
penggunaan kalimat efektif, bentuk alternative
jawaban, tingkat kesukaran, daya pembeda, dan
sebagiannya.
2. Faktor Administrasi Evaluasi dan Penskoran
Banyak hal yang mempengaruhi hasil evaluasi yang
berkaitan dengan administrasi dan penskoran, antara
lain, alokasi waktu pengerjaan tes atau soal,
kedisplinan guru pengawas, kedisplinan peserta tes,
kesalahan penskoran, serta kondisi fisik dan psikis
peserta tes. Dalam hal ini, banyak sekali terjadi
penyimpangan atau kekeliruan, sehingga perlu
diantisipasi.
3. Faktor Jawaban dari Pesera Didik

Dalam praktiknya, factor jawaban peserta didik justru
lebih banyak berpengaruh terhadap validitas hasil tes
dibandingkan dengan kedua factor di atas. Factor ini
meliputi kecenderungan peserta didik untuk
mengjawab dengan cepat namun kurang tepat,
keinginan untuk coba-coba dan menggunakan gaya
bahasa tertentu dalam menjawab soal bentuk uraian.
Dalam literature modern tentang evaluasi, banyak
tokoh yang mengemukakan tentang jenis-jenis validitas,
salah satu tokohnya yaitu Zainal Arifin (2013) yang
membagi jenis-jenis validitas menjadi beberapa
golongan, yaitu :
a) Validitas Permukaan dalam Analisis Kualitas
Tes dan Butir Soal
Analisis Kualitas Tes dan Butir Soal – Validitas ini
menggunakan kriteria yang sangat sederhana, karena
hanya melihat dari sisi muka atau tampang dari
instrument itu sendiri. Artinya, jika suatu tes secara
sepintas telah dianggap baik maka tes tersebut dapat
dikatakan telah memenuhi syarat validitas
permukaan dan tidak membutuhkan judgement yang
mendalam.
b) Validitas Isi
Analisis Kualitas Tes dan Butir Soal – Validitas isi sering
digunakan dalam penilaian hasil belajar atau untuk
mengetahui sejauh mana peserta didik menguasai
materi pelajaran yang telah disampaikan dan
perubahan psikologis yang terjadi setelah mengalami
proses pembelajaran. Validitas isi disebut pula validitas
kurikuler berkenan dengan relevansi materi tes

dengan kurikulum yang ditentukan atau validitas
perumusan berkenaan dengan apakah apek dalam
soal tercakup dalam apa yang hendak diukur.
Validitas kurikuler ini dapat dilakukan dengan dengan
beberapa cara, antara lain mencocokkan materi tes
dengan silabus dan kisi-kisi, melakukan diskusi dengan
sesame pendidik, atau mencermati kembali subtansi
dari konsep yang akan diukur.
c) Validitas Empiris
Analisis Kualitas Tes dan Butir Soal – Validitas empiris
dilakukan dengan pendekatan korelasi untuk mencari
hubungan skor tes dengan criteria tertentu. Validitas
empiris disebut juga validitas yang dihubungkan
dengan atau validitas statistik. Adapun validitas
empiric ini dibagi menjadi 3, yaitu:
1) Validitas prediktif (Predictive validity) yang
digunakan untuk meramalkan prestasi belajar
peserta didik pada masa depan. Validitas ini
bermaksud untuk melihat, sampai mana suatu tes
dapat mempraktikkan perilaku peserta didik pada
masa yang akan datang.
2) Validitas kongkuren (concurrent validity)
digunakan untuk criteria standar yang berlainan.
Misalnya, skor tes dalam mata pelajaran bahasa
Indonesia dikorelasikan dengan skor tes bahasa
inggris.
3) Validitas sejenis (congruent validity) untuk criteria
yang sejenis. Misalnya, bahasa Indonesia dengan
bahasa Indonesia.

Dalam mengukur, validitas suatu tes hendaknya
yang menjadi kriteria sudah betul-betul valid sehingga
dapat diandalkan keampuhannya dan dapat dianggap
sebagai test standar. Sebaliknya, bila kriterianyatidak
valid, maka tes-tes lain yang akan divalidasi menjadi
kurang atau tidak meyakinkan. Suatu tes akan
mempunyai koefisien validitas yang tinggi jika tes itu
betul-betul dapat mengukur apa yang hendak diukur
dari peserta didik tertentu.
Sebuah tes disebut memiliki validitas isi apabila tes
tersebut mengukur tujuan khusus tertentu yang sejajar
dengan materi atau isi pelajaran yang diberikan. Untuk
menilai validitas “ada sekarang” dapat dilakukan dengan
jalan
mengkorelasikan hasil-hasil yang dicapai dalam tes yang
sejenis yang telah diketahui mempunyai validitas yang
tinggi. Sedangkan sebuah tes memiliki validitas ramalan
apabila mempunyai kemampuan untuk meramalkan apa
yang akan terjadi pada masa yang akan datang. Cara
pengujian dengan jalan mencari korelasi antara nilai-nilai
yang dicapai oleh anak-anak dalam tes tersebut dengan
nilai-nilai yang dicapai kemudian. Banyak faktor yang
mempengaruhi hasil tes tidak valid. Beberapa sumber
yang pada umumnya berasal dari faktor internal tes
evaluasi diantaranya sebagai berikut:
(a) Arahan tes yang disusun dengan makna tidak jelas
sehingga dapat mengurangi
validitas tes.
(b) Kata-kata yang digunakan dalam struktur instrumen
evaluasi, terlalu sulit.
(c) Item-item tes dikontruksi dengan jelek.
(d) Tingkat kesulitan item tes tidak tepat dengan materi
pembelajaran yang
diterima siswa.
(a) Waktu yang dialokasikan tidak tepat, hal ini termasuk
kemungkinan terlalu
kurang atau terlalu longgar.
(b) Jumlah item tes terlalu sedikit sehingga tidak mewakili
sampel materi
pembelajaran.
(g) Jawaban masing-masing item evaluasi bisa diprediksi
siswa.
Oleh karena itu ada beberapa hal yang harus
diperhatikan dalam menginterpretasikan koefisien
validitas setiap soal butir tes, hal tersebut antara lain data
mengenai karakteristiksampel validitas, prosedur-
prosedur dalam mengukur validitas, dan pola kriteria
khusus yang dikorelasikan dengan hasil tes. Sehubungan
dengan kriteia khusus maka terdapat delapan kriteria
bahan bandingan berdasarkan pendapat Anastasi dalam
Conny Semiawan Stamboel, yaitu:
1.) Diferensiasi umur
2.) Kemajuan akademis
3.) Kriteria dalam Pelaksanaan Latihan Khusus
4.) Kriteria dalam Pelaksanaan Kerja
5.) Penilaian
6.) Kelompok yang Bertentangan
7.) Korelasi dengan tes lain

8.) Konsistensi Internal (Zainal Arifin, 2013: 250-251)
Hal-hal penting lain yang harus diperhatikan dalam
mengkonstruksi tes hasil belajar agar memiliki validitas isi,
yaitu:
1. Mengidentifikasi topik-topik mata pelajaran dan
2. Mempersiapkan tabel spesifikasi/kisi-kisi,untuk
menentukan sampel item yang digunakan,
3. Mengkonstruksi tes berdasarkan spesifikasi (kisi-
kisi). Agar suatu tes memiliki validitas isi perlu
direkomendasikan oleh para pakar/ahli dalam
bidangnya, mengenai cakupan tes tersebut.
Sedangkan untuk membantu menilai validitas isi

suatu tes, diperlukan petunjuk sebagai berikut:
1. Ada kejelasan mengenai cakupan mata pelajaran
2. Harus ada resume singkat mengenai keterangan
3. Ada manual judgement item tes yang harus
mereka,
4. Berikan tanggal pada pernyataan-pernyataan
dalam manual yang berhubungan dengan
sumber informasi norman (1982) (karmel, 1978 :127)
2) Reliabilitas

Reliabilitas merupakan penerjemahan dari kata
reliability yang mempunyai asal kata rely dan ability.
Pengukuran yang mempunyai reliabilitas tinggi disebut
sebagai pengukuran yang reliabel. Walaupun reliabilitas
mempunyai berbagai nama seperti keterpercayaan,
keterandalan, keajegan, kestabilan, konsistensi dan
sebagainya namun ide pokok yang terkandung dalam
konsep reliabilitas adalah sejauhmana hasil suatu
pengukuran dapat dipercaya. Anne (1984:84) menjelaskan
bahwa reliabilitas adalah keajegan atau ketetapan nilai
yang diperoleh dari individu-individu yang sama ketika
mereka diuji dengan tes yang sama pada waktu yang
berbeda.
Variabel penting kedua sebagai indikator kualitas tes
hasil belajar adalah reliabelitas. Istilah reliabelitas
bersinonim dengan keterandalan, keterpercayaan,
keakuratan, ketelitian, keajegan, dan keteramalan.
Dalam aplikasinya untuk pengujian dan asesmen,
reliabelitas secara umum diklarifikasi sebagai \berikut:
a. Merujuk kepada hasil yang diperoleh instrumen
asesmen dan bukan
instrumen itu sendiri,
b. Estimasi reliabilitas selalu merujuk kepada
konsistensi tertentu, reliabilitas diperlukan sebagai
syarat validitas tes. (kerlinger, 1995: 709-710)
Konsep keajegan atau kestabilan pada reliabilitas
kurang tepat jika diartikan sebagai “sama”. Keajegan
atau kestabilan tidak selalu harus sama, tetapi mengikuti
perubahan secara ajeg. Jika keadaan si A mula-mula
berada dibawah si B , maka jika diadakan pengukuran

ulang, si A juga berada dibawah si B. itulah yang
dikatakan ajeg atau tetap yaitu sama dalam kedudukan
siswa diantara anggota kelompok yang lain. Tinggi
rendahnya reliabilitas, secara empirik ditunjukkan oleh
suatu angka yang disebut koefisien reliabilitas. Tinggi
rendahnya reliabilitas dicerminkan oleh tinggi rendahnya
korelasi antara dua distribusi skor dari dua alat ukur yang
parallel yang dikenakan pada kelompok individu yang
sama. Analisis reliabilitas dapat menggunakan
pendekatan Tes-Ulang (test-retest), pendekatan Tes
Sejajar (alternate-forms) dan pendekatan Konsistensi
Internal (internal consistency).
Suatu tes dapat dikatan reliable apabila selalu
memberikan hasil yang sama bila diteskan pada
kelompok yang sama pada kesempatan yang berbeda.
Berikut ini merupakan empat factor yang mempengaruhi
reliabilitas, yaitu:
1. Panjang tes (Length of Test)
2. Sebaran skor (spread of scores)
3. Tingkat kesukaran (Difficulties Index)
4. Obyektifitas
Kerlinger (1995:727) mengemukakan apabila suatu
butir soal tes belum dapat dikatakan reliabilitas atau
masih perlunya perbaikan makan terdapat langkah-
langkah untuk meningkatkan atau memperbaiki
reliabelitas tes, yaitu:
a. tulis butir-butir soal secara tepat, tidak mendua
arti dan tidak membingungkan;

b. tambahkan butir soal yang sama jenis dan
kualitasnya; dan
c. berikan petunjuk secara jelas dan baku.
3) Daya Pembeda
Daya pembeda soal adalah kemampuan suatu butir
soal untuk membedakan antara siswa yang telah
menguasai materi dan siswa yang belum menguasai
materi yang ditanyakan. Sebagaiman dinyatakan oleh
Anas Sidijono (2003) daya pembeda item merupakan
kemampuan suatu butir item tes hasil belajar untuk dapat
membedakan antara testee yang berkemampuan tinggi
(pandai) dengan testee yang kemampuannya rendah
(bodoh) demikian rupa, sehingga sebagian besar testee
yang memiliki kemampuan tinggi untuk menjawab butir
item tersebut lebih banyak yang menjawab betul,
sementara testee yang kemampuannya rendah untuk
menjawab butir item tersebut, sebagian besar tidak dapat
menjawab item dengan betul.
Manfaat daya pembeda butir soal antara lain: (a)
Untuk meningkatkan kualitas butir soal berdasarkan data
empiriknya. Berdasarkan indeks daya pembeda, setiap
butir soal dapat diketahui apakah butir soal baik, direvisi
atau ditolak. (b) Untuk mengetahui seberapa jauh setiap
butir soal dapat membedakan kemampuan siswa yaitu
siswa yang telah memahami atau belum memahami
materi yang diajarkan oleh guru. Apabila suatu butir soal
tidak dapat membedakan kedua kemampuan siswa
maka terdapat kemungkinan seperti berikut:
1. Kunci jawaban butir soal tidak tepat.

2. Butir soal mempunyai 2 atau lebih jawaban yang
benar
3. Kompetensi yang diukur tidak jelas
4. Pengecoh tidak berfungsi
5. Materi yang ditanyakan terlalu sulit, sehingga
banyak siswa yang menebak.
Sebagian siswa yang memahami materi yang ditanyakan
berfikir ada yang
salah informasi dalam butir soalnya.
Angka yang menunjukkan besarnya daya pembeda
disebut indeks daya pembeda (DP). Semakin tinggi indeks
daya pembeda soal berarti semakin mampu soal yang
bersangkutan membedakan siswa yang sudah memahami
dan belum memahami materi. Indeks daya pembeda
berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi
daya pembeda suatu soal maka semakin baik soal
tersebut. Jika daya pembeda negatif berarti lebih banyak
kelompok siswa yang belum memahami materi menjawab
benar soal tersebut.
Pada suatu butir soal, indeks daya beda dikatakan
baik jika lebih besar atau sama dengan 0,3. Indeks daya
pembeda suatu butir yang kecil nilainya akan
menyebabkan butir tersebut tidak dapat membedakan
siswa yang kemampuannya tinggi dan siswa yang
kemampuannya rendah. Pada analisis tes dengan
Content-Referenced Measures, indeks daya pembeda butir
tidak terlalu perlu menjadi perhatian, asalkan tidak
negative.
Koefisien korelasi menggunakan indeks korelasi point
biseral untuk suatu butir tes ditentukan dengan rumus :

Dengan:
rpbis = koefisien korelasi point biserial,
X1 = variabel kontinu, X1 merupakan rerata skor X untuk
peserta tes yang menjawab benar butir tersebut
X = rerata skor X ,
sx = standar deviasi dari skor X ,
p1 = proporsi peserta tes yang menjawab benar butir

tersebut.
4) Tingkat Kesukaran
Tingkat kesukaran Item adalah pernyataan tentang
seberapa mudah dan seberapa sulit sebuah butir soal bagi
siswa yang dikenai pengukuran (Burhan,1987:126). Tingkat
kesukaran soal merupakan peluang untuk menjawab
benar soal pada tingkat kemampuan tertentu yang
biasanya dinyatakan dalam bentuk indeks. Tingkat
kesukaran butir soal tidaklah menunjukkan bahwa butir
soal itu baik atau tidak. Tingkat kesukaran butir hanya
menunjukkan bahwa butir soal itu sukar atau mudah
untuk kelompok peserta tes tertentu. Butir soal hasil
belajar yang terlalu sukar atau terlalu mudah tidak
banyak memberi informasi tentang butir soal atau peserta
tes (Asmawi Zainul, dkk : 1997).
Indeks kesukaran umumnya dinyatakan dalam
bentuk proporsi yang besarnya antar 0,00 – 1,00. Semakin
besar indeks kesukaran berarti semakin mudah soal

tersebut dan sebaliknya. Secara umum indeks kesukaran
suatu butir sebaiknya terletak pada interval 0,3 – 0,7.
Pada interval ini, informasi tentang kemampuan siswa
akan diperoleh secara maksimal. Dalam merancang indeks
kesukaran suatu perangkat tes, perlu dipertimbangkan
tujuan penyusunan perangkat tes tersebut. Untuk
menentukan indeks kesukaran dari suatu butir pada
perangkat tes pilihan ganda, digunakan persamaan
sebagai berikut :
∑𝐵
pi = 𝑁
dengan :
p = proporsi menjawab benar pada butir soal
tertentu.
B = banyaknya peserta tes yang menjawab benar.
N = jumlah peserta tes yang menjawab.
Fungsi tingkat kesukaran butir biasanya dikaitkan

dengan tujuan tes. Misalnya untuk ujian akhir semester
digunakan soal dengan tingkat kesukaran sedang, untuk
keperluan seleksi digunakan soal dengan tingkat
kesukaran tinggi, dan untukn keperluan diagnostic
digunakan soal dengan tingkat kesukaran mudah. Soal
yang baik adalah soal yang tidak terlalu mudah dan tidak
terlalu sukar. Soal yang terlalu mudah tidak merangsang
siswa untuk mempertinggi usaha pemecahannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan
siswa menjadi putus asa dan tidak mempunyai semangat
untuk mencoba lagi karena diluar jangkauannya.

Pada analisis butir soal secara klasikal, seperti yang
dijelaskan oleh Depdikbud (1997) tingkat kesukaran dapat
diperoleh dengan beberapa cara antara lain : a). skala
kesukaran linier; b). skala bivariat; c). indeks davis; d).
proporsi menjawab benar. Cara yang paling umum
digunakan adalah proporsi menjawab benar atau
proportion correct, yaitu jumlah peserta tes yang
menjawab benar pada soal yang dianalisis dibandingkan
dengan peserta tes seluruhnya. Dalam analisis item ini
digunakan proportion correct (p), untuk menilai tingkat
kesukaran butir soal, yang dapat dilihat berdasarkan hasil
analisis.
Untuk menyusun suatu naskah ujian sebaiknya
digunakan butir soal yang mempunyai tingkat kesukaran
berimbang, yaitu : soal berkategori sukar sebanyak 25%,
kategori sedang 50% dan kategori mudah 25%. Dalam
penggunaan butir soal dengan komposisi seperti di atas,
maka dapat diterapkan penilaian berdasar acuan norma
atau acuan patokan. Bila komposisi butir soal dalam suatu
naskah ujian tidak berimbang, maka penggunaan
penilaian acuan norma tidaklah tepat, karena informasi
kemampuan yang dihasilkan tidaklah akan berdistribusi
normal.
Walaupun demikian ada yang berpendapat
bahwa soal-soal yang dianggap baik adalah soal-soal yang
sedang, yaitu soal-soal yang mempunyai indeks kesukaran
berkisar antara 0,26 – 0,75. Berbagai kriteria tersebut
mempunyai kecenderungan bahwa butir soal yang
memiliki indeks kesukaran kurang dari 0,25 dan lebih dari
0,75 sebaiknya dihindari atau tidak digunakan, karena
butir soal yang demikian terlalu sukar atau terlalu mudah,
sehingga kurang mencerminkan alat ukur yang baik.
Namun demikian menurut Suharsimi Arikunto (2001) soal-
soal yang terlalu mudah atau terlalu sukar tidak berarti
tidak boleh digunakan.
Hal ini tergantung dari tujuan penggunaannya. Jika
dari peserta tes banyak, padahal yang dikehendaki lulus
hanya sedikit maka diambil peserta yang terbaik, untuk
itu diambilkan butir soal tes yang sukar. Demikian
sebaliknya jika kekurangan peserta tes, maka dipilihkan
soal-soal yang mudah. Selain itu, soal-soal yang sukar akan
menambah motivasi belajar bagi siswa-siswa yang pandai,
sedangkan soal-soal yang mudah akan membangkitkan
semangat kepada siswa yang lemah.
5) Efektivitas Distraktor
Pada soal pilihan ganda terdapat opsi atau pilihan
jawaban yang terdiri dari kunci jawaban dan pengecoh.
Kunci jawaban dan pengecoh pada suatu soal perlu
diketahui berfungsi tidaknya kunci jawaban atau
pengecoh tersebut. Kunci jawaban dikatakan berfungsi
(efektif) apabila: (a) paling tidak dipilih oleh 25% peserta,
(b) lebih banyak dipilih oleh siswa yang sudah memahami
materi. Sedangkan pengecoh dapat dikatakan berfungsi
apabila pengecoh: (a) paling tidak dipilih oleh 5% peserta,
(b) lebih banyak dipilih oleh kelompok siswa yang belum
memahami materi (Depdiknas, 2009: 14).
6) Kriteria Keputusan Total

Informasi yang diperoleh tentang kategori item soal
berdasarkan semua karakteristik dapat dimasukkan pada
kriteria soal yang diterima, direvisi, atau ditolak jika

memenuhi kriteria keputusan untuk penilaian item soal
sebagai berikut: (a) Item soal diterima apabila
karakteristik item soal memenuhi semua kriteria. Item soal
yang terlalu sukar atau terlalu mudah, tetapi memiliki
daya beda dan disribusi pengecoh item yang memenuhi
kriteria, butir soal tersebut dapat diterima atau dipilih. (b)
Item soal direvisi apabila salah satu atau lebih dari ketiga
kriteria karakeristik item soal tidak memenuhi kriteria. (c)
Item soal ditolak apabila item soal memiliki karakteristik
yang tidak memenuhi semua kriteria.
Dari beberapa indikator kualitas tes tersebut,
terutama adalah syarat validitas dan reliabelitas atau
relevansi dan keandalan (Cangelosi, 1995:24). Berdasarkan
pandangan para ahli tersebut, dan mengingat
kemampuan peneliti, kajian kualitas tes hasil belajar
dalam penelitian ini hanya difokuskan pada dua indikator
utama yaitu validitas (isi) dan reliabilitas tes (konsistensi
internal), mengingat dua indikator inilah yang paling
penting kaitannya dengan kemampuan dalam
mengkonstruksi tes hasil belajar yang baik atau berkualitas
tinggi.

BAB VIII
PENGEMBANGAN INSTRUMEN
PENILAIAN RANAH AFEKTIF
A. Penjelasan Penilaian Afektif

Ranah afektif merupakan salah satu taksonomi
tujuan instruksional yang berkaitan dengan kondisi
psikologis atau perasaan seseorang. Ada lima karakteristik
afektif yang penting, yaitu “sikap, minat, konsep diri, nilai
dan moral” (Depdiknas, 2008: 4).
Menurut Krathwohl ranah afektif dalam taksonomi
dirinci dalam lima jenjang (Sudijono, 2008:54), yaitu:
receiving/attending, responding, valuing, organization, and
characterization. Sedangkan menurut Mardapi (2012:164-
165) penilaian ranah afektif peserta didik selain
menggunakan kuesioner juga bisa dilakukan melalui
observasi atau pengamatan. Hasil observasi akan
melengkapi informasi hasil kuesioner. Dengan demikian
informasi yang diperoleh akan lebih akurat, sehingga
kebijakan yang ditempuh akan lebih tepat. Penilaian
afektif harus digunakan untuk pengambilan keputusan
instruksional dengan maksud mendorong perubahan
positif dalam disposisi yang diinginkan. Jika penilaian
mengungkapkan perasaan negatif, maka harus berusaha
untuk mendapatkan pengalaman pendidikan yang akan
menghasilkan disposisi positif yang diharapkan.
194 | Pengembangan Instrumen Penilaian Ranah Afektif

Ada dua metode yang dapat digunakan untuk
mengukur ranah afektif, yaitu metode observasi dan
metode laporan-diri. Penggunaan metode observasi
berdasarkan pada asumsi bahwa karateristik afektif
dapat dilihat dari perilaku atau perbuatan yang
ditampilkan, reaksi psikologi, atau keduanya. Metode
laporan-diri berasumsi bahwa yang mengetahui keadaan
afektif seseorang adalah dirinya sendiri. Namun hal ini
menuntut kejujuran dalam mengungkap karakteristik
afektif diri sendiri. (Andersen: 1980)
Selama ini pembelajaran afektif banyak
diabaikan. Menurut Bloom dkk (Amri, 2016) ada
beberapa alasan pengabaian pembelajaran afektif
antara lain:
a. Takut akan indoktrinasi
b. Keyakinan bahwa perasaan, nilai dan komitmen
merupakan yang layak dilakukan dirumah dan
tugas Agama dari pada di sekolah
c. Keyakinan umum bahwa afektif selayaknya
berkembang secara otomatis dari pengetahuan
dan pengalaman
d. Tidak seperti kemampuan kognitif afektif
dipertimbangkan sebagai suatu kepentingan
yang lebih pribadi dari pada masyarakat
e. Beberapa orang merasa bahwa mengevaluasi
perasaan, minat dan sikap seseorang adalah
melanggar hak pribadi seseorang, oleh karena itu
hampir semua prosedur tes dan evaluasi sekarang
banyak ditekankan pada penilaian ranah
kognitif dan apabila ada kecenderungan
Pengembangan Instrumen Penilaian Ranah Afektif | 195

mengevaluasi hasil belajar afektif itu secara
subjektif saja.
Pembagian tersebut sejalan dengan konsep
penilaian afektif yang diterbitkan oleh (BSNP: 2008)
bahwa tingkatan yang ingin dicapai dalam ranah afektif
yakni sebagai berikut.
1. Tingkat Receiving.
Pada tingkat receiving, peserta didik
memiliki persepsi terhadap suatu fenomena khusus
atau stimulus, yang menarik perhatiannya. Tugas
pendidik menjaga perhatian peserta didik pada
fenomena yang menjadi objek pembelajaran
afektif. Misalnya pendidik mengarahkan peserta
didik agar senang membaca buku, senang
bekerjasama, dan sebagainya. Kata kerja
operasional yang dapat digunakan pada
perumusan tujuan adalah menghadiri, melihat,
memperhatikan.
2. Tingkat Responding.
Pada tingkat ini peserta didik tidak saja
memperhatikan fenomena khusus tetapi ia juga
bereaksi. Hasil pembelajaran pada ranah ini
menekankan pada pemerolehan respons,
berkeinginan memberi respons, atau kepuasan
dalam memberi respons. Pada tingkat ini siswa
tidak hanya memberi respon tetapi ia sungguh-
sungguh berpartisipasi aktif. Misalnya senang
membaca buku, senang bertanya, senang
membantu teman, senang dengan kebersihan dan
kerapihan, dan sebagainya. Kata kerja operasional

yang dapat digunakan adalah mengikuti,
mendiskusikan, berlatih, berpartisipasi, menjawab
pertanyaan.
3. Tingkat Valuing.
Valuing berhubungan dengan
pengungkapan perasaan, keyakinan, atau
anggapan bahwa suatu gagasan, benda, atau
cara berpikir tertentu mempunyai nilai. Unsur yang
penting pada jenjang ini adalah seseorang telah
termotivasi bukan karena keinginan atau
kepatuhan tetapi lebih disebabkan karena
keterkaitannya dengan nilai-nilai tertentu. Dalam
tujuan pembelajaran kata kerja operasional yang
dapat digunakan adalah meyakinkan, bertindak,
mengemukakan argumentasi.
4. Tingkat Organization.
Pada tingkat organization, nilai satu
dengan nilai lain dikaitkan, konflik antar nilai
diselesaikan, dan mulai membangun sistem nilai
internal yang konsisten. Hasil pembelajaran pada
tingkat ini berupa konseptualisasi nilai atau
organisasi sistem nilai. Kata kerja operasional yang
dapat digunakan adalah memodifikasi,
membandingkan, memutuskan.
5. Tingkat Characterization.
Tingkat ranah afektif tertinggi adalah
characterization nilai. Pada tingkat ini peserta
didik memiliki system nilai yang mengendalikan
perilaku sampai pada waktu tertentu hingga

terbentuk gaya hidup. Hasil pembelajaran pada
tingkat ini berkaitan dengan pribadi, emosi, dan
sosial.
B. KARAKTERISTIK
Zaenal Arifin. (2009) menjelaskan ada dua hal
yang berhubungan dengan penilaian afektif yang harus
dinilai. Pertama, kompetensi afektif yang ingin dicapai
dalam pembelajaran meliputi tingkatan pemberian
respons, apresiasi, penilaian dan internalisasi. Kedua, sikap
dan minat peserta didik terhadap mata pelajaran dan
proses pembelajaran. Dalam proses pembelajaran
terdapat empat tipe karakteristik afektif yang penting
yaitu sikap, minat, konsep diri dan nilai.
Terdapat empat karakteristik afektif yang penting

dalam pembelajaran yaitu: (1) minat, 2) sikap, 3) konsep
diri, dan 4) nilai.
 Beberapa ranah afektif yang tergolong penting
adalah:
a) Kejujuran: peserta didik harus belajar untuk
menghargai kejujuran dalam beriteraksi dengan
orang lain
b) Integritas: peserta didik harus dapat dipercaya oleh
orang lain, mengikat pada kode nilai.
c) Adil: peserta didik harus berpendapat bahwa
semua orang memperoleh perlakuan hokum yang
sama

d) Kebebasan: peserta didik harus yakin bahwa
negara demokratis harus memberi kebebasan
secara maksimum kepada semua orang.
Ada 5 (lima) tipe karakteristik afektif yang penting,

yaitu sikap, minat, konsep diri, nilai dan moral (Depdiknas,
2008:4).
1. Sikap
Sikap yaitu suatu kecenderungan untuk
bertindak secara suka atau tidak suka terhadap
suatu obyek. Sikap dapat dibentuk melalui cara
mengamati dan menirukan sesuatu yang positif,
kemudian melalui penguatan menerima informasi
verbal. Perubahan sikap dapat diamati dalam
proses pembelajaran. Penilaian sikap adalah
penilaian yang dilakukan untuk mengetahui sikap
peserta didik terhadap 2008mata pelajaran,
kondisi pembelajaran, pendidik dan sebagainya.
Menurut Fishbein dan Ajzen (dalam Depdiknas,
2008:4) sikap adalah suatu predisposisi yang
dipelajari untuk merespon secara positif dan negatif
terhadap suatu obyek, situasi, konsep, atau orang.
Sikap peserta didik terhadap obyek misalnya sikap
terhadap sekolah atau terhadap mata pelajaran.
Sikap peserta didik ini penting untuk ditingkatkan.
2. Minat
Minat adalah kecenderungan yang tetap
untuk memperhatikan dan mengenang beberapa
kegiatan. Kegiatan yang diminati seseorang,
diperhatikan terus menerus yang disertai dengan

rasa senang. Minat sangat besar pengaruhnya
terhadap belajar, karena pelajaran yang dipelajari
tidak sesuai dengan minat siswa, siswa tidak akan
belajar dengan sebaik-baiknya, karena tidak ada
daya tarik baginya (Slameto, 2010:57). Hal penting
pada minat adalah intensitasnya. Secara umum
minat termasuk karakteristik afektif yang memiliki
intensitas tinggi (Depdiknas, 2008:4) siswa, siswa
tidak akan belajar dengan sebaik-baiknya, karena
tidak ada daya tarik baginya (Slameto, 2010:57).
Hal penting pada minat adalah intensitasnya.
Secara umum minat termasuk karakteristik afektif
yang memiliki intensitas tinggi (Depdiknas, 2008:4).
3. Konsep Diri
Menurut Smith, konsep diri adalah evaluasi
yang dilakukan individu terhadap kemampuan
dan kelemahan yang dimiliki. Target, arah, dan
intensitas konsep diri pada dasarnya seperti ranah
afektif yang lain. Target konsep diri biasanya orang
tapi bisa juga institusi seperti sekolah. Arah konsep
diri bisa positif atau negatif, dan intensitasnya bisa
dinyatakan dalam suatu daerah kontinum, yaitu
mulai dari rendah sampai tinggi. Konsep diri ini
penting untuk menentukan jenjang karir peserta
didik, yaitu dengan mengetahui kekuatan dan
kelemahan diri sendiri, dapat dipilih alternatif karir
yang tepat bagi peserta didik. Selain itu informasi
konsep diri penting bagi sekolah untuk
memberikan motivasi belajar peserta didik dengan
tepat (Mardapi, 2004:104)

4. Nilai
Nilai menurut Rokeach (dalam Depdiknas,
2008:5) merupakan suatu keyakinan tentang
perbuatan, tindakan, atau perilaku yang dianggap
baik dan yang dianggap buruk. Selanjutnya
dijelaskan bahwa sikap mengacu pada suatu
organisasi sejumlah keyakinan sekitar obyek
spesifik atau situasi, sedangkan nilai mengacu pada
keyakinan. Nilai cenderung menjadi ide, target nilai
dapat pula sesuatu seperti sikap dan perilaku.
5. Moral
Moral berkenaan dengan perasaan salah
atau benar terhadap kebahagiaan orang lain atau
perasaan terhadap tindakan yang dilakuakan diri
sendiri. Moral juga sering dikaitkan dengan
keyakinan agama seseorang, yaitu keyakinan
akan perbuatan yang berdosa dan berpahala. Jadi
moral berkaitan dengan prinsip, nilai dan
keyakinan seseorang (Depdiknas, 2008:6).
C. KONSEP
Afektif berhubungan dengan emosi seperti
perasaan, nilai, apresiasi, motivasi dan sikap.
Terdapat lima kategori utama afektif dari yang
paling sederhana sampai kompleks yaitu:
a. Receiving (penerimaan) adalah kesediaan
untuk menyadari adanya suatu fenomena di
lingkungannya. Contohnya mendengarkan
orang lain dengan seksama, mendengarkan
dan mengingat nama seseorang yang baru

dikenalnya. Dalam pengajaran bentuknya
berupa mendapatkan perhatian,
mempertahankannya, dan mengarahkannya.
Tugas pendidik adalah mengarahkan
perhatian peserta didik pada fenomena yang
menjadi objek pembelajaran afektif.
Indikatornya adalah peserta didik: bertanya,
memilih, mendeskripsikan, mengikuti,
memberikan, mengidentifikasikan,
menyebutkan, menunjukkan, menyeleksi,
mengulangi, menggunakan.
b. Responding (tanggapan) adalah memberikan
reaksi terhadap fenomena yang ada di
lingkungannya. Meliputi persetujuan,
kesediaan, dan kepuasan dalam memberikan
tanggapan. Pada tingkat ini peserta didik
tidak saja memperhatikan fenomena khusus
tetapi ia juga bereaksi. Hasil pembelajaran
pada ranah ini adalah menekankan pada
pemerolehan respon, berkeinginan memberi
respon, atau kepuasan dalam memberi respon.
Contohnya berpartisipasi di kelas, bertanya
tentang konsep, model dan sebagainya agar
memperoleh pemahaman, dan
menerapkannya. Indikatornya adalah peserta
didik: menjawab, membantu, mendiskusikan,
menghormati, berbuat, melakukan, membaca,
memberikan, menghafal, melaporkan,
memilih, menceritakan, menulis. Tingkat yang
tinggi pada kategori ini adalah minat, yaitu

hal-hal yang menekankan pada pencarian
hasil dan kesenangan pada aktivitas khusus.
c. Valuing (penghargaan) berkaitan dengan
harga atau nilai yang diterapkan pada suatu
objek, fenomena, atau tingkah laku.
Contohnya peka terhadap perbedaan individu
dan budaya, menunjukkan kemampuan
memecahkan masalah, mempunyai
komitmen. Penilaian berdasar pada
internalisasi dari serangkaian nilai tertentu
yang diekspresikan ke dalam tingkah laku.
Indikatornya adalah peserta didik:
melengkapi, menggambarkan, membedakan,
menerangkan, mengikuti, membentuk,
mengundang, menggabung, mengusulkan,
membaca, melaporkan, memilih, bekerja,
mengambil bagian, mempelajari. Dalam
tujuan pembelajaran penilaian ini
diklasifikasikan sebagai sikap.
d. Organization (pengorganisasian) berkaitan
dengan memadukan nilai-nilai yang berbeda,
menyelesaikan konflik, dan membentuk suatu
sistem nilai yang konsisten. Contohnya
mengakui adanya kebutuhan keseimbangan
antara kebebasan dan tanggungjawab,
menyelaraskan antara kebutuhan organisasi,
keluarga dan diri sendiri. Indikatornya adalah
peserta didik: mengubah, mengatur,
menggabungkan, membandingkan,
melengkapi, mempertahankan, menerangkan,

merumuskan, menggeneralisasikan,
mengidentifikasikan, mengintegrasikan,
memodifikasikan, mengorganisir, menyiapkan,
menghubungkan, mengsintesiskan.
e. Characterization by a Value or Value Complex
(karakterisasi berdasarkan nilai-nilai)
berhubungan dengan memiliki sistem nilai
yang mengendalikan tingkah-lakunya
sehingga menjadi karakteristik gaya-hidupnya.
Contohnya menunjukkan kemandiriannya
saat bekerja sendiri, kooperatif dalam kegiatan
kelompok, objektif dalam memecahkan
masalah, menghargai orang berdasarkan yang
mereka katakan bukan siapa mereka.
Indikatornya adalah peserta didik:
membedakan menerapkan, mengusulkan,
memperagakan, mempengaruhi,
mendengarkan, memodifikasikan,
mempertunjukkan, menanyakan,
memecahkan, menggunakan.
D. TUJUAN
Suharsimi Arikunto (2003) menjelaskan
pengukuran ranah afektif tidak dapat dilakukan
setiap saat (dalam arti pengukuran formal) karena
perubahan tingkah laku siswa tidak dapat berubah
sewaktu-waktu. Pengubahan sikap seseorang
memerlukan waktu yang relatif lama. Demikian
juga pengembangan minat dan penghargaan serta

nilai-nilainya. Sasaran penilaian afektif adalah
perilaku peserta didik bukan pengetahuannya.
E. LANGKAH-LANGKAH PENGEMBANGAN
INSTRUMEN AFEKTIF
Menurut Geble dan Wof (Khuriyah, 2003)
dijelaskan bahwa langkah-langkah
pengembangan instrumen ranah afektif yaitu :
1. Tahap pengembangan instruen evaluasi
afektif yang terdiri dari beberapa kegiatan
yaitu :
a. Merumuskan definisi konseptual
b. Mengembangkan definisi operasional
c. Menyeleksi metode penskalan
d. Selektif format respon
2. Tahap Uji Coba
3. Tahap revisi instrumen
4. Tahap pengumpulan data
5. Tahap analisis validitas dan reliabilitas
6. Tahap laporan
Sedangkan menurut Mardapi (2004:104) langkah-
langkah yang harus diikuti dalam mengembangkan
instrumen afektif, yaitu:
1. Menentukan Spesifikasi Instrumen
Spesifikasi instrumen terdiri dari tujuan dan
kisi-kisi instrumen. Dalam bidang pendidikan,
ditinjau dari tujuannya ada lima macam instrumen
pengukuran ranah afektif, yaitu:
1. Instrumen sikap.
2. Instrumen minat.

3. Instrumen konsep diri.
4. Instrumen nilai.
5. Instrumen moral
Dalam menyusun spesifikasi instrumen, ada
empat hal yang harus diperhatikan yaitu
tujuan pengukuran, kisi-kisi instrument, bentuk dan
format instrument, dan panjang instrumen.
Instrumen minat bertujuan untuk memperoleh
informasi tentang minat peserta didik terhadap
mata pelajaran yang selanjutnya digunakan untuk
meningkatkan minat peserta didik terhadap mata
pelajaran. Instrumen sikap bertujuan untuk
mengetahui sikap peserta didik terhadap suatu
objek, misalnya terhadap kegiatan sekolah,
terhadap guru, dan sebagainya. Sikap terhadap
mata pelajaran bisa positif bisa negatif. Hasil
pengukuran sikap berguna untuk menentukan
strategi pembelajaran yang tepat untuk peserta
didik. Instrumen konsep diri bertujuan untuk
mengetahui kekuatan dan kelemahan diri sendiri.
Peserta didik melakukan evaluasi secara objektif
terhadap potensi yang ada dalam dirinya.
Karakteristik potensi peserta didik sangat penting
untuk menentukan jenjang karirnya. Informasi
kekuatan dan kelemahan peserta didik digunakan
untuk menentukan program yang sebaiknya
ditempuh oleh peserta didik. Informasi karakteristik
peserta didik diperoleh dari hasil pengukuran.
Instrumen nilai dan keyakinan bertujuan untuk
mengungkap nilai dan keyakinan individu.

Informasi yang diperoleh berupa nilai dan
keyakinan yang positif dan yang negatif. Hal-hal
yang positif diperkuat sedang yang negatif
diperlemah dan akhirnya dihilangkan. Instrumen
moral bertujuan untuk mengungkap moral.
Informasi moral seseorang diperoleh melalui
pengamatan akan perbuatan yang ditampilkan
dan laporan diri yaitu mengisi kuesioner. Hasil
pengamatan bersama dengan hasil kuesioner
menjadi informasi tentang moral seseorang.
Setelah tujuan pengukuran afektif
ditetapkan, kegiatan berikutnya adalah menyusun
kisi-kisi instrumen. Kisi-kisi, juga disebut blue-print,
merupakan tabel matrik yang berisi spesifikasi
instrumen yang akan ditulis. Langkah pertama
dalam menentukan kisi-kisi adalah menentukan
definisi konseptual yang berasal dari teori-teori
yang diambil dari buku teks. Selanjutnya
mengembangkan definisi operasional berdasarkan
kompetensi dasar, yaitu yang bisa diukur. Definisi
operasional ini kemudian dijabarkan menjadi
sejumlah indikator. Indikator ini merupakan
pedoman dalam menulis instrumen. Tiap indikator
bisa ditulis dua atau lebih butir instrumen.
2. Menulis Instrumen
Ada 5 (lima) ranah afektif yang biasa dinilai
di sekolah, yaitu sikap, minat, konsep diri, nilai, dan
moral. Penilaian ranah afektif peserta didik
dilakukan dengan menggunakan instrumen
afektif.

1. Instrumen Sikap
Sikap merupakan kecenderungan
merespons secara konsisten baik menyukai atau
tidak menyukai suatu objek. Instrumen sikap
bertujuan untuk mengetahui sikap peserta didik
terhadap suatu objek, misalnya kegiatan sekolah.
Sikap ini bisa positif bisa negatif. Definisi
operasional: sikap adalah perasaan positip atau
negatif terhadap suatu objek. Objek ini bisa berupa
kegiatan atau mata pelajaran. Cara yang mudah
untuk mengetahui sikap siswa adalah melalui
kuesioner. Pertanyaan tentang sikap meminta
responden menunjukkan perasaan yang positif
atau negatif terhadap suatu objek, atau suatu
kebijakan. Kata-kata yang sering digunakan pada
pertanyaan sikap menyatakan arah perasaan
seseorang; menerima-menolak, menyenangi-tidak
menyenangi, baik-buruk, diingini-tidak diingini.
Contoh indikator sikap terhadap mata
pelajaran matematika misalnya adalah:
a. Membaca buku matematika
b. Belajar matematika
c. Interaksi dengan guru matematika
d. Mengerjakan tugas matematika
e. Diskusi tentang matematika
f. Memiliki buku matematika
Contoh kuesioner:
a. Saya senang membaca
buku matematika

b. Tidak semua orang harus belajar
matematika
c. Saya jarang bertanya pada guru tentang
pelajaran matematika
d. Saya tidak senang pada tugas
pelajaran matematika
e. Saya berusaha mengerjakan soal-soal
matematika sebaik-baiknya.
f. Matematika penting untuk semua
peserta didik
2. Instrumen Minat
Instrumen minat bertujuan untuk
memperoleh informasi tentang minat peserta didik
terhadap suatu mata pelajaran yang selanjutnya
digunakan untuk meningkatkan minat peserta
didik terhadap suatu mata pelajaran. Minat adalah
watak yang tersusun melalui pengalaman yang
mendorong individu mencari objek, aktivitas,
pengertian, keterampilan untuk tujuan perhatian
atau penguasaan.
Contoh indikator minat terhadap pelajaran
matematika:
a. Catatan pelajaran matematika.
b. Usaha memahami matematika
c. Memiliki buku matematika
d. Kehadiran dalam pelajaran matematika
Contoh kuesioner:
a. Catatan pelajaran matematika saya
lengkap

b. Catatan pelajaran matematika saya
terdapat coretan-coretan tentang hal-hal
yang penting
c. Saya selalu menyiapkan pertanyaan
sebelum pelajaran matematika
d. Saya berusaha memahami mata pelajaran
matematika
e. Saya senang mengerjakan soal matematika.
f. Saya berusaha selalu hadir pada pelajaran
matematika
3. Instrumen Konsep diri
Instrumen konsep diri bertujuan untuk
mengetahui kekuatan dan kelemahan diri sendiri.
Informasi kekuatan dan kelemahan peserta didik
digunakan untuk menentukan program
yang sebaiknya ditempuh oleh peserta didik. Hal ini
berdasarkan informasi karakteristik peserta didik
yang diperoleh dari hasil pengukuran. Konsep diri
adalah pernyataan tentang kemampuan diri
sendiri yang menyangkut mata pelajaran.
Contoh indikator konsep diri adalah:
a. Mata pelajaran yang mudah dipahami
b. Kecepatan memahami mata pelajaran
c. Mata pelajaran yang dirasa sulit
d. Kekuatan dan kelemahan fisik
Contoh instrumen:
a. Saya sulit mengikuti pelajaran matemeatika
b. Saya mudah memahami bahasa Inggeris
c. Saya mudah menghapal
d. Saya mampu membuat karangan yang baik

e. Saya merasa sulit mengikuti pelajaran fisika
f. Saya bisa bermain sepak bola dengan baik
g. Saya mampu membuat karya seni yang baik
h. Saya perlu waktu yang lama untuk
memahami pelajaran fisika.
4. Instrumen Nilai
Nilai merupakan konsep penting
dalam pembentukan kompetensi peserta didik.
Pencapaian kemampuan kognitif dan
psikomotorik tidak akan memberi manfaat bagi
masyarakat, apabila tidak diikuti dengan
kempetensi afektif. Kemampuan lulusan suatu
jenjang pendidikan bisa baik, bila digunakan
membantu orang lain, namun bisa tidak baik bila
kemampuan tersebut digunakan untuk merugikan
orang lain. Hal inilah letak pentingnya kemampuan
afektif. Kegiatan yang disenangi peserta didik di
sekolah dipengaruhi nilai (value) peserta didik. Ada
yang menyukai pelajaran keterampilan dan ada
yang tidak. Ada yang menyukai pelajaran seni tari
dan ada yang tidak. Semua ini dipengaruhi nilai
peserta didik, yaitu yang berkaitan dengan
penilaian baik dan buruk terhadap kegiatan
tersebut. Nilai seseorang pada dasarnya terungkap
melalui bagiamana ia berbuat atau keinginan
berbuat. Hermin dan Simon memasukkan pada
bagian nilai seperti keyakinan, sikap, aktivitas atau
perasaan yang memuaskan, antar lain yang
didukung dan terpadu dengan perilaku yang
sesungguhnya serta berulang dalam kehidupan

seseorang. Jadi nilai berkaitan dengan keyakinan,
sikap dan aktivitas atau tindakan seseorang.
Tindakan merupakan refleksi dari nilai yang
dianutnya.
Nilai adalah keyakinan seseorang tentang
keadaan suatu objek atau kegiatan. Misalnya
keyakinan akan kemampuan peserta
didik, keyakinan tentang kinerja guru.
Kemungknan ada yang berkeyakinan bahwa
prestasi peserta didik sulit untuk ditingkatkan. Atau
ada yang berkeyakinan bahwa guru sulit untuk
melakukan perubahan. Instrumen nilai dan
keyakinan bertujuan untuk mengungkap nilai dan
keyakinan individu. Informasi yang diperoleh
berupa nilai dan keyakinan yang positif
dan yang negatif. Hal-hal yang positif diperkuat
sedang yang negatif diperlemah dan akhirnya
dihilangkan.
Contoh indikator nilai adalah:
a. Keyakinan akan peran sekolah
b. Keyakinan atas keberhasilan peserta didik
c. Keyakinan atas kemampuan guru.
d. Keyakinan akan harapan masyarakat
Contoh kuesioner tentang nilai peserta didik:
a. Saya berkeyakinan bahwa prestasi belajar
peserta didik sulit untuk ditingkatkan.
b. Saya berkeyakinan bahwa kinerja guru
sudah maksimum.

c. Saya berkeyakinan bahwa peserta didik yang
ikut bimbingan tes cenderung akan diterima
di perguruan tinggi.
d. Saya berkeyakinan sekolah tidak akan
mampu mengubah tingkat kesejahteraan
masyarakat.
e. Saya berkeyakinan bahwa perubahan selalu
membawa masalah.
f. Saya berkeyakinan bahwa hasil yang dicapai
peserta didik adalah karena atas usahanya.
Selain melalui kuesioner ranah afektif
peserta didik, sikap, minat, konsep diri, nilai, dan
dapat digali melalui pengamatan. Pengamatan
karakteristik afektif peserta didik dilakukan di
tempat terjadinya kegiatan belajar dan mengajar.
Untuk mengetahui keadaan ranah afektif peserta
didik, guru harus menyiapkan diri untuk mencatat
setiap tindakan yang muncul dari peserta didik yang
berkaitan dengan indikator ranah afektif peserta
didik. Untuk itu perlu ditentukan dulu indikator
substansi yang akan diukur.
5. Instrumen Moral
Instrumen ini bertujuan untuk
mengetahui moral peserta didik. Moral
didefinisikan sebagai pendapat, tindakan yang
dinaggap baik dan yang dianggap tidak baik.
Contoh indikator moral sesuai dengan definisi di
atas adalah:
a. Memegang janji
b. Kepedulian terhadap orang lain

c. Kepedulian terhadap tugas-tugas
d. Kejujuran
Contoh instrumen moral
a. Bila berjanji pada teman saya, tidak harus
selalu menepati.
b. Bila berjanji kepada orang yang lebih tua
saya berusaha menepatinya.
c. Bila berjanji pada anak kecil saya tidak
harus selalu menepatinya.
d. Bila menghadapi kesulitan saya selalu minta
bantuan orang lain.
e. Bila ada orang lain yang menghadapi
kesulitan saya berusaha membantunya.
f. Kesulitan orang lain merupakan tanggung
jawabnya sendiri.
g. Bila bertemu teman, saya selalu
menyapanya walau ia tidak melihat saya.
h. Bila bertemu guru saya, saya selalu
menyapanya, walau ia tidak melihat saya.
i. Saya selalu bercerita tentang hal yang
menyenangkan teman saya, walau tidak
seluruhnya benar.
j. Bila ada orang yang bercerita, saya tidak
selalu mempercayainya.
3. Menentukan Skala Pengukuran Domain
Afektif
Mengacu klasifikasi domain tujuan
pendidikan menjadi domain kognitif, afektif, dan
psikomotor, maka untuk mencapai tujuan ketiga
domain tersebut diperlukan instrumen yang valid

untuk mengukur pencapaian ketiga domain
tersebut. Jika dibuat bagan klasifikasi tersebut
sebagai berikut. Pengukuran domain afektif tidak
semudah mengukur domain kognitif. Pengukuran
domain afektif tidak dapat dilakukan setiap saat
(dalam arti pengukuran formal) karena perubahan
tingkah laku peserta didik dapat berubah
sewaktu-waktu. Pembentukan sikap seseorang
memerlukan waktu yang relatif lama.
Dalam skala nasional (dengan mengacu
kepada tujuan pendidikan nasional) domain atau
ranah afektif memiliki cakupan lebih banyak
dibandingkan dengan domain atau ranah kognitif
dan psikomotor. Penjabaran tujuan pendidikan
nasional ke dalam tujuan jenjang dan satuan
pendidikan, kelompok mata pelajaran hingga
tujuan mata pelajaran, tidak terlepas dengan
tujuan pendidikan nasional, hanya proporsi dari
masing-masing domain tersebut tidak sama untuk
masing-masing mata pelajaran. Sudah barang
tentu kelompok mata pelajaran pendidikan
agama dan akhlak mulia memiliki porsi lebih
banyak domain afektifnya dibanding kelompok
mata pelajaran yang lainnya.
Domain afektif dijabarkan menjadi 5 level,

yaitu penerimaan, partisipasi, penentuan sikap,
organisasi, dan pembentukan pola hidup. Untuk
memudahkan dalam memilah kata kerja yang
cocok untuk masing-masing level tersebut dapat
dilihat pada tabel berikut ini.
Menurut Suharsimi : 2010 terdapat
beberapa skala sikap yang dapat dipergunakan
untuk mengukur domain afektif, di antaranya
sebagai berikut:
1. Skala Likert; skala ini disusun dalam bentuk suatu
pernyataan dan diikuti oleh lima respon yang
menunjukkan tingkatan. Misalnya: SS (sangat
setuju), S (setuju), TB (tidak berpendapat/abstain),
TS (tidak setuju), STS (sangat tidak setuju).
2. Skala Pilihan Ganda; skala ini dikembangkan oleh
Inkels, seorang ahli penilaian di Stanford University.
Skala ini bentuknya seperti soal bentuk pilihan
ganda, yaitu terdiri dari sejumlah pertanyaan yang
diikuti oleh sejumlah alternatif jawaban.
3. Skala Thurstone; skala ini mirip dengan skala Likert
karena merupakan suatu instrumen yang pilihan
jawabannya menunjukkan tingkatan. Perbedaan
skala Thurstone dengan skala Likert, pada skala
Thurstone rentang skala yang disediakan lebih dari
lima pilihan, dan disarankan sekitar sepuluh pilihan

jawaban (misalnya dengan rentang angka 1 s/d 11
atau a s/d k). Jawaban di tengah adalah netral,
semakin ke kiri semakin tidak setuju, sebaliknya
semakin ke kanan semakin setuju.
4. Skala Guttman; skala ini sama dengan yang disusun
oleh Bogardus, yaitu berupa tiga atau empat buah
pertanyaan yang masing-masing harus dijawab
“ya” atau “tidak”. Pernyataanpernyataan tersebut
menunjukkan tingkatan yang berurutan sehingga
bila responden setuju pernyataan nomor 2,
diasumsikan setuju nomor 1, selanjutnya jika
responden setuju dengan pernyataan nomor 3,
berarti setuju penyataan nomor 1 dan 2.
Contoh:
1) Saya mengizinkan anak saya bermain ke tetangga.
2) Saya mengizinkan anak saya pergi ke mana saja ia
mau.
3) Saya mengizinkan anak saya pergi kapan saja dan
ke mana saja.
4) Anak saya bebas pergi ke mana saja tanpa minta
izin terlebih dahulu.
5. Semantic Differensial; instrumen ini disusun oleh
Osgood dan kawan-kawan dipergunakan untuk
mengukur konsep-konsep untuk tiga dimensi.
Dimensi-dimensi yang ada diukur dalam kategori;
baik-tidak baik, kuat-lemah, dan cepat-lambat
atau aktif-pasif, atau dapat juga berguna-tidak
berguna.
Contoh:
Main Musik

Baik 1 2 3 4 5 6 7 Tidak Baik
Berguna 1 2 3 4 5 6 7 Tidak berguna
Aktif 1 2 3 4 5 6 7 Pasif
Dengan mengacu pada pembagian skala data
menjadi empat, yaitu skala data nominal, ordinal,
interval, dan rasio, Augusty Ferdinand:2006
mengemukan teknik pengukuran untuk masing-
masing skala data tersebut.
1) Pengukuran Data Nominal Untuk mengukur data
nominal dapat menggunakan pertanyaan dengan
sejumlah pilihan tertentu, atau pertanyaan dengan
diakhiri titik-titik kosong, responden diminta untuk
menulis jawaban yang sesuai dengan keadaannya.
Pemberian angka pada kategori jawaban respon
sematamata sebagai identitas atau tanda tertentu.
2) Pengukuran Data Ordinal
 Forced Ranking; dalam teknik ini seseorang
(responden) diminta untuk memberikan ranking
pada sejumlah pilihan tertentu yang disediakan.
Contoh:
Mohon saudara memberikan ranking
preferensi terhadap 5 perguruan tinggi agama
Islam berikut. Berikan angka 1 untuk yang paling
diminati, 2 untuk yang paling diminati berikutnya,
hingga angka 5 untuk yang paling tidak diminati:
Universitas Islam Negeri Sunan Kalijaga
Yogyakarta...............
Universitas Islam Negeri Syarif Hidayatullah
Jakarta................

Universitas Islam Negeri
Malang..............................................
Institut Agama Islam Negeri Walisongo
Semarang..................
Institut Agama Islam Sunan Ampel
Surabaya..........................
 Semantic Scale; teknik ini dipergunakan untuk
menghasilkan respon terhadap sebuah stimuli, yang
disajikan dalam kategori semantik dan
menyatakan sebuah tingkatan sifat atau
keterangan tertentu.
Contoh:
Apakah saudara suka minuman kopi?
 sangat tidak suka (=1), tidak suka (=2), netral (=3) ,
suka (=4), sangat suka (=5) Summated (Likert)
Scale; skala Likert adalah sebuah ekstensi dari skala
semantik, perbedaan utamanya adalah pertama,
skala ini menggunakan lebih dari satu item
pertanyaan, di mana beberapa pertanyaan
digunakan untuk menjelaskan sebuah konstruksi,
lalu jawabannya dijumlahkan oleh karenanya
disebut summated scala. Kedua, skala ini dikalibrasi
dengan cara jawaban yang netral diberi kode “0”.
Contoh:
1. Apakah saudara suka minum kopi?
sangat tidak suka (-2), tidak suka (-1), netral (0),
suka (1), sangat suka (2)
Jawaban: netral
2. Apakah kopi termasuk minuman yang
menyehatkan?

sangat tidak sehat (-2), tidak sehat (-1), netral (0) ,
sehat (1), sangat sehat (2)
Jawaban: sehat
3. Apakah saudara pikir, orang-orang sebaya
saudara suka minuman kopi?
sangat tidak suka (-2), tidak suka (-1), netral (0) ,
suka (1), sangat suka (2)
Jawaban: sangat suka
Jawaban dari skala di atas bila dijumlahkan = 0 + 1
+ 2 = +3, yang mengindikasikan sikap yang positif
terhadap kopi.
3) Pengukuran Data Interval
a. Bipolar Adjective; skala ini merupakan
penyempurnaan dari semantic scale, dengan
harapan agar respons yang dihasilkan dapat
merupakan intervally scaled data. Caranya adalah
dengan memberikan hanya dua kategori ekstrim.
Contoh:
Apakah saudara suka minuman kopi?
Sangat tidak suka 1 2 3 4 5 6 7 8 9 10
sangat suka
Jelaskan bagaimana kesukaan saudara pada kopi:
.........................................
b. Agree-Disagree Scale; skala ini merupakan salah
satu bentuk lain dari bipolar adjective, dengan
mengembangkan pertanyaan yang menghasilkan
jawaban setuju–tidak setuju dalam berbagai
rentang nilai.
Contoh:

Kopi adalah minuman alamiah yang menyehatkan
tubuh.
Sangat tidak setuju 1 2 3 4 5 6 7 8 9 10
sangat setuju
Jelaskan bagaimana ia menyehatkan tubuh dan
rasa apa yang saudara rasakan waktu minum kopi
........................................................
c. Continous Scale; skala ini merupakan salah satu
teknik pengukur data untuk menghasilkan data
interval, di mana responden diminta untuk
memberikan jawaban pada garis yang ditentukan,
dan setelah itu peneliti pengukur posisi yang dipilih
oleh responden untuk menghasil skor tertentu.
Contoh
Kopi adalah minuman alamiah yang menyehatkan
tubuh.
Sangat tidak
setuju_________________________________ sangat
setuju
Jelaskan bagaimana ia menyehatkan tubuh, dan
rasa apa yang saudara rasakan waktu minum kopi
.............................................
d. Equal With Interval; teknik ini dipergunakan
dengan menanyakan responden termasuk ke
dalam kategori mana pandangan mereka dapat
diletakkan. Bila rentang yang digunakan tidak
equal, maka data yang dihasilkan cenderung
merupakan data ordinal.
Contoh:

Berapa jumlah buku agama yang saudara miliki di
rumah?
................ ................. ................. .................. ...................
4. – 2 3–4 5–6 7–9 10 ke atas
4) Pengukuran Data Rasio
a. Direct Quantification (Kuantifikasi Langsung);
teknik ini dilakukan dengan menanyakan secara
langsung nilai dari sebuah konstruksi.
Contoh:
Berapa uang saku yang diberikan kepada saudara
setiap hari?
Berapa uang saku saudara ditabung dalam satu
minggu?
b. Constant Sum Scale (Skala Berjumlah Konstan);
skala ini dapat dipergunakan untuk mengetahui
preferensi konsumen atas beberapa jenis sesuai
dengan konstruk tertentu.
Contoh:
Alokasikan angka 100 ke dalam empat jenis bacaan
berikut sesuai dengan tingkat kesenangan saudara!
1. buku cerita = ....................
2. buku ilmiah = ....................
3. buku agama = ....................
4. koran = ....................
Total = 100
c. Reference Alternative (Alternatif Rujukan), yaitu
dengan menentukan sebuah acuan rujukan, dan
penilaian diberikan dengan membandingkan pada
acuan yang dirujuk tersebut. Teknik ini disebut juga
dengan magnitude scaling.

Contoh
Bila buku agama dinilai 100, berapa nilai yang
saudara berikan pada alternatif berikut:
 buku cerita = ....................
 buku ilmiah = ....................
 majalah = ....................
 koran = ....................
5) Menentukan sistem penskoran.
Sistem perskoran yang digunakan tergantung pada
skala pengukuran yang digunakan. Apabila
menggunakan skala Thurstone maka skor tertinggi untuk
tiap butir 7 dan skor terendah 1. Demikian pula untuk
instrumen dengan skala beda semantik tertinggi 7 dan
terendah 1. Untuk skala Likert skor tertinggi 4 dan skor
terendah 1. Dalam pengukuran sering terjadi
kecenderungan responden memilih jawaban pada
kategori 3 untuk skala Likert, untuk mengatasi hal ini skala
Likert hanya menggunakan 4 pilihan agar jelas sikap atau
minat peserta didik yaitu sangat setuju:4, setuju: 3, tidak
setuju: 2, dan sangat tidak setuju :
6) Menelaah instrumen
Kegiatan menelaah instrumen adalah meneliti
tentang: 1) apakah butir pertanyaan atau pernyataan
sesuai dengan indikator, 2) apakah bahasa yang
digunakan sudah komunikatif dan menggunakan tata
bahasa yang benar, 3) apakah butir pertanyaan atau
pernyataan tidak bias, 4) apakah format instrumen
menarik untuk dibaca, 5) apakah jumlah butir sudah
tepat sehingga tidak menjemukan menjawabnya. Telaah
dilakukan oleh pakar dalam bidang yang diukur. Telaah
bisa juga dilakukan oleh teman sejawat bila yang
diinginkan adalah masukan tentang bahasa dan format
instrumen. Bahasa yang digunakan sesuai dengan tingkat
pendidikan peserta didik. Hasil telaah ini selanjutnya
digunakan untuk memperbaiki instrumen.
7) Melakukan uji coba.
Instrumen yang telah ditelaah kemudian diperbaiki
untuk uji coba. Uji coba bertujuan untuk mengetahui
karakteristik instrumen. Karakteristik yang penting adalah
keandalannya. Selanjutnya dihitung keandalannya
dengan formula Cronbach alpha, bila besarnya indeks
sama atau lebih besar dari 0,7 maka instrumen itu
tergolong baik.
8) Menganalisis instrumen.
Berdasarkan hasil uji coba dapat diketahui kualitas
instrumen tersebut. Dengan demikian dapat dilakukan
perbaikan-perbaikan jika masih ada pertanyaan atau
pernyataan yang belum sesuai dengan yang diharapkan.
Ada kemungkinan pertanyaan sudah baik sehingga tidak
perlu diperbaiki, dan ada beberapa butir yang mungkin
perlu diperbaiki dan mungkin ada sebagian yang harus
dibuang karena tidak baik.
9) Merakit instrumen.
Setelah instrumen dianalisis dan diperbaiki, langkah
berikutnya adalah merakit instrumen menjadi satu
keseluruhan.
10) Melaksanakan pengukuran.
Instrumen yang telah disusun diberikan kepada
peserta didik untuk diisi. Dalam pelaksanaan ini perlu
dipantau agar instrumen itu betul-betul diisi oleh peserta

didik yang bersangkutan dengan jujur dan sesuai dengan
ketentuan. Pelaksanaan pengukuran ini perlu
dilaksanakan secara hati-hati agar tujuan pengukuran
dapat tercapai.
11) Menafsirkan hasil pengukuran
Setelah dilakukan pengukuran, selanjutnya
dilakukan analisis untuk tingkat individu dan tingkat kelas
dan ditafsirkan hasilnya untuk mengetahui misalnya minat
individu dan minat kelas terhadap mata pelajaran
Akuntansi. Untuk menafsirkan hasil pengukuran
diperlukan suatu kriteria. Kriteria yang digunakan
tergantung dari skala dan jumlah butir yang digunakan.
Misalkan digunakan skala Likert dengan 4 pilihan untuk
mengukur sikap peserta didik yaitu: sangat setuju: 4,
setuju:3, tidak setuju:2, dan sangat tidak setuju: 1.
 Instrumen yang telah diisi dicari skor
keseluruhannya sehingga tiap peserta didik
memiliki skor. Misal untuk mengungkap data sikap
peserta didik terhadap mata pelajaran Akuntansi
dengan 6 pertanyaan. Penilaian dapat dilakukan
dengan kriteria sebagai berikut:
Skor minimal : 6 x 1 = 6
Skor maksimal : 6 x 4 = 24
24-6
Rentang nilai : ------- = 4,5
4 Kategorisasi sikap sebagai berikut:
Sangat positif : 20 - 24
Positif : 15 – 19
Negatif : 10 – 14
Sangat negatif : 5 - 9

Untuk kategorisasi kelas dapat digunakan kriteria
berikut ini. Misal satu kelas
terdiri dari 40 peserta didik maka:
Skor minimum : 40 x 6 x 1 = 240
Skor maksimum : 40 x 6 x 4 = 960
960 – 240
Rentang nilai = ------------ = 180
Sangat positif : 780 - 960
Positif : 600 - 779
Negatif : 420 - 599
Sangat negatif : 240 – 419

Berikut Adalah Contoh Lembar Observasi Sikap Religius
dan sikap tanggung jawab:
CONTOH LEMBAR OBSERVASI SIKAP RELIGIUS

TERHADAP SISWA SEKOLAH DASAR
Nama Siswa :
Kelas :
Tanggal Pengamatan :
Petunjuk :
Berilah tanda cek ( ) pada kolom skor sesuai
sikap spiritual yang ditampilkan oleh peserta didik,
dengan kriteria sebagai berikut :
4 = selalu, apabila siswa selalu melakukan sesuai
pernyataan
3 = sering, apabila siswa sering melakukan sesuai
pernyataan
2 = kadang-kadang, apabila siswa kadang-kadang
melakukan
1 = tidak pernah, apabila siswa tidak pernah
Melakukan
No. Indikator Pengamatan Skor
1 2 3 4
1. Melaksanakan rutinitas kegiatan ibadah
sesuai agama yang dianutnya.
2. Mengikuti kegiatan keagamaan yang
diselenggarakan sekolah sesuai ajaran
agama yang dianutnya.
3. Menjalankan ibadah sesuai
waktunya/tepat waktu

CONTOH LEMBAR OBSERVASI SIKAP TANGGUNG
JAWAB TERHADAP SISWA SEKOLAH DASAR
Nama Siswa :
Kelas :
Tanggal Pengamatan :
Petunjuk :
Berilah tanda cek ( ) pada kolom skor sesuai
sikap spiritual yang ditampilkan oleh peserta didik,
dengan kriteria sebagai berikut :
4 = selalu, apabila siswa selalu melakukan sesuai
pernyataan
3 = sering, apabila siswa sering melakukan sesuai
pernyataan
2 = kadang-kadang, apabila siswa kadang-kadang
melakukan
1 = tidak pernah, apabila siswa tidak pernah
melakukan
No. Indikator Pengamatan Skor
1 2 3 4
1. Membuang sampah pada tempatnya.
2. Gemar melakukan kegiatan
kemanusiaan.
3. Menggunakan dan memelihara fasilitas
di sekolah baik sarana maupun
prasarana.

BAB IX
PENILAIAN UNJUK KERJA
(PERFORMANCE ASSESSMENT)
A. Pengertian Penilaian Unjuk Kerja

(Performance Assessment)
Menurut Trespeces (Depdiknas 2003),
Performance Assessment adalah berbagai macam
tugas dan situasi dimana peserta tes diminta untuk
mendemonstrasikan pemahaman dan
mengaplikasikan pengetahuan yang mendalam, serta
keterampilan di dalam berbagai macam konteks
sesuai dengan kriteria yang diinginkan. Berdasar
pendapat Mardjuki (1988), orang yang dinilai
kemampuan skillnya harus menampilkan atau
melakukan skill yang dimiliki dibawah persyaratan-
persyaratan kerja yang berlaku.
Menurut pendapat Zainal (1990) tes unjuk kerja
adalah bentuk tes yang menuntut jawaban peserta
didik dalam bentuk perilaku, tindakan atau
perbuatan. Peserta didik bertindak sesuai dengan apa
yang diperintahkan atau ditanyakan. Jadi
Performance Assessment adalah suatu penilaian yang
meminta peserta tes untuk mendemonstrasikan dan
mengaplikasikan pengetahuan unjuk kerja ke dalam
berbagai macam konteks sesuai dengan yang
diinginkan. Berk (1986) menyatakan bahwa asesmen
Penilaian Unjuk Kerja| 229
unjuk kerja adalah proses mengumpulkan data
dengan cara pengamatan yang sistematik untuk
membuat keputusan tentang individu
B. Karakteristik Penilaian Unjuk Kerja

(Performance Assessment)
Tes unjuk kerja dapat dilakukan secara
kelompok dan juga dapat dilakukan secara
individual. Dilakukan secara kelompok berarti guru
menghadapi sekelompok testee, sedangkan secara
individual berarti seorang guru seorang testee. Tes
unjuk kerja dapat digunakan untuk mengevaluasi
mutu suatu pekerjaan yang telah selesai dikerjakan,
keterampilan, kemampuan merencanakan sesuatu
pekerjaan dan mengidentifikasikan bagian-bagian
sesuatu piranti mesin misalnya. Hal yang penting
dalam penilaian unjuk kerja adalah cara mengamati
dan menskor kemampuan kinerja peserta didik. Guna
meminimumkan faktor subyektifitas keadilan dalam
menilai kemampuan kinerja peserta didik, biasanya
rater atau penilai jumlahnya lebih dari satu orang
sehingga diharapkan hasil penilaian mereka menjadi
lebih valid dan reliabel. Di samping itu, dalam
pelaksanaan penilaian diperlukan suatu pedoman
penilaian yang bertujuan untuk memudahkan penilai
dalam menilai, sehingga tingkat subyektifitas bisa
ditekan.
Penilaian unjuk kerja merupakan penilaian
yang dilakukan dengan mengamati kegiatan peserta
didik dalam melakukan sesuatu. Penilaian unjuk kerja
230 | Penilaian Unjuk Kerja

cocok digunakan untuk menilai ketercapaian
kompetensi yang menuntut peserta didik melakukan
tugas tertentu, seperti: praktek di laboratorium,
praktek olah raga, presentasi, diskusi, bermain peran,
memainkan alat musik, bernyanyi, membaca puisi/
deklamasi, termasuk juga membuat busana. Cara
penilaian ini dianggap lebih otentik daripada tes
tertulis karena apa yang dinilai lebih mencerminkan
kemampuan peserta didik yang sebenarnya. Tingkat
penguasaan terhadap bagian-bagian yang sulit dari
suatu pekerjaan. Unsur-unsur yang menjadi
karakteristik inti dari suatu pekerjaan akan menjadi
bagian dari suatu tes unjuk kerja.
Hal-hal yang perlu diperhatikan dalam
pelaksanaan tes unjuk kerja adalah ketersediaan
peralatan dan bahan-bahan lainnya yang diperlukan
untuk tugas-tugas spesifik, kejelasan, dan
kelengkapan instruksi. Secara garis besar penilaian
pembelajaran keterampilan pada dasarnya dapat
dilakukan terhadap dua hal, yaitu : (1) proses
pelaksanaan pekerjaan, yang mencakup; langkah
kerja dan aspek personal; dan (2) produk atau hasil
pekerjaan.
Penilaian terhadap aspek proses umumnya lebih
sulit dibanding penilaian terhadap produk atau hasil
kerja. Penilaian proses hanya dapat dilakukan dengan
cara pengamatan (observasi), dan dilakukan seorang
demi seorang. Penilaian proses pada umumnya
cenderung lebih subyektif dibanding penilaian produk,
karena tidak ada standar yang baku. Namun

demikian, penilai dapat lebih meningkatkan
obyektivitas penilaiannya dengan cara analisis tugas
(analisis skill).
Sementara itu, penilaian produk pada
umumnya lebih mudah dilakukan daripada penilaian
proses, karena dapat dilakukan dengan
menggunakan instrumen yang lebih valid dan reliabel,
seperti alat-alat ukur mikrometer, meteran dan
sebagainya. Dalam penilaian produk, karakteristik
yang digunakan sebagai standar biasanya adalah
berhubungan dengan kemanfaatan, kesesuaian
dengan tujuan, dimensi, nampak luar, tingkat
penyimpangan, kekuatan dan sebagainya (Ahmad
Jaedun, 2010)
1. Validitas Tes Unjuk Kerja
Validitas suatu alat ukur atau tes atau
instrumen dapat diketahui atau dapat dicapai
dari hasil teoritik atau pemikiran, dan dari hasil
empirik atau pengalaman. Allen dan Yen (1979)
mengemukakan bahwa suatu tes dikatakan valid
jika tes tersebut mengukur apa yang ingin diukur.
Untuk mengetahui apakah tes yang digunakan
benar-benar mengukur apa yang dimaksudkan
untuk diukur, maka dilakukan validasi terhadap
tes tersebut. Fernandez 1984) mengemukakan
bahwa validitas tes dikategorikan menjadi tiga,
yaitu validitas isi, validitas kriteria, dan validitas
konstruk.
Menurut Djemari (1996), validitas tes unjuk
kerja adalah penentuan evaluatif secara

keseluruhan tentang derajad bukti empiris dan
rasional teori mendukung ketepatan dan
kesesuaian penafsiran dan tindakan berdasarkan
sekor tes atau bentuk pengukuran yang lain.
Validitas isi mengacu pada sejauhmana butir-
butir soal tes mencakup keseluruhan isi yang
hendak diukur. Hal ini berarti isi tes tersebut harus
tetap relevan dan tidak menyimpang dari tujuan
pengukuran. Pengkajian validitas isi khusus pada
tes unjuk kerja tidak dilakukan melalui analisis
statistik, tetapi dengan menggunakan analisis
rasional. Yang dianalisis secara rasional adalah
validitas isi dan validitas konstruk.
Sebuah tes dikatakan mempunyai validitas
validitas isi yang tinggi apabila tes tersebut berisi
materi-materi yang ada pada GBPP, tolok ukur
yang kedua adalah tujuan instruksional. Jadi tes
prestasi belajar dapat dinyatakan sebagai tes
yang mempunyai validitas isi yang tinggi apabila
butir-butir soalnya selaras dengan tujuan yang
diturunkan menjadi butir soal. Dengan kata lain
bahwa suatutes dikatakan valid apabila materi
tes tersebut betul-betul merupakan bahan-bahan
yang representatif terhadap bahan pelajaran
yang diberikan.
2. Reliabilitas Tes Unjuk Kerja
Pengertian reliabilitas tes adalah
berhubungan dengan konsistensi, kestabilan atau
ketetapan. Reliabilitas adalah derajad keajegan
yang menunjukkan hasil yang sama dalam waktu

yang berlainan atau orang yang berbeda dalam
waktu yang sama. Tes demikian dapat dipercaya
atau dapat diandalkan (Sumadi, 1987). Berdasar
pendapat Djemari Mardapi (1996) pada
reliabilitas suatu alat ukur, bukti yang perlu
ditunjukkan adalah besarnya konsistensi antar
penilai (inter-rater). Misalnya suatu tugas yang
dikerjakan seseorang diamati atau dinilai oleh
tiga orang, hasil tiga perangkat skor tersebut
dikorelasikan, bila harganya tinggi berarti penilai
tersebut bisa dipercaya dalam arti berhak
melakukan penilaian. Bila koefisiennya rendah,
maka hasil pengukuran mengandung kesalahan
yang besar
C. Pengembangan Penilaian Unjuk Kerja

Langkah-langkah yang perlu diperhatikan dalam
menyusun penilaian keterampilan atau penilaian
kinerja, yaitu:
1. Mengidentifikasi semua langkah-langkah penting
yang diperlukan atau yang akan mempengaruhi
hasil akhir (output) yang terbaik
2. Menuliskan perilaku kemampuan-kemampuan
spesifik yang penting dan diperlukan untuk
menyelesaikan tugas dan menghasilkan hasil akhir
(output) yang terbaik
3. Membuat kriteria kemampuan yang akan diukur
tidak terlalu banyak sehingga semua kriteria
tersebut dapat diobservasi selama siswa
melaksanakan tugas

4. Mendefinisikan dengan jelas kriteria kemampuan-
kemampuan yang akan diukur berdasarkan
kemampuan siswa yang bisa diamati (observable)
atau karakteristik produk yang dihasilkan
5. Mengurutkan kriteria-kriteria kemampuan yang
akan diukur berdasarkan urutan yang dapat
diamati
Menurut Djemari Mardapi (2008), ada delapan
langkah yang perlu ditempuh dalam
mengembangkan tes hasil atau prestasi, yaitu:
1) menyusun spesifikasi tes,
2) menulis soal tes,
3) menelaah soal tes
4) melakukan uji coba tes
5) menganalisis butir soal
6) memperbaiki tes
7) merakit tes
8) melaksanakan tes,
9) menafsirkan hasil tes
Pengembangan penilaian unjuk kerja dilakukan
melalui kegiatan analisis jabatan, penentuan skala
rating numerik, pembuatan tes unjuk kerja, analisis
manfaat, dan generalisasi validitas. Guna
mengevaluasi apakah penilaian unjuk kerja sudah
dapat dianggap berkualitas, maka berdasar
pendapat Popham (Sriyono, 2004:5) maka perlu
diperhatikan tujuh kriteria, yaitu:
a. Generalizability, apakah kinerja peserta tes
(student performance) dalam melakukan tugas
yang diberikan tersebut sudah memadai untuk

digeneralisasikan pada tugastugas lain. Apabila
tugas-tugas yang diberikan dalam rangka
penilaian keterampilan atau penilaian unjuk
kerja sudah dapat digeneralisasikan, maka
semakin baik tugas yang diberikan.
b. Authenticity, apakah tugas yang diberikan
tersebut sudah serupa dengan apa yang sering
dihadapinya dalam praktek kehidupan sehari-
hari
c. Multiple foci, apakah tugas yang diberikan
kepada peserta tes sudah mengukur lebih dari
satu kemampuan yang diinginkan
d. Teachability, tugas yang diberikan merupakan
tugas yang hasilnya semakin baik karena adanya
usaha pembelajaran. Tugas yang diberikan dalam
penilaian keterampilan atau penilaian kinerja
adalah tugas-tugas yang relevan dengan yang
dapat diajarkan guru.
e. Fairness, apakah tugas yang diberikan sudah adil
(fair) untuk semua peserta tes
f. Feasibility, apakah tugas yang diberikan dalam
penilaian keterampilan atau penilaian kinerja
memang relevan untuk dapat dilaksanakan,
mengingat faktor-faktor biaya, tempat, waktu
atau peralatan.
g. Scorability, apakah tugas yang diberikan dapat
diskor dengan akurat dan reliabel?

D. Teknik Penilaian Unjuk Kerja
Hal yang penting dalam pembelajaran
keterampilan adalah diperolehnya penguasaan
keterampilan praktis, serta pengetahuan dan perilaku
yang berhubungan langsung dengan keterampilan
tersebut. Sehubungan dengan itu, maka para ahli
telah mengembangkan berbagai metode
pembelajaran keterampilan yang berbeda-beda,
tergantung pada sasaran atau maksud yang hendak
dicapai di dalam pembelajaran tersebut.
Model yang sederhana untuk pembelajaran
keterampilan kerja adalah metode empat tahap TWI
(Training Within Industry). Tahap-tahap tersebut
meliputi:
a. Persiapan
Dalam hal ini, pendidik atau instruktur
mengutarakan sasaran-sasaran latihan kerja,
menjelaskan arti pentingnya latihan,
membangkitkan minat para peserta pelatihan
(peserta didik) untuk menerapkan pengetahuan
yang sudah dimilikinya dalam situasi yang riil.
b. Peragaan
Pada tahap ini, instruktur memperagakan
keterampilan yang dipelajari oleh peserta didik,
menjelaskan cara kerja dan proses kerja yang
benar. Dalam hal ini, instruktur harus mengambil
posisi sedemikian rupa sehingga para peserta
pelatihan akan dapat mengikuti demonstrasi
mengenai proses kerja dengan baik.

c. Peniruan
Pada tahap ini, peserta pelatihan menirukan
aktivitas kerja yang telah diperagakan oleh
instruktur. Dalam hal ini, instruktur mengamati
peniruan yang dilakukan oleh peserta pelatihan,
menyuruh melakukannya secara berulang-ulang
dan membantu serta mendorong para peserta
pelatihan agar dapat melakukan pekerjaannya
dengan benar.
d. Praktik
Setelah instruktur yakin bahwa peserta
pelatihan telah dapat melakukan tugas
pekerjaan dengan cara kerja yang benar, maka
selanjutnya instruktur memberikan tugas kepada
peserta pelatihan untuk melakukan tugas
pekerjaannya. Dalam hal ini, peserta pelatihan
mengulangi aktivitas kerja yang baru saja
dipelajarinya sampai keterampilan tersebut
dapat dikuasai sepenuhnya. Instruktur
melakukan pengamatan untuk melakukan
penilaian baik terhadap aktivitas atau cara kerja
peserta pelatihan maupun hasil-hasil pekerjaan
atau produk yang dihasilkannya.
Metode empat tahap ini mempunyai
keterbatasan, karena hanya cocok untuk
pembelajaran keterampilan yang bertujuan
membuat barang (fabrikasi), sedangkan
pembelajaran keterampilan yang memiliki
karakteristik yang berbeda (seperti: trouble shooting,

layanan/jasa) tidak tepat menggunakan langkah-
langkah pembelajaran tersebut (Jaedun, 2010).
Permasalahan yang sering dihadapi dalam
penilaian unjuk kerja. Menurut Popham (1996),
terdapat tiga sumber kesalahan (sources of error)
dalam performance assessment, yaitu:
a. Scoring instrument flaws, instrumen
pedoman pensekoran tidak jelas sehingga
sukar untuk digunakan oleh penilai,
umumnya karena komponen-
komponennya sukar untuk diamati
(unobservable)
b. Procedural flaws, prosedur yang digunakan
dalam performance assessment tidak baik
sehingga juga mempengaruhi hasil
pensekoran
c. Teachers personal-bias error, penskor (rater)
cenderung sukar menghilangkan masalah
personal bias, yakni ada kemungkinan
penskor mempunyai masalah generosity
error, artinya rater cenderung memberi nilai
yang tinggi-tinggi, walaupun kenyataan
yang sebenarnya hasil pekerjaan peserta tes
tidak baik atau sebaliknya. Masalah lain
adalah adanya kemungkinan terjadinya
subyektifitas penskor sehingga sukar baginya
untuk memberi nilai yang obyektif.
Dengan menerapkan pedoman penilaian,
merupakan salah satu cara yang baik dalam
memberikan penilaian pada pekerjaan siswa secara

obyektif. Seorang guru tidak menggunakan format
penilaian, maka penilaiannya akan mengada-ngada,
menerkanerka, sehingga dia tidak bisa memberikan
penilaian yang objektif kepada pekerjaan siswa.
Berkenaan dengan penilaian keterampilan atau
penilaian unjuk kerja (performance assessment) untuk
bidang busana pada peserta didik di sekolah
menggunakan skala rentang. Penerapan skala
rentang diharapkan memperoleh ketepatan proses
menilai untuk memperkecil kesalahan penilai atau
rater. Disamping itu juga dalam membuat rubrik perlu
tergambar jelas, pelatihan perlu ditingkatkan untuk
rater, dan pemantauan berkesinambungan dalam
proses menilai.
Penilaian kinerja atau unjuk kerja adalah teknik
pengumpulan data dengan cara pengamatan
perilaku siswa secara sistematis tentang proses atau
produk berdasarkan kriteria yang jelas, yang berfungsi
sebagai dasar penilaian. Pengamatan unjuk kerja
perlu dilakukan dalam berbagai konteks untuk
menetapkan tingkat pencapaian kemampuan
tertentu.
Menurut Andono, dkk. (2003:42) untuk menilai
kemampuan melakukan komunikasi di tempat kerja
misalnya, perlu dilakukan pengamatan atau observasi
komunikasi yang beragam, seperti:
1. Komunikasi dengan pelanggan eksternal
dilaksanakan secara terbuka, ramah, sopan
dan simpatik;

2. Bahasa digunakan dengan intonasi yang
cocok;
3. Bahasa tubuh digunakan secara
alami/natural tidak dibuat-buat ;
4. Kepekaan terhadap perbedaan budaya
dan sosial diperlihatkan;
5. Komunikasi dua arah yang efektif
digunakan secara aktif
Dengan cara demikian, gambaran kemampuan

peserta didik akan lebih utuh. Untuk mengamati
unjuk kerja peserta didik dapat menggunakan alat
atau instrumen berikut:
a. Daftar Cek (Check-list)
Penilaian unjuk kerja dapat dilakukan
dengan menggunakan daftar cek. Dengan
menggunakan daftar cek, peserta didik
mendapat nilai apabila kriteria penguasaan
kemampuan tertentu dapat diamati oleh penilai.
Jika tidak dapat diamati, peserta didik tidak
memperoleh nilai. Kelemahan cara ini adalah
penilai hanya mempunyai dua pilihan mutlak,
misalnya benar-salah, dapat diamati-tidak dapat
diamati, baik-tidak baik. Dengan demikian tidak
terdapat nilai tengah. Namun menurut
(Grounlund, 1985:391) daftar cek lebih praktis jika
digunakan mengamati subjek dalam jumlah
besar. Terdapat tiga jenis rating scale, yaitu:
(1) numerical rating scale;
(2) graphic rating scale;

(3) descriptive graphic rating scale
Pada praktek pembuatan busana, teknik
penilaian checklist, misalnya diterapkan pada
pengambilan ukuran badan. Pengambilan
ukuran badan hanya dapat dinilai dengan benar
dan salah, karena mengambil ukuran dengan
tepat akan menghasilkan busana sesuai dengan
ukuran yang sebenarnya.
b. Skala Penilaian (Rating Scale)
Penilaian unjuk kerja menggunakan skala
penilaian memungkinkan penilai memberi nilai
tengah terhadap penguasaan kompetensi
tertentu karena pemberian nilai secara kontinum
di mana pilihan kategori nilai lebih dari dua. Skala
penilaian terentang dari tidak sempurna sampai
sangat sempurna. Skala tersebut, misalnya, tidak
kompeten – agak kompeten – kompeten - sangat
kompeten. Untuk memperkecil faktor
subjektivitas, perlu dilakukan penilaian oleh lebih
dari satu orang, agar hasil penilaian lebih akurat.
Terdapat tiga jenis rating scale menurut
Grounlund (1985:391), yaitu:
(1) numerical rating scale;
(2) graphic rating scale;
(3) descriptive graphic rating scale
Kesukaran yang paling utama ditemukan
dalam penilaian keterampilan atau penilaian
kinerja (performance assessment) adalah
pensekorannya. Banyak faktor yang
mempengaruhi hasil pensekoran penilaian

keterampilan atau penilaian kinerja. Masalah
pensekoran pada penilaian keterampilan atau
penilaian kinerja lebih kompleks dari pada
pensekoran pada bentuk soal uraian.

LEMBAR TELAAH BUTIR UNTUK SOAL
PSIKOMOTOR
No KRITERIA TELAAH
Materi Soal/perintah kerja harus sesuai
dengan alat ukur
Soal/tugas kerja harus jelas, lugas
Isi materi sesuai dengan tujuan
pengukuran
Isi materi yang ditanyakan sudah
sesuai dengan jenjang,jenis sekolah,
atau tingkat kelas
Konstruksi Petunjuk cara mengerjakan soal
jelas dan lugas
Ada pedoman penyekoran
Tabel, grafik, peta dan sejenisnya
disajikan dengan jelas dan terbaca
Bahasa Rumusan kalimat soal komunikatif,
yaitu bahasa sederhana dan kata-
kata sudah dikenal siswa
Butir soal menggunakan bahasa
Indonesia baik, benar
Rumusan soal tidak menimbulkan
penafsiran ganda

DAFTAR PUSTAKA
Abidin, Rizar. Implementasi Penilaian Hasil Belajar Kurikulum

2013 Pada Program Keahlian Teknik Audio Video Di
Smk 2 Surakarta.
http://eprints.uny.ac.id/21143/1/rizar.pdf
Afandi, Muhammad, dkk.2013. Model dan Metode
Pembelajaran di Sekolah. Semarang: UNISSULA
Press
Aiken, Lewis R. 1994. Psychological Testing and Assessment,
(Eight Edition), (Boston: Allyn and Bacon,), h.63.
Alimuddin. (2014). Jurnal: Penilaian Dalam Kurikulum 2013.
Makassar: Universitas Negeri Makassar
Allen, Justin P, dkk. 2012. Practical Assessment, Research
and Evaluation. Lawrenc : University of Kansas.
Allen, M. J & Yen, W. M. 1979. Introduction To Measurement
Theory. California: Brooks/Cole Publising Company
Allen, M. J. & Yen, W. M. 1979. Introduction to Measurement
Theory. Monterey, CA: Brooks/Cole Publishing
Company.
Allen, M. J. & Yen, W. M. Introduction to Measurement Theory.
Monterey, CA: Brooks/Cole Publishing Company. 1979.
Hal:102
Allen. 2004. Assessing Academic Programs in Higher
Education. USA:Anker Publishing Company, inc An
Introduction. New York: Pearson Education
Amri . 2016 . Pengembangan Instrumen Penilaian Afektif Pada

Mata Pelajaran Biologi SMA. Jurnal Biotek. Vol 4 No, 1.
Juni 2016
Anas Sudijono. 2003. Pengantar Evaluasi Pendidikan, (Jakarta:
Raja Grafindo Persada,), cet. 4,
Daftar Pusaka | 245

Anas, Sudijono. 2005. Pengantar Evaluasi Pendidikan.
Ed 1 Cet 5. Jakarta: Raja Grafindo Persada.
Anastasi, A. & Urbina, S. 1998. Tes Psikologi, Edisi Bahasa
Indonesia Jilid 1. Jakarta : Simon & Schuster (Asia) Pte.
Ltd.
Anastasi. Anne and Urbina, Susana. (1997). Psicoholological
Testing. (Seventh Edition). New Jersey: Prentice-Hall,
Inc.
Anderson, B.F. 1980. The Complete Thinker: A Handbook of

Theniques For Creative and Critical Problem Solving.
New Jersey: Englewood Cliffs
Andono, dkk. 2003. Standar Kompetensi Bidang Keahlian

Busana ”Custom-Made”. Jakarta: PPPG Kejuruan
Angelo, Thomas A. & Cross, K. Patricia: 1993. Classroom
Assessment Techniques - A Handbook for College
Teachers 2nd ed. California: Josszy-Bass Inc., Publishers
Anne Anastasi dan Susana Urbina. 1984. Psychological Testing,
(New York: Prentice – Hall Inc.,)
Anonim. The Nuts & Bolts of Assessment. (p. 3-8)
Anonim.2015.http://gadisgigikelinci.blogspot.co.id/2015/03/meto
de-teknik-dan instrumen-penilaian.html diakses pada
Senin, 2 Oktober 2017 pukul 04.56 WIB
Arends, Richard I. 2008. Learning to Teach. Yogyakarta :
Pustaka Pelajar
Arifin, Zainal. 2013. Evaluasi Pembelajaran: Prinsip, Tekhnik
Prosedur. Bandung:PT Remaja Rosdakarya
Arifin,Zainal.2009. Evaluasi Pembelajaran. Bandung: PT.
Remaja Rosdakarya
246 | D a f t a r P u s a k a
Arikunto, Suharsimi. 2003. Manajemen Penelitian. Jakarta:
Rineka Cipta
Arikunto,Suharsimi.2010. Prosedur Penelitian: Suatu

Pendekatan Praktik. Jakarta: Rineka Cipta
Asmawi Zainul dan Noehi Nasoetion. 1997. Penilaian Hasil

Belajar. Pusat Antar Universitas, Direktorat Jenderal
Pendidikan Tinggi: Departemen Pendidikan Dan
kebudayaan.
Asmawi Zainul dan Noehi Nasoetion. 1997. Penilaian Hasil
Belajar. Pusat Antar Universitas, Direktorat Jenderal
kebudayaan.
Asmawi Zainul dan Noehi Nasoetion. Penilaian Hasil Belajar.
Pusat Antar Universitas, Direktorat Jenderal Pendidikan
Tinggi: Departemen Pendidikan Dan kebudayaan.
1997.
Asmawi Zainul dan Noehi Nasoetion. Penilaian Hasil Belajar.
Pusat Antar Universitas, Direktorat Jenderal
kebudayaan. 1997.
Azwar .Saifuddin.(2000).Tes Prestasi (Fungsi Pengembangan
Pengukuran Prestasi Belajar).(Yogyakarta: Pustaka
Pelajar offset).
Azwar, S. 1996. Tes Prestasi Fungi dan Pengembangan
pengukuran prestasi belajar. Yogyakarta : Pustaka
Pelajar Offset.
Azwar, Saifuddin. Reliabilitas dan Validitas. Edisi ke-3,
Yogyakarta: Pustaka Pelajar,
1997.
Badan Standar Nasional Pendidikan. 2008. Panduan
Pengembangan Perangkat Penilaian Afektif. Jakarta:
Direktorat Pembinaan SMA
BAGNATO DAN YEH HO (2006)

Bagnato, Stephen. 2007. Authentic Assessment For Early
Childhood Intervention. New York : The Guilford Press.
Daftar Pusaka | 247
Bahrul Hayat, Penilaian Kelas (Classroom Assessment dalam
Penerapan Standar Kompetensi,. (Bogor: Jurnal
Pendidikan Penabur – No 03/Th III/Desember 2014), hlm.
116
Best, John W. 1982. Metodologi Penelitian Pendidikan.
Surabaya: Usaha Nasional.
Best, John W. Metodologi Penelitian Pendidikan. Penyunting;
Sanafiah Faisal dan Mulyadi Guntur Waseso, Surabaya:
Usaha Nasional, 1982.
Bloom, Benjamin S., etc. 1956. Taxonomy of Educational

Objectives : The Classification of Educational Goals,
Handbook I Cognitive Domain. New York : Longmans,
Green and Co.
Brookhart, Susan M. 2010. How to Asses Higher- Order

Thinking Skills in Your Classroom. Alexandria :
ASCD.
Brookhart, Susan M. and Anthony, Nitko J. 2007. Educational
Assesment of Student Fifth edition. New Jersey: Meril
Prentice Hall
BSNP. 2011. Standar Kompetensi dan Kompetensi Dasar SD/MI
(online)
http://staff.unila.ac.id/ngadimunhd/files/2012/03/2-
Standar-Penilaian-Sesuai-BSNP.pdfb.
Burhan Nurgiyanto.1987.Penilaian Dalam Pengajaran Bahasa
dan Sastra, (Yogyakarta: BPFE,),
Callison, Daniel. 1998. Authentic Assessment. Bloomington :
School Library Media Activities Monthly
Cangelosi, James S. 1995. Merancang Tes untuk Menilai Prestasi
Siswa. Bandung: ITB.Terjemahan Lilian D.
Tedjasudhana.
Cangelosi, James S., Merancang Tes untuk Menilai Prestasi
Siswa. Terjemahan Lilian D. Tedjasudhana, Bandung: ITB,
1995.
Chabib Toha, M. 1991. Teknik Evaluasi Pendidikan. Jakarta:

Raja Grafindo Persada
Charles E. Skinner (ed.), Essentials of Educational Psichology,
(Englewood Cliffs : Prentice-Hall, Inc, tt),( hlm:444-445)
Charles E. Skinner (ed.), Essentials of Educational Psichology,
(Englewood Cliffs : Prentice-Hall, Inc, tt), hlm:444-
445.
Chase, Clinton I. Measurement for Educational Evaluation,
Second Edition, Bloomington-Indiana: Addison-Wesley
Publishing Company, 1978.
Constructing Achievement Tests (3rd cd.), Norman E. Gronlund.

Prentice-Hall, Inc. , Englewood Cliffs, NJ, 1982, 148 pp

Prentice-Hall, Inc. , Englewood Cliffs, NJ, 1982, 148 pp.
Prentice-Hall, Inc. , Englewood Cliffs, NJ, 1982, 148 pp.
D Shermis, Mark and J. Di Vesta, Francis. 2011. Classroom
Assessment In Action. United Kingdom: Rowman &
Littlefield Publisher. Bandung: Grasindo
D. Shermis Mark, J. Di Vesta Frances 2011. Classroom
Assessment In Action. N : Rowman And Little
Field Publishers, Inc.
D. Shermis, dan Mark J. Di Vesta, Francis 2011. Classroom
Assessment In Action. N: Rowman dan Little bidang
penerbit, Inc
D. Shermis, Mark and J. Di Vesta, Francis. 2011. Classroom

Assessment In Action. USA: Rowman&Littlefield
Publishers, Inc.
Daftar Pusaka | 249

Dafidoff, L. L. 1991. Psikologi Suatu Pengantar, Edisi ketoga.
Jakarta : Penerbit Erlangga.
Departemen Pendidikan Nasional. 2008. Rancangan Penilaian
Hasil Belajar.
Depdikbud. 1997. Pengelola Pengujian Bagi Guru Mata
Pelajaran. Jakarta : Ditjen Dikdasmen, Direktorat
Dikdasmen.
Depdiknas. 2008. Panduan Penulisan Butir Soal. Jakarta:
Direktoral Jenderal Manajemen Pendidikan Dasar dan
Menengah. Derektoral Pembinaan Sekolah Menengah
Atas
Depdiknas. 2008. Pengembangan Perangkat Penilaian Afektif.

Jakarta: Direktorat Jenderal Pendidikan Dasar dan
Menengah.
Depdiknas. 2008a. Panduan Umum Pengembangan Silabus.
Departemen Pendidikan Nasional Direktorat Jenderal
Manajemen Pendidikan Dasar dan Menengah Direktorat
Pembinaan Sekolah Menengah Atas.
Ebel, R.L. & Frisbie, D.A. 1986. Essentials of Educational
Measurement. Englewood Cliffs, NJ: Prentice-Hall, Inc.
Ebel, R.L. & Frisbie, D.A. Essentials of Educational
Measurement. Englewood Cliffs, NJ: Prentice-Hall,
Inc. 1986.
Ebel, Robert. L. 1979. Essential of Education Measurement. New
Jersey : Prentice-Hall
Erwin, T. Dary. 1991. Assessing Student Learning and
Development: A Guide to the Principles, Goals, and
Methods of Determining College Outcomes. San
Fransisco: Jossey-Bass Inc
Ferdinand, Augusty. 2006. Structural Equation Modeling dalam

Penelitian Manajemen: Aplikasi Modelmodel Rumit dalam
Penelitian untuk Tesis Magister dan Disertasi Doktor.
Semarang: BP Universitas Diponegoro.
Gabel, D. L. 1993. Handbook of Research on Science
Teaching and Learning. New York : Maccmillam
Company
Gall, Meredith D., Gall, Joyce dan Borg, Walter R. 2007.
Educational Research:
Garrison , Catherine dan Michael Ehringhaus, Ph. D.
Formative and Summative Assessments in the
Classroom
Gregory, Robert J. 2000. Psychological Testing. United States of
America: Allyn and Bacon.
Griffin, P. & Nix, P. 1991. Educational Assesment and
Reporting. Sydney:
Gronlund, E. Norman. 1982. Constructing Achievement Tests,
Third Edition. Englewood Cliffs, New Jersey: Prentice-
Hall, Inc.
Gronlund, E. Norman. 1982. Constructing Achievement Tests,
Third Edition. Englewood Cliffs, New Jersey: Prentice-
Hall, In
Gronlund, E. Norman. Constructing Achievement Tests, Third
Edition. Englewood Cliffs, New Jersey: Prentice-Hall, Inc.,
1982.
Gronlund, Norman Edward. 1977. Constructing achievement
tests. USA: Prentzce-Hall, Znc
Grounlund, N.E. 1985. Measurement And Evaluationin Testing
(5th Ed.) New York: Macmillan Publising Co, Inc
Gullo, Dominic F. 2005. Understanding assessment and
Evaluation in Early Childhood Education. New York:
Teachers College Press
Hamalik, Oemar. 2005. Kurikulum dan Pembelajaran. Jakarta:
PT. Bumi Aksara.
Hamalik, Oemar. 2011. Kurikulum dan Pembelajaran.
Jakarta: Bumi Aksara. Hamalik,
Oemar.2002.Perencanaan Pengajaran Berdasarkan
Pendekatan Sistem.Bandung: Bumi Aksara
Harcout Brace Javanovich, Publisher.
Daftar Pusaka | 251

Hayat, Bahrul. 2004. Penilaian Kelas (Classroom Assessment
dalam PenerapaN Standar Kompetensi). Bogor: Jurnal
Pendidikan Penabur – No 03/Th III/Desember 2014
Howel, Scott L. and Hricko, Mary. 2004. Online Assesment
and Measurement Case Studies From Higher Education.
K-12 and Corporate. United State of America:
Information Science Publishing (An Imprint of Idea
Group Inc)
http://file.upi.edu/Direktor/FIP/JUR_PEND_LUAR_SEKOLAH/1
96009261985031-UYU_WAHYUDI/Macam-
macam_penilaian.pdf
http://schools.nyc.gov/NR/rdonlyres/33148188-6FB5-
4593-A8DF-
8EAB8CA002AA/0/2010_11_formative_sumative_Asses
sment.pdf
http://syukridatuk.blogspot.co.id/2012/06/rancangan-penilaian-
pembelajaran.html
Huba and Freed, Jann. 2000. Learner-Centered Assessment
on College Campuses: Shifting The Focus From Teaching
To Learning. Maryland : Hagerstown Comunity College
Hughes, G. 2011. Aiming for Personal Best: a Case for

Introducing Ipsative Assessment in Higher
Education Studies in Higher Education 36 (3): 353
– 367
Huitt, Bill, John 200 and Dan Kaeck. 2001. Assesment,
Measurement, Research, and Evaluation. Educational
Pshycology Interactive
Huitt, Bill, John Hummel and Dan Kaeck. 2001.
Assesment, Measurement, Research, and
Evaluation. Educational Pshycology Interactive. in
Education And Psychology.Los Angeles: SAGE
Janesick, Valerie J.2006. Authentic Assessment Primer. Peter
Lang: New York.
Kamus Besar Bahasa Indonesia (KBBI)
Katherine. 2003. Authentic Assesment. Canada:
Pembroke Publisher Limited.
Kemendikbud Dirjen Pendidikan Dasar. 2013. Panduan Teknis
Penilaian Sekolah Dasar. (Online)
https://dikdasmenpdmlamtim.files.
wordpress.com/2016/04/panduan-penilaian-di-sekolah-
dasar-versi-dirjen.pdf. Diakses tanggal 2 Oktober 2017
Kemendikbud. 2015. Panduan Penilaian Untuk Sekolah Dasar
(SD). Jakarta
Kementerian Pendidikan dan Kebudayaan (2015). Panduan
Penilaian Pada Sekolah Dasar (SD) Direktorat Jenderal
Pendidikan Dasar dan Menengah Direktorat Pembinaan
Sekolah Dasar.
Kerlinger, Fred N., (1995), Asas-asas Penelitian Behavioral
(diterjemahkan oleh Landum R. Situmorang dan H. J.
Koesumanto), Yogyakarta : Gajah Mada University
Press.
Khuriyah. 2003. Pengembangan Instrumen Evaluasi Ranah
Afektif Untuk Pendidikan Agama Islam. Jurnal
Pendidikan dan Evaluasi. No. 6. Mei 2003
Knight, Peter T.Mantz Yorke.2003.Assesment, Learning

and Employability.London: Open Univ Press.)
Kumar Singh, Yogesh. 2007. Education and Mental
Measurement. S.B Nangia
Kunandar. 2013. Penilaian Autentik. “Penilaian hasil

belajar peserta didik berdasarkan kurikulum
2013.” Suatu pendekatan praktis. Jakarta:
Rajagrafindo.
Kunandar. 2013. Penilaian Autentik. “Penilaian hasil belajar
peserta didik berdasarkan kurikulum 2013.” Suatu
pendekatan praktis. Jakarta: Rajagrafindo,
Kunandar. 2014. Penilaian Autentik (Penilaian Hasil Belajar
Peserta Didik Berdasarkan Kurikulum 2013). Jakarta:
Rajawali Pers
Daftar Pusaka | 253

Kusaeri dan Suprananto. (2012). Pengukuran dan Penilaian
Pendidikan. Yogyakarta: Graha Ilmu.
L. Howell, Scott and Hricko, Mary. 2006. Online Assessment and
Measurement: Case Studies From Higher Education K-12
and Corporate. USA: Idea Group, Inc
Lapono, Nabisi. 2016. Langkah Perencanaan Penilaian Proses
serta Hasil Belajar dan Pembelajaran.
https://kepompong.xyz/langkah-perencanaan-penilaian-
proses-serta-hasil-belajar-dan-pembelajaran/
Lehman, H. 1990. The Systems Approach to Education. Spesial
Presentation Conveyed in The International Seminar on
Educational Innovation and Technology. Manila :
Innotech Publications Vol 20 No 05
Lidz carol s,1991, Practitioner Guide to Dynamic

Assesment . New York : The Guilford Press
Lincoln, Y. S. dan Guba, E. G. 1985. Effective Evaluation. San
Francisco: Jossey-Bass Publisher
Linda Darling-Hammond dalam bukunya Authentic
Assessment in Action: Studies of Schools and Students
at Work
Linda Darling-Hammond dalam bukunya Authentic
Assessment in Action: Studies of Schools and Students
at Work
Linda Darling-Hammond, Jacqueline Ancess, and Beverly Falk.
1951. Authentic Assessment in Action: Studies of Schools
and Students at Work. Teacher college press,
Columbia University : New York.
Linn, Robert L. and Gronlund, Norman E. (1995). Measurement
and Assessment in teaching (Seventh Edition). Ohio:
Merrill, an immprint of Prentice Hall.
Luongo-Orlando, Kathrine. 2003. Authentic Assessment.
Canada : Pembroke Publishers
Luongo-Orlando.
M. Dorn, Charless. 2004. Assessing Expressive Learning_A
Practical Guide for Teacher-Directed_Authentic
Assessment in K–12 Visual Arts Education.
London:Lawrence Erlbaum AssociatesM
Marchese, T. J. (1987). AAHE Bulletin, 40, 3-8.

Mardapi, D. 2012. Pengukuran Penilaian & Evaluasi
Pendidikan. Yogyakarta: Nuha Medika.
Mardapi, Djemari. 2008. Teknik Penyusunan Instrument Tes

dan Non Tes. Yogyakarta: Mitra Cendekia
Mark D. Shermis and Francis J. Di Vesta, Classroom Assessment
In Action, (United Kingdom: Rowman & Littlefield
Publisher. Bandung: Grasindo, 2011), hlm. 332,
Marzano, Robert J.2006. Classroom assessment and
grading that work. United States of America:
Association for Supervision and Curriculum
Development (ASCD).
Masidjo.1995. Penilaian Pencapaian Hasil Belajar
Masrun & Martaniah, S. M,. 1973. Psikologi Pendidikan.
Yogyakarta : yayasan penerbitan Fakultas Psikologi
Universitas Gadjah Mada.
Mehren, W.A. & Lehmann, I.J. (1984). Measurement and
Evaluation in Education and Psychology. New York: Holt,
Rinehart.
Mehrens, W. A. & Lehmann, I. J. 1984. Measurement and
evaluation in education and psychology, Third edition.
New York: Holt, Rinehart and Winston.
Mehrens, William and Lehmann, Irvin J. 1991. Measurement
And Evaluation in Education and Psychology.
Belmont CA: Wadsworth/Thomson Learning
Mertens, Donna M. 2010. Research and Evaluation
Mertens. 1998. Research and Evaluation Methods in Special
Education
Metler, Craig a. 2003. Classroom Assessment: A Practical Guide
For Educators. New York : Pyrczak Publishing
Mueller, J. (2006). Authentic Assessment. North
Central. Tersedia :
Daftar Pusaka | 255

http://jonatan.muller/faculty.noctri.edu/toolb
ox/wahtisist.htm
Nana Sudjana. (1995). Penilaian Hasil Proses Belajar Mengajar.
Bandung: PT Remaja Rosdakarya.
Nasution, noehi. Adi suryanto. 2008. Evaluasi pengajaran.
Jakarta: Universitas Terbuka
National Research Council. 2001. Classroom Assessment and
the National Science Education Standars. Washington,
DC : The National Academies Press
Ngadip, Konsep Dan Jenis Penilaian Autentik (Authentic
Assesment) E-Jurnal Dinas Pendidikan Kota
Surabaya; Volume 1
Ngadip. Konsep Dan Jenis Penilaian Autentik (Authentic

Assesment) E-Jurnal Dinas Pendidikan Kota
Surabaya; Volume 1
Ngadip. Konsep Dan Jenis Penilaian Autentik (Authentic
Assesment) E-Jurnal Dinas Pendidikan Kota Surabaya;
Volume 1
Nitko, Anthony J. (1996). Educational Assessment of Students,
Second Edition. Ohio: Merrill an imprint of Prentice Hall
Englewood Cliffs.
Nitko, Anthony J. 1996. Educational Assessment of
Students, Second Edition.
Nitko, Anthony J. 1996. Educational Assessment of Students,
Second Edition. Ohio: Merrill an imprint of Prentice Hall
Englewood Cliffs.
Norman E. Gronlund.(1982) Constructing Achievement Tests (3rd
cd.), Prentice-Hall,Inc. ,Englewood Cliffs, NJ, 148 pp.
Nurhadi. 2004. Kurikulum 2004: Pertanyaan dan Jawaban.
Jakarta: Grasindo.
Ohio: Merrill an imprint of Prentice Hall Englewood
Cliffs.
Oriondo, L. L. & Antonio, E. M.D. 1998. Evaluating Educational
Outcomes (Test, Measurement and Evaluation). L
orentino St: Rex Printing Company, Inc.
Orlich, onald,dkk.2010.Teaching Strategies A guide to

effective Intructions.USA:Wadsworth
Overall, Lyn and Margaret Sangster. 2006. Assesment: A
Practical Guide for Primary Teachers. London :
Continuum
Overton, Terry. 2011. Assessing Learners with Special Need.
Brownsville: Pearson
Overtoon, Terry. 2012. Assessing Learners with Special Needs.
Brownsville: Pearson Education Inc
Palomba, C. A. & Banta T. W. 2015. Assesment essentials:
planning, implementing, and improving assessment in
higher education. San Francisco: Jossey Bass.
Palomba, C.A & Banta T. W. 1999. Assessment essential:
planning, implementing, and improving assessment in
higher education. San Fransisco Jossey Bass
Palomba, Catherine A and Banta, Trudy W. 1999. Assessment
Essentials: planning, implementing, and improving
assessment in higher education. San Fransisco: Jossey
Bass Inc
Paris, Scott and R. Ayres, Linda. 1991. Becoming

Reflective Students and Teachers With Portfolios and
Authentic Assessment.Washington: American
Psychological Association I.
Payne, David Allen.2003. Penilaian

Pendidikan Terapan. Washington:
Universitas Georgia
Phye, Gary.1997.Handbook of Clasroom Assesment Learning,
Adjustment, and Achievement. California:Academic
Press
Daftar Pusaka | 257

Plans, Irvine. 2009. Guidelines for Reviewing Assessment.
Assessment & Research Studies. University of California
Poerwanti, Endang. Konsep Dasar Assessment Pembelajaran.
UPI direktori file
(https://www.google.co.id/url?sa=t&rct=j&q=
&esrc=s&source=web&cd=2&cad=rja&uact=
8&ved=0ahUKEwiQzdHR-
9PWAhVDvI8KHS5dDRcQFggsMAE&url=http%
3A%2F%2Ffile.upi.edu%2FDirektori%2FFPMIP
A%2FPRODI._ILMU_KOMPUTER%2F19660325 2001121-
MUNIR%2FMultimedia%2FMultimedia_Bahan_
Ajar_PJJ%2FAsesmen_Pembelajaran%2Fassess
men_pembelajaran_1.pdf&usg=AOvVaw0Zg
QQKLuVb17rBkEWqdfcI) diakses pada Selasa pukul
20.10 WIB
Popham, W. J. 1978a. Criterion-referenced measurement.
Englewood Cliffs, NJ: Prentice-Hall.
Popham, W. James. 1996. Classroom Assessment. Boston: Allyn &
Bacon
QAA (2006) Code of Practice for the Assurance of Academic

Quality and Standards in Higher Education,
Gloucester: Quality Assurance Agency for Higher
Education
Rasyid, Harun dan Mansur.2009.Penilaian Hasil
Belajar.Bandung: CV Wacana Prima
Remmers, HH and Gage NL. 1955. Educational Measurement
and Evaluation. New York : Harper
S. Maxam, A. Boyer-Stephens, and M. Alff. 1986. Assessment: A
Key to Appropriate Program Placement. Columbia: the
authors.
S.Cangelosi, James. 1990. Designing Tests For Evaluating
Student Achievement. USA: Longman
Salinger, terry and E. Chittenden. 1994. Analysis of An Early
Literacy Portofolio: Consequences for instruction.
Language Arts 71.
Sawyer, David B. 2004. Fundamental Aspects of Interpreter
Education : Curriculum and Assessment. Amsterdam
: John Benjamins Publishing Company.
Sax, Gilbert. 1980. Principles of Educational Measurement
and Evaluation (second ed.). California: Wadsworth
Publishing.
Scott, Shelleyann dkk. 2016. Leadership of Assessment,
Inclusion, and Learning. London: Spinger
Internasional Publising Switzerland
Secolsky, Charles and Denison, D. Brian. 2012. Handbook On
Measurement, Assessment, And Evaluation In Higher
Education. New York: Routledge
Secolsky, Charles and Denison, Debrian. 2012. Handbook on
Measurement, Assesment, and Evaluation in Higher
Education. Newyork: Routledge
Semiawan Stamboel, Conny. Prinsip dan Teknik Pengukuran
dan Penilaian di Dalam Dunia Pendidikan, Cetakan
II, Jakarta: Mutiara Sumber Widya, 1986
Shermis, Mark and Francis JDV. 1953. Classroom Assesment In
Action. America: Rowman & Littlefield Publisher.
Shermis, Mark D. dan Francis J. Di Vesta. 2011. Classroom
Assessment in Action. Maryland : Rowman &
Littlefield Publishers
Singh, Yogesh Kumar. 2007. Education and Mental
Measurement.S.B Nangia Stuff Lebeam et al (1971)
Measurement, Evaluartion, and Assesment in
Education
Sirait, Bistok. Bahan Pengajaran untuk Mata Kuliah Evaluasi
Hasil Belajar Siswa,
Buku II, Jakarta: Depdikbud, 1989.
Siregar, Eveline & Nara, Hartini. 2011. Teori Belajar dan
Pembelajaran. Cet 2. Bogor : Ghalia Indonesia.
Slameto. 2010. Belajar & Faktor-Faktor yang
Mempengaruhinya. Jakarta: Rineka Cipta.
Daftar Pusaka | 259

Sriyono. 2004. Pengembangan Sistem Penilaian Berbasis
Kompetensi Peserta Diklat Sekolah Menengah
Kejuruan. Proceding: Rekayasa Sistem Penilaian
Dalam Rangka Meningkatkan Kualitas Pendidikan.
Yogyakarta: HEPI
Stiggins, R.J. (1994). Student-Centered Classroom
Assessment. New York:Macmillan College
Publishing Company.
Stinggins, R.J. (1994). Student-Centered Classroom Assessment.
New York : Macmillan College Publishing Company.
Stinggins, R.J. Student-Centered Classroom Assessment. New
York : Macmillan College Publishing Company. (1994).
Stufflebeam, Daniel L. dan Shinkfield, Anthony J. 2007.

Evaluation Theory, Models, and Application. San
Francisco: Jossey-Bass Sugihartono dkk. 2013.
Psikologi Pendidikan. Yogyakarta : UNY Press
Stufflebeam, D.L & Shinkfield, A.J. 1985. Systematic Evalution.
Boston: Kluwer Nijhof Publishing.
Sudijono, A. 2008. Pengantar Evaluasi Pendidikan. Jakarta:
PT. Raja Grafindo Persada.
Suharsimi Arikunto. (2013). Dasar-dasar Evaluasi Pendidikan.

Jakarta: PT Bumi Aksara.
Suharsimi Arikunto.2005. Evaluasi Program Pendidikan.
Jakarta: Bumi Aksara
Sukanti. 2011. Jurnal Pendidikan Akuntansi Indonesia Vol. IX No.
1 Hal. 76
Sukanti. 2011. Jurnal Pendidikan Akuntansi Indonesia Vol. IX No.

1 Hal. 74-82
Sukanti. 2011. Jurnal Pendidikan Akuntansi Indonesia Vol. IX

No. 1 Hal. 78-79
Suprananto, Kusaen. 2012. Pengukuran dan Penilaian

Pendidikan. Yogyakarta: Graha Ilmu.
Suprananto, Kusaen. Pengukuran dan Penilaian Pendidikan.
Yogyakarta: Graha Ilmu. 2012. Zulaiha, Rahmah.
Bagaimana Menganalisis Soal dengan Program Iteman.
(Jakarta: Departemen Pendidikan Nasional Badan
Penelitian dan Pengembangan Pusat Penilaian
Pendidikan, 2008), h.1
Surya, Mohamad. 2004. Psikologi Pembelajaran dan
Pengajaran. Bandung: Pustaka Bani Quraisy.
Suryabrata, S. 1999. Pengembangan Alat Ukur Psikologis.
Direktorat jenderal Pendidikan Tinggi: Departemen
Pendidikan dan Kebudayaan.
Suryabrata, S. 1999. Pengembangan Alat Ukur Psikologis.
Pendidikan dan Kebudayaan.
Suryabrata, S. Pengembangan Alat Ukur Psikologis.
Pendidikan dan Kebudayaan. 1999 hal 18.
Suryabrata, S. Pengembangan Alat Ukur Psikologis.
Pendidikan dan Kebudayaan. 1999.
Suryabrata, Sumadi. 1987. Pengembangan Tes Hasil Belajar.
Jakarta: Rajawali
Sutrisno, Hadi. 1997. Methodologi Research II. Yogyakarta :
Yasbit Psikologi UGM
Tan, Sharon. 2012. Develop Competency-Based Assessment
Plans. Singapore: Workforce Development Agency
Tark, J.S. & Thomas, A. 1994. Assessment and Program
Evaluation. Needham Heights: Simon & Schuster
Custom Publishing.
The Quality Assurance Division. 2012. Develop Competency-
Based Assessment Plans. Singapore: Workforce
Development Agency.
Thoha Chabib, Teknik Evaluasi Pendidikan, ( Jakarta :
Rajawali, 1996).
Thomas A. Knott, Paul W. Carhart, eds William Allan Neilson.
1951. Webster's New International Dictionary: Second
Edition Unabridged.
Daftar Pusaka | 261

Tinambunan, Wilmar (1988)Evaluation of Student
Achievement, (Jakarta: Departemen Pendidikan dan
Kebudayaan,), hlm. 137.
Tjundjing, Sia. 2001. Hubungan Antara IQ, EQ, dan QA dengan
Prestasi Studi pada Siswa SMU. Jurnal Anima Vol. 17.
No.1.
Tomlinson, Carol Ann and Tonya R. Moon. 2013. Assessment and
Student Success in a Differentiated Classroom. USA: ASDC
Publications
Valerie J Janesick, Authentic Assessment Primer, (Peter
Lang: New York, 2006),
Whiterington, H.C. 1984. Psikologi Pendidikan. Jakarta: Aksara
Baru
Widyoko, Eko P. 2000. Evaluasi Program Pembelajaran.
Yogyakarta: Pustaka Pelajar
Wiersma W, Jurs G (1990). Educational Measurement and
Testing. London: Allyn and Bacon. p. 169
Wiersma, William and Stephen G. Jurs. 1990. Instructor’s
Manual for Educational Measurement and Testing, 2nd
Ed. Allyn and Bacon
Wiersma, William and Stephen G. Jurs. 1990. Educational
Measurement & Testing. Boston: Allyn & Bacon
Wiggins, G. (1990). The Case for Authentic Assessment. ERIC
Digest ED238611 (online).
Available:http://www.ed.gov/databases/ERIC_Diges
ts/ed238611.html
William, David D. 2006. Assesment, Measurement, and
Evalution: Emerging Practices. USA: Information
Science Publishing.
Winkel, WS 1987. Bimbingan dan Konseling di Institusi
Pendidikan. Jakarta: Gramedia.
Xu, Yueting. 2016. Assessment planning within the context of
university English language teaching (ELT). China:
Australian Review of Applied Linguistics.
Yarbrough, Donald B., et. al. 2010. Joint Committee on
Standards for Educational Evaluation: The Program
Standards: A Guide for Evaluators and Evaluation
Users. California: Sage Publication.
Zainal A. 1990. Evaluasi Instruksional. Bandung: PT. Remaja
Rosdakarya
Zainul, A., & Nasoetion, N.1997.Penilaian Hasil
Belajar.Jakarta:Direktorat Jendral Pendidikan Tinggi
Zulaiha, Rahmah. Bagaimana Menganalisis Soal dengan
Program Iteman. (Jakarta: Departemen Pendidikan
Nasional Badan Penelitian dan Pengembangan Pusat
Penilaian Pendidikan, 2008), h.1
Zulaiha, Rahmah. Bagaimana Menganalisis Soal dengan
Program Iteman. (Jakarta: Departemen Pendidikan
Nasional Badan Penelitian dan Pengembangan Pusat
Penilaian Pendidikan, 2008), h.1
Daftar Pusaka | 263

Buku Penilaian Pembelajaran Evila

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Buku Penilaian Pembelajaran Evila

Diunggah oleh

Hak Cipta:

Format Tersedia

Evila Ramadhanty

UNIVERSITAS NEGERI YOGYAKARTA

Puji syukur kehadirat Allah SWT yang telah

Kulonprogo, 30 Desember 2017

BAB I. Pengukuran (Measurement), Penilaian

BAB II. Macam-Macam Penilaian ......................... 15

BAB III. Tujuan, Teknik, dan Alat Penilaian ....... 33

BAB IV. Penilaian Autentik ..................................... 62

BAB V. Perencanaan Penilaian ............................ 100

BAB VI. Kontruksi Tes Hasil Belajar Siswa ........... 136

BAB VII. Analisis Butir Soal ....................................... 154

BAB VIII. Pengembangan Instrumen Penilaian

BAB IX. Penilaian untuk Kerja (Performance

DAFTAR PUSTAKA .................................................... 245

Pengukuran, Penilaian, dan Evaluasi | 1

2 | Pengukuran, Penilaian, dan Evaluasi

Pengukuran, Penilaian, dan Evaluasi | 3

4 | Pengukuran, Penilaian, dan Evaluasi

Pengukuran, Penilaian, dan Evaluasi | 5

6 | Pengukuran, Penilaian, dan Evaluasi

Pengukuran, Penilaian, dan Evaluasi | 7

8 | Pengukuran, Penilaian, dan Evaluasi

Jadi kesimpulannya, penilaian adalah sebuah

Pengukuran, Penilaian, dan Evaluasi | 9

10 | Pengukuran, Penilaian, dan Evaluasi

Pengukuran, Penilaian, dan Evaluasi | 11

12 | Pengukuran, Penilaian, dan Evaluasi

Pengukuran, Penilaian, dan Evaluasi | 13

14 | Pengukuran, Penilaian, dan Evaluasi

Menurut Siregar, Eveline & Nara, Hartini dalam

National Research Council dalam buku

Sedangkan menurut Catherine Garrison and

Lebih jelas lagi diungkapkan dalam buku

Hal berbeda diungkapkan oleh Luongo-Orlando,

Lebih jauh lagi, Overall, Lyn and Margaret

Di dalam buku Evaluasi pengajaran karya

Penilaian formatif ini biasa dilaksanakan di

Di dalam buku Model dan Metode Pembelajaran

Selain macam-macam penilaian di atas, juga

Dari paparan di atas, terdapat beberapa macam

Tujuan, Teknik, dan Instrumen Penilaian | 33

Penerima manfaat belajar dapat bervariasi.

34 | Tujuan, Teknik, dan Instrumen Penilaian

Tujuan, Teknik, dan Instrumen Penilaian | 35

36 | Tujuan, Teknik, dan Instrumen Penilaian

a. Dengan melakukan asesmen berbasis kelas ini

38 | Tujuan, Teknik, dan Instrumen Penilaian

1. Mendeskripsikan kecakapan belajar pada

Tujuan, Teknik, dan Instrumen Penilaian | 39

1. Mengetahui tingkat pencapaian siswa.

40 | Tujuan, Teknik, dan Instrumen Penilaian

Jika siswa ditemukan, melalui penilaian, harus

Tujuan penilaian di kelas oleh guru hendaknya

1. Penelusuran (Keeping track), yaitu untuk

Agar tujuan penilaian tersebut tercapai,

42 | Tujuan, Teknik, dan Instrumen Penilaian

Di samping itu, karena tujuan utama dari

Tujuan, Teknik, dan Instrumen Penilaian | 43

Menurut Metter (2003) terdapat beberapa

1. Merencanakan, melakukan, dan

2. Mendiagnosis kesulitan siswa

44 | Tujuan, Teknik, dan Instrumen Penilaian

4. Memberikan masukan kepada siswa

5. Mengkaji dan mengevaluasi