PENILAIAN PEMBELAJARAN
Penilaian
Pembelajaran
Pedoman Penilaian Praktis bagi Pendidik
Evila Ramadhanty
Disusun Oleh :
Evila Ramadhanty
(16108244031)
KATA PENGANTAR
i
buku ini betul – betul bermanfaat dalam menyiapkan
calon guru SD ataupun Guru SD yang berkualitas.
Demikian yang dapat sampaikan, semoga
pembaca dapat mengambil manfaat dari karya ini dan
dapat menerapkan berbagai teori dan pengembangya di
SD.
Penulis
ii
DAFTAR ISI
KATA PENGANTAR................................................... i
DAFTAR ISI ................................................................... iii
iii
D. Fitur Penilaian Autentik (Features Of
Authentic Assessment) ................................ 82
E. Cakupan Penilaian Autentik .................. 85
F. Alternatif Penilaian Autentik .................... 92
G. Manfaat Penggunaan Penilaian
Autentik ......................................................... 96
iv
C. Karakteristik Analisis Butir Soal ................ 162
D. Macam - macam Analisis Butir Soal ....... 166
v
BAB I
PENGUKURAN (MEASUREMENT),
PENILAIAN (ASSESSMENT), DAN
EVALUASI (EVALUATION)
A. PENGUKURAN (MEASUREMENT)
Serriven (David, 2006:2) menyatakan bahwa
pengukuran adalah penentuan besaran kuantitas,
biasanya pada skala uji yang dirujuk kriteria atau skala
numerik kontinu. Dalam konteks tertentu, kita
memperlakukan pengamat sebagai instrumen yang
membutuhkan kalibrasi atau validasi. Pengukuran
adalah komponen evaluasi standar yang umum dan
terkadang besar, namun merupakan bagian yang
sangat kecil dari logikanya, yaitu pembenaran untuk
kesimpulan evaluatif. Selaras dengan pernyataan James
(1990:21), pengukuran adalah proses pengumpulan data
melalui pengamatan empiris yang digunakan untuk
mengumpulkan informasi yang relevan dengan tujuan
yang telah ditentukan. Singkatnya pengukuran adalah
penilaian numerik pada fakta-fakta dari objek yang
hendak diukur menurut kriteria atau satuan-satuan
tertentu (William & Jurs, 1990).
Pengukuran adalah pengamatan dengan
pengumpulan kuantifikasi sistematis dan pengumpulan
informasi. Pengukuran menyiratkan baik proses atau
kuantifikasi dan hasilnya (David Payne, 2003:6).
B. PENILAIAN (ASSESSMENT)
English and H.B English (1958) mendefinisikan
penilaian sebagai "metode untuk mengevaluasi
kepribadian di mana seseorang yang tinggal dalam
kelompok di bawah kondisi fisik dan sosial yang sebagian
terkontrol, bertemu dan memecahkan berbagai masalah
yang berkaitan dengan kehidupan, termasuk masalah
jiwa, dan yang diamati dan dinilai.Menurut Mark Shermis
(1953:2), penilaian adalah (a) sebuah pengaturan
prosedur (b) dirancang untuk menyatakan informasi
tentang perkembangan, pertumbuhan dan prestasi
siswa. Sedangkan menurut Bill Hiutt dkk (2001:11),
penilaian mengacu pada pengumpulan data untuk
menggambarkan atau lebih memahami suatu masalah,
pengukuran adalah proses kuantifikasi data penilaian.
Lebih lengkapnya Erwin (1991:20) menjabarkan bahwa
penilaian adalah dasar sistematis untuk membuat
kesimpulan tentang pembelajaran dan pengembangan
siswa. Ini adalah proses mendefinisikan, memilih,
merancang, mengumpulkan, menganalisa, menafsirkan,
C. EVALUASI (EVALUATION)
Menurut Bill Huitt dkk (2001:11) evaluasi
mengacu pada perbandingan data dengan standar
untuk menilai nilai atau kualitas. Evaluasi adalah proses
keberlanjutan tentang pengumpulan dan penafsiran
informasi untuk menilai (assess) keputusan-keputusan
yang dibuat dalam merancang suatu system pengajaran
(Oemar Hamalik, 2002:210).
Menurut Anne Anastasi (Chabib, 1991:1) Evaluasi
sebagai "proses sistematis untuk menentukan sejauh
mana tujuan instruksional dicapai oleh murid”.
Stufflebeam dan Shinkfield (1985:159) evaluasi adalah
proses penggambaran, memperoleh, dan memberikan
informasi deskriptif dan menghakimi tentang nilai dan
manfaat dari beberapa tujuan, rancangan, pembuatan,
melayani kebutuhan akan akuntabilitas, dan
A. MACAM PENILAIAN
Menurut Brookhart dkk dalam buku How to Asses
Higher-Order Thinking Skills in Your Classroom
menjelaskan bahwa terdapat 2 macam penilaian yaitu :
penilaian Formatif dan penilaian Sumatif. Penilaian
formatif menerima umpan balik dalam bentuk
komentar yang memerlukan analisis, evaluasi atau
penciptaan mengenai peikiran itu sendiri. (h. 57).
Penilaian Sumatif adalah penilaian dengan beberapa
pilihan pertanyaan yang dinilai benar atau salah, dan
rubric penilaiannya digunakan untuk pertanyaan esai
dan kinerja. Penilaian sumatif lebih memperhatikan nilai
dari pada komentar umpan balik tertulis atau lisan. (h.
58).
Sedangkan menurut Marzano & Robert J dalam
buku Classroom assessment and grading that work juga
menyebutkan bahwa terdapat dua macam penilaian,
yaitu penilaian formatif dan penilaian sumatif. Penilaian
formatif didefinisikan sebagai suatu pengetahuan yang
sedang terjadi atau yang sedang dilakukan dan
dipelajari. Penilaian sumatif didefinisikansebagai suatu
pengetahuan yang terjadi pada akhir episode
pembelajaran. misalnya, di akhir kursus ( McMillan,
2000)
Macam-Macam Penilaian | 15
Menurut Sudijono dalam bukunya berjudul
Pengantar Evaluasi Pendidikan. Menerangkan bahwa
hanya ada dua macam penilain yaitu penilaian formatif
dan penilaian sumatif. Penialain formatif adalah
penilaian hasil belajar yang bertujuan untuk
mengetahui, sudah sejauh manakah peserta didik “telah
terbentuk” (sesuai dengan tujuan pengajaran yang telah
ditentukan) setelah mereka mengikuti proses
pembelajaran dalam jangka waktu tertenttu. Peru
diketahui bahwa istilah “formatif” itu berasal dari kata
“form” yang berarti bentuk (hal 71). Penilaian sumatif
adalah penilaian yang dilaksanakan setelah sekumpulan
program pelajaran selesai diberikan. Dengan kata lain
peilaian yang dilaksanakan setelah seluruh unit
pelajaran selesai diajarkan. Adapun tujuan utama dari
penilaian sumatif ini adalah untuk menentukan nilai
yang melambangkan keberhasilan peserta didik setelah
mereka menempuh program pengajaran dalam jangka
waktu tertentu. (hal 23)
16 | Macam-Macam Penilaian
berpindah dari satu unit pembelajaran ke unit
berikutnya. Biasanya diberikan pada akhir suatu
program pembelajaran atau suatu unit pembelajaran
dan hasilnya digunakan untuk menentukan seberapa
jauh siswa menguasai tujuan pembelajaran. (hal. 156-
157)
Macam-Macam Penilaian | 17
merupakan bagian integral dari proses belajar mengajar.
Ini tidak memberikan kontribusi pada tanda akhir yang
diberikan untuk modul; Sebaliknya, hal itu berkontribusi
untuk belajar melalui pemberian umpan balik. Ini harus
menunjukkan apa yang baik tentang sebuah karya dan
mengapa ini bagus; itu juga harus menunjukkan apa
yang tidak begitu bagus dan bagaimana pekerjaan bisa
diperbaiki. Umpan balik formatif yang efektif akan
mempengaruhi apa yang dilakukan oleh siswa dan guru
selanjutnya.
Macam-Macam Penilaian | 19
didik telah dapat berpindah dari suatu unit ke unit
berikutnya.
20 | Macam-Macam Penilaian
dibutuhkan oleh konselor sekolah untuk bantuan dalam
mengidentifikasi kebutuhan belajar khusus dari masing-
masing siswa. Guru masa depan akan mengacu pada
siswa, pekerjaan masa lalu untuk menilai kesiapan
belajar topik baru. Orang tua ingin diberi laporan
pendidikan anak-anak mereka. Semua pemangku
kepentingan, termasuk siswa, memiliki minat dalam
informasi yang diberikan dalam ringkasan catatan siswa
prestasi. Tapi tujuan ini dicapai dengan penilaian sumatif
membutuhkan ukuran pencapaian pendidikan yang
melampaui skor sederhana sebagai rangkuman prestasi
belajar siswa.
2. Penilaian Formatif
Berbeda dengan penilaian sumatif, penilaian
formatif terdiri dari penilaian yang terintegrasi dengan
instruksi pembuatan keputusan instruksional (Linn, 1989)
selama perjalanan petunjuk. Untuk melakukannya
memerlukan tingkat informasi mengenai instruksi dan
pembelajaran tentang: cara proses perkembangan
mempengaruhi pembelajaran, proses pengembangan
kurikulum dan tujuan yang berbeda, tingkat
perkembangan, sifat tujuan instruksional dan metode
untuk mencapainya, cara metode pengajaran
pembelajaran yang berbeda, cara belajar siswa, proses
yang digunakan siswa dalam lingkungan belajar yang
berbeda (Linn, 1989)
Penilaian formatif didasarkan pada kesimpulan
bahwa penilaian bukan tujuan itu sendiri tapi bisa
digunakan secara konstruktif oleh guru dan pendidik
pada setiap saat selama pengajaran untuk
Macam-Macam Penilaian | 21
mengidentifikasi apakah dan di mana pengajaran dan
pembelajaran bisa dilakukan ditingkatkan. Idenya
adalah bahwa setiap atau semua penilaian
menyediakan dasar untuk mempertimbangkan retensi
atau perubahan. Penilaian dilakukan dengan siswa dan
guru yang bekerja secara kooperatif, guru
mempertahankan sebuah pendekatan yang
menghasilkan hasil memuaskan, merevisi instruksi untuk
meningkatkan keefektifannya, atau saat acara
menuntutnya memberikan sebuah instruksional
komponen yang tidak efektif. Belajar dengan cara ini
dimaksudkan untuk memiliki efek terus menerus
peningkatan pengajaran.
22 | Macam-Macam Penilaian
selama tahun ajaran. Teknik, terutama observasi, daftar
periksa, konferensi dan diskusi digunakan untuk
menawarkan umpan balik kepada siswa tentang
pelajaran yang sedang berjalan atau mengembangkan
keterampilan. Informasi yang dikumpulkan melalui
penilaian formatif digunakan untuk menentukan
kemajuan siswa, meningkatkan kinerja dan
memodifikasi instruksi.
3. Penilaian Sumatif
Penilaian sumatif berlangsung pada akhir studi,
kursus, jangka waktu atau periode waktu ketika siswa
dipersiapkan untuk mendemostrasikan pemahaman
dan penerapan tujuan kurikulum mereka. Data yang
dikumpulkan digunakan untuk menilai nilai pekerjaan
siswa.
Hampir sama dengan apa yang diungkapkan
oleh Luongo-Orlando, Kathrine, macam penilaian
menurut Sawyer, David B. dalam buku Fundamental
Aspects of Interpreter Education : Curriculum and
Assessment terdapat tiga macam penilaian yang perlu
diketahui yaitu:
1. Penilaian Formatif
Penilaian formatif merupakan penilaian yang
berlangsung selama pengajaran dan digunakan pada
dasarnya untuk memberi umpan balik ke dalam proses
belajar-mengajar (H-106)
2. Penilaian Sumatif
Penilaian summatif terjadi pada akhir sebuah
pembelajaran dan digunakan untuk memberikan
Macam-Macam Penilaian | 23
informasi tentang berapa banyak siswa yang telah
belajar dan
seberapa baik pembelajaran telah berhasil (H-106)
3. Penilaian Ipsatif
Penilaian ipsatif merupakan penilaian di mana
siswa mengevaluasi pembelajaran dibandingkan dengan
pembelajaran sebelumnya (h.106)
1. Sumatif
Penilaian sumatif dapat disamakan dengan
mengambil gambar dari sebuah situasi. Informasi
dikumpulkan dan dianalisis. Contoh penilaian sumatif
adalah akhir dari tes topik, ujian akhir tahun, ujian GCSE,
laporan akhir tahun dan tes ejaan. Tes sumatif diberikan
pada akhir pekerjaan yang telah ditetapkan. Tes sumatif
adalah tes ingatan untuk mengukur seberapa banyak
murid tahu. Tes sumatif lebih berguna saat menguji apa
yang diketahui dan dapat dipelajari siswa, seperti ujian
mengenai masalah yang harus dipecahkan. Apapun
bentuk yang mereka sajikan, tidak ada tindak lanjut
keberhasilan dan kegagalan. Hasilnya berdiri sebagai
rambu di sepanjang jalan pencapaian pendidikan. (hal.
19-20)
2. Formatif
Dalam banyak hal penilaian formatif hampir
serupa dengan penilaian sumatif. Cara mengumpulkan
24 | Macam-Macam Penilaian
data serupa. Tetapi memiliki tujuan yang berbeda.
Tujuan penilaian formatif adalah untuk menindaklanjuti
atas hasil yang telah diperoleh. Dalam tes formatif
beberapa tindakan diambil. Penilaian formatif saat ini
memiliki tingkat pengembalian yang lebih luas daripada
penilaian sumatif. Interaksi menit demi menit antara
guru dan murid dan antara murid sendiri juga dapat
didefinisikan sebagai tes formatif karena terjadi selama
proses pembelajaran. (hal. 20-21)
3. Diagnostik
Terkadang informasi yang rinci sangat
dibutuhkan dalam fokus pengetahuan. Mungkin seorang
anak sedang berjuang ataukah mengerjakan segala
sesuatu dengan mudahnya. Guru kemudian
memutuskan untuk mengumpulkan data secara
mendalam sehingga dia dapat mengatasi masalah.
Tindakan yang akan diambil, juga merupakan penilaian
formatif. Penilaian diagnostik bisa menyita waktu yang
banyak. Tes diagnostik digunakan apabila ada
hambatan dalam proses belajar. (hal. 21)
4. Ipsatif
Penilaian Ipsatif adalah ketika kemajuan dinilai
dari kinerja sebelumnya. Keputusan akhir disesuaikan
dengan prestasi individu, seperti yang dikatakan
Torrance dan Pryor (1998, hal.36), apa yang mereka
lakukan sekarang mewakili kemajuan nyata bagi anak
itu. Ini adalah jenis penilaian formatif lainnya. Jika Anda
yakin bahwa anak-anak membangun pengetahuan
baiknya berdasarkan dan terkait dengan pengetahuan
sebelumnya maka penilaian ipsatif akan menjadi bagian
Macam-Macam Penilaian | 25
penting dalam siklus pengajaran Anda. Peta konsep, di
mana anak-anak mengidentifikasi apa yang mereka
ketahui dan apa yang perlu mereka ketahui selanjutnya,
akan menjadi ilustrasi yang bagus tentang respons
terhadap penilaian ipsatif. (hal. 25)
1. Penilaian Formatif
Penilaian formatif adalah penilaian hasil belajar
yang bertujuan untuk mengetahui, sudah sejauh
manakah peserta didik “telah terbentuk” (sesuai dengan
tujuan pengajaran yang telah ditentukan) setelah
mereka mengikuti proses pembelajaran dalam jangka
waktu tertentu. Perlu diketahui bahwa istilah “formatif”
itu berasal dari kata “form” yang berarti
“bentuk”. (Sudijono, 2005 : 71)
2. Penilaian Sumatif
26 | Macam-Macam Penilaian
Penilaian sumatif adalah penilaian yang
dilakukan pada setiap akhir satu satuan waktu yang
didalamnya tercakup lebih dari satu pokok bahasan,
dan dimaksudkan untuk mengetahui sejauh mana
peserta didik telah dapat berpindah dari suatu unit ke
unit berikutnya.
Adapun tujuan utama dari penilaian sumatif ini
adalah untuk menentukan nilai yang melambangkan
keberhasilan peserta didik setelah mereka menempuh
program pengajaran dalam jangka waktu tertentu.
(Sudijono, 2007: 23) Seperti halnya penilaian formatif
yang dikatakan Ahmad Rohani dan Abu Ahmadi dalam
bukunya “Pengelolaan Pengajaran”, (Rohani dan
Ahmadi, 1991: 176-179),
3. Penilaian Diagnostik
Penilaian diagnostik adalah penilaian yang
bertujuan untuk mengetahui kelemahan-kelemahan
siswa serta faktor-faktor penyebabnya. Pelaksanaan
penilaian semacam ini biasanya bertujuan untuk
keperluan bimbingan belajar, pengajaran remedial,
menemukan kasus-dasus dan lain-lain. Soal-soalnya
disusun sedemikian rupa agar dapat ditemukan jenis
kesulitan belajar yang dihadapi oleh para siswa.
4. Penilaian Selektif
Penilaian selektif adalah penilaian yang
dilaksanakan dalam rangka menyeleksi atau menyaring.
Memilih siswa untuk mewakili sekolah dalam lomba-
lomba tertentu termasuk jenis penilaian selektif. Untuk
kepentingan yang lebih luas penilaian selektif misalnya
Macam-Macam Penilaian | 27
seleksi penerimaan mahasiswa baru atau seleksi yang
dilakukan dalam rekrutmen tenaga kerja.
5.
Penilaian Penempatan
Penilaian penempatan adalah penilaian yang
ditujukan untuk mengetahui keterampilan prasyarat
yang diperlukan bagi suatu program belajar dan
penguasaan belajar seperti yang diprogramkan sebelum
memulai kegiatan belajar untuk program itu. Dengan
perkataan lain, penilaian ini berorientasi kepada
kesiapan siswa untuk menghadapi program baru dan
kecocokan program belajar dengan kemampuan
siswa,dan penilaian dilaksanakan bilamana ada
kebutuhan untuk menempatkan setiap murid pada
program pendidikan / program belajar mengajar yang
sesuai dengan kemampuannya.
1. Penilaian Formatif
Penilaian ini dimaksudkan untuk memantau
kemajuan belajar peserta didik selama proses belajar
berlangsung, untuk memeberikan balikan (feedback)
bagi penyempurnaan program pembelajaran, serta
untuk mengetahui kelemahankelemahan yang
memerlukan perbaikan, sehingga hasil belajar peserta
didik dan proses pembelajaran guru menjadi lebih baik.
Tujuan utama penilaian formatif adalah untuk
28 | Macam-Macam Penilaian
memperbaiki proses pembelajaran, bukan untuk
menentukan kemampuan peserta didik. (hal.125)
2. Penilaian Sumatif
Penilaian sumatif berarti penilaian yang
dilakukan jika satuan pengalaman belajar atau seluruh
materi pelajaran di anggap telah selesai. Dengan
demikian ujian akhir semesteran dan ujian nasional
termasuk penilaian sumatif. Tujuannya yaitu untuk
menentukan nilai (angka) berdasarkan tingkatan hasil
belajar peserta didik yang selanjutnya dipakai sebagai
angka rapor. Dan juga dapat dipakai untuk perbaikan
proses pembelajaran secara keseluruhan. (hal.125)
3. Penilaian Penempatan
Penilaian penempatan ini tujuan utamanya
adalaha untuk mengetahui apakah peserta didik telah
memiliki ketrampilan-ketrampilan yang diperlukan
untuk mengikuti suatu program pembelajaran dan
sejauh mana peserta didik telah menguasai kompetensi
dasar sebagaimana yang tercantum dalam silabus dan
rencana pelaksanaan pembelajaran (RPP). (hal.126)
4. Penilaian Diagnostik
Penilaian ini dimaksudkan untyk mengetahui
kesulitan belajar peserta didik berdasarkan hasil
penilaian formatif sebelumnya. Dan penilaian ini
memerlukan sejumlah soal untuk satu bidang yang
diperkirakan merupakan kesulitan bagi peserta didik,
dan soal-soal itu bervariasi. (hal.126)
5. Penilaian Selektif
Macam-Macam Penilaian | 29
Adalah penilaian yang bertujuan untuk
keperluan seleksi, misalnya ujian saringan masuk ke
lembaga pendidikan tertentu. (hal.126)
30 | Macam-Macam Penilaian
digunakan sebelum badan utama pengajaran. Penilaian
dinamis secara tipikal kontras dengan penilaian statis. Ini
mencerminkan fakta bahwa penilaian dinamis berfokus
pada proses belajar, berbeda dengan penilaian
tradisional yang berfokus pada produk yang telah
dipelajari.
Penilaian sinoptik adalah penilaian yang
mendorong siswa untuk menggabungkan elemen
pembelajaran mereka dari berbagai bagian program
dan untuk menunjukkan akumulasi pengetahuan dan
pemahaman mereka tentang topik atau bidang subjek.
Penilaian sinoptik biasanya memungkinkan siswa untuk
menunjukkan kemampuan mereka untuk
mengintegrasikan dan menerapkan keterampilan,
pengetahuan dan pemahaman mereka dengan luas dan
mendalam dalam subjek. Ini dapat membantu untuk
menguji kemampuan siswa dalam menerapkan
pengetahuan dan pemahaman yang diperoleh di salah
satu bagian program untuk meningkatkan pemahaman
mereka di bagian lain program ini, atau di seluruh
program secara keseluruhan . Penilaian sinoptik dapat
menjadi bagian dari bentuk penilaian lainnya.
Criterion Referenced Assessment (Kriteria
penilaian) yang diacu Setiap prestasi siswa dinilai
berdasarkan kriteria tertentu. Pada prinsipnya tidak ada
perhitungan yang diambil tentang bagaimana siswa lain
melakukannya. Dalam praktiknya, pemikiran normatif
dapat mempengaruhi penilaian apakah kriteria tertentu
telah dipenuhi atau tidak. Keandalan dan validitas harus
Macam-Macam Penilaian | 31
diyakinkan melalui proses seperti moderasi, uji coba, dan
pengumpulan contoh.
Selain berbagai pendapat di atas, Gabel
(1993:388-390) mengkategerikan penilaian ke dalam
kedua kelompok besar yaitu penilaian tradisonal dan
penilaian alternative. Penilaian yang tergolong
tradisonal adalah tes benar-salah, tes pilihan ganda, tes
melengkapi dan tes jawaban terbatas. Sementara itu
yang tergolong ke dalam penilaian praktek, penilaian
proyek kuesioner, inventori daftar. Contoh : Penilaian
oleh teman sejawat atau sebaya, penilaian diri (self
assessment), portofolio, observasi, diskusi dan interview
(wawancara).
32 | Macam-Macam Penilaian
BAB III
TUJUAN, TEKNIK, DAN ALAT
PENILAIAN
A. TUJUAN PENILAIAN
Tujuan menurut KBBI adalah arah. Tujuan
merupakan sesuatu yang akan dicapai. Tentu dalam
sebuah penilaian itu juga mempunyai tujuan mengapa
diadakannya penilaian.
Tujuan asesmen oleh Sudjana (2005) yaitu sebagai
berikut:
a) Mendeskripsikan kecakapan belajar para siswa
sehingga dapat diketahui kelebihan dan
kekurangannya dalam berbagai bidang studi
atau mata pelajaran yang ditempuh;
b) Mengetahui keberhasilan proses pendidikan dan
pengajaran di sekolah, yakni seberapa jauh
keefektifannya dalam mengubah tingkah laku
para siswa ke arah tujuan pendidikan yang
diharapkan;
c) Menentukan tindak lanjut hasil asesmen, yakni
melakukan perbaikan dan penyempurnaan
dalam hal program pendidikan dan pengajaran
serta strategi pelaksanaannya;
d) Memberikan pertanggung jawaban
(accountability) dari pihak sekolah kepada
B. TEKNIK PENILAIAN
Menurut Brookhart, Susan M. and Anthony, Nitko J.
(2007 : 5) ilihat dari tekniknya, asesmen proses dan hasil
belajar dibedakan menjadi dua macam yaitu dengan
Teknik Tes dan Non Tes namun pada umumnya pengajar
lebih banyak menggunakan tes sebagai alat ukur
dengan rasional bahwa tingkat obyektivitasevaluasi lebih
terjamin, hal ini tidak sepenuhnya benar. Anda bisa lebih
jauh mencermati pada unit-unit selanjutnya:
Contoh:
a. Jelaskan bagaimana prosedur
operasional sebuah pesawat komputer!
b. Sebutkan lima komponen dalam sistem
komputer!
Uraian Bebas (Extended Respons Items)
Dalam bentuk ini peserta didik bebas
untuk menjawab soal dengan cara dan
sistematika sendiri. Peserta didik bebas
mengemukakan pendapat sesuai dengan
kemampuannya. Oleh karena itu, setiap
peserta didik mempunyai cara dan
sistematika yang berbeda-beda. Namun,
guru tetap mempunyai acuan atau patokan
dalam mengoreksi jawaban peserta didik
nanti. Contoh:
Teknik Non-Tes
Teknik non-tes sangat penting dalam
mengevaluasi siswa pada ranah afektif dan
psikomotor, berbeda dengan teknik tes yang
lebih menekankan asfek kognitif. Ada beberapa
macam teknik non-tes, yakni: pengamatan
(observation), wawancara (interview),
kuesioner/angket (quetionaire).
a. Observasi
Observasi adalah suatu proses pengamatan
dan pencatatan secara sistematis, logis,
objektif, dan rasional mengenai berbagai
fenomena untuk mencapai tujuan tertentu.
Dalam evaluasi pembelajaran, observasi
dapat digunakan untuk menilai proses dan
hasil belajar peserta didik, seperti tingkah
laku peserta didik pada waktu belajar,
berdiskusi, mengerjakan tugas, dan lain-lain.
Alat yang digunakan untuk melakukan
observasi disebut pedoman observasi.
b. Wawancara
Wawancara merupakan salah satu bentuk
alat evaluasi jenis non-tes yang dilakukan
melalui percakapan dan tanya jawab, baik
secara langsung maupun tidak langsung.Ada
beberapa teknik atau cara yang harus
Tujuan, Teknik, dan Instrumen Penilaian | 55
diperhatikan dalam melaksanakan
wawancara, yaitu:
Pewawancara harus mempunyai
background tentang apa yang akan
ditanyakan.
Dalam mewawancarai jangan terlalu
kaku, tunjukkan sikap yang
bersahabat, bebas, ramah, terbuka, dan
dapat menyesuaikan diri.
Hilangkan prasangka-prasangka yang
tidak baik.
Pertanyaan hendaknya jelas, tepat, dan
denan bahasa yang sederhana.
Hindari kevakuman pembicaraan yang
terlalu lama.
Batasi waktu wawancara.
c. Angket (Quetioner)
Angket adalah sebuah daftar pertanyaan
yang harus diisi oleh orang yang akan diukur
(responden). Angket adalah alat penilaian
hasil belajar yang berupa daftar pertanyaan
tertulis untuk menjaring informasi tentang
sesuatu, misalnya tentang latar belakang
keluarga siswa, kesehatan siswa, tanggapan
siswa terhadap metode pembelajaran,
media, dan lain- lain. Angket umumnya
dipergunakan pada ranah afektif
d. Daftar Cek (Check List)
Daftar cek adalah deretan pertanyaan
singkat dimana responden yang dievaluasi
C. ALAT/INSTRUMEN PENILAIAN
1) Jenis Instrumen Penilaian
Berikut merupakan jenis instrumen penilaian antara lain:
a. Tes kemampuan standar (atau sering
disebut tes psikometri)
Tes ini dirancang untuk menjadi kurikulum
yang mandiri dan mengukur sifat yang lebih
tahan lama dan jangka panjang daripada
pencapaian pembelajaran, yaitu mengukur apa
yang dapat diketahui siswa daripada
pengetahuan yang diketahui.
b. Tes prestasi standar (atau sering sebagai
tes pencapaian)
Gunanya untuk mengukur apa yang
diketahui dan dapat digunakan siswa untuk
menilai, misalnya, pengetahuan dan
keterampilan siswa dalam melek huruf dan
berhitung, dan untuk menentukan kemajuan di
bidang ini.Dengan berjalan kaki informasi yang
dikumpulkan dari berbagai praktik penilaian
termasuk tes kemampuan dan pencapaian,
informasi lebih lanjut dapat dikumpulkan
melalui administrasi tes diagnostik untuk
memberikan pandangan yang lebih rinci
tentang kekuatan dan kebutuhan belajar siswa.
62 | Penilaian Autentik
peserta didik, kurikulum, program, dan kebijakan
pendidikan.
Sistem penilaian yang digunakan untuk
meningkatkan kualitas pendidikan adalah sistem
penilaian yang berkelanjutan. Dimana sistem
penilaian berkelanjutan memiliki prisnsip yaitu
menilai semua kompetensi dasar, menganalisis hasil
penilaian dan melakukan tindak lanjut yang berupa
program perbaikan atau program pengayaan. Sistem
penilaian yang biasa digunakan di Indonesia adalah
penilaian tradisional dengan menggunakan tes
objektif. Penilaian tradisional lebih tepat digunakan
untuk mengukur produk atau hasil belajar. Proses
pembelajaran yang dilalui tidak dapat diukur dengan
penilaian tradisional. Penggunaan penilaian
tradisional juga penting untuk mengukur tingkat
pemahaman peserta didik. Akan tetapi, penilaian
tradisional dengan menggunakan tes objektif tidak
dapat mengukur kompetensi peserta didik secara
keseluruhan. Selain itu, penggunaan tes objektif dalam
penilaian memiliki juga kelemahan lainnya, seperti
adanya kemuungkinkan faktor keberuntungan
peserta didik dalam memilih jawaban.
Sejalan dengan perkembangan ilmu
pengetahuan dan teknologi, Indonesia selalu
mengembangkan inovasi-inovasi baru untuk
mengimbangi perkembangan ilmu pengetahuan dan
teknologi yang semakin pesat. Salah satu inovasi
tersebut adalah memperbaharui kurikulum KTSP
menjadi kurikulum 2013 atau K13. Kurikulum 2013
menitikberatkan pada kompetensi sikap,
Penilaian Autentik | 63
pengetahuan, dan keterampilan. Ketiga komponen
tersebut secara eksplisit dinyatakan dalam kompetensi
inti yang harus dimiliki siswa. Kurikulum 2013 juga
mengatur kegiatan pembelajaran yang
mengutamakan pendekatan scientific (ilmiah) yaitu
mengamati, menanya, melatih, mencoba, menalar,
dan meng-komu- nikasikan. Perubahan yang
mendasar itu juga berdampak pada sistem penilaian
yang lebih mengarah ke penilaian otentik.
Penilaian otentik memiliki relevansi kuat
terhadap pendekatan scientific (ilmiah) dalam
pembelajaran sesuai dengan tuntutan kurikulum 2013.
Penilaian semacam ini mampu menggambarkan
peningkatan hasil belajar peserta didik, baik dalam
rangka mengobservasi, menalar, mencoba, mem-
bangun jejaring, dan lain-lain. Penilaian otentik
cenderung fokus pada tugas-tugas kompleks atau
kontekstual, memungkinkan peserta didik untuk
menunjukkan kom- petensi mereka dalam
pengaturan yang lebih otentik. Karenanya, penilaian
otentik sangat relevan dengan pendekatan ilmiah
dalam pembelajaran.
Pada mulanya istilah autenetik assessment
atau penilaian otentik diperkenalkan oleh Grant
Wiggins (1990) yang menyatakan bahwa perlunya
kinerja ditampilkan secara efektif dan kreatif. Selain
itu tugas yang diberikan dapat berupa pengulangan
tugas atau masalah yang analog dengan masalah
yang dihadapi orang dewasa (warganegara,
konsumen, professional) di bidangnya. Pada saat itu
64 | Penilaian Autentik
istilah tersebut digunakan untuk menyesuaikan
dengan apa yang dilakukan oleh orang dewasa
sebagai reaksi (menantang) penilaian berbasis sekolah
seperti mengisi titik-titik, tes tertulis, pilihan ganda, kuis
jawaban yang singkat. Jadi dikatakan otentik dalam
arti sesungguhnya dan realistis. Seperti halnya
dikatakan oleh Justin Allen bahwa Otentik sebagai
makna pada dasarnya itu sesuatu yang "nyata, benar
atau apa orang mengatakan itu" (ms. 6), ia
menyarankan istilah yang digunakan dalam berbagai
konteks sebagai benar atau nyata. Palm
menyimpulkan bahwa authenticityis yang
didefinisikan sebagai penilaian itu nyata dalam hal
proses dan produk, penilaian kondisi atau konteks
disajikan, dan benar hidup luar sekolah, kurikulum
dan praktek di ruang kelas atau belajar dan instruksi.
Sedangkan di Indonesia penilaian autentik
(authentic assesment) adalah suatu proses
pengumpulan, pelaporan dan penggunaan informasi
tentang hasil belajar siswa dengan menerapkan
prinsip-prinsip penilaian, pelaksanaan berkelanjutan,
bukti-bukti autentik, akurat, dan konsisten sebagai
akuntabilitas publik (Pusat Kurikulum, 2009).
Sebagaimana ditegaskan oleh (Nurhadi, 2004: 172)
yang menyatakan bahwa penilaian autentik adalah
proses pengumpulan informasi oleh guru tentang
perkembangan dan pencapaian pembelajaran yang
dilakukan oleh peserta didik melalui berbagai teknik
yang mampu mengungkapkan, membuktikan, atau
menunjukkan secara tepat bahwa tujuan
Penilaian Autentik | 65
pembelajaran telah benar-benar dikuasai dan
dicapai.
Menurut John Mueller (2006) penilaian
autentik merupakan suatu bentuk penilaian yang
para siswanya diminta untuk menampilkan tugas
pada situasi yang sesungguhnya yang
mendemonstrasikan penerapan keterampilan dan
pengetahuan esensial yang bermakna. Pendapat
serupa dikemukakan oleh Richard J. Stiggins (1987),
bahkan Stiggins menekankan keterampilan dan
kompetensi spesifik untuk menerapkan keterampilan
dan pengetahuan yang dikuasai. Hal itu terungkap
dalam cuplikan kalimat berikut ini: “ performance
assessment call upon the examinee to demonstrate
specific skills and competencies, that is, to apply the
skills and knowledge they have mastered” (Stiggins,
1987:34)
Model penilaian autentik (authentic
assessment) pada saat ini banyak dibicarakan di dunia
pendidikan karena model penilaian otentik
direkomendasikan, atau bahkan harus ditekankan
penggunaannya dalam kegiatan penilaian hasil
belajar pada kegiatan pembelajaran. Hakikat
penilaian pendidikan menurut konsep authentic
assesment adalah proses pengumpulan berbagai data
yang bisa memberikan gambaran perkembangan
belajar siswa. Data yang dikumpulkan melalui
kegiatan penilaian (assesment) bukanlah untuk
mencari informasi tentang belajar siswa. Pembelajaran
yang benar seharusnya ditekankan pada upaya
66 | Penilaian Autentik
membantu siswa agar mampu mempelajari (learning
how to learn), bukan ditekankan pada diperolehnya
sebanyak mungkin informasi di akhir periode
pembelajaran (Nurhadi, 2004: 168).
Penilaian autentik mementingkan penilaian
proses dan hasil sekaligus. Dengan demikian, seluruh
tampilan siswa dalam rangkaian kegiatan
pembelajaran dapat dinilai secara objektif, apa
adanya, dan tidak semata-mata hanya berdasarkan
pada hasil akhir (produk). Dalam penilaian
kemampuan bersastra misalnya, pebelajar mampu
menganalisis karakter tokoh dalam sebuah fiksi,
mempertanggungjawabkan kinerjanya tersebut
dengan argument yang tepat, atau membuat resensi
teks kesastraan. Masalah kinerja, performansi,
demonstrasi yang dimaksudkan tentu saja dalam
pengertian yang sesuai dengan karakteristik masing-
masing mata pelajaran. Tiap mata pelajaran tentu
memiliki kriteria kinerja yang belum tentu sama
dengan mata-mata pelajaran yang lain.
Kinerja hasil pembelajaran bahasa tentu tidak
sama dengan hasil pembelajaran matematika, teknik
otomotif, tata busana, seni musik, dan lain-lain.
Namun, pada prinsipnya semua mata pelajaran itu
haruslah melaksanakan penilaian dan salah satunya
dengan model penilaian autentik. Meskipun tiap mata
pelajaran berbeda karakteristik, baik yang termasuk
kategori ilmu-ilmu eksakta maupun sosial dan
humaniora, kesemuanya tampaknya dapat
menerapkan model penilaian autentik khususnya
yang berupa portofolio. Penilaian otentik merupakan
Penilaian Autentik | 67
proses evaluasi yang melibatkan berbagai bentuk
kinerja pengukuran refleksi siswa belajar, prestasi,
motivasi, dan sikap instructionally-relevan kegiatan.
Contohnya yaitu penilaian kinerja, portofolio, dan
penilaian diri. Penilaian kinerja terdiri dari segala
bentuk penilaian di mana siswa konstruksi respon
secara lisan atau tertulis.
Penilaian Portofolio adalah sistematis koleksi
siswa bekerja bahwa dianalisis untuk menunjukkan
kemajuan seiring waktu berkaitan dengan tujuan
pengajaran. Penilaian menawarkan kesempatan bagi
siswa untuk belajar mengatur diri, dan tanggung
jawab menilai kemajuan nya sendiri. Penilaian yang
terintegrasi mengacu pada evaluasi beberapa
keterampilan atau penilaian bahasa dan konten
dalam aktivitas yang sama.
Berdasarkan penjelasan diatas, maka dapat
disimpulkan bahwa yang dimaksud dengan penilaian
otentik adalah kegiatan yang dilakukan oleh guru
untuk mengumpulkan informasi tentang
perkembangan dan pencapaian pembelajaran yang
dilakukan oleh peserta didik melalui berbagai teknik
yang mampu mengungkapkan, membuktikan, atau
menunjukkan secara tepat bahwa tujuan
pembelajaran telah benar-benar dikuasai dan dicapai
dengan menerapkan prinsip-prinsip penilaian,
pelaksanaan berkelanjutan, bukti-bukti autentik,
akurat, dan konsisten sebagai akuntabilitas publik.
68 | Penilaian Autentik
B. Karakteristik Penilaian Autentik
Penilaian autentik adalah kegiatan menilai
peserta didik yang menekankan pada apa yang
seharusnya dinilai, baik proses maupun hasil dengan
berbagai instrumen penilaian yang disesuaikan
dengan tuntutan kompetensi yang ada di Standar
Kompetensi (SK) atau Kompetensi Inti (KI) dan
Kompetensi Dasar (KD) (Kunandar,2013:35-36). Dalam
pelaksanaannya di dunia pendidikan penilaian
autentik memiliki beberapa karakteristik. Adapun
beberapa karakteristik penilaian autentik, adalah
sebagai berikut:
1. Bisa digunakan untuk formatif maupun
sumatif, pencapaian kompetensi terhadap
satu kompetensi dasar (formatif) maupun
pencapaian terhadap standar kompetensi
atau kompetensi inti dalam satu semester
(sumatif)
2. Mengukur keterampilan dan performansi,
bukan mengingat fakta, menekankan
pencapaian kompetensi keterampilan (skill)
dan kinerja (performance), bukan kompetensi
yang sifatnya hafalan dan ingatan.
3. Berkesinambungan dan terintegrasi,
merupakan satu kesatuan secara utuh sebagai
alat untuk mengumpulkan informasi
terhadap pencapaian kompetensi siswa.
4. Dapat digunakan sebagai feed back, dapat
digunakan sebagai umpan balik terhadap
Penilaian Autentik | 69
pencapaian kompetensi siswa secara
komprehensif.
Sedangkan menurut Santoso beberapa
karakteristik penilaian autentik adalah sebagai
berikut :
a. Penilaian merupakan bagian dari proses
pembelajaran.
b. Penilaian mencerminkan hasil proses belajar
pada kehidupan nyata.
c. Menggunakan bermacam-macam instrumen,
pengukuran, dan metode yang sesuai dengan
karakteristik dan esensi pengalaman belajar.
d. Penilaian harus bersifat komprehensif dan
holistik yang mencakup semua aspek dari tujuan
pembelajaran (Santoso, 2004).
Adapun Nurhadi juga mengemukakan
beberapa karakteristik authentic assesment, yakni:
a. Melibatkan pengalaman nyata (involves real-
world experience)
b. Dilaksanakan selama dan sesudah proses
pembelajaran berlangsung
c. Mencakup penilaian pribadi (self assesment) dan
refleksi
d. Aspek yang diukur keterampilan dan
performansi, bukan mengingat fakta
e. Berkesinambungan
f. Terintegrasi
g. Dapat digunakan sebagai umpan balik
h. Kriteria keberhasilan dan kegagalan diketahui
siswa dengan jelas (Nurhadi, 2004: 173).
70 | Penilaian Autentik
Menurut Wiggins (1989), penilaian autentik
memiliki beberapa karakteristik umum.
Pertama, mereka dirancang untuk benar-
benar mewakili kinerja di lapangan. Siswa benar-
benar menulis - untuk khalayak yang sebenarnya -
daripada melakukan tes ejaan atau menjawab
pertanyaan tentang menulis. Mereka melakukan
eksperimen sains, daripada menghafal fakta terputus
tentang sains. Takss dikontekstualkan, tantangan
intelektual kompleks yang melibatkan penelitian
siswa sendiri atau penggunaan pengetahuan dalam
tugas "tidak terstruktur" yang memerlukan
pengembangan dan penggunaan keterampilan
meta-kognitif. Mereka juga memungkinkan ruang
yang sesuai untuk gaya belajar siswa, bakat, dan
minat untuk melayani sebagai sumber
pengembangan kompetensi dan untuk identifikasi
kekuatan (mungkin sebelumnya tersembunyi).
Kedua, kriteria yang digunakan dalam
penilaian berusaha untuk mengevaluasi kinerja
"penting" dibandingkan dengan standar kinerja yang
diartikulasikan dengan baik. Ini diungkapkan secara
terbuka kepada siswa dan orang lain di komunitas
belajar, bukan dirahasiakan dalam tradisi ujian
berdasarkan fakta yang tetap "aman".
Kriteria yang disarankan oleh tugas semacam
itu merupakan standar kinerja karena didasarkan
pada tujuan keseluruhan sekolah dan eksplisit, dan
beragam, mewakili berbagai aspek tugas, dan bukan
Penilaian Autentik | 71
dikurangi menjadi dimensi tunggal atau kelas. Karena
kriteria berorientasi pada kinerja, mereka
membimbing pengajaran, pembelajaran, dan evaluasi
dengan cara yang menyinari tujuan dan proses
pembelajaran, menempatkan guru dalam peran
pelatih dan siswa dalam peran pemain, dan juga
evaluator diri.
Seperti yang disarankan di atas, penilaian diri
memainkan peran penting dalam tugas asli. Tujuan
utama penilaian autentik adalah untuk membantu
siswa mengembangkan kapasitas untuk mengevaluasi
pekerjaan mereka sendiri terhadap standar publik,
untuk merevisi, memodifikasi, dan mengalihkan
energinya, mengambil inisiatif untuk menilai
kemajuan mereka sendiri. Ini adalah aspek utama
dari self-directed work dan peningkatan self -
motivated yang dibutuhkan semua manusia dalam
situasi dunia nyata.
Akhirnya, para siswa sering diharapkan
mempresentasikan karyanya secara terbuka dan lisan.
Ini memperdalam pembelajaran mereka dengan
mengharuskan mereka merenungkan apa yang
mereka ketahui dan membingkainya dengan cara
yang orang lain juga dapat mengerti. Ini juga
memastikan penguasaan ide, konsep, atau topik
mereka terlihat asli.
72 | Penilaian Autentik
C. Tujuan dan Prinsip-Prinsip Penilaian
Autentik
Penilaian autentik merupakan “a form of
assessment in which students are asked to perform real-
world tasks that demonstrate meaningful application
of essential knowledge and skills”. Jadi, penilaian
autentik merupakan suatu bentuk tugas yang
menghendaki pebelajar untuk menunjukkan kinerja
di dunia nyata secara bermakna yang merupakan
penerapan esensi pengetahuan dan keterampilan
(Mueller, 2008).
Tujuan penilaian autentik itu sendiri adalah
untuk:
1) menilai kemampuan individu melalui tugas
tertentu,
2) menentukan kebutuhan pembelajaran,
3) membantu dan mendorong siswa,
4) membantu dan mendorong guru untuk
mengajar yang lebih baik,
5) menentukan strategi pembelajaran,
6) akuntabilitas lembaga, dan
7) meningkatkan kualitas pendidikan (Santoso,
2004).
Penilaian autentik menjelaskan beberapa
bentuk penilaian yang mencerminkan siswa belajar,
prestasi, motivasi, dan sikap pada pembelajaran
kegiatan kelas yang relevan. Penilaian autentik pada
umumnya menyelesaikan tujuan berikut :
- Menekankan apa yang siswa tahu, daripada apa
yang mereka tidak tahu
Penilaian Autentik | 73
- Memerlukan siswa untuk mengembangkan
tanggapan daripada memilih mereka dari pilihan
yang telah ditentukan
- Langsung mengevaluasi proyek holistik
- Menggunakan contoh karya siswa
mengumpulkan selama jangka waktu
- Berasal dari jelas kriteria yang dibuat dikenal
untuk siswa dan orang tua
- Elicits berpikir tingkat tinggi
- Memungkinkan untuk kemungkinan beberapa
penilaian manusia
- Berhubungan lebih dekat ke kelas belajar
- Teaches siswa untuk mengevaluasi mereka kerja
sendiri
- Considers perbedaan dalam belajar gaya,
menguasai bahasa, budaya dan pendidikan latar
belakang, dan tingkatan kelas
a. Fungsi Pembelajaran
Penilaian autentik sangat penting perannya
dalam peningkatan mutu proses pembelajaran.
Dari proses penilaian dapat diperoleh informasi
tentang seberapa besar para peserta didik
berhasil mencapai kompetensi dasar yang telah
ditetapkan guru. Dengan demikian, hasil
penilaian memberikan umpan balik bagi guru
tentang seberapa besar ia berhasil
melaksanakan pembelajaran kepada peserta
didik untuk mencapai kompetensi dasar. Dan
guru dapat mengetahui pula kemampuan-
kemamapuan yang belum dikuasai dan sudah
dikuasi oleh peserta didik.
Informasi ini berguna bagi guru untuk
melakukan usaha perbaikan dan peningkatan
pembelajaran. Pada sisi lain, penilaian juga
memberikan fungsi motivasi kepada peserta
Penilaian Autentik | 75
didik, dimana dalam diri peserta didik selalu ada
dorongan untuk memperoleh hasil yang baik
dalam setiap penilaian. Penilaian yang
dilaksanakan secara intensif dan teratur akan
menumbuhkan kebiasaan belajar yang baik.
b. Fungsi Administrasi
Penilaian autentik sangat diperlukan untuk
keputusan yang bersifat administratif. Secara
berkala kantor-kantor wilayah Depdiknas
biasanya menetukan kualifikasi setiap sekolah,
apakah termasuk baik, sedang atau kurang. Hal
ini diperlukan dalam rangka program
pembinaan dan pengembangan sekolah. Salah
satu informasi yang diperlukan adalah hasil
prestasi belajar para peserta didik. Bahkan dari
penilaian autentik dapat pula diketahui sejauh
mana kurikulum dilaksanakan di suatu sekolah.
Untuk sekolah yang memiliki banyak calon
peserta didik tetapi tidak banyak kursi yang
tersedia maka bisa memberikan tes masuk
sebagai seleksinya. Dari tes seleksi ini juga bisa
mempengaruhi akreditasi suatu sekolah. Setiap
akhir semester pihak sekolah membagikan buku
rapor. Buku ini sebagai laporan sekolah kepada
masing-masing orang tua peserta didik tentang
prestasi belajar anaknya selama satu semester
yang baru saja dilampauinya. Nilai-nilai rapor
hendaknya berdasarkan penilaian autentik
yang dilakukan secara cermat agar
memberikan informasi secara berguna bagi para
76 | Penilaian Autentik
orang tua peserta didik, sebagai bahan
bimbingan dan pengarahan kepada anak-
anaknya.
Penilaian autentik juga berfungsi sebagai
penentuan kenaikan kelas dan tindak lanjut ke
studi yang lebih tinggi lagi. Sehingga penilaian
autentik harus dilandasi pada informasi yang
tepat tentang kemampuan peserta didik yang
sesungguhnya.
c. Fungsi Bimbingan
Di samping sekolah memberikan
serangkaian pengetahuan, keterampilan dan
sikap tertentu kepada peserta didik, sekolah pun
perlu informasi tentang bakat-bakat khusus
yang dimiliki peserta didik. Informasi bakat ini
dapat memberikan saran kepada orang tua
tentang bidang pelajaran atau bidang minat
pekerjaan yang lebih sesuai dengan bakat
peserta didik. Keserasian antara bakat dan jenis
pekerjaan merupakan salah satu unsur penting
dari keberhasilan seseorang dalam
kehidupannya.
Informasi tentang bakat khusus setiap
peserta didik dapat diperoleh dari penilaian
khusus. Untuk melakukan penilaiannya
diperlukan alat-alat ukur khusus dan dengan
cara khusus pula, bisa dengan orang-orang
profesional saat melakukan penilaian. Sekolah
bisa meminta bantuan pada lembaha pengujian
psikologis. Berdasarkan informasi tentang bakat
Penilaian Autentik | 77
peserta didik tersebut, sekolah dapat
memberikan bimbingan dan pengarahan agar
peserta didik dapat mengarahkan bakatnya
secara maksimal, sebagaimana yang
diharapkan lembaga-lembaga pendidikan.
Ada banyak buku dan artikel tentang
penilaian autentik. Banyak penulis telah
mengabdikan hidup mereka untuk penilaian
examing, menawarkan kritik kuat terhadap tes
standar, dan memberikan alternatif yang masuk akal
untuk tes standar yang seragam. Penulis seperti Grant
Wiggins (1993, 19999), Alfie Kohn (2000, 2004), Ray
Horn dan Joe Kincheloe (2001), Mark Goldberg (2005),
dan Susan Ohanian (1999) telah menerbitkan banyak
buku dan artikel tentang topik ini. Wiggins (1998)
menyarankan standar penilaian autentik berikut ini :
1. Ini realistis. Tugas penilaian harus mengikuti
dengan cermat cara-cara di mana kemampuan
seseorang "diuji" dalam kata sebenarnya.
Misalnya, sebagai mantan penari, kami
mempraktikkan latihan menari seperti plies,
jetes, turns, dan sebagainya di kelas balet. Ini
hanyalah latihan. Tugas penilaian realistis akan
ditemukan dalam kinerja ballet sebenarnya. Di
Ballber Nutcracker Suite, anggaplah pemeran,
saya terpaksa menunjukkan apa yang bisa saya
lakukan. Ini adalah tes yang realistis, ukuran
penilaian yang autentik.
78 | Penilaian Autentik
2. Hal ini membutuhkan penilaian dan inovasi.
Disini siswa harus menggunakan pengetahuan
dan keterampilan untuk memecahkan masalah.
3. Meminta siswa untuk melakukan subjek.
Kembali ke penari balet, penari harus
meletakkan semua langkah bersama dan
berperan dalam balet yang sebenarnya.
4. Ini mereplikasi atau menstimulasi "tes" aktual di
tempat kerja, kehidupan pribadi, dan
kehidupan sipil. Karena setiap siswa berada
pada tahap pertumbuhan dan perkembangan
yang unik pada waktu tertentu, mengapa
penilaian authentiv lebih masuk akal daripada
tes standar yang dibuat dengan mudah dapat
diapresiasi. Untuk satu hal, satu ukuran tidak
sesuai untuk semua siswa. Akal sehat pasti
menunjukkan hal ini.
5. Ini menilai kemampuan dan keterampilan siswa
untuk secara efektif dan efisien menggunakan
repertoar banyak keterampilan untuk
menyelesaikan masalah atau tugas. Dalam hal
mengakses lebih dari sekedar keterampilan
verbal atau matematis, penilaian autentik
bergantung pada semua kecerdasan yang dapat
dikembangkan seseorang.
6. Ini memungkinkan banyak kesempatan untuk
berlatih, berlatih, berkonsultasi, mendapatkan
umpan balik, dan memperbaiki pertunjukan
dan produksi aktual. Dengan demikian kita
memiliki kinerja, umpan balik, revisi kinerja,
umpan balik, kinerja, dan sebagainya. Dengan
Penilaian Autentik | 79
kata lain, siswa harus belajar sesuatu dan
menjadi lebih baik dalam melakukan tugas
yang ada. Dalam banyak hal, ini adalah llike
para seniman yang memiliki kritik konstan
untuk perbaikan. Untuk menggunakan tarian
sebagai contoh sekali lagi, setelah setiap
pertunjukan, direktur bagian pertunjukan
biasanya membaca "catatan kritik" di akhir
setiap pertunjukan. Dengan demikian konsep
yang dibangun ke dalam feedback adalah
asumsi bahwa siswa akan bekerja untuk
meningkatkan performance test selanjutnya.
Penilaian autentik berbeda dari ukuran
standar dan alternatif karena mereka berbasis kinerja
dan mencakup keputusan dan perilaku nyata dalam
profesi dalam sebuah disiplin. Armstrong (1994)
mencirikan penilaian autentik sebagai hal yang sah
karena mereka secara intelektual menantang namun
responsif terhadap siswa dan sekolah. Penilaian
autentik tidak berfokus pada pengetahuan faktual
sebagai tujuan akhir. Sebaliknya, ini berfokus pada
kemampuan untuk menggunakan pengetahuan,
keterampilan, dan proses yang relevan untuk
memecahkan masalah terbuka selama tugas yang
berarti. Faktor kunci lain yang membedakan
penilaian autentik dari yang tradisional adalah bahwa
mereka memberi kesempatan kepada siswa untuk
mengintegrasikan berbagai jenis pembelajaran.
Baik formatif, sumatif, standar, autentik,
alternatif, atau diciptakan oleh guru atau spesialis
80 | Penilaian Autentik
penilaian, tidak ada ukuran penilaian yang dapat
menangkap semua jenis dan tingkat pembelajaran
yang terjadi di kelas seni. Memang, jika setiap jenis
ukuran yang mungkin digunakan pada setiap produk
siswa, pembelajaran yang signifikan akan tetap tidak
terukur karena sifat pembelajaran yang sangat
kompleks yang rutin terjadi.
Membuat penilaian itu autentik juga
melibatkan pemahaman bahwa usaha perlu
difokuskan untuk membantu siswa belajar. Kita harus
jelas tentang apa yang ingin kita ketahui dan dapat
lakukan. Kita juga perlu memastikan bahwa tindakan
yang kita gunakan dan hasil yang kita dapatkan
secara akurat. mencerminkan apa yang benar-benar
diketahui dan dapat dilakukan oleh siswa. Dalam
penilaian autentik, kita harus ingat bahwa tujuan kita
adalah untuk meningkatkan kualitas pembelajaran
siswa dan memanfaatkan kekuatan siswa daripada
kelemahan mereka. Intinya dalam penilaian autentik
benar-benar tentang membantu siswa menetapkan
standar prestasi mereka sendiri yang tinggi.
Karena instrumen yang dirancang untuk
proyek ini terutama dibutuhkan untuk penilaian
kinerja, diputuskan bahwa pendekatan autentik akan
lebih sesuai dengan tujuan penilaian proyek. Penilaian
autentik memerlukan konstruksi item penilaian
alternatif (Armstrong, 1994). Penilaian alternatif
dianggap salah satu alternatif untuk apa yang
tradisional (tes objektif dan esai). Hal ini juga
difokuskan pada kinerja siswa, yang merupakan bukti
nyata dari apa yang dapat diketahui dan dapat
Penilaian Autentik | 81
dilakukan siswa. Penilaian autentik memerlukan
kinerja yang benar, termasuk keputusan hidup nyata,
seperti perilaku estetika, arsitek, sejarawan seni dan
kritikus, seniman seperti seniman rakyat, orang-orang
yang bekerja dalam segala bentuk yang menghadapi
seni dalam kehidupan sehari-hari mereka, dan orang-
orang yang avokasionalnya. kegiatan berhubungan
dengan seni. Pembelajaran autentik dalam seni
menyiratkan aplikasi informasi yang relevan dan
bermanfaat, berlawanan dengan perolehan
pengetahuan faktual untuk kepentingannya sendiri.
Ini juga mengilhami perubahan dalam praktik
kurikuler dalam proses penilaian.
Penilaian autentik bukan tanpa kritiknya.
Sebagian besar kritik terhadap penilaian alternatif
berasal dari keinginan pengembang uji untuk
memiliki populasi yang stabil agar memperoleh data
keras yang dapat ditangani secara statistik dan dapat
dilaporkan sebagai prediktif atau sebagai skor yang
diacu norma. Ini mengharuskan siswa dan materi
pelajaran untuk diukur juga stabil dan mudah
ditebak. Masalahnya adalah, dalam usaha menilai
pertunjukan dalam kehidupan nyata, tujuan konten
biasanya.
84 | Penilaian Autentik
dan memberikan informasi yang berguna
kepada orang tua dan administrator. Apa yang
diukur dinilai di masyarakat, dan bagaimana
asasnya meyakinkan bahwa siswa
memberikan indikator kinerja mereka yang
andal.
Penilaian Autentik | 85
dibentuk, pengalaman, tercermin dalam
kegiatan sehari-hari.
Komponen yang dinilai pada sikap siswa
meliputi emosi, target, dan ketertarikan.
Indikator yang dapat digunakan pada skala
sikap misalnya baik-tidak baik, indikator pada
minat misalnya tertarik-tidak tertarik, dan
sebagainya.
3. Psikomotorik
Penilaian psikomotorik merupakan bentuk
pengukuran kemampuan fisik siswa yang
meliputi otot, kemampuan bergerak,
memanipulasi objek, dan koordinasi otot saraf.
Contohnya pada kemampuan otot kecil
(misalnya: mengetik) atau otot besar
(melompat).
86 | Penilaian Autentik
untuk penilaian kompetensi sikap, pengetahuan,
dan keterampilan adalah sebagai berikut;
Penilaian Autentik | 87
Menurut Permendikbud Nomor 66 Tahun
2013 menjelaskan bahwa pendidikan
melakukan penilaian kompetensi sikap melalui
observasi, penilaian diri, penilaian “teman
sejawat” (peer evaluation) oleh peseta didik,
dan jurnal. Instrumen yang digunakan untuk
observasi, penilaian diri dan Penilaian antar
peserta didik adalah daftar cek atau skala
penilaian (rating scale) yang disertai rubik,
sedangkan pada jurnal berupa catatan
pendidik.
a) Observasi merupakan teknik penilaian yang
dilakukan secara berkesinambungan
dengan menggunakan indra, baik secara
langsung maupun tidak langsung dengan
menggunakan pedoman observasi yang
berisi sejumlah indikator perilaku yang
diamati.
b) Penilaian diri merupakan teknik penilai
dengan cara meminta peserta didik untuk
mengemukakan kelebihan dan
kekurangan dirinya dalam konteks
pencapaian kompetensi. Instrumen yang
digunakan berupa lembar penilaian diri.
c) Penilaian antar peserta didik merupakan
teknik penilaian dengan cara meminta
peserta didik untuk mengemukakan
kelebihan dan kekurangan dirinya dalam
konteks pencapaian kompetensi. Instrumen
88 | Penilaian Autentik
yang digunakan berupa lembaran
penilaian antar peserta didik.
d) Jurnal merupakan catatan peserta didik di
dalam dan di luar kelas yang berisi informasi
hasil pengamatan tentang kekuatan dan
kelemahan peserta didik yang berkaitan
dengan sikap dan prilaku.
Penilaian Autentik | 89
berupa daftar pertanyaan dan instrumen
penugasan berupa pekerjaan rumah dan/atau
proyek yang dikerjakan secara individu atau
kelompok sesuai dengan karakteristik tugas.
90 | Penilaian Autentik
Berdasarkan penjabaran di atas, instrumen
penilaian harus memenuhi persyaratan:
mempresentasikan kompetensi yang ada dinilai,
susunan penilaian memenuhi persyaratan teknis
sesuai dengan bentuk instrumen yang digunakan,
dan penggunaan bahasa yang baik dan benar
serta komunikatif sesuai dengan perkembangan
siswa.
Prinsip yang paling penting dari penilaian
autentik adalah dalam pembelajaran tidak hanya
menilai apa saja yang sudah diketahui oleh siswa,
tetapi juga menilai apa yang dapat dilakukan oleh
siswa setelah pembelajaran selesai. Sehingga
kualitas hasil belajar dan kerja siswa dalam
menyelesaikan tugas dapat terukur. Maka dari itu
dapat ditarik kesimpulan dalam melakukan
penilaian autentik ada tiga hal yang harus
diperhatikan, yakni:
1. Autentik dari instrumen yang digunakan,
menggunakan instrumen yang bervariasi yang
disesuaikan dengan karakteristik atau tuntutan
kompetensi yang ada dikurikulum.
2. Autentik dari aspek yang diukur, menilai
aspek-aspek hasil belajar secara komprehensif
meliputi kompetensi sikap, keterampilan dan
pengetahuan.
3. Autentik dari aspek kondisi siswa, menilai input
(kondisi awal siswa), proses (kinerja dan
aktivitas siswa dalam proses belajar mengajar),
dan output (hasil pencapaian kompetensi, baik
Penilaian Autentik | 91
sikap, keterampilan maupun pengetahuan
siswa setelah mengikuti proses belajar
mengajar).
Melalui kurikulum 2013 penilaian autentik
menjadi penekanan dalam melakukan penilaian
hasil belajar siswa yang memperhatikan seluruh
minat, potensi dan prestasi siswa secara
menyeluruh. Penilaian juga dilakukan secara
sistematis dan berkesinambungan agar dapat
menggambarkan kemampuan para siswa yang
dievaluasi. Sangat penting untuk melibatkan siswa
dalam penilaian, sehingga siswa secara sadar dapat
mengenali perkembangan pencapaian hasil
pembelajaran mereka.
92 | Penilaian Autentik
adalah rutinitas harian yang terus berlanjut dan
keadaan khas anak. Contoh lingkungan alam adalah
anak-anak yang bermain di tempat prasekolah
mereka sendiri, di rumah saat mandi, di tempat
penitipan anak, di supermarket, dan di gereja. Ini
berbeda dengan dekontekstualisasi, pengaturan yang
dibuat-buat yang menjadi ciri praktik psikometrik
konvensional. Lingkungan pengujian konvensional
biasanya menggunakan klinik atau pengaturan
"laboratorium" seperti ruang pengujian sekolah atau
ruang pemeriksaan rumah sakit.
Seperti yang ditunjukkan, pengujian
konvensional berfokus pada konten item standar
("apa") dan hanya memiliki sedikit penggunaan
instruksional. Sebaliknya, item untuk penilaian
autentik adalah perilaku nyata yang memiliki
kepentingan fungsional bagi anak-anak dan
kemajuannya (misalnya, melintasi ruangan,
mengkomunikasikan keinginan dan kebutuhan,
memilih apel dan bukan buah pir, dan memikirkan
bagaimana mainan bekerja). Perhatikan bahwa
semua ini adalah kompetensi yang berharga, dapat
diajar, dan dihargai secara sosial. Validasi lapangan
dan norma instrumen penilaian untuk individu
penyandang cacat harus menekankan standarisasi
fungsi daripada bentuk perilaku yang diteliti.
Pengujian konvensional mencatat respons
sempit anak terhadap objek dan prosedur standar dan
tidak mengizinkan akomodasi untuk kebutuhan
khusus ("bagaimana"). Penilaian autentik bergantung
pada pengamatan alami terhadap respons anak
Penilaian Autentik | 93
terhadap rutinitas sehari-hari; Dalam konteks ini, anak
dapat menunjukkan kompetensi dengan cara apa
pun yang mungkin. Anak yang buta bisa
menunjukkan keabadian objek dengan menjelajahi
lingkungan dengan tekun dalam mencari mainan
tersembunyi; asli penilaian tidak mengharuskan anak
untuk hanya menunjukkan respons sempit untuk
menemukan dan melihat mainan tersembunyi di
bawah cangkir standar. Kandungan konten
mengundang pengajaran karena item tersebut
bersifat precursive atau merupakan bagian dari
kurikulum. Dengan pendekatan fungsional, lapangan
bermain untuk mendokumentasikan kemampuan
menjadi level dan noninferensial. Item psikometri
konvensional tidak membangun blok untuk
kompetensi masa depan, dan prosedur psikometrik
melarang "pengajaran untuk tes," dan karenanya
tidak peka terhadap kemajuan dan hasil fungsional.
Hanya profesional tertentu, seringkali psikolog,
diizinkan melakukan tes psikometri tradisional
("siapa"). Para profesional ini terutama bukan
anggota program anak yang tidak terpisahkan dan
kemungkinan besar adalah orang asing bagi anak-
anak mereka. Dalam kebanyakan kasus, profesional
asing ini melakukan tes sebagai individu dan bukan
sebagai anggota tim sejati. Di sisi lain, penilaian
autentik bergantung pada pengamatan orang
dewasa yang familiar dalam kehidupan anak untuk
menyediakan data konvergen tentang fungsi
kehidupan nyata. Susunan anggota keluarga,
94 | Penilaian Autentik
pengasuh anak, guru, dan interdisipliner profesional
membentuk tim yang mengenal anak dengan baik
dan bekerja untuk membantu anak tersebut.
Dibutuhkan lebih banyak waktu, usaha,
keterlibatan, pelatihan guru, dan pengembangan
profesional guru untuk menerapkan teknik penilaian
autentik. Sejak tahun 1980 pendidik telah berteriak
untuk mengetahui lebih banyak tentang penilaian
autentik di setiap negara bagian di negara ini.
Mengapa? Sederhananya, karena itu masuk akal.
Apakah kita ingin anak-anak kita dinilai dan dinilai
dengan tes satu pukulan yang memberikan skor
sederhana, atau lebih baik kita menilai siswa dinilai
dan dinilai berdasarkan tugas kinerja yang tidak
hanya menunjukkan apa yang mereka langgeng tapi
juga apa yang dapat mereka lakukan? Alasan untuk
memilih penilaian autentik adalah solid dan jelas:
a. Penilaian autentik secara keseluruhan adalah
adil. Tidak ada satu kelompok ras atau etnis
yang dihukum dengan skor satu tembakan;
b. Penilaian autentik menceritakan banyak hal
tentang bagaimana siswa menghubungkan
pengetahuan konten ke masalah tertentu di
dunia sudent;
c. Penilaian autentik secara keseluruhan
memberikan umpan balik mengenai kemajuan
siswa;
d. Penilaian autentik menunjukkan bagaimana
seorang siswa mengkontruksi suatu produk atau
kinerja sehingga pertumbuhan siswa dapat
dilihat;
Penilaian Autentik | 95
e. Penilaian autentik secara keseluruhan
memberikan umpan balik yang
berkesinambungan, memungkinkan siswa untuk
menyesuaikan dan meningkatkan kinerja;
f. Penilaian autentik memberi siswa suatu
kepentingan nyata dan partisipatif dalam proses
pembelajaran;
g. Penilaian autentik menghilangkan penekanan
pada menghafal fakta dan mengulanginya; dan
h. Penilaian autentik memungkinkan tugas kinerja
untuk evaluasi.
96 | Penilaian Autentik
bersifat tidak langsung. Tetapi, penilaian autentik
menuntut pembelajar untuk berunjuk kerja dalam
situasi yang konkret dan sekaligus bermakna yang
secara otomatis juga mencerminkan penguasaan dan
keterampilan keilmuannnya. Unjuk kerja tersebut
bersifat langsung, langsung terkait dengan konteks
situasi dunia nyata dan tampilannya juga dapat
diamati langsung. Hal itu lebih mencerminkan tingkat
capaian pada bidang yang dipelajari. Misalnya, dalam
belajar berbicara bahasa target, pembelajar tidak
hanya berlatih mengucapkan lafal, memilih kata, dan
menyusun kalimat, melainkan juga
mempratikkannya dalam situasi konkret dan dengan
topic aktual-realistik sehingga menjadi lebih
bermakna.
Kedua, penilaian autentik memberikan
kesempatan pembelajar untuk mengkonstruksikan
hasil belajarnya. Penilaian haruslah tidak sekadar
meminta pembelajar mengulang apa yang telah
dipelajari karena hal demikian hanyalah melatih
mereka menghafal dan mengingat saja yang kurang
bermakna. Dengan penilaian autentik pembelajar
diminta untuk mengkonstruksikan apa yang telah
diperoleh ketika mereka dihadapkan pada situasi
konkret. Dengan cara ini pembelajar akan menyeleksi
dan menyusun jawaban berdasarkan pengetahuan
yang dimiliki dan analisis situasi yang dilakukan agar
jawabannya relevan dan bermakna.
Ketiga, penilaian autentik memungkinkan
terintegrasikannya kegiatan pengajaran, belajar, dan
penilaian menjadi satu paket kegiatan yang terpadu.
Penilaian Autentik | 97
Dalam pembelajaran tradisional, juga model penilaian
tradisional, antara kegiatan pengajaran dan penilaian
merupakan sesuatu yang terpisah, atau sengaja
dipisahkan. Namun, tidak demikian halnya dengan
model penilaian autentik. Ketiga hal tersebut, yaitu
aktivitas guru membelajarkan, siswa belajar, dan guru
menilai capaian hasil belajar pembelajar, merupakan
satu rangkaian yang memang sengaja didesain
demikian. Ketika guru membelajarkan suatu topik
dan pembelajar aktif mempelajari, penilaiannya
bukan semata berupa tagihan terhadap penguasaan
topik itu, melainkan pembelajar juga diminta untuk
berunjuk kerja mempraktikkannya dalam sebuah
situasi konkret yang sengaja diciptakan.
Keempat, penilaian autentik memberi
kesempatan pembelajar untuk menampilkan hasil
belajarnya, unjuk kerjanya, dengan cara yang
dianggap paling baik. Singkatnya, model ini
memungkinkan pembelajar memilih sendiri cara,
bentuk, atau tampilan yang menurutnya paling
efektif. Hal itu berbeda dengan penilaian tradisional,
misalnya bentuk tes pilihan ganda, yang hanya
memberi satu cara untuk menjawab dan tidak
menawarkan kemungkinan lain yang dapat dipilih.
Jawaban pembelajar dengan model ini memang
seragam, dan itu memudahkan kita mengolahnya,
tetapi itu menutup kreativitas pembelajar untuk
mengkreasikan jawaban atau kinerjanya. Padahal,
unsur kreativitas atau kemampuan berkreasi
98 | Penilaian Autentik
merupakan hal esensial yang harus diusahakan
ketercapaiannya dalam tujuan pembelajaran.
Penilaian Autentik | 99
BAB V
PERENCANAAN PENILAIAN
A. Pengertian
Menurut The Quality Assurance Division (2012)
perencanaan penilaian adalah dokumen yang
memberikan informasi tentang bagaimana penilaian
akan tersusun, apa yang dilibatkan dan kriteria
penilaian yang akan dinilai oleh kandidat. Sharon Tan
(2012: 27) Perencanan penilaian adalah dokumen
yang memberikan informasi tentang bagaimana
penilaian akan terstruktur, apa yang terlibat, dan
kriteria penilaian yang calon akan dinilai terhadap
Anda. Rencana penilaian dikembangkan dengan: 1)
Petunjuk yang jelas untuk persiapan untuk penilaian
dan dokumentasi penilaian misalnya mengatur
peralatan, pelaksanaan metode tertentu, waktu
untuk tanggapan, proses banding, daftar-
pembanding; 2) Penilaian petunjuk untuk panduan
penilai; 3) Alat penilaian disediakan misalnya peran
bermain script, jawaban untuk tes tertulis; 4) Catatan
penilaian dengan jelas ditunjukkan kriteria penilaian;
5) Sumber daya/referensi (Perpustakaan, web); 6)
Daftar istilah yang disediakan; dan 7) Kontrol versi.
Marchese (1978: 3-8) Rencana penilaian
merupakan dokumen yang menguraikan data
empiris apa yang akan dikumpulkan, oleh siapa yang
melaksanakan, timing penilaian untuk menilai setiap
pembuatan pemetaan KD
Perencanaan pronta dan dari KI-3 dan
prosem KD-4
perencanaan
bentuk dan penetapan KKM
teknik penilaian
Skor komponen =
KKM per KD =
KKM per KD =
A. Pengertian
Dalam bidang pendidikan, yang digunakan
sebagai ukuran untuk mengetahui sejauh mana anak
didik telah menguasai materi pelajaran yang sudah
diajarkan dan dipelajari adalah hasil belajar atau prestasi
belajar (Masrun dan Martaniah, 1973). Menurut Zainul dan
Nasoetion ( 1997: 28-31) tes hasil belajar adalah salah satu
alat ukur yang paling banyak digunakan untuk
menemukan keberhasilan seseorang dalam suatu proses
belajar mengajar atau untuk menentukan keberhasilan
suatu program pendidikan. Sebagaimana dinyatakan oleh
Gregory (2000: 35), bahwa tes prestasi belajar mengukur
tingkat pencapaian atau kesuksesan seseorang dalam
mempelajari suatu materi pelajaran tertentu.
Di dalam webster’s New Internasional Dictionary
diungkapkan bahwa prestasi adalah standart test untuk
mengukur kecakapan atau pengetahuan bagi seseorang
didalam satu atau lebih dari garis-garis pekerjaan atau
belajar. (Webster’s New Internasional Dictionary, 1951 : 20.).
Surya (2004:57) juga mengemukakan bahwa prestasi
belajar adalah seluruh kecakapan hasil yang dicapai
(achivement) yang diperoleh melalui proses belajar
berdasarkan test belajar. Hal ini juga ditegaskan oleh
Anastasi (1990) bahwa tes prestasi belajar merupakan tes
2) Reliabilitas
3) Daya Pembeda
Daya pembeda soal adalah kemampuan suatu butir
soal untuk membedakan antara siswa yang telah
menguasai materi dan siswa yang belum menguasai
materi yang ditanyakan. Sebagaiman dinyatakan oleh
Anas Sidijono (2003) daya pembeda item merupakan
kemampuan suatu butir item tes hasil belajar untuk dapat
membedakan antara testee yang berkemampuan tinggi
(pandai) dengan testee yang kemampuannya rendah
(bodoh) demikian rupa, sehingga sebagian besar testee
yang memiliki kemampuan tinggi untuk menjawab butir
item tersebut lebih banyak yang menjawab betul,
sementara testee yang kemampuannya rendah untuk
menjawab butir item tersebut, sebagian besar tidak dapat
menjawab item dengan betul.
Manfaat daya pembeda butir soal antara lain: (a)
Untuk meningkatkan kualitas butir soal berdasarkan data
empiriknya. Berdasarkan indeks daya pembeda, setiap
butir soal dapat diketahui apakah butir soal baik, direvisi
atau ditolak. (b) Untuk mengetahui seberapa jauh setiap
butir soal dapat membedakan kemampuan siswa yaitu
siswa yang telah memahami atau belum memahami
materi yang diajarkan oleh guru. Apabila suatu butir soal
tidak dapat membedakan kedua kemampuan siswa
maka terdapat kemungkinan seperti berikut:
1. Kunci jawaban butir soal tidak tepat.
4) Tingkat Kesukaran
Tingkat kesukaran Item adalah pernyataan tentang
seberapa mudah dan seberapa sulit sebuah butir soal bagi
siswa yang dikenai pengukuran (Burhan,1987:126). Tingkat
kesukaran soal merupakan peluang untuk menjawab
benar soal pada tingkat kemampuan tertentu yang
biasanya dinyatakan dalam bentuk indeks. Tingkat
kesukaran butir soal tidaklah menunjukkan bahwa butir
soal itu baik atau tidak. Tingkat kesukaran butir hanya
menunjukkan bahwa butir soal itu sukar atau mudah
untuk kelompok peserta tes tertentu. Butir soal hasil
belajar yang terlalu sukar atau terlalu mudah tidak
banyak memberi informasi tentang butir soal atau peserta
tes (Asmawi Zainul, dkk : 1997).
Indeks kesukaran umumnya dinyatakan dalam
bentuk proporsi yang besarnya antar 0,00 – 1,00. Semakin
besar indeks kesukaran berarti semakin mudah soal
∑𝐵
pi = 𝑁
dengan :
p = proporsi menjawab benar pada butir soal
tertentu.
B = banyaknya peserta tes yang menjawab benar.
N = jumlah peserta tes yang menjawab.
3. Tingkat Valuing.
Valuing berhubungan dengan
pengungkapan perasaan, keyakinan, atau
anggapan bahwa suatu gagasan, benda, atau
cara berpikir tertentu mempunyai nilai. Unsur yang
penting pada jenjang ini adalah seseorang telah
termotivasi bukan karena keinginan atau
kepatuhan tetapi lebih disebabkan karena
keterkaitannya dengan nilai-nilai tertentu. Dalam
tujuan pembelajaran kata kerja operasional yang
dapat digunakan adalah meyakinkan, bertindak,
mengemukakan argumentasi.
4. Tingkat Organization.
Pada tingkat organization, nilai satu
dengan nilai lain dikaitkan, konflik antar nilai
diselesaikan, dan mulai membangun sistem nilai
internal yang konsisten. Hasil pembelajaran pada
tingkat ini berupa konseptualisasi nilai atau
organisasi sistem nilai. Kata kerja operasional yang
dapat digunakan adalah memodifikasi,
membandingkan, memutuskan.
5. Tingkat Characterization.
Tingkat ranah afektif tertinggi adalah
characterization nilai. Pada tingkat ini peserta
didik memiliki system nilai yang mengendalikan
perilaku sampai pada waktu tertentu hingga
B. KARAKTERISTIK
Zaenal Arifin. (2009) menjelaskan ada dua hal
yang berhubungan dengan penilaian afektif yang harus
dinilai. Pertama, kompetensi afektif yang ingin dicapai
dalam pembelajaran meliputi tingkatan pemberian
respons, apresiasi, penilaian dan internalisasi. Kedua, sikap
dan minat peserta didik terhadap mata pelajaran dan
proses pembelajaran. Dalam proses pembelajaran
terdapat empat tipe karakteristik afektif yang penting
yaitu sikap, minat, konsep diri dan nilai.
C. KONSEP
Afektif berhubungan dengan emosi seperti
perasaan, nilai, apresiasi, motivasi dan sikap.
Terdapat lima kategori utama afektif dari yang
paling sederhana sampai kompleks yaitu:
a. Receiving (penerimaan) adalah kesediaan
untuk menyadari adanya suatu fenomena di
lingkungannya. Contohnya mendengarkan
orang lain dengan seksama, mendengarkan
dan mengingat nama seseorang yang baru
D. TUJUAN
Suharsimi Arikunto (2003) menjelaskan
pengukuran ranah afektif tidak dapat dilakukan
setiap saat (dalam arti pengukuran formal) karena
perubahan tingkah laku siswa tidak dapat berubah
sewaktu-waktu. Pengubahan sikap seseorang
memerlukan waktu yang relatif lama. Demikian
juga pengembangan minat dan penghargaan serta
E. LANGKAH-LANGKAH PENGEMBANGAN
INSTRUMEN AFEKTIF
Menurut Geble dan Wof (Khuriyah, 2003)
dijelaskan bahwa langkah-langkah
pengembangan instrumen ranah afektif yaitu :
1. Tahap pengembangan instruen evaluasi
afektif yang terdiri dari beberapa kegiatan
yaitu :
a. Merumuskan definisi konseptual
b. Mengembangkan definisi operasional
c. Menyeleksi metode penskalan
d. Selektif format respon
2. Tahap Uji Coba
3. Tahap revisi instrumen
4. Tahap pengumpulan data
5. Tahap analisis validitas dan reliabilitas
6. Tahap laporan
Sedangkan menurut Mardapi (2004:104) langkah-
langkah yang harus diikuti dalam mengembangkan
instrumen afektif, yaitu:
1. Menentukan Spesifikasi Instrumen
Spesifikasi instrumen terdiri dari tujuan dan
kisi-kisi instrumen. Dalam bidang pendidikan,
ditinjau dari tujuannya ada lima macam instrumen
pengukuran ranah afektif, yaitu:
1. Instrumen sikap.
2. Instrumen minat.
d. Praktik
Setelah instruktur yakin bahwa peserta
pelatihan telah dapat melakukan tugas
pekerjaan dengan cara kerja yang benar, maka
selanjutnya instruktur memberikan tugas kepada
peserta pelatihan untuk melakukan tugas
pekerjaannya. Dalam hal ini, peserta pelatihan
mengulangi aktivitas kerja yang baru saja
dipelajarinya sampai keterampilan tersebut
dapat dikuasai sepenuhnya. Instruktur
melakukan pengamatan untuk melakukan
penilaian baik terhadap aktivitas atau cara kerja
peserta pelatihan maupun hasil-hasil pekerjaan
atau produk yang dihasilkannya.
Metode empat tahap ini mempunyai
keterbatasan, karena hanya cocok untuk
pembelajaran keterampilan yang bertujuan
membuat barang (fabrikasi), sedangkan
pembelajaran keterampilan yang memiliki
karakteristik yang berbeda (seperti: trouble shooting,
No KRITERIA TELAAH
Materi Soal/perintah kerja harus sesuai
dengan alat ukur
Soal/tugas kerja harus jelas, lugas
Isi materi sesuai dengan tujuan
pengukuran
Isi materi yang ditanyakan sudah
sesuai dengan jenjang,jenis sekolah,
atau tingkat kelas
Konstruksi Petunjuk cara mengerjakan soal
jelas dan lugas
Ada pedoman penyekoran
Tabel, grafik, peta dan sejenisnya
disajikan dengan jelas dan terbaca
Bahasa Rumusan kalimat soal komunikatif,
yaitu bahasa sederhana dan kata-
kata sudah dikenal siswa
Butir soal menggunakan bahasa
Indonesia baik, benar
Rumusan soal tidak menimbulkan
penafsiran ganda
246 | D a f t a r P u s a k a
Arikunto, Suharsimi. 2003. Manajemen Penelitian. Jakarta:
Rineka Cipta
248 | D a f t a r P u s a k a
Cangelosi, James S., Merancang Tes untuk Menilai Prestasi
Siswa. Terjemahan Lilian D. Tedjasudhana, Bandung: ITB,
1995.
250 | D a f t a r P u s a k a
Gabel, D. L. 1993. Handbook of Research on Science
Teaching and Learning. New York : Maccmillam
Company
Gall, Meredith D., Gall, Joyce dan Borg, Walter R. 2007.
Educational Research:
Garrison , Catherine dan Michael Ehringhaus, Ph. D.
Formative and Summative Assessments in the
Classroom
Gregory, Robert J. 2000. Psychological Testing. United States of
America: Allyn and Bacon.
Griffin, P. & Nix, P. 1991. Educational Assesment and
Reporting. Sydney:
Gronlund, E. Norman. 1982. Constructing Achievement Tests,
Third Edition. Englewood Cliffs, New Jersey: Prentice-
Hall, Inc.
Gronlund, E. Norman. 1982. Constructing Achievement Tests,
Third Edition. Englewood Cliffs, New Jersey: Prentice-
Hall, In
Gronlund, E. Norman. Constructing Achievement Tests, Third
Edition. Englewood Cliffs, New Jersey: Prentice-Hall, Inc.,
1982.
Gronlund, Norman Edward. 1977. Constructing achievement
tests. USA: Prentzce-Hall, Znc
Grounlund, N.E. 1985. Measurement And Evaluationin Testing
(5th Ed.) New York: Macmillan Publising Co, Inc
Gullo, Dominic F. 2005. Understanding assessment and
Evaluation in Early Childhood Education. New York:
Teachers College Press
Hamalik, Oemar. 2005. Kurikulum dan Pembelajaran. Jakarta:
PT. Bumi Aksara.
Hamalik, Oemar. 2011. Kurikulum dan Pembelajaran.
Jakarta: Bumi Aksara. Hamalik,
Oemar.2002.Perencanaan Pengajaran Berdasarkan
Pendekatan Sistem.Bandung: Bumi Aksara
Harcout Brace Javanovich, Publisher.
252 | D a f t a r P u s a k a
Katherine. 2003. Authentic Assesment. Canada:
Pembroke Publisher Limited.
Kemendikbud Dirjen Pendidikan Dasar. 2013. Panduan Teknis
Penilaian Sekolah Dasar. (Online)
https://dikdasmenpdmlamtim.files.
wordpress.com/2016/04/panduan-penilaian-di-sekolah-
dasar-versi-dirjen.pdf. Diakses tanggal 2 Oktober 2017
Kemendikbud. 2015. Panduan Penilaian Untuk Sekolah Dasar
(SD). Jakarta
Kementerian Pendidikan dan Kebudayaan (2015). Panduan
Penilaian Pada Sekolah Dasar (SD) Direktorat Jenderal
Pendidikan Dasar dan Menengah Direktorat Pembinaan
Sekolah Dasar.
Kerlinger, Fred N., (1995), Asas-asas Penelitian Behavioral
(diterjemahkan oleh Landum R. Situmorang dan H. J.
Koesumanto), Yogyakarta : Gajah Mada University
Press.
Khuriyah. 2003. Pengembangan Instrumen Evaluasi Ranah
Afektif Untuk Pendidikan Agama Islam. Jurnal
Pendidikan dan Evaluasi. No. 6. Mei 2003
254 | D a f t a r P u s a k a
Assessment in K–12 Visual Arts Education.
London:Lawrence Erlbaum AssociatesM
256 | D a f t a r P u s a k a
Outcomes (Test, Measurement and Evaluation). L
orentino St: Rex Printing Company, Inc.
258 | D a f t a r P u s a k a
Sawyer, David B. 2004. Fundamental Aspects of Interpreter
Education : Curriculum and Assessment. Amsterdam
: John Benjamins Publishing Company.
Sax, Gilbert. 1980. Principles of Educational Measurement
and Evaluation (second ed.). California: Wadsworth
Publishing.
Scott, Shelleyann dkk. 2016. Leadership of Assessment,
Inclusion, and Learning. London: Spinger
Internasional Publising Switzerland
Secolsky, Charles and Denison, D. Brian. 2012. Handbook On
Measurement, Assessment, And Evaluation In Higher
Education. New York: Routledge
Secolsky, Charles and Denison, Debrian. 2012. Handbook on
Measurement, Assesment, and Evaluation in Higher
Education. Newyork: Routledge
Semiawan Stamboel, Conny. Prinsip dan Teknik Pengukuran
dan Penilaian di Dalam Dunia Pendidikan, Cetakan
II, Jakarta: Mutiara Sumber Widya, 1986
Shermis, Mark and Francis JDV. 1953. Classroom Assesment In
Action. America: Rowman & Littlefield Publisher.
Shermis, Mark D. dan Francis J. Di Vesta. 2011. Classroom
Assessment in Action. Maryland : Rowman &
Littlefield Publishers
Singh, Yogesh Kumar. 2007. Education and Mental
Measurement.S.B Nangia Stuff Lebeam et al (1971)
Measurement, Evaluartion, and Assesment in
Education
Sirait, Bistok. Bahan Pengajaran untuk Mata Kuliah Evaluasi
Hasil Belajar Siswa,
Buku II, Jakarta: Depdikbud, 1989.
Siregar, Eveline & Nara, Hartini. 2011. Teori Belajar dan
Pembelajaran. Cet 2. Bogor : Ghalia Indonesia.
Slameto. 2010. Belajar & Faktor-Faktor yang
Mempengaruhinya. Jakarta: Rineka Cipta.
260 | D a f t a r P u s a k a
Suprananto, Kusaen. Pengukuran dan Penilaian Pendidikan.
Yogyakarta: Graha Ilmu. 2012. Zulaiha, Rahmah.
Bagaimana Menganalisis Soal dengan Program Iteman.
(Jakarta: Departemen Pendidikan Nasional Badan
Penelitian dan Pengembangan Pusat Penilaian
Pendidikan, 2008), h.1
Surya, Mohamad. 2004. Psikologi Pembelajaran dan
Pengajaran. Bandung: Pustaka Bani Quraisy.
Suryabrata, S. 1999. Pengembangan Alat Ukur Psikologis.
Direktorat jenderal Pendidikan Tinggi: Departemen
Pendidikan dan Kebudayaan.
Suryabrata, S. 1999. Pengembangan Alat Ukur Psikologis.
Direktorat jenderal Pendidikan Tinggi: Departemen
Pendidikan dan Kebudayaan.
Suryabrata, S. Pengembangan Alat Ukur Psikologis.
Direktorat jenderal Pendidikan Tinggi: Departemen
Pendidikan dan Kebudayaan. 1999 hal 18.
Suryabrata, S. Pengembangan Alat Ukur Psikologis.
Direktorat jenderal Pendidikan Tinggi: Departemen
Pendidikan dan Kebudayaan. 1999.
Suryabrata, Sumadi. 1987. Pengembangan Tes Hasil Belajar.
Jakarta: Rajawali
Sutrisno, Hadi. 1997. Methodologi Research II. Yogyakarta :
Yasbit Psikologi UGM
Tan, Sharon. 2012. Develop Competency-Based Assessment
Plans. Singapore: Workforce Development Agency
Tark, J.S. & Thomas, A. 1994. Assessment and Program
Evaluation. Needham Heights: Simon & Schuster
Custom Publishing.
The Quality Assurance Division. 2012. Develop Competency-
Based Assessment Plans. Singapore: Workforce
Development Agency.
Thoha Chabib, Teknik Evaluasi Pendidikan, ( Jakarta :
Rajawali, 1996).
Thomas A. Knott, Paul W. Carhart, eds William Allan Neilson.
1951. Webster's New International Dictionary: Second
Edition Unabridged.
262 | D a f t a r P u s a k a
Standards for Educational Evaluation: The Program
Standards: A Guide for Evaluators and Evaluation
Users. California: Sage Publication.
Zainal A. 1990. Evaluasi Instruksional. Bandung: PT. Remaja
Rosdakarya
Zainul, A., & Nasoetion, N.1997.Penilaian Hasil
Belajar.Jakarta:Direktorat Jendral Pendidikan Tinggi
Zulaiha, Rahmah. Bagaimana Menganalisis Soal dengan
Program Iteman. (Jakarta: Departemen Pendidikan
Nasional Badan Penelitian dan Pengembangan Pusat
Penilaian Pendidikan, 2008), h.1
Zulaiha, Rahmah. Bagaimana Menganalisis Soal dengan
Program Iteman. (Jakarta: Departemen Pendidikan
Nasional Badan Penelitian dan Pengembangan Pusat
Penilaian Pendidikan, 2008), h.1