PHBF Makalah 4

BAB I
PENDAHULUAN
1.1 Latar Belakang
Di dalam dunia pendidikan, kita mengetahui bahwa setiap jenis atau
bentuk pendidikan pada waktu-waktu tertentu selama satu periode pendidikan,
selalu mengadakan evaluasi. Artinya pada waktu-waktu tertentu selama satu
periode pendidikan, selalu mengadakan penilaian terhadap hasil yang telah
dicapai, baik oleh pihak terdidik maupun oleh pendidik.
Belajar adalah suatu proses yang kompleks yang terjadi pada setiap orang
sepanjang hidupnya. Proses belajar itu terjadi karena adanya interaksi antara
seseorang dengan lingkungannya. Oleh karena itu, belajar dapat terjadi kapan saja
dan di mana saja. Salah satu indikator bahwa seseorang itu telah belajar adalah
adanya suatu perubahan tingkah laku pada orang itu yang mungkin disebabkan
oleh terjadinya perubahan pada tingkat pengetahuan, keterampilan, atau sikapnya.
Demikian pula dalam satu kali proses pembelajaran, guru hendaknya
menjadi seorang evaluator yang baik. Kegiatan ini dimaksudkan untuk
mengetahui apakah tujuan yang telah dirumuskan itu tercapai atau belum, dan
apakah materi pelajaran yang diajarkan sudah tepat. Semua pertanyaan tersebut
akan dapat dijawab melalui kegiatan evaluasi atau penilaian.
Penilaian atau evaluasi berhubungan dengan setiap bagian dari proses
pendidikan, bukan hanya keberhasilan belajar saja, tetapi mencakup semua proses
belajar mengajar. Kegiatan penilaian tidak hanya terbataspada karateristik peserta
didik saja, tetapi juga mencakup karakteristik metode mengajar, kurikulum,
fasilitas dan administrasi sekolah.
Dalam fungsinya sebagai penilai hasil belajar peserta didik, guru
hendaknya terus menerus mengikuti hasil belajar yang telah dicapai oleh peserta
didik dari waktu ke waktu. Informasi yang diperoleh melalui evaluasi ini
merupakan umpan balik (feed back) terhadap proses belajar mengajar. Umpan
balik ini akan dijadikan titik tolak untuk memperbaiki dan meningkatkan proses
belajar mengajar selanjutnya. Dengan demikian proses belajar mengajar akan
terus dapat ditingkatkan untuk memperoleh hasil yang optimal.
1
Evaluasi memiliki kedudukan yang penting dalam proses pembelajaran.
Dengan melakukan evaluasi, guru sebagai pengelola kegiatan pembelajaran dapat
mengetahui kemampuan yang dimilikipeserta didik, ketepatan metode yang
digunakan, dan keberhasilan peserta didik dalam meraih kompetensi yang telah
ditetapkan.
Berdasarkan hasil penilaian, pendidik dapat mengambil keputusan secara
tepat untuk menentukan langkah yang akan diambil selanjutnya . Hasil penilaian
juga dapat memberikan motivasi kepada peserta didik untuk berprestasi lebih baik
di kemudian hari.
Selanjutnya didalam melakukan evaluasi ada dua teknik evaluasi yang kita
kenal yaitu teknik evaluasi menggunakan tes dan evaluasi dengan teknik non tes,
Teknik non tes pada umumnya memegang peranan penting dalam rangka
mengevaluasi hasil belajar peserta didik dari segi ranah sikap (affective domain)
dan ranah keterampilan (Psychomotoric domain), sedangkan teknik tes lebih
banyak digunakan untuk mengevaluasi hasil belajar peserta didik dari segi ranah
proses berfikirnya (cognitif domain).
1.2 Tujuan
1. Untuk mengetahui pengertian pengukuran, penilaian, dan evaluasi
2. Untuk mengetahui konsep penilaian tes.
3. Untuk mengetahui konsep penilaian non tes.
BAB II
2
PEMBAHASAN
2.1 Kajian Pustaka
2.1.1 Pengertian Pengukuran, Penilaian dan Evaluasi
Pengukuran merupakan suatu kegiatan yang dilakukan untuk mengukur
dalam arti memberi angka terhadap sesuatu yang disebut objek pengukuran atau
objek ukur. Mengukur pada dasarnya adalah pemasangan atau koprespondensi
(Djaali dan Muljono, 2007: 1).
Menurut Cangelosi dalam Noelaka dan Noelaka (2017:140) Pengukuran
dalam Pendidikan adalah proses pengumpulan data melalui pengamatan empiris.
Proses pengumpulan ini dilakukan untuk menaksir apa yang diperoleh siswa
setelah mengikuti pelajaran selama waktu tertentu.
According to Biggs in Sekyi (2016:1)
Assessment is integral to teaching and learning activities in school and mediates the
interaction between teachers and students in the classroom. Assessment can be defined as
all activities that teachers and students undertake to get information that can be used to
alter teaching and learning. This includes teacher observation and analysis of student work
(homework, tests, essays, reports, practical procedures and classroom discussion of issues).
All these are concerned with sampling what a student may or may not know. Assessment is
also used in ‘selecting, controlling or motivating students, and to satisfy public
expectations as to standards and accountability’.
Menurut Biggs dam Sekyi (2016:1), Penilaian merupakan bagian integral

dari kegiatan belajar mengajar di sekolah dan memediasi interaksi antara guru dan
siswa di kelas. Penilaian dapat didefinisikan sebagai semuanya kegiatan yang
dilakukan oleh guru dan siswa untuk mendapatkan informasi yang dapat
digunakan untuk mengubah proses belajar mengajar. Ini termasuk pengamatan
guru dan analisis pekerjaan siswa (pekerjaan rumah, tes, esai, laporan, prosedur
praktis dan diskusi kelas tentang masalah). Semua ini berkaitan dengan
pengambilan sampel yang diketahui atau tidak diketahui oleh siswa. Penilaian
juga digunakan dalam 'memilih, mengendalikan atau memotivasi siswa, dan untuk
memenuhi harapan publik mengenai standar dan akuntabilitas'.
According Kulieke in Nasab (2015:166) Assessment and testing should be set apart.
Assessment is an informal gathering of information about the students' state-of-the-art knowledge
through various ways of collecting information at various times and in different contexts. Testing,
however, is formal and standardized and offers students scoring on the tasks they have performed.
Testing is a single-occasion and timed exercise which is considered as the sole criterion through
which student learning can be measured. Many scholars nowadays abstain from accepting that
there is a single method of gathering data concerning student learning. Testing therefore is seen as
just one component of the broader concept of assessment.
3
Menurut Kulieke dalam Nasab (2015: 166), Penilaian dan pengujian harus
ditetapkan. Penilaian adalah pengumpulan informasi informal tentang
pengetahuan canggih siswa melalui berbagai cara mengumpulkan informasi di
berbagai waktu dan dalam konteks yang berbeda. Pengujian, bagaimanapun,
adalah formal dan terstandarisasi dan menawarkan siswa nilai pada tugas yang
telah mereka lakukan. Pengujian adalah latihan satu kali dan waktunya yang
dianggap sebagai satu-satunya kriteria di mana pembelajaran siswa dapat diukur.
Banyak sarjana saat ini abstain dari menerima bahwa ada satu metode tunggal
mengumpulkan data mengenai pembelajaran siswa. Oleh karena itu, pengujian
dipandang sebagai hanya satu komponen dari konsep penilaian yang lebih luas.
Penilaian merupakan upaya memperoleh informasi secara komprehensif
mengenai kekuatan, kelemahan dan kemajuan belajar siswa yang meliputi aspek
kognitif, afektif, dan psikomotor.Penilaian oleh guru dapat diketahui dari segi
perencanaan, pelaksanaan dan pelaporan hasil belajar siswa. Perencanaan
penilaian dapat terdeteksi melalui silabus, rencana pelaksanaan pembelajaran, dan
kiss-kiss soal dalam penilaian yang digunakan guru. Pelaksanaan penilaian dapat
dilihat dari dokumen siswa dan buku penilaian guru.Pelaporan hasil belajar siswa
dapat dilihat dari buku laporan (rapor) hasil belajar siswa (Sukadir, 2017 : 110).
Evaluasi pada dasarnya merupakan penafsiran atau interpretasi yang
bersumber pada data kuantitatif, sedang data kuantitatif merupakan hasil dari
pengukuran. Evaluai hampir sama dengan penilaian, bedanya dalam evaluasi
berakhir dengan pengambilan keputusan sedangkan penilaian hanya sebatas
memberikan penilaian saja (Djaali dan Muljono, 2007: 1).
Menurut Bloom et al dalam Noelaka dan Noelaka (2017:141) Evaluasi
merupakan kegiatan pengumpulan kenyataan mengenai proses pembelajran secara
sistematis untuk menetapkan apakah terjadi perubahan terhadap peserta didik dan
sejauh apakah perubahan tersebut mempengaruhi kehidupan peserta didik.
Menurut Mardapi (1999) dalam Suryani, Penilaian merupakan proses
penggambaran, memperoleh dan memberikan informasi yang berguna sebagai alternatif
pengambilan keputusan. Suatu proses penilaian, ada yang didasarkan atas hasil
pengukuran yang bersifat kuantitatif dan ada pula yang kualitatif yang didasarkan atas
non-pengukuran. Ciri penting dalam pengukuran adalah adanya proses perbandingan.
Oleh karena itu, pengukuran, penilaian, dan evaluasi merupakan kegiatan yang berkaitan
4
dan berurutan. Secara umum penilaian atau evaluasi adalah suatu sistem sistematis untuk
mengetahui tingkat keberhasilan dan efisiansi suatu program. Evaluasi dalam sistem
pendidikan adalah salah satu kegiatan yang sangat penting dilaksanakan secara teratur
pada periode-periode tertentu, antara lain untuk memantau kualitas mutu pendidikan dan
membantu proses belajar mengajar (PBM) di kelas, karena itu diperlukan alat ukur.
Pemahaman siswa terhadap materi pelajaran dapat diketahui seseorang berdasarkan hasil
evaluasi, sehingga informasi yang bermakna dapat diperoleh dalam pengambilan
keputusan. Oleh karena itu dalam praktiknya masalah pengukuran mempunyai kedudukan
yang sangat penting dalam proses evaluasi. Baik buruknya hasil evaluasi tergantung pada
hasil pengukuran.
2.1.2 Konsep Penilaian Tes

2.1.2.1 Pengertian Tes
According to Sah (2012: 29), Test is a process that is administered to
measure student’s ability to performance in a particular field in a certain time
limit with some specific goal. It generally acts as a gatepass in teaching for
students to go ahead in learning
Menurut Sah (2012:29), Tes adalah proses yang dilakukan untuk
mengukur kemampuan siswa untuk melakukan kinerja dalam bidang tertentu
dalam batas waktu tertentu dengan beberapa tujuan tertentu. Itu umumnya
bertindak sebagai gatepass dalam pengajaran bagi siswa untuk terus maju dalam
belajar.
According to Hasanuddin and Talib (2018: 5) a test can be defined as a
way of measuring the ability performance or knowledge of a person in a
particular domain.
Menurut Hasanuddin dan Talib (2018: 5) tes dapat didefinisikan sebagai
cara untuk mengukur kinerja kemampuan atau pengetahuan seseorang dalam
domain tertentu.
Menurut Djali dan Muljono (2007:6) Secara umum tes dapat diartikan
sebagai alat yang dipergunakan untuk mengukur pengetahuan atau penguasaan
obyek ukur terhadap seperangkat konten tertentu. Tes dapat juga diartikan sebagai
alat pengukur yang mempunyai standar objektif, sehingga dapat digunakan secara
meluas, serta betul-betul dapat digunakan untuk mengukur dan membandingkan
5
keadaan psikis atau tingkah laku. Tes dapat digunakan untuk mengukur
banyaknya pengetahuan yang diperoleh individu dari suatu bahan pelajaran yang
terbatas pada tingkat tertentu. Oleh karena itu, tes merupakan alat ukur ynag
paling banyak digunakan dalam pendidikan.
Menurut Norman dalam Djali dan Muljono (2007:7) tes merupakan salah
satu prosedur evaluasi yang komperehensif, sistematik, dan obyektif, yang
hasilnya dapat dijadikan sebagai dasar dalam pengambilan keputusan dalam
proses pengajaran yang dilakukan oleh guru. Dapat disimpulkan bahwa tes
memiliki peranan yang sangat penting dalam dunia pendidikan.
According to Kinra (2008:48) testing techniques do tell us what a student
might achieve in case of a test but cannot tell us what be might do in other
situations.
Menurut Kinra (2008:48) teknik pengjian memang memberi tahu kita apa
ynag mungkin dicapai seorang siswa dalam suatu ujian tetapi tidak dapat memberi
tahu kita apa yang mungkin dia lakukan dalam situasi lain.
2.1.2.2 Fungsi Tes

Menurut Djali dan Muljono (2007:7-9) Secara umum ada beberapa fungsi
tes dalam dunia Pendidikan, pertama tes dapat digunakan sebagai alat mengukur
prestasi belajar siswa. Sebagai alat untuk mengukur prestasi belajar siswa tes
dimaksudkan untuk mengukur tingkat perkembangan atau kemajuan yang telah
dicapai siswa menempuh proses belajar mengajar dalam jangka waktu tertentu.
Dalam kaitan ini tes berfungsi sebagai alat untuk mengukur keberhasilan program
pengajaran. Kedua tes berfungsi sebagai motivator dalam pembelajaran. Hampir
semua ahli teori pembelajaran menekankan pentingnya umpan balik yang berupa
nilai untuk meningkatkan intensitas kegiatan belajar. Ketiga tes dapat berfungsi
untuk upaya perbaikan kualitas pembelajaran. Keempat, tes yang dimaksudkan
untuk menentukan berhasil atau tidaknya siswa sebagai syarat untuk melanjutkan
Pendidikan pada jenjang yang lebih tinggi.
According to Oriondo and Dallo-antonio (1984:9) Tests provide the teacher with
information that is help-ful in providing more effective instructional guidance for
individual pupils and for the whole class. Tests results focus the teachers attention on
specific objectives that need to be emphasized more, the teaching methods that have to be
utilized more or those that need to be improved. Further more, they provide information on
how subject-matter may be better presented or organized. Tests help students identify their
6
own specific strengths as well as weaknesses, making them more aware of how they can
improve themselves.
Menurut Oriondo and Dallo-antonio (1984:9 ), Tes memberi guru informasi

yang membantu dalam memberikan bimbingan pengajaran yang lebih efektif
untuk siswa secara perorangan dan untuk seluruh kelas. Hasil tes memusatkan
perhatian guru pada tujuan khusus yang perlu lebih ditekankan, metode
pengajaran yang harus digunakan lebih banyak atau yang perlu ditingkatkan.
Lebih jauh lagi, mereka memberikan informasi tentang bagaimana materi
pelajaran dapat disajikan atau diatur dengan lebih baik. Tes membantu siswa
mengidentifikasi kekuatan spesifik mereka sendiri serta kelemahan, membuat
mereka lebih sadar bagaimana mereka dapat meningkatkan diri.
2.1.2.3 Penggolongan tes

Menurut Djali dan Muljono (2007:10-12) Tes dibedakan menjadi dua
golongan yaitu:
1. Tes awal (pretest), tes ini dilaksanakan dengan tujuan untuk mengetahui
sejauh mana materi pelajaran yang diajarkan telah diketahui oleh siswa atau
peserta didik. Tes awal ini dilaksanakan sebelum bahan pelajaran diajarkan.
2. Test akhir (post-test), test ini dilaksanakan dengan tujuan untuk mengetahui
apakah semua materi pelajaran yang penting telah dikuasai dengan baik oleh
peserta didik.
Mallawi dan Maruti (2016: 20) membagi tes berdasarkan cara
menyelesaikannya menjadi dua macam yaitu:
1. Tes verbal, testee dalam menyelesaikan atau mengerjakan tes dengan
menggunakan kata-kata, misalnya: memberi informasi, memberikan hasil
perhitungan.
2. Tes non-verbal, testee merespon dengan tindakan.
Ditinjau dari aspek psikis tes dibedakan menjadi lima golongan. Pertama, tes
inteligensi yang dilaksanakan dengan tujuan untuk mengungkapkan atau
memprediksi tingkat kecerdasarn seseorang. Kedua, tes kemampuan yang
dilaksanakna dengan tujuan untuk mengungkapkan kemampuan dasar atau bakat
khusus yang dimiliki oleh peserta tes. Ketiga, tes sikap yang dilaksanakan dengan
tujuan untuk mengungkapkan pre-disposisi atau kecendrungan seseorang untuk
melakukan sesuatu respon terhadap obyek yang disikapi. Keempat, tes
kepribadian untuk mengungkapkan ciri-ciri khas diri seseorang yang sedikit
7
banyak bersifat lahiriah. Kelima, tes hasil belajar untuk mengungkapkan
pencapaian terhadap tujuan pembelajaran atau prestasi belajar (Djali dan Muljono,
2007: 10-11).
Menurut Yusuf (2017: 95) ditinjau dari segi baku/ tidaknya suatu tes, maka
tes dapatdibedakan atas:
1. Tes standar (standardized test), ialah tes yang diakui reliabilitas dan
validitasnya. Tes seperti itu telah lama diujicobakan, dianalisa, direvisi dan
disusun kembali secara berulang-ulang.
2. Tes buatan guru (teacher made test) atau tes lokal, ialah tes yang dirancang
khusus ole guru mata pelajaran untuk menilai proses dan hasil belajar siswa
yang dibelajarkannya. Tes ini belum diketahui validitas dan reliabilitasnya.
Ditinjau dari cara mengajukan pertanyaan tes dibedakan menjadi tiga
golongan. Pertama, tes tertulis yang dikenal dengan istilah pencil and paper test,
yaitu tes dimana pelaksana tes dalam mengajukan butir-butir petanyaannya
dilakukan secara tertulis dan peserta tes memberi jawaban secara tertulis pula.
Kedua, tes tidak tertulis yang dikenal dengan istila non-pencil and paper test,
yaitu tes dimana pelaksana tes dalam mengajukan butir-butir pertanyaannya
dilakukan secara tidak tertulis (lisan) dan peserta tes memberi jawaban juga secara
lisan. Ketiga, tes perbuatan yang diberikan dalam bentuk tugas atau instruksi
kemudia peserta tes melakukan tugas instruksi tersebut dan hasilnya dinilai oleh
pemberi tes ( Djali dan Muljono, 2007: 11-12).
Jika dikaitkan dengan fungsi tes di sekolah, maka tes dibagi atas:
1. Tes diagnostik
Menurut Djali dan Muljono (2007:9) Tes diagnostik dilaksanakan untuk
mengidentifikasi kesulitan belajar yang dialami siswa, menentukan factor-faktor
yang menyebabkan terjadinya kesulitan belajar, dan menetapkan cara mengatasi
kesulitan belajar tersebut. Berhasil atau gagalnya suatu kegiatan pembelajaran
dalam proses Pendidikan pada suatu jenis dan/atau jenjang Pendidikan tertentu
sangat dipengaruhi oleh apakah siswa mengalami kesulitan belajar yang dialami
dalam suatu kegiatan pembelajaran, maka makin besar peluang bahwa siswa akan
berhasil.
According to Cohen et al. (2000: 317-318) Diagnostic testing is an in-depth test to
discover particular strengths, weaknesses and difficulties that a student is experiencing,
and is designed to expose causes and specific areas of weakness or strength. This often
requires the test to include several items about the same feature, so that, for example,
8
several types of difficulty in a student’s understanding will be exposed; the diagnostic test
will need to construct test items that will focus on each of a range of very specific
difficulties that students might be experiencing, in order to identify the exact problems that
they are having from a range of possible problems. Clearly this type of test is criterion-
referenced.
Menurut Cohen dkk (2000: 317-318) Tes diagnostik adalah tes mendalam
untuk menemukan kekuatan, kelemahan, dan kesulitan tertentu yang dialami
siswa, dan dirancang untuk mengekspos penyebab dan area spesifik kelemahan
atau kekuatan. Ini sering mengharuskan tes untuk memasukkan beberapa item
tentang fitur yang sama, sehingga, misalnya, beberapa jenis kesulitan dalam
pemahaman siswa akan diekspos; tes diagnostik perlu menyusun item-item tes
yang akan fokus pada masing-masing dari serangkaian kesulitan yang sangat
spesifik yang mungkin dialami siswa, untuk mengidentifikasi masalah yang
sebenarnya mereka alami dari berbagai masalah yang mungkin terjadi. Jelas jenis
tes ini adalah kriteria-referensi.
According to Gall et al.(2003: 210) Suppose that your research project involves
remediation of student learning difficulties, or evaluation of the effectiveness of a remedial
program. In these situations, a diagnostic test might be helpful in identifying an
appropriate research sample. A diagnostic test is a form of achievement trst that is used
identify a student’s strenghs and weaknesses in a particular school subject. Diagnostic tests
usually focus on the low end of the achievenment spectrum and provide a detailed picture
of the student’s level of performance various skills that the subject involves. A disadvantage
of some diagnostic tests is that the subscores hove low-reliability, and often they are highly
intercorrelated. For diagnostic purposes a criterion-referenced test covering the subject of
interest might be a better choice, because it provides a measure of the learner’s absolute
level of performance in a precisely defined content area.
Menurut Gall dkk (2003: 210), Misalkan proyek penelitian Anda melibatkan
remediasi kesulitan belajar siswa, atau evaluasi efektivitas program perbaikan.
Dalam situasi ini, tes diagnostik mungkin membantu dalam mengidentifikasi
sampel penelitian yang sesuai. Tes diagnostik adalah bentuk pencapaian pertama
yang digunakan untuk mengidentifikasi kekuatan dan kelemahan siswa dalam
mata pelajaran sekolah tertentu. Tes diagnostik biasanya berfokus pada ujung
rendah dari spektrum pencapaian dan memberikan gambaran rinci tentang tingkat
keterampilan berbagai keterampilan siswa yang melibatkan subjek. Kelemahan
dari beberapa tes diagnostik adalah bahwa subskala memiliki keandalan yang
rendah, dan seringkali mereka sangat saling terkait. Untuk tujuan diagnostik, tes
yang direferensikan kriteria yang mencakup subjek yang menarik mungkin
9
menjadi pilihan yang lebih baik, karena memberikan ukuran tingkat kinerja
absolut pelajar di area konten yang ditentukan secara tepat.
2. Tes formatif
Menurut Sukardi dalam Utami (2015:119) pada proses belajar mengajar, tes
formatif bertujuan untuk memperoleh informasi yang diperlukan oleh seorang
dosen tentang mahasiswa guna menentukan tingkat perkembangan mahasiswa
dalam satu unit proses belajar mengajar. Tes formatif ini juga bertujuan untuk
mengukur apakah tujuan instruksional khusus yang hendak dicapai yang telah
dirumuskan didalam program satuan pelajaran.
Menurut Djali dan Muljono (2007:9) Menurut Tes formatif pada dasarnya
adalah tes yang bertujuan untuk mendapatkan umpan balik bagi usaha perbaikan
kualitas pembelajaran dalam konteks kelas. Kualitas pembelajaran dikelas
ditentukan oleh intensitas proses belajar (proses intern) dalam diri setiap siswa
sebagai subyek belajar sekaligus peserta didik. Intensitas proses belajar dalam arti
intern tersebut ditentukan oleh kesesuaian antara strategi dan metode
pembelajaran dengan struktur kognitif (termasuk bakat) siswa sebagai peserta
didik dan karakteristik konsep atau materi yang dipelajari.
3. Tes Sumatif
According to Harlen in Setiyana (2016: 435) a summative test refers to the
process by which teachers collect data systematically to make an inference about
the state of a student’s learning.
Menuru Harlen dalam Setiyana (2016: 435) tes sumatif mengacu pada proses
dimana guru mengumpulkan data secara sistematis untuk membuat kesimpulan
tentang keadaan pembelajaran siswa.
Menurut Djali dan Muljono, (2007:9-120) tes sumatif yang dikenal dengan
istilah summative test adalah tes hasil belajar yang telah dilaksanakan setelah
kumpulan materi pelajaran atau satuan program pengajaran selesai diberikan.
Disekolah tes sumatif dikenal dengan tes ulangan umum yang dilaksanakan
dengan tujuan untuk menentukan nilai yang menjadi lambing keberhasilan siswa
setelah mereka menempuh proses pembelajaran dalam jangka waktu tertentu.
2.1.2.4 Bentuk-Bentuk Tes
10
Adapun bentuk-bentuk tes antara lain terdiri atas:
1. Tes tertulis bentuk uraian (essay)
Menurut Asrul, Ananda R dan Rosnita (2014: 42-52) Tes bentuk uraian adalah
tes yang pertanyaannya membutuhkan jawaban uraian, baik uraian secara bebas
maupun uraian secara terbatas. Sutomo mengatakan bahwa tes bentuk uraian ini,
khususnya bentuk uraian bebas menuntut kemampuan murid untuk
mengorganisasikan dan merumuskan jawaban dengan menggunakan kata-kata
sendiri serta dapat mengukur kecakapan murid untuk berfikir tinggi yang biasanya
dituangkan dalam bentuk pertanyaan yang menuntut: Memecahkan masalah,
Menganalisa masalah, Membandingkan, Menyatakan hubungan, Menarik
kesimpulan dan sebagainya.
Dilihat dari keluasan materi yang ditanyakan, maka tes bentuk uraian ini
dapat dibagi menjadi dua bentuk, yaitu uraian terbatas(restricted respons items)
dan uraian bebas (extended respons items).
According to Ebel & Darwin in McAllister, Orlando (2017: 5-6) Over the past 75
years there have been many arguments and counter arguments regarding the superiority of
the essay type test compared to the objective type test. However, there is no significant
research to substantiate those claims. It is significant to noted that (1) it is relatively easy to
construct a 5 to six page question extended response essay test compared to 100 item
multiple choice test; (2) it helps to eliminate teacher bias by making them stress the
students’ ability to supply/select the correct answer; (3) it is the only means teachers have
to assess the students’ ability to compose, answer and present in effective proses. Another
problem with essay type tests is that students who are unsure or do not have a clear
understanding of what the question asked may write well, but have little to say. Finally, the
time taken to score essay type tests can lead to reader fatigue and decreased test reliability.
Despite the limitations of the essay type test they are still very popular and widely used,
perhaps because they are “easier” to construct and less time consuming. Empirical data
suggest that there are too many instances where essay tests are inappropriate because they
tend to measure low level skills on Bloom’s Taxonomy of Educational Objectives because of
the frequent use of extended response time essay question “with virtually” no bounds
placed on the student.
Menurut Ebel dan Darwin dalam McAllister, Orlando (2017: 5-6) Selama
75 tahun terakhir telah ada banyak argumen dan argumen yang bertentangan
tentang keunggulan tes tipe esai dibandingkan dengan tes tipe objektif. Namun,
tidak ada penelitian yang signifikan untuk mendukung klaim tersebut. Penting
untuk dicatat bahwa (1) relatif mudah untuk membangun tes esai respon diperluas
5 sampai 6 halaman pertanyaan dibandingkan dengan 100 item tes pilihan ganda;
(2) membantu menghilangkan bias guru dengan membuat mereka menekankan
kemampuan siswa untuk menyediakan / memilih jawaban yang benar; (3) itu
adalah satu-satunya cara guru harus menilai kemampuan siswa untuk menyusun,
11
menjawab dan hadir dalam prosa yang efektif. Masalah lain dengan tes tipe esai
adalah bahwa siswa yang tidak yakin atau tidak memiliki pemahaman yang jelas
tentang apa yang ditanyakan oleh pertanyaan dengan baik, tetapi tidak banyak
bicara. Akhirnya, waktu yang dibutuhkan untuk menilai tes tipe esai dapat
menyebabkan kelelahan pembaca dan penurunan reliabilitas tes. Terlepas dari
keterbatasan tes tipe esai mereka masih sangat populer dan banyak digunakan,
mungkin karena mereka "lebih mudah" untuk membangun dan lebih sedikit
memakan waktu. Data empiris menunjukkan bahwa jumlahnya terlalu banyak
contoh-contoh di mana tes esai tidak sesuai - karena mereka cenderung mengukur
keterampilan tingkat rendah pada Taksonomi Bloom dari Tujuan Pendidikan
karena seringnya menggunakan pertanyaan esai waktu respons diperpanjang
“dengan hampir” tidak ada batasan yang ditempatkan pada siswa.
Bentuk tes objektif dan bentuk tes uraian masing-masing memiliki
kelebihan dan kelemahan. Bentuk tes uraian, memberikan kebebasan kepada
setiap penempuh tes untuk mengekspresikan daya nalarnya, sehingga jawaban
yang diberikan oleh setiap penempuh tes akan menunjukkan kemampuan berpikir
secara kompleks. Namun demikian ada beberapa kelemahan bentuk tes uraian.
Bentuk tes uraian dalam memberikan skor membutuhkan waktu yang lama dan
relatif lebih sulit, sehingga bentuk uraian sulit digunakan untuk tes-tes yang
berskala besar. Di samping itu, penskoran bentuk tes uraian bersifat subjektif dan
harus dilakukan oleh ahli atau yang berwenang sehingga tidak dapat dilakukan
komputerisasi dalam pensekoranya (Suwongko,2010: 271).
2. Tes Hasil Belajar Bentuk Objektif
Menurut Asrul, Ananda R dan Rosnita (2014: 45) Tes objektif disebut objektif
karena cara pemeriksaannya yang seragam terhadap semua murid yang mengikuti
sebuah tes. Tes objektif juga dikenal dengan istilah tes jawaban pendek (short
answer test), dan salah satu tes hasil belajar yang terdiri dari butir-butir soal
(items) yang dapat dijawab oleh tester dengan jalan memilih salah satu (atau
lebih), di antara beberapa kemungkinan jawaban yang telah dipasangkan pada
masing masing items atau dengan jalan menuliskan jawabannya berupa kata-kata
atau simbol-simbol tertentu pada tempat-tempat yang disediakan untuk masing-
masing butir yang bersangkutan. Terdapat beberapa jenis tes bentuk objektif,
12
misalnya: bentuk melengkapi (completion test), pilihan ganda (multifle chois),
menjodohkan (matching), bentuk pilihan benar-salah (true false). Lebih jelasnya
diuraikan subagai berikut.
a. Melengkapi (Completion test).
Menurut Asrul, Ananda R dan Rosnita (2014:45-46) Completion test adalah
dikenal dengan istilah melengkapi atau menyempurnakan. Salah satu jenis
objektif yang hampir mirip sekali dengan tes objektif fill in. Letak perbedaannya
ialah pada tes objektif bentuk fill in bahan yang dites itu merupakan satu kesatuan.
Sedangkan pada tes objektif bentuk completion tidak harus demikian. Tes ini
memiliki kelebihan yaitu amat mudah dalam penyusunannya dan lebih
menghemat tempat (kertas). Adapun kelemahannya adalah pada umumnya tester
cenderung menggunakan tes model ini untuk mengungkapkan daya ingat atau
aspek hapalan saja dan butir-butir item dari tes model ini kurang relevan untuk
disajikan.
b. Test objektif bentuk multifle choice test (pilihan berganda)
Menurut Asrul, Ananda R dan Rosnita (2014:46) Test multifle chois, tes
pilihan ganda merupakan tes objektif dimana masing-masing tes disediakan lebih
dari kemungkinan jawaban, dan hanya satu dari pilihan-pilihan tersebut yang
benar atau yang paling benar.
Menurut Sudjana dalam Istiyono E, Mardapi D, dan Suparno (2014:4)
Kenyataan bahwa tes pilihan ganda lebih banyak digunakan dari pada bentuk tes
yang lain. Hal ini karena tes pilihan ganda memiliki kelebihan-kelebihan, antara
lain: (1) materi yang diujikan dapat mencakup sebagian besar bahan
pembelajaran, (2) jawaban siswa dapat dikoreksi dengan mudah dan cepat, (3)
jawaban setiap pertanyaan sudah pasti benar atau salah, sehingga penilai-an
objektif. Walaupun ada juga kelemahan tes ini, yaitu: (1) kemungkinan peserta
didik untuk melakukan tebakan jawaban masih cukup besar dan (2) proses
berpikir siswa tidak dapat dilihat de-ngan nyata. Di sam-ping itu, kelemahan lain
tes objektif yakni: (1) percaya diri yang tinggi pada testi dan (2) terjadinya
kecurangan (cheating).
c. Test objektif bentuk matching (menjodohkan)
13
Menurut Asrul, Ananda R dan Rosnita (2014:48) Test bentuk ini sering
dikenal dengan istilah tes menjodohkan, tes mencari pandangan, tes
menyesuaikan, tes mencocokkan. Tes ini terdiri dari satu pertanyaan dan satu seri
jawaban. Tugas tes adalah mencari dan menetapkan jawaban-jawaban yang telah
bersedia sehingga sesuai dengan atau cocok atau merupakan pasangan, atau
merupakan jodoh dari pertanyaan.
3. Tes Tindakan (Performance Test)
Menurut Asrul, Ananda R dan Rosnita (2014:51) Tes tindakan adalah tes
yang menuntut jawaban peserta didik dalam bentuk perilaku, tindakan, atau
perbuatan di bawah pengawasan penguji yang akan mengobservasi
penampilannya dan membuat keputusan tentang kualitas hasil belajar yang
dihasilkannya atau ditampikannya. Peserta didik bertindak sesuai dengan apa yang
diperintahkan dan ditanyakan.
Menurut Asrul, Ananda R dan Rosnita (2014:51-52) Tes tindakan dapat
digunakan untuk menilai kualitas suatu perkerjaan yang telah selesai dikerjakan
oleh peserta didik, termasuk juga keterampilan dan ketepatan menyelesaikan suatu
pekerjaan, kecepatan dan kemampuan merencanakan suatu pekerjaan. Tindakan
atau unjuk kerja yang dapat deklamasi, menggunakan peralatan laboratorium, dan
mengoperasikan suatu alat. Penilaian ini cocok digunakan untuk menilai
ketercapaian kompetensi yang menuntut peserta didik menunjukkan unjuk kerja.
Cara penilaian ini dianggap lebih otentik daripada tes tertulis karena apa yang
dinilai lebih mencerminkan kemampuan peserta didik yang sebenarnya.
Menurut Asrul, dkk (2014: 52-53), Sebagaimana jenis tes yang lain, tes
tindakan mempunyai kelebihan dan kekurangan, kekurangan tes tindakan adalah :
1) Satu-satunya teknik tes yang dapat digunakan untuk mengetahui hasil belajar
dalam bidang keterampilan, seperti ketereampilan membaca Al-Qur’an
berdasarkan ilmu tajwid.
2) Sangat baik digunakan untuk mencocokkan kesesuaian antara pengetahuan
teori dengan keterampilan praktik, sehingga hasil penilaian menjadi lengkap.
3) Dalam pelaksanaannya tidak memungkinkan peserta didik untuk saling
menyontek.
4) Guru dapat lebih mengenal karakteristik masing-masing peserta didik sebagai
dasar tindak lanjut hasil penilaian, seperti pembelajaran remedial.
Adapun kelemahan/kekurangan tes tindakan adalah :
14
1) Memakan waktu yang lama.
2) Dalam hal tertentu membutuhkan biaya yang benar.
3) Cepat membosankan.
4) Jika tes tindakan sudah menjadi sesuatu yang rutin, maka ia tidak mempunyai
arti apa-apa lagi.
5) Memerlukan syarat-syarat pendukung yang lengkap, baik waktu, tenaga
maupun biaya. Jika syarat-syarat tersebut tidak terpenuhi, maka hasil
penilaian tidak dapat dipertanggung jawabkan dengan baik.
2.1.2.5 Ciri-Ciri Tes yang Baik

Menurut Maruti dan Malawi (2016: 22-24) Sebuah tes dapat dikatakan baik
sebagai alat ukur apabila memenuhi beberapa persyaratan sebagai berikut:
validitas, reliabilitas, obyektivitas, praktbilitas ekonomis, standard, disktiminatif,
dan komperehensif.
1. Validitas
Kata validitas sering disamakan artinya dengan ketepatan atau kesahihan.
Sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur
secara tepat. Misalnya untuk mengukur besarnya partisipasi siswa dalam proses
pembelajaran, bukan diukur melalui nilai yang diperoleh siswa pada waktu
ulangan, tetapi dilihat melalui: presensi, fokus tidaknya perhtian siswa pada
pelajaran, dan ketepatan siswa dalam menjawab pertanyaan yang diajukan guru.
2. Reliabilitas
Dalam bahasa indonesia kata reliabilitas diartikan dapat dipercaya atau
keajegan atau ketetapan. Sebuah tes dikatakan reliabel atau dapat dipercaya
apabila memberikan hasil yang tetap atau ajeg jika diteskan berkali-kali. Dengan
kata lain, apabila kepada testee diberikan tes yang sama pada waktu yang
berlainan, maka setiap testee akan memperoleh peringkat yang sama dalam
kelompoknya.
3. Obyektivitas
Kata obyektif berarti tidak terpengaruh oleh unsur pribadi atau unsur
subyektif dari penilai atau dari unsur bentuk tes. Tes yan berbentuk uraian, akan
memberi banyak kemungkinan kepada pihak penilai dalam memberikan penilaian
menurut caranya sendiri. Oleh karena itu pada saat kini terdapat kecenderungan
penggunaan tes obyektif dalam berbagai biang, dengan disediakan pedoman
sistem skoring yang jelas dan rinci.
15
4. Praktibilitas
Sebuah tes memiliki praktibilitas yang tinggi apabila tes tersebut bersifat
praktis, mudah dilaksanakan, mudah pemeriksaannya, dan mudah
pengadministrasiannya, serta dilengkapi dengan petunjuk-petunjuk yang jelas
sehingga dapat diberikan atau diawali oleh orang lain.
5. Ekonomis
Tes harus ekonomis, artinya bahwa pelaksanaan tes tersebut tidak
membutuhkan biaya yang mahal, tenaga yang banyak dan waktu yang lama.
6. Standar
Secara teori sebenarnya semua hal dalam tes in perlu distandardisasikan,
namun secara praktis biasanya dipilih hal-hal tertentuynag dianggap penting,
seperti: materi tes, penyelenggaraan tes, skoring, dan interpretasi hasil testingnya.
Standardisasi suatu tes bertujuan supaya setiap testee yang dites dengan tes
tersebut memperoleh perlakuan yang benar-benar ama.
7. Tes harus diskriminatif
Dengan tes dimaksud untuk dapat mengungkap gejala tertentu dan
menunjukkan perbedaan-perbedaan (diskriminasi) gejala tersebut antar individu.
Jadi tes diskriminatif akan mampu menunjukkan perbedaan-perbedaan yang kecil
mengenai sifat atau faktor tertentu pada indivdu-individuyang berbeda-beda,
indeks ynag menunjukkan sifat diskrimintif ii disebut dengan daya beda.
8. Komperhensif
Tes harus kompehensif artinya dapat sekaligus mengungkap atau
menyelidiki banyak aspek. Terutama dalam tes prestasi belajar hal ini penting
sekali untuk mendapat perhatian bagi guru sebagai penyusun tes. Tujuannya
adalah supaya dengan tes itu mampu mengungkap pengetahuan testee mengenai
segala hal yang harus dipelajari, jadi hal ini untuk mencegah kedorongan untuk
berspekulasi.
According to Djiwandono and Sudijono in Sugianto (2017: 23) It is known that a

test should fulfil standard or characteristics of a good test. Based on theories, there are five
characteristics of a good test. They are: 1) the test should be valid, 2) the test should be
reliable, 3) the test should be objective, 4) the test should be practicable, and 5) the test
should be economic. From the five characteristics of a good test, the two firsts are the most
important; they are the test should be valid and reliable. Validity is the extent to which the
test measures what it is wanted to measure. In other words, a valid test can really measure
what it is supposed to measure. For instance, if the test is supposed to measure speaking
ability, so the test is constructed, conducted, answered orally. Validity refers to the extent
to which the test measures what it says it measures. Consequently, validity refers to the
16
suitability between a test as an instrument of measurement and the domain of what it is
supposed to measure.
The extent of validity can be analysed logically or empirically. The kind of validity
analysed logically is called as logical validity, while the validity analysed empirically is
called as empirical validity. Logical validity is resulted from the process of thinking
logically.So a test if it has been supposed that has fulfilled logical validity, it means that the
test rationally has been able to measure what it should measure. Empirical validity is
resulted from the correlation between the test and the empirical data. Empirical data are
obtained from experienceswhich are interpreted into numbers or scores. Logical validity
can be divided into two types; they are content validity and construct validity. Content
validity is the extent to which the test measures the materials that has been taught and
programmed in syllabus. So, in content validity, items should be representatives of whole
materials. A test is said to have content validity if its content constitutes a representative
sample of the language skills, structures, tc. with which it is meant to be concerned”.
Stated that content validity is the extent to which the selection of tasks one observes in a
test taking situation is representative of the larger set of tasks of which the test is assumed
to be a sample, so in the other words that a test should be a representative sample of the
teaching/instructional contents as defined and covered in the curriculum.
Menurut Djiwandono dan Sudijono dalam Sugianto (2017: 23) diketahui

bahwa tes harus memenuhi standar atau karakteristik tes yang baik. Berdasarkan
teori, ada lima karakteristik tes yang baik. Mereka adalah: 1) tes harus valid, 2) tes
harus dapat diandalkan, 3) tes harus objektif, 4) tes harus dapat dipraktikkan, dan
5) tes harus ekonomis. Dari lima karakteristik tes yang baik, dua yang pertama
adalah yang paling penting; mereka tes harus valid dan dapat diandalkan. Validitas
adalah sejauh mana tes mengukur apa yang ingin diukur. Dengan kata lain, tes
yang valid benar-benar dapat mengukur apa yang seharusnya diukur. Misalnya,
jika tes seharusnya mengukur kemampuan berbicara, maka tes tersebut dibangun,
dilakukan, dijawab secara lisan. Sudijonoalidity mengacu pada sejauh mana tes
mengukur apa yang dikatakannya mengukur. Akibatnya, validitas mengacu pada
kesesuaian antara tes sebagai instrumen pengukuran dan domain dari apa yang
seharusnya diukur.
Tingkat validitas dapat dianalisis secara logis atau empiris. Jenis validitas
yang dianalisis secara logis disebut sebagai validitas logis, sedangkan validitas
yang dianalisis secara empiris disebut sebagai validitas empiris. Validitas logis
dihasilkan dari proses berfikir secara logis. Jadi suatu tes jika telah dianggap telah
memenuhi validitas logis, itu berarti bahwa tes secara rasional telah dapat
mengukur apa yang seharusnya diukur. Validitas empiris dihasilkan dari korelasi
antara tes dan data empiris. Data empiris diperoleh dari pengalaman yang
ditafsirkan menjadi angka atau skor. Validitas logis dapat dibagi menjadi dua
jenis; mereka adalah validitas konten dan membangun validitas. Konten validitas
17
adalah sejauh mana tes mengukur materiyang telah diajarkan dan diprogram
dalam silabus. Jadi, dalam validitas konten, item harus mewakili seluruh bahan.
Suatu tes dikatakan memiliki validitas konten jika isinya merupakan sampel
representatif dari keterampilan bahasa, struktur, dan lain-lain. dengan yang
dimaksudkan untuk diperhatikan. Validitas konten adalah sejauh mana pemilihan
tugas yang diamati dalam situasi pengambilan tes mewakili set tugas yang lebih
besar di mana tes diasumsikan sebagai sampel, jadi dengan kata lain bahwa tes
harus merupakan sampel yang representatif isi pengajaran/instruksional
sebagaimana didefinisikan dan tercakup dalam kurikulum.
2.1.3 Konsep Penilaian Non-Tes

2.1.3.1 Pengertian Penilaian Non-Tes
Teknik evaluasi non tes berarti melaksanakan penilaian dengan tidak
menggunakan tes. Teknik penilaian ini umumnya untuk menilai kepribadian anak
secara menyeluruh meliputi sikap, tingkah laku, sifat, sikap sosial, ucapan,
riwayat hidup dan lain-lain yang berhubungan dengan kegiatan belajar dalam
pendidikan, baik secara individu maupun secara kelompok (Ratnawulan dan
Rusdiana, 2014).
Menurut Rukajat (2018:63) Teknik nontes adalah suatu alat penilaian yang
biasanya dipergunakan untuk mendapatkan informasi tertentu tentang keadaan
peserta tes dengan tidak menggunakan tes. Hal ini berarti bahwa jawaban yang
diberikan oleh peserta tes tidak bisa dikategorikan sebagai jawaban benar atau
salah sebagaimana interpretasi jawaban tes. Dengan teknin nontes maka penilaian
atau evaluasi hasil belajar peserta didik dilakukan tanpa menguji peserta didik
melainkan dilakukan dengan cara tertentu. Teknik penilaian non-tes berarti
melaksanakan penilaian dengan tidak menggunakan tes. Sedangkan teknik
penilaian non-tes tulis maksunya adalah bentuk evaluasi nontes yang berbentuk
tulisan atau non lisan.
Menurut Bisri H dan Ichsan M (2015: 83) Teknik non tes adalah cara
mengumpulkan kemajuan pembelajaran dengan cara selain tes. Bentuk‐bentuk
teknik nontes ialah observasi, penilaian diri, penilaian antarteman, jurnal, angket,
dan skala. Dalam kegiatan menilai, digunakan sejumlah instrumen/alat penilaian
yang disesuaikan dengan teknik yang dipakai dalam menilai. Instrumen penilaian
18
nontes yakni berbagai alat yang digunakan dalam pengukuran dengan cara nontes.
Instrumen nontes digunakan untuk mengevaluasi hasil belajar aspek
psikomotorik, sikap, atau nilai.
2.1.3.2 Kegunaan Non-Tes

Salah satu tujuan dan kegunaan instrumen Non-Tes Menurut Widoyoko
(2009:14) dalam Ratnawulan dan Rusdiana adalah untuk memperoleh hasil belajar
non-tes terutama dilakukan untuk mengukur hasil belajar yang berkenaan dengan
soft skill, terutama yang berhubungan dengan apa yang dapat dibuat atau
dikerjakan oleh peserta didik dari apa yang diketahui atau dipahaminya.
Menurut Hasyim dalam Rukajat (2018: 73) Penilaian nontes adalah
penilaian yang mengukur kemampuan siswa secara langsung dengan tugas-tugas
riil dalam proses pembelajaran. Penilaian yang dilakukan dengan teknis nontes
terutama bertujuan untuk memperoleh informasi yang berkaitan dengan evaluasi
hasil belajar peserta didik dari ranah sikap hidup dan ranah keterampilan.
2.1.2.3 Jenis Teknik Non-tes

Menurut Asrul dkk (2014:55-67) jenis non-tes adalah sebagai berikut:
a. Daftar Cek
Penilaian unjuk kerja dapat dilakukan dengan menggunakan daftar cek (ya -
tidak). Pada penilaian unjuk kerja yang menggunakan daftar cek, peserta didik
mendapat nilai apabila kriteria penguasaan kemampuan tertentu dapat diamati
oleh penilai. Jika tidak dapat diamati, pesertadidik tidak memperoleh nilai.
Kelemahan cara ini adalah penilai hanya mempunyai dua pilihan mutlak, misalnya
benar-salah, dapat diamatitidak dapat diamati. Dengan demikian tidak terdapat
nilai tengah.
b. Skala Rentang
Penilaian unjuk kerja yang menggunakan skala rentang memungkinkan
penilai memberi nilai penguasaan kompetensi tertentu karena pemberian nilai
secara kontinuum di mana pilihan kategori nilai lebih dari dua.
c. Penilaian Sikap
19
Sikap berangkat dari perasaan (suka atau tidak suka) yang terkait dengan
kecenderungan bertindak seseorang dalam merespon sesuatu/ objek. Sikap juga
sebagai ekspresi dari nilai-nilai atau pandangan hidup yang dimiliki oleh
seseorang. Sikap dapat dibentuk untuk terjadinya perilaku atau tindakan yang
diinginkan. Sikap terdiri dari tiga komponen, yakni: komponen afektif, komponen
kognitif, dan komponen konatif. Komponen afektif adalah perasaan yang dimiliki
oleh seseorang atau penilaiannya terhadap sesuatu objek. Komponen kognitif
adalah kepercayaan atau keyakinan seseorang mengenai objek. Adapun komponen
konatif adalah kecenderungan untuk berperilaku atau berbuat dengan cara-cara
tertentu berkenaan dengan kehadiran objek sikap.
d. Penilaian Proyek
Penilaian proyek merupakan kegiatan penilaian terhadap suatu tugas yang
harus diselesaikan dalam periode/waktu tertentu. Tugas tersebut berupa suatu
investigasi sejak dari perencanaan, pengumpulan data, pengorganisasian,
pengolahan dan penyajian data. Penilaian proyek dapat digunakan, diantaranya
untuk mengetahui pemahaman dan pengetahuan dalam bidang tertentu,
kemampuan peserta didik mengaplikasikan pengetahuan tersebut dalam
penyelidikan tertentu, dan kemampuan peserta didik dalam menginformasikan
subyek tertentu secara jelas. Penilaian proyek dapat dilakukan mulai perencanaan,
proses selama pengerjaan tugas, dan terhadap hasil akhir proyek. Dengan
demikian guru perlu menetapkan hal-hal atau tahapan yang perlu dinilai, seperti
penyusunan disain, pengumpulan data, analisis data, kemudian menyiapkan
laporan tertulis. Laporan tugas atau hasil penelitiannya juga dapat disajikan dalam
bentuk poster. Pelaksanaan penilaian ini dapat menggunakan alat/instrumen
penilaian berupa daftar cek (checklist) ataupun skala rentang (rating scale).
e. Penilaian Produk
Penilaian produk adalah penilaian terhadap keterampilan dalam membuat
suatu produk dan kualitas produk tersebut. Penilaian produk tidak hanya diperoleh
dari hasil akhir saja tetapi juga proses pembuatannya. Penilaian produk meliputi
penilaian terhadap kemampuan peserta didik membuat produk-produk teknologi
dan seni, seperti: makanan, pakaian, hasil karya seni (patung, lukisan, gambar),
barang-barang terbuat dari kayu, keramik, plastik, dan logam.
f. Penilaian Portofolio
20
Penilaian portofolio merupakan penilaian berkelanjutan yang didasarkan
pada kumpulan informasi yang menunjukkan perkembangan kemampuan peserta
didik dalam satu periode tertentu. Informasi perkembangan peserta didik tersebut
dapat berupa karya peserta didik (hasil pekerjaan)dari proses pembelajaran yang
dianggap terbaik oleh peserta didiknya, hasil tes (bukan nilai), piagam
penghargaan atau bentuk informasi lain yang terkait dengan kompetensi tertentu
dalam satu mata pelajaran. Berdasarkan informasi perkembangan tersebut, guru
dan peserta didik sendiri dapat menilai perkembangan kemampuan peserta didik
dan terus melakukan perbaikan. Dengan demikian, portofolio dapat
memperlihatkan perkembangan kemajuan belajar peserta didik melalui karya
peserta didik, antara lain: karangan, puisi, surat, komposisi, musik.
g. Penilaian Diri
Penilaian diri (self assessment) adalah suatu teknik penilaian, di mana
subjek yang ingin dinilai diminta untuk menilai dirinya sendiri berkaitan dengan,
status, proses dan tingkat pencapaian kompetensi yang dipelajarinya dalam mata
pelajaran tertentu. Teknik penilaian diri dapat digunakan dalam berbagai aspek
penilaian, yang berkaitan dengan kompetensi kognitif, afektif dan psikomotor.
According to Lee C (2006:61) Peer assessment and self-assessment are

important forms of assessment that engage pupils in talking about their learning and
therefore help them to become self-critical and independent. They are not replacements for
teacher marking and feedback. As with all areas of learning mathematics, pupils need to
learn how to talk about their learning, the language and expressions to use in critiquing
others’ work and how to discuss problems and strategies with one another. This will take
time and effort but the rewards are worthwhile. Peer assessment helps pupils learn the
skills of self-assessment and also provides a rich resource of ideas that pupils can use in
their own learning. When a group of pupils are engaged in peer assessment, the group will
be talking about mathematical ideas and making and sharing meanings about those ideas.
Each member will be part of the group’s articulation of ideas and strategies and will
thereby begin to internalize both the language and the ideas that are used. Peer and self-
assessment provide a framework for talking about learning and therefore encourage meta-
cognition, that is, thinking and talking about how and what pupils are learning. Engaging
in peer and self-assessment enables pupils to become selfreliant learners; they can guide
their own learning because they know what they are trying to achieve and what they have
to do to get there. Through peer and self-assessment, pupils become involved in the
analysis and constructive criticism of their own work and this increases their rates of
progress and levels of attainment. Pupils become able to focus their learning on the areas
in which they feel they have the least confidence. They can pinpoint which parts/concepts in
the topic give the most difficulty and concentrate their efforts where it will help most. Peer
and self-assessment also enable teachers to learn more quickly and accurately about their
pupils’ ideas or difficulties and give them a deeper understanding of all pupils’ progress
and problems. Teachers can then decide where their time is best employed, who can carry
on and who needs particular input.
21
Menurut Lee C (2006:61), Penilaian teman dan penilaian diri adalah
bentuk penilaian penting yang melibatkan siswa dalam berbicara tentang
pembelajaran mereka dan karenanya membantu mereka menjadi kritis dan
mandiri. Mereka bukan pengganti untuk penilaian dan umpan balik guru. Seperti
halnya semua bidang pembelajaran matematika, siswa perlu belajar bagaimana
berbicara tentang pembelajaran mereka, bahasa dan ungkapan yang digunakan
untuk mengkritik pekerjaan orang lain dan bagaimana membahas masalah dan
strategi satu sama lain. Ini akan membutuhkan waktu dan usaha tetapi hasilnya
bermanfaat. Penilaian sejawat membantu siswa mempelajari keterampilan
penilaian diri dan juga menyediakan sumber ide yang kaya yang dapat digunakan
siswa dalam pembelajaran mereka sendiri. Ketika sekelompok siswa terlibat
dalam penilaian sejawat, kelompok itu akan berbicara tentang ide-ide matematika
dan membuat dan berbagi makna tentang ide-ide itu. Setiap anggota akan menjadi
bagian dari artikulasi ide dan strategi kelompok dan karenanya akan mulai
menginternalisasi bahasa dan ide-ide yang digunakan. Penilaian diri menyediakan
kerangka kerja untuk berbicara tentang belajar dan karena itu mendorong meta-
kognisi, yaitu berpikir dan berbicara tentang bagaimana dan apa yang dipelajari
siswa. Terlibat dalam penilaian teman sebaya dan diri memungkinkan siswa untuk
menjadi pembelajar mandiri; mereka dapat membimbing pembelajaran mereka
sendiri karena mereka tahu apa yang ingin mereka capai dan apa yang harus
mereka lakukan untuk mencapainya. Melalui penilaian teman sebaya dan diri
sendiri, siswa terlibat dalam analisis dan kritik konstruktif atas pekerjaan mereka
sendiri dan ini meningkatkan tingkat kemajuan dan tingkat pencapaian mereka.
Murid menjadi mampu memusatkan pembelajaran mereka pada bidang-bidang di
mana mereka merasa paling tidak percaya diri. Mereka dapat menentukan bagian /
konsep mana dalam topik yang paling menyulitkan dan memusatkan upaya
mereka di tempat yang paling membantu. Peer dan penilaian diri juga
memungkinkan guru untuk belajar lebih cepat dan akurat tentang ide atau
kesulitan siswa mereka dan memberi mereka pemahaman yang lebih dalam
tentang semua kemajuan dan masalah siswa. Guru kemudian dapat memutuskan
di mana waktu mereka paling baik digunakan, siapa yang dapat melanjutkan dan
siapa yang membutuhkan input khusus.
22
Menurut Maruti dan Malawi (2016: 13-14), teknik non-test terdiri dari:
a. Skala bertingkat (rating scale)
Teknik ini menggambarkan suatu nilai yang berbentuk bilangan tehadap
suatu pertimbangan.
b. Kuesioner (Questionaire)
Teknik kuesioner sering dikenal dengan angket, yaitu daftar pertanyaan
yang harus diisi oleh responden. Melalui teknik angket ini dapat diungkap
mengani data diri, pengalaman. pengetahuan, sikap atau pendapat. dll. Mengenai
macam anget dapat ditinjau dari berbagai segi. yaitu:
1) Ditinjau dari segi testee, dibedakan menjadi angket langsung dan angket tidak
langsung.
2) Ditinjau dari segi cara menjawab, dapat dibedakan menjadi: angket terbuka
dan angket tenutup.
c. Daftar Cocok (Chek list)
Daftar cocok (chek list) yaitu deretan pernyataan (biasanya singkat-singkat).
dlmana responden tinggal membubuhkan tanda cocok (V) di tempat yang telah
disediakan.
d. Wawancara (Interview)
Wawancara adalah suatu metode pengumpulan data dengan mendapatkan
jawaban dari interview dengan cara tanya jawab sepihak (oleh pihak interviewer).
Wawancara dapat dllakukan dengan dua cara. ya‘nu: interview bebas dan
interview terpimpin.
e. Pengamatan (Observation)
Observasi adalah suam teknik yang dilakukan dengan cara mengadakan
pengamatan secara teliti dan dengan pencatatan secara sistematis. Terdapat tiga
macam observasi. yaitu: observasi partisipan, observasi sistematik. dan obsevasi
eksperimental.
f. Riwayat Hidup
Riwayat hidup adalah gambaran tentang keadaan seseorang selama dalam
masa kehidupannya. Dengan mempelajari riwayat hidup. maka subyek evaluasi
akan dapat menarik suatu kesimpulan tentang kepribadian, kebiasaan. sikap dari
subyek yang dikenai penilaian.
23
Menurut Arifin (2012: 200-210), teknik non-tes terdiri dari:
1. Daftar Cek (check list)
Daftar cek adalah suatu daftar yang berisi subjek dan aspek-aspek yang akan
diamati. Daftar cek dapat memungkinkan Anda mencatat tiap-tiap kejadian yang
betapapun kecilnya, tetapi dianggap penting. Ada bermacam-macam aspek
perbuatan yang biasanya dicantumkan dalam daftar cek, kemudian Anda sebagai
observer tinggal memberikan tanda cek pada tiap-tiap aspek tersebut sesuai
dengan hasil pengamatannya. Daftar cek banyak manfaatnya, antara lain (1) dapat
membantu guru untuk mengingat-ingat apa yang harus diamati (2) dan dapat
memberikan informasi kepada stakeholder. Namun demikian, Anda tetap harus
waspada kemungkinan perilaku penting yang belum tercakup di dalam daftar cek,
karena itu Anda jangan terlalu kaku dengan apa yang sudah tertulis pada daftar
cek tersebut.
2. Skala Penilaian (rating scale)
Dalam daftar cek, Anda hanya dapat mencatat ada-tidaknya variabel tingkah
laku tertentu, sedangkan dalam skala penilaian fenomena-fenomena yang akan
diobservasi itu disusun dalam tingkatan-tingkatan yang telah ditentukan. Jadi,
tidak hanya mengukur secara mutlak ada atau tidaknya variabel tertentu, tetapi
lebih jauh mengukur bagaimana intensitas gejala yang ingin diukur. Pencatatan
melalui daftar cek termasuk pencatatan yang kasar. Fenomena-fenomena hanya
dicatat ada atau tidak ada. Hal ini agak kurang realistik. Perilaku manusia, baik
yang berwujud sikap jiwa, aktifitas, maupun prestasi belajar timbul dalam tingkat-
tingkat tertentu. Oleh karena itu, untuk mengukur hal-hal tersebut ada baiknya
digunakan skala penilaian.
Namun demikian, skala penilaian juga mempunyai kelemahan. Menurut
Zainal Arifin (2011) kelemahan skala penilaian adalah “ada kemungkinan halo
effects,generosity effects, dan cary-over effects”. Ada kemungkinan terjadinya
halo effects, yaitu kelemahan yangakan timbul jika dalam pencatatan observasi
terpikat oleh kesan-kesan umum yang baik pada peserta didik sementara ia tidak
menyelidiki kesan-kesan umum itu. Misalnya, seorang guru terkesan oleh sopan
santun dari peserta didik, sehingga memberikan nilai yang tinggi pada segi-segi
yang lain, padahal mungkin peserta didik tersebut tidak demikian adanya. Bisa
24
juga guru terkesan dengan model berpakaian atau penampilan umum peserta
didik. Begitu juga sebaliknya, seorang guru mungkin memberikan nilai yang
rendah, karena peserta didik kurang sopan dan tidak berpakaian rapih.
3. Angket (quetioner)
Angket termasuk alat untuk mengumpulkan dan mencatat data atau
informasi, pendapat, dan paham dalam hubungan kausal. Angket mempunyai
kesamaan dengan wawancara, kecuali dalam implementasinya. Angket
dilaksanakan secara tertulis, sedangkan wawancara dilaksanakan secara lisan.
Keuntungan angket antara lain (1) responden dapat menjawab dengan bebas
tanpa dipengaruhi oleh hubungan dengan peneliti atau penilai, dan waktu relatif
lama, sehingga objektifitas dapat terjamin (2) informasi atau data terkumpul lebih
mudah karena itemnya homogeny (3) dapat digunakan untuk mengumpulkan data
dari jumlah responden yang besar yang dijadikan sampel. Sedangkan
kelemahannya adalah (1) ada kemungkinan angket diisi oleh orang lain (2) hanya
diperuntukkan bagi yang dapat melihat saja (3) responden hanya menjawab
berdasarkan jawaban yang ada.
Angket terdiri atas beberapa bentuk, yaitu :
Bentuk angket berstruktur, yaitu angket yang menyediakan beberapa
kemungkinan jawaban. Bentuk angket berstruktur terdiri atas tiga bentuk, yaitu :
a. Bentuk jawaban tertutup, yaitu angket dimana setiap pertanyaannya sudah
tersedia berbagai alternatif jawaban.Bentuk jawaban tertutup, tetapi pada
alternatif jawaban terakhir diberikan secara terbuka. Hal ini dimaksudkan
untuk memberikan kesempatan kepada peserta didik untuk menjawab secara
bebas.
b. Bentuk jawaban bergambar, yaitu angket yang memberikan jawaban dalam
bentuk gambar.
c. Bentuk angket tak berstruktur yaitu bentuk angket yang memberikan jawaban
secara terbuka dimana peserta didik secara bebas menjawab pertanyaan
tersebut. Hal ini dapat memberikan pemahaman yang lebih mendalam tentang
situasi, tetapi kurang dapat dinilai secara objektif. Jawabannya tidak dapat
dianalisis secara statistik, sehingga kesimpulannya pun hanya merupakan
pandangan yang bersifat umum.
25
4. Studi Kasus (case study)
Studi kasus adalah studi yang mendalam dan komprehensif tentang peserta
didik atau madrasah yang memiliki kasus tertentu. Misalnya, peserta didik yang
sangat cerdas, sangat lamban, sangat rajin, sangat nakal atau kesulitan-kesulitan
dalam belajar. Pengertian mendalam dan komprehensif adalah mengungkap semua
variabel dan aspek-aspek yang melatarbelakanginya, yang diduga menjadi
penyebab timbulnya perilaku atau kasus tersebut dalam kurun waktu tertentu.
Untuk itu, Anda harus menjawab tiga pertanyaan inti dalam studi kasus, yaitu :
Mengapa kasus tersebut bisa terjadi ?
Apa yang dilakukan oleh seseorang dalam kasus tersebut ?
Bagaimana pengaruh tingkah laku seseorang terhadap lingkungan ?
Studi kasus sering digunakan dalam evaluasi, bimbingan, dan penelitian.
Studi ini menyangkut integrasi dan penggunaan data yang komprehensif tentang
peserta didik sebagai suatu dasar untuk melakukan diagnosis dan mengartikan
tingkah laku peserta didik tersebut. Penekanannya adalah pada diagnosis masalah-
masalah peserta didik dan memberikan rekomendasi untuk mengatasinya. Dalam
melakukan studi kasus, guru harus terlebih dahulu mengumpulkan data dari
berbagai sumber dengan menggunakan berbagai teknik dan alat pengumpul data.
Salah satu alat yang dapat digunakan adalah depth-interview yaitu melakukan
wawancara secara mendalam. Jenis data yangdiperlukan antara lain : latar
belakang kehidupan, latar belakang keluarga, kesanggupan dan kebutuhan,
perkembangan kesehatan, dan sebagainya.
5. Catatan Insidental (anecdotal records)
Catatan insidental ialah catatan-catatan singkat tentang peristiwa-peristiwa
sepintas yang dialami peserta didik secara perorangan. Catatan ini merupakan
pelengkap dalam rangka penilaian guru terhadap peserta didiknya, terutama yang
berkenaan dengan tingkah laku peserta didik. Catatan tersebut biasanya berbunyi :
a. Tanggal 23 Pebruari 2008, Gita menangis sendiri di belakang madrasah, tanpa
sebab.
b. Tanggal 05 Maret 2008, Gita mengambil mistar teman sebangkunya dan tidak
mengembalikannya.
26
Catatan insidental semacam ini mungkin belum berarti apa-apa bagi
keperluan penilaian Gita, tetapi setelah dihubungkan dengan data-data yang lain
seringkali memberikan petunjuk yang berguna. Catatan ini dapat dibuat di buku
khusus atau pada kartu-kartu kecil, sehingga memudahkan dalam penafsirannya
6. Sosiometri
Sosiometri adalah suatu prosedur untuk merangkum, menyusun, dan sampai
batas tertentu dapat mengkuantifikasi pendapat-pendapat peserta didik tentang
penerimaan teman sebayanya serta hubungan di antara mereka. Seperti Anda
ketahui, di madrasah banyak peserta didik kurang mampu menyesuaikan diri
dengan lingkungannya. Ia nampak murung, mengasingkan diri, mudah
tersinggung atau bahkan over-acting. Hal ini dapat dilihat ketika mereka sedang
istirahat, bermain atau mengerjakan tugas kelompok. Fenomena tersebut
menunjukkan adanya kekurangmampuan peserta didik dalam menyesuaikan diri
dengan lingkungannya. Kondisi seperti ini perlu diketahui dan dipelajari oleh
7. Inventori Kepribadian
Inventori kepribadian hampir serupa dengan tes kepribadian. Bedanya, pada
inventori, jawaban peserta didik tidak memakai kriteria benar-salah. Semua
jawaban peserta didik adalah benar selama ia menyatakan yang sesungguhnya.
Walaupun demikian, dipergunakan pula skala-skala tertentu untuk kuantifikasi
jawaban, sehingga dapat dibandingkan dengan kelompoknya. Aspek-aspek
kepribadian yang biasanya dapat diketahui melalui inventori ini, seperti : sikap,
minat, sifat-sifat kepemimpinan, dominasi, dan sebagainya.
Ada beberapa instrumen non-tes menurut Djaali dan Muljono (2007:16-23)

yaitu:
a. Pedoman Observasi
Secara umum pengertian observasi adalah cara menghimpun bahan-bahan
keterangan yangg dilakukan dengan mengadakan pengamatan dan pencatatan
secara sistematis terhadap fenomena-fenomena yang dijadikan objek pengamatan.
Observasi sebagai alat evaluasi banyak digunakan untuk menilai tingkah laku
individu atau proses terjadinya suatu kegiatan yang dapat diamati. Observasi ynag
dapat menilai dan mengukur hasil belajar adalah tingkah laku para siswa pada
27
waktu guru mengajar. Observasi dapat dilakukan secara partipasif maupun non
partisipasif.
Observasi dapat pula berbentuk observasi eksperimental yaitu observasi
yang dilakukan dalam situasi yang dibuat dan observasi non- eksperimental yaitu
observasi yang dilakukan dalam situasi yang wajar. Jika observasi digunakan
sebagai alat evaluasi, maka pencatatan hasil observasi lebih sukar daipada
mencatat jawaban yang diberikan oleh peserta tes terhadap pertanyaan yang
diberikan dalam suatu tes, karena respon observasi adalah tingkah laku dimana
proses kejadian nya berlangsung cepat.
b. Pedoman wawancara
Secara umum yang dimaksud dengan wawancara adalah cara menghimpun
bahan bahan keterangan yang dilaksanakan dengan tanya jawab baik secara Iisan,
sepihak, berhadapan muka, maupun kesulitan-kesulitan arah serta tujuan yang
telah ditentukan. Ada dua jenis wawancara yang dapat dipergunakan sebagal alat
evaluasi yaitu:
1) Wawancara terpimpin (guidedintamow) yang juga dikenal dengan wawancara
berstruktur atau wawancara sistematis.
2) Wawancara tidak terpimpin (unguided interview) yang dikenal dengan istilah
wawancara sederhana atau wawancara bebas.
Salah satu kelebihan yang dimiiiki wawancara adalah pewawancara sebagai
evaluator dapat melakukan kontak langsung dengan peserta didik yang akan
dinilai, sehingga dapat diperoleh hasil penilaian yang lebih lengkap dan
mendalam. Dengan melakukan wawancara, pesrta didik dapat mengeluarkan isi
pemikiran atau hatinya secara lebih bebas.
Jika wawancara dilakukan secara bebas, maka pewawancara tidak perlu
persiapan yang matang, tetapi jika wawancara dilakukan secara sistematis, maka
pewawancara perlu ada pedoman wawancara yang berisi pokok-pokok pertanyaan
yang akan ditanyakan kepada responden. Mencatat dan mengolah hasil
wawancara jauh lebih sulit dibadingkan dengan mencatat dan mengolah hasil
observasi atau hasil tes .
c. Angket (Kuesioner)
Angket dapat juga digunakan sebagai alat untuk menilai hasil belajar. Jika
dalam wawancara pewawancara berhadap langsung dengan responden atau siswa.
maka dengan angket penilaian hasil belajar akan jauh Iebih praktis, hemat waktu
28
dan tenaga. Kelemahannya yaitu kemungkinan adanya jawaban yang diberikan
dalam angket tidak sesuai dengan keadaan yang sebenarnya. Apalagi penanyaan
dalam angket tidak dirumuskan dengan jelas sehingga membingungkan
responden.
Angket dapat diberikan Iangsung kepada responden, dapat juga diberikan
kepada orang lain yang mengenal berbagai karakteristik responden untuk
melakukan penilaian terhadap responden. Angket untuk mengukur hasil belajar
dapat diberikan kepada orang tua siswa atau gurunya.
Data yang dihimpun melalui angket biasanya adalah data yang berkenaan
dengan kesulitan-kesulitan yang dihadapi oleh siswa dalam mengikuti pelajaran,
antara lain: cara belajar, fasilitas belajar yang tersedia. bimbingan guru dan orang
tua, motivasi dan minat belaiar, sikap belajar, sikap terhadap mata pelajaran
tertentu dan pandangan siswa terhadap proses pembelajaran, serta sikap siswa
terhadap gurunya.
Angket pada umumnya dipergunakan untuk menilai hasil belajar pada ranah
afektit. Angket dapat disajikan dalam bentuk pilihan ganda atau bentuk skala
sikap, misalnya skala likert yang paling banyak djpergunakan orang, terutama
para peneliti di bidang pendidikan yang tertarik untuk meneliti aspek-aspek
psikologis yang diduga berpengaruh terhadap proses belajar mengajar.
Selain sebagai alat untuk mengukur hasil belajar siswa, angket juga berguna
untuk mengungkap latar belakang orang tua siswa maupun siswa itu sendiri di
mana data yang berhasil diperoleh melalui angket pada suatu saat akan dipadukan.
terutama jika terjadi kasus-kasus tertentu yang menyangkut pribadi siswa.
d. Pemeriksaan Dokumen
Untuk mengukur kemajuan belajar siswa dapat juga dilakukan dengan tanpa
pengujian tetapi dengan cara melakukan pemeriksaan dokumen-dokumen,
misalnya dokumen yang memuat informasi mengenai kapan siswa itu diterima di
sekolah tetsebut, dari mana sekolah asalnya, apakah siswa tersebut pemah tinggal
kelas, apakah ia pernah meraih kejuaraan sebagai siswa yang berprestasi di
sekolahnya, apakah ia memiliki keterampilan khusus, apakah ia pemah meraih
kejuaraan atau penghargaan khusus atas keterampilannya itu, dan lain sebagainya.
Berbagai informasi yang direkam melalui angket, baik informasi pribadi
siswa maupun informasi orang tua siswa dan lingkunganya akan bermanfaat pada
saat-saat tertentu sebagai bahan pelengkap untuk melakukan pengukuran hasil
pembelajaran terhadap siswa.
29
Dengan demikian maka dalam pelaksanaan pengukuran hasil belajar tidak
semata-mata dilakukan dengan tes, tetapi dapat juga dilakukan dengan
menggunakan non-tes, terutama untuk masalah-masalah yang berhubungan
dengan masalah kejiwaan pesena didik seperti persepsi terhadap mata pelajaran
tenentu, persepsi terhadap guru, minat, bakat, tingkah laku, dan sikap yang tidak
mungkin diukur dengan tes.
2.2 Kajian Kritis

Pengukuran adalah suatu kegiatan yang dilakukan untuk menentukan fakta
kuantitatif yang disesuiakan dengan kriteria-kriteria tertentu sesuai dengan objek
yang akan diukur. Penilaian merupakan proses penggambaran, memperoleh dan
memberikan informasi yang berguna sebagai alternatif pengambilan keputusan.
Suatu proses penilaian, ada yang didasarkan atas hasil pengukuran yang bersifat
kuantitatif dan ada pula yang kualitatif yang didasarkan atas non-pengukuran.
Penilaian adalah pengumpulan informasi informal tentang pengetahuan canggih
siswa melalui berbagai cara mengumpulkan informasi di berbagai waktu dan
dalam konteks yang berbeda. Evaluasi adalah proses menilai sesuatu berdasarkan
kriteria tertentu yang selanjutnya diikuti dengan pengambilan keputusan atas
objek yang dievaluasi.
Tes dapat juga diartikan sebagai alat pengukur yang mempunyai standar
objektif, sehingga dapat digunakan secara meluas, serta betul-betul dapat
digunakan untuk mengukur dan membandingkan keadaan psikis atau tingkah
laku. Tes dapat digunakan untuk mengukur banyaknya pengetahuan yang
diperoleh individu dari suatu bahan pelajaran yang terbatas pada tingkat tertentu.
Oleh karena itu, tes merupakan alat ukur ynag paling banyak digunakan dalam
pendidikan.
Secara umum ada beberapa fungsi tes dalam dunia Pendidikan, pertama tes
dapat digunakan sebagai alat mengukur prestasi belajar siswa. Sebagai alat untuk
mengukur prestasi belajar siswa tes dimaksudkan untuk mengukur tingkat
perkembangan atau kemajuan yang telah dicapai siswa menempuh proses belajar
mengajar dalam jangka waktu tertentu. Dalam kaitan ini tes berfungsi sebagai alat
untuk mengukur keberhasilan program pengajaran. Kedua tes berfungsi sebagai
motivator dalam pembelajaran. Secara umum, ada dua macam fungsi yang
30
dimiliki oleh teknik tes, yaitu: Sebagai alat pengukur terhadap peserta didik.
Dalam hubungan ini tes berfungsi mengukur tingkat perkembangan atau
kemajuan yang telah dicapai olrh peserta didik setelah mereka menempuh proses
belajar mengajar dalam jangka waktu tertentu. Yang kedua Sebagai alat pengukur
keberhasilan program pengajaran, sebab melalui tes tersebut akan dapat diketahui
sudah seberapa jauh program pengajaran yang telah ditentukan, telah dapat
dicapai.
Karakteristik tes yang baik. Mereka adalah: 1) tes harus valid, 2) tes harus
dapat diandalkan, 3) tes harus objektif, 4) tes harus dapat dipraktikkan, dan 5) tes
harus ekonomis. Dari lima karakteristik tes yang baik, dua yang pertama adalah
yang paling penting; mereka tes harus valid dan dapat diandalkan. Validitas adalah
sejauh mana tes mengukur apa yang ingin diukur. Sedangkan Reliabel adalah
dapat dipercaya atau dapat diandalkan.
Non tes adalah cara penilaian hasil belajar peserta didik yang dilakukan
tanpa menguji peserta didik tetapi dengan melakukan pengamatan secara
sistematis. Teknik evaluasi nontes berarti melaksanakan penilain dengan tidak
menggunakan tes. Teknik penilaian ini umumnya untuk menilai kepribadian anak
secara menyeluruh meliputi sikap, tingkah laku, sifat, sikap sosial dan lainlain.
Yang berhubungan dengan kegiatan belajar dalam pendidikan, baik secara
individu maupun secara kelompok. Penggunaan nontes untuk menilai hasil dan
proses belajar masih sangat terbatas jika dibandingkan dibandingkan dengan
penggunaan tes dalam menilai hasil dan proses belajar. Para guru disekolah
umumnya lebih banyak menggunakan tes dari pada bukan tes mengingat alatnya
mudah dibuat, penggunaannya lebih praktis dan yang dinilai terbatas pada aspek
kognitif berdasarkan hasil-hasil yang diperoleh peserta didik setelah
menyelesaikan pengalaman belajarnya.
Bentuk‐bentuk teknik nontes ialah observasi, penilaian diri, penilaian
antarteman, jurnal, angket, dan skala. Dalam kegiatan menilai, digunakan
sejumlah instrumen/alat penilaian yang disesuaikan dengan teknik yang dipakai
dalam menilai. Instrumen penilaian nontes yakni berbagai alat yang digunakan
dalam pengukuran dengan cara nontes. Instrumen nontes digunakan untuk
mengevaluasi hasil belajar aspek psikomotorik, sikap, atau nilai. Instrumen yang
31
digunakan dengan teknik nontes adalah lembar pengamatan, checklist observasi,
skala sikap, lembar penilaian diri/teman dan anekdot.
BAB III
PENUTUP
3.1 Kesimpulan
Dari pembahasan diatas maka dapat disimpulkan bahwa
1. Penilaian dapat didefinisikan sebagai semuanya kegiatan yang dilakukan oleh
guru dan siswa untuk mendapatkan informasi yang dapat digunakan untuk
mengubah proses belajar mengajar. Pengukuran merupakan suatu kegiatan
yang dilakukan untuk mengukur dalam arti memberi angka terhadap sesuatu
yang disebut objek pengukuran atau objek ukur. Evaluasi dalam sistem
pendidikan adalah salah satu kegiatan yang sangat penting dilaksanakan secara
teratur pada periode-periode tertentu, antara lain untuk memantau kualitas mutu
pendidikan dan membantu proses belajar mengajar (PBM) di kelas.
2. Secara umum tes dapat diartikan sebagai alat yang dipergunakan untuk
mengukur pengetahuan atau penguasaan obyek ukur terhadap seperangkat
konten tertentu. Tes dapat juga diartikan sebagai alat pengukur yang
mempunyai standar objektif, sehingga dapat digunakan secara meluas, serta
betul-betul dapat digunakan untuk mengukur dan membandingkan keadaan
psikis atau tingkah laku. Secara umum ada beberapa fungsi tes dalam dunia
Pendidikan, pertama tes dapat digunakan sebagai alat mengukur prestasi
belajar siswa. Kedua tes berfungsi sebagai motivator dalam pembelajaran.
Ketiga tes dapat berfungsi untuk upaya perbaikan kualitas pembelajaran.
Keempat, tes yang dimaksudkan untuk menentukan berhasil atau tidaknya
siswa sebagai syarat untuk melanjutkan Pendidikan pada jenjang yang lebih
tinggi.
3. Non tes adalah cara penilaian hasil belajar peserta didik yang dilakukan tanpa
menguji peserta didik tetapi dengan melakukan pengamatan secara sistematis.
Teknik evaluasi nontes berarti melaksanakan penilain dengan tidak
menggunakan tes. Bentuk‐bentuk teknik nontes ialah observasi, penilaian diri,
32
penilaian antarteman, jurnal, angket, dan skala. Dalam kegiatan menilai,
digunakan sejumlah instrumen/alat penilaian yang disesuaikan dengan teknik
yang dipakai dalam menilai. Instrumen penilaian nontes yakni berbagai alat
yang digunakan dalam pengukuran dengan cara nontes. Instrumen nontes
digunakan untuk mengevaluasi hasil belajar aspek psikomotorik, sikap, atau
nilai. Instrumen yang digunakan dengan teknik nontes adalah lembar
pengamatan, checklist observasi, skala sikap, lembar penilaian diri/teman dan
anekdot.
3.2 Saran
Walaupun penulis menginginkan kerapihan dan kesempurnaan ketika
menyusun makalah ini namun pada kenyatannya masih banyak sekali kekurangan-
kekurangan yang perlu diperbaiki ulang oleh penulis. Persoalan ini dikarenakan
masih sangat sedikitnya pengetahuan penulis. Maka dari itu penulis sangat
berharap sekali bahwa para pembaca selalu memberikan sebuah kritikan dan saran
kepada penulis agar penulis bisa menjadikan saran dan kritikan yang diberikan
oleh para pembaca ini dijadikan sebagai bahan evaluasi untuk selanjutnya.
Semoga makalah ini dapat bermanfaat bagi kita semua.
33
DAFTAR PUSTAKA
Arifin Zainal. 2012. Evaluasi Pembelajaran. Jakarta: Direktorat Jenderal

pendidikan Islam.
Asrul, Ananda, R. Dan Rosnita. 2014. Evaluasi Pembelajaran. Bandung:

Citapustaka Media.
Bisri H dan Ichsan M. 2015. Penilaian Otentik Dengan Teknik Nontes Di Sekolah
Dasar. Jurnal Sosial Humaniora, ISSN 2087‐4928 Volume 6 Nomor 2.
Cohen, L. Manion, L. and Marrison K. 2000. Research methods in education.

New York : RoutledgeFalmer.
Djali dan Muljono, 2007. Pengukuran dalam bidang Pendidikan. Grasindo:

Jakarta.
Gall, M.D., Gall, J.P and Borg, W.R. Education Research. An Introduction
Seventh Edition. New York: Longman Inc.
Hasanuddin and Talib R. 2018. Elt Assessment. Yogyakarta: Deepublish
Istiyono E, Mardapi D, dan Suparno. 2014. Pengembangan Tes Kemampuan

Berpikir Tingkat Tinggi Fisika (Pysthots) Peserta Didik Sma. Yogyakarta:
Jurnal Penelitian dan Evaluasi Pendidikan Nomor 1.
Kete, Sukadir. 2017. Implementasi Evaluasi Program Model Formatif Mata

Pelajaran Bahasa Indonesia Pada Smp Negeri 4 Kendari Kota Kendari.
Jurnal Al-Ta’dib. Vol. 10 No. 1.
Kinra. 2008. Guidance and Counselling. India: Dorling Kindersley.
Lee C. 2006. Languange for Learning Mathematics. New York: Two penn
Maruti dan Malawi. 2016. Evaluasi pendidikan. Magetan: Media grafika
Matondan Zulkifli. 2009. Validitas Dan Reliabilitas Suatu Instrumen Penelitian.

Jurnal Tabularasa Pps Unimed. Vol.6 No.1, Juni 2009.
McAllister, Orlando. 2017. Academic Testing, Measurement, and Evaluation in

the Classroom. Faculty Publications. 131.
Nasab Fatemeh Ghanavati. 2015. Alternative versus Traditional Assessment.
Journal of Applied Linguistics and Language Research. Volume 2, Issue 6,
2015, pp. 165-178. ISSN: 2376-760X.
34
Rusman. 2007. Belajar dan pembelajaran beroriensi standar proses Pendidikan.
Kencana: Jakarta.
Sah, K.P. 2012. Assessment And Test In Teaching And Learning. Academic Voices
A Multidisciplinary Journal. Volume 2, N0. 1.
Sekyi. 2016. Assessment, Student Learning and Classroom Practice: A Review.

Journal of Education and Practice. ISSN 2222-1735 (Paper) ISSN 2222-
288X (Online) Vol.7, No.21.
Setiyana Rusma. 2016. Analysis Of Summative Tests For English. English

Education Journal (Eej),Volume 7. No 4.
Suryani, Y, E. 2017. Pemetaan Kualitas Empirik Soal Ujian Akhir Semester Pada
Mata Pelajaran Bahasa Indonesia Sma Di Kabupaten Klaten. Jurnal
Penelitian Dan Evaluasi Pendidikan. Volume 21, No 2.
Susongko Purwo. 2010. Perbandingan Keefektifan Bentuk Tes Uraian Dan Testlet
Dengan Penerapan Graded Response Model (Grm). Jurnal Penelitian dan
Evaluasi Pendidikan, Nomor 2.
Utami P. 2015. Hubungan Tes Formatif Dengan Motivasi Belajar Asuhan

Persalinan Pada Mahasiswi Universitas M.H Thamrin. Jurnal Ilmu
Kesehatan, Volume 7. No 2.
Wulan, E.R. dan Rusdiana. 2013. Evaluasi Pembelajaran. Bandung: Pustaka

Setia.
Noelaka A. dan Noelaka G. 2017. Landasan Pendidikan: Dasar Pengenalan Diri

Sendiri Menuju Perubahan Hidup. Depok: Kencana.
Sugianto A. 2017. Validity and Reliability of English Summative Test for Senior
High School. Journal of ELT, Linguistic, and Literature. Volume 3, No 2.
35

PHBF Makalah 4

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

PHBF Makalah 4

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB I

Menurut Biggs dam Sekyi (2016:1), Penilaian merupakan bagian integral

2.1.2 Konsep Penilaian Tes

2.1.2.2 Fungsi Tes

Menurut Oriondo and Dallo-antonio (1984:9 ), Tes memberi guru informasi

2.1.2.3 Penggolongan tes

2.1.2.4 Bentuk-Bentuk Tes

2.1.2.5 Ciri-Ciri Tes yang Baik

According to Djiwandono and Sudijono in Sugianto (2017: 23) It is known that a

Menurut Djiwandono dan Sudijono dalam Sugianto (2017: 23) diketahui

2.1.3 Konsep Penilaian Non-Tes

2.1.3.2 Kegunaan Non-Tes

2.1.2.3 Jenis Teknik Non-tes

According to Lee C (2006:61) Peer assessment and self-assessment are

Ada beberapa instrumen non-tes menurut Djaali dan Muljono (2007:16-23)

2.2 Kajian Kritis

Arifin Zainal. 2012. Evaluasi Pembelajaran. Jakarta: Direktorat Jenderal

Asrul, Ananda, R. Dan Rosnita. 2014. Evaluasi Pembelajaran. Bandung:

Cohen, L. Manion, L. and Marrison K. 2000. Research methods in education.

Djali dan Muljono, 2007. Pengukuran dalam bidang Pendidikan. Grasindo:

Hasanuddin and Talib R. 2018. Elt Assessment. Yogyakarta: Deepublish

Istiyono E, Mardapi D, dan Suparno. 2014. Pengembangan Tes Kemampuan

Kete, Sukadir. 2017. Implementasi Evaluasi Program Model Formatif Mata

Kinra. 2008. Guidance and Counselling. India: Dorling Kindersley.

Maruti dan Malawi. 2016. Evaluasi pendidikan. Magetan: Media grafika

Matondan Zulkifli. 2009. Validitas Dan Reliabilitas Suatu Instrumen Penelitian.

McAllister, Orlando. 2017. Academic Testing, Measurement, and Evaluation in

Sekyi. 2016. Assessment, Student Learning and Classroom Practice: A Review.

Setiyana Rusma. 2016. Analysis Of Summative Tests For English. English

Utami P. 2015. Hubungan Tes Formatif Dengan Motivasi Belajar Asuhan

Wulan, E.R. dan Rusdiana. 2013. Evaluasi Pembelajaran. Bandung: Pustaka

Noelaka A. dan Noelaka G. 2017. Landasan Pendidikan: Dasar Pengenalan Diri

Anda mungkin juga menyukai