PENDAHULUAN
1.1 Latar Belakang
Di dalam dunia pendidikan, kita mengetahui bahwa setiap jenis atau
bentuk pendidikan pada waktu-waktu tertentu selama satu periode pendidikan,
selalu mengadakan evaluasi. Artinya pada waktu-waktu tertentu selama satu
periode pendidikan, selalu mengadakan penilaian terhadap hasil yang telah
dicapai, baik oleh pihak terdidik maupun oleh pendidik.
Belajar adalah suatu proses yang kompleks yang terjadi pada setiap orang
sepanjang hidupnya. Proses belajar itu terjadi karena adanya interaksi antara
seseorang dengan lingkungannya. Oleh karena itu, belajar dapat terjadi kapan saja
dan di mana saja. Salah satu indikator bahwa seseorang itu telah belajar adalah
adanya suatu perubahan tingkah laku pada orang itu yang mungkin disebabkan
oleh terjadinya perubahan pada tingkat pengetahuan, keterampilan, atau sikapnya.
Demikian pula dalam satu kali proses pembelajaran, guru hendaknya
menjadi seorang evaluator yang baik. Kegiatan ini dimaksudkan untuk
mengetahui apakah tujuan yang telah dirumuskan itu tercapai atau belum, dan
apakah materi pelajaran yang diajarkan sudah tepat. Semua pertanyaan tersebut
akan dapat dijawab melalui kegiatan evaluasi atau penilaian.
Penilaian atau evaluasi berhubungan dengan setiap bagian dari proses
pendidikan, bukan hanya keberhasilan belajar saja, tetapi mencakup semua proses
belajar mengajar. Kegiatan penilaian tidak hanya terbataspada karateristik peserta
didik saja, tetapi juga mencakup karakteristik metode mengajar, kurikulum,
fasilitas dan administrasi sekolah.
Dalam fungsinya sebagai penilai hasil belajar peserta didik, guru
hendaknya terus menerus mengikuti hasil belajar yang telah dicapai oleh peserta
didik dari waktu ke waktu. Informasi yang diperoleh melalui evaluasi ini
merupakan umpan balik (feed back) terhadap proses belajar mengajar. Umpan
balik ini akan dijadikan titik tolak untuk memperbaiki dan meningkatkan proses
belajar mengajar selanjutnya. Dengan demikian proses belajar mengajar akan
terus dapat ditingkatkan untuk memperoleh hasil yang optimal.
1
Evaluasi memiliki kedudukan yang penting dalam proses pembelajaran.
Dengan melakukan evaluasi, guru sebagai pengelola kegiatan pembelajaran dapat
mengetahui kemampuan yang dimilikipeserta didik, ketepatan metode yang
digunakan, dan keberhasilan peserta didik dalam meraih kompetensi yang telah
ditetapkan.
Berdasarkan hasil penilaian, pendidik dapat mengambil keputusan secara
tepat untuk menentukan langkah yang akan diambil selanjutnya . Hasil penilaian
juga dapat memberikan motivasi kepada peserta didik untuk berprestasi lebih baik
di kemudian hari.
Selanjutnya didalam melakukan evaluasi ada dua teknik evaluasi yang kita
kenal yaitu teknik evaluasi menggunakan tes dan evaluasi dengan teknik non tes,
Teknik non tes pada umumnya memegang peranan penting dalam rangka
mengevaluasi hasil belajar peserta didik dari segi ranah sikap (affective domain)
dan ranah keterampilan (Psychomotoric domain), sedangkan teknik tes lebih
banyak digunakan untuk mengevaluasi hasil belajar peserta didik dari segi ranah
proses berfikirnya (cognitif domain).
1.2 Tujuan
1. Untuk mengetahui pengertian pengukuran, penilaian, dan evaluasi
2. Untuk mengetahui konsep penilaian tes.
3. Untuk mengetahui konsep penilaian non tes.
BAB II
2
PEMBAHASAN
2.1 Kajian Pustaka
2.1.1 Pengertian Pengukuran, Penilaian dan Evaluasi
Pengukuran merupakan suatu kegiatan yang dilakukan untuk mengukur
dalam arti memberi angka terhadap sesuatu yang disebut objek pengukuran atau
objek ukur. Mengukur pada dasarnya adalah pemasangan atau koprespondensi
(Djaali dan Muljono, 2007: 1).
Menurut Cangelosi dalam Noelaka dan Noelaka (2017:140) Pengukuran
dalam Pendidikan adalah proses pengumpulan data melalui pengamatan empiris.
Proses pengumpulan ini dilakukan untuk menaksir apa yang diperoleh siswa
setelah mengikuti pelajaran selama waktu tertentu.
According to Biggs in Sekyi (2016:1)
Assessment is integral to teaching and learning activities in school and mediates the
interaction between teachers and students in the classroom. Assessment can be defined as
all activities that teachers and students undertake to get information that can be used to
alter teaching and learning. This includes teacher observation and analysis of student work
(homework, tests, essays, reports, practical procedures and classroom discussion of issues).
All these are concerned with sampling what a student may or may not know. Assessment is
also used in ‘selecting, controlling or motivating students, and to satisfy public
expectations as to standards and accountability’.
3
Menurut Kulieke dalam Nasab (2015: 166), Penilaian dan pengujian harus
ditetapkan. Penilaian adalah pengumpulan informasi informal tentang
pengetahuan canggih siswa melalui berbagai cara mengumpulkan informasi di
berbagai waktu dan dalam konteks yang berbeda. Pengujian, bagaimanapun,
adalah formal dan terstandarisasi dan menawarkan siswa nilai pada tugas yang
telah mereka lakukan. Pengujian adalah latihan satu kali dan waktunya yang
dianggap sebagai satu-satunya kriteria di mana pembelajaran siswa dapat diukur.
Banyak sarjana saat ini abstain dari menerima bahwa ada satu metode tunggal
mengumpulkan data mengenai pembelajaran siswa. Oleh karena itu, pengujian
dipandang sebagai hanya satu komponen dari konsep penilaian yang lebih luas.
Penilaian merupakan upaya memperoleh informasi secara komprehensif
mengenai kekuatan, kelemahan dan kemajuan belajar siswa yang meliputi aspek
kognitif, afektif, dan psikomotor.Penilaian oleh guru dapat diketahui dari segi
perencanaan, pelaksanaan dan pelaporan hasil belajar siswa. Perencanaan
penilaian dapat terdeteksi melalui silabus, rencana pelaksanaan pembelajaran, dan
kiss-kiss soal dalam penilaian yang digunakan guru. Pelaksanaan penilaian dapat
dilihat dari dokumen siswa dan buku penilaian guru.Pelaporan hasil belajar siswa
dapat dilihat dari buku laporan (rapor) hasil belajar siswa (Sukadir, 2017 : 110).
Evaluasi pada dasarnya merupakan penafsiran atau interpretasi yang
bersumber pada data kuantitatif, sedang data kuantitatif merupakan hasil dari
pengukuran. Evaluai hampir sama dengan penilaian, bedanya dalam evaluasi
berakhir dengan pengambilan keputusan sedangkan penilaian hanya sebatas
memberikan penilaian saja (Djaali dan Muljono, 2007: 1).
Menurut Bloom et al dalam Noelaka dan Noelaka (2017:141) Evaluasi
merupakan kegiatan pengumpulan kenyataan mengenai proses pembelajran secara
sistematis untuk menetapkan apakah terjadi perubahan terhadap peserta didik dan
sejauh apakah perubahan tersebut mempengaruhi kehidupan peserta didik.
Menurut Mardapi (1999) dalam Suryani, Penilaian merupakan proses
penggambaran, memperoleh dan memberikan informasi yang berguna sebagai alternatif
pengambilan keputusan. Suatu proses penilaian, ada yang didasarkan atas hasil
pengukuran yang bersifat kuantitatif dan ada pula yang kualitatif yang didasarkan atas
non-pengukuran. Ciri penting dalam pengukuran adalah adanya proses perbandingan.
Oleh karena itu, pengukuran, penilaian, dan evaluasi merupakan kegiatan yang berkaitan
4
dan berurutan. Secara umum penilaian atau evaluasi adalah suatu sistem sistematis untuk
mengetahui tingkat keberhasilan dan efisiansi suatu program. Evaluasi dalam sistem
pendidikan adalah salah satu kegiatan yang sangat penting dilaksanakan secara teratur
pada periode-periode tertentu, antara lain untuk memantau kualitas mutu pendidikan dan
membantu proses belajar mengajar (PBM) di kelas, karena itu diperlukan alat ukur.
Pemahaman siswa terhadap materi pelajaran dapat diketahui seseorang berdasarkan hasil
evaluasi, sehingga informasi yang bermakna dapat diperoleh dalam pengambilan
keputusan. Oleh karena itu dalam praktiknya masalah pengukuran mempunyai kedudukan
yang sangat penting dalam proses evaluasi. Baik buruknya hasil evaluasi tergantung pada
hasil pengukuran.
5
keadaan psikis atau tingkah laku. Tes dapat digunakan untuk mengukur
banyaknya pengetahuan yang diperoleh individu dari suatu bahan pelajaran yang
terbatas pada tingkat tertentu. Oleh karena itu, tes merupakan alat ukur ynag
paling banyak digunakan dalam pendidikan.
Menurut Norman dalam Djali dan Muljono (2007:7) tes merupakan salah
satu prosedur evaluasi yang komperehensif, sistematik, dan obyektif, yang
hasilnya dapat dijadikan sebagai dasar dalam pengambilan keputusan dalam
proses pengajaran yang dilakukan oleh guru. Dapat disimpulkan bahwa tes
memiliki peranan yang sangat penting dalam dunia pendidikan.
According to Kinra (2008:48) testing techniques do tell us what a student
might achieve in case of a test but cannot tell us what be might do in other
situations.
Menurut Kinra (2008:48) teknik pengjian memang memberi tahu kita apa
ynag mungkin dicapai seorang siswa dalam suatu ujian tetapi tidak dapat memberi
tahu kita apa yang mungkin dia lakukan dalam situasi lain.
6
own specific strengths as well as weaknesses, making them more aware of how they can
improve themselves.
7
banyak bersifat lahiriah. Kelima, tes hasil belajar untuk mengungkapkan
pencapaian terhadap tujuan pembelajaran atau prestasi belajar (Djali dan Muljono,
2007: 10-11).
Menurut Yusuf (2017: 95) ditinjau dari segi baku/ tidaknya suatu tes, maka
tes dapatdibedakan atas:
1. Tes standar (standardized test), ialah tes yang diakui reliabilitas dan
validitasnya. Tes seperti itu telah lama diujicobakan, dianalisa, direvisi dan
disusun kembali secara berulang-ulang.
2. Tes buatan guru (teacher made test) atau tes lokal, ialah tes yang dirancang
khusus ole guru mata pelajaran untuk menilai proses dan hasil belajar siswa
yang dibelajarkannya. Tes ini belum diketahui validitas dan reliabilitasnya.
Ditinjau dari cara mengajukan pertanyaan tes dibedakan menjadi tiga
golongan. Pertama, tes tertulis yang dikenal dengan istilah pencil and paper test,
yaitu tes dimana pelaksana tes dalam mengajukan butir-butir petanyaannya
dilakukan secara tertulis dan peserta tes memberi jawaban secara tertulis pula.
Kedua, tes tidak tertulis yang dikenal dengan istila non-pencil and paper test,
yaitu tes dimana pelaksana tes dalam mengajukan butir-butir pertanyaannya
dilakukan secara tidak tertulis (lisan) dan peserta tes memberi jawaban juga secara
lisan. Ketiga, tes perbuatan yang diberikan dalam bentuk tugas atau instruksi
kemudia peserta tes melakukan tugas instruksi tersebut dan hasilnya dinilai oleh
pemberi tes ( Djali dan Muljono, 2007: 11-12).
Jika dikaitkan dengan fungsi tes di sekolah, maka tes dibagi atas:
1. Tes diagnostik
Menurut Djali dan Muljono (2007:9) Tes diagnostik dilaksanakan untuk
mengidentifikasi kesulitan belajar yang dialami siswa, menentukan factor-faktor
yang menyebabkan terjadinya kesulitan belajar, dan menetapkan cara mengatasi
kesulitan belajar tersebut. Berhasil atau gagalnya suatu kegiatan pembelajaran
dalam proses Pendidikan pada suatu jenis dan/atau jenjang Pendidikan tertentu
sangat dipengaruhi oleh apakah siswa mengalami kesulitan belajar yang dialami
dalam suatu kegiatan pembelajaran, maka makin besar peluang bahwa siswa akan
berhasil.
According to Cohen et al. (2000: 317-318) Diagnostic testing is an in-depth test to
discover particular strengths, weaknesses and difficulties that a student is experiencing,
and is designed to expose causes and specific areas of weakness or strength. This often
requires the test to include several items about the same feature, so that, for example,
8
several types of difficulty in a student’s understanding will be exposed; the diagnostic test
will need to construct test items that will focus on each of a range of very specific
difficulties that students might be experiencing, in order to identify the exact problems that
they are having from a range of possible problems. Clearly this type of test is criterion-
referenced.
Menurut Cohen dkk (2000: 317-318) Tes diagnostik adalah tes mendalam
untuk menemukan kekuatan, kelemahan, dan kesulitan tertentu yang dialami
siswa, dan dirancang untuk mengekspos penyebab dan area spesifik kelemahan
atau kekuatan. Ini sering mengharuskan tes untuk memasukkan beberapa item
tentang fitur yang sama, sehingga, misalnya, beberapa jenis kesulitan dalam
pemahaman siswa akan diekspos; tes diagnostik perlu menyusun item-item tes
yang akan fokus pada masing-masing dari serangkaian kesulitan yang sangat
spesifik yang mungkin dialami siswa, untuk mengidentifikasi masalah yang
sebenarnya mereka alami dari berbagai masalah yang mungkin terjadi. Jelas jenis
tes ini adalah kriteria-referensi.
According to Gall et al.(2003: 210) Suppose that your research project involves
remediation of student learning difficulties, or evaluation of the effectiveness of a remedial
program. In these situations, a diagnostic test might be helpful in identifying an
appropriate research sample. A diagnostic test is a form of achievement trst that is used
identify a student’s strenghs and weaknesses in a particular school subject. Diagnostic tests
usually focus on the low end of the achievenment spectrum and provide a detailed picture
of the student’s level of performance various skills that the subject involves. A disadvantage
of some diagnostic tests is that the subscores hove low-reliability, and often they are highly
intercorrelated. For diagnostic purposes a criterion-referenced test covering the subject of
interest might be a better choice, because it provides a measure of the learner’s absolute
level of performance in a precisely defined content area.
Menurut Gall dkk (2003: 210), Misalkan proyek penelitian Anda melibatkan
remediasi kesulitan belajar siswa, atau evaluasi efektivitas program perbaikan.
Dalam situasi ini, tes diagnostik mungkin membantu dalam mengidentifikasi
sampel penelitian yang sesuai. Tes diagnostik adalah bentuk pencapaian pertama
yang digunakan untuk mengidentifikasi kekuatan dan kelemahan siswa dalam
mata pelajaran sekolah tertentu. Tes diagnostik biasanya berfokus pada ujung
rendah dari spektrum pencapaian dan memberikan gambaran rinci tentang tingkat
keterampilan berbagai keterampilan siswa yang melibatkan subjek. Kelemahan
dari beberapa tes diagnostik adalah bahwa subskala memiliki keandalan yang
rendah, dan seringkali mereka sangat saling terkait. Untuk tujuan diagnostik, tes
yang direferensikan kriteria yang mencakup subjek yang menarik mungkin
9
menjadi pilihan yang lebih baik, karena memberikan ukuran tingkat kinerja
absolut pelajar di area konten yang ditentukan secara tepat.
2. Tes formatif
Menurut Sukardi dalam Utami (2015:119) pada proses belajar mengajar, tes
formatif bertujuan untuk memperoleh informasi yang diperlukan oleh seorang
dosen tentang mahasiswa guna menentukan tingkat perkembangan mahasiswa
dalam satu unit proses belajar mengajar. Tes formatif ini juga bertujuan untuk
mengukur apakah tujuan instruksional khusus yang hendak dicapai yang telah
dirumuskan didalam program satuan pelajaran.
Menurut Djali dan Muljono (2007:9) Menurut Tes formatif pada dasarnya
adalah tes yang bertujuan untuk mendapatkan umpan balik bagi usaha perbaikan
kualitas pembelajaran dalam konteks kelas. Kualitas pembelajaran dikelas
ditentukan oleh intensitas proses belajar (proses intern) dalam diri setiap siswa
sebagai subyek belajar sekaligus peserta didik. Intensitas proses belajar dalam arti
intern tersebut ditentukan oleh kesesuaian antara strategi dan metode
pembelajaran dengan struktur kognitif (termasuk bakat) siswa sebagai peserta
didik dan karakteristik konsep atau materi yang dipelajari.
3. Tes Sumatif
According to Harlen in Setiyana (2016: 435) a summative test refers to the
process by which teachers collect data systematically to make an inference about
the state of a student’s learning.
Menuru Harlen dalam Setiyana (2016: 435) tes sumatif mengacu pada proses
dimana guru mengumpulkan data secara sistematis untuk membuat kesimpulan
tentang keadaan pembelajaran siswa.
Menurut Djali dan Muljono, (2007:9-120) tes sumatif yang dikenal dengan
istilah summative test adalah tes hasil belajar yang telah dilaksanakan setelah
kumpulan materi pelajaran atau satuan program pengajaran selesai diberikan.
Disekolah tes sumatif dikenal dengan tes ulangan umum yang dilaksanakan
dengan tujuan untuk menentukan nilai yang menjadi lambing keberhasilan siswa
setelah mereka menempuh proses pembelajaran dalam jangka waktu tertentu.
10
Adapun bentuk-bentuk tes antara lain terdiri atas:
1. Tes tertulis bentuk uraian (essay)
Menurut Asrul, Ananda R dan Rosnita (2014: 42-52) Tes bentuk uraian adalah
tes yang pertanyaannya membutuhkan jawaban uraian, baik uraian secara bebas
maupun uraian secara terbatas. Sutomo mengatakan bahwa tes bentuk uraian ini,
khususnya bentuk uraian bebas menuntut kemampuan murid untuk
mengorganisasikan dan merumuskan jawaban dengan menggunakan kata-kata
sendiri serta dapat mengukur kecakapan murid untuk berfikir tinggi yang biasanya
dituangkan dalam bentuk pertanyaan yang menuntut: Memecahkan masalah,
Menganalisa masalah, Membandingkan, Menyatakan hubungan, Menarik
kesimpulan dan sebagainya.
Dilihat dari keluasan materi yang ditanyakan, maka tes bentuk uraian ini
dapat dibagi menjadi dua bentuk, yaitu uraian terbatas(restricted respons items)
dan uraian bebas (extended respons items).
According to Ebel & Darwin in McAllister, Orlando (2017: 5-6) Over the past 75
years there have been many arguments and counter arguments regarding the superiority of
the essay type test compared to the objective type test. However, there is no significant
research to substantiate those claims. It is significant to noted that (1) it is relatively easy to
construct a 5 to six page question extended response essay test compared to 100 item
multiple choice test; (2) it helps to eliminate teacher bias by making them stress the
students’ ability to supply/select the correct answer; (3) it is the only means teachers have
to assess the students’ ability to compose, answer and present in effective proses. Another
problem with essay type tests is that students who are unsure or do not have a clear
understanding of what the question asked may write well, but have little to say. Finally, the
time taken to score essay type tests can lead to reader fatigue and decreased test reliability.
Despite the limitations of the essay type test they are still very popular and widely used,
perhaps because they are “easier” to construct and less time consuming. Empirical data
suggest that there are too many instances where essay tests are inappropriate because they
tend to measure low level skills on Bloom’s Taxonomy of Educational Objectives because of
the frequent use of extended response time essay question “with virtually” no bounds
placed on the student.
Menurut Ebel dan Darwin dalam McAllister, Orlando (2017: 5-6) Selama
75 tahun terakhir telah ada banyak argumen dan argumen yang bertentangan
tentang keunggulan tes tipe esai dibandingkan dengan tes tipe objektif. Namun,
tidak ada penelitian yang signifikan untuk mendukung klaim tersebut. Penting
untuk dicatat bahwa (1) relatif mudah untuk membangun tes esai respon diperluas
5 sampai 6 halaman pertanyaan dibandingkan dengan 100 item tes pilihan ganda;
(2) membantu menghilangkan bias guru dengan membuat mereka menekankan
kemampuan siswa untuk menyediakan / memilih jawaban yang benar; (3) itu
adalah satu-satunya cara guru harus menilai kemampuan siswa untuk menyusun,
11
menjawab dan hadir dalam prosa yang efektif. Masalah lain dengan tes tipe esai
adalah bahwa siswa yang tidak yakin atau tidak memiliki pemahaman yang jelas
tentang apa yang ditanyakan oleh pertanyaan dengan baik, tetapi tidak banyak
bicara. Akhirnya, waktu yang dibutuhkan untuk menilai tes tipe esai dapat
menyebabkan kelelahan pembaca dan penurunan reliabilitas tes. Terlepas dari
keterbatasan tes tipe esai mereka masih sangat populer dan banyak digunakan,
mungkin karena mereka "lebih mudah" untuk membangun dan lebih sedikit
memakan waktu. Data empiris menunjukkan bahwa jumlahnya terlalu banyak
contoh-contoh di mana tes esai tidak sesuai - karena mereka cenderung mengukur
keterampilan tingkat rendah pada Taksonomi Bloom dari Tujuan Pendidikan
karena seringnya menggunakan pertanyaan esai waktu respons diperpanjang
“dengan hampir” tidak ada batasan yang ditempatkan pada siswa.
Bentuk tes objektif dan bentuk tes uraian masing-masing memiliki
kelebihan dan kelemahan. Bentuk tes uraian, memberikan kebebasan kepada
setiap penempuh tes untuk mengekspresikan daya nalarnya, sehingga jawaban
yang diberikan oleh setiap penempuh tes akan menunjukkan kemampuan berpikir
secara kompleks. Namun demikian ada beberapa kelemahan bentuk tes uraian.
Bentuk tes uraian dalam memberikan skor membutuhkan waktu yang lama dan
relatif lebih sulit, sehingga bentuk uraian sulit digunakan untuk tes-tes yang
berskala besar. Di samping itu, penskoran bentuk tes uraian bersifat subjektif dan
harus dilakukan oleh ahli atau yang berwenang sehingga tidak dapat dilakukan
komputerisasi dalam pensekoranya (Suwongko,2010: 271).
2. Tes Hasil Belajar Bentuk Objektif
Menurut Asrul, Ananda R dan Rosnita (2014: 45) Tes objektif disebut objektif
karena cara pemeriksaannya yang seragam terhadap semua murid yang mengikuti
sebuah tes. Tes objektif juga dikenal dengan istilah tes jawaban pendek (short
answer test), dan salah satu tes hasil belajar yang terdiri dari butir-butir soal
(items) yang dapat dijawab oleh tester dengan jalan memilih salah satu (atau
lebih), di antara beberapa kemungkinan jawaban yang telah dipasangkan pada
masing masing items atau dengan jalan menuliskan jawabannya berupa kata-kata
atau simbol-simbol tertentu pada tempat-tempat yang disediakan untuk masing-
masing butir yang bersangkutan. Terdapat beberapa jenis tes bentuk objektif,
12
misalnya: bentuk melengkapi (completion test), pilihan ganda (multifle chois),
menjodohkan (matching), bentuk pilihan benar-salah (true false). Lebih jelasnya
diuraikan subagai berikut.
a. Melengkapi (Completion test).
Menurut Asrul, Ananda R dan Rosnita (2014:45-46) Completion test adalah
dikenal dengan istilah melengkapi atau menyempurnakan. Salah satu jenis
objektif yang hampir mirip sekali dengan tes objektif fill in. Letak perbedaannya
ialah pada tes objektif bentuk fill in bahan yang dites itu merupakan satu kesatuan.
Sedangkan pada tes objektif bentuk completion tidak harus demikian. Tes ini
memiliki kelebihan yaitu amat mudah dalam penyusunannya dan lebih
menghemat tempat (kertas). Adapun kelemahannya adalah pada umumnya tester
cenderung menggunakan tes model ini untuk mengungkapkan daya ingat atau
aspek hapalan saja dan butir-butir item dari tes model ini kurang relevan untuk
disajikan.
b. Test objektif bentuk multifle choice test (pilihan berganda)
Menurut Asrul, Ananda R dan Rosnita (2014:46) Test multifle chois, tes
pilihan ganda merupakan tes objektif dimana masing-masing tes disediakan lebih
dari kemungkinan jawaban, dan hanya satu dari pilihan-pilihan tersebut yang
benar atau yang paling benar.
Menurut Sudjana dalam Istiyono E, Mardapi D, dan Suparno (2014:4)
Kenyataan bahwa tes pilihan ganda lebih banyak digunakan dari pada bentuk tes
yang lain. Hal ini karena tes pilihan ganda memiliki kelebihan-kelebihan, antara
lain: (1) materi yang diujikan dapat mencakup sebagian besar bahan
pembelajaran, (2) jawaban siswa dapat dikoreksi dengan mudah dan cepat, (3)
jawaban setiap pertanyaan sudah pasti benar atau salah, sehingga penilai-an
objektif. Walaupun ada juga kelemahan tes ini, yaitu: (1) kemungkinan peserta
didik untuk melakukan tebakan jawaban masih cukup besar dan (2) proses
berpikir siswa tidak dapat dilihat de-ngan nyata. Di sam-ping itu, kelemahan lain
tes objektif yakni: (1) percaya diri yang tinggi pada testi dan (2) terjadinya
kecurangan (cheating).
c. Test objektif bentuk matching (menjodohkan)
13
Menurut Asrul, Ananda R dan Rosnita (2014:48) Test bentuk ini sering
dikenal dengan istilah tes menjodohkan, tes mencari pandangan, tes
menyesuaikan, tes mencocokkan. Tes ini terdiri dari satu pertanyaan dan satu seri
jawaban. Tugas tes adalah mencari dan menetapkan jawaban-jawaban yang telah
bersedia sehingga sesuai dengan atau cocok atau merupakan pasangan, atau
merupakan jodoh dari pertanyaan.
3. Tes Tindakan (Performance Test)
Menurut Asrul, Ananda R dan Rosnita (2014:51) Tes tindakan adalah tes
yang menuntut jawaban peserta didik dalam bentuk perilaku, tindakan, atau
perbuatan di bawah pengawasan penguji yang akan mengobservasi
penampilannya dan membuat keputusan tentang kualitas hasil belajar yang
dihasilkannya atau ditampikannya. Peserta didik bertindak sesuai dengan apa yang
diperintahkan dan ditanyakan.
Menurut Asrul, Ananda R dan Rosnita (2014:51-52) Tes tindakan dapat
digunakan untuk menilai kualitas suatu perkerjaan yang telah selesai dikerjakan
oleh peserta didik, termasuk juga keterampilan dan ketepatan menyelesaikan suatu
pekerjaan, kecepatan dan kemampuan merencanakan suatu pekerjaan. Tindakan
atau unjuk kerja yang dapat deklamasi, menggunakan peralatan laboratorium, dan
mengoperasikan suatu alat. Penilaian ini cocok digunakan untuk menilai
ketercapaian kompetensi yang menuntut peserta didik menunjukkan unjuk kerja.
Cara penilaian ini dianggap lebih otentik daripada tes tertulis karena apa yang
dinilai lebih mencerminkan kemampuan peserta didik yang sebenarnya.
Menurut Asrul, dkk (2014: 52-53), Sebagaimana jenis tes yang lain, tes
tindakan mempunyai kelebihan dan kekurangan, kekurangan tes tindakan adalah :
1) Satu-satunya teknik tes yang dapat digunakan untuk mengetahui hasil belajar
dalam bidang keterampilan, seperti ketereampilan membaca Al-Qur’an
berdasarkan ilmu tajwid.
2) Sangat baik digunakan untuk mencocokkan kesesuaian antara pengetahuan
teori dengan keterampilan praktik, sehingga hasil penilaian menjadi lengkap.
3) Dalam pelaksanaannya tidak memungkinkan peserta didik untuk saling
menyontek.
4) Guru dapat lebih mengenal karakteristik masing-masing peserta didik sebagai
dasar tindak lanjut hasil penilaian, seperti pembelajaran remedial.
Adapun kelemahan/kekurangan tes tindakan adalah :
14
1) Memakan waktu yang lama.
2) Dalam hal tertentu membutuhkan biaya yang benar.
3) Cepat membosankan.
4) Jika tes tindakan sudah menjadi sesuatu yang rutin, maka ia tidak mempunyai
arti apa-apa lagi.
5) Memerlukan syarat-syarat pendukung yang lengkap, baik waktu, tenaga
maupun biaya. Jika syarat-syarat tersebut tidak terpenuhi, maka hasil
penilaian tidak dapat dipertanggung jawabkan dengan baik.
15
4. Praktibilitas
Sebuah tes memiliki praktibilitas yang tinggi apabila tes tersebut bersifat
praktis, mudah dilaksanakan, mudah pemeriksaannya, dan mudah
pengadministrasiannya, serta dilengkapi dengan petunjuk-petunjuk yang jelas
sehingga dapat diberikan atau diawali oleh orang lain.
5. Ekonomis
Tes harus ekonomis, artinya bahwa pelaksanaan tes tersebut tidak
membutuhkan biaya yang mahal, tenaga yang banyak dan waktu yang lama.
6. Standar
Secara teori sebenarnya semua hal dalam tes in perlu distandardisasikan,
namun secara praktis biasanya dipilih hal-hal tertentuynag dianggap penting,
seperti: materi tes, penyelenggaraan tes, skoring, dan interpretasi hasil testingnya.
Standardisasi suatu tes bertujuan supaya setiap testee yang dites dengan tes
tersebut memperoleh perlakuan yang benar-benar ama.
7. Tes harus diskriminatif
Dengan tes dimaksud untuk dapat mengungkap gejala tertentu dan
menunjukkan perbedaan-perbedaan (diskriminasi) gejala tersebut antar individu.
Jadi tes diskriminatif akan mampu menunjukkan perbedaan-perbedaan yang kecil
mengenai sifat atau faktor tertentu pada indivdu-individuyang berbeda-beda,
indeks ynag menunjukkan sifat diskrimintif ii disebut dengan daya beda.
8. Komperhensif
Tes harus kompehensif artinya dapat sekaligus mengungkap atau
menyelidiki banyak aspek. Terutama dalam tes prestasi belajar hal ini penting
sekali untuk mendapat perhatian bagi guru sebagai penyusun tes. Tujuannya
adalah supaya dengan tes itu mampu mengungkap pengetahuan testee mengenai
segala hal yang harus dipelajari, jadi hal ini untuk mencegah kedorongan untuk
berspekulasi.
16
suitability between a test as an instrument of measurement and the domain of what it is
supposed to measure.
The extent of validity can be analysed logically or empirically. The kind of validity
analysed logically is called as logical validity, while the validity analysed empirically is
called as empirical validity. Logical validity is resulted from the process of thinking
logically.So a test if it has been supposed that has fulfilled logical validity, it means that the
test rationally has been able to measure what it should measure. Empirical validity is
resulted from the correlation between the test and the empirical data. Empirical data are
obtained from experienceswhich are interpreted into numbers or scores. Logical validity
can be divided into two types; they are content validity and construct validity. Content
validity is the extent to which the test measures the materials that has been taught and
programmed in syllabus. So, in content validity, items should be representatives of whole
materials. A test is said to have content validity if its content constitutes a representative
sample of the language skills, structures, tc. with which it is meant to be concerned”.
Stated that content validity is the extent to which the selection of tasks one observes in a
test taking situation is representative of the larger set of tasks of which the test is assumed
to be a sample, so in the other words that a test should be a representative sample of the
teaching/instructional contents as defined and covered in the curriculum.
17
adalah sejauh mana tes mengukur materiyang telah diajarkan dan diprogram
dalam silabus. Jadi, dalam validitas konten, item harus mewakili seluruh bahan.
Suatu tes dikatakan memiliki validitas konten jika isinya merupakan sampel
representatif dari keterampilan bahasa, struktur, dan lain-lain. dengan yang
dimaksudkan untuk diperhatikan. Validitas konten adalah sejauh mana pemilihan
tugas yang diamati dalam situasi pengambilan tes mewakili set tugas yang lebih
besar di mana tes diasumsikan sebagai sampel, jadi dengan kata lain bahwa tes
harus merupakan sampel yang representatif isi pengajaran/instruksional
sebagaimana didefinisikan dan tercakup dalam kurikulum.
18
nontes yakni berbagai alat yang digunakan dalam pengukuran dengan cara nontes.
Instrumen nontes digunakan untuk mengevaluasi hasil belajar aspek
psikomotorik, sikap, atau nilai.
19
Sikap berangkat dari perasaan (suka atau tidak suka) yang terkait dengan
kecenderungan bertindak seseorang dalam merespon sesuatu/ objek. Sikap juga
sebagai ekspresi dari nilai-nilai atau pandangan hidup yang dimiliki oleh
seseorang. Sikap dapat dibentuk untuk terjadinya perilaku atau tindakan yang
diinginkan. Sikap terdiri dari tiga komponen, yakni: komponen afektif, komponen
kognitif, dan komponen konatif. Komponen afektif adalah perasaan yang dimiliki
oleh seseorang atau penilaiannya terhadap sesuatu objek. Komponen kognitif
adalah kepercayaan atau keyakinan seseorang mengenai objek. Adapun komponen
konatif adalah kecenderungan untuk berperilaku atau berbuat dengan cara-cara
tertentu berkenaan dengan kehadiran objek sikap.
d. Penilaian Proyek
Penilaian proyek merupakan kegiatan penilaian terhadap suatu tugas yang
harus diselesaikan dalam periode/waktu tertentu. Tugas tersebut berupa suatu
investigasi sejak dari perencanaan, pengumpulan data, pengorganisasian,
pengolahan dan penyajian data. Penilaian proyek dapat digunakan, diantaranya
untuk mengetahui pemahaman dan pengetahuan dalam bidang tertentu,
kemampuan peserta didik mengaplikasikan pengetahuan tersebut dalam
penyelidikan tertentu, dan kemampuan peserta didik dalam menginformasikan
subyek tertentu secara jelas. Penilaian proyek dapat dilakukan mulai perencanaan,
proses selama pengerjaan tugas, dan terhadap hasil akhir proyek. Dengan
demikian guru perlu menetapkan hal-hal atau tahapan yang perlu dinilai, seperti
penyusunan disain, pengumpulan data, analisis data, kemudian menyiapkan
laporan tertulis. Laporan tugas atau hasil penelitiannya juga dapat disajikan dalam
bentuk poster. Pelaksanaan penilaian ini dapat menggunakan alat/instrumen
penilaian berupa daftar cek (checklist) ataupun skala rentang (rating scale).
e. Penilaian Produk
Penilaian produk adalah penilaian terhadap keterampilan dalam membuat
suatu produk dan kualitas produk tersebut. Penilaian produk tidak hanya diperoleh
dari hasil akhir saja tetapi juga proses pembuatannya. Penilaian produk meliputi
penilaian terhadap kemampuan peserta didik membuat produk-produk teknologi
dan seni, seperti: makanan, pakaian, hasil karya seni (patung, lukisan, gambar),
barang-barang terbuat dari kayu, keramik, plastik, dan logam.
f. Penilaian Portofolio
20
Penilaian portofolio merupakan penilaian berkelanjutan yang didasarkan
pada kumpulan informasi yang menunjukkan perkembangan kemampuan peserta
didik dalam satu periode tertentu. Informasi perkembangan peserta didik tersebut
dapat berupa karya peserta didik (hasil pekerjaan)dari proses pembelajaran yang
dianggap terbaik oleh peserta didiknya, hasil tes (bukan nilai), piagam
penghargaan atau bentuk informasi lain yang terkait dengan kompetensi tertentu
dalam satu mata pelajaran. Berdasarkan informasi perkembangan tersebut, guru
dan peserta didik sendiri dapat menilai perkembangan kemampuan peserta didik
dan terus melakukan perbaikan. Dengan demikian, portofolio dapat
memperlihatkan perkembangan kemajuan belajar peserta didik melalui karya
peserta didik, antara lain: karangan, puisi, surat, komposisi, musik.
g. Penilaian Diri
Penilaian diri (self assessment) adalah suatu teknik penilaian, di mana
subjek yang ingin dinilai diminta untuk menilai dirinya sendiri berkaitan dengan,
status, proses dan tingkat pencapaian kompetensi yang dipelajarinya dalam mata
pelajaran tertentu. Teknik penilaian diri dapat digunakan dalam berbagai aspek
penilaian, yang berkaitan dengan kompetensi kognitif, afektif dan psikomotor.
21
Menurut Lee C (2006:61), Penilaian teman dan penilaian diri adalah
bentuk penilaian penting yang melibatkan siswa dalam berbicara tentang
pembelajaran mereka dan karenanya membantu mereka menjadi kritis dan
mandiri. Mereka bukan pengganti untuk penilaian dan umpan balik guru. Seperti
halnya semua bidang pembelajaran matematika, siswa perlu belajar bagaimana
berbicara tentang pembelajaran mereka, bahasa dan ungkapan yang digunakan
untuk mengkritik pekerjaan orang lain dan bagaimana membahas masalah dan
strategi satu sama lain. Ini akan membutuhkan waktu dan usaha tetapi hasilnya
bermanfaat. Penilaian sejawat membantu siswa mempelajari keterampilan
penilaian diri dan juga menyediakan sumber ide yang kaya yang dapat digunakan
siswa dalam pembelajaran mereka sendiri. Ketika sekelompok siswa terlibat
dalam penilaian sejawat, kelompok itu akan berbicara tentang ide-ide matematika
dan membuat dan berbagi makna tentang ide-ide itu. Setiap anggota akan menjadi
bagian dari artikulasi ide dan strategi kelompok dan karenanya akan mulai
menginternalisasi bahasa dan ide-ide yang digunakan. Penilaian diri menyediakan
kerangka kerja untuk berbicara tentang belajar dan karena itu mendorong meta-
kognisi, yaitu berpikir dan berbicara tentang bagaimana dan apa yang dipelajari
siswa. Terlibat dalam penilaian teman sebaya dan diri memungkinkan siswa untuk
menjadi pembelajar mandiri; mereka dapat membimbing pembelajaran mereka
sendiri karena mereka tahu apa yang ingin mereka capai dan apa yang harus
mereka lakukan untuk mencapainya. Melalui penilaian teman sebaya dan diri
sendiri, siswa terlibat dalam analisis dan kritik konstruktif atas pekerjaan mereka
sendiri dan ini meningkatkan tingkat kemajuan dan tingkat pencapaian mereka.
Murid menjadi mampu memusatkan pembelajaran mereka pada bidang-bidang di
mana mereka merasa paling tidak percaya diri. Mereka dapat menentukan bagian /
konsep mana dalam topik yang paling menyulitkan dan memusatkan upaya
mereka di tempat yang paling membantu. Peer dan penilaian diri juga
memungkinkan guru untuk belajar lebih cepat dan akurat tentang ide atau
kesulitan siswa mereka dan memberi mereka pemahaman yang lebih dalam
tentang semua kemajuan dan masalah siswa. Guru kemudian dapat memutuskan
di mana waktu mereka paling baik digunakan, siapa yang dapat melanjutkan dan
siapa yang membutuhkan input khusus.
22
Menurut Maruti dan Malawi (2016: 13-14), teknik non-test terdiri dari:
a. Skala bertingkat (rating scale)
Teknik ini menggambarkan suatu nilai yang berbentuk bilangan tehadap
suatu pertimbangan.
b. Kuesioner (Questionaire)
Teknik kuesioner sering dikenal dengan angket, yaitu daftar pertanyaan
yang harus diisi oleh responden. Melalui teknik angket ini dapat diungkap
mengani data diri, pengalaman. pengetahuan, sikap atau pendapat. dll. Mengenai
macam anget dapat ditinjau dari berbagai segi. yaitu:
1) Ditinjau dari segi testee, dibedakan menjadi angket langsung dan angket tidak
langsung.
2) Ditinjau dari segi cara menjawab, dapat dibedakan menjadi: angket terbuka
dan angket tenutup.
c. Daftar Cocok (Chek list)
Daftar cocok (chek list) yaitu deretan pernyataan (biasanya singkat-singkat).
dlmana responden tinggal membubuhkan tanda cocok (V) di tempat yang telah
disediakan.
d. Wawancara (Interview)
Wawancara adalah suatu metode pengumpulan data dengan mendapatkan
jawaban dari interview dengan cara tanya jawab sepihak (oleh pihak interviewer).
Wawancara dapat dllakukan dengan dua cara. ya‘nu: interview bebas dan
interview terpimpin.
e. Pengamatan (Observation)
Observasi adalah suam teknik yang dilakukan dengan cara mengadakan
pengamatan secara teliti dan dengan pencatatan secara sistematis. Terdapat tiga
macam observasi. yaitu: observasi partisipan, observasi sistematik. dan obsevasi
eksperimental.
f. Riwayat Hidup
Riwayat hidup adalah gambaran tentang keadaan seseorang selama dalam
masa kehidupannya. Dengan mempelajari riwayat hidup. maka subyek evaluasi
akan dapat menarik suatu kesimpulan tentang kepribadian, kebiasaan. sikap dari
subyek yang dikenai penilaian.
23
Menurut Arifin (2012: 200-210), teknik non-tes terdiri dari:
1. Daftar Cek (check list)
Daftar cek adalah suatu daftar yang berisi subjek dan aspek-aspek yang akan
diamati. Daftar cek dapat memungkinkan Anda mencatat tiap-tiap kejadian yang
betapapun kecilnya, tetapi dianggap penting. Ada bermacam-macam aspek
perbuatan yang biasanya dicantumkan dalam daftar cek, kemudian Anda sebagai
observer tinggal memberikan tanda cek pada tiap-tiap aspek tersebut sesuai
dengan hasil pengamatannya. Daftar cek banyak manfaatnya, antara lain (1) dapat
membantu guru untuk mengingat-ingat apa yang harus diamati (2) dan dapat
memberikan informasi kepada stakeholder. Namun demikian, Anda tetap harus
waspada kemungkinan perilaku penting yang belum tercakup di dalam daftar cek,
karena itu Anda jangan terlalu kaku dengan apa yang sudah tertulis pada daftar
cek tersebut.
2. Skala Penilaian (rating scale)
Dalam daftar cek, Anda hanya dapat mencatat ada-tidaknya variabel tingkah
laku tertentu, sedangkan dalam skala penilaian fenomena-fenomena yang akan
diobservasi itu disusun dalam tingkatan-tingkatan yang telah ditentukan. Jadi,
tidak hanya mengukur secara mutlak ada atau tidaknya variabel tertentu, tetapi
lebih jauh mengukur bagaimana intensitas gejala yang ingin diukur. Pencatatan
melalui daftar cek termasuk pencatatan yang kasar. Fenomena-fenomena hanya
dicatat ada atau tidak ada. Hal ini agak kurang realistik. Perilaku manusia, baik
yang berwujud sikap jiwa, aktifitas, maupun prestasi belajar timbul dalam tingkat-
tingkat tertentu. Oleh karena itu, untuk mengukur hal-hal tersebut ada baiknya
digunakan skala penilaian.
Namun demikian, skala penilaian juga mempunyai kelemahan. Menurut
Zainal Arifin (2011) kelemahan skala penilaian adalah “ada kemungkinan halo
effects,generosity effects, dan cary-over effects”. Ada kemungkinan terjadinya
halo effects, yaitu kelemahan yangakan timbul jika dalam pencatatan observasi
terpikat oleh kesan-kesan umum yang baik pada peserta didik sementara ia tidak
menyelidiki kesan-kesan umum itu. Misalnya, seorang guru terkesan oleh sopan
santun dari peserta didik, sehingga memberikan nilai yang tinggi pada segi-segi
yang lain, padahal mungkin peserta didik tersebut tidak demikian adanya. Bisa
24
juga guru terkesan dengan model berpakaian atau penampilan umum peserta
didik. Begitu juga sebaliknya, seorang guru mungkin memberikan nilai yang
rendah, karena peserta didik kurang sopan dan tidak berpakaian rapih.
3. Angket (quetioner)
Angket termasuk alat untuk mengumpulkan dan mencatat data atau
informasi, pendapat, dan paham dalam hubungan kausal. Angket mempunyai
kesamaan dengan wawancara, kecuali dalam implementasinya. Angket
dilaksanakan secara tertulis, sedangkan wawancara dilaksanakan secara lisan.
Keuntungan angket antara lain (1) responden dapat menjawab dengan bebas
tanpa dipengaruhi oleh hubungan dengan peneliti atau penilai, dan waktu relatif
lama, sehingga objektifitas dapat terjamin (2) informasi atau data terkumpul lebih
mudah karena itemnya homogeny (3) dapat digunakan untuk mengumpulkan data
dari jumlah responden yang besar yang dijadikan sampel. Sedangkan
kelemahannya adalah (1) ada kemungkinan angket diisi oleh orang lain (2) hanya
diperuntukkan bagi yang dapat melihat saja (3) responden hanya menjawab
berdasarkan jawaban yang ada.
Angket terdiri atas beberapa bentuk, yaitu :
Bentuk angket berstruktur, yaitu angket yang menyediakan beberapa
kemungkinan jawaban. Bentuk angket berstruktur terdiri atas tiga bentuk, yaitu :
a. Bentuk jawaban tertutup, yaitu angket dimana setiap pertanyaannya sudah
tersedia berbagai alternatif jawaban.Bentuk jawaban tertutup, tetapi pada
alternatif jawaban terakhir diberikan secara terbuka. Hal ini dimaksudkan
untuk memberikan kesempatan kepada peserta didik untuk menjawab secara
bebas.
b. Bentuk jawaban bergambar, yaitu angket yang memberikan jawaban dalam
bentuk gambar.
c. Bentuk angket tak berstruktur yaitu bentuk angket yang memberikan jawaban
secara terbuka dimana peserta didik secara bebas menjawab pertanyaan
tersebut. Hal ini dapat memberikan pemahaman yang lebih mendalam tentang
situasi, tetapi kurang dapat dinilai secara objektif. Jawabannya tidak dapat
dianalisis secara statistik, sehingga kesimpulannya pun hanya merupakan
pandangan yang bersifat umum.
25
4. Studi Kasus (case study)
Studi kasus adalah studi yang mendalam dan komprehensif tentang peserta
didik atau madrasah yang memiliki kasus tertentu. Misalnya, peserta didik yang
sangat cerdas, sangat lamban, sangat rajin, sangat nakal atau kesulitan-kesulitan
dalam belajar. Pengertian mendalam dan komprehensif adalah mengungkap semua
variabel dan aspek-aspek yang melatarbelakanginya, yang diduga menjadi
penyebab timbulnya perilaku atau kasus tersebut dalam kurun waktu tertentu.
Untuk itu, Anda harus menjawab tiga pertanyaan inti dalam studi kasus, yaitu :
Mengapa kasus tersebut bisa terjadi ?
Apa yang dilakukan oleh seseorang dalam kasus tersebut ?
Bagaimana pengaruh tingkah laku seseorang terhadap lingkungan ?
Studi kasus sering digunakan dalam evaluasi, bimbingan, dan penelitian.
Studi ini menyangkut integrasi dan penggunaan data yang komprehensif tentang
peserta didik sebagai suatu dasar untuk melakukan diagnosis dan mengartikan
tingkah laku peserta didik tersebut. Penekanannya adalah pada diagnosis masalah-
masalah peserta didik dan memberikan rekomendasi untuk mengatasinya. Dalam
melakukan studi kasus, guru harus terlebih dahulu mengumpulkan data dari
berbagai sumber dengan menggunakan berbagai teknik dan alat pengumpul data.
Salah satu alat yang dapat digunakan adalah depth-interview yaitu melakukan
wawancara secara mendalam. Jenis data yangdiperlukan antara lain : latar
belakang kehidupan, latar belakang keluarga, kesanggupan dan kebutuhan,
perkembangan kesehatan, dan sebagainya.
5. Catatan Insidental (anecdotal records)
Catatan insidental ialah catatan-catatan singkat tentang peristiwa-peristiwa
sepintas yang dialami peserta didik secara perorangan. Catatan ini merupakan
pelengkap dalam rangka penilaian guru terhadap peserta didiknya, terutama yang
berkenaan dengan tingkah laku peserta didik. Catatan tersebut biasanya berbunyi :
a. Tanggal 23 Pebruari 2008, Gita menangis sendiri di belakang madrasah, tanpa
sebab.
b. Tanggal 05 Maret 2008, Gita mengambil mistar teman sebangkunya dan tidak
mengembalikannya.
26
Catatan insidental semacam ini mungkin belum berarti apa-apa bagi
keperluan penilaian Gita, tetapi setelah dihubungkan dengan data-data yang lain
seringkali memberikan petunjuk yang berguna. Catatan ini dapat dibuat di buku
khusus atau pada kartu-kartu kecil, sehingga memudahkan dalam penafsirannya
6. Sosiometri
Sosiometri adalah suatu prosedur untuk merangkum, menyusun, dan sampai
batas tertentu dapat mengkuantifikasi pendapat-pendapat peserta didik tentang
penerimaan teman sebayanya serta hubungan di antara mereka. Seperti Anda
ketahui, di madrasah banyak peserta didik kurang mampu menyesuaikan diri
dengan lingkungannya. Ia nampak murung, mengasingkan diri, mudah
tersinggung atau bahkan over-acting. Hal ini dapat dilihat ketika mereka sedang
istirahat, bermain atau mengerjakan tugas kelompok. Fenomena tersebut
menunjukkan adanya kekurangmampuan peserta didik dalam menyesuaikan diri
dengan lingkungannya. Kondisi seperti ini perlu diketahui dan dipelajari oleh
7. Inventori Kepribadian
Inventori kepribadian hampir serupa dengan tes kepribadian. Bedanya, pada
inventori, jawaban peserta didik tidak memakai kriteria benar-salah. Semua
jawaban peserta didik adalah benar selama ia menyatakan yang sesungguhnya.
Walaupun demikian, dipergunakan pula skala-skala tertentu untuk kuantifikasi
jawaban, sehingga dapat dibandingkan dengan kelompoknya. Aspek-aspek
kepribadian yang biasanya dapat diketahui melalui inventori ini, seperti : sikap,
minat, sifat-sifat kepemimpinan, dominasi, dan sebagainya.
27
waktu guru mengajar. Observasi dapat dilakukan secara partipasif maupun non
partisipasif.
Observasi dapat pula berbentuk observasi eksperimental yaitu observasi
yang dilakukan dalam situasi yang dibuat dan observasi non- eksperimental yaitu
observasi yang dilakukan dalam situasi yang wajar. Jika observasi digunakan
sebagai alat evaluasi, maka pencatatan hasil observasi lebih sukar daipada
mencatat jawaban yang diberikan oleh peserta tes terhadap pertanyaan yang
diberikan dalam suatu tes, karena respon observasi adalah tingkah laku dimana
proses kejadian nya berlangsung cepat.
b. Pedoman wawancara
Secara umum yang dimaksud dengan wawancara adalah cara menghimpun
bahan bahan keterangan yang dilaksanakan dengan tanya jawab baik secara Iisan,
sepihak, berhadapan muka, maupun kesulitan-kesulitan arah serta tujuan yang
telah ditentukan. Ada dua jenis wawancara yang dapat dipergunakan sebagal alat
evaluasi yaitu:
1) Wawancara terpimpin (guidedintamow) yang juga dikenal dengan wawancara
berstruktur atau wawancara sistematis.
2) Wawancara tidak terpimpin (unguided interview) yang dikenal dengan istilah
wawancara sederhana atau wawancara bebas.
Salah satu kelebihan yang dimiiiki wawancara adalah pewawancara sebagai
evaluator dapat melakukan kontak langsung dengan peserta didik yang akan
dinilai, sehingga dapat diperoleh hasil penilaian yang lebih lengkap dan
mendalam. Dengan melakukan wawancara, pesrta didik dapat mengeluarkan isi
pemikiran atau hatinya secara lebih bebas.
Jika wawancara dilakukan secara bebas, maka pewawancara tidak perlu
persiapan yang matang, tetapi jika wawancara dilakukan secara sistematis, maka
pewawancara perlu ada pedoman wawancara yang berisi pokok-pokok pertanyaan
yang akan ditanyakan kepada responden. Mencatat dan mengolah hasil
wawancara jauh lebih sulit dibadingkan dengan mencatat dan mengolah hasil
observasi atau hasil tes .
c. Angket (Kuesioner)
Angket dapat juga digunakan sebagai alat untuk menilai hasil belajar. Jika
dalam wawancara pewawancara berhadap langsung dengan responden atau siswa.
maka dengan angket penilaian hasil belajar akan jauh Iebih praktis, hemat waktu
28
dan tenaga. Kelemahannya yaitu kemungkinan adanya jawaban yang diberikan
dalam angket tidak sesuai dengan keadaan yang sebenarnya. Apalagi penanyaan
dalam angket tidak dirumuskan dengan jelas sehingga membingungkan
responden.
Angket dapat diberikan Iangsung kepada responden, dapat juga diberikan
kepada orang lain yang mengenal berbagai karakteristik responden untuk
melakukan penilaian terhadap responden. Angket untuk mengukur hasil belajar
dapat diberikan kepada orang tua siswa atau gurunya.
Data yang dihimpun melalui angket biasanya adalah data yang berkenaan
dengan kesulitan-kesulitan yang dihadapi oleh siswa dalam mengikuti pelajaran,
antara lain: cara belajar, fasilitas belajar yang tersedia. bimbingan guru dan orang
tua, motivasi dan minat belaiar, sikap belajar, sikap terhadap mata pelajaran
tertentu dan pandangan siswa terhadap proses pembelajaran, serta sikap siswa
terhadap gurunya.
Angket pada umumnya dipergunakan untuk menilai hasil belajar pada ranah
afektit. Angket dapat disajikan dalam bentuk pilihan ganda atau bentuk skala
sikap, misalnya skala likert yang paling banyak djpergunakan orang, terutama
para peneliti di bidang pendidikan yang tertarik untuk meneliti aspek-aspek
psikologis yang diduga berpengaruh terhadap proses belajar mengajar.
Selain sebagai alat untuk mengukur hasil belajar siswa, angket juga berguna
untuk mengungkap latar belakang orang tua siswa maupun siswa itu sendiri di
mana data yang berhasil diperoleh melalui angket pada suatu saat akan dipadukan.
terutama jika terjadi kasus-kasus tertentu yang menyangkut pribadi siswa.
d. Pemeriksaan Dokumen
Untuk mengukur kemajuan belajar siswa dapat juga dilakukan dengan tanpa
pengujian tetapi dengan cara melakukan pemeriksaan dokumen-dokumen,
misalnya dokumen yang memuat informasi mengenai kapan siswa itu diterima di
sekolah tetsebut, dari mana sekolah asalnya, apakah siswa tersebut pemah tinggal
kelas, apakah ia pernah meraih kejuaraan sebagai siswa yang berprestasi di
sekolahnya, apakah ia memiliki keterampilan khusus, apakah ia pemah meraih
kejuaraan atau penghargaan khusus atas keterampilannya itu, dan lain sebagainya.
Berbagai informasi yang direkam melalui angket, baik informasi pribadi
siswa maupun informasi orang tua siswa dan lingkunganya akan bermanfaat pada
saat-saat tertentu sebagai bahan pelengkap untuk melakukan pengukuran hasil
pembelajaran terhadap siswa.
29
Dengan demikian maka dalam pelaksanaan pengukuran hasil belajar tidak
semata-mata dilakukan dengan tes, tetapi dapat juga dilakukan dengan
menggunakan non-tes, terutama untuk masalah-masalah yang berhubungan
dengan masalah kejiwaan pesena didik seperti persepsi terhadap mata pelajaran
tenentu, persepsi terhadap guru, minat, bakat, tingkah laku, dan sikap yang tidak
mungkin diukur dengan tes.
30
dimiliki oleh teknik tes, yaitu: Sebagai alat pengukur terhadap peserta didik.
Dalam hubungan ini tes berfungsi mengukur tingkat perkembangan atau
kemajuan yang telah dicapai olrh peserta didik setelah mereka menempuh proses
belajar mengajar dalam jangka waktu tertentu. Yang kedua Sebagai alat pengukur
keberhasilan program pengajaran, sebab melalui tes tersebut akan dapat diketahui
sudah seberapa jauh program pengajaran yang telah ditentukan, telah dapat
dicapai.
Karakteristik tes yang baik. Mereka adalah: 1) tes harus valid, 2) tes harus
dapat diandalkan, 3) tes harus objektif, 4) tes harus dapat dipraktikkan, dan 5) tes
harus ekonomis. Dari lima karakteristik tes yang baik, dua yang pertama adalah
yang paling penting; mereka tes harus valid dan dapat diandalkan. Validitas adalah
sejauh mana tes mengukur apa yang ingin diukur. Sedangkan Reliabel adalah
dapat dipercaya atau dapat diandalkan.
Non tes adalah cara penilaian hasil belajar peserta didik yang dilakukan
tanpa menguji peserta didik tetapi dengan melakukan pengamatan secara
sistematis. Teknik evaluasi nontes berarti melaksanakan penilain dengan tidak
menggunakan tes. Teknik penilaian ini umumnya untuk menilai kepribadian anak
secara menyeluruh meliputi sikap, tingkah laku, sifat, sikap sosial dan lainlain.
Yang berhubungan dengan kegiatan belajar dalam pendidikan, baik secara
individu maupun secara kelompok. Penggunaan nontes untuk menilai hasil dan
proses belajar masih sangat terbatas jika dibandingkan dibandingkan dengan
penggunaan tes dalam menilai hasil dan proses belajar. Para guru disekolah
umumnya lebih banyak menggunakan tes dari pada bukan tes mengingat alatnya
mudah dibuat, penggunaannya lebih praktis dan yang dinilai terbatas pada aspek
kognitif berdasarkan hasil-hasil yang diperoleh peserta didik setelah
menyelesaikan pengalaman belajarnya.
Bentuk‐bentuk teknik nontes ialah observasi, penilaian diri, penilaian
antarteman, jurnal, angket, dan skala. Dalam kegiatan menilai, digunakan
sejumlah instrumen/alat penilaian yang disesuaikan dengan teknik yang dipakai
dalam menilai. Instrumen penilaian nontes yakni berbagai alat yang digunakan
dalam pengukuran dengan cara nontes. Instrumen nontes digunakan untuk
mengevaluasi hasil belajar aspek psikomotorik, sikap, atau nilai. Instrumen yang
31
digunakan dengan teknik nontes adalah lembar pengamatan, checklist observasi,
skala sikap, lembar penilaian diri/teman dan anekdot.
BAB III
PENUTUP
3.1 Kesimpulan
Dari pembahasan diatas maka dapat disimpulkan bahwa
1. Penilaian dapat didefinisikan sebagai semuanya kegiatan yang dilakukan oleh
guru dan siswa untuk mendapatkan informasi yang dapat digunakan untuk
mengubah proses belajar mengajar. Pengukuran merupakan suatu kegiatan
yang dilakukan untuk mengukur dalam arti memberi angka terhadap sesuatu
yang disebut objek pengukuran atau objek ukur. Evaluasi dalam sistem
pendidikan adalah salah satu kegiatan yang sangat penting dilaksanakan secara
teratur pada periode-periode tertentu, antara lain untuk memantau kualitas mutu
pendidikan dan membantu proses belajar mengajar (PBM) di kelas.
2. Secara umum tes dapat diartikan sebagai alat yang dipergunakan untuk
mengukur pengetahuan atau penguasaan obyek ukur terhadap seperangkat
konten tertentu. Tes dapat juga diartikan sebagai alat pengukur yang
mempunyai standar objektif, sehingga dapat digunakan secara meluas, serta
betul-betul dapat digunakan untuk mengukur dan membandingkan keadaan
psikis atau tingkah laku. Secara umum ada beberapa fungsi tes dalam dunia
Pendidikan, pertama tes dapat digunakan sebagai alat mengukur prestasi
belajar siswa. Kedua tes berfungsi sebagai motivator dalam pembelajaran.
Ketiga tes dapat berfungsi untuk upaya perbaikan kualitas pembelajaran.
Keempat, tes yang dimaksudkan untuk menentukan berhasil atau tidaknya
siswa sebagai syarat untuk melanjutkan Pendidikan pada jenjang yang lebih
tinggi.
3. Non tes adalah cara penilaian hasil belajar peserta didik yang dilakukan tanpa
menguji peserta didik tetapi dengan melakukan pengamatan secara sistematis.
Teknik evaluasi nontes berarti melaksanakan penilain dengan tidak
menggunakan tes. Bentuk‐bentuk teknik nontes ialah observasi, penilaian diri,
32
penilaian antarteman, jurnal, angket, dan skala. Dalam kegiatan menilai,
digunakan sejumlah instrumen/alat penilaian yang disesuaikan dengan teknik
yang dipakai dalam menilai. Instrumen penilaian nontes yakni berbagai alat
yang digunakan dalam pengukuran dengan cara nontes. Instrumen nontes
digunakan untuk mengevaluasi hasil belajar aspek psikomotorik, sikap, atau
nilai. Instrumen yang digunakan dengan teknik nontes adalah lembar
pengamatan, checklist observasi, skala sikap, lembar penilaian diri/teman dan
anekdot.
3.2 Saran
Walaupun penulis menginginkan kerapihan dan kesempurnaan ketika
menyusun makalah ini namun pada kenyatannya masih banyak sekali kekurangan-
kekurangan yang perlu diperbaiki ulang oleh penulis. Persoalan ini dikarenakan
masih sangat sedikitnya pengetahuan penulis. Maka dari itu penulis sangat
berharap sekali bahwa para pembaca selalu memberikan sebuah kritikan dan saran
kepada penulis agar penulis bisa menjadikan saran dan kritikan yang diberikan
oleh para pembaca ini dijadikan sebagai bahan evaluasi untuk selanjutnya.
Semoga makalah ini dapat bermanfaat bagi kita semua.
33
DAFTAR PUSTAKA
Bisri H dan Ichsan M. 2015. Penilaian Otentik Dengan Teknik Nontes Di Sekolah
Dasar. Jurnal Sosial Humaniora, ISSN 2087‐4928 Volume 6 Nomor 2.
Gall, M.D., Gall, J.P and Borg, W.R. Education Research. An Introduction
Seventh Edition. New York: Longman Inc.
Lee C. 2006. Languange for Learning Mathematics. New York: Two penn
34
Rusman. 2007. Belajar dan pembelajaran beroriensi standar proses Pendidikan.
Kencana: Jakarta.
Sah, K.P. 2012. Assessment And Test In Teaching And Learning. Academic Voices
A Multidisciplinary Journal. Volume 2, N0. 1.
Suryani, Y, E. 2017. Pemetaan Kualitas Empirik Soal Ujian Akhir Semester Pada
Mata Pelajaran Bahasa Indonesia Sma Di Kabupaten Klaten. Jurnal
Penelitian Dan Evaluasi Pendidikan. Volume 21, No 2.
Susongko Purwo. 2010. Perbandingan Keefektifan Bentuk Tes Uraian Dan Testlet
Dengan Penerapan Graded Response Model (Grm). Jurnal Penelitian dan
Evaluasi Pendidikan, Nomor 2.
Sugianto A. 2017. Validity and Reliability of English Summative Test for Senior
High School. Journal of ELT, Linguistic, and Literature. Volume 3, No 2.
35