Anda di halaman 1dari 19

BAB II

PEMBAHASAN

A. Tes, Pengukuran, Penilaian dan Evaluasi


1. Tes
Istilah ini berasal dari bahasa latin “testum” yang berarti sebuah piringan atau
jambangan dari tanah liat. Istilah ini dipergunakan dalam lapangan psikologi dan selanjutnya
hanya dibatasi sampai metode psikologi, yaitu suatu cara untuk menyelidiki seseorang.
Penyelidikan tersebut dilakukan mulai dari pemberian suatu tugas kepada seseorang atau
untuk menyelesaikan suatu masalah tertentu. Pada hakikatnya tes adalah suatu alat yang
berisi serangkaian tugas yang harus dikerjakan atau soal-soal yang harus dijawab oleh peserta
didik untuk mengukur suatu aspek perilaku tertentu. Dengan demikian, fungsi tes adalah
sebagai alat ukur.
Tes adalah suatu pertanyaan atau tugas/seperangkat tugas yang direncanakan untuk
memperoleh informasi tentang trait/atribut pendidikan atau psikologik yang setiap butir
pertanyaan atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar
(Ebel dan Frisbie 1996; Sax 1980; Lehmann 1973; Zainul 1995). Menurut Riduwan ( 2006:
37) tes sebagai instrumen pengumpulan data adalah serangkaian pertanyaan / latihan yang
digunakan untuk mengukur ketrampilan pengetahuan, intelegensi, kemampuan atau bakat
yang dimiliki individu / kelompok.Menurut Allen Philips (1979: 1-2) A test is commonly
difined as a tool or instrument of measurement that is used to obtain data about a specific trait
or characteristic of an individual or group. Test biasanya diartikan sebagai alat atau instrumen
dari pengukuran yang digunakan untuk memperoleh data tentang suatu karakteristik atau ciri
yang spesifik dari individu atau kelompok.) Menurut Rusli Lutan (2000:21) tes adalah sebuah
instrument yang dipakai untuk memperoleh informasi tentang seseorang atau obyek. Tes
adalah cara penilaian yang dirancang dan dilaksanakan kepada peserta didik pada waktu dan
tempat tertentu serta dalam kondisi yang memenuhi syarat-syarat tertentu yang jelas.
Tes dapat dipilah-pilah ke dalam berbagai kelompok. Berdasarkan bentuknya
dikenal adanya tes uraian (essay test) dan tes objektif (objective test). Tes Uraian berdasarkan
tipenya dapat dikelompokkan menjadi dua, yakni tes uraian terbatas (restricted essay test) dan
tes uraian bebas (extended essay test). Tes objektif, berdasarkan tipenya dapat
dikelompokkan menjadi 3, yakni tes benar salah (true-false test), tes menjodohkan (mathcing
test), dan tes pilihan ganda (multiple choice test).
Beberapa tipe tes tersebut masih dapat dikelompokkan lagi menjadi beberapa jenis
tes berdasarkan ragam dan karakternya. Tes berdasarkan cara melakukannya juga dapat
dipilih menjadi tes tertulis, tes lisan, dan tes perbuatan. Informasi tentang trait/atribut
pendidikan atau psikologik dapat juga didapatkan dengan cara nontes. Misalnya dengan
melakukan observasi, wawancara, angket, sosiometri, catatan anecdote, dan sebagainya.
Uraian lebih lanjut tentang tes dan nontes akan dipaparkan lebih rinci pada bagian lain buku
ini.
2. Jenis-Jenis Tes
1. Dari segi bentuk pelaksanaannya
a. Tes Tertulis ( paper and pencil test) dalam pelaksanaannya lebih menekankan pada
penggunaan kertas dan pencil sebagai instrumen utamanya, sehingga tes mengerjakan soal
atau jawaban ujian pada kertas ujian secara tertulis, baik dengan tulisan tangan maupun
menggunakan komputer.

b. Tes Lisan ( oral test) dilakukan dengan pembicaraan atau wawancara tatap muka
antara guru dan murid.

c. Tes Perbuatan (performance test) mengacu pada proses penampilan seseorang dalam
melakukan sesuatu unit kerja. Tes perbuatan mengutamakan pelaksanaan perbuatan peserta
didik.

2. Dari segi bentuk soal dan kemungkinan jawabannya

a. Tes Essay (uraian)

Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa
menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa sendiri. Tes
essay ini sangat bermanfaat untuk mengembangkan kemampuan dalam menjelaskan atau
mengungkapkan suatu pendapat dalam bahasa sendiri.

b. Tes Objektif

Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan alternatif
jawabannya. Tes ini terdiri dariberbagai macam bentuk, antara lain ;
Tes Betul-Salah (TrueFalse)
Tes Pilihan Ganda (Multiple Choice)
Tes Menjodohkan (Matching)
Tes Analisa Hubungan (Relationship Analysis)

3. Dari segi fungsi tes di sekolah

a. Tes Formatif

Tes Formatif, yaitu tes yang diberikan untuk memonitor kemajuan belajar selama
proses pembelajaran berlangsung. Tes ini diberikankan dalam tiap satuan unit pembelajaran.
Manfaat tes formatif bagi peserta didik adalah :

 Untuk mengetahui apakah peserta didik sudah menguasai materi dalam tiap
unit pembelajaran.
 Merupakan penguatan bagi peserta didik.
 Merupakan usaha perbaikan bagi siswa, karena dengan tes formatif peserta
didik mengetahui kelemahan-kelemahan yang dimilikinya.
 Peserta didik dapat mengetahui bagian dari bahan yang mana yang belum
dikuasainya.

b. Tes Summatif

Tes sumatif diberikan dengan maksud untuk mengetahui penguasaan atau pencapaian
peserta didik dalam bidang tertentu. Tes sumatif dilaksanakan pada tengah atau akhir
semester.

c. Tes Penempatan

Tes penempatan adalah tes yang diberikan dalam rangka menentukan jurusan yang
akan dimasuki peserta didik atau kelompok mana yang paling baik ditempati atau dimasuki
peserta didik dalam belajar.

d. Tes Diagnostik

Tes diagnostik adalah tes yang digunakan untuk mendiagosis penyebab kesulitan yang
dihadapi seseorang baik dari segi intelektual, emosi, fisik dan lain-lain yang mengganggu
kegiatan belajarnya.

C. Ciri-ciri Tes Yang Baik


Sebuah tes dikatakan baik jika memenuhi persyaratan:

1. Bersifat valid atau memiliki validitas yang cukup tinggi. Suatu tes dikatakan valid bila
tes itu isinya dapat mengukur apa yang seharusnya di ukur, artinya alat ukur yang digunakan
tepat.

2. Bersifat reliable, atau memiliki reliabelitas yang baik. Reliabelitas sering diartikan dengan
keterandalan. Suatu tes dikatakan relliabel jika tes itu diberikan berulang-ulang memberikan
hasil yang sama.

3. Bersifat praktis atau memiliki kepraktisan. Tes memiliki sifat kepraktisan artinya praktis
dari segi perencanaan, pelaksanaan tes dan memiliki nilai ekonomi tetapi harus tetap
mempertimbangkan kerahasiaan tes.

Namun syarat minimum yang harus dimiliki oleh sebuah tes yang baik adalah valid dan
reliable.

D. Langkah-langkah Pengembangan Tes


Ada enam tahap dalam merencanakan dan menyusun tes agar diperoleh tes yang baik,yaitu:

1) Pengembangan spesifikasi tes

Spesifikasi tes adalah suatu ukuran yang menunjukkan keseluruhan kualitas tes dan ciri-ciri
yang harus dimiliki oleh tes yang akan dikembangkan. Hal yang perlu diperhatikan adalah

 Menentukan tujuan, tujuan pembelajaran yang baik hendaklah berorientasi kepada


peserta didik, bersifat menguraikan hasil belajar, harus jelas dan dapat dimengerti,
mengandung kata kerja yang jelas (kata kerja operasional), serta dapat diamati dan
dapat di ukur.
 Menyusun kisi-kisi soal, penyusunan kisi-kisi soal bertujuan untuk merumuskan
setepat mungkin ruang lingkup, tekanan dan bagian-bagian tes sehingga perumusan
tersebut dapat menjadi petunjuk yang efektif bagi penyusun tes.
 Memilih tipe soal, dalam memilih tipe soal perlu diperhatikan kesesuaian antara tipe
soal dengan materi, tujuan evaluasi, skoring, pengelolaan hasil evaluasi,
penyelenggaraan tes, serta ketersediaan dana dan kepraktisan.
 Merencanakan tingkat kesukaran soal, untuk soal objektif dapat diketahui melalui uji
coba atau dapat juga diperkirakan berdasarkan berat ringannya beban penyeleaian soal
tersebut
 Merencanakan banyak soal
 Merencanakan jadwal penerbitan soal

2) Penulisan soal

3) Penelaahan soal, yaitu menguji validitas soal yang bertujuan untuk mencermati apakah
butir-butir soal yang disusun sudah tepat untuk mengukur tujuan pembelajaran yang sudah
dirumuskan, ditinjau dari segi isi/materi, kriteria dan psikologis.

4) Pengujian butir-butir soal secara empiris, kegiatan ini sangat penting jika soal yang
dibuat akan dibakukan.

5) Penganalisisan hasil uji coba.

6) Pengadministrasian soal

2. Pengukuran
Pengukuran adalah suatu proses atau kegiatan untuk menentukan kuantitas
“sesuatu”. Kata “sesuatu” bisa berarti peserta didik, guru, gedung sekolah, meja belajar,
papan tulis, dll. Dalam proses pengukuran tentu guru harus menggunakan alat ukur (tes atau
non tes). Alat ukur tersebut harus standar, yaitu memiliki derajat validitas dan reliabilitas
yang tinggi.Pengukuran (measurement) adalah proses pemberian angka atau usaha
memperoleh deskripsi numeric dari suatu tingkatan dimana seseorang peserta didik telah
mencapai karakteristik tertentu. Menurut William Shockley (
id.wilkipedia.org/wiki/pengukuran). Pengukuran adalah perbandingan dengan standar.
Menurut Buana (www.fajar.co.id/news.php). Pengukuran adalah suatu kegiatan untuk
mengetahui informasi atau data secara kuantitatif. Pengukuran tidak melibatkan
pertimbangan mengenai baik-buruknya, tidak menentukan siapa yang lulus dan tidak
lulus.Menurut Rusli Lutan (2000:21) pengukuran ialah proses pengumpulan informasi.
Menurut Gronlund yang dikutip Sridadi (2007) pengukuran suatu kegiatan atau proses untuk
memperoleh deskripsi numerik dan tingkatan atau derajat karakteristik khusus yang dimiliki
individu.Menurut Allen Philips (1979: 1-2) a measure is the score that has been assigned on
the basis of a test. ( Pengukuran adalah mencetak prestasi yang telah ditugaskan atas dasar
suatu perjanjian.Menurut Kerlinger yang dikutip Sridadi (2007) pengukuran sebagai
pemberian angka-angka pada obyek atau kejadian-kejadian menurut suatu aturan
tertentu.Menurut id.wilkipedia.org/wiki/pengukuran. Pengukuran adalah
penentuan besaran,dimensi, atau kapasitas, biasanya terhadap suatu standar atau satuan
pengukuran. Pengukuran tidak hanya terbatas pada kuantitas fisik, tetapi juga dapat diperluas
untuk mengukur hampir semua benda yang bisa dibayangkan, seperti tingkat ketidakpastian,
atau kepercayaan konsumen Menurut Sridadi (2007) pengukuran adalah suatu prose yang
dilakukan secara sistematis untuk memperoleh besaran kuantitatif dari suatu obyek tertentu
dengan menggunakan alat ukur yang baku.Menurut Wolf (1984: 7) Measurement is the act of
process of measuring. (Pengukuran adalah tindakan dari proses dari mengukur.
Pengukuran berkaitan erat dengan proses pencarian atau penentuan nilai
kuantitatif.Pengukuran adalah pemberian angka pada suatu atribut atau karakteristik tertentu
yang dimiliki oleh orang atau objek lain menurut aturan atau formulasi yang jelas.
Karakteristik dari pengukuran adalah penggunaan angka atau skala tertentu dan penggunaan
aturan atau formula tertentu (Ebel dan Frisbie 1996; Sax 1980; Lehmann 1973; Zainul 1995).
Misalnya, untuk mengukur berat atau tinggi badan seseorang kita akan dengan mudah
melakukannya karena alat ukur dan formulasinya telah diketahui secara umum.
Pengukuran menjadi kompleks dan rumit bila kita dihadapkan pada pengukuran
tentang kecepatan cahaya, ketinggian puncak gunung, daya penglihatan, kemampuan
pendengaran, kecerdasan, kematangan, dan kepribadian seseorang. Alat ukur dan
formulasinya sangat khusus dan hanya orang yang ahli di bidangnya yang bisa
melakukannya. Dengan kata lain, tidak semua orang bisa melakukan pengukuran dalam
semua bidang dengan baik. Demikian juga halnya dengan pengukuran dalam dunia
pendidikan, yang pada umumnya hanya bisa dilakukan oleh orang-orang ahli di bidang
pendidikan. Kemampuan ini merupakan kemampuan profesional guru. Tanpa melakukan
pengukuran, seorang guru tidak akan mengetahui kemajuan proses belajar mengajar yang
dikelolanya. Berdasarkan uraian tersebut dapat diketahui ada dua karakter pengukuran, yakni
pemakaian angka atau skala tertentu, dan pemakaian atauran atau formula tertentu.
 Langkah-langkah dalam proses pengukuran

Seperti ditunjukkan di atas, pengukuran adalah proses untuk menempatkan sejumlah


atribut dari individu atau kelompok sesuai dengan aturan dan prosedur tertentu. Proses ini
terdiri dari tiga langkah logis yaitu : (1) Menentukan gagasan konseptual, (2) dan (3)
mendefinisikan konstruk operasional danmengukur pengamatan (Bachman, 1990: 40-45).
Tidak seperti atribut fisik seperti tinggi, warna mata dan ukuran sepatu, atribut biasanya kita
ingin menilai sebagai gaya kognitif, akurasi pronounciation, pengetahuan tentang tata bahasa,
atau jenis perencanaan, tidak dapat diamati secara langsung, dan untuk alasan ini kita perlu
mendefinisikan dengan cara yang akan memungkinkan kita untuk menghubungkan
pengamatan kami dari cara itu, seperti tanggapan tertulis yakni kuesioner, ucapan lisan,
tulisan sampel dan waktu dalam tes, Langkah-langkah dalam pengukuran memberikan dasar
untuk usia link ini atau untuk membuat kesimpulan tentang atribut observatioable atas dasar
kinerja yang diamati.

1) Konstruk konseptual

Meskipun cukup memadai, untuk tujuan gambaran umum atau diskusi untuk
menggunakan istilah-istilah seperti kemampuan bahasa, pengetahuan tentang tata bahasa atau
bacaan untuk describe atribut individu tanpa mengembangkan definisi yang tepat untuk tes,
untuk tujuan mengukur atribut seperti ini , kita harus mendefinisikan mereka cukup tepat
untuk membedakan mereka mondar-mandir lainnya, suatu atribut untuk memahami hubungan
mereka dengan atribut lain yang sejenis.

Jadi, jika kita ingin mengembangkan prosedur untuk mengukur atribut atau
kemampuan, kita perlu membangun definisi precies ini, ini definisi berikut misalnya,
mengidentifikasi pengetahuan organisasi 'sebagai komponen pengetahuan bahasa, sebagai
lawan pengetahuan topikal atau Pengembangan strategi keterkaitannya, sementara juga
menunjukkan bahwa terdiri dari beberapa subkomponen:

Pengetahuan organisasi adalah komponen taht pengetahuan bahasa yang terlibat dalam
mengontrol struktur formal bahasa untuk memproduksi atau pemahaman ucapan tata bahasa
yang diterima atau kalimat untuk mengatur ini untuk membentuk teks, baik lisan maupun
tulisan.Ada dua bidang pengetahuan organisasi, pengetahuan grammaticall dan pengetahuan
tekstual.

Ketika kita mendefinisikan kemampuan dengan cara ini, menjadi konstruk tentang apa
yang kita ingin membuat kesimpulan untuk situasi pengujian tertentu , maka atribut yang
telah ditetapkan dengan cara tertentu untuk tujuan situasi pengukuran tertentu. (Bachman
1996) point bahwa membangun definisi umumnya didasarkan pada salah satu teori
kemampuan bahasa atau profiency atau isi silabus pembelajaran

2) Konstruk operasional

Langkah kedua dalam pengukuran adalah untuk menentukan prosedur dan kondisi di
mana kita akan mengamati atau menimbulkan kinerja yang akan memungkinkan kita untuk
membuat kesimpulan tentang konstruk kita yang ingin kita ukur, ini prosedur dan kondisi
spesified dalam spesifikasi tes atau blueprint yang mencakup informasi rinci tentang jenis dan
jumlah tugas tes untuk dimasukkan dan bagaimana ini akan memerintahkan dalam ujian,
jumlah waktu yang diizinkan dan bagaimana tanggapan untuk tugas tes ini akan mencetak
gol. Dalam menentukan prosedur ini, kita mendefinisikan untuk konstruk operasional dan
prosedur pengukuran ini yang tugas tes dan bagaimana mereka menjadi kedua sehingga
menjadi definisi konstrukoperasional.

3) Mengukur pengamatan

Langkah ketiga dalam pengukuran adalah untuk menentukan prosedur spesifik kita
akan ikuti untuk quantify atau anggota assign pengamatan dari pertunjukan atau variabel, Ini
adalah langkah yang membedakan pengukuran dari bentuk-bentuk ketetapan. Prosedur
pengukuran tertentu yang kita gunakan akan tergantung pada sifat dari atribut kita ingin
mengukur dan cara di mana kami telah memperoleh kinerja yang akan diukur.

Ketika kita menggunakan prosedur elisitasi seperti tes, questinnaores atau wawancara
untuk memperoleh kinerja pada dasarnya ada dua cara yang berbeda di mana kita dapat
menetapkan nomor 1. hakim kualitas atau tingkat kinerja sesuai dengan skala penilaian
dengan tingkat ditentukan atau 2. menghitung skor atau tanda untuk tugas individu atau item.

a) Pengukuran skala

Ketika kita menggunakan pengukuran untuk menetapkan jumlah pengamatan, ini


adalah variabel yang mewakili atribut inted untuk mengukur. Informasi nomor ini akan
tergantung pada bagaimana kita mendefinisikan atribut sebagai konstruksi dan
peraturan dan prosedur kami telah digunakan untuk mengukur. Dari contoh di atas
jelaslah bahwa kita dapat menggunakan berbagai prosedur untuk mengukur
pengamatan dan prosedur yang berbeda, pengukuran ini menghasilkan set angka atau
skala pengukuran, yang berisi berbagai jenis dan jumlah informasi yang dapat
mengidentifikasi merangkak skala pengukuran yang berbeda, nominal, ordinal, interval
dan rasio, Karena ini skala yang berbeda memberikan peningkatan jumlah informasi
dari skala nominal sampai dengan rasio skala mereka kadang-kadang disebut tingkat
pengukuran.

b) Pembatasan pengukuran

Sama seperti itu penting untuk memahami proses maesurement dan sifat data
yang dapat memberikan untuk analisis, juga penting untuk memahami keterbatasan
pada proses itu, karena ini juga akan membatasi kesimpulan dan menggunakan kita
membuat skor tes. Aku akan briefy menjelaskan enam pembatasan tersebut, ada
underspesification, indirectness(ketidaklangsungan) ketidaklengkapan, ketidaktepatan,
subjektivitas dan relativitas.

 Underspecification

Berbagai macam faktor seperti pengetahuan topik, dampak, gaya kognitif dan
kecemasan di samping kemampuan bahasa yang kita ingin ukur, dapat mempengaruhi
kinerja tes bahasa. Kita tidak mungkin menjelaskan semua ini, baik dalam cara
merancang prosedur pengukuran kami atau dalam cara kita menafsirkan hasil dari
prosedur ini.

 Ketidaklangsungan

Tidak seperti atribut fisik seperti tinggi dan berat badan, atribut atau kemampuan
yang umumnya kita ingin ukur tidak dapat diamati secara langsung, tetapi hanya dapat
infered dari pengamatan kinerja.Karena ukuran kami adalah indikator necessarlly tidak
langsung dari kemampuan kita ingin mengukur, validitas interpretasi dan penggunaan
skor tergantung pada perawatan dan kekakuan dengan yang langkah-langkah dalam
pengukuran telah diikuti dalam membangun hubungan yang jelas antara skor dan
konstruk.

 Ketidaklengkapan

Pengamatan kinerja kami buat adalah tidak lengkap, dalam bahwa mereka tidak
merupakan kinerja lengkap individu. Kinerja kita amati prosedur pengukuran kami
sehingga hanya menyediakan sampel total penggunaan bahasa apapun individu tertentu
ini.

 Ketidaktelitian
Kemampuan kita untuk mengukur atribut yang menarik bagi kita dibatasi oleh
ketepatan prosedur pengukuran.Ketepatan atau akurasi tindakan bergantung pada dua
faktor, jumlah titik atau tingkatan dalam skala pengukuran dan komparabilitas poin
skala ini.

 Subyektivitas

Hampir setiap aspek dari proses pengukuran yang dijelaskan di atas melibatkan
keputusan subjektif dari pihak pengembang tes, pengambil tes dan usesrs tes. desain
pengujian dan pengembangan keputusan seperti menentukan tujuan tes, konstruk yang
akan diukur, merancang prosedur pengukuran dan memilih prosedur statistik yang
sesuai untuk menganalisis skor tes semua dibuat secara subjektif oleh individu.

 Relativeness

Tidak seperti tindakan atribut fisik seperti kekuatan genggaman dan denyut
jantung, atribut kita ingin mengukur umumnya tidak dapat ditafsirkan atau dilaporkan
dalam hal skala mutlak dan untuk alasan ini mereka hanya bisa ditafsirkan relatif
terhadap beberapa kerangka acuan atau standar, di luar ukuran itu sendiri.

3. Peniaian
Groundlund (1971:6) mengungkapkan bahwa penilaian merupakan deskripsi
kualitatif dari tingkah laku siswa baik yang didasarkan pada hasil pengukuran (tes) maupun
bukan hasil pengukuran (nontes: catatan anekdot, observasi, wawancara dll). Menurut Buana
(www.fajar.co.id/news.php). assessment adalah alih-bahasa dari istilah penilaian. Penilaian
digunakan dalam konteks yang lebih sempit daripada evaluasi dan biasanya dilaksanakan
secara internal. Penilaian atau assessment adalah kegiatan menentukan nilai suatu objek,
seperti baik-buruk, efektif-tidak efektif, berhasil-tidak berhasil, dan semacamnya sesuai
dengan kriteria atau tolak ukur yang telah ditetapkan sebelumnya.
Menurut www.elook.org/dictionary/assessment.htm Definition of assessment: the
classification of someone or something with respect to its worth.( Definisi dari penilaian
adalah penggolongan seseorang atau sesuatu berkenaan dengan harganya.)Menurut Angelo
(1991: 17) Classroom Assessment is a simple method faculty can use to collect feedback,
early and often, on how well their students are learning what they are being taught. (Penilaian
Kelas adalah suatu metode yang sederhana dapat menggunakan fakultas (sekolah) untuk
mengumpulkan umpan balik, awal dan setelahnya, pada seberapa baik para siswa mereka
belajar apa yang mereka ajarkan.)Menurut Suharsimi yang dikutip oleh Sridadi(2007)
penilaian adalah suatu usaha yang dilakukan dalam pengambilan keputusan terhadap sesuatu
dengan ukuran baik-buruk → bersifat kualitatif.Menurut Depag yang dikutip Sridadi (2007)
penilaian adalah suatu usaha untuk mengumpulkan berbagai informasi secara
berkesinambungan dan menyeluruh tentang proses dan hasil belajar yang telah dicapai oleh
siswa melalui kegiatan belajar mengajar yang ditetapkan sehingga dapat dijadikan dasar
untuk menentukan langkah selanjutnya.Menurut Rusli Lutan (2000:9) assessment termasuk
pelaksanaan tes dan evaluasi. Asessment bertujuan untuk menyediakan informasi yang
selanjutkan digunakan untuk keperluan informasi.
Penilaian adalah suatu proses atau kegiatan yang sistematis dan berkesinambungan
untuk mengumpulkan informasi tentang proses dan hasil belajar peserta didik dalam rangka
membuat keputusan-keputusan berdasarkan kriteria dari pertimbangan tertentu. Kegiatan
penilaian harus dapat memberikan informasi kepada guru untuk meningkatkan kemampuan
mengajarnya dan membantu peserta didik mencapai perkembangan belajarnya secara
optimal. Implikasinya adalah kegiatan penilaian harus digunakan sebagai cara atau teknik
untuk mendidik sesuai dengan prinsip pedagogis. Guru harus menyadari bahwa kemajuan
belajar perserta didik merupakan salah satu indikator keberhasilan dalam
pembelajaran.Penilaian (assessment) adalah penerapan berbagai cara dan penggunaan
beragam alat penilaian untuk memperoleh informasi tentang sejauh mana hasil belajar peserta
didik atau ketercapaian kompetensi (rangkaian kemampuan) peserta didik. Penilaian
menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang peserta
didik.Hasil penilaian dapat berupa nilai kualitatif (pernyataan naratif dalam kata-kata) dan
nilai kuantitatif (berupa angka). Pengukuran berhubungan dengan proses pencarian atau
penentuan nilai kuantitatif tersebut. Penilaian (assessment) merupakan istilah yang umum dan
mencakup semua metode yang biasa dipakai untuk mengetahui keberhasilan belajar siswa
dengan cara menilai unjuk kerja individu peserta didik atau kelompok.

4. Evaluasi
Menurut pengertian bahasa kata evaluasi berasal dari bahasa Inggris evaluation yang
aberarti penilaian atau penaksiran (John M. Echols dan Hasan Shadily: 1983). Menurut
Stufflebeam, dkk (1971) mendefinisikan evaluasi sebagai “The process of delineating,
obtaining, and providing useful information for judging decision alternatives”. Artinya
evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikan informasi yang
berguna untuk merumuskan suatu alternatif keputusan. Evaluasi adalah kegiatan mengukur
dan menilai. Mengukur lebih besifat kuantitatif, sedangkan menilai lebih bersifat kualitatif.
Viviane dan Gilbert de Lansheere (1984) menyatakan bahwa evaluasi adalah proses
penentuan apakah materi dan metode pembelajaran telah sesuai dengan tujuan yang
diharapkan. Menurut Rusli Lutan (2000:22) evaluasi merupakan proses penentuan nilai atau
kelayakan data yang terhimpun. Menurut Buana (www.fajar.co.id/news.php). Evaluasi adalah
suatu kegiatan atau proses untuk menentukan nilai segala sesuatu dalam dunia pendidikan
seperti program pendidikan termasuk perencanaan suatu program, substansi pendidikan
seperti kurikulum, pengadaan dan peningkatan kemampuan guru, pengelolaan pendidikan,
dan lain-lain. Menurut Sridadi (2007) evaluasi : suatu proses yang dirancang secara sistematis
dan terencana dalam rangka untuk membuat alternatif-alternatif keputusan atas dasar
pengukuran dan penilaian yang telah dilakukan sebelumnya.Allen Philips (1979: 1-2)
evaluation is a complex term that often is misused by both teachers and students. It involves
making decicions or judgements about students based on the extent to which instructional
objectives are achieved by them. (evaluasi adalah suatu istilah kompleks yang sering
disalahgunakan oleh para guru dan para siswa. Evaluasi melibatkan pembuatan keputusan
atau penghakiman tentang para siswa didasarkan pada tingkat sasaran hasil yang dicapai oleh
mereka.Menurut Sutarsih dan Kadarsih yang dikutip oleh Sridadi (2007) evaluasi : suatu
proses untuk memberikan atau menentukan nilai kepada obyek tertentu berdasarkan suatu
kriteria tertentu.
Penentuannya bisa dilakukan salah satunya dengan cara pemberian tes kepada
pembelajar. Terlihat disana bahwa acuan tes adalah tujuan pembelajaran. Evaluasi adalah
kegiatan identifikasi untuk melihat apakah suatu program yang telah direncanakan telah
tercapai atau belum, berharga atau tidak berharga, dan dapat pula untuk melihat tingkat
efisiensi pelaksanaannya. Evaluasi juga dapat diartikan sebagai suatu proses penilaian untuk
mengambil keputusan yang menggunakan seperangkat hasil pengukuran dan berpatokan
kepada tujuan yang telah dirumuskan. Pada hakikatnya evaluasi adalah suatu proses yang
sistematis dan berkelanjutan untuk menentukan kualitas (nilai dan arti) dari sesuatu,
berdasarkan pertimbangan dan kriteria tertentu dalam rangka pembuatan keputusan.

B. Perbedaan Tes, Pengukuran, Penilaian dan Evaluasi


Rustaman (2003) mengungkapkan bahwa asesmen lebih ditekankan pada penilaian
proses. Sementara itu evaluasi lebih ditekankan pada hasil belajar. Apabila dilihat dari
keberpihakannya, menurut Stiggins (1993) asesmen lebih berpihak kepada kepentingan
siswa. Siswa dalam hal ini menggunakan hasil asesmen untuk merefleksikan kekuatan,
kelemahan, dan perbaikan belajar. Sementara itu evaluasi menurut Rustaman (2003) lebih
berpihak kepada kepentingan evaluator.
Yulaelawati (2004) mengungkapkan bahwa terdapat perbedaan antara evaluasi
dengan asesmen. Evaluasi (evaluation) merupakan penilaian program pendidikan secara
menyeluruh. Evaluasi pendidikan lebih bersifat makro, meluas, dan menyeluruh. Evaluasi
program menelaah komponen-komponen yang saling berkaitan tentang perencanaan,
pelaksanaan, dan pemantauan. Sementara itu asesmen merupakan penilaian dalam scope yang
lebih sempit (lebih mikro) bila dibandingkan dengan evaluasi. Seperti dikemukakan oleh
Kumano (2001) asesmen hanya menyangkut kompetensi siswa dan perbaikan program
pembelajaran.
Harlen (1982) mengungkapkan perbedaan antara asesmen dan evaluasi dalam hal
metode. Evaluasi dinyatakan menggunakan kriteria dan metode yang bervariasi. Asesmen
dalam hal ini hanya merupakan salah satu dari metode yang dipilih untuk evaluasi tersebut.
Selain dari itu, subyek untuk asesmen hanya siswa, sementara itu subyek evaluasi lebih luas
dan beragam seperti siswa, guru, materi, organisasi, dll.
Yulaelawati (2004) menekankan kembali bahwa scope asesmen hanya mencakup
kompetensi lulusan dan perbaikan cara belajar siswa. Jadi hubungannya lebih pada peserta
didik. Ruang lingkup evaluasi yang lebih luas ditunjukkan dengan cakupannya yang meliputi
isi atau substansi, proses pelaksanaan program pendidikan, kompetensi lulusan, pengadaan
dan peningkatan tenaga kependidikan, manajemen pendidikan, sarana dan prasarana, dan
pembiayaan.
Pengukuran, Tes, dan evaluasi dalam pendidikan berperan dalam seleksi,
penempatan, diagnosa, remedial, umpan balik, memotivasi dan membimbing. Baik tes
maupun pengukuran keduanya terkait dan menjadi bagian istilah evaluasi. Meski begitu,
terdapat perbedaan makna antara mengukur dan mengevaluasi. Mengukur adalah
membandingkan sesuatu dengan satu ukuran tertentu. Dengan demikian pengukuran bersifat
kuantitatif. Sementara itu evaluasi adalah pengambilan suatu keputusan terhadap sesuatu
dengan ukuran baik-buruk Dengan demikian pengambilan keputusan tersebut lebih bersifat
kualitatif (Arikunto,2003; Zainul & Nasution, 2001).
Setiap butir pertanyaan atau tugas dalam tes harus selalu direncanakan dan
mempunyai jawaban atau ketentuan yang dianggap benar (Jacobs & Chase, 1992). Sementara
itu tugas ataupun pertanyaan dalam kegiatan pengukuran (measurement) tidak selalu
memiliki jawaban atau cara pengerjaan yang benar atau salah karena measurement dapat
dilakukan melalui alat ukur non-tes. Maka tugas atau pertanyaan tersebut bukanlah tes. Selain
dari itu, tes mengharuskan subyek untuk menjawab atau mengerjakan tugas, sementara itu
pengukuran (measurement) tidak selalu menuntut jawaban atau pengerjaan tugas.
Berdasarkan pengertian di atas penulis menyimpulkan bahwa penilaian adalah suatu
proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui
pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pengukuran adalah
membandingkan hasil tes dengan standar yang ditetapkan. Pengukuran bersifat kuantitatif.
Sedangkan menilai adalah kegiatan mengukur dan mengadakan estimasi terhadap hasil
pengukuran atau membanding-bandingkan dan tidak sampai ke taraf pengambilan
keputusan.Penilaian bersifat kualitatif.
Agar lebih jelas perbedaannya maka perlu dispesifikasi lagi untuk pengertian
masing-masing :
 Evaluasi pembelajaran adalah suatu proses atau kegiatan untuk menentukan
nilai, kriteria-judgment atau tindakan dalam pembelajaran.
 Penilaian dalam pembelajaran adalah suatu usaha untuk mendapatkan
berbagai informasi secara berkala, berkesinambungan, dan menyeluruh
tentang proses dan hasil dari pertumbuhan dan perkembangan yang telah
dicapai oleh anak didik melalui program kegiatan belajar.
· Pengukuran atau measurement merupakan suatu proses atau kegiatan untuk menentukan
kuantitas sesuatu yang bersifat numerik. Pengukuran lebih bersifat kuantitatif, bahkan
merupakan instrumen untuk melakukan penilaian. Dalam dunia pendidikan, yang dimaksud
pengukuran sebagaimana disampaikan Cangelosi (1995: 21) adalah proses pengumpulan data
melalui pengamatan empiris.
perbedaan antara tes, pengukuran dan penilaian terletak pada waktu dan fungsinya.
Tes digunakan sebagai alat atau media untuk memperoleh informasi tentang orang lain.
Pengukuran digunakan untuk memberi angka pada karakteristik tertentu yang dimiliki oleh
orang, hal, atau obyek yang diambil dari sebuah tes. Sedangkan penilaian digunakan untuk
mengambil keputusan berdasarkan data-data yang diperoleh berdasarkan pengukuran
sebelumnya.
Perbedaannya terletak pada ruang lingkup dan pelaksanaannya. Ruang lingkup
penilaian lebih sempit dan biasanya hanya terbatas pada salah satu komponen atau aspek saja,
seperti prestasi belajar. Pelaksanaan penilaian biasanya dilakukan dalam konteks internal.
Ruang lingkup evaluasi lebih luas, mencangkup semua komponen dalam suatu sistem dan
dapat dilakukan tidak hanya pihak internal tetapi juga pihak eksternal.Evaluasi dan penilaian
lebih bersifat komprehensif yang meliputi pengukuran, sedangkan tes merupakan salah satu
alat (instrument) pengukuran. Pengukuran lebih membatasi pada gambaran yang bersifat
kuantitatif (angka-angka) tentang kemajuan belajar peserta didik, sedangkan evaluasi dan
penilaian lebih bersifat kualitatif. Keputusan penilaian tidak hanya didasarkan pada hasil
pengukuran, tetapi dapat pula didasarkan hasil pengamatan dan wawancara.
Perhatikan ilustrasi berikut ini:“Bu Nisa ingin mengetahui apakah peserta didiknya
sudah menguasai kompetensi dasar dalam matapelajaran TIK. Untuk itu, Bu Nisa
memberikan tes tertulis dalam bentuk objektif pilihan ganda sebanyak 50 soal kepada peserta
didiknya (artinya Bu Nisa sudah menggunakan tes). Selanjutnya, Bu Nisa memeriksa lembar
jawaban peserta didik sesuai dengan kunci jawaban, kemudian sesuai dengan rumus tertentu
dihitung skor mentahnya. Ternyata, skor mentah yang diperoleh peserta didik sangat
bervariasi, ada yang memperoleh skor 25, 36, 44, 47, dan seterusnya (sampai disini sudah
terjadi pengukuran). Angka atau skor-skor tersebut tentu belum mempunyai nilai /makna dan
arti apa-apa. Untuk memperoleh nilai dan arti dari setiap skor tersebut, Bu Nisa melakukan
pengolahan skor dengan pendekatan tertentu. Hasil pengolahan dan penafsiran dalam skala
0 – 10 menunjukkan bahwa skor 25 memperoleh nilai 5 (berarti tidak menguasai), skor 36
memperoleh nilai 6 (berarti cukup menguasai), skor 44 memperoleh nilai 8 (berarti
menguasai), dan skor 47 memperoleh nilai 9 (berarti sangat memuaskan). Sampai disini
sudah terjadi proses penilaian. Ini contoh dalam ruang lingkup penilaian hasil belajar. Jika
Bu Nisa menilai seluruh komponen pembelajaram maka berarti terjadi evaluasi.“
C. Hubungan Tes, Pengukuran, Penilaian dan Evaluasi
Kumano (2001) mengungkapkan bahwa meskipun terdapat perbedaan
makna/pengertian, asesmen dan evaluasi memiliki hubungan. Menurut Zainul & Nasution
(2001) Hubungan antara tes, pengukuran, dan evaluasi adalah sebagai berikut. Evaluasi
belajar baru dapat dilakukan dengan baik dan benar apabila menggunakan informasi yang
diperoleh melalui pengukuran yang menggunakan tes sebagai alat ukurnya. Akan tetapi tentu
saja tes hanya merupakan salah satu alat ukur yang dapat digunakan karena informasi tentang
hasil belajar tersebut dapat pula diperoleh tidak melalui tes, misalnya menggunakan alat ukur
non tes seperti observasi, skala rating, dan lain-lain.
Zainul dan Nasution (2001) menyatakan bahwa guru mengukur berbagai kemampuan
siswa. Apabila guru melangkah lebih jauh dalam menginterpretasikan skor sebagai hasil
pengukuran tersebut dengan menggunakan standar tertentu untuk menentukan nilai atas dasar
pertimbangan tertentu, maka kegiatan guru tersebut telah melangkah lebih jauh menjadi
evaluasi. Untuk mengungkapkan hubungan antara asesmen dan evaluasi, Gabel (1993)
mengungkapkan bahwa evaluasi merupakan proses pemberian penilaian terhadap data atau
hasil yang diperoleh melalui asesmen.
D. Kriteria Tes, Pengukuran, Penilaian dan Evaluasi
1. Kriteria Tes yang Baik
 Validitas (Ketepatan); Suatu alat pengukur dapat dikatakan alat pengukur yang valid
apabila alat pengukur tersebut dapat mengukur apa yang hendak diukur secara tepat.
 Reliabilitas merujuk pada konsistensi skor yang dicapai oleh orang yang sama ketika
diuji ulang dengan tes yang sama pada kesepatan yang berbeda, atau dengan
seperangkat butir-butir ekuivalen yang berbeda, atau pada kondisi pengujian yang
berbeda
 Objektivitas; Suatu tes dikatakan obyektif jika tes tersebut diajukan kepada beberapa
penilai, tetapi memberikan skor yang sama, untuk disiapkan kunci jawaban (scorring
key).
 Memiliki discrimination power (daya pembeda); Tes yang dikatakan baik apabila
mampu membedakan anak yang pandai dan anak yang bodoh.
 Mencakup ruang lingkup (scope) yang sangat luas dan menyeluruh; Tes yang baik
harus memiliki komphrehensi veenes, ini akan menyisihkan siswa yang berspekulasi
dalam menempuh tes.
Praktis; mencakup :
 Mudah dipakai/ diperiksa
 Hemat biaya
 Mudah diadministrasikan
 Tidak menyulitkan guru dan sekolah.

2. Kriteria Pengukuran
 Pengukuran harus jelas parameternya.
 Memiliki sasaran yang terukur
 Mudah dipahami cara pengkurannya.
 Dapat diukur setiap waktu dan simple.

3. Kriteria Penilaian
 Penilaian dilakuakn selama dan sesudah proses pembelajaran berlangsung
 Aspek yang diukur adalah keterampilan dan performasi, bukan mengingat fakta
apakah peserta didik belajar? Atau apa yang sudah diketahui peserta didik?
 Penilaian dilakukan secara berkelanjutan, yaitudilakukan dalam beberapa tahapan dan
periodik, sesuai dengan tahapan waktu dan bahasanya, baik dalam bentuk formatif
maupun sumatif.
 Penilaian dilakukan secara integral, yaitu menilai berbagai aspek pengetahuan, sikap,
dan keterampilan peserta didik sebagai satu kesatuan utuh.
 Hasil penilain digunakan sebagai feedback, yaitu untuk keperluan pengayaan
(enrichment) standart minimal telah tercapai atau mengulang (remedial) jika standart
minimal belum tercapai.

4. Kriteria Evaluasi
 Evaluasi adalah suatu proses bukan suatu hasil ( produk ). Hasil yang diperoleh dari
kegiatan evaluasi adalah kualitas sesuatu, baik yang menyangkut tentang nilai atau
arti, sedangkan kegiatan untuk sampai pada pemberian nilai dan arti itu adalah
evaluasi. Membahas tentang evaluasi berarti mempelajari bagaimana proses
pemberian pertimbangan mengenai kualitas sesuatu.
 Tujuan evaluasi adalah untuk menentukan kualitas sesuatu, terutama yang berkenaan
dengan “nilai dan arti”.
 Dalam proses evaluasi harus ada pemberian pertimbangan ( judgement ) yang
merupakan konsep dasar dari evaluasi. Melalui pertimbangan inilah ditentukan nilai
dan arti / makna dari sesuatu yang dievaluasi.
 Pemberian pertimbangan tentang nilai dan arti haruslah berdasarkan kriteria tertentu.
Tanpa kriteria yang jelas, pertimbangan nilai dan arti yang diberikan bukanlah suatu
proses yang dapat diklasifikasikan sebagai evaluasi. Kriteria ini penting dibuat oleh
evaluator dengan pertimbangan:
1. Hasil evaluasi dapat dipertanggungjawabkan secara ilmiah.
2. Evaluator lebih percaya diri.
3. Menghindari adanya unsur subjektivitas.
4. Memungkinkan hasil evaluasi akan sama, sekalipun dilakukan pada waktu dan
orang yang berbeda.
5. Memberikan kemudahan bagi evaluator dalam melakukan penafsiran hasil evaluasi.

Jutmini, S, dkk. (2008). Panduan Evaluasi Pembelajaran [Online]. 10. Tersedia:


http://lpp.uns.ac.id/download/PANDUAN%20EVALUASI%20PEMBELAJARAN.pdf
[11 Okteber 2010].
Ratna. (2009). PENGERTIAN DAN ESENSI KONSEP EVALUASI, ASESMEN, TES, DAN
PENGUKURAN (Online).
http://www.google.co.id/url?sa=t&rct=j&q=pengertian%20asesmen&source=web&cd=
3&ved=0CDEQFjAC&url=http%3A%2F%2Ffile.upi.edu%2FDirektori%2FFPMIPA
%2FJUR._PEND._BIOLOGI%2FANA_RATNAWULAN%2Fpengertian_asesmen.pdf
&ei=vRcpT8S0E8PyrQessuDhAQ&usg=AFQjCNGGca4u1WgNMwIlGAsqT5W6-
1BWzQ&cad=rja. Pdf (1 Februari 2012).
http://auliaprima.student.fkip.uns.ac.id/2011/10/18/hubungan-antara-penilaian-pengukuran-
evaluasi-dan-tes-dalam-pembelajaran-dan-skala-pengukuran-yang-digunakan/
http://ijobaraya.wordpress.com/2010/09/21/konsep-dasar-evaluasi-pembelajaran/
http://abyfarhan7.blogspot.com/2011/12/penilaian-proses-dan-hasil-belajar.html
http://wiliandalton.blogspot.com/2009/03/pengertian-tes-pengukuran-evaluasi-dan.html
http://www.masbied.com/2011/02/01/pengukuran-dalam-penelitian/
http://evaluasipendidikan.blogspot.com/2008/03/pengukuran-penilaian-dan-
evaluasi.html

Anda mungkin juga menyukai