Evaluasi di ambil dari bahasa inggris “Evaluation”, yang
berarti penaksiran atau penilaian. Nurkancana (1983)
mengatakan bahwa evaluasi adalah kegiatan yang dilakukan berkaitan dengan proses untuk menentukan nilai dari suatu hal. Ada dua jenis Evaluasi yaitu Pretest dan Posttest. Pretest merupakan evaluasi yang digunakan untuk menguji konsep dan eksekusi yang direncanakan. Sedangkan posttest adalah evaluasi yang digunakan untuk melihat tercapainya tujuan dan dijadikan sebagai masukan untuk analisis situasi berikutnya. Penilaian (assesment) adalah proses pengumpulan dan pengolahan informasi untuk mengukur pencapaian hasil belajar peserta didik. Penilaian autentik cenderung fokus pada tugas-tugas kompleks atau kontekstual, memungkinkan peserta didik menunjukkan kompetensi mereka yang meliputi sikap, pengetahuan, dan keterampilan dalam kehidupan nyata. Pengukuran adalah proses pemberian angka-angka atau label kepada unit analisis untuk merepresentasikan atribut-atribut konsep. Proses ini seharusnya cukup dimengerti orang walau misalnya definisinya tidak dimengerti. Hal ini karena antara lain kita sering kali melakukan pengukuran. Menurut Cangelosi (1995) yang dimaksud dengan pengukuran (Measurement) adalah suatu proses pengumpulan data melalui pengamatan empiris untuk mengumpulkan informasi yang relevan dengan tujuan yang telah ditentukan. Dalam hal ini guru menaksir prestasi siswa dengan membaca atau mengamati apa saja yang dilakukan siswa, mengamati kinerja mereka, mendengar apa yang mereka katakan, dan menggunakan indera mereka seperti melihat, mendengar, menyentuh, mencium, dan merasakan. Istilah ini berasal dari bahasa latin “testum” yang berarti sebuah piringan dari tanah liat. Pada hakikatnya tes adalah suatu alat yang berisi serangkaian tugas yang harus dikerjakan atau soal-soal yang harus dijawab oleh peserta didik untuk mengukur suatu aspek perilaku tertentu. Dengan demikian, fungsi tes adalah sebagai alat ukur. Menurut Anne Anastasia, tes adalah alat pengukur yang mempunyai standar yang objektif sehingga dapat digunakan secara meluas serta serta dapat betul-betul di gunakan untuk mmengukur dan membandingkan keadaan psikis atau tingkah laku.