Anda di halaman 1dari 5

Perbedaan Utama Antara Penilaian dan Evaluasi

Dirangkum dari (Weir & Roberts, 1994; Howard & Donaghue 2015; Kellaghan & Stufflebean 2003)
Perbedaan signifikan antara penilaian dan evaluasi adalah sebagai berikut :

1. penilaian adalah Proses pengumpulan, peninjauan, dan penggunaan data, untuk tujuan
peningkatan kinerja saat ini. Sedangkan Evaluasi adalah sebuah proses dari memberikan
penilaian, berdasarkan kriteria dan bukti yang ditentukan.
2. Penilaian bersifat diagnostik karena cenderung mengidentifikasi area perbaikan. Di sisi lain,
evaluasi bersifat penilaian, karena bertujuan untuk memberikan nilai keseluruhan.
3. Penilaian memberikan umpan balik tentang kinerja dan cara-cara untuk meningkatkan kinerja di
masa depan. Berlawanan dengan ini, evaluasi memastikan apakah standar terpenuhi atau tidak.
4. Dalam penilaian, umpan balik didasarkan pada pengamatan dan poin positif & negatif. Berbeda
dengan evaluasi, di mana umpan balik bergantung pada tingkat kualitas sesuai standar yang
ditetapkan.
5. Tujuan penilaian bersifat formatif, yaitu untuk meningkatkan kualitas sedangkan evaluasi adalah
tentang menilai kualitas.
5. Penilaian berkaitan dengan proses, sedangkan evaluasi berfokus pada produk atau hasil akhir
6. Kriteria penilaian ditetapkan oleh kedua belah pihak secara bersama-sama. Berbeda dengan
evaluasi, di mana kriteria ditetapkan oleh evaluator.
1. pengertian Penilaian

Menurut Brown (1990) penilaian adalah serangkaian tindakan yang digunakan untuk menentukan
kemampuan kompleks dari individu atau kelompok. Hal Ini melibatkan pengumpulan informasi tentang
tingkat pencapaian tujuan pembelajaran siswa.

Penilaian dikembangkan oleh berbagai berbagai kelompok dan individu, termasuk guru, administrator
distrik, universitas, perusahaan swasta, departemen pendidikan dan kelompok yang mencakup
kombinasi individu dalam institusi ini. Hasil Penilaian digunakan untuk mengidentifikasi kelemahan dan
kekuatan siswa sehingga pendidik dapat memberikan dukungan dalam perbaikan pengajaran bahkan
kurikulum

Penilaian adalah proses yang mencakup empat komponen dasar:

Mengukur peningkatan dari waktu ke waktu.

Memotivasi siswa untuk belajar.

Mengevaluasi metode pengajaran.

Peringkat kemampuan siswa dalam kaitannya dengan evaluasi seluruh kelompok.

Dalam penilaian kelas, karena guru sendiri yang mengembangkan, mengelola dan menganalisis
pertanyaan, mereka lebih mungkin menerapkan hasil penilaian untuk pengajaran mereka sendiri. Oleh
karena itu, memberikan umpan balik pada efektivitas instruksi dan memberikan siswa ukuran kemajuan
mereka.

Terdapat dua fungsi utama penilaian kelas:

1. untuk menunjukkan apakah pembelajaran telah berhasil atau tidak


2. Untuk memperjelas harapan para guru dan siswa (Brown, 1990).

Brown (1990) mengatakan bahwa Penilaian sangat penting karena bisa mendorong siswa untuk belajar.
Kebanyakan siswa cenderung memfokuskan energi mereka pada cara terbaik atau tercepat untuk lulus
ujian mereka. Berdasarkan pengetahuan ini, kami dapat menggunakan strategi penilaian kami untuk
memanipulasi jenis pembelajaran yang terjadi. Misalnya, strategi penilaian yang berfokus pada
mengingat pengetahuan, kemungkinan akan menampilkan pembelajaran yang dangkal. Sedangkan jika
kita memilih penilaian strategi yang menuntut pemikiran kritis atau pemecahan masalah yang kreatif,
kita cenderung mewujudkan prestasi siswa yang lebih tinggi. Selain itu, penilaian yang bagus dapat
membantu siswa menjadi pelajar yang lebih mandiri dan efektif (Hammond : 2006).

Seperti yang ditunjukkan di atas, memotivasi dan mengarahkan pembelajaran hanyalah satu tujuan
penilaian. Strategi penilaian yang dirancang dengan baik juga berperan penting dalam pengambilan
keputusan pendidikan dan merupakan komponen penting dari kualitas yang berkelanjutan untuk proses
perbaikan di tingkat pelajaran, kursus ataupun kurikulum.

2. Jenis Penilaian

Banyak istilah yang digunakan untuk menggambarkan berbagai jenis penilaian pelajar.

a. Penilaian Informal dan Formal

Dengan penilaian informal, penilaian diintegrasikan dengan tugas-tugas lain, misalnya, umpan
balik dosen pada jawaban atas pertanyaan. Penilaian informal dapat berupa beberapa bentuk,
seperti komentar dan tanggapan antara guru dan siswa yang tidak direncanakan, pembinaan
dan umpan balik dadakan lainnya kepada siswa. Contohnya termasuk mengatakan "Kerja
bagus!"

Tidak hanya itu, banyak guru melakukan penilaian informal kepada siswa dalam bentuk tugas-
tugas kelas yang dirancang untuk membuat penilaian tentang kompetensi siswa.Contoh di akhir
pembelajaran guru meminta siswa untuk memberi tanggapan, saran, ataupun resume
pelajaran yang telah dipelajari sehingga guru mampu menunjukkan bagaimana untuk
memodifikasi catatan siswa agar siswa lebih mengingat isi pelajaran. Penilaian informal paling
sering digunakan untuk memberikan umpan balik formatif. Dengan demikian, itu cenderung
kurang mengancam dan dengan demikian kurang stres bagi siswa. Namun, umpan balik
informal rentan terhadap subjektivitas atau bias yang tinggi.
Kita dapat mengatakan bahwa semua tes adalah penilaian formal, tetapi tidak semua penilaian
formal adalah tes. Misalnya, guru melakukan penilaian formal dengan cara mengamati secara
sistematis frekuensi partisipasi lisan siswa dikelas tetapi hal tersebut tetapi hal tersebut tidak
disebut sebagai sebuah tes. mungkin menggunakan jurnal atau portofolio materi siswa sebagai
penilaian formal atas pencapaian tujuan kursus tertentu, tetapi sulit untuk menyebut kedua
prosedur itu sebagai "tes". Tes biasanya relatif dibatasi waktu (biasanya mencakup periode
kelas atau paling banyak beberapa jam) dan menggunakan sampel perilaku yang terbatas.
Penilaian formal terjadi ketika siswa menyadari bahwa tugas yang mereka lakukan adalah untuk
tujuan penilaian, misalnya ujian tertulis. Sebagian besar penilaian formal juga bersifat sumatif
dan dengan demikian cenderung memiliki dampak motivasi yang lebih besar dan dikaitkan
dengan peningkatan stres. Mengingat peran mereka dalam pengambilan keputusan, penilaian
formal harus diadakan dengan standar reliabilitas dan validitas yang lebih tinggi daripada
penilaian informal (McAlpine 2002).

b. Penilaian Formatif dan Sumatif


Penilaian formatif dirancang untuk membantu proses pembelajaran dengan memberikan
umpan balik kepada pelajar, yang dapat digunakan untuk mengidentifikasi kekuatan dan
kelemahan dan karenanya meningkatkan kinerja masa depan. Penilaian formatif paling tepat
dimana hasilnya digunakan secara internal oleh mereka yang terlibat dalam proses
pembelajaran (siswa, guru, pengembang kurikulum).
Penilaian sumatif bertujuan untuk mengukur, atau meringkas, apa yang telah dipahami siswa,
dan biasanya terjadi pada akhir kursus atau unit pengajaran. Penilaian sumatif digunakan untuk
membuat keputusan ataupun untuk menentukan kesiapan untuk kemajuan. Penjumlahan dari
apa yang telah dipelajari siswa memberikan gambaran tentang seberapa baik siswa itu telah
mencapai tujuan, tetapi tidak selalu menunjukkan jalan menuju kemajuan di masa depan. Ujian
akhir dalam kursus dan ujian kecakapan umum adalah contoh penilaian sumatif.
c. Tes Referensi-Norma dan Referensi-Kriteria

Norm-referenced adalah jenis tes yang menilai kemampuan dan kinerja peserta tes terhadap peserta tes
lainnya. Itu juga dapat mencakup sekelompok peserta tes terhadap kelompok peserta tes lainnya. Ini
dilakukan untuk membedakan orang yang berprestasi tinggi dan rendah. Konten tes mencakup area
topik yang luas yang diharapkan diketahui oleh peserta tes dan tingkat kesulitan konten bervariasi. Tes
ini juga harus diberikan dalam format standar. Uji referensi-normal membantu menentukan posisi
peserta tes dalam populasi yang telah ditentukan. Contoh-contoh tes yang direferensikan norma
termasuk SAT, ACT, dll. Tes-tes ini tidak memiliki kurikulum yang ditentukan sebelumnya dan topik-topik
pada tes bervariasi tergantung pada panel yang menetapkan tes. Tujuan dari tes Referensi-Norma
adalah untuk menempatkan peserta dalam urutan peringkat.

Criterion-Reference adalah jenis tes yang menilai kemampuan peserta tes untuk memahami kurikulum
yang ditetapkan. Dalam tes ini, sebuah kurikulum diatur di awal kelas, yang kemudian dijelaskan oleh
instruktur. Di akhir pelajaran, tes digunakan untuk menentukan seberapa banyak yang dipahami oleh
peserta tes. Tes ini biasanya digunakan untuk mengukur tingkat pemahaman peserta tes sebelum dan
sesudah instruksi diberikan. Ini juga dapat digunakan untuk menentukan seberapa baik instruktur
mengajar siswa. Tes harus memiliki materi yang dibahas di kelas oleh instruktur. Guru atau instruktur
menetapkan tes sesuai dengan kurikulum yang disajikan. Contoh tes Referensi-Kriteria meliputi tes yang
diberikan di sekolah dan perguruan tinggi di kelas oleh seorang guru. Ini membantu guru menentukan
apakah siswa harus lulus kelas.

Prinsip Penilaian

Bahasa Seberapa baik tes seharusnya? Bagaimana kita bisa mengatakan bahwa tes itu efektif?
Pertanyaan-pertanyaan sederhana ini perlu mendapat perhatian serius untuk dijawab agar dapat
menyusun tes yang baik. Item tes yang efektif sesuai dengan hasil instruksional yang diinginkan secara
langsung. Harmer (2007:167) mengatakan bahwa tes yang baik adalah tes yang melakukan pekerjaan
yang dirancang untuk mereka lakukan dan yang memudahkan orang mengambil dan menandai mereka
bahwa mereka bekerja. Tes juga memiliki efek positif daripada efek negatif pada siswa dan guru. Sebuah
tes yang baik adalah valid dan memiliki reliabilitas tanda. Tes harus kepraktisan. Selanjutnya Brown
(2004:19) menyatakan bahwa tes harus memerlukan kriteria pengujian yang meliputi kepraktisan,
reliabilitas. validitas, keaslian dan pencucian kembali. Kelima kriteria tersebut dibahas pada bagian
berikut.

1. Kepraktisan
Kepraktisan dalam pengujian bahasa mengacu pada administrasi, ekonomi dan adil. (Brown
2004:19) menyatakan bahwa tes yang efektif adalah praktis. Ini berarti bahwa tes tidak terlalu
mahal, tetap dalam batasan waktu yang tepat, relatif mudah dilakukan, dan memiliki prosedur
penilaian/evaluasi yang spesifik dan efisien waktu.
Sebuah tes yang sangat mahal tidak praktis. Tes kemahiran bahasa yang membutuhkan siswa
lima jam untuk menyelesaikannya tidak praktis karena menghabiskan lebih banyak waktu dan
uang daripada yang diperlukan untuk mencapai tujuannya. Sebuah tes yang membutuhkan
pengawasan satu-satu individu tidak praktis untuk sekelompok beberapa ratus pengambil tes
dan hanya segelintir penguji. Sebuah tes yang memakan waktu beberapa menit bagi seorang
siswa untuk mengambil dan beberapa jam untuk pemeriksa untuk mengevaluasi tidak praktis
untuk sebagian besar situasi kelas. Tes yang hanya dapat dinilai dengan komputer tidak praktis
jika tes dilakukan ribuan mil jauhnya dari komputer terdekat. Nilai dan kualitas tes terkadang
bergantung pada pertimbangan praktis dan seluk beluk semacam itu.
2. Keandalan
Sebuah tes yang dapat diandalkan adalah konsisten dan dapat diandalkan. Jika Anda
memberikan tes yang sama kepada siswa yang sama atau siswa yang cocok pada dua
kesempatan yang berbeda, tes tersebut harus memberikan hasil yang serupa. Masalah
reliabilitas tes mungkin paling baik ditangani dengan mempertimbangkan nomor. Schumacher
dan McMillan (2001:181) mengatakan bahwa reliabilitas mengacu pada konsistensi
pengukuran, sejauh mana skor serupa atas berbagai bentuk instrumen yang sama atau
kesempatan pengumpulan data. Artinya reliabilitas dalam tes bahasa mengacu pada akurasi.
konsistensi dan stabilitas pengukuran dengan tes. Airasia dan Russell (2008:243) menyatakan
bahwa reliabilitas berkaitan dengan stabilitas dan konsistensi penilaian. Mereka mengatakan
bahwa cara logis untuk memperoleh informasi tentang keandalan kinerja siswa adalah dengan
mengamati dan menilai dua atau lebih pertunjukan atau produk sejenis.

3. Validitas
Kriteria yang paling kompleks dari sebuah tes yang efektif dan bisa dibilang prinsip yang paling
penting adalah validitas, “sejauh mana kesimpulan yang dibuat dari hasil penilaian adalah
tepat, bermakna, dan berguna dalam hal tujuan penilaian. Schumacher dan McMillan
(2001:281) mengatakan bahwa validitas tes adalah sejauh mana kesimpulan dan penggunaan
yang dibuat atas dasar suatu instrumen masuk akal dan tepat. Validitas adalah penilaian
kesesuaian ukuran untuk kesimpulan, keputusan, konsekuensi atau penggunaan tertentu yang
dihasilkan dari skor yang dihasilkan. Artinya secara valid dalam pengujian bahasa mengacu
pada apa yang diujikan kepada siswa. Airasia dan Russell (2008:242) menyatakan bahwa
berkaitan dengan apakah informasi yang diperoleh dari penilaian memungkinkan guru untuk
membuat keputusan yang tepat tentang pembelajaran siswa. Selanjutnya mereka mengatakan
bahwa instrumen tes yang tidak relevan dengan pembahasan (materi) yang dimaksudkan untuk
membantu pembuatannya, tidak valid.
4. Keaslian

Keaslian didefinisikan sebagai tingkat kesesuaian karakteristik tugas tes bahasa yang diberikan
dengan fitur tugas bahasa target. Brown (2004:28) menunjukkan bahwa dalam tes, keaslian
disajikan dengan cara berikut: bahasa dalam tes sealami mungkin, item dikontekstualisasikan
daripada terisolasi, topik bermakna (relevan, menarik) bagi pelajar, organisasi tematik sonik
untuk item disediakan, seperti melalui alur cerita atau episode dan tugas mewakili, atau
mendekati tugas dunia nyata.
5. Cuci kembali
Setiap jenis tes memiliki efek washback. Itu terjadi ketika guru melihat bentuk siswa mereka
akan harus mengambil dan kemudian sebagai hasilnya, mulai mengajar untuk ujian. Washback
umumnya mengacu pada efek tes pada instruksi dalam hal bagaimana siswa mempersiapkan
tes (Brown, 2004:28).

Anda mungkin juga menyukai