Anda di halaman 1dari 5

Nama : Melisa Septeanawat

Nim : 4201417039

Penilaian Pendidikan atau Evaluasi Pendidikan


Penilaian pendidikan atau evaluasi pendidikan adalah proses sistematis untuk mendokumentasikan dan
menggunakan data empiris pada pengetahuan, keterampilan, sikap, dan kepercayaan untuk
menyempurnakan program dan meningkatkan pembelajaran siswa. Data penilaian dapat diperoleh dari
langsung memeriksa pekerjaan siswa untuk menilai pencapaian hasil belajar atau dapat didasarkan pada
data dari mana seseorang dapat membuat kesimpulan tentang pembelajaran. Penilaian sering digunakan
secara bergantian dengan tes, tetapi tidak terbatas pada tes. Penilaian dapat fokus pada pelajar individu,
komunitas belajar (kelas, lokakarya, atau kelompok pelajar terorganisir lainnya), kursus, program
akademik, institusi, atau sistem pendidikan secara keseluruhan (juga dikenal sebagai granularity).
diperlukan] Kata 'penilaian' mulai digunakan dalam konteks pendidikan setelah Perang Dunia Kedua.

Sebagai proses yang berkelanjutan, penilaian menetapkan hasil belajar siswa yang terukur dan jelas
untuk pembelajaran, menyediakan jumlah kesempatan belajar yang cukup untuk mencapai hasil ini,
menerapkan cara sistematis mengumpulkan, menganalisis dan menafsirkan bukti untuk menentukan
seberapa baik pembelajaran siswa sesuai dengan harapan, dan menggunakan informasi yang
dikumpulkan untuk menginformasikan peningkatan dalam pembelajaran siswa.

Tujuan akhir praktik penilaian dalam pendidikan tergantung pada kerangka teori para praktisi dan
peneliti, asumsi dan keyakinan mereka tentang sifat pikiran manusia, asal pengetahuan, dan proses
pembelajaran.

Jenis
Istilah penilaian umumnya digunakan untuk merujuk pada semua kegiatan yang digunakan guru untuk
membantu siswa belajar dan mengukur kemajuan siswa. Penilaian dapat dibagi demi kenyamanan
menggunakan kategorisasi berikut:

-Penempatan, penilaian formatif, sumatif dan diagnostik

-Objektif dan subyektif

-Referensi (kriteria-direferensikan, norma-direferensikan, dan ipsative (pilihan-terpaksa))

-Informal dan formal

-Internal dan eksternal

-Penempatan, formatif, sumatif dan diagnostik


Penilaian sering dibagi ke dalam kategori awal, formatif, dan sumatif untuk tujuan mempertimbangkan
berbagai tujuan untuk praktik penilaian.

Penilaian penempatan - Evaluasi penempatan digunakan untuk menempatkan siswa sesuai dengan
pencapaian sebelumnya atau karakteristik pribadi, pada titik yang paling sesuai dalam urutan
pengajaran, dalam strategi pengajaran yang unik, atau dengan guru yang sesuai yang dilakukan melalui
pengujian penempatan, yaitu tes yang digunakan perguruan tinggi dan universitas untuk menilai
kesiapan perguruan tinggi dan menempatkan siswa ke dalam kelas awal mereka. Evaluasi penempatan,
juga disebut sebagai pra-penilaian atau penilaian awal, dilakukan sebelum instruksi atau intervensi untuk
menetapkan dasar dari mana pertumbuhan individu siswa dapat diukur. Jenis penilaian ini digunakan
untuk mengetahui tingkat keterampilan siswa tentang mata pelajaran tersebut. Ini membantu guru
untuk menjelaskan materi dengan lebih efisien. Penilaian ini tidak dinilai.

Penilaian formatif - Penilaian formatif umumnya dilakukan sepanjang kursus atau proyek. Penilaian
formatif, juga disebut sebagai "penilaian edukatif," digunakan untuk membantu pembelajaran. Dalam
lingkungan pendidikan, penilaian formatif mungkin seorang guru (atau teman sebaya) atau pelajar,
memberikan umpan balik pada pekerjaan siswa dan tidak perlu digunakan untuk tujuan penilaian.
Penilaian formatif dapat berupa diagnostik, tes standar, kuis, pertanyaan lisan, atau rancangan kerja.
Penilaian formatif dilakukan bersamaan dengan instruksi. Hasilnya mungkin masuk hitungan. Penilaian
formatif bertujuan untuk melihat apakah siswa memahami instruksi sebelum melakukan penilaian
sumatif.

Penilaian sumatif - Penilaian sumatif umumnya dilakukan pada akhir kursus atau proyek. Dalam
lingkungan pendidikan, penilaian sumatif biasanya digunakan untuk memberi siswa kelas. Penilaian
sumatif adalah evaluatif. Penilaian sumatif dibuat untuk merangkum apa yang telah dipelajari siswa,
untuk menentukan apakah mereka memahami materi pelajaran dengan baik. Jenis penilaian ini biasanya
dinilai (mis. Lulus / gagal, 0-100) dan dapat berupa tes, ujian, atau proyek. Penilaian sumatif sering
digunakan untuk menentukan apakah seorang siswa telah lulus atau gagal dalam suatu kelas. Sebuah
kritik terhadap penilaian sumatif adalah bahwa mereka reduktif, dan pelajar menemukan seberapa baik
mereka telah memperoleh pengetahuan terlalu terlambat untuk digunakan.

Penilaian diagnostik - Penilaian diagnostik berkaitan dengan seluruh kesulitan pada akhirnya yang terjadi
selama proses pembelajaran.

Objektf dan subyektf


Penilaian (baik sumatif atau formatif) sering dikategorikan sebagai objektif atau subyektif. Penilaian
obyektif adalah suatu bentuk pertanyaan yang memiliki satu jawaban yang benar. Penilaian subyektif
adalah suatu bentuk pertanyaan yang mungkin memiliki lebih dari satu jawaban yang benar (atau lebih
dari satu cara mengekspresikan jawaban yang benar). Ada berbagai jenis pertanyaan objektif dan
subyektif. Jenis pertanyaan objektif mencakup jawaban benar / salah, pilihan ganda, respons ganda dan
pertanyaan yang cocok. Pertanyaan subyektif mencakup pertanyaan dan esai tanggapan panjang.
Penilaian objektif sangat cocok untuk format penilaian terkomputerisasi atau online yang semakin
populer.

Beberapa berpendapat bahwa perbedaan antara penilaian obyektif dan subyektif tidak berguna atau
akurat karena, pada kenyataannya, tidak ada yang namanya penilaian "obyektif". Faktanya, semua
penilaian dibuat dengan bias bawaan yang dibangun ke dalam keputusan tentang materi pelajaran dan
konten yang relevan, serta bias budaya (kelas, etnis, dan gender).

Dasar perbandingan
Hasil tes dapat dibandingkan dengan kriteria yang ditetapkan, atau terhadap kinerja siswa lain, atau
terhadap kinerja sebelumnya:

Penilaian yang direferensikan kriteria, biasanya menggunakan tes yang direferensikan kriteria, seperti
namanya, terjadi ketika kandidat diukur terhadap kriteria yang ditentukan (dan obyektif). Penilaian yang
direferensikan dengan kriteria seringkali, tetapi tidak selalu, digunakan untuk membangun kompetensi
seseorang (apakah ia dapat melakukan sesuatu). Contoh penilaian referensi-kriteria yang paling dikenal
adalah tes mengemudi, ketika pengemudi pelajar diukur terhadap serangkaian kriteria eksplisit (seperti
"Tidak membahayakan pengguna jalan lain").

Penilaian referensi-normal (bahasa sehari-hari dikenal sebagai "penilaian pada kurva"), biasanya
menggunakan tes referensi-normal, tidak diukur terhadap kriteria yang ditentukan. Jenis penilaian ini
relatif terhadap badan siswa yang melakukan penilaian. Ini secara efektif merupakan cara
membandingkan siswa. Tes IQ adalah contoh paling terkenal dari penilaian referensi-norma. Banyak tes
masuk (ke sekolah atau universitas bergengsi) yang direferensikan dengan norma, memungkinkan
proporsi tertentu siswa untuk lulus ("lulus" dalam konteks ini berarti diterima di sekolah atau universitas
daripada tingkat kemampuan eksplisit). Ini berarti bahwa standar dapat bervariasi dari tahun ke tahun,
tergantung pada kualitas kelompok; penilaian yang direferensikan dengan kriteria tidak berbeda dari
tahun ke tahun (kecuali jika kriteria berubah).

Informal dan formal


Penilaian dapat bersifat formal atau informal. Penilaian formal biasanya menyiratkan dokumen tertulis,
seperti tes, kuis, atau kertas. Penilaian formal diberikan skor numerik atau nilai berdasarkan kinerja
siswa, sedangkan penilaian informal tidak berkontribusi pada nilai akhir siswa. Penilaian informal
biasanya terjadi dengan cara yang lebih santai dan dapat mencakup observasi, inventaris, daftar periksa,
skala penilaian, rubrik, penilaian kinerja dan portofolio, partisipasi, evaluasi rekan dan evaluasi diri, dan
diskusi.

Internal dan eksternal


Penilaian internal ditetapkan dan ditandai oleh sekolah (mis. Guru). Siswa mendapat nilai dan umpan
balik terkait penilaian. Penilaian eksternal ditetapkan oleh badan pengelola, dan ditandai oleh personel
yang tidak bias. Beberapa penilaian eksternal memberikan umpan balik yang jauh lebih terbatas dalam
penandaan mereka. Namun, dalam tes seperti NAPLAN Australia, kriteria yang ditujukan oleh siswa
diberikan umpan balik terperinci agar guru mereka mengatasi dan membandingkan prestasi belajar
siswa dan juga merencanakan masa depan.

Standar kualitas
Secara umum, penilaian berkualitas tinggi dianggap yang memiliki tingkat keandalan dan validitas tinggi.
Namun, pendekatan terhadap reliabilitas dan validitas bervariasi.

Reliabilitas
Reliabilitas berhubungan dengan konsistensi penilaian. Penilaian yang andal adalah penilaian yang secara
konsisten mencapai hasil yang sama dengan kelompok siswa yang sama (atau serupa). Berbagai faktor
memengaruhi keandalan — termasuk pertanyaan yang ambigu, terlalu banyak pilihan di dalam makalah
pertanyaan, instruksi pemberian tanda yang tidak jelas dan penanda yang kurang terlatih. Secara
tradisional, keandalan penilaian didasarkan pada yang berikut:

Stabilitas temporal: Kinerja pada tes sebanding pada dua atau lebih kesempatan terpisah.

Kesetaraan formulir: Kinerja di antara peserta ujian setara dengan berbagai bentuk ujian berdasarkan
konten yang sama.

Konsistensi internal: Respons pada tes konsisten untuk semua pertanyaan. Misalnya: Dalam survei yang
meminta responden untuk menilai sikap terhadap teknologi, konsistensi akan diharapkan dalam
menanggapi pertanyaan-pertanyaan berikut:

"Saya merasa sangat negatif tentang komputer secara umum."

"Saya menikmati menggunakan komputer."

Validitas
Penilaian yang valid adalah penilaian yang mengukur apa yang ingin diukur. Misalnya, tidak sah untuk
menilai keterampilan mengemudi melalui tes tertulis saja. Cara yang lebih valid untuk menilai
keterampilan mengemudi adalah melalui kombinasi tes yang membantu menentukan apa yang diketahui
pengemudi, seperti melalui tes tertulis tentang pengetahuan mengemudi, dan apa yang dapat dilakukan
pengemudi, seperti melalui penilaian kinerja aktual dari pengemudi. menyetir. Para guru sering
mengeluh bahwa beberapa ujian tidak menilai silabus yang menjadi dasar ujian; mereka, secara efektif,
mempertanyakan validitas ujian.

Validitas suatu penilaian umumnya diukur melalui pemeriksaan bukti dalam kategori berikut:

-Konten - Apakah konten tes mengukur tujuan yang dinyatakan?


-Kriteria - Apakah skor berkorelasi dengan referensi luar?

-Membangun - Apakah penilaian sesuai dengan variabel signifikan lainnya?

yang baik memiliki validitas dan reliabilitas, ditambah atribut kualitas lainnya yang disebutkan di atas
untuk konteks dan tujuan tertentu. Dalam praktiknya, penilaian jarang benar-benar valid atau
sepenuhnya dapat diandalkan. Penggaris yang ditandai salah akan selalu memberikan pengukuran yang
sama (salah). Ini sangat dapat diandalkan, tetapi tidak terlalu valid. Meminta individu secara acak untuk
memberi tahu waktu tanpa melihat jam atau arloji kadang-kadang digunakan sebagai contoh penilaian
yang valid, tetapi tidak dapat diandalkan. Jawabannya akan bervariasi antar individu, tetapi jawaban
rata-rata mungkin mendekati waktu aktual. Di banyak bidang, seperti penelitian medis, pengujian
pendidikan, dan psikologi, sering kali ada pertukaran antara keandalan dan validitas. Tes sejarah yang
ditulis dengan validitas tinggi akan memiliki banyak esai dan pertanyaan kosong. Ini akan menjadi ukuran
penguasaan subjek yang baik, tetapi sulit untuk menilai sepenuhnya secara akurat. Tes sejarah yang
ditulis untuk keandalan tinggi akan sepenuhnya pilihan ganda. Ini tidak sebagus mengukur pengetahuan
sejarah, tetapi dapat dengan mudah dinilai dengan presisi tinggi. Kami dapat menggeneralisasi dari ini.
Semakin dapat diandalkan estimasi kami adalah dari apa yang kami maksudkan untuk diukur, semakin
sedikit kami yakin bahwa kami sebenarnya mengukur aspek pencapaian tersebut.

Anda mungkin juga menyukai