Sejak pertengahan tahun 1980-an, para ahli pendidikan banyak berbicara mengenai
kelemahan tes baku yang peranannya semakin dominan dalam system persekolahan. Tes
baku yang didasarkan pada prinsip validitas, reliabilitas, keamanan, kemanfaatan dan akurasi
suatu pengukuran hasil belajar, semakin luas dipersoalkan karena dianggap sebagai bagian
yang terisolir dari proses belajar secara keseluruhan.
Secara sederhana, penilaian alternatif diartikan sebagai pemanfaatan pendekatan non-
tradisional untuk memberi penilaian kinerja atau hasil belajar siswa. Istilah tradisional yang
digunakan dalam konteks pengertian diatas terutama tes baku yang menggunakan perangkat
tes objektif. Ada kalanya istilah penilaian alternatif diidentikkan dengan penilaian istilah lain
seperti penilaian otentik dan penilaian kinerja. Disebut sebagai penilaian otentik karena
penilaian alternatif sengaja dirancang untuk menjamin keaslian dan kejujuran penilaian serta
hasilnya terpecaya. Disebut penilaian kinerja, karena siswa diminta menunjukkan
penguasaannya tentang bidang ilmu tertentu, menjelaskan dengan kata-kata dan caranya
sendiri tentang peristiwa tertentu.
Istilah penilaian alternatif secara luas didefinisikan sebagai metode penilaian apapun yang
alternatif. Penilaian alternatif menuntut siswa untuk menunjukkan keterampilan dan
pengetahuan yang tidak dapat dinilai dengan menggunakan penilaian berupa tes. Penilaian
alternatif berusaha untuk mambuat siswa berpikir kritis dan evaluasi keterampilan dengan
meminta siswa untuk menyelesaikan tugas-tugas terbuka yang sering mengambil lebih dari
satu periode kelas untuk menyelesaikan.
Ada beberapa alasan memilih untuk memanfaatkan tes atau penilaian alternatif, baik dalam
proses maupun dalam produk proses pembelajaran.
1. Keberhasilan atas terjadinya perubahan lebih tergantung pada kerja keras dibandingkan
penjejalan pelajaran dimenit terakhir.
2. Bentuk ini lebih menghargai yang konsisten, karena menuntut keterlibatan dalam proses
pembelajaran secara langsung.
3. Penilaian ini menuntut respon segera dari dosen atau guru.
4. Penilaian ini menuntut dosen atau guru melakukan komunikasi yang lebih baik, lebih
terbuka, dan lebih jelas terhadap mahasiswa atau siswa.
5. Moodel penilaian ini dapat memotivasi untuk bekerja dengan cara dan gaya yang berbeda
sesuai dengan kecendrungan masing- masing.
6. Model penilaian ini dapat mengurangi “jarak” hubungan yang berbeda antara fungsi guru dan
siswa, dan dapat meciptakan hubungan yang akrab antara kedua belah pihak.
7. Model penilaian ini diyakini lebih adil, lebih mudah mengukur kompetensi, kualitas, dan
keahlian, serta bernilai dalam konteks external.
8. Menggunakan metode penilaian standar membuat aktivitas mendekati kehidupan nyata.[1]
Ada banyak cara untuk mengimplementasikan penilaian alternatif dalam kelas. Walau
bagaimanapun penilaian alternative mungkin akan menunjukkan sebagian besar karakteristik
ini:
Penilaian ini didasarkan pada tugas-tugas otentik yang menunjukkan kemampuan peserta
didik untuk mencapai tujuan komunikasi
Instruktur dan peserta fokus pada komunikasi, bukan pada jawaban yang benar dan yang
salah
Membantu peserta didik untuk menetapkan kriteria untuk berhasil menyelesaikan tugas
komunikasi
Peserta didik memiliki kesempatan untuk menilai diri mereka sendiri dan rekan-rekan
mereka.
Meminta para siswa untuk melakukan, menciptakan atau menghasilkan sesuatu.
Mendorong siswa dalam merefleksikan diri.
Mengukur hasil signifikansi.
Mampu berpikir tingkat tinggi dan keterampilan pemecahan masalah.
Menggunakan tugas-tugas yang mewakili kegiatan instruksional bermakna.
Memanggil aplikasi dunia nyata.
Menggunakan penilaian manusia (bukan mesin) untuk skor.
Memerlukan peran instruksional dan penilaian untuk guru.
Memberikan kesempatan penilaian diri bagi siswa.
Menyediakan kesempatan bagi individu maupun kerja kelompok.
Mendorong siswa untuk melanjutkan aktivitas belajar di luar ruang lingkup penugasan.
Eksplisit mendefinisikan kriteria kinerja.
Membuat penilaian sama pentingnya dengan kurikulum dan pengajaran
Assesment Kinerja
A. Pengertian
Assesment kinerja adalah suatu prosedur yang menggunakan berbagai bentuk tugas-tugas untuk
memperoleh informasi tentang apa dan sejauh mana yang telah dilakukan dalam suatu program.
Pemantauan didasarkan pada kinerja (performance) yang ditunjukkan dalam menyelesaikan suatu
tugas atau permasalahan yang diberikan. Hasil yang diperoleh merupakan suatu hasil dari unjuk kerja
tersebut.
Assesment kinerja adalah penelusuran produk dalam proses. Artinya, hasil-hasil kerja yang
ditunjukkan dalam proses pelaksanaan program itu digunakan sebagai basis untuk dilakukan suatu
pemantauan mengenai perkembangan dari satu pencapaian program tersebut.
Secara sederhana asesmen ini menilai proses perolehan, penerapan pengetahuan dan
ketrampilan melalui proses pembelajaran yang menunjukkan kemampuan peserta didik dalam proses
maupun produk. (Brualdy, 1998) Dalam asesmen kinerja, evaluasi tidak dilakukan dengan menyuruh
peserta didik menjawab atau memilih jawaban dari sederetan kemungkinan jawaban yang tersedia
akan tetapi peserta didik diharuskan menjelaskan dengan kata-kata atau caranya sendiri yang dapat
menunjukkan penguasaannya terhadap suatu hal atau peristiwa.
Performance assessment bertujuan untuk mengetahui seberapa baik subyek belajar telah mampu
mengaplikasikan pengetahuan dan keterampilannya sesuai dengan sasaran pembelajaran yang telah
ditentukan dan berfokus pada penilaian secara langsung yakni dalam arti langsung dari kinerja atau
apa yang ditampilkan oleh peserta didik, berlangsung kontinyu, dengan mengkaitkannya dengan
berbagai permasalahan nyata yang dihadapi peserta didik.
Terdapat tiga komponen utama dalam assesment kinerja, yaitu tugas kinerja, rubric performansi,
dan cara penilaian.
Tugas kinerja adalah suatu tugas yang berisi topik, standar tugas, deskripsi tugas, dan kondisi
penyelesaian tugas. Contoh Tugas dalam Pembuatan assesment kinerja dalam bidang TI adalah
sebagai berikut.
1. Internet
2. Media penyimpanan data
Pengumpulan data
Analisis data
a. Holistic Scoring, yaitu pemberian skor berdasarkan impresi penilai secara umum terhadap kualitas
performansi
b. Analytic Scoring, yaitu pemberian skor terhadap aspek-aspek yang berkontribusi terhadap suatu
performansi
c. Primary Traits Scoring, yaitu pemberian skor berdasarkan beberapa unsur dominan dari suatu
performansi.
Untuk mengetahui apakah penilaian kinerja (performance assessment) dapat dianggap berkualitas
atau tidak, terdapat tujuh kriteria yang perlu diperhatikan oleh evaluator. Ketujuh kriteria ini
sebagaimana diungkap oleh Popham (1995) yaitu:
1. Generability : apakah kinerja peserta tes (students performance) dalam melakukan tugas yang
diberikan tersebut sudah memadai untuk digeneralisasikan kepada tugas-tugas lain? Semakin dapat
digeneralisasikan tugas-tugas yang diberikan dalam rangka penilaian keterampilan atau penilaian
kinerja (performance assessment) tersebut, dalam artian semakin dapat dibandingkan dengan tugas
yang lainnya maka semakin baik tugas tersebut. Hal ini terutama dalam kondisi bila peserta tes
diberikan tugas-tugas dalam penilaian keterampilan (performance assessment) yang berlainan.
2. Authenticity: apakah tugas yang diberikan tersebut sudah serupa dengan apa yang sering dihadapinya
dalam praktek kehidupan sehari-hari?
3. Multiple foci: apakah tugas yang diberikan kepada peserta tes sudah mengukur lebih dari satu
kemampuan-kemampuan yang diinginkan (more than one instructional outcomes)?
4. Teachability: apakah tugas yang diberikan merupakan tugas yang hasilnya semakin baik karena adanya
usaha mengajar guru di kelas? Jadi tugas yang diberikan dalam penilaian keterampilan atau penilaian
kinerja (performance assessment) adalah tugas-tugas yang relevan dengan yang dapat diajarkan guru
di dalam kelas.
5. Fairness: apakah tugas yang diberikan sudah adil (fair) untuk semua peserta tes. Jadi tugas-tugas
tersebut harus sudah dipikirkan tidak ”bias” untuk semua kelompok jenis kelamin, suku bangsa,
agama, atau status sosial ekonomi.
6. Feasibility: apakah tugas-tugas yang diberikan dalam penilaian keterampilan atau penilaian kinerja
(performance assessment) memang relevan untuk dapat dilaksanakan mengingat faktor-faktor seperti
biaya, ruangan (tempat), waktu, atau peralatannya?
7. Scorability: apakah tugas yang diberikan nanti dapat diskor dengan akurat dan reliabel? Karena
memang salah satu yang sensitif dari penilaian keterampilan atau penilaian kinerja (performance
assessment) adalah penskorannya.