Anda di halaman 1dari 7

ERIC Identifier: ED328611 Tanggal Publikasi: 1990-12-00 Penulis: Wiggins, Grant Sumber:.

ERIC Clearinghouse on Pengukuran Tes dan Evaluasi Washington DC, Amerika


Institutes Penelitian Washington DC.

Kasus untuk Penilaian Otentik


Mr. Wiggins, seorang peneliti dan konsultan tentang isu-isu reformasi sekolah, adalah advokat dikenal luas dari
penilaian autentik dalam pendidikan. Digest ini didasarkan pada bahan yang ia siapkan untuk California Balai
Pengkajian.
APAKAH PENILAIAN ASLI?
Penilaian otentik ketika kita langsung memeriksa kinerja siswa pada tugas-tugas intelektual yang layak.
Penilaian tradisional, dengan kontrak, bergantung pada langsung atau proxy 'barang' - efisien, pengganti
sederhana dari yang kami pikir kesimpulan yang valid dapat dibuat tentang kinerja siswa di tantangan-
tantangan dihargai.
Apakah kita ingin mengevaluasi siswa masalah-berpose dan pemecahan masalah dalam matematika?
Penelitian eksperimental dalam ilmu? berbicara, mendengarkan, dan memfasilitasi diskusi? melakukan
penyelidikan sejarah berdasarkan dokumen-? benar-benar merevisi tulisan imajinatif sampai "bekerja"
untuk pembaca? Lalu biarkan penilaian kami dibangun dari tantangan intelektual teladan tersebut.
Perbandingan lebih lanjut dengan tes standar tradisional akan membantu untuk menjelaskan apa yang
"keaslian" berarti ketika mempertimbangkan desain penilaian dan penggunaan:
penilaian Authentic mengharuskan mahasiswa untuk menjadi pemain yang efektif dengan pengetahuan
yang diperoleh. Tes tradisional cenderung mengungkapkan hanya apakah siswa dapat mengenali, recall
atau "plug in" apa yang telah dipelajari di luar konteks. Ini mungkin bermasalah dengan menyimpulkan
mengemudi atau kemampuan dari tes tertulis saja mengajar. (Catatan, karena itu, bahwa perdebatan tidak
"baik-atau": mungkin ada kebajikan dalam berbagai instrumen penilaian lokal dan negara sebagaimana
layaknya tujuan pengukuran.)
Penilaian Authentic menyajikan siswa dengan array penuh tugas yang mencerminkan prioritas dan
tantangan yang ditemukan dalam kegiatan pembelajaran terbaik: melakukan penelitian; menulis, merevisi
dan membahas makalah; menyediakan analisis lisan menarik dari peristiwa politik baru-baru ini;
berkolaborasi dengan orang lain pada debat, dll tes konvensional biasanya terbatas pada kertas dan pensil,
satu- menjawab pertanyaan.
penilaian otentik menghadiri apakah siswa dapat kerajinan dipoles, menyeluruh dan dibenarkan
jawaban, pertunjukan atau produk. Tes konvensional biasanya hanya meminta mahasiswa untuk memilih
atau menulis jawaban yang benar - terlepas dari alasan. (Jarang ada kesempatan yang memadai untuk
merencanakan, merevisi dan memperkuat respon pada tes yang khas, bahkan ketika ada pertanyaan
terbuka). Akibatnya,
penilaian otentik mencapai validitas dan reliabilitas dengan menekankan dan standardisasi kriteria yang
sesuai untuk mencetak seperti (bervariasi) produk; pengujian tradisional standarisasi tujuan "item" dan,
karenanya, (satu) jawaban yang tepat untuk setiap.
"Uji validitas" harus tergantung sebagian pada apakah tes mensimulasikan dunia nyata "tes"
kemampuan. Validitas pada tes pilihan ganda yang paling ditentukan hanya dengan pencocokan item
dengan isi kurikulum (atau melalui korelasi canggih dengan hasil tes lainnya).
tugas Authentic melibatkan "sakit-terstruktur" tantangan dan peran yang membantu siswa berlatih untuk
ambiguitas kompleks "permainan" dari orang dewasa dan kehidupan profesional. Tes tradisional latihan
lebih seperti, menilai unsur statis dan terlalu sering sewenang-wenang diskrit atau sederhana dari kegiatan
tersebut.
Di luar pertimbangan teknis pindah ke penilaian reformasi didasarkan pada premis bahwa penilaian harus
terutama mendukung kebutuhan peserta didik. Dengan demikian, tes rahasia terdiri dari item proxy dan
skor yang tidak memiliki arti atau kegunaan yang jelas melemahkan kemampuan untuk meningkatkan
instruksi dan siswa guru kemampuan untuk meningkatkan kinerja mereka. Kami berlatih untuk dan
mengajarkan untuk tes otentik - memikirkan musik dan pelatihan militer - tanpa mengorbankan validitas.
Tes terbaik selalu mengajarkan siswa dan guru jenis pekerjaan yang paling penting; mereka
memungkinkan dan memandang ke depan, bukan hanya mencerminkan ajaran sebelumnya. Di banyak
perguruan tinggi dan semua pengaturan profesional tantangan penting yang dikenal di muka - laporan
yang akan datang, resital, presentasi Dewan, kasus hukum, buku untuk menulis, dll tes Tradisional,
dengan mewajibkan kerahasiaan lengkap untuk validitas mereka, membuat sulit bagi guru dan siswa
untuk berlatih dan mendapatkan kepercayaan diri yang berasal dari mengetahui kewajiban kinerja
mereka. (Tantangan dikenal juga memungkinkan untuk menampung semua siswa untuk standar yang
lebih tinggi).
MENGAPA KITA PERLU BERINVESTASI DALAM BENTUK KERJA-INTENSIF PENILAIAN?
Sementara tes pilihan ganda dapat indikator valid atau prediktor prestasi akademik, terlalu sering tes kami
menyesatkan siswa dan guru tentang jenis pekerjaan yang harus dikuasai. Norma tidak standar; item
masalah tidak nyata; jawaban yang benar tidak alasan-alasan.
Apa yang kebanyakan pembela tes tradisional gagal lihat adalah bahwa itu adalah bentuk, bukan isi dari
tes yang berbahaya bagi pembelajaran; demonstrasi validitas teknis tes standar seharusnya tidak menjadi
masalah dalam perdebatan reformasi assessment. Mahasiswa datang untuk percaya bahwa belajar adalah
menjejalkan; guru datang untuk percaya bahwa tes setelah-the-fakta, gangguan terdiri dari pertanyaan-
buat dikenakan - tidak relevan dengan maksud dan keberhasilan mereka. Kedua belah pihak dituntun
untuk percaya bahwa jawaban yang benar lebih penting daripada kebiasaan pikiran dan pembenaran
pendekatan dan hasil seseorang.
Sebuah langkah menuju tugas yang lebih otentik dan hasil sehingga meningkatkan pengajaran dan
pembelajaran: siswa memiliki kejelasan tentang kewajiban mereka (dan diminta untuk menguasai tugas
lebih menarik), dan guru bisa datang ke percaya bahwa hasil penilaian yang baik berarti dan berguna
untuk meningkatkan instruksi.
Jika tujuan kita adalah semata-mata untuk memantau kinerja maka pengujian konvensional mungkin
memadai. Jika tujuan kita adalah untuk meningkatkan kinerja di seluruh papan maka tes harus terdiri dari
tugas-tugas teladan, kriteria dan standar.
TIDAK PENILAIAN ASLI BE terlalu mahal dan memakan waktu?
Biaya menipu: sedangkan scoring tugas berbasis penghakiman tampaknya mahal jika dibandingkan
dengan pilihan ganda tes (sekitar $ 2 per siswa vs 1 sen) keuntungan untuk pengembangan profesi guru,
menilai lokal, dan belajar siswa banyak. Seperti negara-negara seperti California dan New York telah
menemukan (dengan menulis dan tangan-on tes ilmu mereka) perbaikan yang signifikan terjadi secara
lokal dalam mengajar dan menilai menulis dan ilmu pengetahuan ketika guru terlibat dan diinvestasikan
dalam proses penilaian.
Jika biaya membuktikan mahal, pengambilan sampel mungkin menjadi respons yang tepat - strategi yang
digunakan di California, Vermont dan Connecticut dalam kinerja dan penilaian portofolio proyek baru
mereka. Apakah melalui sampling banyak genre penulisan, di mana setiap siswa mendapat satu-satunya
yang cepat; atau melalui sampel sejumlah kecil semua kertas siswa dan portofolio sekolah-lebar; atau
melalui menilai hanya contoh kecil dari siswa, informasi berharga diperoleh dengan biaya minimum.
Dan apa yang telah kita diperoleh dengan gagal untuk cukup menilai semua kapasitas dan hasil kami
mengaku menghargai hanya karena memakan waktu, mahal, atau padat karya? Sebagian besar negara-
negara lain secara rutin meminta siswa untuk menanggapi secara lisan dan tertulis pada tes utama mereka
- negara yang sama yang mengalahkan kami di perbandingan internasional. Uang, waktu dan pelatihan
secara rutin menyisihkan untuk memastikan penilaian
yangberkualitas tinggi. Mereka juga benar menganggap bahwa standar tinggi tergantung pada kualitas
sehari-hari penilaian lokal - lebih lanjut mengimbangi jelas tingginya biaya pelatihan guru untuk
mencetak pekerjaan siswa dalam penilaian regional atau nasional.
AKAN PUBLIK MEMILIKI IMAN DI KEJUJURAN DAN KEANDALAN SKOR PENILAIAN
BERBASIS?
Kita lupa bahwa banyak program negara dan pengujian nasional dengan tingkat tinggi kredibilitas dan
integritas telah bertahun-tahun beroperasi menggunakan hakim manusia:
ujian New York Bupati, bagian yang telah memasukkan pertanyaan esai sejak awal mereka - dan yang
mencetak lokal (sementara diaudit oleh negara);
program Advanced Placement yang menggunakan pertanyaan-pertanyaan terbuka dan tugas, termasuk
tidak hanya esai pada kebanyakan tes tetapi tes berbasis kinerja di Art Portfolio dan Bahasa Asing ujian;
penilaian negara-lebar menulis di dua negara lusin mana kertas model, pelatihan pembaca, makalah
membaca "buta" dan prosedur untuk mencegah bias dan melayang gain keandalan yang memadai;
Nasional Penilaian Kemajuan Pendidikan (NAEP), penilaian kongres yang dimandatkan, menggunakan
banyak terbuka pertanyaan tes dan menulis petunjuknya (dan berhasil diujicobakan tangan-uji kinerja
ilmu pengetahuan);
baru-mandat berbasis kinerja dan pengujian berbasis portofolio negara-lebar di Arizona, California,
Connecticut, Kentucky, Maryland, dan New York.
Meskipun skor tes standar tidak memiliki kesalahan yang signifikan, prosedur dimana item yang dipilih,
dan cara di mana norma atau memotong-nilai ditetapkan seringkali cukup subjektif - dan biasanya kebal
dari pengawasan publik dan pengawasan.
Akuntabilitas asli tidak menghindari penilaian manusia. Kami memantau dan meningkatkan penghakiman
melalui sesi pelatihan, pertunjukan model yang digunakan sebagai eksemplar, audit dan kebijakan
pengawasan serta melalui prosedur dasar seperti memiliki hakim tertarik mengulas pekerjaan siswa "buta"
untuk nama atau pengalaman siswa - seperti yang terjadi secara rutin di seluruh profesional, atletik dan
seni dunia dalam penjurian kinerja.
Penilaian autentik juga memiliki keuntungan dari memberikan orang tua dan anggota masyarakat dengan
produk-produk langsung diamati dan bukti dimengerti tentang kinerja siswa mereka; kualitas pekerjaan
siswa lebih dilihat ke awam daripada ketika kita harus mengandalkan terjemahan pembicaraan tentang
stanines dan renorming.
Pada akhirnya, sebagai peneliti Lauren Resnick telah menempatkan itu, Apa yang Anda menilai adalah
apa yang Anda dapatkan; jika Anda tidak mengujinya Anda tidak akan mendapatkannya. Untuk
meningkatkan kinerja siswa kita harus mengakui bahwa kemampuan intelektual penting jatuh melalui
celah-celah pengujian konvensional.
TAMBAHAN READING
Archbald, D. & Newmann, F. (1989) "Fungsi dari Pengkajian dan Sifat Prestasi Akademik Authentic," di
Berlak Menilai Prestasi (ed.): Menjelang pengembangan Ilmu Baru dari Educational Testing. Buffalo,
NY: SUNY Press.
Frederiksen, J. & Collins, A. (1989) "A Pendekatan Sistem untuk Educational Testing," Peneliti
Pendidikan, 18, 9 (Desember).
Komisi Nasional Pengujian dan Kebijakan Publik (1990) Dari Gatekeeper ke Gateway: Transformasi
Pengujian di Amerika. Chestnut Hill, MA: NCTPP, Boston College.
Wiggins, G. (1989) "A Uji Benar: Menuju Lebih Authentic dan Penilaian Pemerataan," Phi Delta Kappa,
70, 9 (Mei).
Wolf, D. (1989) "Portofolio Penilaian: Sampling Kerja Siswa," Kepemimpinan Pendidikan 46, 7, pp 35-
39 (April)..
-----
Buku ini dibuat dengan dana dari Kantor Penelitian Pendidikan dan Peningkatan, Departemen Pendidikan
AS dengan nomor kontrak R88062003. Pendapat yang dikemukakan dalam laporan ini tidak
mencerminkan posisi atau kebijakan dari OERI atau Departemen Pendidikan. Izin diberikan untuk
menyalin dan mendistribusikan ini ERIC / TM Digest.