Anda di halaman 1dari 22

Makalah

Pengembangan Instrumen Penilaian

Mata Kuliah
Desainn Sistem Pembelajaran
Program Pascasarjana Teknologi Pendidikan
Universitas Sebelas Maret

Oleh :
Yogi Pinilih : S812208015
Dimas Suharto : S812208003
Nur Atikasari : S812208018
BAB I

PENDAHULUAN

Setelah menetapkan tujuan atau kompetensi tertentu yang telah dikembangkan,


maka langkah selanjutnya adalah mengembangkan alat penilaian atau tools yang dapat
mengukur pencapaian hasil belajar siswa. Ini juga dikenal sebagai penilaian hasil
belajar. Di beberapa negara, termasuk Amerika, penilaian hasil belajar ini disebut
dengan tes prestasi yang menekankan penilaian berpusat pada peserta didik. Tugas
penilaian disini diharapkan berfungsi sebagai pengalaman belajar peserta didik. Selain
itu, peserta didik juga didorong untuk terlibat dalam penilaian hasil belajar ini.
Definisi penilaian yang berpusat pada peserta didik mengacu pada kriteria: (1)
sesuai dengan tujuan instruksional yang telah ditetapkan; (2) dan serangkaian tujuan
kinerja atau kompetensi yang berasal dari tujuan instruksional. Penilaian ini penting
dilakukan karena untuk mengevaluasi kemajuan peserta didik dan mengevaluasi
ketercapaian tujuan instruksional. Hasil penilaian ini kemudian memberikan gambaran
kepada pendidik seberapa baik peserta didik mampu mencapai setiap tujuan
instruksional, selain itu juga menunjukkan kepada pendidik komponen mana yang
berjalan dengan baik dan mana yang harus direvisi. Penilaian hasil belajar bagi peserta
didik juga dapat dijadikan sebagai sarana refleksi terhadap kemampuan mereka
sendiri. Refleksi seperti ini menjadi penting karena mampu membantu peserta didik
untuk bertanggung jawab atas proses belajar yang mereka jalani.
Dalam rangkaian penilaian hasil belajar, tentunya yang harus dilakukan adalah
mengembangkan instrumen penilaiannya. Pengembangan instrumen dilakukan setelah
perumusan tujuan instruksional, dengan alasan utama bahwa item tes harus sesuai
dengan tujuan yang telah ditetapkan. Sehingga sifat item tes yang diberikan kepada
peserta didik berfungsi sebagai kunci untuk pengembangan strategi instruksional. 
Berdasar uraian di atas, dalam makalah ini penulis akan memaparkan bagaimana
seorang desainer pembelajaran menyusun berbagai jenis instrumen penilaian. Kami
menggunakan istilah penilaian karena ‘pengujian’ seringkali menyiratkan tes dengan
pilihan ganda di kertas dan pensil yang terkesan kaku. Sehingga, penilaian dipilih
sebagai istilah yang lebih luas, yang mencakup semua jenis kegiatan yang efektif
untuk menunjukkan penguasaan keterampilan baru peserta didik.
BAB II
PEMBAHASAN

KONSEP
Konsep utama dalam bab ini adalah penilaian yang mengacu pada kriteria, biasanya
instrumen terdiri dari item atau tugas yang secara langsung mengukur keterampilan yang
sudah dijelaskan dalam satu atau lebih tujuan pembelajaran. Istilah kriteria digunakan karena
butir-butir penilaian dijadikan sebagai tolak ukur untuk menentukan kemampuan peserta
didik dalam memenuhi tujuan; yaitu, keberhasilan penilaian ini menentukan apakah seorang
pembelajar telah mencapai tujuan secara instruksional. Item penilaian atau tugas, terkait
langsung dengan tujuan yang telah tertera pada bahan ajar yang digunakan.
Kriteria berkaitan dengan standar minimal yang harus dikuasai. Contohnya termasuk
tolok ukur seperti siswa akan 'menjawab semua item dengan benar,' 'mengikuti keenam
langkah dalam penyimpanan cairan yang mudah terbakar secara aman,' dan 'memotong sudut
lima derajat.' Jenis spesifikasi kriteria ini dapat ditetapkan untuk satu item tes yang ditulis
untuk satu tujuan pembelajaran, beberapa item tes yang ditulis untuk satu tujuan, atau
beberapa item tes yang ditulis untuk banyak tujuan.

PENILAIAN FORMATIF DAN PENILAIAN SUMATIF PEMBELAJARAN


Manakah yang lebih tepat dilakukan sebagai seorang desainer pembelajaran: penilaian
formatif atau sumatif? Untuk menjawab pertanyaan ini, penting untuk membedakan antara
keduanya. Satu jenis penilaian tidak lebih unggul dari yang lain, masing-masing dapat
disesuaikan dengan konteks yang dipilih. Sehingga seorang desainer pembelajaran harus
mengetahui, pengambilan keputusan apa yang akan diambil dari hasil penilaian yang telah
dilakukan.
Perbedaan kedua penilaian ini disesuaikan dengan tujuan sehingga dalam
pengembangan instrumennya juga akan berbeda. Tujuan utama penilaian formatif
pembelajaran adalah untuk menguji pencapaian peserta didik bidang dalam bidang yang telah
ditentukan, sehingga penilaian difokuskan pada tujuan dan sasaran tertentu dalam bidang
yang sama. Sebaliknya, penilaian sumatif digunakan untuk mengetahui hasil belajar peserta
didik dalam kurun waktu tertentu dengan cakupan beberapa bidang yang diujikan. Dengan
penilaian sumatif ini pendidik dapat mengetahui capaian hasil belajar peserta didik yang
dapat dikuasai secara keseluruhan dan dapat digunakan sebagai salah satu dasar pengambilan
keputusan dan pelaporan hasil belajar. Secara lebih detail, tentang penilaian formatif dan
sumatif akan dibahas pada bab-bab selanjutnya. Dalam makalah ini penulis menekankan pada
pembahasan dalam mengembangkan penilaian untuk mengukur kemampuan peserta didik.
Penilaian ini bisa mencakup dengan melakukan tes objektif, pengamatan, praktek, dan
portofolio.

EMPAT TIPE TES YANG DAPAT DIGUNAKAN


1. Entry Behaviors Test (Tes awal)
Tes ini diberikan kepada peserta didik sebelum memulai pembelajaran. Tes ini
berguna untuk mengukur keterampilan syarat atau keterampilan yang harus sudah
dikuasai sebelum pembelajaran dimulai. Keterampilan syarat akan muncul di bawah
garis entry behavior pada peta kompetensi.
2. Pretest 
Tes ini dilakukan pada awal pembelajaran untuk mengetahui apakah peserta didik
sudah menguasai beberapa atau semua keterampilan yang akan diajarkan. Tujuannya
adalah untuk efisiensi. Jika semua keterampilan sudah dikuasai maka tidak perlu ada
pembelajaran. Namun jika hanya sebagian materi yang sudah dikuasai maka data tes
ini memungkinkan desainer pembelajaran untuk lebih efisien dalam merumuskan
strategi pembelajaran. Mungkin hanya review atau pengingat yang dibutuhkan. 
Biasanya pretest dan entry behavior test dijadikan satu. Hasil dari tes entry behavior
dapat digunakan desainer untuk mengetahui apakah peserta didik siap memulai
pembelajaran, sedangkan dari hasil pretest desainer dapat memutuskan apakah
pembelajaran akan menjadi terlalu mudah untuk peserta didik.
3. Practice Test 
Tujuan tes ini adalah untuk membuat peserta didik lebih aktif berpartisipasi selama
pembelajaran. Tes ini memungkinkan peserta didik untuk menampilkan pengetahuan
dan keterampilan baru serta untuk refleksi diri sampai level berapa keterampilan dan
pengetahuan mereka. Tes ini berisi keterampilan yang lebih sedikit dan lebih fokus
pada materi per pertemuan daripada per bab. Hasil tes ini digunakan pendidik untuk
memberikan feedback dan untuk memonitor pembelajaran.
4. Posttest 
Tes ini paralel dengan pretest. Sama dengan pretest, posttest mengukur tujuan
pembelajaran. Posttest harus menilai semua pembahasan. Namun jika waktu tidak
memungkinkan, maka hanya tujuan akhir dan keterampilan penting saja yang
diujikan. Posttest mungkin digunakan untuk menilai performance peserta didik.
Tujuan yang terutama dari tes ini adalah agar desainer dapat mengidentifikasi materi
pembelajaran yang tidak bisa dilakukan dengan baik. Jika peserta didik gagal dalam
tes, desainer harus dapat mengidentifikasi dalam proses pembelajaran yang mana
yang tidak dimengerti oleh peserta didik.

Tipe Tes Keputusan Desainer Pembelajaran Tujuan yang Diujikan

Entry  Apakah peserta didik siap untuk  Keterampilan prasyarat


Skills melakukan pembelajaran? atau keterampilan di bawah
Test  Apakah peserta didik harus memiliki garis putus-putus pada peta
keterampilan prasyarat yang kompetensi.
diperlukan?

Pretests  Apakah peserta didik sudah  Tujuan belajar 


menguasai keterampilan  Analisis langkah-langkah
sebelumnya? utama dari tujuan yang
 Apa keterampilan khusus yang telah ditetapkan
peserta didik kuasai?
 Bagaimana saya mengembangkan
instruksional dengan efisien?

Practice  Apakah peserta didik memperoleh  Pengetahuan dan


Test pengetahuan dan keterampilan yang keterampilan yang sudah
diinginkan? disampaikan
 Apa kesalahan yang peserta didik  Tingkat capaian difokuskan
lakukan? pada setiap pertemuan
 Apakah instruksional sudah
dilaksanakan dengan tepat?
 Apakah ritme pembelajaran sudah
sesuai untuk peserta didik?

Posttests  Apakah peserta didik telah mencapai  Tujuan akhir


tujuan akhir pembelajaran?  Langkah-langkah utama
 Apakah instruksional yang telah dan keterampilan bawahan
dilaksanakan terbukti efektif dalam
langkah utama tujuan dan untuk
setiap keterampilan bawahan?
 Dimana langkah instruksional yang
harus diperbaiki?
 Sudahkah peserta didik menguasai
informasi, keterampilan, dan sikap
yang dimaksud?

Tabel 1. Tipe Tes, Keputusan Desainer Pembelajaran, Tujuan yang Diujikan

MENDESAIN TES
Pertimbangan pertama adalah menyesuaikan bidang pelajaran dengan item atau tipe
tugas penilaian. Verbal information biasanya di tes dengan objektif tes. Tes bentuk objektif
meliputi format seperti jawaban singkat, jawaban alternatif, mencocokkan, dan pilihan ganda.
Untuk intellectual skill lebih kompleks dan biasanya menggunakan model objektif, kreasi
produk atau pertunjukan langsung. Penilaian untuk ranah afektif juga kompleks. Biasanya
tidak ada cara langsung untuk mengukur tingkah laku seseorang. Penilaian di ranah ini
biasanya dilakukan dengan observasi. Penilaian ranah psikomotor biasanya dilakukan dengan
mendemonstrasikan tugas. Untuk melihat apakah setiap langkah telah dilakukan dengan baik
oleh pebelajar, guru membuat checklist atau rating-scale. 

LEVEL PENGUASAAN
Apabila desainer pembelajaran ingin memastikan bahwa peserta didik benar-benar
mengerti keterampilan sebelum mereka melanjutkan tahap pembelajaran selanjutnya, maka
desainer harus menyediakan kemungkinan-kemungkinan untuk menampilkan keterampilan,
sehingga hampir tidak mungkin semua keterampilan dapat ditampilkan dengan berhasil. Jika
menggunakan soal pilihan ganda sangat mudah untuk menghitung kemungkinan kesempatan
berhasil. Namun, dengan tipe soal yang lain, lebih sulit dilakukan penghitungan tetapi lebih
mudah untuk meyakinkan orang lain bahwa keberhasilan bukan sekedar kesempatan saja.

KRITERIA ITEM TES


Terdapat empat kategori tes yang berkualitas, yaitu:
1. Berpusat pada tujuan (Goal-Centered Criteria) 
Soal tes dan penugasan harus sesuai dengan tujuan utama pembelajaran. Soal dan
penugasan harus sesuai dengan perilaku termasuk konsep dan prakteknya. Untuk
menyesuaikan jawaban soal tes dengan perilaku yang diharapkan dalam tujuan,
desainer pembelajaran harus mempertimbangkan tugas belajar atau kata kerja yang
digunakan dalam tujuan. Butir-butir soal harus mengukur perilaku yang sesungguhnya
yang telah dideskripsikan dalam tujuan.
2. Berpusat pada peserta didik (Learner-Centered Criteria)
Tes item dan penilaian tugas harus disesuaikan dengan karakteristik dan kebutuhan
peserta didik, meliputi kosa kata, bahasa, tingkat kompleksitas tugas, motivasi siswa,
tingkat ketertarikan siswa, pengalaman siswa, dan latar belakang siswa serta
kebutuhan khusus siswa.
3. Berpusat pada konteks (Context-Centered Criteria) 
Dalam membuat tes item dan penilaian tugas, desainer pembelajaran harus
mempertimbangkan setting pembelajaran dan juga lingkungan belajar atau lingkungan
kelas. Tes item dan tugas harus realistis atau relevan dengan setting pembelajaran.
Kriteria ini membantu untuk memastikan transfer pengetahuan dan skill dari belajar
ke dalam lingkungan pembelajaran.
4. Berpusat pada penilaian (Assessment-Centered Criteria) 
Peserta didik akan merasa cemas selama assessment, penyusunan tes item dan
penilaian tugas yang baik dapat menghilangkan rasa cemas siswa. Cetakan tes yang
berkualitas meliputi: kebahasaan baik, pengucapan dan tanda baca yang tepat, tulisan
jelas, petunjuk jelas, sumber materi dan pertanyaan jelas. Kriteria ini membantu
peserta didik untuk mengerjakan tes dengan tenang.

PENGUASAAN KRITERIA
Terdapat beberapa saran yang dapat membantu dalam menentukan berapa banyak tes
item pilihan yang diperlukan. Jika tes item memerlukan sebuah format respon yang
memungkinkan siswa dapat menebak jawaban dengan benar, maka dapat memasukkan
beberapa tes item paralel untuk tujuan yang sama, jika jawaban benar yang ditebak
kemungkinan kecil, maka dapat memutuskan satu atau dua item untuk menentukan
kemampuan siswa.
Jika ingin memeriksa pertanyaan jumlah item dalam hal domain pembelajaran, maka
lebih mudah karena lebih spesifik. Untuk menilai keterampilan intelektual, biasanya perlu
memberikan tiga atau lebih item pertanyaan untuk menunjukkan keterampilan tersebut.
Dengan informasi verbal, bagaimanapun, hanya satu item yang diperlukan untuk mengambil
informasi spesifik dari memori. Jika tujuan informasi mencakup berbagai pengetahuan
(misalnya, mengidentifikasi ibukota negara bagian), maka desainer pembelajaran harus
memilih sampel acak dari contoh dan menganggap bahwa kemampuan siswa mewakili
proporsi tujuan informasi verbal yang telah dikuasai. Dalam hal keterampilan psikomotor,
biasanya hanya ada satu cara untuk menguji keterampilan—mintalah siswa untuk melakukan
keterampilan tersebut.

KRITERIA PENGUASAAN

Ada beberapa saran praktis yang dapat membantu Anda menentukan jumlah item tes
yang dibutuhkan oleh tujuan. Jika soal atau tes membutuhkan format jawaban yang
memungkinkan siswa untuk menebak jawabannya dengan benar, maka mungkin beberapa tes
parallel item untuk tujuan yang sama harus disertakan. Jika kemungkinan menebak jawaban
yang benar tipis, namun, maka Anda dapat memutuskan bahwa satu atau dua item cukup
untuk menentukan kemampuan siswa untuk melakukan keterampilan.

  Jika mengkaji soal jumlah butir soal dalam hal pembelajaran domain tujuan, lebih
mudah untuk lebih spesifik. Untuk menilai kemampuan intelektual, biasanya diperlukan
untuk memberikan tiga atau lebih kesempatan untuk mendemonstrasikan keahlian.

  Jika tujuan informasi mencakup jangkauan yang luas pengetahuan (misalnya,


mengidentifikasi ibu kota negara bagian), maka perancang harus memilih secara acak sampel
contoh dan asumsikan bahwa kinerja siswa mewakili proporsi tujuan informasi verbal yang
telah dikuasai.

FORMAT ITEM TES DAN TUJUAN KINERJA

  Jenis kinerja tertentu dapat diuji dengan beberapa cara berbeda, dan beberapa format
item tes dapat menilai kinerja yang ditentukan lebih baik daripada yang lain. Misalnya, jika
penting bagi pembelajar untuk mengingat suatu fakta, tanyakan kepada mereka untuk
menyatakan fakta itu lebih baik daripada meminta reaksi terhadap pertanyaan pilihan ganda.
  Dengan menggunakan tujuan sebagai panduan, pilih jenis soal tes yang memberikan
siswa yang terbaik untuk menunjukkan kinerja yang ditentukan dalam tujuan.  Untuk
memilih jenis item terbaik dari antara yang dianggap memadai, pertimbangkan faktor-faktor
seperti waktu respons yang dibutuhkan oleh peserta didik, waktu penilaian yang diperlukan
untuk menganalisis dan menilai jawaban, lingkungan pengujian, dan kemungkinan menebak
jawaban yang benar.

  Ketika instruksi diimplementasikan, itu penting bahwa instruktur dapat menggunakan


prosedur evaluasi. Perancang mungkin menggunakan satu jenis item selama pengembangan
instruksi, dan kemudian menawarkan lebih luas berbagai format item ketika instruksi siap
untuk digunakan secara luas.

  Lingkungan pengujian juga merupakan faktor penting dalam pemilihan format item.
Semakin jauh perilaku dalam penilaian tersebut dihilangkan dari perilaku tersebut ditentukan
dalam tujuan, kurang akurat adalah prediksi bahwa peserta didik baik dapat atau tidak dapat
melakukan perilaku yang ditentukan. Terkadang kinerja yang tepat seperti yang dijelaskan
dalam tujuan tidak mungkin untuk dinilai, dan dengan demikian lainnya, kurang diinginkan.
Ini juga merupakan pertimbangan penting ketika instruksional strategi dikembangkan.

TES OBJEKTIF

  Tes objektif mencakup item tes yang mudah diselesaikan oleh siswa dan desainer
untuk dinilai. Jawabannya pendek dan biasanya dinilai benar atau salah, dan menilai
kebenaran suatu jawaban sangatlah mudah.

  Format objektif termasuk:

Isian, jawaban singkat, benar/salah, menjodohkan, dan pilihan ganda. Item tes yang
harus dinilai dengan menggunakan daftar periksa atau rubrik, termasuk item esai, tidak
dianggap sebagai item objektif, dan mereka dijelaskan di bagian selanjutnya tentang penilaian
alternatif.

  Strategi pengurutan tipikal untuk desainer yang harus membuat skor tangan. Satu-
satunya jenis barang yang dikecualikan dari strategi ini adalah pertanyaan esai yang panjang,
yang biasanya terletak di bagian akhir tes untuk membantu peserta didik dalam mengatur
waktu mereka selama tes. Tes diselenggarakan dengan cara ini tidak semenarik yang diatur
berdasarkan format item, tetapi jauh lebih fungsional untuk pelajar dan instruktur. Ini
memungkinkan pembelajar untuk berkonsentrasi pada satu bidang informasi dan
keterampilan pada satu waktu, dan itu memungkinkan instruktur untuk menganalisis kinerja
individu dan kelompok secara objektif tanpa terlebih dahulu menyusun ulang data.

  Arahan menulis Tes harus mencakup arah yang jelas dan ringkas. Awal sebuah tes
biasanya menimbulkan kecemasan di antara peserta didik. Seharusnya tidak ada keraguan
dalam pikiran mereka tentang apa yang mereka harus dilakukan untuk melakukan dengan
benar pada tes. Biasanya ada petunjuk arah ke seluruh petunjuk pengujian dan subbagian saat
format item berubah.

  Arah pengujian berubah sesuai dengan situasi pengujian, tetapi biasanya mencakup :

1.      Judul tes menyarankan konten untuk dicakup daripada sekadar mengatakan "Pretes" atau
"Uji I."

2.      Pernyataan singkat menjelaskan tujuan atau kinerja yang akan ditunjukkan dan jumlah
kredit yang diberikan untuk jawaban yang benar sebagian.

3.      Siswa diberi tahu apakah mereka harus menebak jika mereka tidak yakin akan jawabannya.

4.      Instruksi menentukan apakah kata-kata harus dieja dengan benar agar diterima penuh
kredit.

5.     Peserta didik diberi tahu apakah mereka harus menggunakan nama mereka atau sekadar
mengidentifikasi diri mereka sebagai anggota suatu kelompok.

6.      Batas waktu, batas kata, atau batas ruang dijabarkan. Selain itu, peserta didik harus
diberitahu apakah mereka memerlukan sesuatu yang khusus untuk menanggapi tes, seperti
pensil nomor 2; lembar jawaban yang dapat dinilai mesin; teks khusus; atau peralatan
seperti komputer, kalkulator, atau ilustrasi.  Sulit untuk menulis petunjuk pengujian yang
jelas dan ringkas.

Tes objektif bukan satu-satunya alat penilaian. Selanjutnya, kami mempertimbangkan


prosedur untuk mengembangkan penilaian alternatif, termasuk pertunjukan langsung,
pengembangan produk, dan sikap.
MENGEMBANGKAN INSTRUMEN PENILAIAN ALTERNATIF YANG DIGUNAKAN
UNTUK MENGUKUR KINERJA, PRODUK, DAN SIKAP

Banyak kompleks keterampilan intelektual memiliki tujuan proses dan produk.


Misalnya, pertimbangkan kursus di mana buku teks ini dapat digunakan. Tujuan instruksional
bisa jadi, “Gunakan proses desain instruksional untuk merancang, mengembangkan, dan
mengevaluasi satu jam dari bahan ajar mandiri.” Siswa akan diminta untuk
mendokumentasikan setiap langkah dalam mengolah dan menghasilkan seperangkat bahan
ajar. Instruktur dapat menilai proses dengan memeriksa deskripsi siswa tentang penggunaan
proses dan produk seperti analisis instruksional dan tujuan kinerja.

Skala peringkat dapat digunakan untuk mengevaluasi setiap langkah dalam proses.
skala Yang terpisah dapat digunakan untuk mengevaluasi instruksi yang dihasilkan. Situasi di
mana proses adalah hasil utama mendapat sedikit perhatian terhadap produk dengan
keyakinan bahwa dengan penggunaan proses yang berulang, produk akan terus ditingkatkan.
Dalam situasi lain, produk atau hasil adalah segalanya yang penting, dan proses yang
digunakan oleh pembelajar tidak kritis.

Arahan Penulisan

Arahan kepada peserta didik untuk penampilan dan produk yang seharusnya
menggambarkan dengan jelas apa yang harus dilakukan dan bagaimana caranya, termasuk
syarat-syarat khusus semacam itu sebagai sumber daya atau batas waktu. Dalam menulis
arahan Anda, pertimbangkan jumlah panduan yang harus diberikan. Mungkin diinginkan
untuk mengingatkan peserta didik untuk tampil dan untuk menginformasikan mereka tentang
kriteria yang akan digunakan dalam mengevaluasi pekerjaan mereka.

Dalam kasus seperti itu (misalnya, mengembangkan makalah penelitian, membuat


pidato), peserta ujian dapat diberikan salinan daftar periksa evaluasi atau skala penilaian yang
digunakan untuk menilai mereka bekerja sebagai bagian dari arahan. Faktor yang dapat Anda
gunakan dalam menentukan jumlah bimbingan yang tepat adalah sifat keterampilan yang
diujikan, termasuk kompleksitasnya, tingkat kecanggihannya dari target peserta didik, dan
situasi alami dimana peserta didik akan ditransfer keterampilannya sebagaimana ditentukan
dalam analisis konteks Anda. Instruksi untuk peserta ujian terkait dengan pengukuran sikap
berbeda dari yang diberikan untuk mengukur kinerja dan produk. Untuk evaluasi sikap yang
akurat, penting bagi peserta ujian untuk merasa bebas memilih untuk berperilaku menurut
mereka

Mengembangkan Instrumen Selain menulis instruksi untuk peserta didik, Anda harus
mengembangkan rubrik untuk memandu evaluasi kinerja, produk, atau sikap Anda. Ada lima
langkah dalam mengembangkan instrumen:

1.      Identifikasi elemen yang akan dievaluasi.

2.      Parafrase setiap elemen.

3.      Urutan elemen pada instrumen.

4.      Pilih jenis penilaian yang akan dibuat oleh evaluator.

5.      Tentukan bagaimana instrumen akan dinilai.

  Mengembangkan Format Respon Langkah keempat dalam mengembangkan


instrument mengukur kinerja, produk, atau sikap adalah menentukan bagaimana evaluator
membuat dan mencatat penilaian. Setidaknya ada tiga respon evaluator format: daftar periksa
(mis., ya atau tidak), skala peringkat yang membutuhkan tingkat kualitas diferensiasi (mis.,
buruk, memadai, dan baik), jumlah frekuensi kemunculan setiap elemen yang
dipertimbangkan, atau beberapa kombinasi dari format ini.

Mode respon evaluator tergantung pada beberapa faktor, antara lain sebagai berikut:

1.      Sifat dan kompleksitas unsur-unsur yang diamati;

2.    Waktu yang tersedia untuk mengamati, membuat penilaian, dan mencatat
penilaian;

3.      Akurasi atau konsistensi dimana evaluator dapat membuat penilaian; dan

4.      Kualitas umpan balik yang akan diberikan kepada peserta ujian.

  Dua strategi untuk mengembangkan timbangan dapat membantu memastikan


peringkat yang lebih andal. Itu pertama adalah memberikan deskripsi verbal yang jelas
tentang setiap tingkat kualitas. Alih-alih sederhana menggunakan kategori angka dan istilah
umum seperti (1) tidak memadai, (2) memadai, dan (3) bagus, Anda harus menggunakan
deskriptor verbal yang lebih tepat yang mewakili spesifik kriteria untuk setiap tingkat
kualitas.

  Semakin spesifik Anda dalam menyebutkan kriteria yang sesuai dengan masing-masing
Instrumen tingkat kualitas, semakin dapat diandalkan Anda dalam mengukur kualitas elemen
yang dinilai.

  Hitungan Frekuensi.

Penghitungan frekuensi diperlukan ketika suatu elemen menjadi yang diamati, baik
positif maupun negatif, dapat diulang beberapa kali oleh peserta ujian selama pertunjukan
atau dalam produk. Misalnya, dalam suatu produk seperti laporan tertulis, jenis fitur atau
kesalahan yang sama dapat terjadi beberapa kali. Prosedur Skoring Kegiatan terakhir dalam
membuat instrumen untuk mengukur produk, penampilan, dan sikap adalah untuk
menentukan bagaimana instrumen akan mencetak gol. Sama seperti tes kertas dan pensil,
Anda pasti membutuhkan skor tingkat objektif serta skor kinerja secara keseluruhan.

  Skor tingkat tujuan dapat diperoleh dari skala penilaian dengan menjumlahkan nomor
yang ditetapkan untuk setiap elemen yang dinilai dalam suatu tujuan. Skor yang
menunjukkan kinerja keseluruhan peserta ujian pada tujuan dapat diperoleh dengan
menjumlahkan peringkat individu di semua elemen yang termasuk dalam instrumen. Tidak
seperti tes objektif, daftar periksa, dan skala penilaian, menentukan prosedur penilaian yang
tepat untuk instrumen penghitungan frekuensi dapat menjadi tantangan. Itu prosedur terbaik
untuk digunakan harus ditentukan berdasarkan situasi spesifik, dan itu tergantung pada sifat
keterampilan atau sikap yang diukur dan pada latarnya.

  Terlepas dari bagaimana Anda memutuskan untuk mencetak instrumen penghitung


frekuensi, itu adalah hal penting yang Anda pertimbangkan selama proses pengembangan
bagaimana jadinya dilakukan dan membandingkan konsekuensi dari penilaian satu cara
versus cara alternatif. Cara dalam menilai instrumen memerlukan, modifikasi pada daftar
elemen yang ingin Anda amati; oleh karena itu, skor prosedur harus direncanakan sebelum
mulai menilai kinerja pelajar. Ketika tidak ada prosedur penilaian yang dapat ditemukan
untuk instrumen penghitungan frekuensi, Anda dapat mempertimbangkan kembali
menggunakan daftar periksa, skala penilaian, atau kombinasi. Semua saran yang tercakup
dalam diskusi ini harus membantu dalam pengembangan tes referensi kriteria. Jika Anda
seorang penulis tes yang tidak berpengalaman, Anda mungkin ingin berkonsultasi dengan
referensi tambahan tentang konstruksi uji. 

PORTFOLIO 

Portofolio merupakan kumpulan penilaian yang mengacu pada kriteria yang


menggambarkan pekerjaan peserta didik. Penilaian ini bisa merujuk kepada tes objektif yang
menunjukkan kemajuan dari pretest ke posttest, produk yang dikembangkan peserta didik
selama instruksi, atau pertunjukan langsung. Portofolio juga mencakup penilaian sikap
peserta didik tentang domain yang dipelajari atau proses pembelajaran.

Penilaian portofolio didefinisikan sebagai proses meta-evaluasi kumpulan sampel


pekerjaan atau perkembangan proses pembelajaran yang dapat diamati. Tes objektif dinilai
sebagai perubahan atau pertumbuhan kemampuan peserta didik. Kemampuan tersebut dinilai
dari pretest hingga posttest, produk, serta pelacakan kinerja untuk dibandingkan sebagai bukti
kemajuan pelajar. Setidaknya ada lima kriteria untuk merancang penilaian kualitas portofolio:

1. Tujuan dan sasaran instruksional yang termasuk dalam penilaian portofolio harus
dicantumkan.
2. Sampel pekerjaan harus dikaitkan dengan tujuan instruksional dan tujuan kinerja
tertentu.
3. Sampel pekerjaan harus merupakan penilaian yang mengacu pada kriteria yang
dikumpulkan selama proses pengajaran.
 4. Penilaian adalah pretest dan posttest reguler, terlepas dari format tes, dan biasanya
tidak ada tes khusus yang dibuat untuk penilaian portofolio.
5. Setiap penilaian reguler disertai dengan rubriknya dengan tanggapan siswa yang
dievaluasi dan diberi skor, yang menunjukkan kekuatan dan masalah dalam suatu
kegiatan

Penilaian portofolio tidak sesuai untuk semua jenis pembelajaran karena sangat memakan
waktu dan mahal. Pembelajaran membutuhkan waktu, sehingga siswa memiliki kesempatan
untuk mengembangkan serta menyempurnakan keterampilan, dan juga menghasilkan produk
atau penampilan yang dibutuhkan untuk penilaian.
KESESUAIAN DALAM PROSES DESAIN

Dalam pendekatan sistem untuk desain instruksional, keluaran dari satu langkah
adalah masukan untuk langkah berikutnya. Oleh karena itu, penting untuk berhenti secara
berkala untuk menentukan apakah produk yang dibuat konsisten dari langkah ke langkah
dalam prosesnya. Dalam proses desain, tujuan telah dianalisis, keterampilan bawahan telah
diidentifikasi, pembelajar dan konteks telah dianalisis, tujuan telah ditulis, dan penilaian telah
dikembangkan. Sangat penting untuk memastikan bahwa keterampilan, tujuan, dan penilaian
semuanya mengacu pada keterampilan yang sama, sehingga diperlukan tinjauan yang cermat
untuk memastikan kesesuaian tersebut.

Bahan untuk Mengevaluasi Desain

Anda harus memiliki semua bahan yang dihasilkan sejauh ini untuk menyelesaikan
desain evaluasi, termasuk analisis diagram pembelajaran, tujuan kinerja, ringkasan
karakteristik siswa, konteks dan kinerja pembelajaran, dan penilaian. Ingatlah bahwa ada
empat kategori Kriteria utama yang harus dipertimbangkan untuk diajukan: desain tujuan
pembelajaran, pelajar, konteks, dan penilaian. Seluruh kriteria ini dihubungkan melalui
desain penilaian yang akan dibuat.

Prosedur untuk Mengevaluasi Desain


Dengan menggunakan kriteria utama tersebut, terdapat lima langkah dalam mengevaluasi
desain:
1. Mengatur dan menampilkan materi untuk memperjelas hubungan mereka.
2. Menilai kesesuaian antara informasi dan keterampilan dalam analisis tujuan
pebelajaran dan materi yang dibuat.
3. Menilai kesesuaian antara materi dan karakteristik sasaran peserta didik.
4. Menilai kesesuaian antara kinerja dan konteks pembelajaran dan materi.
5. Menilai kejelasan semua materi.

Organisasi

Bagaimana cara terbaik dalam mengatur dan menyajikan materi untuk mengevaluasi
pada saat dalam proses desain pembelajaran? Setiap komponen dibangun berdasarkan produk
yang telah ada sebelumnya; oleh karena itu, materi harus disajikan dengan cara yang
memungkinkan perbandingan di antara berbagai komponen desain yang ada. Perancang harus
dapat melihat secara sekilas apakah komponen-komponen tersebut setingkat, sehingga dapat
dicapai dengan mengatur bahan-bahan sedemikian rupa menjadi komponen-komponen yang
terkait menjadi satu.

Urutan subskill yang akan disajikan pada bagan sangat penting. Jika menempatkannya
dalam urutan yang menurut Anda harus diajarkan, maka anda dapat menerima umpan balik
tambahan dari peninjau mengenai logika yang telah Anda gunakan untuk keterampilan
menyusun dan menyajikan instruksi. Umpan balik tambahan ini dapat menghemat langkah
dalam menulis ulang atau mengatur ulang materi di kemudian hari. Topik keterampilan
menyusun instruksi akan dibahas secara lebih rinci di bab Sembilan.

Anda harus memiliki dokumen lain yang tersedia untuk digunakan oleh penilai
dengan tabel evaluasi desain, termasuk diagram analisis pembelajaran, tabel karakteristik
target pembelajar, dan tabel yang menggambarkan kinerja dan konteks pembelajaran. Semua
item dalam tabel desain harus dikunci dengan penomoran subskill dalam diagram analisis.
Kumpulan materi lengkap ini mewakili desain pembelajaran hingga saat ini.

Kesesuaian.

Langkah kedua membutuhkan penggunaan kriteria yang berpusat pada tujuan untuk
menilai kesesuaian di antara materi. Kesesuaian antara keterampilan bawahan dalam
kerangka tujuan, tujuan kinerja yang diinginkan (kondisi, perilaku, dan konten), dan item tes
yang dimaksudkan sangat penting dalam menyiapkan kualitas materi.

Prosedur yang direkomendasikan untuk mengikuti bagian analisis ini adalah


membandingkan 
(1) keterampilan bawahan dalam analisis tujuan instruksional dengan keterampilan
bawahan yang tercantum dalam tabel evaluasi desain, 
(2) keterampilan bawahan dalam tabel dengan tujuan kinerja dalam tabel,
(3) sasaran kinerja (kondisi, kinerja, dan kriteria) dengan butir-butir tes yang ditentukan
dalam tabel.
Karakteristik Pembelajar

Langkah ketiga adalah membandingkan materi dengan karakteristik peserta didik.


Untuk analisis ini, penilai harus menilai kesesuaian antara materi dan kemampuan
pembelajar, kosa kata, minat, pengalaman, dan kebutuhan. Bahan-bahan terbaik di dunia
tidak efektif jika pembelajar yang dituju tidak dapat menggunakannya secara efektif. Apakah
peninjau percaya bahwa tujuan dan penilaian kinerja ditetapkan pada ruang lingkup dan
kompleksitas yang tepat untuk kelompok sasaran yang ditentukan? Apakah tujuan dipecah
cukup halus, atau terlalu banyak? Apakah item tes pada tingkat kompleksitas yang sesuai
untuk peserta didik?

Konteks

Langkah keempat adalah menilai kesesuaian konteks kinerja dan pembelajaran


dengan tujuan kinerja dan item tes dalam tabel evaluasi desain. Peninjau harus menilai
keaslian tugas yang ditentukan untuk konteks kinerja, karena keaslian ini membantu
memastikan transfer keterampilan dari pembelajaran ke konteks kinerja. Mereka juga harus
memeriksa kelayakan tugas untuk konteks pembelajaran. Dapatkah perancang mengharapkan
sumber daya yang diperlukan (misalnya, biaya, waktu, personel, fasilitas, peralatan) untuk
mengimplementasikan instruksi dan penilaian tersirat tersedia dalam konteks pembelajaran?

Kejelasan Bahan

Dengan keselarasan antara materi dan tujuan, konteks, dan peserta didik telah
ditetapkan, langkah terakhir bagi peninjau untuk menilai kejelasan materi. Sayangnya,
langkah ini kadang-kadang di mana evaluasi dimulai, tetapi tanpa menentukan keselarasan
dokumen desain, kejelasan mungkin menjadi poin yang diperdebatkan. Selama langkah ini,
penilai harus ditanya apakah struktur dan ruang lingkup analisis tujuan masuk akal bagi
mereka. Apakah keterampilan bawahan dan entri diidentifikasi dengan benar, dan apakah
urutannya benar? Apakah tujuan kinerja ditulis dengan jelas, dan apakah mereka tahu apa
yang dimaksud dengan masing-masing? Bagaimana persepsi mereka terhadap kualitas soal
tes, termasuk kejelasan bahasa; tingkat kosakata; tata bahasa, ejaan, dan tanda baca; format
penilaian; dan penampilan profesional?
Setelah menerima umpan balik tentang kecukupan desain dan membuat revisi yang sesuai
dalam kerangka kerja, anda telah memiliki masukan yang diperlukan untuk mulai
mengerjakan komponen model berikutnya, yaitu mengembangkan strategi pembelajaran.
Memiliki desain bagus, yang telah dianalisis dengan hati-hati, dan telah di perbaiki pada titik
ini memudahkan pekerjaan untuk melanjutkan pada langkah-langkah yang tersisa.

EXAMPLE (159)

Checklist for Evaluating Motor Skills

Dalam mengukur kinerja keterampilan motorik, diperlukan instruksi untuk kinerja dan
rubrik yang dapat gunakan dalam mencatat evaluasi kinerja. Informasi juga diberikan kepada
siswa tentang bagaimana kinerja akan dinilai. Instruksi tersebut memberitahu siswa untuk (1)
mengingat setiap langkah, (2) melakukannya dengan menggunakan alat yang sesuai, (3)
menggunakan setiap alat dengan benar, dan (4) selalu sadar akan keselamatan dalam
melakukan setiap langkah.

Dengan informasi ini, mereka memahami bahwa kegagalan dalam memenuhi salah
satu dari empat kriteria tersebut berarti kehilangan poin untuk langkah tersebut. Mereka juga
diberitahu bahwa mereka dapat dihentikan kapan saja selama ujian. Mengetahui bahwa hal
ini dapat terjadi, mengapa hal itu dapat terjadi, dan akibat dari hal tersebut dapat mengurangi
kecemasan mereka jika dihentikan selama ujian. Langkah selanjutnya dalam
mengembangkan instrumen adalah menentukan bagaimana skor siswa disusun. Untuk
melakukan hal tersebut, dapatkan skor langkah tiap bagian serta skor total untuk tes tersebut
seperti yang diperlihatkan pada gambar dibawah.
Instrument for Evaluating Behaviors Related to Attitudes

Untuk penilaian perilaku dapat disimpulkan dari, daftar tindakan, skala penilaian, atau
jumlah frekuensi yang diperlukan. Perhatikan bahwa di bagian atas instrumen ada ruang
untuk mengidentifikasi teller dan tanggal atau tanggal pengamatan. Ada juga ruang untuk
menghitung jumlah transaksi yang diamati. Informasi ini diperlukan kemudian untuk
menginterpretasikan data. Terdapat pula ruang untuk mencatat jumlah total perilaku positif
dan negatif yang ditunjukkan oleh teller selama pengamatan. Perilaku tertentu yang dicari
dijalaskan pada kolom paling kiri. Serupa dengan checklist, ada dua kolom respon untuk
evaluator. Satu-satunya perbedaan adalah bahwa ruang disediakan dalam contoh ini untuk
menghitung banyak perilaku selama beberapa transaksi yang berbeda. Dalam menentukan
bagaimana menilai instrumen, perilaku yang dianggap positif (186) dan yang dianggap
negatif (19) dihitung. Meninjau ringkasan data simulasi ini, tampak bahwa teller berperilaku
sopan terhadap pelanggan di sebagian besar kasus. Informasi ini dapat ditafsirkan dalam dua
cara, tergantung pada pengetahuan teller tentang pengamatan. Jika teller tidak menyadari
pengamatan dan memilih untuk berperilaku dengan cara ini, maka evaluator dapat
menyimpulkan bahwa teller memang menunjukkan sikap positif dalam memberikan layanan
yang sopan dan ramah.
BAB III
PENUTUP

Untuk mengembangkan tes yang mengacu pada kriteria, Anda memerlukan daftar
tujuan kinerja berdasarkan analisis instruksional. Format tes objektif adalah yang terbaik
untuk banyak informasi verbal dan tujuan keterampilan intelektual; namun, Anda tetap harus
memutuskan format item gaya objektif apa yang paling sesuai dengan kondisi dan perilaku
yang ditentukan. Item objektif harus ditulis untuk meminimalkan kemungkinan menebak
jawaban dengan benar, dan harus ditulis dengan jelas sehingga semua rangsangan atau isyarat
yang ditentukan dalam objektif ada dalam item atau instruksi. Anda juga harus memutuskan
berapa banyak item yang diperlukan untuk mengukur kinerja siswa secara memadai pada
setiap tujuan. Dalam menentukan jumlah item yang akan diproduksi, Anda harus
mempertimbangkan berapa kali informasi atau keterampilan akan diuji. Item yang cukup
untuk mendukung konstruksi pretest dan posttest harus diproduksi. Bila memungkinkan,
peserta didik harus disajikan dengan item yang berbeda setiap kali tujuan diukur.
menggunakan item tes objektif, seperti menulis paragraf, membuat pidato persuasif, dan
menganalisis dan membedakan fitur tertentu dari dua metode yang berbeda untuk
memprediksi tren ekonomi. Keterampilan intelektual yang menghasilkan suatu produk atau
kinerja, keterampilan psikomotorik, dan perilaku yang berkaitan dengan sikap harus diukur
dengan menggunakan tes yang terdiri dari instruksi untuk pelajar dan instrumen observasi
untuk evaluator. Dalam membuat instrumen ini, Anda harus mengidentifikasi,
memparafrasekan, dan mengurutkan elemen yang dapat diamati dari produk, kinerja, atau
perilaku. Anda juga harus memilih format penilaian yang masuk akal untuk evaluator dan
menentukan bagaimana instrumen akan dinilai.

Anda mungkin juga menyukai