Disusun untuk Memenuhi Tugas Mata Kuliah Perencanaan Dan Evaluasi Pendidikan
Dasar
Dosen Pengampu:
Prof. Dr. Harun, M.Pd.
Disusun oleh:
Wulan Tri Puji Utami
23012050031
1
MATERI I
PENGAMBILAN KEPUTUSAN DI KELAS DAN PENGGUNAAN PENILAIAN
2
lain (pengukur siswa lainnya) lebih tinggi dari skor siswa A.
Guru dapat melihat dari definisi sebelumnya bahwa penilaian mungkin
memberikan pengukuran atau tidak. Jika suatu prosedur menggambarkan seorang siswa
dengan label atau kategori kualitatif, siswa tersebut dinilai, namun tidak diukur dalam
pengertian yang digunakan di sini. Penilaian merupakan istilah yang lebih luas
dibandingkan tes atau pengukuran karena tidak semua jenis penilaian menghasilkan
pengukuran.
E. Evaluasi
Evaluasi didefinisikan sebagai proses membuat penilaian nilai atas nilai produk
atau kinerja siswa. Misalnya, guru mungkin menilai tulisan siswa sangat bagus untuk
penempatan nilainya. Evaluasi ini dapat mengarahkan guru untuk mendorong siswa
tersebut untuk mengikuti kompetisi esai nasional. Untuk melakukan evaluasi ini, pertama-
tama guru harus menilai kemampuan menulisnya. Guru dapat mengumpulkan informasi
dengan meninjau jurnal siswa tersebut, membandingkan tulisannya dengan siswa lain dan
dengan standar kualitas tulisan yang diketahui, dan sebagainya. Penilaian tersebut
memberikan informasi yang dapat digunakan untuk menilai kualitas atau nilai tulisan
siswa. Penilaian guru bahwa tulisan siswa berkualitas tinggi akan membuat keputusan
untuk mendorongnya mengikuti kompetisi. Evaluasi adalah dasar untuk mengambil
keputusan tentang tindakan apa yang harus diambil.
Guru melakukan evaluasi siswa untuk tujuan formatif atau sumatif. Evaluasi
formatif terhadap prestasi siswa artinya kita menilai kualitas prestasi siswa pada saat
siswa tersebut masih dalam proses belajar. Guru melakukan evaluasi formatif terhadap
siswa sehingga dapat memandu langkah pembelajaran mereka selanjutnya. Ketika guru
mengajukan pertanyaan di kelas untuk melihat apakah siswa memahami pelajaran,
misalnya, guru memperoleh informasi untuk mengevaluasi pembelajaran mereka secara
formatif. Guru kemudian dapat menyesuaikan pelajaran jika siswa belum memahaminya.
Evaluasi sumatif terhadap prestasi siswa berarti menilai kualitas atau nilai prestasi siswa
setelah proses pembelajaran selesai. Memberikan nilai huruf pada rapor adalah salah satu
contoh pelaporan evaluasi sumatif guru terhadap prestasi siswa.
F. Penilaian Dan Akuntabilitas Dengan Tinggi
Mungkin tidak mengejutkan bagi guru bahwa apa yang diajarkan dan cara
mengajarkannya tidak sepenuhnya berada di bawah kendali. Namun, mungkin
mengejutkan bagi para guru pemula bahwa penilaian yang dibuat secara eksternal di kelas
akan membentuk dan memengaruhi apa yang mereka ajarkan dan cara mereka menilai
siswanya. Program penilaian yang diamanatkan secara hukum memberikan batasan pada
3
pengajaran. Guru perlu menyadari hal ini saat merencanakan proses pembelajaran.
4
b. Guru harus terampil dalam mengembangkan metode penilaian yang sesuai untuk
keputusan pembelajaran. Dalam standar ini guru akan memiliki keterampilan dalam
pengumpulan data/informasi yang memudahkan pengambilan keputusan.
c. Guru harus terampil dalam mengamati, menilai, dan menafsirkan hasil metode
penilaian yang digunakan secara eksternal dan diproduksi guru. Dalam pengertian ini,
guru akan terampil menafsirkan hasil penilaian yang dihasilkan guru. Guru akan
mampu melaksanakan tes prestasi standard an mampu mengintrepretasikan skor
umum yang dilaporkan.
d. Guru harus terampil menggunakan hasil penilaian saat mengamil keputusan tentang
individu siswa, merencanakan keputusan tentang inidvidu siswa, merencanakan
pengajaran, mengembangkan kurikulum, dan peningkatan sekolah
e. Guru harus terampil dalam mengembangkan prosedur penilaian siswa yang valid
dengan menggunakan penilaian siswa. Dalam hal ini guru akan memahami dan
mampu mengartikulasikan nilai yang diberikan untuk siswa, memberikan alasan
rasional, dapat dibenarkan, dan adil.
f. Guru harus terampil dalam mengkomunikasikan hasil penilaian kepada siswa,
orangtua, audiens umum, dan pendidik lainnya. Guru harus secara rutin melaporkan
hasil penilaian siswa kepada pemangku kepentingan untuk mengkomunikasikan hal-
hal yang dirasa perlu. g. Guru harus terampil mengenali metode penilaian, dan
penggunaan informasi penilaian yang tidak etis, illegal, dan tidak pantas.
5
MATERI 2
MENDESKRIPSIKAN TUJUAN PENDIDIKAN DAN TUJUAN PEMBELAJARAN
6
menyesuaikan pembelajaran anda, untuk merencanakan kegiatan berikutnya, atau
untuk menentukan tujuan pembelajaran dengan lebih baik.
C. Tujuan Pendidikan, Standar Negara, Dan Tujuan Pembelajaran Tujuan
Pendidikan Vs Tujuan Pembelajaran Spesifik
Sekolah dan pembelajaran terorganisisr lainnya membantu siswa mencapai
tujuan pembelajaran. Salah satu dari banyak cara untuk mendefinisikan tujuan
pendidikan adalah bahwa mereka adalah aktivitas manusia yang berkontribusi
pada fungsi masyarakatnya (termasuk berfungsinya individu dalam masyarakat)
dan mana yang bisa diperoleh melalui pembelajaran.
Tujuan pendidikan dinyatakan secara luas. Mereka memberikan arahan dan
tujuan untuk merencanakan kegiatan pendidikan secara keseluruhan. Contoh
pernyataan tujuan pendidikan yang luas muncul dalam laporan yang disiapkan
oleh departemen pendidikan negara bagian, sistem sekolah setempat, dan asosiasi
seperti Dewan Guru Matematika Nasional, Asosiasi Amerika untuk kemajuan
sains, dan Asosiasi Ahli Geografi Amrika Serikat.
7
mungkin memiliki target pembelajaran umum bahwa bahwa siswa siswa harus
“mempelajari organisasi dan fungsi sel”. Namun, apa yang dapat dilakukan siswa
untuk menunjukkan pembelajaran mengenai tujuan umum ini? Mungkin ada
beberapa jawaban terhadap pertanyaan ini, masing-masing diungkapkan sebagai
tujuan instruksional tertentu dari masing-masing menggambarkan apa yang dapat
dilakukan oleh seorang siswa, seperti yang ditunjukkan dalam contoh berikut :
Contoh :
1. Siswa dapat menggambar model berbagai jenis sel dan beri label pada bagian-
bagiannya.
2. Siswa dapat membuat daftar bagian-bagian sel dan menjelaskan struktur
yang terdapat di dalamnya.
3. Siswa dapat menjelaskan fungsi-fungsi yang dilakukan oleh sel-sel
yang berbeda dan bagaimana fungsi-fungsi tersebut berhubungan lainnya.
Pernyataan tentang apa yang dapat dilakukan siswa pada akhir pembelajaran
dapat disebut target penguasaan pembelajaran. Hal ini juga disebut sebagai
pernyataan “bisa melakukan”. Hal ini juga disebtu hasil pembelajaran spesifik dan
tujuan perilaku.
F. Target Pembelajaran Penguasaan Vs Target Pembelajaran Perkembangan
Beberapa keterampilan dan kemampuan lebih tepat dinyatakan pada tingkat
abstraksi yang lebih tinggi daripada target pembelajaran penguasaan untuk
mengkomunikasikan bahwa keterampilan dan kemampuan tersebut terus
dikembangkan sepanjang hidup.
G. Taksonomi Target Pembelajaran
Cukup menulis target pembelajaran "dari atas kepala Anda" bisa membuat
frustasi karena ada kemungkinan target yang tampaknya tak ada habisnya.
Selanjutnya, jika Anda tidak terbiasa menulis target leaming, Anda cenderung
menulis terlebih dahulu target yang memiliki fokus sangat sempit, menentukan
topics konten, dan mewakili keterampilan kognitif tingkat rendah. Taksonomi
dapat membantu Anda mengingat berbagai target penting dan keterampilan
berpikir.
Taksonomi target pembelajaran instruksional adalah skema yang sangat
terorganisir untuk mengklasifikasikan target pembelajaran ke dalam berbagai
tingkat kompleksitas. Secara umum, target pendidikan terbagi dalam salah satu
dari tiga domain:
8
1. Domain kognitif: Target fokus pada pengetahuan dan kemampuan yang
membutuhkan memori, pemikiran, dan proses penalaran.
2. Domain afektif: Target fokus pada perasaan, minat, sikap, disposisi, dan
keadaan emosional.
3. Domain psikomotorik: Target fokus pada keterampilan motorik dan proses
perseptial.
9
BAB III
Completion, Short-Answer, and True-False Items
A. Three fundamental principles for crafting assessment (tiga prinsip dasar dalam
pembuatan evaluasi)
1. Prinsip Penilaian Pendidikan
Pada kegiatan peningkatan mutu pendidikan, guru berperan penting saat
kegiatan belajar mengajar. Guru adalah profesi paling penting pada kegiatan
belajar untuk menentukan kualitas hasil belajar peserta didik (Hayati 2021). Guru
kelas khususnya pada sekolah dasar, wajib mempunyai kemampuan
meningkatkan profesionalitas secara terus menerus (Irmawanty dkk, 2019). Hal
yang terjadi dalam proses pembelajaran yaitu kurangnya perhatian guru terhadap
aspek penilaian hasil belajar. Dapat diartikan bahwa pendidik lebih fokus ketika
proses belajar saja, dapat dikatakan juga bahwa proses belajar harus berjalan
lancar. Sehingga, kurang dalam memperhatikan tujuan yang ingin dicapai,
berakibat pada teknik penilaian yang sederhana dan belum terpenuhi kriteria
yang ada. Dan juga, masih terdapatkesalahan baik dalam pemahaman konseptual
pendidik tentang penilaian maupun dalam pelaksanaan dan pemakaian hasil
penilaian tersebut. Biasanya guru jarang mempelajari suatu penilaian dan
melakukan penilaianseolah-olah apa adanya tanpa terlebih dahulu memahami
prinsip-prinsip penilaian serta tujuan dan fungsi penilaian.
2. Pendekatan dalam penilaian
Menurut (Arifin,2012)terdapat 2 pendekatan pada penilaian,
yakni: Criterion-Referenced-Assessment (CRA) dan Norm-
Referenced-Assesment (NRA). Penjelasannya sebagai berikut:
a. Criterion-Referenced-Assessment (CRA) ialah penilaian acuan dalam patukan
yang menjadi acuapan dalam hal yang dilakukan peserta didik atau
kemampuannya, tidak membandingkan individu dengan individu lain.
Kriteria disini ialah pencapaian kompetensi peserta didik setelah
pembelajaran.Rentag kriteria 70%-90%. Bagi yang mendapatkan dibawah
criteria, maka ia tidak berhasil dalam menyelesaikan materi yang telah
diajarkan dan harus melakukan remedial. Penilaian ini dapat meningkatkan
hasil peserta didik dalam belajar dan mereka sungguh- sungguh untuk
mencapainya (Irhamni,2018)
10
b. Norm-Referenced-Assesment (NRA) ialah penilaian acuan dalam
norma kelompok . Perolehan nilai denganmembandingkan hasil
belajar individu dengan individu lainnya atau berdasarkan
kelompok kemudian penilaiannya dimasukkan pada rentang hasil
belajar yang telah ditetapkan, Memberi penilaian dari hasil
perolehan pada skor kelompok tersebut .
B. Short-answer items (Item Jawaban Singkat)
1. Beragam Format Jawaban Singkat (Varieties of short-answer formats)
Ada berbagai variasi format pertanyaan singkat (short-answer
formats) yang dapat digunakan dalam penilaian pendidikan. Berikut
adalah beberapa variasi format pertanyaan singkat yang dapat
digunakan:
a. Jawaban Singkat Terbuka: Ini adalah format pertanyaan di mana
siswa diminta untuk memberikan jawaban dalam bentuk kalimat
atau beberapa kalimat singkat. Format ini memungkinkan siswa
untuk mengekspresikan pemikiran mereka secara bebas.
b. Kata-kata Kunci atau Frasa: Dalam format ini, siswa diminta untuk
memberikan kata kunci atau frasa pendek yang merangkum konsep
atau informasi yang relevan. Ini dapat digunakan untuk menguji
pemahaman konsep atau definisi.
c. Daftar atau Poin-poin: Siswa diminta untuk menyusun daftar atau
poin- poin terkait dengan topik atau pertanyaan tertentu. Ini dapat
digunakan untuk menguji pemahaman tentang rangkaian konsep
atau langkah- langkah.
d. Penomoran atau Urutan: Dalam format ini, siswa diminta untuk
mengurutkan informasi, peristiwa, atau langkah-langkah dalam
urutan yang benar. Ini digunakan untuk menguji pemahaman
urutan logis atau prosedur.
e. Identifikasi: Siswa diminta untuk mengidentifikasi elemen atau
komponen yang relevan terkait dengan topik atau masalah tertentu.
Ini digunakan untuk menguji pemahaman komponen-komponen
yang penting.
11
f. Pemilihan dari Opsi: Siswa diberikan pilihan jawaban dan diminta untuk
memilih yang benar atau yang paling sesuai. Ini mirip dengan format pilihan
ganda, tetapi dengan pilihan yang lebih sedikit.
g. Isian Singkat: Siswa diminta untuk melengkapi kalimat atau pernyataan yang
tidak lengkap dengan informasi yang relevan. Ini dapat digunakan untuk
menguji pemahaman konteks atau hubungan antara konsep.
h. Pertanyaan Desain: Siswa diminta untuk merancang atau merumuskan solusi
untuk masalah tertentu dalam beberapa kalimat atau dalam bentuk singkat. Ini
digunakan untuk menguji pemahaman konsep yang lebih mendalam dan
kemampuan pemecahan masalah.
2. Merancang Item Pertanyaan Singkat. ( crafting short-answer items)
Konteks umum, "crafting short-answer items" (membuat item pertanyaan
singkat) merujuk kepada proses merancang pertanyaan singkat atau pertanyaan
berbentuk jawaban singkat yang digunakan dalam penilaian
pendidikan.Pembuatan item pertanyaan singkat adalah bagian penting dari
pengembangan instrumen penilaian yang efektif. Hal ini melibatkan merancang
pertanyaan yang sesuai dengan tujuan pembelajaran, mengukur pemahaman atau
kemampuan yang ingin diuji, serta menyusun instruksi dan skoring yang jelas.
Selain itu, pertanyaan singkat harus diformulasikan sedemikian rupa sehingga
dapat memberikan informasi yang berharga tentang kemajuan siswa dan
membantu dalam pengambilan keputusan pembelajaran.
12
Materi 4
MULTIPLE-CHOICE AND MATCHING EXERCISES
Contoh
Batang
Batang soal adalah bagian dari soal yang mengajukan pertanyaan, menetapkan
tugas yang harus dilakukan siswa, atau menyatakan masalah yang harus dipecahkan
siswa. Anda menulis stem agar siswa memahami tugas apa yang harus dilakukan
atau pertanyaan apa yang harus dijawab.
Alternatif
Guru menyebut daftar tanggapan yang disarankan dengan berbagai nama:
alternatif, tanggapan, pilihan, dan opsi. Alternatif-alternatif tersebut harus selalu
disusun dengan cara yang bermakna (secara logis, secara numerik, abjad, dll.).
Urutan kronologis kejadian dan ukuran objek (besar, sedang, kecil) adalah contoh
urutan logis. Jika tidak ada urutan logis atau numerik di antara mereka, alternatif
harus disusun dalam urutan abjad. Pada contoh sebelumnya, alternatif disusun
berdasarkan urutan abjad. Alasannya adalah karena Anda tidak ingin membuat pola
yang dapat memberi petunjuk jawaban bagi siswa yang tidak mengetahuinya. Kedua,
13
mengikuti aturan ini akan menghemat waktu siswa.
2. Alternatif dan Pengalih Perhatian Utama
Alternatif yang merupakan jawaban yang benar atau terbaik untuk pertanyaan atau
masalah yang Anda ajukan disebut jawaban kunci, alternatif kunci, atau kunci.
Alternatif lain yang salah disebut pengecoh atau distraktor. Tujuan dari pengecoh
adalah untuk menyajikan jawaban yang masuk akal (tetapi salah) jawaban atas
pertanyaan atau solusi untuk masalah di buritan. Pertanyaan-pertanyaan ini harus
masuk akal hanya untuk siswa yang tidak memiliki tingkat pengetahuan atau
pemahaman yang dibutuhkan oleh target pembelajaran-mereka yang belum
mempelajari materi dengan cukup baik. Sebaliknya, pertanyaan tidak boleh masuk
akal bagi siswa yang memiliki tingkat pengetahuan yang Anda inginkan.
3. Kritik
Wood (1977) telah merangkum beberapa kritik terhadap tes pilihan ganda. Tentu
saja, sebagian besar kritik yang diungkapkan dalam bagian ini juga berlaku untuk
semua jenis prosedur penilaian. Namun, dalam format penilaian lainnya, kelemahan-
kelemahan tersebut dapat muncul dalam cara guru memberikan tugas atau dalam
rubrik yang digunakan guru untuk menilai jawaban siswa.
1. Siswa harus memilih dari daftar pilihan yang sudah ditentukan, bukannya
menciptakan atau mengekspresikan ide atau solusi mereka sendiri. Jika Anda hanya
mengandalkan tes pilihan ganda, Anda akan berisiko memberikan sedikit atau
bahkan tidak ada
kesempatan kepada siswa untuk menulis tentang towir dalam mata pelajaran yang
mereka pelajari. sedang belajar.
2. Butir soal pilihan ganda yang ditulis dengan buruk dapat bersifat dangkal, sepele,
dan terbatas pada pengetahuan faktual. Tentu saja, begitu juga dengan format
penilaian yang dibuat dengan buruk. Mendapatkan pengetahuan dan keterampilan
untuk mengatasi kritik ini adalah alasan mengapa Anda mengikuti kursus ini!
3. Karena biasanya hanya satu pilihan jawaban yang dianggap benar, siswa yang lebih
pandai mungkin akan dihukum karena tidak memilih pilihan tersebut. Siswa yang
lebih cerdas dapat mendeteksi kekurangan dalam soal pilihan ganda karena
ambiguitas kata- kata, sudut pandang yang berbeda, atau pengetahuan tambahan
tentang mata pelajaran tersebut; sedangkan siswa lain tidak.
4. Butir soal pilihan ganda cenderung mengarah pada pengetahuan yang
"terstandardisasi", "divulgarisasi", atau "disetujui". Masalah yang dipecahkan siswa
14
pada soal pilihan ganda cenderung sangat terstruktur dan tertutup (memiliki satu
jawaban yang benar). Hal ini memberikan kesan bahwa semua Soal-soal dalam
suatu bidang studi memiliki satu jawaban yang benar, yang dapat mendorong siswa
untuk menaruh terlalu banyak kepercayaan pada kebenaran figur otoritas atau dapat
salah mengartikan suatu bidang studi sebagai bidang studi yang memiliki dasar
pengetahuan yang tetap dan terbatas. Lebih lanjut, jika Anda menggunakan tes
pilihan ganda yang tidak menggunakan soal- soal yang terkait dengan materi
interpretasi yang realistis, hal ini akan mengakibatkan tes tidak memiliki konteks
dunia nyata. Hal ini disebut sebagai pengetahuan yang didekontekstualisasikan.
Akibatnya, tes Anda mungkin tidak dapat menilai apakah siswa dapat
menggunakan apa yang telah mereka pelajari dalam konteks yang bermakna dan
otentik.
5. Penggunaan tes pilihan ganda secara eksklusif untuk penilaian yang penting atau
berisiko tinggi dapat membentuk pendidikan dengan cara yang tidak diinginkan.
Mereka yang keberatan dengan tes pilihan ganda menunjukkan bahwa Jenis ujian
yang Anda gunakan dapat membentuk isi dan sifat instruksi yang Anda berikan
kepada siswa. Jika soal pilihan ganda dalam penilaian berisiko tinggi, maka
fokuslah pada pengetahuan faktual, guru cenderung menggunakan teknik drill-and-
practice untuk mempersiapkan siswa dalam menghadapi ujian. Jika tes berisi soal
pilihan ganda yang menilai penggunaan pengetahuan dan penerapan keterampilan
berpikir tingkat tinggi, strategi pengajaran drill-and-practice menjadi kurang efektif.
Materi 5
TUGAS PENILAIAN ESAI
15
memiliki kebebasan sepenuhnya untuk menjelajahi topik sesuai keinginannya,
melainkan harus tetap fokus pada hal-hal yang telah ditentukan.
16
Yang mungkin unik dari bentuk soal esai adalah menawarkan kesempatan bagi
siswa untuk menampilkan kemampuan mereka dalam menulis, mengorganisasi,
mengekspresikan, dan untuk menjelaskan keterkaitan antar ide. Guru dapat
menilai daya ingat dan pemahaman siswa dengan lebih mudah dengan soal
jawaban singkat dan saol pilihan. Oleh karena itu, pilihlah format penilaian yang
akan menilai secara tepat target pembelajaran yang ingin dicapai siswa.
17
18
MATERI 6
HOTS dan PROBLEM SOLVING
19
memisahkan gabungan golongan benda menjadi dimensi-dimensi tersendiri, misalnya
warna bunga mawar terdiri atas merah, putih, dan kuning.
20
4. Tahap Operasional Formal (12 Tahun Ke Atas)
21
Pada taksonomi Andersoan dikenal istilah HOT (Higher Order Thinking).
Dimana dimaksud dengan HOT adalah kemampuan berpikir tingkat tinggi.
Dalam taksonomi Anderson, hasil belajar yang termasuk kedalam wilayah ini
mulai “menganalisis” hingga “mencipta” seperti terlihat pada piramida di atas.
Siswa SD sudah bisa diajarkan hingga tingkat mencipta benda atau karya yang
sederhana sesuai usia perkembangan berpikir.
22
2. Kecerdasan yang tidak lagi dipandang sebagai kemampuan yang tidak dapat
diubah, melainkan kesatuan pengetahuan yang dipengaruhi oleh berbagai
faktor. Faktor tersebut terdiri dari lingkungan belajar, strategi dan kesadaran
dalam belajar.
3. Pemahaman pandangan yang telah bergeser dari unidimensi, linier, hirarki
atau spiral menuju pemahaman pandangan ke multidimensi dan interaktif.
4. Keterampilan berpikir tingkat tinggi yang lebih spesifik seperti penalaran,
kemampuan analisis, pemecahan masalah, dan keterampilan berpikir kritis
dan kreatif.
23
Ranah afektif
Tabel 3.
Ranah Psikomotorik
24
B. Keterampilan Berpikir Tinggi Problem Solving
Menurut Marzano dkk (1988) problem solving adalah salah satu bagian dari
Menurut Mourtos, Okamoto dan Rhee, ada enam aspek yang dapat digunakan
untuk mengukur sejauh mana keterampilan pemecahan masalah peserta didik,
yaitu:
1. Mengidefinisi masalah, menjelaskan permasalahan, menentukan kebutuhan
data dan informasi yang harus diketahui sebelum digunakan Buku Pegangan
Pembelajaran Berorientasi pada Keterampilan Berpikir Tingkat Tinggi 14
untuk mendefinisikan masalah sehingga menjadi lebih detail, dan
mempersiapkan kriteria untuk menentukan hasil pembahasan dari masalah
yang dihadapi.
2. Mengeksplorasi masalah, dengan menentukan objek yang berhubungan dengan
masalah, memeriksa masalah yang terkait dengan asumsi dan menyatakan
hipotesis yang terkait dengan masalah.
3. Merencanakan solusi dimana peserta didik mengembangkan rencana untuk
memecahkan masalah, memetakan sub-materi yang terkait dengan masalah,
memilih teori prinsip dan pendekatan yang sesuai dengan masalah, dan
menentukan informasi untuk menemukan solusi.
4. Melaksanakan rencana, pada tahap ini peserta didik menerapkan rencana yang
telah ditetapkan.
5. Memeriksa solusi, mengevaluasi solusi yang digunakan untuk memecahkan
masalah.
6. Mengevaluasi, dalam langkah ini, solusi diperiksa, asumsi yang terkait dengan
solusi dibuat, memperkirakan hasil yang diperoleh ketika
mengimplementasikan solusi dan mengkomunikasikan solusi yang telah
dibuat.
25
Pembelajaran abad 21 menggunakan istilah yang dikenal sebagai 4Cs (critical
thinking, communication, collaboration, and creativity), adalah empat
keterampilan yang telah diidentifikasi sebagai keterampilan abad 21/21st century
skills. Framework 21st Century Skills Kompetensi Berpikir P21
1. Definisi Masalah
Tahap paling pertama adalah mendefinisikan masalah. harus dicari tahu apa
sebenarnya inti dari masalah itu dan dari mana sumbernya.
2. Identifikasi Masalah
Setelah mengetahui akar masalahnya, maka identifikasi dan petakan hal-hal
yang berkaitan dengan masalah itu, seperti dampak langsung dan tidak langsung
3. Cari Alternatif Solusi
Dari hasil identifikasi, akan menemukan beberapa alternatif solusi.
4. Pilih Solusi Terbaik
Dari alternatif solusi yang muncul, dapat dipilih solusi yang terbaik.
5. Terapkan
Dari alternatif solusi yang muncul, didapatkan solusi terbaik tinggal penerapan.
6. Evaluasi
Evaluasi perlu dilakukan untuk melihat efektifitas keputusan yang diambil.
26
C. Critical Thinking
Terdapat berbagai pengertian berpikir kritis. Turan, dkk (2019)
menawarkan definisi yang paling sederhana: “Berpikir kritis berarti membuat
penilaian- penilaian yang masuk akal”. Turan memandang berpikir kritis
sebagai menggunakan criteria untuk menilai kualitas sesuatu, dari kegiatan
yang paling sederhana seperti kegiatan normal sehari-hari sampai
menyusun kesimpulan dari sebuah tulisan yang digunakan seseorang untuk
mengevaluasi validitas sesuatu (pernyataan-pernyataan, ide-ide, argumen-
argumen, penelitian, dan lain-lain). Alsaleh (2020) menyatakan bahwa
berpikir kritis sebagai pengaturan diri dalam memutuskan (judging)
sesuatu yang menghasilkan interpretasi, analisis, evaluasi, dan inferensi,
maupun pemaparan menggunakan suatu bukti, konsep, metodologi,
kriteria, atau pertimbangan kontekstual yang menjadi dasar dibuatnya
keputusan. Berpikir kritis penting sebagai alat inkuiri. Berpikir kritis
merupakan suatu kekuatan serta sumber tenaga dalam kehidupan
bermasyarakat dan personal seseorang.
27
28
MATERI 8
HOW TO CRAFT PERFORMANCE TASKS,
PROJECTS, PORTOFOLIOS, RATING SCALES,
AND SCORING RUBRICS
29
dapat dinilai atau harus dinilai dengan tugas kinerja: Pilih hanya target yang
dapat dinilai dan harus dinilai. Ingatlah dari pembahasan sebelumnya bahwa kita
harus membuat rencana penilaian dan pembuatan penilaian kinerja harus
disesuaikan dengan rencana itu. Terakhir, ingat kembali bahwa prinsip dasar
penilaian adalah fokus hanya pada target pembelajaran yang penting; dengan
demikian, penilaian kita harus menilai target pembelajaran yang bermanfaat.
Menilai Dimensi Prestasi
Bagian paling penting dari tahap pertama dalam penyusunan
penilaian kinerja adalah menentukan dimensi prestasi yang akan dipakai
untuk menilai kinerja siswa (lihat Marzano et al., 1993; Stiggins, 1987).
Dimensi prestasi adalah pengetahuan, keterampilan, dan kemampuan
yang dipelajari siswa dari hasil pengajaran. Dimensinya mencakup target
pembelajaran spesifik seperti isi atau materi pelajaran dan target
pembelajaran seumur hidup. Dimensi pencapaian konten mencakup
target pembelajaran deklaratif dan prosedural spesifik yang ingin dicapai
siswa. Sasaran pembelajaran deklaratif adalah fakta, ide, generalisasi, dan
teori yang ingin dipelajari siswa. Sasaran pembelajaran prosedural adalah
keterampilan, metode, dan prosedur yang ingin dipelajari siswa. Dimensi
pencapaian seumur hidup mencakup hasil yang diharapkan kurikulum
atau mungkin berguna di luar sekolah, seperti pemikiran kompleks,
pemrosesan informasi, komunikasi efektif, kerja sama dan kolaborasi,
dan kebiasaan berpikir (Marzano et al.,1993). Kita harus menyusun tugas
kinerja diseputar dimensi pencapaian atau kerangka kerja lain yang
diwajibkan digunakan oleh kebijakan sekolah.
Batasi Jumlah Dimensi yang Dinilai: Kita tidak boleh mencoba menilai
semua dimensi pencapaian dalam satu tugas kinerja, jika tidak maka
tugas tersebut akan menjadi berat dan membingungkan. Marzano dan
rekannya (1993) menyarankan bahwa setiap tugas kinerja harus menilai
satu dimensi pencapaian dari masing- masing empat kategori berikut:
konten, pemikiran kompleks, pemrosesan informasi, dan komunikasi
efektif. Menilai satu dimensi pencapaian dari masing-masing dua
kategori lainnya (kolaborasi/kerja sama dan kebiasaan berpikir) adalah
opsional.
30
MATERI 9
EVALUASI FORMATIF MENGGUNAKAN PENILAIAN INFORMAL
DIAGNOSIS
31
3. Penguasaan pendekatan tujuan tertentu, dimana deficit diartikan sebagai
kegagalan siswa dalam mencapai satu atau lebih target pembelajaran di
akhir pembelajaran. Misalnya, target pembelajaran, siswa dapat mengurangi
dengan system bersusun ke bawah, di akhir pembelajaran siswa belum
mampu mencapi target tersbeut.
32
MATERI 10
Mempersiapkan Siswa Untuk Dinilai dan Menggunakan Hasilnya
Untuk Meningkatkan Penilaian
A. Mempersiapkan Siswa
1. Mempersiapkan Siswa Untuk Penilaian
a. Menilai Kinerja Maksimal Yang Tidak Biasa Di Kelas
Guru harus menilai kinerja maksimum siswa daripada kinerja
biasa mereka (Cronbach, 1990). Guru menilai kinerja maksimum
ketika mengatur kondisi sehingga siswa dapat memperoleh nilai
terbaik yang mereka bisa. Menilai kinerja tipikal ketika
mengumpulkan informasi tentang apa yang akan dilakukan siswa di
bawah kondisi normal atau tipikal. Sebagai contoh, mungkin siswa
telah diajarkan keterampilan praktis seperti menyeimbangkan buku
cek, dan prosedur penilaian, mengumpulkan informasi tentang
apakah setiap siswa mampu melakukannya, hal Ini adalah penilaian
kinerja yang maksimal, di sisi lain, beberapa siswa mungkin
melakukan kesalahan di luar kelas ketika benar-benar menggunakan
cek saat berbelanja, atau mereka mungkin tidak pernah melakukan
rekonsiliasi rekening giro mereka. Dengan demikian, siswa tersebut
mungkin mampu melakukan keterampilan yang diajarkan
sebelumnya, tetapi biasanya tidak dapat melakukan keterampilan
tersebut secara maksimal. Karena sekolah biasanya berusaha: untuk
mengajarkan kemampuan baru kepada para siswa pada tingkat yang
tinggi, maka penilaian prestasi dilakukan dalam kondisi yang
mendorong siswa untuk melakukan yang terbaik dari kemampuan
mereka.
b. Memberikan Informasi Yang Cukup Kepada Siswa Sebelum
Penilaian
Guru bertanggung jawab secara profesional untuk
menginformasikan kepada siswa tentang penilaian yang akan datang
dan bagaimana penilaian akan dilakukan. Untuk menilai siswa yang
berada di bawah dengan memberikan Siswa Informasi yang cukup
sebelum melakukan penilaian. Setidaknya guru memberikan
informasi tentang penilaian Anda yang akan dating sebagai berikut:
33
soal- soal dalam ujian, sejauh mana ingatan akan dibutuhkan).
6) Bagaimana penilaian akan dinilai dan dinilai (apakah kredit
parsial akan diberikan?).
7) Pentingnya hubungan hasil penilaian tertentu dengan keputusan
mengenai siswa (misalnya, akankah dihitung setengah dari nilai
periode penilaian?).
c. Kapan Penilaian Diberikan
Guru memberitahukan kapan penilaian akan dilaksanakan,
sehingga siswa dapat mempersiapkan diri terlebih dahulu. Siswa,
perlu mengatur upaya belajar mereka dan menetapkan prioritas .
Mereka dapat belajar melakukan perencanaan ini ketika mereka
mengetahui tanggal ujian sebelumnya. Guru dari berbagai mata
pelajaran harus mengoordinasikan jadwal penilaiannya agar tersebar.
d. Pop Kuis Tidak Menilai Performa Dengan Maksimal
Beberapa guru menganjurkan kuis “kejutan” atau “pop”. Alasan
mereka seringkali berupa gagasan yang samar-samar bahwa siswa
yang baik harus selalu siap untuk melakukan perintah. Hal ini
nampaknya merupakan harapan siswa yang tidak realistis. Beberapa
guru menggunakan kuis kejutan untuk mengancam atau menghukum
kelas yang tidak patuh. Hal ini dianggap sebagai penggunaan
penilaian yang tidak etis. Siswa dengan masalah khusus sering kali
mendapat manfaat dari mengetahui tentang penilaian jauh
sebelumnya. Kecemasan dan ketakutan menghadapi ujian cenderung
berkurang ketika siswa dapat merencanakan program studi secara
rasional untuk penilaian yang akan datang (Mealey & Host, 1992).
Anak-anak penyandang disabilitas yang
e. Kondisi Penilaian
Memberi tahu siswa kondisi yang diharapkan dapat mereka lakukan:
Berapa banyak soal yang akan diujikan? Berapa lama waktu yang
dimiliki siswa untuk menyelesaikan penilaian? Apakah penilaiannya
akan dipercepat? Apakah bukunya terbuka atau tertutup? Apakah
34
akan ada penalti untuk menebak? Dan pada jam berapa diberikan
(jika tidak pada waktu biasa)?
f. Menjelaskan Kepada Siswa Apa Saja Cakupan Tes Mengatakan
informasi untuk merencanakan dan belajar secara efektif, siswa
memerlukan lebih banyak detail. Beberapa guru menyiapkan daftar
pertanyaan penelaahan untuk membantu siswa memfokuskan siswa.
Hal ini mungkin sangat berguna bagi siswa sekolah dasar yang
menganggap hampir semua hal dalam buku sama pentingnya.
Pertanyaan belajar juga membantu siswa yang lebih tua, terutama
ketika sejumlah besar materi telah dibahas selama semester
tersebut. Untuk siswa sekolah menengah dan perguruan tinggi,
alternatif untuk mengembangkan serangkaian pertanyaan belajar
adalah dengan memberi mereka salinan cetak penilaian, daftar target
pembelajaran, salinan kriteria penilaian (atau rubrik), atau garis
besar konten terperinci yang menunjukkan jumlah item yang
mencakup setiap elemen.
35
siswa seringkali harus menebak sifat atau jenis pertanyaan yang akan
muncul pada suatu penilaian. Misalnya, seorang guru memberikan
latihan latihan kepada siswa kelas enam yang memintanya untuk
mengidentifikasi frasa preposisi secara terpisah menggunakan daftar
kata dan frasa tertentu. Keesokan harinya, penilaiannya terdiri dari
menemukan subjek, predikat, dan frase preposisi dalam konteks
beberapa paragraf yang lebih otentik. Siswa tidak pernah mempunyai
kesempatan untuk mempraktekkan tugas yang menjadi tanggung
jawabnya. Cara terbaik untuk membiasakan siswa dengan tugas-tugas
yang akan muncul dalam penilaian adalah dengan memberi mereka
contoh tugas, mungkin bentuk penilaian lama yang dapat mereka
praktikkan. Hal ini
mungkin efektif khususnya ketika jenis tugas yang muncul dalam
penilaian bersifat kompleks atau asing bagi siswa.
i. Memberitahu Siswa Bagaimana Cara Menilai Tes
Mempersiapkan diri, terutama untuk menjawab tugas terbuka. Jika
guru akan memberikan poin untuk mengeja istilah-istilah penting dan
nama diri, maka siswa perlu melatih ejaan ini selain
mempelajari gagasan utama dan melatih cara menyusun jawaban
mereka. Siswa juga perlu mengetahui apakah dan bagaimana guru
akan memberikan nilai untuk jawaban yang kurang sempurna dan
berapa bobot (yaitu, nilai) yang akan diberikan untuk setiap
pertanyaan. Pastikan untuk membagikan rubrik penilaian kepada
siswa jauh sebelum memberikan ujian.
36
k. Keterampilan Pengambilan Nilai Minimal Dan Keterampilan
Yang Perlu Diajarkan Kepada Siswa
Siswa memerlukan lebih dari sekadar informasi tentang penilaian,
Siswa perlu belajar cara mengerjakan tes. Guru perlu mengajari siswa
keterampilan mengambil penilaian minimum berikut, mungkin
melalui instruksi langsung di kelas (Ebel & Frisbie, 1991):
37
ekstensif, juga tidak menganjurkan untuk selalu memberikan tes yang
panjang. Namun harus bersikap adil terhadap siswa. Jika kita
mengharapkan mereka untuk mengerjakan penilaian negara bagian
dan tes standar dengan baik, maka mereka harus mengalami jenis
penilaian ini selama kelas normal mereka sebagai bagian dari proses
pengajaran dan penilaian normal mereka. Mempersiapkan siswa
untuk mengambil
tes pilihan ganda yang lebih lama seminggu atau lebih sebelum tes
tampaknya tidak tepat. Ini hanya membuang- buang waktu
pengajaran dan mungkin merupakan praktik pengajaran yang tidak
etis.
2. Keterujian
a. Kuis Tes Kebijaksanaan
Pastikan untuk menandai jawaban untuk setiap item, meskipun tidak
yakin dengan jawabannya. Ada jawaban yang benar atau terbaik
untuk setiap item.
38
c. Saran Mengubah Jawaban
Apakah siswa akan mendapat manfaat jika mereka mengubah
jawabannya setelah diberi tanda pada lembar jawaban? Terlepas
39
Materi 11
THE MEANING OF TEST SCORE
40
1. Interpretasi Yang Mengacu Pada Norma
a. Norma dan Kelompok Inferensi
Untuk memahami kinerja pada tes psikologi atau pendidikan,
sering kali berguna untuk membandingkan kinerja peserta tes dengan
kinerja beberapa kelompok individu yang telah dipilih sebelumnya. Nilai
mentah pada tes, seperti jumlah yang benar, memiliki makna khusus ketika
dievaluasi terhadap kinerja kelompok normatif atau kelompok referensi.
Untuk mencapai hal ini, ketika menggunakan pendekatan acuan norma
untuk menginterpretasikan skor tes, skor mentah pada tes biasanya
dikonversi menjadi skor turunan berdasarkan informasi tentang kinerja
kelompok normatif atau referensi tertentu. Pertimbangan yang paling
penting ketika membuat interpretasi yang mengacu pada norma adalah
relevansi dari kelompok individu yang dibandingkan dengan kinerja
peserta tes. Kelompok referensi dari mana norma-norma diturunkan harus
mewakili jenis individu yang diharapkan untuk mengikuti tes dan harus
didefinisikan sebelum standarisasi tes. Ketika Anda menginterpretasikan
kinerja siswa dalam tes atau penilaian lainnya, Anda harus bertanya pada
diri sendiri, "Apakah norma-norma ini sesuai untuk siswa ini?" Sebagai
contoh, akan masuk akal untuk membandingkan kinerja siswa pada tes
prestasi akademik dengan siswa lain yang memiliki usia, kelas, dan latar
belakang pendidikan yang sama. Namun, mungkin tidak terlalu berguna
untuk membandingkan kinerja siswa dengan siswa yang lebih muda yang
tidak terpapar kurikulum yang sama, atau dengan siswa yang lebih tua
yang telah menerima instruksi, pelatihan, atau pengalaman tambahan. Agar
interpretasi yang mengacu pada norma menjadi bermakna, Anda perlu
membandingkan kinerja peserta ujian dengan kinerja kelompok referensi
atau sampel yang relevan. Oleh karena itu, langkah pertama dalam
mengembangkan data normatif yang baik adalah mendefinisikan dengan
jelas populasi yang menjadi sasaran tes.
Setelah populasi referensi yang sesuai telah didefinisikan dengan
jelas, sampel acak dipilih dan diuji. Kelompok referensi normatif yang
41
standardisasi, sampel dari populasi target yang diambil dengan
menggunakan seperangkat prosedur tertentu. Sebagian besar penerbit dan
pengembang tes memilih sampel standardisasi menggunakan prosedur
yang dikenal sebagai pengambilan sampel acak berstrata proporsional
populasi. Ini berarti bahwa sampel orang dipilih sedemikian rupa untuk
memastikan bahwa populasi nasional secara keseluruhan terwakili secara
proporsional pada variabel-variabel penting. Di Amerika Serikat,
misalnya, tes biasanya distandarisasi dengan menggunakan rencana
pengambilan sampel yang mengelompokkan sampel berdasarkan jenis
kelamin, usia, pendidikan, etnis, latar belakang sosial ekonomi, wilayah
tempat tinggal, dan ukuran komunitas berdasarkan statistik populasi yang
disediakan oleh Biro Sensus AS. Jika data dari Biro Sensus menunjukkan
bahwa 1% dari populasi AS terdiri dari laki-laki Afrika-Amerika dengan
status sosial ekonomi menengah yang tinggal di pusat-pusat kota di
wilayah selatan, maka 1% dari sampel standardisasi tes diambil untuk
memenuhi karakteristik yang sama. Setelah sampel standarisasi dipilih
dan diuji, tabel skor turunan dibuat. Tabel-tabel ini didasarkan pada
kinerja sampel standardisasi dan biasanya disebut sebagai tabel normatif
atau "norma". Karena relevansi sampel standardisasi sangat penting
ketika menggunakan tes yang direferensikan dengan norma, maka
penerbit tes bertanggung jawab untuk memberikan informasi yang
memadai tentang sampel standardisasi. Selain itu, merupakan tanggung
jawab setiap pengguna tes untuk mengevaluasi kecukupan sampel dan
kesesuaian dalam membandingkan skor peserta ujian dengan kelompok
tertentu. Dalam membuat keputusan ini, Anda harus mempertimbangkan
faktor-faktor berikut:
1) Apakah sampel standardisasi mewakili peserta ujian yang akan
menggunakan tes tersebut? Apakah karakteristik demografis sampel
(misalnya, usia, ras, jenis kelamin, pendidikan, lokasi geografis, dll.)
serupa dengan peserta ujian yang akan mengikuti tes? Dalam istilah
awam, apakah Anda membandingkan apel dengan apel dan jeruk
dengan jeruk?
42
2) Apakah sampelnya mutakhir? Partisipan dalam sampel dari 20 tahun
yang lalu mungkin akan memberikan respons yang sangat berbeda
dengan sampel kontemporer. Sikap, kepercayaan, perilaku, dan
bahkan kemampuan kognitif berubah seiring waktu, dan agar relevan,
data normatif haruslah data terkini (lihat Topik Minat Khusus 3.1
untuk informasi mengenai "Efek Flynn" dan bagaimana kecerdasan
berubah seiring waktu).
3) Apakah ukuran sampel cukup besar untuk memberikan informasi
statistik yang stabil? Meskipun tidak ada angka ajaib, namun jika
sebuah tes mencakup rentang usia yang luas, maka biasanya sampel
standardisasi melebihi 1.000 peserta. Jika tidak, jumlah peserta pada
setiap tingkat usia atau kelas mungkin terlalu kecil untuk
menghasilkan estimasi rata-rata, standar deviasi, dan distribusi skor
yang lebih umum. Sebagai contoh, Tes Prestasi Individu Wechsler
Achievement Test-Second Edition (WIAT-II; The Psychological
Corporation, 2002) memiliki 3.600 peserta dalam standarisasi, dengan
minimal 150 peserta di setiap tingkat kelas (yaitu pra-taman kanak-
kanak sampai kelas 12).
Pertimbangan terakhir mengenai interpretasi yang mengacu pada
norma adalah pentingnya administrasi yang terstandarisasi. Sampel
normatif harus diberikan tes dalam kondisi yang sama dan dengan
prosedur administratif yang sama dengan yang akan digunakan dalam
praktik yang sebenarnya. Oleh karena itu, ketika tes diberikan dalam
pengaturan klinis atau pendidikan, penting bagi pengguna tes untuk
mengikuti prosedur administratif dengan tepat. Sebagai contoh, jika Anda
memberikan tes standar, Anda harus memastikan bahwa Anda membaca
petunjuk secara verbatim dan mematuhi batas waktu. Tentu saja tidak
masuk akal untuk membandingkan kinerja siswa Anda pada tes
matematika dengan waktu tertentu dengan kinerja sampel standarisasi
yang diberi waktu lebih atau kurang untuk menyelesaikan butir soal.
(Kebutuhan untuk mengikuti prosedur administrasi dan penskoran yang
standar sebenarnya berlaku untuk semua tes yang terstandardisasi, baik
43
yang mengacu pada norma maupun yang mengacu pada kriteria).
44
MATERI 12
ITEM ANALYSIS FOR TEACHERS
(Analisis Soal Untuk Guru-Guru)
45
Untuk memaksimalkan variabilitas dan reliabilitas, tingkat kesulitan soal yang
optimal adalah 0,50, yang menunjukkan bahwa 50% peserta tes menjawab soal
dengan benar dan 50% menjawab salah. Berdasarkan pernyataan ini, anda
mungkin menyimpulkan bahwa semua soal tes sebaiknya memiliki tingkat
kesulitan 0,50, namun hal ini belum tentu benar karena beberapa alasan. Salah
satu alasannya adalah bahwa soal-soal dalam suatu tes sering kali berkorelasi
satu sama lain, yang berarti proses pengukuran mungkin menjadi kacau jika
semua soal memiliki nilai p 0,50. Akibatnya, sering kali diinginkan untuk
memilih beberapa item dengan nilai p di bawah 0,50 dan beberapa dengan nilai
lebih besar dari 0,50, namun dengan rata-rata 0,50. Aiken (2000)
merekomendasikan bahwa harus ada kisaran sekitar 0,20 nilai p di sekitar nilai
optimal. Misalnya, pengembang tes mungkin memilih item dengan tingkat
kesulitan berkisar antara 0,40 hingga 0,60, dengan rata-rata 0,50.
Alasan lain mengapa 0,50 bukanlah tingkat kesulitan optimal untuk setiap
situasi pengujian adalah karena pengaruh menebak. Pada soal-soal dengan
respons yang dikonstruksi (misalnya, soal esai dan jawaban singkat) yang tidak
terlalu menjadi perhatian utama dalam menebak, 0,50 biasanya dianggap sebagai
tingkat kesulitan optimal. Akan tetapi, pada soal dengan respon terpilih
(misalnya soal pilihan ganda dan benar-salah) di mana peserta tes dapat
menjawab soal tersebut dengan benar hanya dengan menebak, tingkat kesulitan
optimalnya bervariasi. Untuk mempertimbangkan efek menebak, tingkat kesulitan
soal yang optimal ditetapkan lebih tinggi daripada jawaban soal yang dibangun.
Misalnya, untuk soal pilihan ganda dengan empat pilihan, rata-rata p harus sekitar
0,74 (Lord, 1952). Artinya, pengembang tes mungkin memilih soal dengan
tingkat kesulitan dari 0,64 hingga 0,84 dengan rata-rata sekitar 0,74. Tabel 6.1
memberikan informasi mengenai nilai rata-rata p optimal untuk soal jawaban
terpilih dengan jumlah alternatif atau pilihan yang bervariasi.
Tabel 6.1 Nilai p Optimal untuk Soal dengan Jumlah Pilihan yang Bervariasi
Nomor Pilihan OptimalBerartiPNilai
2 (misalnya, Benar-Salah) 0,85
3 0,77
4 0,74
46
5 0,69
Tanggapan yang 0,50
dibangun (misalnya,
esai)
Situasi Penilaian Khusus dan Kesulitan Butir
Diskusi kita tentang kesulitan soal sejauh ini paling dapat diterapkan pada
tes yang mengacu pada norma. Untuk tes yang mengacu pada kriteria, khususnya
tes penguasaan, tingkat kesulitan soal dievaluasi secara berbeda. Pada tes
penguasaan, peserta tes biasanya lulus atau gagal dan ada harapan bahwa sebagian
besar peserta tes pada akhirnya akan berhasil. Akibatnya, pada tes penguasaan,
biasanya soal memiliki nilai p rata-rata setinggi 0,90. Tes lain yang dirancang
untuk tujuan penilaian khusus mungkin berbeda dalam hal mewakili tingkat
kesulitan soal yang diinginkan. Misalnya, jika sebuah tes dikembangkan untuk
membantu pemberi kerja memilih 25% pelamar kerja teratas, maka akan lebih
baik jika tes tersebut memiliki item dengan nilai p yang rata-rata sekitar 0,25. Jika
suatu tes diinginkan untuk dapat membedakan antara peserta ujian dengan kinerja
tertinggi (misalnya, dalam menguji siswa berbakat dan berbakat), mungkin juga
diinginkan untuk memasukkan setidaknya beberapa soal yang sangat sulit.
Singkatnya, meskipun rata-rata p sebesar 0,50 adalah optimal untuk
memaksimalkan variabilitas di antara peserta tes, tingkat kesulitan yang berbeda-
beda diinginkan dalam banyak aplikasi pengujian. Kami akan memberikan
beberapa contoh bagaimana pengembang tes menggunakan informasi tentang
kesulitan item dan statistik analisis item lainnya untuk memilih item yang akan
dipertahankan, direvisi, atau dihapus dari administrasi tes di masa depan.
B. Soal Diskriminasi
Diskriminasi soal mengacu pada seberapa baik suatu soal dapat membedakan
atau membedakan peserta tes yang berbeda pendapat dalam konstruksi yang
diukur dengan tes tersebut. Misalnya, jika sebuah tes dirancang untuk mengukur
47
tingkat kesulitan soal yang disepakati mengenai cara menghitung statistik, lebih
dari 50 indeks diskriminasi soal yang berbeda telah dikembangkan selama
bertahun-tahun (Anastasi & Urbina, 1997). Untungnya, sebagian besar indeks ini
menghasilkan hasil yang serupa (Engelhart, 1965; Oosterhof, 1976).
Korelasi soal-total yang besar diambil sebagai bukti bahwa suatu soal
mengukur konstruk yang sama dengan ukuran tes secara keseluruhan dan bahwa
soal tersebut membedakan antara individu yang memiliki konstruk tinggi dan
mereka yang memiliki konstruk rendah. Korelasi soal-total yang dihitung pada
total yang disesuaikan akan lebih rendah dibandingkan dengan yang dihitung pada
total yang tidak disesuaikan dan lebih disukai karena soal yang diperiksa tidak
"mencemari" atau meningkatkan korelasi. Hasil korelasi soal-total akan serupa
dengan indeks soal diskriminasi dan dapat diinterpretasikan dengan cara yang
sama (Hopkins, 1998).
48
MATERI 13
The Initial Steps In Developing a Classroom Test
49
3. Mengidentifikasi kekuatan dan kelemahan siswa: Dengan menganalisis hasil tes,
guru dapat mengidentifikasi kekuatan dan kelemahan siswa dalam pemahaman
materi. Informasi ini dapat digunakan untuk merencanakan pengajaran yang lebih
efektif dan menyediakan bantuan tambahan kepada siswa yang membutuhkannya.
5. Mempersiapkan siswa untuk evaluasi tingkat yang lebih tinggi: Tes kelas juga
dapat berfungsi sebagai persiapan untuk evaluasi tingkat yang lebih tinggi, seperti
ujian akhir atau ujian nasional. Dengan terbiasa menghadapi tes kelas, siswa
dapat mengembangkan keterampilan ujian yang penting, seperti manajemen
waktu, analisis soal, dan komunikasi efektif
Dengan menyusun tujuan tes yang jelas dan terarah, guru akan memiliki panduan
yang kuat selama proses pengujian dan dapat memastikan bahwa pengujian yang
dilakukan akan efektif dan efisien.
Proses penMemberikan umpan balik yang jelas kepada siswa, guru, dan orang
tua tentang prestasi belajar siswa.
50
c. Mendorong pengembangan kurikulum yang berfokus pada hasil belajar yang
konkret dan terukur.
d. Uji Coba: Melakukan uji coba instrumen tes kepada sejumlah siswa untuk
mengumpulkan data dan melakukan analisis untuk memperbaiki instrumen yang
ada.
e. Revisi dan Finalisasi: Merevisi instrumen tes berdasarkan hasil uji coba dan
analisis, serta finalisasi instrumen yang akan digunakan.
3. Jenis-Jenis Tes
a. Tes Objektif: Tes pilihan ganda atau isian singkat yang mengukur pengetahuan
faktual dan pemahaman siswa.
c. Tes Kinerja: Tes praktik atau proyek yang mengukur kemampuan siswa
dalam menerapkan pengetahuan dan keterampilan dalam konteks nyata.
51
b. Pemahaman Konsep: Mengukur pemahaman siswa terhadap konsep-konsep
yang mendasari materi pelajaran.
52
MATERI 14
A. Perencanaan Tes Kelas dan Penilaian (Planning Classroom Tests and Assessments)
Tes kelas dan penilaian memiliki peran penting dalam mengevaluasi hasil belajar siswa.
Validitas dari penilaian ini bergantung pada perencanaan dan persiapan yang cermat. Tujuan
utama adalah untuk mendapatkan informasi yang valid, reliabel, dan bermanfaat tentang
pencapaian siswa. Hal ini memerlukan penentuan apa yang perlu diukur dan definisi yang
tepat. Juga melibatkan spesifikasi domain pencapaian dan memastikan penekanan yang
sesuai pada tujuan-tujuan utama. Sejumlah langkah, termasuk menentukan tujuan
pengukuran, mengembangkan spesifikasi, memilih tugas yang sesuai, dan menyusun item,
harus diikuti untuk meningkatkan kemungkinan persiapan penilaian yang valid.
Tes kelas dan penilaian dapat digunakan untuk berbagai tujuan instruksional, seperti
pretes, tes selama instruksi, dan penilaian akhir instruksi. Pretes digunakan untuk
menentukan kesiapan siswa atau menilai pencapaian sebelumnya. Tes selama instruksi
digunakan untuk penilaian formatif, memonitor kemajuan dan memberikan umpan balik. Tes
akhir instruksi menilai sejauh mana hasil pembelajaran telah dicapai dan juga dapat
memberikan umpan balik serta mengevaluasi efektivitas pengajaran.
Dalam menyusun tes dan penilaian, penting untuk mencocokkan item dan tugas dengan
hasil pembelajaran yang diinginkan. Berbagai jenis item dan tugas, seperti jawaban singkat,
pilihan ganda, benar-salah, dan pertanyaan esai, dapat digunakan untuk mengukur berbagai
jenis hasil. Item tes objektif sangat terstruktur dan memerlukan respons yang spesifik,
sementara tugas penilaian kinerja memberikan kebebasan lebih dalam respons. Kedua jenis
ini memiliki kelebihan dan keterbatasan dan harus digunakan sesuai dengan kebutuhan.
Untuk memastikan sampel item dan tugas yang representatif, dapat dikembangkan tabel
spesifikasi. Tabel ini memandu pemilihan item dan tugas untuk mengukur hasil
pembelajaran yang diinginkan dan memastikan representasi yang seimbang dari konten.
Jumlah item dan tugas tergantung pada tujuan pengukuran, jenis item yang digunakan, dan
tingkat reliabilitas yang dibutuhkan. Penting untuk menghilangkan hambatan yang tidak
relevan terhadap performa dan memastikan bahwa siswa memiliki keterampilan dan
kemampuan yang diperlukan untuk merespons. Ambiguitas harus dihindari, dan item serta
tugas harus jelas dan ringkas.
53
Secara keseluruhan, tes kelas dan penilaian memainkan peran penting dalam
mengevaluasi hasil belajar siswa. Perencanaan dan persiapan yang cermat diperlukan untuk
memastikan hasil yang valid dan reliabel. Pemilihan item dan tugas yang tepat,
pencocokannya dengan hasil yang diinginkan, dan penghilangan faktor-faktor ekstrinsik
adalah pertimbangan kunci dalam konstruksi tes.
1. Tujuan dari tes kelas dan penilaian
Tujuan dari tes kelas dan penilaian adalah untuk mendapatkan informasi yang valid,
reliabel, dan bermanfaat tentang pencapaian siswa. Penilaian ini digunakan untuk mengukur
hasil pembelajaran, menentukan kesiapan siswa, memantau kemajuan, mendeteksi
pemahaman yang keliru, memberikan umpan balik kepada siswa dan guru, serta
mengevaluasi efektivitas pengajaran. Mereka juga membuat hasil pembelajaran yang
diharapkan eksplisit bagi siswa dan orang tua, serta menunjukkan jenis kinerja yang dihargai.
Tujuan utamanya adalah untuk meningkatkan pembelajaran siswa dengan menggunakan
hasil tes dan penilaian untuk membimbing dan meningkatkan pengajaran.
2. Langkah-langkah dalam perencanaan tes kelas dan penilaian
Langkah-langkah yang terlibat dalam perencanaan tes kelas dan penilaian adalah sebagai
berikut:
a. Menentukan tujuan pengukuran
Langkah ini melibatkan mengidentifikasi apa yang perlu diukur dan mendefinisikannya
dengan tepat. Ini termasuk menentukan domain pencapaian dan menentukan penekanan
pada tujuan-tujuan utama.
b. Mengembangkan spesifikasi
Langkah ini melibatkan membuat set spesifikasi yang mendefinisikan dan membatasi
domain pencapaian yang akan diukur. Ini menguraikan konten kursus dan
menghubungkan tujuan pembelajaran dengan konten, menentukan sifat sampel yang
diinginkan dari item dan tugas. Tabel spesifikasi dapat digunakan untuk tujuan ini.
c. Memilih jenis item tes dan tugas penilaian yang sesuai
Berdasarkan spesifikasi, dipilih jenis item tes dan tugas penilaian yang sesuai. Ini bisa
mencakup item tes objektif (seperti pertanyaan pilihan ganda atau benar-salah) atau
tugas penilaian kinerja (seperti esai atau proyek).
54
d. Menyiapkan set item dan tugas yang relevan
Setelah jenis item dan tugas dipilih, disiapkan set item dan tugas yang relevan. Item dan
tugas ini harus sesuai dengan hasil pembelajaran yang diinginkan dan jelas, ringkas, dan
bebas dari bias atau hambatan yang tidak relevan.
Dengan mengikuti langkah-langkah ini, pendidik dapat meningkatkan kemungkinan
persiapan tes kelas dan penilaian yang valid, reliabel, dan bermanfaat.
3. Tes Objektif dan Penilaian Kinerja
Tes objektif dan penilaian kinerja adalah dua pendekatan utama dalam mengukur
pencapaian siswa, masing-masing dengan karakteristik uniknya sendiri. Tes objektif,
pertama-tama, menonjolkan tugas yang sangat terstruktur, yang membatasi opsi respons
siswa menjadi bentuk tertentu seperti penyediaan jawaban singkat, lengkap, atau pemilihan
dari beberapa alternatif yang disediakan. Jenis item tes objektif melibatkan berbagai macam
format, yaitu :
a. jawaban singkat,
b. jawaban lengkap,
c. benar-salah,
Dengan kata lain, tes objektif memberikan panduan yang jelas tentang apa yang
diharapkan dari siswa dan mengevaluasi pemahaman mereka terhadap materi pembelajaran.
Di sisi lain, penilaian kinerja memungkinkan lebih banyak kebebasan dalam respons
siswa. Dalam konteks ini, siswa memiliki kesempatan untuk menunjukkan pemahaman
mereka melalui tindakan konkret, seperti menyusun ide, menjalankan suatu tugas, atau
memberikan kinerja di atas kertas. Penilaian kinerja mendorong kreativitas dan penerapan
pengetahuan dalam situasi nyata, memungkinkan evaluasi yang lebih holistik terhadap
kemampuan siswa.
Kedua pendekatan ini memberikan manfaat dalam pengukuran pencapaian siswa. Tes
objektif sering kali dianggap efisien karena dapat dengan cepat dan mudah dinilai. Jenis item
seperti pilihan ganda atau benar-salah memungkinkan evaluasi massal dalam waktu yang
relatif singkat. Selain itu, tes objektif dapat mengukur pemahaman fakta dan konsep secara
55
luas. Namun, kelemahan tes objektif terletak pada keterbatasannya dalam mengukur
keterampilan kompleks, penerapan pengetahuan dalam konteks nyata, dan aspek kreatif
siswa.
Di sisi lain, penilaian kinerja menangkap dimensi keterampilan yang lebih mendalam.
Siswa diuji tidak hanya pada pemahaman teoritis, tetapi juga kemampuan mereka untuk
menerapkan pengetahuan tersebut dalam situasi kehidupan nyata. Kreativitas, kemampuan
pemecahan masalah, dan keterampilan praktis dapat dinilai secara lebih akurat melalui
penilaian kinerja. Namun, kelemahannya termasuk waktu dan sumber daya yang dibutuhkan
untuk evaluasi yang cermat, serta subjektivitas yang mungkin muncul dalam penilaian oleh
orang yang berbeda.
Pemilihan antara tes objektif dan penilaian kinerja harus didasarkan pada tujuan
pembelajaran yang diinginkan. Jika fokusnya pada pemahaman konsep dan fakta, tes objektif
mungkin menjadi pilihan yang efisien. Namun, jika tujuan pembelajaran mencakup
penerapan pengetahuan dalam konteks nyata, pengembangan keterampilan praktis, dan
pengukuran aspek kreatif siswa, maka penilaian kinerja menjadi lebih relevan.
Kelebihan dan keterbatasan keduanya harus dipertimbangkan dengan cermat.
Penggunaan kombinasi keduanya dalam suatu pengukuran dapat memberikan gambaran
yang lebih menyeluruh tentang pencapaian siswa. Integritas dan keberlanjutan proses
pengukuran juga harus diperhatikan, sehingga hasilnya dapat memberikan informasi yang
akurat dan bermanfaat bagi pengembangan pendidikan dan peningkatan mutu pembelajaran.
Dengan pemahaman yang mendalam tentang keunggulan dan kelemahan masing-masing
metode, pendidik dapat membuat keputusan yang terinformasi dan sesuai dengan konteks
pembelajaran mereka.
4. Persiapan Item Tes dan Tugas Penilaian
Persiapan item tes dan tugas penilaian merupakan tahapan kritis dalam proses
pengembangan instrumen evaluasi yang valid dan bermakna.
a. Menyesuaikan item dan tugas secara langsung dengan tujuan pembelajaran.
Pertama-tama, penting untuk menyesuaikan setiap item dan tugas secara langsung
dengan tujuan pembelajaran yang telah ditetapkan. Hal ini memastikan bahwa
evaluasi yang dilakukan secara efektif mencerminkan capaian yang diharapkan dari
siswa sesuai dengan kurikulum dan rencana pembelajaran.
b. Memperoleh sampel representatif dari hasil yang diinginkan.
56
Selanjutnya, untuk mendapatkan hasil yang akurat dan bermakna, perlu memperoleh
sampel representatif dari hasil yang diinginkan. Ini melibatkan pemilihan item dan
tugas yang mencakup berbagai aspek materi pembelajaran dan mencerminkan tingkat
kesulitan yang diinginkan. Sampel yang representatif memastikan bahwa hasil
evaluasi memberikan gambaran yang holistik tentang pemahaman siswa terhadap
materi pembelajaran.
c. Menghilangkan hambatan yang tidak relevan terhadap jawaban.
Selain itu, dalam proses persiapan item tes dan tugas penilaian, penting untuk
menghilangkan hambatan yang tidak relevan terhadap jawaban siswa. Hambatan ini
bisa berupa redaksi yang ambigu, pertanyaan yang terlalu rumit, atau asumsi yang
tidak jelas. Penghapusan hambatan ini memastikan bahwa siswa dapat memberikan
jawaban yang sesuai dengan pemahaman mereka tanpa terkendala oleh masalah
teknis atau linguistik.
d. Mencegah petunjuk tidak disengaja untuk respons.
Mencegah petunjuk tidak disengaja untuk respons juga menjadi perhatian utama
dalam persiapan item dan tugas penilaian. Petunjuk yang tidak disengaja dapat
memberikan keuntungan tidak adil atau memunculkan bias dalam hasil evaluasi. Oleh
karena itu, setiap item dan tugas harus diformulasikan dengan cermat untuk
meminimalkan kemungkinan interpretasi yang keliru atau memandu siswa ke arah
tertentu.
e. Fokus pada perbaikan pembelajaran dan instruksi.
Terakhir, fokus pada perbaikan pembelajaran dan instruksi menjadi prinsip terpenting
dalam persiapan item tes dan tugas penilaian. Evaluasi bukan hanya tentang
memberikan penilaian pada siswa, tetapi juga tentang memahami bagaimana
pembelajaran dapat ditingkatkan. Oleh karena itu, setiap item dan tugas harus
dirancang dengan mempertimbangkan bagaimana informasi yang diperoleh dari
evaluasi dapat memberikan wawasan untuk mengembangkan metode pembelajaran
yang lebih efektif.
Secara keseluruhan, persiapan item tes dan tugas penilaian adalah tahap yang
memerlukan ketelitian dan kebijaksanaan. Dengan menyesuaikan item dan tugas dengan
tujuan pembelajaran, memperoleh sampel representatif, menghilangkan hambatan, mencegah
57
petunjuk tidak disengaja, dan fokus pada perbaikan pembelajaran, proses evaluasi dapat
menjadi alat yang kuat untuk mendukung pengembangan kurikulum dan peningkatan
kualitas pembelajaran.
B. Pembuatan Item Tes Objektif: Bentuk Sederhana (Constructing Objective Test Items: Simple
Forms)
Setiap jenis item tes memiliki karakteristik, penggunaan, kelebihan, keterbatasan, dan
aturan konstruksi yang unik. Karakteristik ini dipertimbangkan khususnya untuk bentuk tes
objektif yang umumnya digunakan untuk mengukur hasil pembelajaran yang relatif
sederhana, yaitu: (a) item tes jawaban singkat, (b) item tes benar-salah, dan (c) latihan
pencocokan.
Perencanaan awal tes, sebagaimana dijelaskan sebelumnya, memberikan dasar yang
kokoh untuk mengembangkan tes kelas yang dapat digunakan untuk berbagai tujuan
pembelajaran. Spesifikasi tes menjelaskan sampel pencapaian yang akan diukur, dan
pertimbangan berbagai aspek dalam perencanaan tes membentuk kerangka umum untuk
melanjutkan proses. Langkah selanjutnya adalah konstruksi aktual dari item tes. Tahap ini
sangat krusial karena validitas tes kelas pada akhirnya ditentukan oleh sejauh mana kinerja
yang akan diukur benar-benar dipanggil oleh item tes. Memilih jenis item yang tidak sesuai
untuk hasil pembelajaran yang akan diukur, membuat item dengan cacat teknis, atau tanpa
sengaja menyertakan petunjuk yang tidak relevan dalam item dapat merusak semua
perencanaan yang telah dilakukan dengan cermat sebelumnya.
Konstruksi item tes yang berkualitas dianggap sebagai suatu seni. Namun,
keterampilan yang diperlukan untuk hal ini sejalan dengan keterampilan yang ditemukan
dalam pengajaran yang efektif. Dibutuhkan pemahaman mendalam tentang materi pelajaran,
konsepsi yang jelas tentang hasil pembelajaran yang diinginkan, pemahaman psikologis
tentang siswa, penilaian yang baik, ketekunan, dan sentuhan kreativitas. Satu-satunya
persyaratan tambahan untuk membuat item tes yang baik adalah penerapan terampil dari
sejumlah aturan dan saran sederhana namun penting.
Jenis Item Tes Objektif dan Karakteristiknya
a. Item Tes Jawaban Singkat (Short-answer Items)
58
Jenis ini memerlukan siswa untuk menyediakan kata, frasa, angka, atau simbol yang
sesuai dengan pertanyaan langsung atau pernyataan yang tidak lengkap. Cocok untuk
mengukur berbagai hasil pengetahuan sederhana, terutama untuk mengukur kemampuan
pemecahan masalah dalam sains dan matematika. Meskipun mudah dikonstruksi dan
relatif bebas dari tebakan, penggunaannya dibatasi oleh hasil pembelajaran yang relatif
sederhana dan rentan terhadap kesalahan ejaan.
Jenis ini memerlukan siswa untuk memilih salah satu dari dua jawaban yang mungkin.
Digunakan untuk mengukur hasil pengetahuan ketika hanya ada dua alternatif yang
mungkin atau kemampuan untuk mengidentifikasi kebenaran pernyataan fakta. Dapat
digunakan untuk mengukur kemampuan membedakan fakta dan opini serta kemampuan
mengenali hubungan sebab-akibat. Penggunaannya dibatasi oleh kesulitan konstruksi
item tanpa petunjuk, rentan terhadap tebakan, reliabilitas yang rendah, dan kurangnya
nilai diagnostik.
c. Latihan Pencocokan (Matching Exercises)
Terdiri dari dua kolom paralel frasa, kata, angka, atau simbol yang harus dipasangkan.
Digunakan untuk mengukur kemampuan mengidentifikasi hubungan antara dua hal.
Meskipun efisien untuk mengukur banyak hubungan dalam waktu singkat, memiliki
keterbatasan, termasuk kesulitan menghilangkan petunjuk yang tidak relevan dan
kesulitan menemukan materi homogen yang signifikan. Penggunaannya dapat
ditingkatkan dengan menyertakan lebih banyak item dalam satu kolom daripada yang
lain, menyusun tanggapan yang lebih pendek di sebelah kanan dan dalam urutan logis,
serta menunjukkan dengan jelas dasar pemadanan semua yang akan berkontribusi pada
efektivitas latihan pencocokan tersebut.
59
60
DAFTAR PUSTAKA
Nitko, A.J., Brookhart, S.M. 2007. Educational Assessment of Students. Upper Saddle
River, NJ:Merrill Prentice Hall
61