Anda di halaman 1dari 29

DAFTAR ISI

DAFTAR ISI...................................................................................................................... ii
BAB I PENDAHULUAN .................................................................................................. 1
BAB II PEMBAHASAN ................................................................................................... 2
A. Karakteristik Tujuan Pembelajaran ........................................................................ 2
B. Menyusun Tujuan Pembelajaran ............................................................................ 9
C. Mengembangkan Tabel Spesifikasi ..................................................................... 10
D. Menerapkan Tabel Spesifikasi dan Mengembangkan Penilaian ........................... 12
E. Mengembangkan Tes Kelas .................................................................................. 13
F. Mempersiapkan Siswa dan Mengatur Penilaian .................................................... 22
BAB III PENUTUP ........................................................................................................... 27
DAFTAR PUSTAKA .......................................................................................................28

ii
BAB I

PENDAHULUAN

Penentuan tujuan pembelajaran yang tepat merupakan hal utama yang perlu
dipersiapkan guru dalam melaksanakan kegiatan pembelajaran, tujuan pembelajaran secara
sederhana dapat diartikan sebagai hal-hal yang diharapkan guru terhadap siswanya. Tentunya
tujuan yang diharapkan dari setiap capaian pembelajaran berbeda-beda, sehingga tujuan
pembelajaran ini perlu dipersiapkan guna menjadi bahan acuan bagi guru untuk melakukan
proses penilaian kepada siswanya.
Selain bertugas untuk mengajar, guru juga harus mempunyai kemampuan dalam
melaksanakan dan melakukan penskoran, serta mendeskripsikan hasil penilaian yang didapat
selama proses pembelajaran. Agar dapat memilih serta mengembangkan prosedur penilaian
yang tepat, guru harus mampu menafsirkan dan menggunakan alat penilaian yang tepat pula.
Guru harus dapat mendeskripsikan dengan tepat untuk semua aktivitas penilaian seperti tes
tulis, baik penilaian sikap dan keterampilan dari siswanya. Guru perlu meiliki kemampuan
menginterpretasikan skor pada prosedur penilaian terstamdar. Dalam hal menginterpretasikan
skor, guru dituntut untuk dapat memiliki pengetahuan dasar mengenai statistik, seperti ukuran
pusat kecendrungan, penyebaran, korelasi, konsep-konsep reliabilitas, validitas dan
pengukuran. Dan suatu hal yang lebih penting bahwa item yang digunakan dalam sebuah
penilaian merupakam hal yang perlu menjadi perhatian, karena penggunaan item yang baik
akan menafsirkan penilaian yang baik pula.
Dengan melakukan tes atau ujian, guru dapat memahami berbagai kemampuan
kognitif, afekti serta psikomotr dari setiap anak didiknya. Tentunya banyak persiapan dan
banyak hal terkait informasi yang perlu didapatkan oleh guru guna tercapainya tujuan dalam
pembelajaran.

1
BAB II

PEMBAHASAN

A. Karakteristik Tujuan Pembelajaran


Tujuan pembelajaran secara sederhana dapat dijelaskan sebagai apa yang diharapkan
guru dapat dikuasai oleh para siswanya. Dalam setiap mata pelajaran dapat mengandung satu
atau bahkan lebih tujuan pembelajaran. Penilaian tes yang baik berasal dari tujuan
pembelajaran yang jelas sehingga perlu bagi guru untuk menentukan tujuan pembelajaran
dengan spesifik untuk mempermudah dalam menyusun penilaian.
Tes yang baik adalah yang dapat mengukur apa yang benar telah dipelajari siswa di
kelas. Dengan kata lain, tes yang dilakukan oleh guru seharusnya mampu merefleksikan apa
yang telah diajarkan oleh guru di kelas dan atau menekankan apa yang ditekankan dalam
pembelajaran di kelas. Oleh karena itu penyusun tes sangat erkaitan dengan isi kurikulum
dan tujuan pembelajaran. Tujuan pembelajaran memiliki beberapa karakteristik, diantaranya
yaitu ruang lingkup, bidang atau aspek yang dinilai, dan format penilaian. Ketiga aspek
tersebut saling berkaitan dalam menyusun item tes.
1. Ruang Lingkup (Scope)
Ruang lingkup (scope) menunjukkan apakah tujuan pembelajaran yang dimiliki masih
luas atau sudah spesifik. Tujuan pembelajaran yang terlalu luas dapat menyebabkan bias
dalam menyusun item tes. Namun apabila guru hanya menggunakan tujuan pembelajaran
yang terlalu spesifik maka item dalam tes akan nampak terpisah-pisah dan hanya menuntut
pengetahuan dasar atau kemampuan brpikir tingkat rendah. Misalnya pada contoh tujuan
pembelajaran berikut.
 Siswa mampu menganalisa dan mendiskusikan pengaruh dari penjajahan di
Indonesia.
 Siswa mampu menyebutkan negara-negara yang pernah menjajah Indonesia.
Contoh pertama merupakan tujuan pembelajaran yang masih umum sedangkan contoh
kedua adalah tujuan pembelajaran yang lebih khusus. Dari contoh di atas dapat kita lihat
bahawa tujuan pembelajaran yang terlalu umum mungkin dapat menyulitkan guru dalam
menyusun penilaian di kelas namun tujuan pembelajaran yang khusus pun juga tidak selalu
baik dan efektif. Oleh karena itu dalam praktiknya sebaiknya guru menggabungkan antara
pendektan dengan tujuan pembelajaran yang luas dan spesifik atau bisa dengan menjabarkan

2
tujuan pembelajaran yang luas menjadi lebih spesifik namun jangan sampai terlalu spesifik
untuk menghindari hanya mengukur kemampuan berpikir tingkat rendah.
2. Domain/Aspek
Taksonomi dalam Tujuan Pembelajaran
Selain mengacu pada kedalaman dari tujuan pembelajaran, ruang lingkup tujuan
pembelajaran juga meliputi jenis atau kemampuan apa yang akan diukur. Kemampuan
tersebut yaitu kognitif, afektif, dan psikomotor. Ketiga aspek tersebut biasanya ditunjukkan
dalam berbagai tingkatan atau level yang berbeda-beda.
a. Domain Kognitif
Kedua contoh tujuan pembelajaran sebelumnya merupakan contoh tujuan pembelajaran
dalam aspek kognitif.
 Siswa mampu menganalisa dan mendiskusikan pengaruh perang dunia pada abad ke-
20 teradap politik di Amerika.
 Siswa mampu menyebutkan negara-negara yang memisahkan diri dari serikat
selama perang dunia..
Dari kedua contoh di atas nampak perbedaan ruang lingkup yang menonjol yaitu pada
contoh pertama, tujuan pembelajaran masih sangat luas dan dapat menjadi dasar suatu bab
pembahasan. Sedangkan pada cotnoh kedua lebih spesifik. Selain itu perbedaan tingkat
kognitif yang diukur juga membedakan ruang lingkup tujuan pembelajaran. Seperti contoh di
atas, pada tujuan pembelajaran pertama mengukur tingkat kognitif yang lebih tinggi karena
menuntut siswa untuk “menganalisa dan berdiskusi”, sedangkan pada tujuan pembelajaran
yang kedua hanya “mendaftar/menyebutkan”. Siswa yang mampu mencapai tujuan
pembelajara kedua belum tentu mampu mencapai tujuan pembelajaran yang pertama karena
analisis dan diskusi menuntut tingkat kognitif yang lebih tinggi dari pada hafalan. Berikut
taksonomi Bloom yang digunakan sebagai dasar dalam mengkategorikan tingkat kognitif
dalam tujuan pembelajaran.
1) Pengetahuan (Knowledge)
Tingkat paling sederhana dari taksonomi kognitif adalah pengetahuan. Tujuan
pembelajaran pada tingkat pengetahuan meliputi belajar dan mengingat fakta-fakta, istilah,
kata, tanggal, dan sebagainya. Contoh: Siswa mampu menyebutkan nama-nama pulau di
Indonesia.
2) Pemahaman (Comprehension)

3
Tujuan pembelajaran pada tingkat pemahaman menuntut siswa untuk “memahami”
bukan hanya “menghafal”. Kata kerja yang biasa digunakan pada tingkat ini yaitu
menafsirkan, menerjemahkan, menjelaskan, dan merangkum. Contoh: Siswa mampu
menjelaskan makna simbol-simbol pada peta.
3) Penerapan (Application)
Tujuan pembelajaran pada tingkat penerapan melibatkan penggunaan aturan umum,
prinsip, atau konsep abstrak untuk menyelesaikan masalah yang sebelumnya tidak
ditemui. Contoh: siswa mampu menggunakan perkalian dan pembagian dua digit pada
soal matematika terapan.
4) Analisa (Analysis)
Tujuan pembelajaran pada tingkat analisa menuntut siswa untuk mengurangi atau
memecah konsep yang kompleks menjadi bagian-bagian dasar atau elemen dengan cara
menggambarkan hubungan antarbagian dan menjadi keseluruhan. Contoh: siswa akan
menggambarkan peta-peta dalam hal fungsi dan bentuk.
5) Sintese (Synthesis)
Tujuan pada tingkat sintesis menuntut siswa untuk mampu mengabungkan
bagian/elemen yang ada dengan cara sedemikian rupa sehingga membentuk pola atau
struktur baru. Contoh: siswa akan membuat peta negara hipotetis dengan karakteristik
yang diberikan.
6) Penilaian (Evaluation)
Tujuan pembelajaran pada tingkat evaluasi menuntut siswa untuk membuat penilaian
evaluatif berdasarkan kualitas, nilai, atau sesuatu yang bernilai untuk tujuan lain. Contoh:
siswa akan mengevaluasi kegunaan peta dalam mebantunya melakukan perjalan dari satu
tempat ke tempat lain.
Taksonomi Bloom sangat membantu karena menyediakan kerangka yang
mengingatkan guru untuk memasukkan item yang mencerminkan tujuan pembelajaran yang
lebih kompleks ke dalam tes atau soal. Guru biasanya lebih banyak membuat soal yang
terbatas hanya sampai pada kognitif tingkat 2, atau pada kemampuan hafalan sehingga tujuan
pembelajaran tingkat tinggi masih perlu ditingkatkan.
Meskipun begitu bukan berarti kemampuan kognitif tingkat rendah tidak penting atau
diabaikan. Di masing-masing tujuan pembelajaran guru harus menentukan sampai pada level
manakah yang harus ditunjukkan siswa. Pada pengantar singkat topik mungkin cukup hanya
mengharapkan pengetahuan dan pemahaman konsep utama. Namun semakin detail
pembahasan topik maka akan menuntut level penguasaan yang semakin tinggi pula.
4
Walaupun sering tidak mungkin dapat menguasai tujuan pembelajaran tingkat tinggi sebelum
menguasai tujuan-tujuan tingkat rendah. Meskipun dalam buku ini berusaha mendorong
pengembangan tujuan-tujuan pembelajaran tingkat tinggi, namun tidak realistis untuk
menuntut penguasaan tingkat tinggi di semua aspek. Pendidikan merupakan proses pragmatis
dalam memilih apa yang paling penting untuk ditekankan dalam waktu pengajaran yang
terbatas. Budaya kita membantu membuat beberapa pilihan ini, seperti halnya badan
legislatif, dewan sekolah, administrator, kadang-kadang orang tua dan siswa. Di beberapa
distrik sekolah, tujuan pembelajaran kognitif disediakan dengan sangat detail, sedangkan di
beberapa sekolah lainnya praktis tidak ada. Seperti yang dijelaskan sebelumnya, bahwa tren
saat ini adalah untuk anggota parlemen federal dan negara bagian untuk lebih banyak
mengontrol atas konten kurikulum.
b. Domain Afektif
Kebanyakan orang berpikir tujuan kognitif ketika berpikir mengnai pengalaman
pendidikan siswa. Meskipun begitu, muncul dua domain lainnya dalam kurikulum sekolah
yaitu tujuan afektif dan psikomotor. Domain afektif melibatkan karakteristik seperti nilai,
sikap, minat, dan tindakan perilaku. Hasilnya, tujuan afektif melibatkan sikap dan tindakan
siswa dalam hubungannya pada matapelajaran di sekolah, seperti yang ditunjukkan dalam
contoh:
“Siswa akan menunjukkan minat pada sains bumi dengan memimpin pameran sains di
beberapa bidang proyek sains.”
Sebagai aturan umum, tujuan afektif lebih ditekankan pada kurikulum tingkat sekolah
dasar daripada tingkat sekolah menengah. Taksonomi tujuan afektif dikembangkan oleh
Krath-wohl, Bloom, dan Masia (dalam Reynold, , Livingston, dan Willson, 2009:175).
Taksonomi tersebut melibatkan tingkatan peningkatan pengalaman duniawi, dengan setiap
tingkat dibangun atas tingkat sebelumnya. Hal tersebut menggambarkan sebuah proses
dimana ide, nilai, dan keyakinan diterima secara bertahap diterima dan terinternalisasi
menjadi milik diri. Berikut tabel taksonomi tujuan afektif Krathwohl.
Level Deskripsi Sublevel
Menerima (Receive/ Seacara sadar mau Kesadaran, kemauan
attending) mengikuti sesuatu
Merespon (responding) Berpartisipasi secara Persetujuan, kemauan,
aktif dalam suatu kepuasan
kegiatan atau proses

5
Penghargaan (valuing) Memberikan penilaian Penerimaan, pilihan, dan
atau penghargaan komitmen
terhadap suatu kegatan
atau ide
Penyusunan Ide dan nilai telah Konsep dan hierarki
(organization) terinernalisasi dan
terorganisir dalam diri
seseorang menganai nilai
yang diyakini
(Characterization by a nilai individu Himpunan umum dan
value or value complex) dicontohkan dalam contoh-contoh
seperangkat karakteristik karakterisasi
perilaku dan tindakan
Taksonomi tujuan afektif milik karthwhol tidak pernah sepopuler taksonomi milik
Bloom karena domain afektif lebih sulit didefinisikan dan merupakan bidang pendidikan
yang lebih kontroversial dibandingkan kognitif. Di sekolah tujuan afektif hampir selalu
ditambahkan dalam tujuan kognitif. Sebagai contoh, kita ingin para siswa untuk mempelajari
sains dan hasilnya mereka akan menghargai atau menikmatinya. Tes kelas uatamanya fokus
pada tujuan-tujuan kognitif, namun tujuan-tujuan afektif ditemukan di kurikulum sekolah,
baik secara eksplisit maupun implisit. Karena tujuan afektif muncul dalam kurikulum sekolah
maka perincian dari tujuan afektif dapat meningkatkan peluang bagi tujuan tersebut untuk
dicapai.
c. Domain Psikomotor
Tingkatan ketiga dalam tujuan pembelajaran berhubungan dnegan aktivitas fisik dan
dimaksudkan sebagai tujuan psikomotor. Tujuan perilaku (behavioral objective) khususnya
ada dalam pendidikan jasmani, menari, pidato, teater, kegiatan laboratorium, atau kelas
teknis/kejuruan seperti elektronos, otomotif, dan lain sebagainya. Contohnya, pada
pendidikan jasmani begitu banyak kegiatan psikomotor sperti menggulirkan bola bowling
dengan benar atau memukul bola tenis dengan benar. Kelas biologi juga memiliki aktivitas
psikomotor seperti mengamati melalui mikroskop dan membedah. Ilmu komputer juga
memerlukan keterampilan seperti menggunakan keyboard. Taksonomi tujuan psikomotor
dikembangkan oleh Harrow. Berikut taksonomi psikomot oleh Harrow.
Level Description Sublevel

6
Gerakan reflex Tindakan yang tidak refleks segmental,
disenagja intersegmental, dan
suprasegmental
Gerakan fundamental pola gerakan inheren lokomotor, non
dasar adalah kombinasi dari lokomotor, dan gerakan
gerakan refleks dan manipulatif
berfungsi sebagai dasar
untuk gerakan yang
lebih kompleks
Kemampuan persepsi melibatkan interpretasi diskriminasi kinestetik,
input sensorik yang pada visual, pendengaran, dan
gilirannya memandu sentuhan, kemampuan
gerakan terkoordinasi
Kemampuan fisik karakteristik fisik daya tahan, kekuatan,
fungsional yang fleksibilitas, dan
berfungsi sebagai dasar ketangkasan
untuk gerakan terampil

Gerakan Terampil gerakan kompleks yang keterampilan adaptif


merupakan hasil yang sederhana,
pembelajaran dan majemuk, dan kompleks
didasarkan pada pola
gerakan yang melekat
(lihat level 2)
komunikasi non Komunikasi nonverbal Gerakan ekspresif dan
diskursif mulai dari ekspresi interpretatif
wajah hingga tarian
ekspresif

Tujuan psikomotor biasanya berkaitan dengan tujuan kognitif karena aktibitas fisik
membutuhkan proses kognitif. Hasilnya, seperti tujuan afektif, tujuan psikotor biasanya
ditambahkan pada tujuan kognitif. Namun kedua aspek tersebut muncul dalam kurikulum
sekolah dan perinciannya dapat menambah pengajaran dan penilaian.

7
3. Format
Tujuan Pembelajaran Perilaku Dan Non-Perilaku
Tujuan pendidikan sering diklasifikasikan menjadi perilaku dan bukan perilaku.
Contohnya:
Perilaku: para siswa akan dapat membuat daftar alasan yang dikutip dalam panduan
kurikulum masuknya Amerika Serikat ke dalam perang dunia I dengan akurasi 80%.
Bukan perilaku: siswa akan dapat menganalisis alasan masuknya Amerika Serikat ke
dalam perang dunia I.
Perbedaan pada dua tujuan di atas yaitu pada aktivitas yang diminta. Pada tujuan-tujuan
perilaku merinci aktivitas-aktivitas yang tampak dan dapat diukur secara langsung.
Sedangkan tujuan pembelajaran yang bukan perilaku merinci aktivitas-aktivitas yang tidak
tampak dan tidak dapat diukur secara langsung. Jika pada tujuan perilaku guru dapat
langsung melakukan penilaian, dalam tujuan yang bukan perilaku guru harus melakukan
dugaan dan kesimpulan. Tujuan yang berupa perilaku meliputi menyusun, membangun,
membuat, mendefinisikan, mengembangkan, mengidentifikasi, mendaftar, membaca,
menghubungkan. Sedangkan tujuan bukan perilaku meliputi menganalisis, memeriksa,
menilai, mengetahui, dan mengerti. Meskipun mungkin untuk menuliskan tujuan perilaku dan
tujuan bukan perilaku pada semua level taksonomi kognitif, namun guru biasanya merasa
lebih mudah untuk menuliskan tujuan perilaku pada level kognitif yang rendah (pengetahua,
pemahaman, dan penerapan) dan menuliskan tujuan bukan perilaku pada level yang kognitif
yang lebih tinggi (analisis, sistesis, dan evaluasi).
Pada tujuan perilaku juga umumnya menetapkan kriteria hasil. Misalnya pada contoh di
atas, kriteria hasilnya yaitu, “ alasan yang dikutip dalam panduan kurikulum...........dengan
akurasi 80%.” Tujuan perilaku biasanya menetapkan kriteria hasil berupa persentase yang
menunjukkan tingkat penguasaan. Misalnya:
Para siswa akan mampu menggambar diagram 80% kalimat yang disajikan dari daftar
standar dengan benar.
Meskipun tujuan perilaku sering menetapkan kriteria hasil namun tetap sulit untuk
menentukan kriteria penguasaan siswa. Apakah 80% akurat menunjukkan tingkat penguasaan
siswa, ataukah harus 90% atau bahkan 100%. Kadang-kadang sifat materi dan hasil yang
tidak mencapai penguasaan 100% akan menentukan kriteria. Contohnya, sebagian besar
siswa yang menunjukkan penguasaan 80% pada tes yang mengukur pengetahuan tentang
penggunaan aman alat-alat listrik di kelas seni industri mungkin bebas kecelakaan, namun
tingkat kecelakaan 5% mungkin benar-benar tidak dapat ditoleransi. Dalam situasi ini kriteria
8
penguasaan mungkin perlu ditingkatkan hingga 100% untuk mencapai tingkat kecelakaan
yang bisa diterima (<1%). Ketika melatih pilot untuk menerbangkan jet tempur, angkatan
udara mungkin juga membutuhkan penguasaan 100% dari semua tujuan penerbangan darat
karena satu kesalahan mungkin dpat menyebabkan kematian dan kehilangan peralatan mahal.
Kegunaan tujuan perilaku siterima luas pada tahun 1960 dan 1970 karena membantu
gur dalam menentukan tujuan pembelajaran. Namun kekurangannya apabila dilakukan secara
berlebihan maka tujuan pembelajaran akan terlalu sempit menyulistkan kegiatan pengajaran
dan penilaian. Tujuan pendidikan yang ideal adalah yang cukup luas sehingga membantu
guru menyusun pengajaran dan penilaian namun juga cukup rinci sehingga kegiatan dapat
dinilai.

B. Menyusun Tujuan pembelajaran


Di atas telah didefinisikan tujuan-tujuan pembelajaran dan beberapa karakteristiknya.
Selanjutnya berikut dijabarkan beberapa saran umum dalam menyusun tujuan pendidikan
yang bermanfaat.
1. Susunlah tujuan pembelajaran yang mencakup spektrum atau gambaran kemampuan
yang luas. Seperti yang telah disampaikan sebelumnya, diharapkan tujuan pendidikan
mencakup tingkat kemampuan yang luas, lebih dari hafalan.
2. Jika memungkinkan, identifikasi perilaku yang dapat diamati dan diukur secara
langsung. Idealnya tujuan pendidikan harus menentukan perilaku yang bisa diamati dan
dinilai. Sehingga lebih baik menuntut kemampuan siswa untuk menyusun, mebuat,
membangun, mengembangkan, mengidentidfikasi, mendaftar, dan menceritakan
dibandingkan meminta siswa untuk menganalisis, memeriksa, menilai, mengetahui, dan
memahami tidak mudah untuk dinilai. Namun kadang perlu untuk menentukan perilaku
yang tidak dapat diukur secara langsung untuk memperoleh kemampuan kognitif yang
lebih tinggi.
3. Menegaskan kondisi khusus. Apabila aktivitas yang diharapkan harus diperagakan
dengan persyaratan tertentu maka persyaratan-persyaratan tersebut harus disampaikan
secara jelas. Contohnya sebagai berikut:
Berikan peta Amerika Serikat, siswa mampu megenali masing-masing negara dan
ibu kotanya.
Dalam contoh di atas, peta Amerika merupakan materi yang dubutuhkan untuk mencapai
tujuan pembelajaran. Kubiszyn dan Borich (dalam Reynold, Livingston, dan Willson,

9
2009:178) mendaftar waktu, latar, alat, sumber sebagai persyaratan yang harus
dimasukkan dalam tujuan pembelajaran ketika berhubungan dengan tujuan tersebut.
4. Bila perlu, tentukan kriteria hasil. Seperti yang kita bahas sebelumnya, itu benar
terkadang bermanfaat untuk menentukan kriteria hasil, yaitu tingkat kinerja dipandang
sebagai indikasi bahwa siswa telah mencapai tujuan. Ini yang paling berlaku saat
menggunakan tujuan perilaku. Pengembangan tujuan pendidikan bukanlah bidang di
mana ada lakukan perjanjian antara para ahli pengujian. Meskipun setiap ahli
pengembangan tes kami tahu dari percaya tujuan pendidikan perlu ditentukan, penulis
yang berbeda sedikit mendukung pendekatan yang berbeda. Beberapa
merekomendasikan menulis tujuan bebas konten sedangkan yang lain
merekomendasikan tujuan yang berpusat pada konten. Beberapa penulis
merekomendasikan penggunaan perilaku tujuan sedangkan yang lain melihat pendekatan
ini terlalu membatasi. Pedoman kami sederhana saran yang dapat Anda gunakan secara
fleksibel untuk memenuhi kebutuhan spesifik Anda. Kami percaya itu Sangat penting
bagi guru untuk mengembangkan dan menentukan tujuan pendidikan, tetapi tepat format
yang mereka adopsi kurang penting. Dalam Tabel 7.4 kami menyatakan kembali tujuan
pembelajaran yang disediakan dalam Bab 2 teks ini. Kami melakukan ini karena kami
akan menggunakan bab ini dan yang terkait tujuan di bagian selanjutnya untuk
menunjukkan pengembangan tabel spesifikasi untuk ujian.

C. Mengembangkan Tabel Spesifikasi (Blue Print)


Anda mungkin bertanya mengapa kami menghabiskan banyak waktu untuk membahas
tujuan pendidikan. Alasannya adalah bahwa pengembangan tes kelas harus terkait erat
dengan kurikulum kelas dan tujuan pendidikan. Seperti yang kami catat sebelumnya, tes kelas
harus mengukur apa yang diajarkan. Tes kelas harus menekankan apa yang ditekankan di
kelas. Metode untuk memastikan kesesuaian antara instruksi kelas dan konten tes adalah
pengembangan dan penerapan tabel spesifikasi, juga disebut sebagai cetak biru tes. Contoh
diberikan pada Tabel 7.5 untuk Bab 2 teks ini.
TABEL 7.5

10
Kolom di sebelah kiri, berlabel Area Konten, mencantumkan area konten utama yang
akan dicakup dalam pengujian. Area konten ini diturunkan dengan meninjau tujuan
pendidikan dengan cermat dan memilih area konten utama untuk dimasukkan dalam tes. Di
bagian atas tabel kita mencantumkan tingkat taksonomi kognitif Bloom. Dimasukkannya
bagian ini mendorong kita untuk mempertimbangkan kompleksitas proses kognitif yang ingin
kita ukur. Seperti disebutkan sebelumnya, ada kecenderungan bagi guru untuk sangat
bergantung pada proses tingkat yang lebih rendah (mis., Menghafal memori) dan kurang
menekankan proses kognitif tingkat tinggi. Dengan memasukkan kategori-kategori ini dalam
tabel spesifikasi kami, kami diingatkan untuk memasukkan serangkaian proses kognitif yang
lebih luas ke dalam tes saat ini.
Angka-angka di badan tabel mencerminkan jumlah item yang akan dikhususkan untuk
menilai setiap area konten pada setiap tingkat taksonomi kognitif. Tabel 7.5 menggambarkan
spesifikasi untuk tes 30-item. Jika Anda memeriksa area konten pertama pada Tabel 7.5
(mis., Skala pengukuran) Anda melihat dua item tingkat pengetahuan, dua item tingkat
pemahaman, dan dua item tingkat analisis yang dikhususkan untuk menilai area konten ini.
Area konten berikutnya (yaitu, ukuran kecenderungan sentral) akan dinilai oleh tiga item
tingkat pengetahuan dan tiga item tingkat pemahaman. Jumlah item yang didedikasikan untuk
menilai setiap tujuan harus mencerminkan pentingnya tujuan dalam kurikulum dan berapa
banyak waktu pengajaran yang dicurahkan untuk itu. Dalam tabel spesifikasi kami, kami
menentukan jumlah item yang didedikasikan untuk setiap area / tujuan konten dengan
memeriksa berapa banyak materi dikhususkan untuk setiap topik dalam teks dan berapa
banyak waktu yang biasanya kita habiskan untuk setiap topik dalam kuliah kelas. Beberapa
pakar pengujian merekomendasikan untuk menggunakan persentase alih-alih jumlah item
saat mengembangkan tabel spesifikasi. Pendekatan ini diilustrasikan dalam Tabel 7.6.
Sebagai contoh, Anda mungkin menentukan bahwa sekitar 20% dari instruksi Anda
melibatkan skala pengukuran yang berbeda. Anda ingin mencerminkan bobot ini dalam

11
pengujian Anda sehingga Anda mencurahkan 20% dari pengujian untuk area konten ini. Jika
Anda mengembangkan tes 30-item ini berarti Anda akan menulis enam item untuk menilai
tujuan yang terkait dengan skala pengukuran (0,20 x 30 = 6). Jika Anda mengembangkan tes
40 item, ini berarti Anda akan menulis delapan item untuk menilai tujuan terkait dengan skala
pengukuran (0,20x40 = 8). Kelemahan menggunakan persentase daripada jumlah item adalah
Anda tidak harus menentukan terlebih dahulu berapa banyak item yang akan Anda miliki
dalam tes. Namun demikian, keputusan untuk menggunakan persentase atau jumlah item
mungkin lebih baik diserahkan kepada masing-masing guru karena pendekatan mana pun
dapat menghasilkan tabel spesifikasi yang bermanfaat.
TABEL 7.6

Setiap tes yang dikonstruksi oleh guru harus didasarkan pada tabel spesifikasi.
Mungkin relatif tidak formal ketika menyusun kuis singkat, atau sama berkembangnya seperti
pada Tabel 7.5 saat menyusun ujian besar. Tabel spesifikasi membantu guru meninjau konten
kurikulum dan meminimalkan kemungkinan mengabaikan konsep atau tambahan penting
konsep yang tidak relevan. Tabel spesifikasi juga mendorong guru untuk menggunakan
item dengan kompleksitas yang berbeda-beda. Untuk siswa, tabel tersebut dapat berfungsi
sebagai dasar untuk belajar dan mengulas. Akan ada beberapa siswa atau orangtua yang
melakukan pengujian "tidak adil" jika siswa mengetahui elemen-elemen dari tabel spesifikasi
sebelum ujian. Meskipun kami telah berkonsentrasi pada tes pencapaian dan tujuan kognitif
di bagian ini, daftar spesifikasi dapat dikembangkan untuk tugas afektif dan psikomotor
dengan cara yang sama, menggantikan taksonomi digunakan dalam domain tersebut untuk
taksonomi kognitif.

D. Menerapkan Tabel Spesifikasi dan Mengembangkan Penilaian

12
Sejauh ini dalam bab ini kami telah berfokus pada apa yang kami ingin siswa pelajari
dan konten apa yang ingin kami sampaikan dalam ujian kami. Ini telah melibatkan diskusi
tentang pengembangan objek pendidikan dari tabel spesifikasi atau cetak biru tes. Namun,
sebelum kita benar-benar mulai menulis ujian, kita masih memiliki beberapa keputusan
penting yang harus diambil. Satu keputusan penting melibatkan bagaimana
menginterpretasikan skor tes (eferensi norma dan referensi kriteria, pendekatan untuk
interpretasi skor diperkenalkan pada Bab 3). Keputusan penting lainnya melibatkan
pemilihan jenis barang yang akan dimasukkan dalam penilaian. Kami sekarang akan sebentar
meninjau informasi tentang penilaian yang direferensikan norma dan kriteria yang
direferensikan dan membingkainya dalam hal pengembangan tes kelas.
Norma yang Direferensikan versus Interpretasi Skor Referensi yang Dirujuk
Ingat diskusi sebelumnya tentang interpretasi skor yang direferensikan dengan norma
dan kriteria. Dalam ulasan, dengan penilaian yang direferensikan norma, kinerja siswa
ditafsirkan dalam kaitannya dengan kinerja siswa lain. Penafsiran yang direferensikan normal
adalah relatif karena melibatkan kinerja siswa relatif terhadap siswa lain. Peringkat persentil
dan skor standar adalah skor referensi-normal yang digunakan di sekolah saat ini. Sebaliknya,
interpretasi yang mengacu pada kriteria membandingkan kinerja siswa ke standar atau
kriteria absolut, bukan untuk kinerja siswa lain. Penafsiran yang direferensikan kriteria
adalah mutlak karena merefleksikan tingkat dimana siswa telah menguasai konten atau
domain yang diwakili oleh tes. Skor yang direferensikan kriteria termasuk persen yang benar
dan skor penguasaan / nonmasteri. Jika hasilnya menunjukkan bahwa siswa mendapat nilai
pada persentil ke-80, yang berarti dia mendapat nilai lebih baik dari 80% siswa dalam
kelompok norma, interpretasinya mengacu pada norma. Jika hasil menunjukkan bahwa siswa
menjawab dengan benar 80% dari item tes, interpretasi adalah referensi-kriteria.

E. Mengembangkan Tes Kelas di Lingkungan Pengujian di Seluruh Negara Bagian


Dengan fokus nasional saat ini pada pengujian dan penguasaan konten, penting bagi
guru untuk menyadari dan memantau konten dan pengujian instruksional mereka terkait
dengan konten dan standar kinerja yang dinyatakan negara mereka. Semua negara bagian
A.S. telah mengembangkan ini sebagai panduan untuk sekolah, dan untuk sebagian besar
negara bagian ini menjadi dasar untuk penilaian di seluruh negara bagian di berbagai
tingkatan kelas. Meskipun kami tidak menganjurkan kepatuhan sempit terhadap daftar
tersebut, baik pejabat terpilih dan publik mengharapkan anak-anak untuk menguasai konten
berdasarkan standar yang dikembangkan melalui proses legislatif negara.
13
Di banyak sekolah, komite tingkat sekolah atau bahkan komite tingkat kabupaten
memusatkan perhatian pada konten di tingkat kelas, seringkali mengembangkan jadwal untuk
urutan tenda pengajaran untuk tahun ajaran. Ini sangat direkomendasikan, terutama ketika
mobilitas di antara siswa tinggi. Siswa yang pindah satu atau lebih kali melintasi sekolah
selama tahun ajaran berada pada risiko yang jauh lebih tinggi untuk tertinggal, dan daerah
yang mengatur jadwal mereka dengan baik di seluruh sekolah memberikan dukungan yang
lebih baik bagi siswa tersebut. Di banyak negara industri, siswa dapat pindah ke mana saja di
negara mereka dan berharap berada pada halaman yang sama dari teks mereka di sekolah
mana pun. Ketika instruksi seorang guru secara wajar terkait dengan konten harapan negara
tes tes yang dikembangkan guru dapat memberikan dasar yang sangat baik untuk
keberhasilan siswa pada tes seluruh negara. Tes negara sebelumnya biasanya tersedia bagi
guru untuk dilihat, dan tes kebijaksanaan, memberikan siswa pengalaman dengan proses
pengujian yang mirip dengan tes di seluruh negara bagian, telah terbukti meningkatkan
kinerja siswa. Dengan demikian, guru dapat mengembangkan pertanyaan tes yang mirip
dengan yang ada di tes di seluruh negara bagian dalam format. Tentu saja, tidak ada alasan
untuk membatasi tes guru untuk format ini.
1. Memilih Jenis item Yang Akan Digunakan
Keputusan penting lainnya melibatkan jenis barang atau tugas yang akan dimasukkan
dalam pengujian Anda. Penulis yang berbeda menggunakan sistem atau skema klasifikasi
yang berbeda saat mengkategorikan item tes. Secara historis pendekatan populer adalah untuk
mengklasifikasikan tes iems sebagai "obyektif" atau "subyektif." Perbedaan ini biasanya
merujuk pada bagaimana item dinilai (yaitu, baik secara obyektif atau subyektif). Misalnya,
tidak boleh ada perbedaan pendapat antara individu-individu yang berbeda yang menilai item
pilihan ganda. Item harus dengan mudah dinilai "benar" atau "salah" sesuai dengan kriteria
penilaian. Hal yang sama berlaku untuk item benar-salah dan cocok. Mereka semua dapat
diberi skor secara obyektif dan diklasifikasikan sebagai obyektif: Semua orang setuju pada
jawaban mana yang dikunci sebagai benar dan salah. Tidak konsisten, item esai dianggap
subyektif karena menilai mereka melibatkan penilaian subyektif pada bagian dari individu
yang menilai tes. Tidak terlalu mengejutkan bahwa dua siswa kelas mungkin memberikan
nilai yang berbeda untuk item esai yang sama. Contoh lain dapat berupa respons siswa
terhadap ujian lisan. Di sini juga mungkin ada subjektivitas yang cukup besar dalam penilaian
dan dua individu mungkin menilai tanggapan berbeda. Akibatnya, esai dan item tes lainnya
yang melibatkan lebih banyak penilaian subyektif diklasifikasikan sebagai subyektif.

14
Meskipun perbedaan obyektif-subyektif umumnya bermanfaat, ada beberapa
ambiguitas. Misalnya, apakah item jawaban pendek objektif atau subyektif? Banyak penulis
menyebutnya sebagai item objektif, tetapi seperti yang akan Anda lihat di bab selanjutnya,
mencetak item jawaban pendek sering melibatkan subjektivitas yang cukup besar.
Pendekatan yang lebih langsung adalah untuk mengklasifikasikan item sebagai item yang
dipilih-respons atau dibangun-respons. Dengan pendekatan ini, jika suatu item kembali
Meminta seorang siswa untuk memilih jawaban dari alternatif yang tersedia itu
diklasifikasikan sebagai item tanggapan-dipilih. Item pilihan ganda, benar-salah, dan item
yang cocok adalah semua item respons terpilih. Jika suatu item mengharuskan siswa untuk
membuat atau membangun respons, itu diklasifikasikan sebagai item yang dibangun-respons.
Item respons dibangun termasuk isi item yang kosong, jawaban pendek, dan esai. Dalam arti
yang lebih luas, penilaian respons yang dibangun juga mencakup penilaian kinerja dan
portofolio. Klasifikasi respons-respons-terstruktur-terpilih yang dipilih adalah yang akan
kami gunakan dalam buku teks ini. dalam bab-bab selanjutnya kita akan mempelajari lebih
rinci dalam pengembangan berbagai jenis barang. Untuk sekarang, kita hanya akan
memberikan gambaran singkat tentang beberapa karakteristik utama dari respons-terpilih dan
hal-hal yang dibangun-respons
Seperti yang kami tunjukkan, pada item respons terpilih siswa memilih respons yang
sesuai dari opsi yang disediakan. Pada item benar-salah, siswa hanya memilih benar atau
salah untuk menjawab item. Pada item pilihan ganda, siswa memilih respons terbaik dari
daftar alternatif. Pada item yang cocok siswa mencocokkan tempat (biasanya tercantum di
sebelah kiri) dengan tanggapan yang sesuai (biasanya terdaftar di sebelah kanan). Faktor
kuncinya adalah itu saja item respon terpilih memberikan jawabannya; siswa hanya memilih
yang sesuai.
Meskipun ada banyak perbedaan di antara format-format item respons-terpilih ini, kita
dapat membuat beberapa pernyataan umum tentang kekuatan dan keterbatasannya (lihat
Tabel 7.7), Kelebihannya meliputi:
 Siswa pada umumnya dapat menanggapi sejumlah besar item respon terpilih dalam
jumlah waktu yang terbatas. Ini berarti Anda dapat memasukkan lebih banyak item
dalam pengujian Anda. Karena tes pada dasarnya adalah sampel dari domain konten, dan
sampel besar lebih baik daripada sampel kecil, dimasukkannya sejumlah besar item
cenderung meningkatkan karakteristik pengukuran tes.

15
 Item respons yang dipilih dapat diberi skor dengan cara yang efisien, objektif, dan andal.
Komputer sering dapat mencetak item respons yang dipilih. Akibatnya, penilaian
membutuhkan waktu lebih sedikit dan ada kesalahan penilaian yang lebih sedikit. Ini
dapat menghasilkan pengujian dengan karakteristik pengukuran yang diinginkan.
 Item respon terpilih sangat baik untuk mengukur tujuan kognitif level rendah (mis.,
Pengetahuan, pemahaman, dan aplikasi).
 Item respon terpilih mengurangi pengaruh faktor konstruk-tidak relevan tertentu yang
dapat memengaruhi nilai ujian (mis., Pengaruh kemampuan menulis pada tes yang
mengukur pengetahuan ilmiah)
Secara alami, ada batasan yang terkait dengan penggunaan item respons terpilih termasuk
yang berikut:
 Item respon terpilih sulit untuk ditulis. Dibandingkan dengan item yang dibangun-
respons, mereka biasanya membutuhkan lebih banyak usaha dan waktu untuk menulis.
Ini bukan untuk mengatakan bahwa menulis item tanggapan dibangun adalah tugas yang
mudah, hanya saja pengembangan efektif item respons yang dipilih biasanya lebih sulit
dan memakan waktu
 Meskipun item respon terpilih sangat cocok untuk menilai tujuan kognitif tingkat rendah,
mereka tidak cocok untuk menilai tujuan tingkat yang lebih tinggi (yaitu, analisis,
sintesis, dan evaluasi). Hal ini terutama berlaku untuk item benar-salah dan mencocokan
yang sering terbatas pada penilaian tujuan pendidikan tingkat rendah. Item pilihan ganda
dapat ditulis untuk menilai tujuan tingkat yang lebih tinggi, tetapi ini seringkali
membutuhkan sedikit usaha dan kreativitas.
 Pilihan-pilihan jawaban tunduk pada tebakan buta.
Item respons terstruktur mencakup item jawaban pendek, esai, penilaian kinerja, dan
portofolio. Kebanyakan orang terbiasa dengan item jawaban pendek dan esai. Item dengan
jawaban pendek mengharuskan siswa untuk memberikan kata, frasa, atau angka sebagai
jawaban atas pertanyaan langsung. Item jawaban pendek juga dapat berbentuk kalimat tidak
lengkap yang diselesaikan siswa (mis., Isi bagian yang kosong). Item esai menimbulkan
pertanyaan atau masalah bagi siswa untuk merespons dalam format tertulis. Item esai
biasanya dapat diklasifikasikan baik sebagai respon terbatas atau respon diperluas. Seperti
namanya, esai respon terbatas sangat terstruktur dan menempatkan batasan pada sifat dan
ruang lingkup respon siswa. Sebaliknya, esai tanggapan panjang kurang terstruktur dan
memberikan lebih banyak kebebasan kepada siswa dalam bagaimana mereka merespons.

16
Meskipun kami telah menyebutkan penilaian kinerja beberapa kali dalam teks ini sampai saat
ini, Anda mungkin tidak terlalu mengenal mereka. Sebelumnya, kami mencatat bahwa
penilaian kinerja mengharuskan siswa untuk menyelesaikan proses atau menghasilkan produk
dalam konteks yang sangat mirip dengan situasi kehidupan nyata. Portofolio, sebuah fornm
penilaian kinerja, melibatkan koleksi sistematis produk kerja siswa selama periode waktu
tertentu sesuai dengan seperangkat pedoman tertentu (AERA et al, 1999). Penilaian
tanggapan yang dibangun memiliki kekuatan dan kelemahannya sendiri (lihat Tabel 7.8).
Kekuatan mereka meliputi:
 Dibandingkan dengan item tanggapan terpilih, beberapa penilaian tanggapan
terkonstruksi (mis., Jawaban singkat dan esai) mungkin lebih mudah ditulis atau
dikembangkan. Tidak mudah, tetapi lebih mudah!
 Item respons terstruktur cocok untuk menilai kemampuan kognitif tingkat tinggi dan
kinerja tugas yang kompleks, dan beberapa tugas hanya memerlukan format respons
dibangun (misalnya, menulis surat, menunjukkan keterampilan pemecahan masalah).
Akibatnya mereka memperluas jangkauan tujuan pembelajaran yang dapat dinilai.
Kelemahannya meliputi:
 Item respons terstruktur membutuhkan lebih banyak waktu bagi siswa untuk
menyelesaikan. Anda tidak dapat memasukkan sebanyak mungkin item atau tugas
respons yang dibangun pada tes seperti halnya Anda dapat memilih item respons.
Akibatnya, Anda tidak dapat mengambil sampel domain konten secara menyeluruh.
 Item respons terstruktur sulit untuk dinilai. Selain skor menjadi lebih sulit dan
memakan waktu dibandingkan dengan item respon terpilih, penilaian lebih subjektif
dan kurang dapat diandalkan.
 Meskipun item yang dibangun-respons menghilangkan tebakan buta, mereka rentan
terhadap "gertak sambal." Artinya, siswa yang tidak benar-benar mengetahui respons
yang benar mungkin berpura-pura menanggapi yang secara dangkal mengubah
respons yang benar.
 Item respons terstruktur rentan terhadap pengaruh faktor-faktor asing atau konstruk-
tidak relevan yang dapat memengaruhi skor tes (mis., Pengaruh kemampuan menulis
pada tes yang mengukur pengetahuan ilmiah)
Seperti yang Anda lihat, penilaian respons terpilih dan respons respons terstruktur
memiliki kekuatan dan kelemahan spesifik yang patut dipertimbangkan dengan hati-hati
ketika memilih format penilaian. Namun, biasanya faktor kunci dalam memilih format

17
penilaian atau item melibatkan identifikasi format yang paling langsung mengukur perilaku
yang ditentukan oleh tujuan pendidikan. Artinya, Anda ingin memilih format item atau tugas
yang akan menjadi ukuran paling murni, langsung dari tujuan yang Anda coba ukur.
Misalnya, jika Anda ingin menilai kemampuan siswa untuk menunjukkan kemampuan
menulis mereka, esai adalah pilihan alami. Jika Anda ingin menilai kemampuan siswa untuk
terlibat dalam debat lisan, penilaian kinerja akan menjadi pilihan logis. Meskipun sifat
beberapa tujuan menentukan penggunaan item respons yang dibangun (misalnya,
keterampilan menulis), beberapa tujuan dapat diukur dengan sama baiknya dengan
menggunakan respons yang dipilih atau item respons yang dibangun. Jika setelah
mempertimbangkan dengan cermat Anda menentukan bahwa kedua format tersebut sesuai,
kami biasanya merekomendasikan penggunaan item respons terpilih karena memungkinkan
pengambilan sampel yang lebih luas dari domain konten dan prosedur penilaian yang lebih
objektif dan andal. kedua faktor ini meningkatkan karakteristik pengukuran pengujian Anda.
Kami akan membahas format penilaian ini dalam tiga bab berikutnya, dan diskusi ini akan
membantu Anda menentukan format mana yang paling tepat untuk pengujian Anda. Kami
percaya bahwa penilaian pendidikan idealnya harus berisi berbagai prosedur penilaian (mis.
Pilihan ganda, jawaban singkat, dan penilaian kinerja) yang secara khusus dirancang untuk
mengukur tujuan pendidikan yang menarik.
2. Menyatukan Penilaian
Kami sekarang akan memberikan beberapa saran untuk mengatur dan menyusun
penilaian ruang kelas Anda. Banyak dari saran ini akan dibahas secara lebih terperinci dalam
konteks format item yang berbeda, tetapi pengantarnya di sini diharapkan akan membantu
Anda mulai mempertimbangkan beberapa masalah utama. Beberapa saran ini mungkin
tampak jelas, tetapi kadang-kadang yang jelas diabaikan! Tabel 7.9 merangkum saran-saran
ini.
a) Ikuti Tabel Spesifikasi Anda. Mudah-mudahan kami menyampaikan pentingnya
menyatakan secara eksplisit tujuan pendidikan Anda dan mengembangkan tabel
spesifikasi lengkap untuk ujian Anda. Setelah Anda menginvestasikan waktu dan energi
dalam proses itu, kami mendorong Anda untuk menindaklanjuti dan menggunakannya
sebagai panduan atau cetak biru untuk mengembangkan tes Anda. Ingatlah bahwa tabel
spesifikasi Anda adalah alat yang membantu memastikan kesesuaian antara instruksi
kelas Anda dan konten tes Anda.

18
b) Berikan Arah yang Jelas. Adalah umum bagi guru untuk menerima begitu saja bahwa
siswa memahami bagaimana menanggapi format item yang berbeda. Mungkin bukan ini
masalahnya! Saat membuat tes selalu sertakan arahan menyeluruh yang secara jelas
menentukan bagaimana siswa harus menanggapi setiap format item. Supaya aman,
anggaplah bahwa para siswa belum pernah melihat tes seperti itu sebelumnya dan
berikan arahan dengan cukup detail untuk memastikan mereka tahu apa yang diharapkan
dari mereka.
c) Sebutkan Pertanyaan, Masalah, atau Tugas ini dengan Jelas dan Tegaskan dengan Cara
yang Mungkin. Anda ingin siswa yang telah menguasai tujuan pembelajaran untuk
mendapatkan item yang benar dan siswa yang belum menguasai tujuan untuk
mendapatkannya salah. Jika siswa sudah menguasai tujuan pembelajaran, Anda tidak
ingin menggunakan kata-kata yang ambigu, sintaks yang kompleks, dankata yg terlalu
sulit untuk menyebabkan mereka melewati pertanyaan.
d) Kembangkan Item dan Tugas yang Dapat Dicetak dengan Cara yang Tegas. Tanyakan
kepada diri Anda sendiri apakah barang-barang tersebut memiliki jawaban yang jelas
bahwa hampir setiap ahli akan setuju. Dalam hal esai dan penilaian kinerja,
pertanyaannya mungkin adalah apakah para ahli akan setuju tentang kualitas kinerja pada
tugas tersebut. Proses penilaian dapat menjadi tantangan bahkan ketika barang Anda
memiliki jawaban yang "benar". Ketika ada ambiguitas mengenai apa yang mewakili
jawaban atau jawaban definitif, penilaian bisa menjadi jauh lebih sulit.
e) Hindari Isyarat yang Tidak Sengaja pada Jawaban yang Benar. Sangat mudah untuk
isyarat yang tidak disengaja ke respon yang benar untuk menjadi tertanam dalam suatu
tes. Isyarat ini memiliki efek negatif yang memungkinkan siswa yang belum menguasai
materi menjawab pertanyaan dengan benar. Ini mengacaukan kecerdasan (mis., Mencari
tahu jawaban yang benar berdasarkan isyarat yang terdeteksi) dengan prestasi (mis.,
setelah mempelajari materi). Mengutip Gronlund (1998), hanya siswa yang telah
menguasai suatu tujuan yang harus mendapatkan item dengan benar, dan mereka yang
belum menguasainya, tidak peduli seberapa cerdas mereka, tidak boleh mendapatkannya
dengan benar.
f) Atur Item dalam Penilaian dalam Cara sistematis. Anda harus mengatur item dalam
penilaian Anda dengan cara yang mempromosikan kinerja optimal siswa Anda. Jika
pengujian Anda berisi beberapa format item, item tersebut harus disusun dalam beberapa
bagian sesuai dengan jenis item. Artinya, tempatkan item pilihan ganda bersama-sama,
semua item jawaban singkat bersama, dan seterusnya. Ini memungkinkan siswa untuk
19
mempertahankan mental yang sama di seluruh bagian. Ini memiliki manfaat tambahan
sehingga memudahkan Anda untuk menilai item. Setelah mengatur item berdasarkan
format, Anda harus mengatur item di setiap bagian (mis. Item pilihan ganda) sesuai
dengan tingkat kesulitannya. Yaitu, mulailah dengan item yang mudah dan pindah secara
progresif ke item yang lebih sulit. Pengaturan ini cenderung mengurangi kecemasan,
meningkatkan motivasi, dan memungkinkan siswa untuk maju dengan cepat melalui item
yang lebih mudah dan mencurahkan waktu yang tersisa untuk item yang lebih sulit.
g) Beberapa pakar penilaian menyarankan agar Anda mengatur item sesuai dengan urutan
materi yang disajikan dalam instruksi kelas Anda. Ini dianggap membantu siswa
mengambil informasi dengan lebih mudah. Namun, jika Anda mengadopsi pendekatan
ini, disarankan agar Anda mendorong siswa untuk melewati hal-hal yang paling sulit dan
mengembalikannya sesuai waktu yang diizinkan. Variasi logis pada pendekatan ini
adalah mengatur item dari yang termudah hingga yang paling sulit dalam setiap area
konten tertentu (misalnya, Nitko, 2001). Misalnya, pada bagian pilihan berganda yang
mencakup keandalan, validitas, dan analisis item, Anda akan mengatur semua item yang
terkait dengan reliabilitas dalam urutan kesulitan, diikuti oleh item validitas agar dari
kesulitan, dan akhirnya item pada analisis ietm dalam urutan kesulitan.
h) Sertakan Item Tes dan Tugas yang Akan Menghasilkan Penilaian yang Menghasilkan
Hasil Tes yang Andal dan Valid. Pada bagian pertama teks ini, kami membahas
impopropertika keandalan dan validitas. Apa pun format yang Anda pilih untuk
pengujian, Anda seharusnya tidak melupakan pentingnya mengembangkan tes yang
menghasilkanhasil yang andal dan valid. Untuk membuat keputusan pendidikan yang
lebih baik, Anda memerlukan informasi berkualitas tinggi.
i) Menentukan banyak Item yang Harus disertakan. Seperti yang sering terjadi, tidak ada
jawaban sederhana untuk pertanyaan ini. Jumlah item yang optimal untuk dimasukkan
dalam penilaian ditentukan oleh faktor-faktor seperti usia siswa, jenis item, luasnya
materi atau topik yang dinilai (yaitu, ruang lingkup tes), dan jenis tes. Mari kita
pertimbangkan beberapa faktor ini secara terpisah:
1) Umur Pelajar. Untuk siswa di sekolah dasar, mungkin yang terbaik adalah membatasi
ujian kelas reguler menjadi sekitar 30 menit untuk memaksimalkan upaya,
konsentrasi, dan motivasi. Dengan siswa yang lebih tua, Anda dapat meningkatkan
periode ini secara signifikan, tetapi itu mungkin diinginkan untuk membatasi
penilaian hingga sekitar satu jam untuk memaksimalkan kinerja dan mengakomodasi
jadwal kelas. Tentu ini hanya panduan fleksibel. Misalnya, ketika melaksanakan ujian
20
enam semester atau semester, lebih banyak waktu mungkin diperlukan untuk menilai
tujuan pembelajaran secara memadai. Selain itu, Anda mungkin akan memerlukan
bantuan dengan administrasi penilaian standar yang memakan waktu lebih banyak
daripada ujian kelas standar.
2) Jenis item. Jelas, siswa dapat menyelesaikan lebih banyak item benar-salah daripada
mereka dapat mengarang item dalam periode waktu tertentu. Gronlund (2003)
memperkirakan bahwa siswa sekolah menengah harus dapat menyelesaikan kira-kira
satu item pilihan ganda, tiga item benar-salah, atau tiga item mengisi-dalam-kosong
dalam satu menit jika item menilai tujuan di tingkat pengetahuan. Secara alami,
dengan siswa yang lebih muda atau tujuan yang lebih kompleks, lebih banyak waktu
akan dibutuhkan. Ketika Anda pindah ke esai respon terbatas atau penilaian kinerja,
secara signifikan lebih banyak waktu akan dibutuhkan, dan ketika Anda memasukkan
tugas respon diperluas tuntutan waktu semakin meningkat. Seperti yang telah kita
singgung, dimasukkannya lebih banyak item "hemat waktu" meningkatkan
pengambilan sampel dari domain konten.
3) Jenis dan Tujuan Tes. Tes kinerja maksimum biasanya dapat dikategorikan sebagai tes
kecepatan atau daya. Tes kecepatan murni umumnya berisi item yang relatif mudah
tetapi memiliki batas waktu yang ketat yang mencegah peserta ujian berhasil
menyelesaikan semua item. Pada tes daya murni, kecepatan kinerja tidak menjadi
masalah. Setiap orang diberikan cukup waktu untuk mencoba semua item, tetapi item
tersebut dipesan sesuai dengan kesulitan, dengan beberapa item menjadi sangat sulit
sehingga tidak ada peserta ujian yang diharapkan untuk menjawab semuanya.
Perbedaan antara tes kecepatan dan daya adalah tingkat, bukan absolut. Paling sering
sebuah tes bukan tes kecepatan murni atau tes kekuatan apure, tetapi menggabungkan
beberapa kombinasi dari dua pendekatan. Keputusan untuk menggunakan tes
kecepatan, tes daya, atau kombinasi keduanya akan memengaruhi jumlah dan jenis
item yang Anda sertakan pada tes Anda.
4) Lingkup Tes. Selain perbedaan kecepatan versus tes daya, ruang lingkup tes akan
memengaruhi berapa banyak item yang Anda sertakan dalam penilaian. Untuk ujian
mingguan yang dirancang untuk menilai kemajuan dalam kisaran keterampilan dan
pengetahuan yang relatif sempit, tes singkat kemungkinan akan cukup. Namun, untuk
penilaian enam minggu atau semester yang mencakup jangkauan keterampilan dan
pengetahuan yang lebih luas, penilaian yang lebih komprehensif (yaitu, lebih lama)
biasanya diindikasikan. Saat memperkirakan waktu yang dibutuhkan untuk
21
menyelesaikan tes, Anda juga harus mempertimbangkan aktivitas terkait tes seperti
membagikan tes, memberikan arahan, dan mengumpulkan tes. Sebagian besar
pengembang uji profesional merancang uji daya yang sekitar 95% dari sampel mereka
akan selesai dalam waktu yang ditentukan. Ini mungkin aturan praktis yang baik
untuk ujian kelas. Ini dapat dihitung di kelas dengan membagi jumlah siswa yang
menyelesaikan seluruh tes dengan jumlah total mata pelajaran.

F. Mempersiapkan Siswa Anda dan Mengatur Penilaian


Di bagian akhir bab ini, kami akan memberikan beberapa saran tentang cara terbaik
untuk mempersiapkan siswa Anda dan kemudian melaksanakan penilaian. Jelas itu akan
penyesalan untuk mengembangkan penilaian teladan dan kemudian hasilnya dikompromikan
oleh persiapan yang buruk atau prosedur administrasi yang tidak tepat. Tujuan Anda adalah
untuk mempromosikan kondisi yang memungkinkan siswa untuk melakukan yang terbaik.
Sebelum memberikan penilaian, Anda harus mengambil langkah-langkah yang tepat untuk
mempersiapkan siswa. Ini bisa termasuk mengumumkan di awal ketika tes akan
dilaksanakan, menggambarkan konten dan keterampilan apa yang akan dibahas, parameter
dasar tes (misalnya tes satu jam termasuk item esai jawaban pendek dan respons terbatas),
bagaimana skor akan dinilai, dan bagaimana hasil akan digunakan (misalnya, Linn &
Gronlund, 2000), itu juga bermanfaat untuk memberikan kepada siswa contoh-contoh jenis
barang yang akan dimasukkan dalam ujian dan memberikan instruksi umum dalam
keterampilan dasar ujian. Anda juga ingin melakukan yang terbaik untuk meminimalkan
kecemasan tes yang berlebihan karena dapat menjadi sumber varian yang tidak relevan yang
merusak validitas interpretasi Anda. Meskipun menekankan pentingnya penilaian yang akan
datang dapat membantu memotivasi siswa, ada titik di mana itu tidak lagi memotivasi dan
menjadi kontraproduktif. Minat Khusus Topik 7.1 memberikan beberapa saran untuk
membantu siswa mengelola kecemasan mereka. Penjadwalan penilaian juga merupakan
keputusan yang patut dipertimbangkan dengan cermat. Anda harus mencoba menjadwalkan
ujian pada saat siswa tidak akan terganggu oleh acara lain. Misalnya, menjadwalkan tes pada
hari terakhir sebelum liburan besar mungkin tidak optimal. Dalam situasi ini siswa cenderung
lebih fokus pada liburan yang akan datang daripada pada ujian. Hal yang sama berlaku
dengan acara besar di sekolah. Menjadwalkan tes di hari pertandingan besar di sekolah atau
saat prom mungkin tidak diharapkan. Guru harus melakukan segala upaya untuk memastikan
bahwa lingkungan fisik kondusif untuk kinerja siswa yang optimal. Anda harus mengambil
langkah-langkah untuk memastikan bahwa ruangan itu nyaman (mis., Suhu, ventilasi yang
22
tepat), bahwa ada pencahayaan yang tepat, dan bahwa kebisingan diminimalkan. Selain itu,
Anda harus berupaya menghindari hal lain menginterupsi (mis., tanyakan apakah ada api
yang dijadwalkan, tempatkan tanda "tes sedang berlangsung" di pintu).
Setelah siswa memulai tes, berhati-hatilah dalam memberikan bantuan kepada siswa.
Siswa dapat cukup pintar ketika membujuk informasi dari guru selama ujian. Mereka
mungkin datang untuk meminta klarifikasi sementara sebenarnya "memancing petunjuk
untuk jawabannya. Sebagai seorang guru Anda tidak ingin mencegah siswa untuk
mengklarifikasi makna item yang ambigu, tetapi Anda juga tidak ingin secara tidak sengaja
memberikan petunjuk untuk jawaban dari Item yang dinyatakan dengan jelas. Saran kami
adalah untuk mempertimbangkan pertanyaan siswa dengan hati-hati dan menentukan apakah
item tersebut benar-benar ambigu. Jika ya, buat komentar klarifikasi singkat untuk seluruh
kelas. Jika item tersebut jelas dan siswa hanya mencari petunjuk. untuk jawabannya, cukup
instruksikan siswa untuk kembali ke tempat duduknya dan dengan hati-hati membaca dan
mempertimbangkan arti dari item tersebut. Akhirnya, ambil langkah-langkah yang wajar
untuk mencegah kecurangan. Menyontek adalah sumber varians konstruk-tidak relevan yang
dapat merusak validitas interpretasi skor Anda. Pada topik khusus 7.2 memberikan beberapa
strategi untuk mencegah kecurangan dalam ujian di kelas.

TOPIK MENARIK 7.1


Saran untuk Mengurangi Kecemasan Tes
Penelitian menunjukkan bahwa ada hubungan lengkung antara kecemasan dan kinerja.
Artinya, pada tingkat yang relatif rendah secara anonim mungkin memiliki efek motivasi. Ini
dapat memotivasi siswa untuk belajar dengan cara yang tidak teliti dan mengerahkan upaya
terbaik mereka. Namun, ketika kecemasan melebihi titik tertentu itu menjadi merugikan
perfomace. Ini akan meningkatkan validitas interpretasi Anda jika Anda dapat mengurangi
pengaruh kecemasan tes yang melemahkan. Ingat, dalam sebagian besar situasi kelas Anda
berusaha untuk mengukur prestasi siswa, bukan dampak dari kecemasan yang berlebihan.
Dalam situasi ini kecemasan tes adalah sumber varians konstruk-tidak relevan. Dengan
mengurangi kecemasan tes, Anda mengurangi variansi konstruk yang tidak relevan dan
meningkatkan validitas interpretasi kami. Para peneliti telah memberikan saran untuk
membantu siswa mengendalikan kecemasan tes (mis., Hembree, 1988; Linn & Gronlund,
2000, Mealey & Host 1992: Nitko, 2001; Tippets & Benson, 1989). Saran-saran ini termasuk
yang berikut:

23
 Siswa dengan tes kecemasan dapat mengambil manfaat dari pelatihan relaksasi. Di
banyak sekolah, siswa dengan kecemasan yang lemah dapat dirujuk ke konselor
sekolah atau psikolog sekolah yang dapat mengajari mereka beberapa teknik relaksasi
yang cukup sederhana.
 Meskipun ini adalah praktik yang baik untuk meminimalkan gangguan lingkungan
bagi semua siswa, ini bahkan lebih penting bagi siswa yang sangat cemas. Siswa yang
sangat cemas cenderung lebih mudah terganggu oleh auditori dan visual dibandingkan
dengan rekan-rekan mereka yang kurang cemas
 Jangan membuat tes ini sebagai situasi "lakukan-atau-mati". Meskipun masuk akal
untuk menekankan tance dari penilaian, itu tidak bermanfaat untuk memberi tahu
siswa Anda bahwa ini akan menjadi tes paling sulit yang telah mereka selesaikan atau
bahwa masa depan mereka tergantung pada mereka. kinerja pada tes
 Berikan ulasan materi yang akan dibahas pada tes sebelum tanggal pengujian. Ini
adalah strategi pembelajaran yang baik yang dapat memfasilitasi integrasi materi,
siswa akan menghargai ulasan, dan kecemasan akan berkurang.
 Atur item pada tes Anda dari mudah ke sulit. Pernahkah Anda mengikuti tes di mana
item pertama sangat sulit atau membahas beberapa topik tidak jelas yang belum
pernah Anda dengar tentang Jika demikian, Anda mungkin mengalami penurunan
kepercayaan diri secara tiba-tiba, bahkan jika awalnya Anda merasa siap untuk
mengikuti tes. Untuk menghindari hal ini, banyak instruktur akan dengan sengaja
memulai tes dengan item yang sangat mudah. Mungkin tidak berbuat banyak dari
sudut pandang teknis (mis., Item kesulitan atau diskriminasi), tetapi dapat memiliki
pengaruh positif pada motivasi dan moral siswa.
 Akan bermanfaat untuk memiliki beberapa penilaian selama periode penilaian
daripada mendasarkan semuanya pada satu atau dua penilaian. Ketika hanya ada
sejumlah penilaian, taruhannya mungkin tampak sangat tinggi sehingga kecemasan
siswa meningkat secara tidak perlu.
 Persiapkan semua siswa Anda untuk ujian dengan mengajarkan strategi pengambilan
tes yang tepat. format tes baru atau tidak dikenal memicu kecemasan pada banyak
siswa, dan kecenderungan ini diperbesar
 Ketika siswa duduk dan siap untuk memulai tes, hindari diskusi yang tidak perlu
sebelum membiarkan mereka memulai. siswa biasanya sedikit "gelisah" dan ingin

24
memulai. jika guru mulai mengoceh tentang topik yang tidak relevan, ini cenderung
meningkatkan kecemasan siswa.

TOPIK MENARIK 7.2


Strategi untuk Mencegah Kecurangan
Menyontek pada tes sama tuanya dengan penilaian. Di Cina kuno, peserta ujian digeledah
sebelum mengambil ujian pegawai negeri, dan ujian yang sebenarnya diberikan dalam bilik
individu untuk mencegah kecurangan. Hukuman untuk menyontek adalah kematian
(Hopkins, 1998). Kami tidak menghukum orang yang berbuat curang seperti hari ini, tetapi
menyontek terus menjadi masalah di sekolah, Seperti halnya kegelisahan ujian, menyontek
adalah sumber varian yang tidak relevan dengan konstruksi yang merongrong validitas
interpretasi tes. Jika Anda dapat mengurangi kecurangan, Anda akan meningkatkan validitas
interpretasi Anda. Banyak penulis telah memberikan saran untuk mencegah kecurangan
(mis., Hopkins, 1998; Linn & Gronlund, 2000; Popham, 2000). termasuk yang berikut ini:
 Jaga agar bahan penilaian tetap aman. Tes dan penilaian lainnya memiliki cara untuk
sampai ke tangan siswa, Untuk menghindari hal ini, jangan biarkan penilaian terbuka
di kantor yang tidak terkunci, pastikan bahwa orang yang menyalin tes tahu untuk
menjaga keamanannya. , dan beri nomor tes sehingga Anda akan tahu jika ada yang
hilang. Verifikasi jumlah tes saat membagikannya kepada siswa dan ketika
mengambilnya dari siswa.
 Mungkin rekomendasi yang paling masuk akal adalah untuk memberikan pengawasan
yang tepat bagi siswa selama ujian, Ini bukan untuk menyarankan Anda mengarahkan
siswa (ini dapat menyebabkan kecemasan yang tidak perlu), tetapi hanya bahwa Anda
memberikan tingkat pengawasan yang tepat. Hal ini dapat melibatkan pengamatan
dari posisi yang memberikan pandangan yang tidak terhalang ke seluruh ruangan atau
secara ocehan berjalan di sekitar ruangan. Mungkin faktor yang paling penting adalah
atentif dan terlihat; ini mungkin akan sangat membantu mengurangi kemungkinan
kecurangan.
 Mintalah siswa membersihkan meja mereka sebelum membagikan tes.
 Saat membagikan tes, disarankan untuk menyerahkan masing-masing siswa tes secara
individual. Ini akan membantu Anda menghindari ujian yang tidak disengaja lebih
banyak daripada siswa (kecelakaan yang dapat menyebabkan tes jatuh ke tangan yang
salah).

25
 Jika siswa diizinkan untuk menggunakan kertas gores, Anda harus meminta mereka
menyerahkannya dengan ujian
 Jika memungkinkan, gunakan tempat duduk alternatif dengan deretan kursi kosong di
antara siswa.
 Buat dua bentuk tes. Ini dapat dicapai dengan hanya mengubah sedikit urutan tes item
sehingga item tidak dalam urutan yang sama persis. Beri siswa duduk di sebelah satu
sama lain soal berseling.

26
BAB III

PENUTUP

Guru sebagai pendukung utama dalam kesuksesan belajar siswanya, guru harus
memiliki langkah-langkah awal yang harus dilakukan mengembangkan tes pencapaian kelas.
langkah pertama adalah menentukan tujuan pendidikan atau tujuan yang Anda miliki untuk
siswa. Penting untuk melakukan ini karena tujuan-tujuan ini akan berfungsi sebagai dasar
untuk melakukan penilaian. Dalam menulis tujuan pendidikan, kami mencatat bahwa ada
beberapa faktor yang perlu dipertimbangkan.
Tujuan pendidikan dapat ditulis pada kontinum dari sangat spesifik ke sangat luas. Ada
batasan yang terkait dengan tujuan di kedua ujung kontinum ini dan strategi yang disarankan
untuk membantu guru dalam meminimalkan keterbatasan ini. Tujuan pendidikan juga
berbeda dalam jenis kemampuan atau karakteristik yang diukur. Tujuan pendidikan biasanya
melibatkan kemampuan kognitif, afektif, atau psikologis. Sementara ketiga domain ini
penting dalam pengaturan sekolah, domain kognitif adalah yang terpenting. Tujuan
pendidikan sering diklasifikasikan sebagai perilaku atau non-perilaku. Meskipun tujuan
perilaku memiliki kelebihan, jika format perilaku diambil secara ekstrem, ia juga memiliki
keterbatasan..
Dari pembahasan yang telah dilakukan kita seharusnya menyadari bahwa merumuskan
tujuan sebagai acuan penilaian dalam prosess pembelajaran sangat diperlukan, beberapa saran
praktis untuk menyusun tes mempersiapkan siswa untuk penilaian, dan mengelolanyaseperti
sebagai berikut: (1) mematuhi tabel spesifikasi. (2) memberikan instruksi yang jelas, (3)
menyatakan pertanyaan dengan jelas, (4) mengembangkan item yang dapat dinilai dengan
cara yang menentukan, (5) menghindari petunjuk untuk jawaban yang benar. (6) mengatur
item secara sistematis, dan (7) termasuk item yang akan berkontribusi pada keandalan dan
validitas hasil penilaian. Tentunya guru juga harus mempertimbangkan beberapa faktor yang
dalam menentukan berapa banyak item yang akan disertakan dalam penilaian. Faktor-faktor
ini termasuk usia siswa, cakupan materi, dan jenis tes yang dikembangkan.
Dalam hal mempersiapkan siswa untuk dan mengelola penilaian, guru dapat melakukan
hal sebagai berikut: (I) mempersiapkan siswa untuk penilaian, (2) menjadwalkan penilaian
pada waktu yang tepat, (3) memastikan bahwa kondisi pengujian memadai (mis.,
Pencahayaan yang tepat nyaman, tenang), (4) menghindari menjawab pertanyaan yang
mungkin "memberikan" jawaban, dan (5) mengambil langkah-langkah yang wajar untuk
mencegah kecurangan

27
DAFTAR PUSTAKA

Reynolds, C. R., Livingstone, R. B., & Willson, V. (2009). Measurmnt and Assessment. New
Jersey: PEARSON.

28

Anda mungkin juga menyukai