Anda di halaman 1dari 47

EVALUASI PEMBELAJARAN IPA

TERJEMAHAN

MEASUREMENT AND ASSESSMENT IN TEACHING


PART II
Classroom Test and Assesment
CHAPTER 6
Planning Classroom Test and Assesment

Diterjemahkan Oleh :

IRMA SURYANI HS
18708251015

PROGRAM PASCASARJANA
PENDIDIKAN SAINS
UNIVERSITAS NEGERI YOGYAKARTA
2019
Tes dan penilaian di kelas memainkan peran sentral dalam evaluasi
pembelajaran siswa. Mereka memberikan langkah-langkah yang relevan dari
banyak hasil pembelajaran penting dan bukti tidak langsung mengenai orang lain.
Mereka membuat hasil belajar yang diharapkan secara eksplisit kepada siswa dan
orang tua dan menunjukkan jenis kinerja apa yang dihargai. Namun, validitas
informasi yang mereka berikan tergantung pada perlakuan yang masuk ke dalam
perencanaan dan persiapan tes dan penilaian.
Tujuan utama dari pengujian dan penilaian kelas adalah untuk mendapatkan
informasi yang valid, andal, dan berguna mengenai prestasi siswa. Ini
membutuhkan penentuan apa yang akan diukur dan kemudian mendefinisikannya
secara tepat sehingga tugas dapat dibuat yang membutuhkan pengetahuan,
keterampilan, dan pemahaman yang dimaksudkan sambil meminimalkan pengaruh
keterampilan yang tidak relevan atau tambahan. Ini juga mensyaratkan penetapan
domain prestasi sedemikian rupa sehingga sampel item dan tugas penilaian akan
mewakili domain total tugas pencapaian yang memberikan penekanan yang sesuai
untuk tujuan prioritas tinggi. Memuaskan persyaratan ini memberikan dasar untuk
mendapatkan hasil yang akan valid untuk penggunaan pembelajaranonal yang
dimaksud.
Kemungkinan mempersiapkan tes dan penilaian kelas yang valid, andal, dan
bermanfaat sangat ditingkatkan jika serangkaian langkah seperti yang ditunjukkan
pada Gambar 6.1 diikuti.
Prosedur khusus untuk membuat masing-masing dari berbagai jenis item tes
diuraikan dalam Bab 7 hingga 9. Pertanyaan esai terbuka dibahas dalam Bab 10 dan
jenis tugas penilaian kinerja lainnya yang digunakan untuk mengukur pencapaian
kompleks dijelaskan dalam Bab 11. Sistematika koleksi pekerjaan siswa ke dalam
portofolio dan penggunaan portofolio tersebut untuk tujuan spesifik dijelaskan
dalam Bab 12. Bab 13 menjelaskan penggunaan teknik observasi, penilaian sejawat,
dan laporan diri.
TUJUAN
Peningkatan pembelajaran dan
pengajaran

8. Menggunakan hasilnya

7. Menilai penilaian

6. Mengolah penilaian

5. Menyusun penilaian

4. Mempersiapkan jenis penilain yang relevan

3. Memilih jenis penilaian yang sesuai

2. Spesifikasi pengembangan

1. Menentukan tujuan pengukuran

Gambar 6.1
Langkah-langkah dasar dalam pengujian dan penilaian kelas teknik untuk menilai
hasil belajar dan pengembangan siswa. Bab 14 berkaitan dengan perakitan,
administrasi, dan penilaian tes dan penilaian kelas. Bab 15, bab terakhir di bagian
ini, menjelaskan pendekatan untuk penilaian dan pelaporan.

TUJUAN PENGUJIAN DAN PENILAIAN KELAS


Tes dan penilaian kelas dapat digunakan untuk berbagai tujuan pengajaran. Ini
dapat digambarkan dengan baik dalam hal lokasi mereka dalam proses pengajaran,
yang sangat mirip dengan tipe penilaian yang dijelaskan dalam Bab 3.
Pretesting
Tes dan penilaian dapat diberikan pada awal segmen pembelajaran (misalnya,
unit atau pelajaran) untuk menentukan (a) apakah siswa memiliki
keterampilan prasyarat yang diperlukan untuk pembelajaran (untuk
menentukan kesiapan) atau (b) sejauh mana siswa telah memiliki mencapai

3
tujuan pembelajaran yang direncanakan (untuk menentukan penempatan
siswa atau modifikasi pembelajaran).
Kesiapan pretes biasanya terbatas cakupannya. Misalnya, pretest
dalam aljabar mungkin terbatas pada operasi dan konsep aritmatika,
pretest dalam fisika mungkin terdiri dari konsep fisik dasar atau
keterampilan prasyarat dalam aljabar, dan pretest pada mulanya
Jerman mungkin terbatas pada pengetahuan tata bahasa Inggris. Selain
terbatas pada domain terbatas, item pretest cenderung memil iki
tingkat kesulitan yang relatif rendah. Tes kesiapan yang
dipublikasikan tersedia di tingkat sekolah dasar di bidang
keterampilan dasar, tetapi sebagian besar guru harus mengembangkan
pretes kesiapan mereka sendiri. Tes ini berfungsi sebagai dasar untuk
pekerjaan remedial atau untuk adaptasi rencana pengajaran.
Pretest untuk menentukan sejauh mana siswa telah mencapai
tujuan pembelajaran yang direncanakan tidak berbeda dari tes yang
digunakan untuk mengukur hasil pembelajaran. Dengan demikian, tes
yang dirancang untuk mengukur pencapaian akhir dalam pelajaran
atau unit dapat diberikan di awal untuk mengukur kinerja entri pada
tujuan. Dalam hal ini, tes akhir atau penilaian seharusnya, tentu saja,
bukan tes yang sama yang digunakan dalam pretesting tetapi bentuk
yang setara dari itu.
Pengujian dan Penilaian Selama Pembelajaran
Tes dan penilaian yang diberikan selama pengajaran memberikan
dasar untuk penilaian formatif. Mereka digunakan untuk memantau
kemajuan belajar, mendeteksi kesalahpahaman, mendorong siswa
untuk belajar, dan memberikan umpan balik kepada siswa dan guru.
Guru biasanya menyebut tes formatif ini dengan tes belajar, tes
praktik, kuis, tes unit, dan sejenisnya. Tes dan penilaian ini biasanya
mencakup beberapa segmen pembelajaran yang telah ditentukan
(misalnya, bab atau serangkaian keterampilan tertentu) dan dengan
demikian mencakup sampel hasil pembelajaran yang agak terbatas.
Gabungan jenis item tes dan tugas penilaian kinerja yang lebih
kompleks perlu dipilih dengan hati-hati untuk memastikan bahwa
berbagai tujuan pembelajaran kritis dinilai dan untuk memastikan
bahwa prioritas tinggi tetapi mungkin sulit untuk menilai tujuan
cukup memadai, terwakili dalam penilaian. Idealnya, tes dan
penilaian akan dibuat sedemikian rupa sehingga langkah-langkah
perbaikan dapat diberikan untuk tujuan pembelajaran yang belum
tercapai. Ketika sebagian besar siswa gagal satu set item atau
berkinerja buruk pada tugas kinerja yang diperluas, ulasan kelompok
mungkin berlaku. Ketika sejumlah kecil siswa tampil dengan cara-
cara yang menunjukkan kurangnya pemahaman tentang konsep -
konsep kritis, metode studi alternatif dapat ditentukan (misalnya,
bimbingan khusus, tugas membaca, latihan praktik, dan sejenisnya).
Kesulitan belajar yang terus-menerus mungkin memerlukan
penggunaan tes diagnostik. Untuk jenis pengujian ini, sejumlah item
pengujian diperlukan di setiap area spesifik, dengan sedikit variasi
dari item ke item. Dalam mendiagnosis kesulitan siswa dalam
menambahkan bilangan bulat, misalnya, akan perlu untuk
memasukkan masalah tambahan yang mengandung berbagai
kombinasi angka, beberapa memerlukan pengangkutan dan beberapa
tidak, untuk menentukan jenis kesalahan spesifik yang dibuat.
Pengujian diagnostik adalah bidang yang sangat khusus yang agak
diabaikan dalam pengukuran pendidikan. Ada beberapa tes
diagnostik yang diterbitkan, tetapi ini terutama di bidang
keterampilan dasar. Di bidang lain, guru harus lebih bergantung pada
fitur diagnostik tes formatif atau menyiapkan tes dan penilaian
diagnostik mereka sendiri.
Pengujian dan Penilaian Akhir Pembelajaran
Pada akhir segmen pembelajaran (misalnya, unit atau pelajaran),
minat utama kami adalah mengukur sejauh mana hasil pembelajaran
yang diharapkan dan standar kinerja telah tercapai.

5
Meskipun tes dan penilaian akhir pembelajaran ini digunakan,
terutama untuk penilaian sumatif (mis, untuk mensertifikasi pencapaian
atau menugaskan nilai), mereka juga dapat melayani fungsi lainnya. Tes
akhir-unit dapat digunakan untuk umpan balik kepada siswa, mendorong
siswa untuk melakukan pekerjaan lanjutan yang lebih menantang,
menugaskan pekerjaan perbaikan, dan menilai pembelajaran serta untuk
tujuan penilaian. Bahkan, mereka dapat melayani fungsi penilaian
formatif dan sumatif dan dalam beberapa kasus berfungsi sebagai pretest
untuk unit berikutnya (mis., Di mana unit diurutkan, seperti dalam
matematika). Tes akhir pelajaran memberikan survei luas tentang
pembelajaran siswa atas semua hasil yang diinginkan dari suatu
pelajaran. Selain penggunaannya dalam penilaian, tes juga dapat
memberikan informasi untuk mengevaluasi efektivitas pengajaran.
Ringkasan dari berbagai jenis tes kelas disajikan pada Tabel 6.1

Tabel 6.1
Jenis dasar tes dan penilaian kelas
(Item yang dimit dari edisi buku web)

MENGEMBANGKAN SPESIFIKASI UNTUK TES DAN PENILAIAN


Untuk memastikan bahwa tes dan penilaian kelas mengukur sampel yang
representatif tugas yang relevan secara pembelajaranonal, penting untuk
mengembangkan spesifikasi yang dapat memandu pemilihan item tes dan tugas
penilaian. Saat menyiapkan ujian belajar singkat tentang area terbatas (mis., ejaan
atau huruf besar), daftar sederhana tugas tertentu, dengan indikasi jumlah item
yang mengukur setiap tugas, mungkin sudah cukup. Namun, untuk sebagian besar
tujuan pengujian, spesifikasi yang lebih rumit diperlukan. Satu perangkat yang
telah banyak digunakan untuk tujuan ini adalah grafik dua arah, yang disebut tabel
spesifikasi (atau cetak biru uji).
Membuat Tabel Spesifikasi
Membuat daftar spesifikasi melibatkan (a) menyiapkan daftar tujuan
pembelajaran, (b) menjabarkan isi pelajaran, dan (c) menyiapkan grafik dua
arah. Langkah-langkah ini diilustrasikan di sini untuk unit cuaca di kelas
ilmu bumi sekolah menengah.
Mempersiapkan Daftar Tujuan Pembelajaranonal. Dengan menggunakan
prosedur untuk menyatakan tujuan pembelaharan yang dijelaskan dalam Bab
3, daftar tujuan umum dan hasil pembelajaran khusus berikut ini disiapkan
untuk unit cuaca. Meskipun daftar ini tidak lengkap, itu menggambarkan
metode menyatakan tujuan dan jumlah detail yang diinginkan. Jika unit
cuaca ini diajarkan pada tingkat kelas yang lebih rendah, tujuan kami akan
ditentukan oleh hasil pembelajaran spesifik yang lebih sedikit dan sederhana;
pada tingkat kelas yang lebih tinggi, hasil pembelajaran yang lebih kompleks
akan dimasukkan.
Tujuan Pembelajaranonal untuk Materi Cuaca
1. Mengetahui istilah dasar
1.1 Menulis definisi dari setiap istilah
1.2 Identifikasi istilah yang mewakili setiap elemen cuaca
1.3 Mengidentifikasi istilah tinju terbaik yang diberikan cuaca
1.4 Cocokkan istilah tersebut dengan gambar konsep
1.5 Membedakan antara penggunaan istilah yang benar dan salah
2. Mengetahui simbol cuaca
2.1 Cocokkan setiap simbol dengan elemen cuaca yang diwakilinya
2.2 Gambar simbol untuk setiap elemen cuaca
2.3 Identifikasi arti dari setiap simbol
3. Mengetahui fakta spesifik
3.1 Identifikasi elemen-elemen yang mempengaruhi cuaca
3.2 Menamai instrumen yang digunakan untuk mengukur setiap
elemen cuaca
3.3 Identifikasi unit pengukuran yang digunakan dalam pelaporan
setiap cuaca elemen

7
3.4 Membedakan antara prosedur yang benar dan yang salah untuk
menentukan masing-masing elemen cuaca
3.5 Cocokkan nama masing-masing jenis cloud dengan deskripsi
karakteristiknya
3.6 Identifikasi kondisi cuaca yang terkait dengan setiap jenis depan
4. Memahami pengaruh faktor-faktor pada pembentukan cuaca
4.1 Menjelaskan karakteristik kondisi cuaca yang diberikan
4.2 Menjelaskan bagaimana awan terbentuk
4.3 Membedakan antara laporan cuaca yang mungkin dan tidak
mungkin
4.4 Identifikasi faktor-faktor yang menyebabkan perubahan cuaca
4.5 Memprediksi cuaca masa depan dari perubahan kondisi
4.6 Menjelaskan bagaimana awan mempengaruhi cuaca dan iklim
4.7 Memberikan laporan cuaca lisan untuk negara bagian lain ke
class
5. Menafsirkan peta cuaca
5.1 Menjelaskan cuaca untuk lokasi tertentu
5.2 Identifikasi berbagai jenis bidang yang ditunjukkan pada peta
cuaca
5.3 Menjelaskan kondisi cuaca di sekitar setiap depan yang
ditunjukkan pada peta cuaca
5.4 Identifikasi arah gerakan untuk setiap depan yang ditunjukkan
pada peta cuaca
5.5 Menjelaskan cara pola global pergerakan atmosfer mempengaruhi
cuaca lokal
5.6 Buat peta cuaca menggunakan deskripsi tertulis tentang kondisi
yang ada
6. Mengukur karakteristik cuaca yang relevan
6.1 Mengukur dan mencatat perubahan tekanan udara
6.2 Mengukur dan mencatat arah dan kecepatan angin
6.3 Mengukur kelembaban relatif
Daftar tujuan terbatas pada hasil-hasil yang dapat diukur dengan
penilaian ruang kelas. Bentuk pertanyaan tes atau tugas penilaian dapat
bervariasi sebagai fungsi dari hasil. Hasil yang melibatkan kata kerja seperti
mengidentifikasi, membedakan, atau mencocokkan secara efektif dan efisien
diukur dengan pilihan ganda atau jenis item tes objektif lainnya. Yang
melibatkan kata kerja seperti nama atau gambar mudah diukur dengan item
jenis persediaan sederhana di mana siswa diminta untuk "mengisi bagian
yang kosong." Hasil yang menggunakan kata kerja seperti yang dijelaskan
atau menjelaskan dapat diukur dengan item objektif yang dibuat dengan
terampil tetapi seringkali lebih mudah dan lebih baik diukur dengan
pertanyaan esai. Kata kerja yang melibatkan kata kerja seperti konstruksi,
pengiriman, atau pengukuran paling jelas membutuhkan tugas penilaian
kinerja. Tujuan yang terdaftar tidak termasuk hasil afektif (mis.,
Menunjukkan sikap ilmiah). Rencana evaluasi yang lebih rumit untuk unit
cuaca mungkin berisi daftar semua hasil yang relevan dengan indikasi
bagaimana masing-masing dinilai.
Menjabarkan Konten Pembelajaran. Langkah kedua dalam menyiapkan tabel
spesifikasi adalah membuat garis besar konten pembelajaran. Tujuan
pembelajaran menggambarkan jenis kinerja yang diharapkan ditunjukkan
oleh siswa; konten pembelajaran menunjukkan area di mana setiap jenis
kinerja akan ditampilkan. Jumlah detail untuk disertakan dalam garis besar
konten agak arbitrer (sewenang-wenang), tetapi garis besar harus cukup rinci
untuk memastikan pengambilan sampel konten yang memadai dan
interpretasi yang tepat dari hasil. Daftar topik dan subtopik berikut untuk unit
cuaca menggambarkan garis besar yang memadai untuk persiapan ujian dan
penilaian.
Garis Besar Konten untuk Unit Cuaca

A. Tekanan udara
1. Mengukur dan melaporkan tekanan udara
2. Faktor yang mempengaruhi tekanan udara

9
3. Hubungan dengan perubahan cuaca
B. Temperatur udara
1. Mengukur dan melaporkan suhu udara
2. Faktor-faktor yang mempengaruhi suhu udara
3. Hubungan dengan formasi cuaca
C. Kelembaban dan curah hujan
1. Mengukur dan melaporkan kelembaban
2. Faktor yang mempengaruhi kelembaban
3. Bentuk presipitasi
4. Mengukur dan melaporkan curah hujan
D. Angin
1. Pengukuran kecepatan dan arah
2. Faktor-faktor yang mempengaruhi kecepatan dan arah
3. Simbol untuk melaporkan kecepatan dan arah
E. Awan
1. Jenis awan
2. Karakteristik tipe cloud
3. Faktor-faktor yang menyebabkan pembentukan awan
4. Hubungan dengan kondisi cuaca
5. Simbol untuk tipe cloud
F. Front
1. Jenis-jenis front
2. Formasi front
3. Cuaca terkait dengan front
4. Simbol untuk front

Mempersiapkan Grafik Dua Arah. Langkah terakhir dalam membuat tabel


spesifikasi adalah menyiapkan grafik dua arah yang menghubungkan tujuan
pembelajaran dengan konten pembelajaran, sehingga menentukan sifat
sampel item-item tes dan tugas penilaian. Contoh grafik untuk unit cuaca
menengah pertama kami disajikan pada Tabel 6.2. Tabel ini menunjukkan
jumlah total item tes dan tugas penilaian serta persentase yang dialokasikan
untuk setiap tujuan dan setiap area konten. Untuk pengujian ruang kelas,
menggunakan jumlah item mungkin cukup, tetapi persentase berguna dalam
menentukan jumlah penekanan yang diberikan untuk setiap area.

Tabel 6.2
Tabel spesifikasi untuk unit cuaca di kelas sains bumi sekolah menengah
Tujuan
---- Pengetahuan---- Memahami Penafsiran
Pengaruh Total
Ketentuan Simbol Khusus Peta Persentase
Konten Setiap Faktor jumlah
Berjemur cuaca pada fakta cuaca item
Formasi cuaca item
Tekanan udara 1 1 1 3 3 9 15
Angin 1 1 1 10 2 15 25
Suhu 1 1 1 4 2 9 15
Kelembaban dan
1 1 1 7 5 15 25
curah hujan
Awan 2 2 2 6 12 20
Total jumlah item 6 6 6 30 12 60
Persentase item 10 10 10 50 20 100

Tabel 6.2 terbatas pada tujuan-tujuan yang dapat diukur dengan tes
kelas dengan item esai objektif atau respons terbatas. Ini tidak termasuk
dalam tujuan yang membutuhkan kinerja (mis., 4.7, presentasi lisan; 5.6,
membuat peta cuaca, dan 6.1 hingga 6.3, menggunakan instrumen
cuaca). Dengan demikian, untuk cakupan yang komprehensif, tes kelas
perlu ditambah dengan serangkaian tugas penilaian kinerja. Bobot relatif
yang akan diberikan kepada hasil penilaian kinerja dan tes kelas dalam
penugasan nilai pelajaran harus ditentukan sesuai dengan kepentingan
relatif dari tujuan. Sangat penting bahwa tujuan penting yang tidak dapat
dinilai oleh tes kelas dapat diidentifikasi sehingga rencana untuk menilai
pencapaian tujuan tersebut dapat dibuat. Dalam contoh ini, daftar
sederhana lima tugas penilaian kinerja yang sesuai dengan tujuan
pembelajaran 4.7, 5.6, 6.1, 6.2, dan 6.3, bersama dengan rencana untuk
bobot relatif yang akan diberikan kepada skor pada tugas-tugas dan tes
kelas, akan cukup.

11
Tabel 6.2 disiapkan menggunakan langkah-langkah berikut.

1. Sebutkan tujuan pembelajaran umum di bagian atas tabel.

2. Sebutkan area konten utama di sisi kiri tabel.

3. Tentukan proporsi item tes apa yang harus dikhususkan untuk setiap
tujuan dan setiap area konten.

Baris bawah dari Tabel 6.2 menunjukkan bahwa 10% dari item harus
dikhususkan untuk pengetahuan tentang persyaratan dasar, 10% untuk
pengetahuan tentang simbol cuaca, 10% untuk pengetahuan tentang fakta
spesifik, 50% untuk memahami pengaruh faktor cuaca, dan 20% untuk
interpretasi peta cuaca. Demikian pula, kolom di paling kanan menunjukkan
bahwa 15% dari item berkaitan dengan tekanan udara, 25% dengan angin,
dan seterusnya di bawah kolom. Biasanya persentase ini ditetapkan terlebih
dahulu untuk menunjukkan penekanan relatif yang harus diberikan untuk
setiap tujuan dan setiap area konten. Jumlah total item untuk setiap area
kemudian ditentukan. Sebagai contoh, karena ini akan menjadi tes 60-item,
6 item (100) adalah untuk mengukur pengetahuan tentang istilah dasar, dan
9 item (15%) berkaitan dengan tekanan udara. Dengan demikian, jumlah
total item dihitung dan terdaftar di bagian bawah dan bawah sisi kanan tabel.
Angka-angka ini kemudian digunakan sebagai panduan untuk menetapkan
item tes ke setiap sel. Sebagai contoh, 2 item (sekitar 33% dari 6) telah
ditugaskan ke sel di sudut kiri bawah, menunjukkan bahwa tes akan berisi 2
item yang mengukur pengetahuan tentang istilah tentang awan. Namun,
penugasan item ke setiap sel tidak sepenuhnya mengikuti persentase.
Beberapa sel mungkin dibiarkan kosong, seperti yang ditunjukkan dalam
rantai, karena barang-barang di daerah itu tidak pantas. Demikian pula,
beberapa sel mungkin menerima jumlah item yang lebih besar karena
mereka sesuai dengan tujuan pembelajaran yang lebih penting, dan
akibatnya tugas belajar untuk sel itu mungkin telah menerima penekanan
yang lebih besar dalam pengajaran. Dalam contoh tersebut, 10 dari 60 item
akan dialokasikan untuk menilai pemahaman siswa tentang angin pada
pembentukan cuaca, sedangkan hanya satu item yang akan dimasukkan
untuk mengukur pengetahuan tentang fakta tertentu tentang angin. Alokasi
yang tidak proporsional seperti itu tepat jika konsisten dengan prioritas
pembelajaran yang dimaksudkan dan aktual yang diberikan untuk
memahami pengaruh angin pada pembentukan cuaca. Tabel spesifikasi
memberikan panduan dalam menyusun tes. Tes yang sebenarnya mungkin
sedikit menyimpang dari spesifikasi untuk sel-sel tertentu, tetapi jumlah
item dalam sel tabel harus mendekati distribusi yang diinginkan dan harus
menambahkan hingga jumlah total item yang ditunjukkan untuk setiap
kolom dan baris.

Penyebaran akhir item dalam tabel spesifikasi dikombinasikan dengan


penilaian kinerja yang bukan bagian dari tes kelas harus mencerminkan
penekanan yang diberikan selama pembelajaran. Tujuan yang dianggap
lebih penting oleh guru harus dibagikan lebih banyak soal tes. Ini tidak
hanya berlaku untuk item-item pada tes ruang kelas tetapi juga tugas
penilaian kinerja. Bobot yang diberikan untuk kinerja tugas penilaian
tersebut harus mencerminkan besarnya tujuan. Demikian pula, bidang
konten yang menerima lebih banyak waktu pelajaran harus dialokasikan
lebih banyak item tes dan tugas penilaian. Meskipun keputusan yang terlibat
dalam membuat tabel agak sewenang-wenang dan prosesnya sudah
waktunya, persiapan tabel spesifikasi pengujian, bersama dengan daftar
tugas penilaian kinerja yang diperlukan untuk melengkapi tes, adalah salah
satu cara terbaik untuk memastikan bahwa set total item tes dan tugas
penilaian akan mengukur sampel representatif dari tujuan pembelajaran
relevan. Seperti dicatat dalam bab 4, ini memberikan bukti terkait konten
bahwa tes akan memberikan ukuran yang valid dari hasil pembelajaran yang
dimaksudkan. Upaya yang masuk ke dalam spesifikasi pelimpahan juga
membuatnya jauh lebih mudah untuk mempersiapkan tes begitu rencana
dilimpahkan.

13
Contoh Spesifikasi Lain

Karena cakupannya yang luas, tabel spesifikasi sangat berguna dalam


membuat tes atau penilaian atas unit tentu saja. Di sini tabel memastikan
bahwa masing-masing jenis hasil belajar yang beragam akan menerima
penekanan yang sesuai dalam ujian. Apakah tabel spesifikasi berguna dalam
menyusun tes di area yang lebih terbatas, bagaimana pun tergantung pada
ruang lingkup hasil belajar yang akan dicakup oleh tes. jika domain tugas
sangat terbatas, seperti "penambahan fraksi dengan beberapa penyebut"
tabel spesifikasi mungkin tidak diperlukan. Di sini kita bisa menuliskan
semua, atau hampir semua, tugas-tugas spesifik yang dicakup oleh hasil
pembelajaran ini, sebagai berikut.

 Tambahkan dua pecahan dengan penyebut yang sama di mana


jawabannya kurang dari 1 (1/3 + 1/3)
 Tambahkan dua pecahan dengan penyebut yang sama di mana
jawabannya sama dengan 1 (1/3 + 2/3)
 Tambahkan dua pecahan dengan penyebut yang sama di mana
jawabannya lebih besar dari 1 (2/3 + 2/3)
 Tambahkan dua fraksi dengan penyebut yang sama dan kurangi
jawaban ke istilah terendah (4/6 + 4/6)
 Tambahkan lebih dari dua fraksi dengan penyebut yang sama dan
kurangi jawaban (1/8 + 5/8 + 6/8)

Daftar tugas pembelajaran seperti spesifik ini cukup awal sifat tepat
kinerja terlibat dalam "penambahan fraksi dengan penyebut yang sama."
Kita bisa memperoleh sampel yang cukup representatif dari tugas-tugas
tersebut dengan hanya membuat lima atau lebih item untuk setiap tugas,
menggunakan berbagai kombinasi angka.

Jika tes matematika kami mencakup domain pencapaian yang sedikit


lebih lemah, katakan “penambahan fraksi,” kita mungkin sekarang
menemukan tabel spesifikasi yang cukup memuaskan. Ilusi dari tabel seperti
itu untuk tes 50-item ditunjukkan pada Teble 6.3. penggunaan tabel seperti
itu tidak berarti, tidak tentu saja, kita seharusnya tidak membuat jenis
rincian kerusakan yang kita lakukan.

Tabel 6.3
Tabel spesifikasi untuk pengujian 50 item pada penambahan fraksi

Tujuan Pembelajaranonal
Menambahkan Jumlah
Menamba Menambahkan
Fraksi item
Area Konten hkan Angka
dan Angka
Fraksi Campuran
Campuran
Penyebut sama 5 5 5 15
Penyebut tidak 5 5 5 15
sama (dengan
faktor umum)
Penyebut tidak 6 7 7 20
sama (tanpa
faktor umum
keluar)
Jumlah item 16 17 17 50

"Penambahan pecahan dengan penyebut yang sama." Daftar tugas yang


sedemikian mendetail membantu dalam mengajar, mendeteksi kesalahan
pembelajaran, dan menyusun item-item tes. Namun, tabel spesifikasi
melengkapi daftar tersebut dengan menentukan sampel tugas yang akan
dimasukkan dalam tes. Seperti disebutkan sebelumnya, ini memberikan
jaminan yang lebih besar bahwa hasil pembelajaran yang dimaksudkan akan
diukur secara seimbang.
Daftar sederhana seperti yang diberikan untuk spesifikasi "penambahan
fraksi dengan penyebut yang sama" seperti yang ada pada tabel 6.3 dapat
dengan mudah dibuat untuk aspek keterampilan operasional penambahan
fraksi. Namun, seringkali lebih sulit untuk membuat spesifikasi yang adil
untuk tujuan memahami konsep atau kemampuan untuk menerapkan konsep
dalam pengaturan novel. Ini diperjelas bahkan dengan topik yang relatif
sempit dari fraksi dengan mempertimbangkan Dewan Nasional Guru

15
Matematika (NCTM) Standar 12: Fraksi dan Desimal untuk Kelas K-4.
Antara lain, standar itu menyatakan bahwa siswa harus "mengembangkan
konsep pecahan, angka campuran, dan desimal" dan "menerapkan pecahan
dan desimal untuk situasi masalah" (NCTM, 1989).
Menggunakan Standar 12 sebagai pernyataan tujuan pembelajaran untuk
fraksi, penilaian jelas perlu mencakup tugas yang mengukur pemahaman
konseptual siswa tentang fraksi dan kemampuan mereka untuk menerapkan
fraksi dalam situasi masalah baru. Untuk memastikan dimasukkannya tugas-
tugas tersebut, memahami konsep dan aplikasi fraksi harus dimasukkan
dalam tabel spesifikasi. Meskipun spesifikasi pada Tabel 6.3 mungkin cocok
untuk satu segmen pembelajaran, spesifikasi yang mirip dengan yang ada
pada Tabel 6.4 mungkin lebih sesuai pada tahap pembelajaran lainnya.
Karena Tabel 6.4 dinyatakan dalam persentase poin yang terkait dengan
setiap kombinasi tujuan dan area konten, keputusan perlu dibuat tentang
jumlah total poin. Karena poin harus diperoleh dari kombinasi tes kelas dan
satu set tugas penilaian kinerja, spesifikasi tambahan juga akan diperlukan
untuk mengalokasikan poin ke berbagai sumber informasi. Tugas penilaian
kinerja tunggal yang melibatkan hubungan antara desimal dan pecahan,
misalnya, mungkin dinilai pada skala 5 poin. Dengan asumsi total.

Tabel 6.4
Tabel spesifikasi untuk pecahan dan desimal yang menunjukkan persentase target
poin dari kombinasi tes kelas dan satu set tugas penilaian kinerja.
Tujuan Pembelajaranonal
Total
Area Konten Keterampilan Memahami Aplikasi Persentase
Prosedural
Poin
Pecahan sederhana 5 10 5 20
Angka campuran 5 15 10 30
Desimal 5 10 5 20
Hubungan 10 10 10 30
pecahan
desimal
Total persentase poin 25 45 30 100
Tabel 6.5
Daftar keterampilan membaca pemahaman dan jumlah item untuk setiap
keterampilan khusus
Kemampuan membaca Jumlah item
Identifikasi perincian yang dinyatakan dalam satu bagian 10
Identifikasi gagasan utama suatu bagian 10
mengidentifikasi urutan tindakan atau peristiwa 10
Identifikasi hubungan yang diungkapkan dalam suatu bagian 10
Jumlah total 50 .

100 poin, tugas itu akan mewakili setengah dari total target 10 poin untuk sel
itu. 5 poin lainnya kemudian dapat dialokasikan untuk lima item tes jawaban
singkat.
Menggunakan Sistem Klasifikasi Satu Arah
Untuk pengujian di beberapa area, hanya diperlukan klasifikasi satu arah
untuk semua item. Dalam merencanakan tes membaca, misalnya, daftar
keterampilan membaca dan jumlah item tes untuk mengukur setiap
keterampilan mungkin cukup untuk menentukan tes apa yang diukur. Konten
(mis., Bacaan yang dibaca) dapat bervariasi dari waktu ke waktu, tetapi hasil
keterampilan tetap cukup konstan. Dengan demikian, daftar keterampilan
utama dapat disiapkan untuk digunakan dengan berbagai jenis bahan bacaan.
Contoh dari daftar tersebut disajikan pada Tabel 6.5.
Perlu dicatat bahwa setiap keterampilan dalam Tabel 6.5 dinyatakan
dalam istilah kinerja spesifik dan 10 item digunakan untuk mengukur setiap
keterampilan. Ini memberikan interpretasi yang mengacu pada kriteria.
Meskipun item yang akan dibaca tidak termasuk dalam spesifikasi, item itu
tentu saja harus dipilih dengan cermat dalam hal minat dan tingkat
keterbacaan. Lihat kotak "Daftar Periksa"

17
DAFTAR PERIKSA
Meninjau Spesifikasi untuk Tes dan Penilaian
Iya Tidak
1. Apakah spesifikasinya selaras dengan tujuan
pengujian atau penilaian
2. Apakah spesifikasi menunjukkan sifat dan batasan
domain prestasi?
3. Apakah spesifikasi menunjukkan jenis hasil
pembelajaran yang akan diukur?
4. Apakah spesifikasi menunjukkan sampel hasil
pembelajaran yang akan diukur?
5. Apakah jumlah item tes tugas penilaian
ditunjukkan untuk setiap subdivisi?
6. Apakah jenis barang dan tugas yang digunakan
sesuai untuk hasil yang akan diukur?
7. Apakah distribusi barang dan tugas memadai untuk
jenis interpretasi yang akan dibuat?
8. Jika item sampel atau tugas dimasukkan, apakah
mereka menggambarkan atribut yang diinginkan?
9. Apakah spesifikasi, secara keseluruhan,
menunjukkan sampel representatif dari tugas yang
relevan secara pembelajaranonal yang sesuai
dengan penggunaan yang akan dibuat dari hasil?

MEMILIH JENIS-JENIS ITEM DAN TUGAS PENILAIAN YANG TEPAT


Merupakan hal yang umum untuk membuat perbedaan antara tes kelas yang
terdiri dari item tes objektif dan penilaian kinerja yang mengharuskan siswa untuk
membuat tanggapan (mis., Menulis esai) atau melakukan tugas tertentu (mis.,
Mengukur tekanan udara). Item tes objektif sangat terstruktur dan mengharuskan
siswa untuk memberikan satu atau dua kata atau untuk memilih jawaban yang
benar dari alternatif. Mereka disebut obyektif karena mereka memiliki hak tunggal
atau jawaban terbaik yang dapat ditentukan sebelumnya. Tugas penilaian kinerja,
seperti pertanyaan esai, memungkinkan siswa untuk mengatur dan menyusun
jawaban dalam bentuk esai. Jenis lain dari tugas penilaian kinerja mungkin
mengharuskan siswa untuk menggunakan peralatan, menghasilkan hipotesis,
membuat pengamatan, membuat sesuatu (misalnya, model), atau melakukan untuk
audiensi (mis., Memberikan pidato). Untuk sebagian besar tugas penilaian kinerja,
tidak ada hak tunggal atau respons terbaik di sana mungkin berbagai tanggapan
yang dianggap sangat baik. Identifikasi masalah dapat, pada kenyataannya,
menjadi bagian penting dari tugas, dan tentu saja, mungkin ada beberapa cara
untuk menyusun masalah dan mengatur respons. Diperlukan penilaian ahli untuk
menilai kinerja. Tidak ada konflik antara item objektif yang sangat terbatas ini dan
tugas penilaian kinerja yang jauh lebih sedikit dibatasi. Untuk beberapa tujuan
pengajaran, item objektif mungkin paling efisien, sedangkan untuk yang lain,
penilaian kinerja mungkin terbukti paling memuaskan. Setiap pendekatan harus
digunakan di mana yang paling sesuai, dengan kesesuaian ditentukan oleh hasil
pembelajaran yang akan diukur dan oleh kelebihan dan keterbatasan masing-
masing pendekatan.

Item Tes Objektif


Berbagai bentuk dan penggunaan item obyektif dibahas secara lebih rinci dalam
Bab 7 hingga 9. Di sini kami hanya memberikan tinjauan singkat.
Berbagai macam jenis item tes objektif dapat diklasifikasikan ke dalam item
yang mengharuskan siswa untuk memberikan jawaban dan item yang
mengharuskan siswa untuk memilih jawaban dari sejumlah alternatif yang
diberikan. Dua kelas umum ini umumnya dibagi menjadi tipe dasar dari item tes
objektif, diilustrasikan dalam contoh yang menyertainya.
CONTOH : JENIS PENAWARAN
Jawaban Singkat
Apa nama penulis Moby Dick? (herman Melville)
Apa rumus untuk asam klorida? (HCl)
Berapa nilai X dalam persamaan 2X + 5 = 9? (2)
Penyelesaian
Garis-garis pada peta cuaca yang menghubungkan titik-titik dengan
tekanan barometrik yang sama disebut (isobars)
Formula untuk garam meja biasa adalah ........ (NaCl)
Dalam persamaan 2X + 5 = 9, X = ........... (2)

JENIS SELEKSI

19
Sesuai
(C) 1. Dan A. Kata sifat
(D) 2. Anjing B. Kata kerja
(G) 3. Lompat C. Konjuksi
(F) 4. Dia D. Kata benda
(B) 5. Dengan cepat E. Preposisi
F. Kata ganti
G. Kata kerja
Benar salah
T F Dan virus adalah organisme terkecil yang diketahui
T F Atom adalah partikel terkecil dari materi
iya Tidak Dalam persamaan 2X + 5 = 9; Xequals 3.
iya Tidak Asam mengubah kertas lakmus menjadi merah.
Pilihan Ganda
Dalam persamaan 2X + 5 = 9, 2X berarti
A. 2 ditambah X.
B. 2 dikurangi X.
C. 2 dibagi dengan X.
D. 2 dikalikan dengan X.
Di manakah dari kalimat berikut yang tidak disetujui subjek dan kata kerja?
A. Ketika mereka menang, mereka bahagia.
B. Politik sulit dipahami.
C. Mayoritas selalu benar.
D. Satu atau yang lainnya harus dipilih

Selain jenis dasar dari item tes objektif ada banyak modifikasi dan kombinasi
jenis. Namun, sedikit yang bisa diperoleh dari daftar semua variasi yang mungkin,
karena banyak yang unik untuk tujuan tertentu atau bidang materi pelajaran.
Beberapa variasi yang lebih umum digunakan untuk mengukur pemahaman,
keterampilan berpikir, dan hasil pembelajaran kompleks lainnya diilustrasikan
kemudian. Pemahaman tentang prinsip-prinsip konstruksi tes dan prinsip-prinsip
yang berlaku untuk masing-masing jenis item tes objektif harus memungkinkan
guru untuk membuat adaptasi yang paling sesuai dengan tujuan khusus mereka.
Berbagai jenis item tes objektif memiliki satu fitur yang sama yang
membedakan mereka dari tugas penilaian kinerja: Mereka menyajikan siswa
dengan tugas yang sangat terstruktur yang membatasi jenis respons yang dapat
mereka buat. Untuk mendapatkan jawaban yang benar, siswa harus menunjukkan
pengetahuan, pemahaman, atau keterampilan khusus yang disebut dalam item;
mereka tidak bebas mendefinisikan-ulang masalah atau mengatur dan menyajikan
jawaban dengan kata-kata mereka sendiri. Mereka harus memilih salah satu dari
beberapa jawaban alternatif atau memberikan kata, angka, atau simbol yang benar.
Penataan masalah dan pembatasan metode merespons ini berkontribusi pada
penilaian obyektif yang cepat, mudah, dan akurat. Di sisi negatif, penataan yang
sama ini membuat item tes objektif tidak sesuai untuk mengukur kemampuan
untuk merumuskan masalah dan memilih pendekatan untuk menyelesaikannya
atau kemampuan untuk memilih, mengatur, dan mengintegrasikan ide-ide. Untuk
mengukur hasil seperti itu, kita harus bergantung pada tugas penilaian kinerja.
Tugas penilaian kinerja juga diperlukan untuk mengukur kemampuan siswa untuk
terlibat dalam kegiatan langsung, seperti melakukan percobaan, mengukur curah
hujan, merancang dan melakukan survei, atau membuat objek seni.
Karena esai tertulis adalah bentuk tugas penilaian kinerja yang paling umum
digunakan, ada baiknya berfokus pada pertanyaan esai sebelum
mempertimbangkan jenis tugas penilaian kinerja lainnya. Pertanyaan esai
umumnya dipandang sebagai satu jenis item. Akan tetapi, klasifikasi yang
bermanfaat adalah klasifikasi yang didasarkan pada jumlah kebebasan respons
yang diizinkan oleh siswa. Ini termasuk pertanyaan esai respons panjang, di mana
siswa diberikan kebebasan hampir lengkap dalam membuat tanggapan mereka, dan
pertanyaan esai respons terbatas, di mana sifat, panjang, atau organisasi respons
terbatas. Jenis pertanyaan esai ini diilustrasikan sebagai berikut:
CONTOH : PERTANYAAN ESSAY RESPONS PANJANG
Jelaskan menurut Anda apa peran pemerintah federal dalam
memelihara ekonomi yang stabil di Amerika Serikat. Masukkan

21
kebijakan dan program spesifik dan berikan alasan untuk proposal
Anda.
Jelaskan bagaimana awan terbentuk dan bagaimana mereka
mempengaruhi cuaca dan iklim.
Memprediksi dampak kenaikan suku bunga terhadap konsumen,
produsen, dan investor. Sertakan penjelasan tentang bagaimana
prediksi Anda mengikuti dari prinsip ekonomi mendasar.

PERTANYAAN ESSAY RESPONS TERBATAS


Nyatakan dua keunggulan dan dua kelemahan mempertahankan tarif
tinggi untuk barang-barang dari negara lain.
Sebutkan dua jenis awan dan jelaskan karakteristik yang
membedakannya.
Persentase tenaga kerja yang menganggur meningkat mengikuti
kenaikan suku bunga. Jelaskan hubungan itu secara singkat.

Pertanyaan-pertanyaan esai respon panjang memungkinkan siswa untuk


memutuskan fakta mana yang menurut mereka paling relevan, untuk
memilih metode organisasi mereka sendiri, dan untuk menulis sebanyak
yang diperlukan untuk jawaban yang komprehensif. Dengan demikian,
pertanyaan-pertanyaan semacam itu cenderung mengungkapkan
kemampuan untuk mengevaluasi ide, menghubungkannya secara koheren,
dan mengekspresikannya secara ringkas. Pada tingkat lebih rendah, mereka
juga mencerminkan perbedaan individu dalam sikap, nilai, dan kemampuan
kreatif.
Meskipun pertanyaan esai yang diperluas sangat berharga untuk
mengukur keterampilan yang kompleks dan pemahaman konsep dan prinsip,
mereka memiliki tiga kelemahan: (1) Mereka tidak mampu mengukur
pengetahuan materi faktual karena pertanyaannya sangat luas sehingga
hanya sedikit sampel konten yang dapat dimasukkan dalam salah satu
penilaian; (2) kriteria penilaian tidak jelas bagi siswa karena tidak terdaftar
dengan item; dan (3) penilaian sulit dan cenderung tidak dapat diandalkan
karena tanggapannya mencakup serangkaian informasi faktual dari berbagai
tingkat kebenaran, diorganisasikan dengan berbagai tingkat koherensi, dan
dinyatakan dengan berbagai tingkat keterbacaan dan keringkasan. Oleh
karena itu, pertanyaan esai yang diperluas paling baik digunakan untuk
menilai tujuan kognitif yang lebih kompleks yang melibatkan aplikasi,
evaluasi, atau kemampuan untuk mengekspresikan ide dengan cara yang
koheren dan persuasif.
Pertanyaan esai respons terbatas meminimalkan beberapa kelemahan
dari pertanyaan esai respons panjang. Membatasi jenis respons membuatnya
lebih mudah untuk mengukur pengetahuan materi faktual, membuat skor
lebih jelas bagi siswa, dan mengurangi kesulitan penilaian. Di sisi lain, tugas
yang lebih terstruktur yang disajikan oleh pertanyaan-pertanyaan esai respon
terbatas membuatnya kurang efektif sebagai ukuran kemampuan untuk
memilih, mengatur, dan mengintegrasikan ide-ide. Selain itu, jika
batasannya menjadi terlalu ketat, pertanyaan berkurang menjadi tidak lebih
dari item jenis persediaan.
Baik pertanyaan esai tanggapan panjang maupun pertanyaan esai
respons terbatas dapat melayani semua tujuan secara setara. Jenis pertanyaan
esai untuk digunakan dalam situasi tertentu tergantung terutama pada hasil
pembelajaran yang akan diukur dan, pada tingkat lebih rendah, pada
pertimbangan praktis seperti kesulitan penilaian.
Jenis Penilaian Kinerja Lainnya
Ada banyak jenis tugas penilaian kinerja lainnya. Contohnya termasuk
presentasi oral; konstruksi grafik, diagram, atau model; penggunaan
peralatan atau instrumen ilmiah; mengetik; dan memainkan alat musik.
Tugas dipilih sehingga kinerja sesuai dengan tujuan pembelajaran yang
penting.
Perbedaan dapat dibuat antara tugas kinerja respons terbatas dan tugas
kinerja respons diperluas. Jenis-jenis ini diilustrasikan sebagai berikut:

23
CONTOH : TUGAS KINERJA RESPONS YANG DIPERPANJANG
Siapkan laporan cuaca untuk keadaan lain dan buat presentasi
lisan atau laporan ke kelas menggunakan tampilan visual yang
sesuai.
Ambil empat lembar kertas berbeda warna yang masing-masing
panjangnya 6 inci. Potong strip putih menjadi dua bagian
dengan panjang yang sama, strip kuning menjadi tiga bagian
dengan panjang yang sama, strip hijau menjadi empat bagian
dengan panjang yang sama, dan strip biru menjadi enam
bagian dengan panjang yang sama. Bandingkan panjang
ketika berbagai potongan strip disatukan (mis., Dua potong
strip kuning dibandingkan dengan tiga potong strip biru) dan
jelaskan hubungan antara fraksi yang sesuai (mis., 2/3 dan
3/6).
TUGAS KINERJA RESPONS YANG DIBATASI
Ukur dan catat kelembaban relatif.
Ambil beberapa lembar kertas 1 inci persegi untuk digunakan.
Dengan asumsi setiap kotak mewakili fraksi 1/4, buat
keseluruhan. (Dapat diulang menggunakan fraksi yang
berbeda).

Keutamaan dan keterbatasan tugas kinerja respons diperpanjang dan


terbatas sama dengan yang terdaftar untuk pertanyaan esai respons
diperpanjang dan terbatas. Kebebasan yang diberikan oleh tugas kinerja
respon-diperpanjang memungkinkan siswa untuk menampilkan
keterampilan penting seperti pemecahan masalah, perencanaan, organisasi,
integrasi, dan kreativitas. Pertanyaan jenis ini juga memberikan kesempatan
untuk mengamati kinerja siswa dalam konteks yang lebih realistis daripada
yang mungkin dengan item tes objektif. Di sisi lain, mereka butuh waktu
untuk mengelola dan sulit untuk mencetak gol
Tugas kinerja respons terbatas biasanya lebih mudah untuk dinilai dan
membutuhkan lebih sedikit waktu daripada tugas kinerja respons panjang.
Namun, mereka umumnya kurang cocok untuk mengukur keterampilan
tingkat tinggi yang diukur dengan tugas kinerja respons yang diperpanjang.

Keunggulan Komparatif Item Tes Objektif dan Tugas Penilaian Kinerja


Baik item tes objektif dan tugas penilaian kinerja dapat memberikan bukti
berharga tentang prestasi siswa. Masing-masing memiliki kelebihan dan
keterbatasan yang membuatnya lebih sesuai untuk beberapa tujuan dari pada
untuk yang lain. Perbandingan nilai relatif dari tes item objektif dan penilaian
kinerja disajikan pada Tabel 6.6. Dalam mempertimbangkan keunggulan
komparatif dari tes objektif-item dan penilaian kinerja, kita harus berhati-
hati untuk tidak jatuh ke dalam salah satu atau berpikir untuk menggunakan
salah satu item obyektif atau tugas penilaian kinerja. Seringkali lebih baik
untuk menggunakan keduanya, dengan masing-masing mengukur hasil
pembelajaran partikel yang paling cocok. Ini juga harus memiliki pengaruh
yang diinginkan pada pembelajaran siswa karena dalam mempersiapkan tes
tersebut siswa harus memperhatikan jenis spesifik hasil belajar yang diukur
dengan item objektif serta sintesis dan hasil kinerja terintegrasi yang diukur
dengan tugas penilaian kinerja.

Memilih Jenis Item dan Tugas yang Paling Tepat


Prinsip dasar dalam memilih jenis item tes dan tugas penilaian untuk
digunakan adalah memilih jenis Item yang memberikan ukuran paling
langsung dari hasil pembelajaran yang diinginkan. Jika, misalnya, hasil
pembelajaran yang dimaksud adalah menulis, memberi nama, mendaftar,
atau berbicara, tugas tersebut harus mengharuskan siswa untuk menyediakan
Jawaban jika hasilnya melibatkan penggunaan peralatan laboratorium untuk
menyelesaikan masalah, tidak ada kekurangan aktual tugas kinerja
laboratorium akan cukup. Di sisi lain, jika tugas meminta idntifikasi jawaban

25
yang benar, item jenis seleksi harus digunakan. Dalam kasus-kasus di mana
hasil pembelajaran spesifik tidak memperjelas jenis item yang akan
digunakan, item-item tipe seleksi akan disukai karena kontrol yang lebih
besar atas respons siswa dan objektifitas penilaian. Namun, hasil
pembelajaran yang dimaksud mungkin juga membutuhkan item yang lebih
kompleks atau ukuran kinerja langsung. Barang-barang berikut disiapkan
untuk unit cuaca yang dibahas sebelumnya. Perhatikan bagaimana setiap
jenis item objektif memberikan ukuran langsung dari hasil yang dirancang
untuk diukur.
CONTOH: SOAL JAWABAN SINGKAT
Hasil Pembelajaran Khusus: Menulis definisi setiap istilah.
Petunjuk : Tulis definisi satu kalimat dari masing-masing istilah
berikut.
1. Cuaca
2. Kelembaban
3. Terlibat depan
Hasil Pembelajaran Khusus: Menamai instrumen yang digunakan
untuk mengukur setiap elemen cuaca.
1. Instrumen yang digunakan untuk mengukur jumlah curah hujan di
suatu daerah tertentu disebut a (an)________
Hasil Pembelajaran Khusus: Daftar karakteristik dari fenomena cuaca
yang diberikan.
1. Sebutkan tiga karakteristik utama badai.
Hasil Pembelajaran Khusus: Mengukur kelembaban relatif.
1. Gunakan instrumen yang sesuai untuk mengukur kelembaban relatif
dan catat nilai yang diperoleh.

Tabel 6.6
Keunggulan komparatif dari tes objektif dan penilaian kinerja

Tes Objektif Penilaian Kinerja


Pengukuran hasil Efisien untuk mengukur Dapat mengukur pemahaman,
belajar pengetahuan fakta. Beberapa jenis keterampilan berpikir, dan
(mis., Banyak hasil pembelajaran kompleks
pilihan) juga dapat mengukur lainnya (terutama berguna
pemahaman, keterampilan berpikir, jika orisinalitas respons
dan hasil kompleks lainnya diinginkan).

Tidak efisien atau tidak sesuai Cocok untuk mengukur


untuk mengukur kemampuan untuk kinerja pada tugas yang
memilih dan mengatur ide, sesuai dengan tujuan
kemampuan menulis, dan beberapa pembelajaran yang penting
jenis keterampilan pemecahan dalam konteks yang realistis.
masalah Tidak efisien untuk mengukur
pengetahuan
Fakta

Persiapan Sejumlah besar pertanyaan Hanya beberapa tugas yang


pertanyaan diperlukan untuk ujian diperlukan untuk penilaian

Persiapannya sulit dan memakan


waktu

Pengambilan Memberikan sampel konten Pengambilan sampel tentu


sampel tentu saja pelajaran yang luas karena saja konten biasanya terbatas
konten banyaknya pertanyaan yang dapat karena sejumlah kecil tugas
dimasukkan dalam tes yang dapat dimasukkan
dalam penilaian

Respon kontrol Penataan lengkap tugas membatasi Kebebasan merespons dengan


siswa siswa untuk jenis respons yang cara sendiri memungkinkan
diminta. Mencegah gertak sambal siswa untuk menampilkan
dan menghindari pengaruh orisinalitas, dan menebak
keterampilan menulis, meskipun dapat diminimalkan
item jenis seleksi dapat ditebak.

Pengaruh Penilaian objektif. Penilaian penilaian.


penilaian pada Biasanya mendorong siswa untuk Mendorong siswa untuk
pembelajaran mengembangkan yang berkonsentrasi pada unit
komprehensif materi pelajaran yang lebih
pengetahuan tentang fakta spesifik besar, dengan penekanan
dan kemampuan untuk membuat khusus pada kemampuan
diskriminasi yang baik di antara untuk mengatur,
mereka. Dapat mendorong mengintegrasikan, dan
pengembangan pemahaman, mengekspresikan ide secara
keterampilan berpikir, dan hasil efektif.

27
kompleks lainnya jika dibuat
dengan benar.

Reliabilititas Keandalan yang tinggi Keandalan biasanya rendah,


dimungkinkan dan biasanya terutama karena sampel tugas
diperoleh dengan tes yang dibuat yang terbatas dan penilaian
dengan baik. yang tidak konsisten

ITEM PILIHAN GANDA


Hasil Pembelajaran Khusus: Mengidentifikasi unit pengukuran yang
digunakan dalam melaporkan setiap elemen cuaca pada peta cuaca.
Peta cuaca Amerika Serikat menunjukkan tekanan udara masuk
A. Satu inci
B. Kaki
C. Pound
D. Millibar
ITEM BENAR —SALAH
Hasil Pembelajaran Khusus: Membedakan antara prosedur yang benar dan
salah untuk menentukan setiap elemen cuaca.
T F 1. Titik embun ditentukan dengan mendinginkan sampel
udara sampai bebas dari kelembaban.
T F 2. Langit-langit ditentukan dengan menggunakan balon itu
naik pada tingkat yang diketahui.
ITEM MENCOCOKAN
Hasil Belajar Khusus: Cocokkan setiap instrumen cuaca dengan elemen
cuaca yang diukurnya.
Petunjuk: Pada baris di sebelah kiri setiap elemen cuaca di Kolom A, tulis
huruf instrumen cuaca di Kolom B yang digunakan untuk mengukurnya.
Setiap instrumen dalam Kolom B dapat digunakan sekali, lebih dari sekali,
atau tidak sama sekali.
Kolom A Kolom B
(B) 1. Tekanan udara A. Anemometer
(E) 2. Suhu udara B. Barometer
(C) 3. Kelembaban C. Hygrometer
(A)Kecepatan angin D. Pengukur hujan
E.Termometer
F. Baling-baling angin
TUGAS KINERJA
Hasil Pembelajaran Khusus: Mengukur dan mencatat perubahan tekanan
udara.
Petunjuk: Mengukur tekanan udara pada 5 hari berturut-turut pada waktu
yang bersamaan dan membuat grafik untuk melihat perubahannya. Jelaskan
alasan perubahan yang terjadi.

Dalam memutuskan item jenis seleksi mana yang akan digunakan, praktik
umum adalah menggunakan item pilihan ganda jika akan mengukur hasil belajar
secara langsung seperti dua jenis lainnya. Penggunaan item benar salah biasanya
paling berharga dalam kasus khusus di mana hanya ada dua alternatif yang
mungkin (mis., Membedakan antara prosedur yang benar dan yang salah). Item
yang cocok adalah bentuk khusus dari item pilihan ganda dan harus digunakan
hanya jika serangkaian hal-hal yang homogen terkait (mis., Tanggal dan acara,
penulis dan buku, atau instrumen dan penggunaan). Item pilihan ganda lebih
disukai untuk sebagian besar tugas tipe seleksi lainnya karena penggunaan empat
atau lima alternatif mengurangi kemungkinan menebak jawaban dan
memberikan petunjuk bagi kesalahpahaman siswa. Lihat Lampiran G untuk
contoh-contoh lain tentang bagaimana menghubungkan item-item tes dengan
hasil pembelajaran yang diinginkan
Apakah item tes atau tugas penilaian benar-benar mengukur kinerja tertentu
yang diminta oleh hasil pembelajaran tertentu, tentu saja, sebagian besar
tergantung pada keterampilan yang digunakan untuk menguji item tes atau tugas
penilaian. Namun, tidak ada jumlah keterampilan yang memungkinkan kami
untuk mengembangkan tes atau penilaian pencapaian yang valid jika item atau
tugas yang dipilih untuk digunakan tidak sesuai untuk mengukur hasil yang
diinginkan.

29
PERTIMBANGAN DALAM MENYIAPKAN ITEM TES RELEVAN DAN
TUGAS PENILAIAN
Pembuatan item dan tugas harus didahului dengan serangkaian langkah awal.
Pertama, tujuan tes atau penilaian harus ditentukan. Kedua, seperangkat spesifikasi
harus dikembangkan. Ketiga, jenis item tes yang paling tepat dan tugas penilaian
kinerja harus dipilih. Akhirnya, item dan tugas harus dibuat sesuai dengan
spesifikasi yang dikembangkan selama langkah sebelumnya. Aturan untuk
membuat setiap jenis item objektif dibahas dalam Bab 7 hingga 9, dan aturan untuk
membuat penilaian kinerja dibahas dalam Bab 10 dan 11. Di sini kami fokus pada
pertimbangan umum yang terlibat dalam menyiapkan item tujuan yang relevan dan
tugas penilaian.
Mencocokkan Item dan Tugas dengan Hasil yang Dimaksudkan
Tes dan penilaian di kelas mungkin memberikan ukuran yang valid dari
tujuan pembelajaran jika item tes dan tugas penilaian dirancang untuk
mengukur kinerja yang ditentukan oleh hasil pembelajaran tertentu. Proses
mencocokkan item tes dan tugas penilaian dengan hasil pembelajaran yang
akan diukur diilustrasikan sebelumnya. Pada dasarnya, ini melibatkan
pemasangan setiap item atau tugas sedekat mungkin dengan hasil yang
diinginkan, sebagai berikut:
CONTOH :
Hasil Pembelajaran Khusus: Mengidentifikasi fungsi struktur tubuh tertentu.
Item Uji yang relevan:
Apa fungsi dari ginjal?
A. Menghilangkan produk limbah
B. Meningkatkan sirkulasi darah
C. Pertahankan pernapasan
D. Merangsang pencernaan
Dengan demikian, persiapan item tes yang relevan dan tugas penilaian
berarti menganalisis kinerja yang dijelaskan dalam hasil pembelajaran
khusus (yaitu, "Identifikasi fungsi ...") dan membuat item tes atau tugas
penilaian yang menghasilkan kinerja itu ( yaitu, "Apa fungsi dari ...?").
Perhatikan bahwa hasil pembelajaran spesifik mendefinisikan jenis respons
yang diharapkan dari siswa, tetapi itu tidak menunjukkan konten pelajaran
yang spesifik (yaitu, ginjal) yang harus diidentifikasi oleh siswa. Menjaga
hasil belajar bebas dari isi pelajaran tertentu memungkinkan untuk tanggapan
kunci yang dimaksudkan untuk berbagai bidang konten. Sebagai contoh,
siswa dapat diminta untuk mengidentifikasi fungsi jantung, paru-paru, otot,
atau struktur tubuh lainnya yang berkaitan dengan isi pelajaran. Kinerja
siswa yang diinginkan dinyatakan dalam hasil belajar spesifik dapat dikunci
untuk setiap area konten tertentu melalui tabel spesifikasi.
Dalam beberapa kasus, mungkin diinginkan untuk menyiapkan pola
item umum sebagai langkah perantara antara hasil pembelajaran spesifik dan
item tes. Pola item umum untuk item tes ilustratif kami adalah sebagai
berikut:
CONTOH: Apa fungsi dari ...?
Pola item seperti ini dapat diselesaikan dengan menambahkan nama
struktur tubuh apa pun dan menggunakannya sebagai pertanyaan jawaban
pendek atau dengan mendaftar alternatif yang sesuai dan menggunakan item
pilihan ganda. Dengan demikian, dengan menggunakan pola item sebagai
panduan, kita dapat menghasilkan sejumlah besar item tes yang relevan
untuk hasil pembelajaran khusus ini. Prosedur ini sangat berguna ketika file
item tes sedang dipersiapkan atau ketika lebih dari satu bentuk tes diperlukan
(mis., Pretesting, posttesting, dan pengujian ulang).
Ketika pola item digunakan sebagai panduan untuk menguji konstruksi,
mereka dapat diatur oleh tipe umum hasil pembelajaran.
CONTOH: Hasil Pengetahuan
1. Apa nama dari ...?
2. Apa lokasi ...?
3. Apa karakteristik dari ...?
4. Apa fungsi dari ...?
Memahami Hasil
1. Apa alasan untuk ...?

31
2. Apa hubungan antara ...?
3. Manakah dari ini adalah contoh dari ...?
4. Manakah dari rangkuman terbaik ini ...?
Hasil Aplikasi
1. Metode apa yang terbaik untuk ...?
2. Langkah apa yang harus diikuti untuk membuat ...?
3. Manakah dari ini menunjukkan aplikasi yang benar dari ..
4. Manakah dari solusi ini yang benar untuk ...?

Pola item seperti ini seharusnya tidak tentu saja, dikembangkan secara
sembarangan. Sebaliknya, mereka harus diturunkan dari hasil belajar
spesifik yang mereka wakili. Meskipun biasanya tidak akan mungkin untuk
mengembangkan pola item untuk semua hasil, daftar mereka akan membantu
menghasilkan kumpulan item tes yang relevan. Waktu konstruksi uji
disimpan dengan menggunakan daftar A tersebut kemudian dapat digunakan
untuk membuat item yang lebih efektif untuk area-area di mana pola item
umum tidak layak.
Mendapatkan Sampel refresentatif dari item dan Tugas
Suatu tes atau penilaian, tidak peduli seberapa luasnya, hampir selalu
merupakan sampel dari banyak item tes atau tugas yang mungkin dapat
dimasukkan. Kami berharap siswa mengetahui ribuan fakta, tetapi kami
hanya dapat menguji untuk sejumlah fakta; kami berharap siswa
mengembangkan pemahaman yang berlaku untuk situasi yang tak terhitung
banyaknya, tetapi kami dapat menguji aplikasi hanya dalam sejumlah situasi;
dan kami berharap siswa untuk mengembangkan keterampilan berpikir yang
akan memungkinkan mereka untuk memecahkan berbagai masalah, tetapi
kami dapat menguji kemampuan pemecahan masalah mereka dengan hanya
sejumlah masalah. Dalam setiap bidang konten dan untuk setiap hasil
pembelajaran tertentu, maka, kami hanya memilih sampel kinerja siswa dan
menerimanya sebagai bukti prestasi di bidang itu. Kami berasumsi bahwa
respons siswa terhadap serangkaian item dan tugas yang dipilih adalah
tipikal dari respons mereka terhadap item dan tugas lain yang diambil dari
area yang sama. Ini berarti, tentu saja, bahwa sampel terbatas kami harus
dipilih sedemikian rupa sehingga mereka memberikan sampel yang
representatif mungkin di masing-masing dari berbagai bidang di mana tes
atau penilaian sedang dikembangkan
Sampel kami kemungkinan besar akan representatif ketika persiapan tes
atau penilaian dipandu oleh serangkaian spesifikasi yang disiapkan dengan
cermat. Kecuali jika tabel spesifikasi atau perangkat serupa digunakan
sebagai panduan dalam konstruksi, ada kecenderungan untuk membebani tes
dengan item-item yang mengukur pengetahuan tentang fakta-fakta yang
terisolasi dan mengabaikan hasil belajar yang lebih kompleks. Dalam studi
sosial, misalnya, tidak jarang untuk memasukkan sejumlah besar item yang
tidak proporsional yang mengukur pengetahuan nama, tanggal, tempat, dan
sejenisnya. Dalam ilmu pengetahuan, mendefinisikan istilah dan struktur
penamaan dan fungsi biasanya terlalu ditekankan. Dalam matematika,
keterampilan komputasi seringkali merupakan satu-satunya hasil
pembelajaran yang diukur. Dalam seni bahasa dan sastra, identifikasi bagian-
bagian bahasa, karakter sastra, pengarang, dan sejenisnya seringkali terlalu
menonjol. Hasil pembelajaran ini ditekankan bukan karena kami berpikir
bahwa pengetahuan tentang fakta yang terisolasi lebih penting daripada
pemahaman, aplikasi, interpretasi, dan berbagai keterampilan berpikir.
Sebaliknya, mereka biasanya menerima keunggulan yang tidak semestinya
karena kami merasa lebih mudah untuk membuat item tes semacam ini.
Tanpa rencana pengujian yang dikembangkan dengan hati-hati, kemudahan
konstruksi terlalu sering menjadi kriteria dominan dalam membuat item tes.
Sebagai konsekuensinya, tes ini mengukur sampel tugas pembelajaran yang
terbatas dan bias dan mengabaikan banyak hasil pembelajaran yang lebih
penting.
Melengkapi pertanyaan tes objektif dengan tugas penilaian kinerja
adalah salah satu cara untuk memastikan bahwa tujuan pembelajaran yang
lebih luas diberikan perhatian yang tepat. Namun, tidak efisien untuk hanya
mengandalkan penilaian kinerja untuk mengukur pemahaman yang lebih

33
kompleks. Untuk alasan ini, penting untuk menemukan cara membuat item
tes objektif yang melakukan lebih dari mengukur pengetahuan faktual. Salah
satu pendekatan untuk tujuan ini mengukur pencapaian yang kompleks
adalah melalui penggunaan latihan interpretatif. Pendekatan ini dibahas
secara rinci dalam Bab 9.
Jumlah Item dan Tugas. Jumlah item dan tugas tentu saja merupakan faktor
penting dalam mendapatkan sampel yang representatif. Jumlah item dan
jumlah tugas kinerja ditentukan ketika set spesifikasi dibuat dan tergantung
pada faktor-faktor seperti tujuan pengukuran, jenis item tes dan tugas
penilaian yang digunakan, usia siswa, dan tingkat keandalan yang diperlukan
untuk penggunaan hasil tes atau penilaian secara efektif. Dengan demikian,
penilaian atas unit studi sosial kelas tiga mungkin berisi 50 item objektif,
sedangkan tes survei selama pelajaran studi sosial kelas 10 mungkin berisi
lebih dari 100 item objektif dan beberapa pertanyaan esai. Meskipun tidak
ada aturan keras dan cepat untuk menentukan jumlah item dan tugas,
pertimbangan penting dari sudut pandang pengambilan sampel adalah
jumlah item atau tugas yang dikhususkan untuk setiap area spesifik yang
sedang diukur. Kami ingin pengujian dan penilaian kami cukup lama untuk
memberikan sampel yang memadai untuk setiap tujuan dan setiap area
konten. Sebagai patokan, diinginkan ketika membuat unit test untuk
menggunakan setidaknya 10 item tes objektif untuk mengukur setiap hasil
pembelajaran tertentu. Namun, angka ini dapat diturunkan menjadi
sedikitnya lima jika tugasnya sangat terbatas (misalnya, "Menambahkan dua
angka satu angka" atau "Memanfaatkan nama yang tepat") dan para siswa
harus memberikan jawaban dari pada memilihnya. Untuk tes survei, di mana
sampel item tes biasanya mencakup area yang luas dan penekanannya pada
skor total, menggunakan beberapa item tes objektif untuk setiap hasil
pembelajaran tertentu dan 10 atau lebih untuk setiap tujuan umum mungkin
akan cukup.
Masalah khusus pengambilan sampel muncul ketika hasil pembelajaran
yang kompleks sedang diukur, karena ini membutuhkan item tipe objektif
yang lebih rumit (disebut sebagai latihan interpretatif) dan tugas penilaian
kinerja. Baik latihan interpretatif dan tugas penilaian kinerja membutuhkan
waktu administrasi yang cukup besar, tetapi item tes tunggal atau tugas
penilaian masih tidak memadai untuk mengukur hasil yang diinginkan. Satu
latihan yang menyerukan penafsiran grafik, misalnya, tidak cukup untuk
mengukur kemampuan menafsirkan grafik secara memadai. Sifat data atau
jenis grafik dapat menjadi faktor yang paling berpengaruh dalam
menentukan apakah ditafsirkan dengan benar. Ketika beberapa grafik
digunakan, efek dari faktor-faktor tersebut diminimalkan, dan kami
memperoleh sampel yang lebih representatif dari kemampuan untuk
menafsirkan grafik.
Situasi serupa terjadi dengan penggunaan tugas penilaian kinerja.
Kinerja dari setiap tugas tunggal sangat bergantung pada sampel informasi
tertentu yang diminta oleh tugas, dan dengan demikian satu-satunya solusi
yang layak adalah membatasi setiap penilaian hasil yang kompleks ke area
yang agak terbatas (misalnya, interpretasi grafik atau pemecahan masalah)
dan menilai lebih sering. Dalam hal apa pun, tujuan kami harus memperoleh
sampel kinerja siswa yang representatif sebanyak mungkin di setiap bidang
yang akan dinilai. Hal-hal lain dianggap sama, semakin besar jumlah item
tes atau tugas penilaian, semakin besar kemungkinan sampel yang memadai
dan semakin dapat diandalkan hasilnya.
Menghilangkan Hambatan yang Tidak Relevan dengan Kinerja
Seperti yang telah dibahas dalam Bab 4, validitas penilaian dapat dirusak
oleh pengaruh faktor-faktor atau kemampuan yang tidak relevan dengan
konstruk yang mendukung maksud penilaian. Oleh karena itu, kehati-hatian
harus diambil ketika membuat item atau tugas penilaian untuk
menghilangkan faktor-faktor yang tidak relevan dengan konstruk yang dapat
mencegah siswa dari melakukan yang terbaik. Jika siswa telah mencapai
hasil belajar tertentu (mis., Pengetahuan tentang istilah), kami ingin mereka
menjawab dengan benar item tes yang mengukur pencapaian hasil belajar
tersebut. Kami akan sangat tidak bahagia (dan begitu juga mereka) jika

35
mereka menjawab tes seperti itu salah hanya karena struktur kalimatnya
terlalu kompleks, kosa kata terlalu sulit, atau jenis respons yang menyerukan
tidak jelas. Faktor-faktor ini, yang tidak sesuai dengan tujuan utama
pengukuran, membatasi dan memodifikasi respons siswa dan mencegah
mereka menunjukkan tingkat pencapaian mereka yang sebenarnya. Faktor-
faktor seperti itu tidak adil seperti menentukan kemampuan berlari seseorang
ketika pergelangan kaki terkilir. Meskipun ukuran kemampuan berlari akan
diperoleh, kinerja akan dibatasi oleh faktor yang tidak ingin kami sertakan
dalam pengukuran kami.
Salah satu cara untuk menghilangkan faktor-faktor yang tidak sesuai
dengan tujuan pengukuran adalah memastikan bahwa semua siswa memiliki
keterampilan dan kemampuan yang diperlukan untuk membuat respons. Ini
disebut perilaku yang memungkinkan karena memungkinkan siswa untuk
membuat respons tetapi tidak dimaksudkan sebagai faktor penting dalam
pengukuran. Artinya, mereka adalah kondisi yang diperlukan tetapi tidak
cukup untuk merespons dengan benar atau melakukan tugas dengan baik.
Mungkin perilaku yang paling penting dalam pengujian obyektif adalah
keterampilan membaca. Dalam penilaian kinerja tertulis, keterampilan
dalam ekspresi tertulis merupakan faktor tambahan yang harus
dipertimbangkan. Dalam mengukur pemahaman, keterampilan berpikir, dan
hasil pembelajaran kompleks lainnya, pengetahuan fakta-fakta tertentu dan
keterampilan komputasi sederhana juga mungkin merupakan prasyarat yang
diperlukan.
Maka, dalam menyusun tes dan penilaian, kita perlu mengupayakan hal-
hal dan tugas-tugas yang mengukur pencapaian hasil pembelajaran spesifik
dan bukan perbedaan dalam kemampuan tambahan. Perbedaan dalam
kemampuan membaca, keterampilan komputasi, keterampilan komunikasi,
dan sejenisnya tidak boleh memengaruhi respons siswa kecuali jika hasil
seperti itu secara khusus diukur. Satu-satunya perbedaan fungsional antara
siswa yang berprestasi pada tugas dan mereka yang berkinerja buruk harus
memiliki pengetahuan, pemahaman, atau hasil belajar lainnya yang diukur
oleh tugas tersebut. Semua perbedaan lainnya tidak sesuai dengan tujuan
tugas, dan pengaruhnya harus dihilangkan atau dikendalikan untuk hasil
yang valid.
Masalah khusus dalam mencegah faktor-faktor luar dari mendistorsi
pengujian dan hasil penilaian kami adalah menghindari ambiguitas. Item-
item tes objektif khususnya dapat disalahtafsirkan ketika kalimat-kalimat
yang panjang dan kompleks digunakan; ketika kosakata tidak perlu sulit; dan
ketika kata-kata yang tidak memiliki makna yang tepat digunakan. Dengan
demikian, dari sudut pandang tingkat kesulitan membaca dan ketepatan
makna, penangkal ambiguitas tampaknya menjadi pilihan kata yang cermat
dan penggunaan kalimat yang singkat dan ringkas. Dalam beberapa kasus,
ambiguitas dapat dikurangi dengan menggunakan gambar atau bahan
ilustrasi lainnya sebagai pengganti deskripsi verbal. Ketika ini dilakukan,
materi ilusif harus, tentu saja, juga diperiksa dengan cermat untuk
memastikan itu jelas dan tidak ambigu.
Kehati-hatian harus diambil untuk menghindari bias ras, etnis, atau
gender dalam mempersiapkan item tes dan tugas penilaian kinerja. Situasi
kosa kata dan tugas harus dapat diterima oleh berbagai kelompok ras dan
etnis dan untuk pria dan wanita dan harus bebas dari stereotip. Misalnya,
dalam menampilkan karakter dalam masalah cerita, bacaan, atau situasi ujian
lainnya, kaum minoritas tidak boleh digambarkan dengan cara stereotip.
Demikian pula, situasi tugas tidak harus selalu menempatkan laki-laki dalam
peran tradisional seperti atlet, eksekutif bisnis, dan orang profesional dan
perempuan dalam peran tradisional seperti pembuat rumah, guru, dan
perawat. Diperlukan penggunaan peran yang berbeda secara seimbang untuk
minoritas dan pria dan wanita jika kita ingin menghindari bias sebagai
penghalang yang mungkin untuk kinerja maksimum, lihat kotak “Pedoman”.
Menghindari Petunjuk yang Tidak Diinginkan dalam Item Tes Objektif
Item tes harus dibuat sehingga siswa memperoleh jawaban yang benar hanya
jika mereka telah mencapai hasil belajar yang diinginkan. Dalam prinsip
sebelumnya, kami prihatin dengan faktor-faktor yang mencegah siswa dari

37
merespon dengan benar meskipun mereka telah mencapai hasil belajar yang
diinginkan. Di sini kami prihatin dengan faktor-faktor yang memungkinkan
siswa untuk merespons dengan benar meskipun mereka tidak memiliki
prestasi yang diperlukan. Ini adalah petunjuk, beberapa agak jelas dan
beberapa sangat halus, yang secara tidak sengaja menyusup ke dalam benda
uji selama perbaikan. Mereka mengarahkan orang-orang yang berprestasi
miskin ke jawaban yang benar dan dengan demikian mencegah item-ietem
berfungsi sebagaimana dimaksud. Ketika item tes dihubung pendek dengan
cara ini, mereka memberikan bukti prestasi yang tidak valid. Perhatikan
bagaimana suatu memberikan petunjuk pada item berikut.

PANDUAN
Kemungkinan Hambatan dalam Item Tes dan Tugas Penilaian
 Pernyataan ambigu
 Kata yang berlebihan
 Kosa kata yang sulit
 Penyempitan kalimat yang rumit
 Petunjuk tidak jelas
 Materi ilustrasi tidak jelas
 Bias ras, etnis, atau gender

CONTOH : Tujuan adalah sebuah


A. Tanaman
B. Reftile
C. Hewan
D. Burung

Petunjuk seperti itu tidak terbatas pada item jenis pemilihan, seperti yang
ditunjukkan dalam item jenis persediaan berikut.
CONTOH : Sepotong tanah yang sepenuhnya dikelilingi oleh air dikenal
sebagai..

Petunjuk jauh lebih jelas bagi orang yang menyusun item tes ini daripada
petunjuk dalam ilustrasi pertama kami. Namun, bagi siswa yang mengikuti
ujian, itu sudah jelas. Dua jawaban yang paling masuk akal adalah pulau dan
semenanjung. Karena semenanjung dimulai dengan bunyi konsonan dan tidak
mengikuti artikel dan, itu dikesampingkan sebagai suatu kemungkinan. Ini
tidak berarti, tentu saja, bahwa siswa perlu mengetahui aturan untuk struktur
tata bahasa yang baik untuk menggunakan petunjuk; sebagian besar petunjuk
dianalisis dalam hal pengetahuan parsial dan firasat. Semenanjung tidak
terdengar benar bagi siswa, jadi kata island digunakan, dan jawaban yang
benar diperoleh.
Mengarah ke jawaban yang benar juga dapat diberikan oleh asosiasi
verbal sederhana. Perhatikan bagaimana kata wind pada item berikut
memberikan petunjuk untuk jawabannya.
CONTOH : Manakah dari instrumen berikut yang digunakan untuk
menentukan arah angin?
A. Nemometer
B. Barometer
C. Hygrometer
D. Baling-Baling Angin

Daripada mengarahkan orang yang kurang informasi ke jawaban yang


benar, petunjuk seperti itu seharusnya membuat orang miskin yang
berprestasi menjauh dari jawaban yang benar. Dalam item berikut, petunjuk
yang sama membuat baling-baling angin jawaban yang masuk akal (tetapi
salah) bagi siswa yang belum belajar penggunaan berbagai instrumen cuaca.
CONTOH : Manakah dari instrumen berikut yang digunakan untuk
menentukan kecepatan angin?
A. Anemometer
B. Barometer
C. Hygrometer
D. Baling-Baling Angin

Petunjuk verbal tidak perlu sejelas ini. Bahkan, petunjuk yang muncul
dalam versi akhir dari suatu tes biasanya agak halus, karena mereka
didasarkan pada pengetahuan parsial dan asosiasi verbal yang tidak mudah

39
terlihat oleh pengamat biasa. Misalnya, sekilas item berikut tampaknya bebas
dari petunjuk.

CONTOH : Manakah dari berikut ini yang digunakan untuk mencegah


polio?
A. Gamma globulin
B. Penisilin
C. Vaksin Salk
D. Sulfa

Akan tetapi, memeriksa item ini akan menunjukkan kata vaksin


memberikan petunjuk untuk menjawab. Semua siswa perlu tahu untuk
menjawab item dengan benar adalah vaksin yang digunakan untuk mencegah
penyakit. Karena sebagian besar siswa memiliki divaksinasi pada satu waktu
atau yang lain, mereka mungkin perlu pengetahuan parsial yang diperlukan
untuk membuat petunjuk itu jelas bagi mereka. Beberapa siswa juga
mungkin telah mengembangkan hubungan verbal antara Salk dan polio dan
merespons dengan benar atas dasar itu. Dalam kedua kasus, pengetahuan
parsial dapat menyebabkan jawaban yang benar dan mencegah item seperti
yang diharapkan.
Jenis petunjuk halus lainnya adalah yang didasarkan pada kata-kata yang
digunakan untuk memenuhi syarat pernyataan. Sebagai contoh, benar -
pernyataan salah yang mencakup kualifikasi seperti kadang-kadang,
biasanya, umumnya, dan sejenisnya paling sering benar, sedangkan
pernyataan yang mengandung absolut seperti selalu, tidak pernah, tidak ada,
dan hanya yang paling sering salah. Kata-kata seperti itu disebut penentu
spesifik. Mereka sulit untuk dihapus dari item salah benar karena pernyataan
benar umumnya harus memenuhi syarat, dan pernyataan palsu sering harus
dinyatakan dalam istilah absolut untuk membuat mereka jelas salah.
Petunjuk umum lainnya dalam item jenis seleksi meliputi (a)
menyatakan jawaban yang benar dalam bahasa buku teks atau lebih detail
daripada jawaban yang salah, (b) membuat jawaban yang benar lebih
panjang dari jawaban yang salah, dan (c) menempatkan jawaban yang benar
di beberapa yang dapat diidentifikasi pola (misalnya, T, F, T, F). Beberapa
petunjuk ini lebih mungkin terdeteksi oleh siswa berprestasi rendah yang
putus asa mencari beberapa dasar untuk menjawab. Lihat kotak "Garis
panduan"
PANDUAN
Petunjuk Umum Dalam Item Tes
 Inkonsistensi gramatikal
 Asosiasi verbal
 Penentu spesifik ( mis. Selalu )
 Frase tanggapan yang benar
 Panjang respons yang benar
 Lokasi tanggapan yang benar

Saran Umum untuk Menulis Item Tes dan Tugas Penilaian


Dalam menyiapkan serangkaian item pengujian atau tugas penilaian, aturan
umum berikut ini berlaku untuk semua jenis item atau tugas. Aturan khusus
untuk menulis setiap item atau jenis tugas dijelaskan dan diilustrasikan
dalam bab-bab berikut.
1. Gunakan spesifikasi tes dan penilaian Anda sebagai panduan.
Spesifikasi menggambarkan kinerja yang akan diukur dan sampel hasil
pembelajaran untuk diukur. Dengan demikian, mereka berfungsi
sebagai bantuan untuk memilih jenis item dan tugas untuk
mempersiapkan, untuk menulis, dan untuk menentukan berapa banyak
item dan tugas yang diperlukan untuk setiap subdomain pencapaian.
2. Tulis lebih banyak item dan tugas dari pada yang dibutuhkan.
Mempersiapkan lebih banyak item tes dan tugas penilaian dari yang
dibutuhkan akan memungkinkan item dan tugas yang lebih lemah untuk
dibuang selama peninjauan kemudian. Ini juga akan membuatnya lebih
mudah untuk mencocokkan set akhir item dan tugas dengan spesifikasi.
3. Tulis item dan tugas dengan baik sebelum tanggal pengujian.
Mengesampingkan item dan tugas selama beberapa hari dan kemudian
meninjaunya dengan pandangan baru akan mengungkapkan kurangnya

41
kejelasan atau ambiguitas yang diabaikan selama persiapan mereka.
Sering mengejutkan betapa banyak cacat yang menyelinap selama
penulisan aslinya.
4. Tuliskan masing-masing item tes dan tugas penilaian sehingga tugas
yang akan dilakukan didefinisikan dengan jelas dan menampilkan
kinerja yang dijelaskan dalam hasil pembelajaran yang dimaksudkan.
Kejelasan diperoleh dengan merumuskan dengan hati-hati pertanyaan
dan pembelajaran, menggunakan bahasa yang sederhana dan langsung,
menggunakan tanda baca dan tata bahasa yang benar, dan menghindari
kata-kata yang tidak perlu. Selama menulis dan mengulas, bandingkan
tugas yang diminta siswa untuk dilakukan dengan hasil pembelajaran
yang dirancang untuk diukur untuk memastikan keduanya cocok.
5. Tulis setiap item atau tugas pada tingkat bacaan yang sesuai. Jaga
kesulitan membaca dan tingkat kosa kata sesederhana mungkin untuk
mencegah faktor-faktor ini mendistorsi hasil. Respon siswa harus
ditentukan oleh kinerja yang diukur, bukan oleh beberapa faktor item
atau tugas tidak dirancang untuk diukur.
6. Tulis setiap item atau tugas sehingga tidak memberikan bantuan dalam
menanggapi item atau tugas lain. Kecuali jika diperhatikan selama
penulisan, satu item dapat memberikan informasi itu, berguna dalam
menjawab item lain. Misalnya, nama, tanggal, atau fakta yang secara
tidak sengaja dimasukkan dalam buritan item pilihan ganda yang
mungkin disebut dalam item jawaban pendek di bagian lain dari tes.
7. Tuliskan masing-masing item sehingga jawabannya adalah salah satu
yang akan disetujui oleh para ahli atau, dalam hal tugas penilaian,
tanggapan yang dinilai sangat baik akan disetujui oleh para ahli. Aturan
ini mudah dipenuhi saat mengukur pengetahuan faktual tetapi lebih sulit
ketika mengukur hasil yang kompleks yang menyerukan esai yang
diperluas atau jenis kinerja lainnya.
8. Setiap kali item tes atau tugas penilaian direvisi, periksa kembali
relevansinya. Ketika meninjau item atau tugas untuk kesesuaian,
kejelasan, kesulitan, dan kebebasan dari petunjuk dan bias, beberapa
revisi sering diperlukan. Setelah merevisi item atau tugas, periksa untuk
memastikan bahwa item itu masih memberikan ukuran yang relevan dari
hasil pembelajaran yang dimaksudkan. Bahkan sedikit perubahan
kadang-kadang dapat memodifikasi fungsi item atau tugas.
Berfokus pada Peningkatan Pembelajaran dan Pembelajaran
Tujuan utama pengujian dan penilaian adalah untuk meningkatkan
pembelajaran siswa. Ketika Anda menyusun tes dan penilaian di kelas, perlu
diingat sejauh mana itu mungkin berkontribusi, secara langsung atau tidak
langsung, ke arah tujuan ini. Tes dan penilaian kelas yang dibuat dengan baik
harus meningkatkan kuantitas dan kualitas pembelajaran siswa.
1. Tes dan penilaian dapat memiliki pengaruh yang diinginkan pada
pembelajaran siswa jika guru memperhatikan luas dan kedalaman
konten dan ukuran hasil belajar. Ketika kami memilih sampel konten
yang representatif dari semua area yang tercakup dalam petunjuk kami,
kami menekankan kepada siswa bahwa mereka harus mencurahkan
perhatian pada semua area. Mereka tidak dapat mengabaikan beberapa
aspek dari pelajaran dan melakukannya dengan baik pada tes. Dengan
memberi bobot lebih pada tujuan prioritas tinggi yang ditekankan dalam
pengajaran, kami juga mendorong pada saat yang sama konsentrasi
upaya pada tujuan-tujuan yang dianggap paling penting. Secara umum,
ketika tes kami mengukur berbagai jenis hasil belajar, siswa segera
belajar bahwa banyak informasi faktual yang dihafal tidak cukup.
Mereka juga harus belajar menafsirkan dan menerapkan fakta,
mengembangkan pemahaman konseptual yang mendalam, menarik
kesimpulan, mengenali asumsi, mengidentifikasi hubungan sebab-
akibat, menghasilkan hipotesis, memecahkan masalah yang bermakna,
dan sejenisnya. Ini mengecilkan hati siswa dari hanya mengandalkan
hafalan sebagai dasar untuk belajar dan mendorong mereka untuk
mengembangkan penggunaan proses mental yang lebih kompleks.

43
2. Uji konstruk dan penilaian yang mengukur berbagai hasil pembelajaran
juga harus mengarah pada peningkatan prosedur pengajaran dan, dengan
demikian, secara tidak langsung meningkatkan pembelajaran siswa.
Ketika kami menerjemahkan berbagai hasil pembelajaran ke dalam item
tes dan tugas penilaian, kami mengklarifikasi gagasan kami tentang
pemahaman, keterampilan berpikir, dan hasil pembelajaran yang
kompleks lainnya. Klarifikasi ini memungkinkan kita untuk
merencanakan pengalaman belajar siswa secara lebih efektif dan
meningkatkan tingkat dimana kita menekankan pemahaman,
keterampilan berpikir, dan hasil pembelajaran kompleks lainnya dalam
pengajaran kita. Tes atau penilaian yang dibuat dengan baik sering kali
mengarah pada tinjauan prosedur pengajaran dan meninggalkan mereka
yang mendorong pembelajaran hafalan.
3. Tes dan penilaian akan berkontribusi pada peningkatan hubungan guru-
siswa (dengan efek yang menguntungkan pada pembelajaran siswa) jika
siswa melihat tes dan penilaian sebagai langkah adil dan berguna untuk
pencapaian mereka. Kita dapat membuat keadilan terlihat dengan
memasukkan sampel yang representatif dari hasil pembelajaran yang
telah ditekankan selama pengajaran dengan menulis arah yang jelas,
dengan memastikan bahwa maksud dari setiap item atau tugas jelas dan
bahwa setiap item bebas dari segala jenis bias yang akan mencegah
orang yang berpengetahuan untuk berkinerja baik, dan dengan
memberikan batas waktu yang memadai. Pengakuan siswa tentang
kegunaan, bagaimanapun, sangat tergantung pada apa yang kita lakukan
dengan hasil tes atau penilaian seperti pada karakteristik instrumen itu
sendiri. Kami menjadikan manfaatnya jelas dengan menggunakan hasil
sebagai dasar untuk membimbing dan meningkatkan pembelajaran.

RANGKUMAN
Merencanakan tes dan penilaian kelas melibatkan (a) menentukan tujuan
pengukuran, (b) mengembangkan seperangkat spesifikasi, (c) memilih jenis item
tes dan tugas penilaian yang tepat, dan (d) menyiapkan serangkaian item dan tugas
yang relevan.
Tes dan penilaian kelas dapat digunakan untuk berbagai tujuan pengajaran,
paling baik dijelaskan dalam hal lokasi mereka dalam urutan pengajaran. Ada (a)
pretest di awal pelajaran atau unit untuk menentukan kesiapan belajar, untuk
membantu dalam perencanaan pengajaran, dan untuk membuat penempatan
lanjutan; (B) tes dan penilaian selama pelajaran untuk meningkatkan dan
mengarahkan belajar siswa dan untuk mengidentifikasi dan memperbaiki
kesalahan belajar; dan (c) tes dan penilaian akhir pelajaran yang digunakan pada
akhir pembelajaran atau unit untuk menugaskan nilai, mensertifikasi pencapaian,
atau mengevaluasi. Masing-masing jenis pengujian dan penilaian kelas ini
menempatkan tuntutan yang berbeda pada pengambilan sampel barang dan tugas
dan jenis penafsiran yang digunakan (yaitu, kriteria yang dirujuk atau aturan yang
dirujuk).
Contoh kinerja siswa lebih cenderung representatif jika serangkaian
spesifikasi digunakan dalam merencanakan tes atau penilaian. Spesifikasi
menentukan dan membatasi domain pencapaian yang akan diukur dan
menggambarkan sampel item tes dan tugas penilaian yang harus disiapkan. Salah
satu bentuk spesifikasi adalah grafik dua arah yang disebut tabel spesifikasi.
Membuat tabel melibatkan (a) memperoleh daftar tujuan pengajaran, (b)
menguraikan isi pemebelajaran, dan (c) menyiapkan grafik dua arah yang
menghubungkan tujuan pengajaran dengan isi pembelajaran dan menentukan sifat
dari sampel yang diinginkan beberapa item dan tugas. Meskipun sebuah tabel
spesifikasi sangat berguna dalam mempersiapkan tes sumatif dan penilaian (karena
cakupan yang luas), ini juga berguna dalam menyiapkan beberapa tes dan penilaian
formatif. Namun, dalam kasus lain, tes atau rencana penilaian mungkin terbatas
pada daftar singkat dari hasil pembelajaran yang spesifik dan dinyatakan secara
tepat, atau mungkin berisi serangkaian spesifikasi yang komprehensif dan
terperinci dengan item atau tugas sampel yang ilustratif.
Kategori utama tes obyektif atau penilaian kinerja dapat dibagi lagi menjadi
beberapa jenis item tes dan tugas penilaian berikut.

45
Tes Objektif:
A. Jenis persediaan
1. Jawaban singkat
2. Penyelesaian
B. Jenis seleksi
1. Benar-Salah atau alternatif
2. Mencocokan
3. Pilihan ganda
Penilaian kinerja
A. Respons yang diperluas
B. Respon terbatas
Tes objektif memberi siswa tugas yang sangat terstruktur yang membatasi
respons mereka untuk memasok kata, frasa singkat, angka, atau simbol atau untuk
memilih jawaban dari sejumlah alternatif yang diberikan. Penilaian kinerja
memungkinkan siswa untuk kembali dengan memilih, mengatur, dan
mempresentasikan ide atau melakukan dengan cara yang mereka anggap tepat.
Baik tes obyektif dan penilaian kinerja memiliki tujuan yang berguna dalam
mengukur prestasi siswa. Jenis yang digunakan dalam situasi tertentu paling baik
ditentukan oleh hasil pembelajaran yang akan diukur dan oleh kelebihan dan
keterbatasan unik dari setiap pendekatan. Praktik yang baik adalah memasukkan
item tes objektif dan tugas penilaian kinerja dalam pengukuran komprehensif
prestasi siswa.
Persiapan satu set item tes yang relevan dan tugas penilaian melibatkan (a)
mencocokkan item dan tugas dengan hasil pembelajaran secara langsung mungkin,
(b) mendapatkan sampel yang representatif dari semua hasil yang diinginkan, (c)
menghilangkan hambatan yang tidak relevan untuk jawabannya, (d) mencegah
petunjuk yang tidak diinginkan pada respons, dan (e) berfokus pada peningkatan
pembelajaran dan pengajaran. Aturan untuk membuat setiap jenis item tes objektif
dan tugas penilaian kinerja dijelaskan dalam bab-bab berikutnya.

LATIHAN PEMBELAJARAN
1. Jelaskan sifat dari pretest kesiapan dan bagaimana hasilnya dapat digunakan
dalam pengajaran.
2. Jelaskan bagaimana tes formatif dan penilaian dan tes sumatif dan penilaian
berbeda.
3. Apa keuntungan menggunakan grafik dua arah saat menyiapkan spesifikasi
untuk tes dan penilaian? Untuk jenis pengujian dan penilaian apa yang paling
bermanfaat? Mengapa?
4. Mengapa penting untuk tes dan penilaian kelas untuk mengukur sampel yang
representatif dari hasil pembelajaran yang dimaksudkan?
5. Jenis informasi apa yang harus dipertimbangkan selama masing-masing
langkah berikut dalam menyusun tes dan penilaian?
a. Mengembangkan seperangkat spesifikasi
b. Memilih jenis item tes dan tugas penilaian untuk digunakan
c. Menulis item ujian dan tugas penilaian.
6. Sebutkan beberapa hasil pembelajaran yang paling baik diukur dengan item
tes objektif. Daftar beberapa yang memerlukan penggunaan tugas penilaian
kinerja
7. Sebutkan sebanyak mungkin faktor spesifik yang dapat Anda pikirkan yang
mungkin menghalangi beberapa siswa untuk melakukan yang terbaik
meskipun mereka memiliki pengetahuan dan keterampilan yang ingin diukur
oleh item atau tugas tersebut.
8. Sebutkan sebanyak mungkin faktor spesifik yang dapat Anda pikirkan yang
akan memungkinkan beberapa siswa menjawab item tes objektif dengan benar
walaupun mereka tidak memiliki pengetahuan yang dirancang untuk diukur
oleh item tersebut.
9. Asumsikan bahwa Anda akan mempersiapkan unit test singkat untuk unit
kerja dalam pembelajaran di area pengajaran utama Anda. Bagaimana Anda
akan melanjutkan? Bagaimana perbedaan prosedur Anda jika menjadi tes atau
penilaian sumatif akhir pelajaran?

47

Anda mungkin juga menyukai