Anda di halaman 1dari 57

BAB I

PENDAHULUAN
A. Latar Belakang
Pendidikan merupakan sesuatu yang penting dalam mencapai tujuan bangsa.
Upaya untuk mencapai keberhasilan tersebut dibutuhkan sumber daya manusia yang
memiliki potensi dan kapasitas. Sumber daya manusia (SDM) dikatan baik apabila
memiliki pengetahuan dan mampu mengatasi tuntutan masa depan. Langkah untuk
membentuk individu yang baik,salah satunya pelaksanaan system pendidikan
nasional.
Undang-undang No.20 tahun 2003 tentang System Pendidikan Nasional,
dalam Bab I, Pasal I, poin I bahwa: Pendidikan diartikan sebagai usaha sadar dan
terencana untuk mewujudkan suasana belajar dan proses pembelajaran agar peserta
didik secara aktif mengembangkan potensi dirinya untuk memiliki kekuatan spiritual
keagamaan,pengendalian diri,kecerdasan,akhlak mulia,serta keterampilan yang
diperlukan dirinya,masyarakat,bangsa,dan Negara.
Pencapaian cita-cita yang digalangkan dalam sitem pendidikan nasional tidak
akan terwujud tanpa bantuan guru. Guru memiliki peran yang sangat penting dalam
membantu siswa memperoleh informasi. Informasi yang disamapiakan berupa
pemahaman-pemahaman terkait kopentensi yang disesuaiakan dengan kebutuhan
siswa. Adapun dalam Bab I Pasal,poin 20 dikemukakan bahwa: Pembelajaran adalah
proses interaksi peserta didik dengan pendidik dan sumber belajar pada suatu
lingkungan belajar.
Oleh karena itu,asesmen dan evaluasi proses pembelajaran perlu dilakukan
untuk mendapatkan informasi dalam rangka memperbaiki kualitas pembelajaran dan
belajar,dengan memperhatikan rencana pelaksanaan pembelajaran yang telah disusun
sebelumnya. Penilaian secara berkala dan berkelanjutan berfungsi untuk mengetahuai
apakah kegiatan pembelajaran yang dilakukan telah sesuai dengan tujuan penilaian.
Peraturan Pemerintah No.19 pasal 63 ayat 1 menjelaskan bahwa guru,satuan
pendidikan dan pemerintah harus mampu melaksanakn penilaian. Penilaian yang

1
dilaksanakan guru harus dilakukan secara berkesinambungan dalam memantau
kegiatan,kemajuan,dan perbaikan hasil pembelajaran yang dilaksanakan,termasuk
untuk menilai kopentensi siswa dalam kegiatan pembelajaran dengan melaksanakan
penilaian berbasis kelas.
Penilaian berbasis kelas dilaksanakan sesuai dengan prosedur yang telah
ditetapakn oleh pemerintah yaitu standar isi,standar proses,dan standar penilaian
pendidikan. PP No.19 tahun 2005 pasal1 ayat 5 dan 6 mengatakan bahwa pada
kegiatan pembelajaran dan pengajaran,guru harus berpedoman pada standar isi dan
standar proses. Sementara standar penilaian disesuaikan dengan
mekanisme,prosesdur,dan instrument penilaian.
Penilaian berbasis kelas dipahami sebagai kegiatan
pengumpulan,penafsiran,pendeskripsian,dan penggunaan hasil ketercapaian siswa
dengan menerapkan aspek,prinsisp,prosedur,dan standar penilaian pendidikan yang
dilaporkan secara akurat dengan disertai bukti-bukti otentik. Penilaian berbasis kelas
menggunakan istilah assessment sebagai penilaian untuk mengetahui pencapaian
siswa dalam tiga ranah kompentensi yaitu kognitif,afektif,dan psikomotorik.
Menurut TGAT(1987),penilaian atau assessment mencakup semua cara yang
digunakan untuk unjuk kerja individu. Proses assessment meliputi pengumpulan
bukti-bukti tentang pencapaian pembelajaran peserta didik. Bukti ini tidak melalui tes
saja,tapi juga dikumpulkan melalui pengamatan atau laporan diri(self report). Tes dan
penilaian kelas memainkan peran sentral dalam evaluasi pembelajaran siswa,yaitu
prestasi belajar yang dicapai kelompok atau kelas.
Usaha peningkatan prestasi harus didasarkan pada kondisi saat ini yang
diperoleh dengan menggunakan alat ukur. Alat ukur yang banyak digunakan dalam
penilaian pendidikan adalah tes. Agar diperoleh data akurat,tes yang digunakan harus
memiliki bukti-bukti tentang kesahihan dan kehandalannya. Dengan demikian
,peningkatan kualitas pendidikan memerlukan alat ukur yang sahih dan handal.
Tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur
sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan. Tes

2
merupakan alat yang direncanakan untuk mengukur kemampuan, keahlian atau
pengetahuan. Sehingga, dalam melakukan tes dibutuhkan perencanaan tes,
pengembangan tes, prosedur penulisan ataupun penyusunan butir-butir soal.
Untuk merencanakan tes dan penilaian kelas tersebut diperlukan adanya langkah-
langkah ataupun prosedur yang diikuti secara sistematis sehingga dapat diperoleh tes
yang lebih efektif.
Adapun tujuan makalah ini ditulis untuk menambah pengetahuan dan
wawasan pembaca dan pemakalah khususnya mengenai perencanaan tes dan
penilaian kelas serta mampu mengaplikasikannya dengan mengikuti prosedur yang
ada. Selanjutnya, untuk pembahasan lebih dalam mengenai prosedur dalam
merencanakan tes, dan penilaian kelas akan dibahas di dalam makalah ini.

B. Rumusan Masalah
Rumusan masalah yang diangkat dalam makalah ini adalah:
1. Apa yang dimaksud dengan perencanaan tes dan penilaian kelas?
2. Apa tujuan pengujian dan penilaian kelas?
3. Bagaimana pengembangan spesifikasi untuk uji dan penilaian?
4. Bagaimana memilih jenis-jenis barang dan tugas penilaian yang tepat?
5. Apa pertimbangan dalam menyiapkan item tes yang relevan dan tugas
penilaian?

C. Tujuan
Makalah ini bertujuan untuk:
1. Mengetahui pengertian perencanaan tes dan penilaian kelas.
2. Mengetahui tujuan pengujian dan penilaian kelas.
3. Mengetahui pengembangan spesifikasi uji dan penilaian.
4. Mengetahui bagaiaman memilih jenis-jenis barang dan tugas penilaian yang
tepat.

3
5. Mengetahui bagaiamana pertimbangan dalam menyiapkan item tes
yang relevan dan tugas penilaian.

D. Manfaat
Manfaat dari penulisan makalah ini adalah untuk memberikan infomasi dan
pemahaman kepada penulis maupun pembaca tentang perencanaan tes dan penilaian
kelas(Classroom).

4
BAB II
PEMBAHASAN

A. Pengertian Tes dan Penilaian Kelas


Secara garis besar,instrument asesmen dalam pendidikan dapat
dikategorikan dala dua kelompok,Tes dan Nontes. Instrumen asesmen dalam
bentuk tes maupun dalam bentuk nontes mempunyai fungsi yang berbeda sesuai
dengan jenis yang digunakan. Tes yang baik bukanlah kerja sekali jadi,melainkan
membutuhkan tenaga ,waktu yang cukup lama,ketelitian dan ketekunan. Tes
hendaklah dirancang secara baik dan mempunyai hubungan erat dengan tujuan
kegiatan pendidikan atau pembelajaran baik sebagai aspek yang ingin dinilai
maupun sasaran yang ingin dicapai. Secara konseptual para ahli dibidang
psikologi maupun pendidikan sependapat dengan apa yang dimaksud dengan tes
itu sendiri,walaupun diformulasikan dengan cara yang berbeda-beda.
Menurut Brown (1961): “a test as a systematic procedure for measuring a
sample of behavior.” Ia menjelaskan bahwa pada prinsipnya suatu tes merupakan
suatu prosedur sistematis untuk mengukur sampel tingkah laku
seseorang.seorang pembuat tes (tes maker) untuk aspek tertentu,hendaklah
menyusun “blueprint”setepat mungkin yang dapat mewakili semua aspek dari
pengetahuan,sikap dan tingkah laku yang akan diukur,sesuai dengan tujuan yang
telah dirumuskan. Tes yang baik harus mampu mengukur apa yang akan diukur
(aspek validitas).dan konsisten atau stabil dalam mengukur apa yang akan
diukur(aspek reliabilitas). Disamping syarat utama itu,suatu tes hendaklah: (1)
objektif,(2) praktis, dan (3) norma.
Cronbatch (1970) mengemukakan pula bahwa: “a test is a system atic
procedure for observing a person’s behavior and describing it with aid of
numerical scale or a category system.” Adapun Friedenberg
(1995:26)menyatakan bahwa: “A test is a type of assessment that uses specific
procedures to obtain information and convert that information to numbers or

5
scores.”dari beberapa pendapat diatas,dapat disimpulkan bahwa esensi dari tes
adalah suatu prosedur yang spesifik dan sistematis untuk mengukur tingkah laku
seseorang;atau suatu pengukuran yang bersifat objektif mengenai tingkah laku
seseorang,sehingga tingkah laku tersebut dapat digambarkan dengan bantuan
angka,skala atau dengan system kategori.
Dalam merencanakan tes, hal yang lebih dahulu dilakukan ialah
menentukan dan merumuskan tujuan tes. Kemudian, dalam pengembangan tes
melibatkan kegiatan identifikasi hasil belajar, deskripsi materi, pengembangan
spesifikasi, penulisan butir dan kunci jawaban, pengumpulan data uji coba,
pengujian kualitas butir dan perangkat, serta komplikasi. Dalam suatu tes hanya
ada kemungkinan; Benar atau Salah.apabila seseorang yang diuji(examine) tidak
menjawab sesuai dengan kuncinya maka ia akan salah.
Tes yang baik bukanlah kerja sekali jadi,melaiankan membutuhkan
tenaga,waktu yang cukup lam,ketelitian dan ketekunan. Tes hendaklah dirancang
secara baik,dan mempunyai hubungan erat dengan tujuan kegiatan pendidikan
atau pembelajaran,baik sebagai aspek yang ingin dinilai maupun sasaran yang
ingin dicapai. Dengan kata lain,tujuan kegiatan pendidikan atau pembelajaran
merupakan titik awal dari perancangan asesmen belajar. Seandainya tujuan
pendidikan atau pembelajaran dirumuskan secara kurang tepat,maka asesmen
belajar menjadi kurang jelas dan kurang terarah pula pada tujuan yang
seharusnya.
Dalam konteks tersebut asesmen/penilaian kelas(classroom assessment)
diperlukan.jangan biarkan pembelajaran tampa makna yang sesungguhnya
terhadap peserta didik. Ujian sumatif yang diujikan pada akhir semester,akhir
tahun maupun tengah semester,lebih diarahkan untuk pemberian angka/skor
kenaikan kelas,bukan untuk perbaikan proses pembelajaran yang dilakukan
pendidik;bukan untuk menggali mengapa peserta didik tidak mengerti dan tidak
mampu melakukan sesuai yang telah diberikan.

6
Asesmen kelas adalah cara sederhana yang dapat digunakan pendidik
untuk mengumpulkan balikan( feedback)lebih awal dan seringkali;tentang
bagaimana sebaiknya peserta didik belajar mengenai hal-hal yang telah
dibelajarkan. Asesmen kelas merupakan suatu pendekatan yang dirancang untuk
menolong pendidik dalam memahami,apakah peserta didik belajar selama proses
pembelajaran berlangsung,dan bagaimana sebaiknya mereka mempelajarinya.
Dengan demikian dapat juga dikatakan bahwa asesmen kelas dimaksudkan untuk
mengetahui bagaimana peserta didik belajar. Dan tindakan tersebut dilaksanakan
dalam usaha untuk memperbaiki pendidikan yang dilakukan pendidik.bukan
untuk memberi angka.
Tes dan penilaian di kelas memainkan peran sentral dalam evaluasi
pembelajaran siswa. Tes ini memberikan langkah-langkah yang relevan dari
banyak hasil belajar penting dan bukti tidak langsung mengenai orang lain.
Mereka membuat hasil belajar yang diharapkan secara eksplisit kepada siswa
dan orang tua dan menunjukkan jenis pertunjukan apa yang dihargai.
keabsahan informasi yang mereka berikan. Apapun, tergantung pada perawatan
yang masuk ke dalam perencanaan dan persiapan tes dan penilaian.
Tujuan utama pengujian dan penilaian di kelas adalah untuk memperoleh
informasi yang valid, andal, dan berguna mengenai prestasi siswa. Ini
membutuhkan penentuan apa yang harus diukur dan kemudian
mendefinisikannya secara tepat sehingga tugas-tugas yang membangkitkan
kinerja yang diinginkan dapat dibangun. Ini juga mensyaratkan menentukan
domain prestasi sedemikian rupa sehingga sampel item dan tugas penilaian akan
mewakili domain total tugas prestasi dan hasilnya akan sesuai untuk penggunaan
instruksional yang dimaksud.
Kemungkinan mempersiapkan tes dan penilaian kelas yang valid, andal,
dan bermanfaat sangat ditingkatkan jika serangkaian langkah seperti yang
ditunjukkan pada Gambar 2.1 diikuti.

7
GAMBAR 2.1
Langkah-langkah dasar dalam pengujian dan penilaian kelas
TUJUAN

Peningkatan pembelajaran dan instruksi

8.mengunakan hasil

7. menilai penilaian

8
6. mengelola penilaian

5. menyusun penilaian

4. mempersiapkan tugas penilaian yang relevan

3. memilih tugas penilaian yang tepat

2. mengembangkan spesifikasi

1.menentukan tujuan pengukuran

B. TUJUAN PENGUJIAN DAN PENILAIAN KELAS


Tes dan penilaian kelas dapat digunakan untuk berbagai tujuan
pengajaran. Tes ini dapat dijelaskan dengan baik berdasarkan lokasi mereka

9
dalam proses pembelajaran, yang secara paralel dengan tipe penilaian yang
dijelaskan dalam bab1.
1. Pretesting.
Tes dan penilaian dapat diberikan pada awal segmen instruksional (misalnya,
unit atau kursus) untuk menentukan (1) apakah siswa memiliki keterampilan
prasyarat yang diperlukan untuk instruksi (untuk menentukan kesiapan) atau
(2) sejauh mana siswa telah memiliki mencapai tujuan instruksi yang
direncanakan (untuk menentukan penempatan siswa atau modifikasi
instruksi).

Pra-persiapan kesiapan biasanya terbatas dalam ruang lingkup. Misalnya,


pretest dalam aljabar mungkin terbatas pada operasi dan konsep aritmatika
atau keterampilan prasyarat dalam aljabar; dan pretest pada awalnya bahasa
Jerman mungkin terbatas pada pengetahuan tata bahasa Inggris. Selain
terbatas pada domain terbatas, item pretest cenderung memiliki tingkat
kesulitan yang relatif rendah. Tes kesiapan yang dipublikasikan tersedia di
tingkat sekolah dasar di bidang keterampilan dasar. Tetapi tidak semua guru
harus mengembangkan pretes kesiapan mereka sendiri. Tes ini berfungsi
sebagai dasar untuk pekerjaan perbaikan atau untuk adaptasi
rencanapengajaran. Pretest untuk menentukan sejauh mana siswa telah
mencapai tujuan pengajaran yang direncanakan tidak berbeda dari tes yang
digunakan untuk mengukur hasil pengajaran. Dengan demikian, pengujian
yang dirancang untuk mengukur pencapaian akhir dalam suatu Kursus atau
unit dapat diberikan pada awal untuk mengukur kinerja entri pada tujuan.
Dalam hal ini, tes akhir atau penilaian seharusnya, tentu saja, bukan tes yang
sama yang digunakan dalam pretesting tetapi bentuk yang setara dari itu.
2. Pengujian dan penilaian diberikan selama instruksi
Tes dan penilaian yang diberikan selama pengajaran memberikan dasar untuk
penilaian formatif. Mereka digunakan untuk memantau kemajuan belajar.

10
Mendeteksi kesalahan pembelajaran, dan memberikan umpan balik kepada
siswa dan guru. Guru biasanya menyebut tes formatif ini dengan tes belajar,
tes praktik, kuis, tes unit, dan sejenisnya. Tes dan penilaian ini biasanya
mencakup beberapa segmen instruksi yang telah ditentukan (misalnya, bab
atau serangkaian keterampilan tertentu) dan dengan demikian mencakup
sampel hasil pembelajaran yang agak terbatas. Gabungan jenis item tes dan
tugas penilaian kinerja yang lebih kompleks perlu dipilih dengan hati-hati
untuk memastikan bahwa berbagai tujuan instruksional kritis yang belum
tercapai. Ketika semua siswa gagal satu set item atau melakukan porly pada
perpanjangan tugas kinerja, review kelompok mungkin berlaku. Ketika
sejumlah kecil siswa memiliki kesalahan, metode studi alternatif dapat
ditentukan (mis., Tugas membaca, latihan praktik, dan sejenisnya).
Kesulitan belajar yang persisten mungkin memerlukan penggunaan tes
diagnostik. Untuk jenis pengujian ini, sejumlah item tes diperlukan di setiap
area spesifik, dengan sedikit variasi dari satu item ke item lainnya. Dalam
mendiagnosis kesulitan siswa dalam menambahkan bilangan bulat, misalnya,
akan perlu untuk memasukkan masalah tambahan yang mengandung
berbagai kombinasi angka, beberapa memerlukan pengangkutan dan
beberapa tidak, untuk menentukan jenis kesalahan spesifik yang dibuat.
Pengujian diagnostik adalah bidang yang sangat terspesialisasi yang agaknya
diabaikan dalam pengukuran pendidikan. Ada beberapa tes diagnostik yang
diterbitkan tetapi ini terutama di bidang keterampilan dasar. Di daerah lain,
guru harus lebih bergantung pada fitur diagnostik tes formatif atau
menyiapkan tes dan penilaian diagnostik mereka sendiri.
3. Pengujian dan penilaian diakhir instruksi
Di akhir segmen pengajaran (mis., Unit atau kursus), minat utama kami
adalah mengukur sejauh mana hasil pembelajaran yang diinginkan telah
tercapai. Meskipun tes dan penilaian akhir instruksi ini digunakan terutama
untuk penilaian sumatif (mis., Untuk mengesahkan pencapaian atau

11
menugaskan nilai), mereka juga dapat melayani fungsi-fungsi lain. Tes akhir-
unit dapat digunakan untuk umpan balik kepada siswa, menugaskan
pekerjaan perbaikan, dan menilai instruksi serta untuk tujuan penilaian.
Bahkan, mereka dapat melayani fungsi penilaian formatif dan sumatif, dan
dalam beberapa kasus berfungsi sebagai pretest untuk unit berikut (mis., Di
mana unit diurutkan, seperti dalam matematika). Tes akhir kursus
memberikan survei luas tentang pembelajaran siswa atas semua hasil yang
diinginkan dari suatu kursus. Selain penggunaannya dalam penilaian, mereka
juga dapat memberikan informasi untuk mengevaluasi pembelajaran

TABLE 2.2
Jenis dasar tes dan penilaian kelas (sumber: Diadaptasi dari “Jenis Fungsional
Evaluasi Siswa” oleh P. Airasian dan G.F. Madaus, 1972, Pengukuran dan Evaluasi
dalam Bimbingan, 4 hal.22-223.)

Instruksi
Waktu Sebelum instruksi Selama Instruksi Akhir

Fungsi   Kesiapan   Penempatan'   Formatif   Diagnostic   Sumatif


Fokus Keterampil Tujuan kursus Segmen Kesalahan Tujuan
pengukura an entri atau unit instruksi pembelajara kursus
n prasyarat yang n paling atau unit
ditentukan umum
sebelumnya

Sifat Sampel Sampel luas Sampel Sampel Sampel


Sampel terbatas dari semua terbatas dari terbatas luas dari
dari tujuan tugas untuk semua
keterampil pembelajara kesalahan tujuan
an yang n spesifik
dipilih

Kesulitan Biasanya Biasanya Bervariasi Bervariasi Biasanya


barang memiliki memiliki berdasarkan berdasarkan memiliki
tingkat berbagai instruksi instruksi berbagai
kesulitan kesulitan kesulitan
yang
rendah

Waktu Awal tentu Awal tentu secara Sesuai Akhir


Administr saja unit saja atau unit berkala kebutuhan kursus
asi selama selama atau unit

12
instruksi instruksi

Pengguna Memperbaik   Perencana   Tingkatka   Memperba   Tetapkan


an hasil i kekurangan an n dan iki nilai,
entri atau instruksio arahkan kesalahan pencapai
tugas untuk nal dan pembelajar yang an
kelompok penempat an melalui terkait kepastia
belajar an umpan dengan n, atau
lanjutan balik yang kesulitan evaluasi
berkelanju belajar pengajar
tan yang an
berkelanju
  tan

13
C. PENGEMBANGAN SPESIFIKASI UNTUK UJI DAN PENILAIAN
Untuk memastikan bahwa tes dan penilaian kelas mengukur sampel yang
representatif dari tugas yang relevan secara instruksional, penting untuk
mengembangkan spesifikasi yang dapat memandu pemilihan item tes dan tugas
penilaian. Saat menyiapkan tes pembelajaran singkat pada area terbatas
(misalnya, ejaan atau huruf besar) daftar sederhana tugas-tugas tertentu, dengan
indikasi jumlah atau item yang mengukur setiap tugas, mungkin cukup. Namun,
untuk sebagian besar tujuan pengujian, spesifikasi yang lebih rumit adalah Yang
dibutuhkan. Satu perangkat yang telah banyak digunakan untuk tujuan ini adalah
bagan dua arah, yang disebut tabel spesifikasi (atau cetak biru uji).
1. Membangun Tabel Spesifikasi
Membangun daftar spesifikasi melibatkan (1) menyiapkan daftar tujuan
pembelajaran, (2) menguraikan konten kursus, dan (3) menyiapkan grafik dua
arah. Langkah-langkah ini akan diilustrasikan untuk satuan cuaca dalam sains
sekolah menengah pertama.
Mempersiapkan daftar tujuan pembelajaran. Menggunakan prosedur untuk
menyatakan tujuan instruksional dan hasil pembelajaran khusus disiapkan
untuk unit cuaca. Meskipun daftar ini tidak lengkap, ini menggambarkan
metode menyatakan tujuan dan hasil pembelajaran khusus disiapkan untuk
unit cuaca. Meskipun daftar ini tidak lengkap, itu menggambarkan metode
menyatakan tujuan dan jumlah detail yang diinginkan. Jika unit cuaca ini
menjadi taughy pada tingkat kelas yang lebih rendah, tujuan kami akan
ditentukan oleh hasil pembelajaran spesifik yang lebih sedikit dan lebih
sederhana, pada tingkat kelas yang lebih tinggi hasil pembelajaran yang lebih
kompleks akan dimasukkan.
2. Tujuan Instruksional untuk Unit cuaca
a. Mengetahui istilah dasar.
1) Menulis definisi setiap istilah.
2) Identifikasi istilah yang mewakili setiap elemen cuaca

14
3) Identifikasi istilah yang paling cocok dengan deskripsi cuaca yang
diberikan.
4) Cocokkan istilah tersebut dengan gambar konsep
5) Membedakan antara penggunaan istilah yang benar dan salah
b. Tahu simbol cuaca.
1) Cocokkan setiap simbol dengan elemen cuaca yang diwakilinya
2) Gambar simbol untuk setiap elemen cuaca
3) Identifikasi arti dari setiap simbol
c. Mengetahui fakta spesifik.
1) Identifikasi elemen-elemen yang mempengaruhi cuaca.
2) Menamai instrumen yang digunakan untuk mengukur setiap elemen
cuaca.
3) Identifikasi unit pengukuran yang digunakan dalam melaporkan setiap
elemen cuaca
4) Membedakan antara prosedur yang benar dan salah untuk menentukan
setiap elemen cuaca.
5) Cocokkan nama setiap tipe cloud dengan deskripsi karakteristiknya
6) Identifikasi kondisi cuaca yang terkait dengan setiap jenis depan.
d. Memahami pengaruh faktor pada pembentukan cuaca.
1) Menjelaskan karakteristik kondisi cuaca yang diberikan.
2) Membedakan antara laporan cuaca yang mungkin dan tidak mungkin
3) Identifikasi faktor-faktor penyebab perubahan cuaca yang diberikan.
4) Memprediksi cuaca di masa depan dari perubahan kondisi
5) Mempersiapkan dan mengirimkan laporan cuaca lisan ke kelas untuk
negara bagian lain.
e. Menafsirkan peta cuaca
1) Menjelaskan cuaca untuk lokasi tertentu.
2) Identifikasi berbagai jenis front yang ditampilkan pada peta cuaca

15
3) Menjelaskan kondisi cuaca di sekitar setiap depan yang ditunjukkan
pada peta cuaca
4) Identifikasi arah gerakan untuk setiap depan yang ditampilkan pada
peta cuaca
5) Buat peta cuaca menggunakan deskripsi tertulis tentang kondisi yang
ada.
f. Mengukur karakteristik cuaca yang relevan.
1) Mengukur dan mencatat perubahan tekanan udara
2) Mengukur dan mencatat arah dan kecepatan angin
3) Mengukur kelembaban relatif.

Daftar sasaran terbatas pada hasil-hasil yang dapat diukur dengan tes
kelas atau, seperti dalam kasus 4,5,5.5, dan 6, tugas penilaian kinerja. Ini tidak
termasuk hasil afektif (mis., Menunjukkan sikap ilmiah). Rencana evaluasi
yang lebih terperinci untuk unit cuaca mungkin berisi daftar semua hasil yang
relevan dengan indikasi bagaimana masing-masing akan dievaluasi.
Menguraikan konten Instruksional. Langkah kedua dalam menyiapkan tabel
spesifikasi adalah membuat garis besar konten instruksional. Tujuan
instruksional menggambarkan jenis kinerja yang siswa diharapkan untuk
menunjukkan strate, konten instruksional menunjukkan area di mana masing-
masing jenis kinerja akan ditampilkan. Jumlah detail untuk dimasukkan dalam
garis besar konten agak arbitrer, tetapi garis besar harus cukup rinci untuk
memastikan pengambilan sampel konten yang memadai dan interpretasi yang
tepat dari hasil. Daftar topik dan subtopi berikut untuk unit cuaca
menggambarkan garis besar yang memadai untuk ujian dan persiapan
penilaian.

3. Garis besar konten untuk Unit cuaca


a. Tekanan Udara
1) Mengukur dan melaporkan dan melaporkan tekanan udara

16
2) Factor-faktor yang mempengaruhi tekanan udara
3) Hubungan dengan perubahan cuaca
b. Temperatur Udara
1) Mengukur dan melaporkan suhu udara
2) Factor-faktor yang mempengaruhi suhu udara
3) Hubungan dengan formasi cuaca
c. Kelembaban dan curah hujan
1) Mengukur dan melaporkan kelembaban
2) Factor yang mempengaruhi kelembaban
3) Bentuk presipitasi
4) Mengukur dan melaporkan curah hujan
d. Angin
1) Pengukuran kecepatan dan arah
2) Factor yang mempengaruhi kecepatan dan arah
3) Symbol untuk melaporkan kecepatan dan arah
e. Awan
1) Jenis awan
2) Karakteristik tipe awan
3) Factor-faktor yang menyebabkan pembentukan awan
4) Hubungan dengan kondisi cuaca
5) Symbol untuk type awan
f. Depan
1) Jenis bidang
2) Formasi depan
3) Cuaca terkait dengan depan
4) Symbol untuk garis depan
Mempersiapkan Cbart dua arah. Langkah terakhir dalam membangun tabel
spesifikasi adalah menyiapkan bagan dua arah yang menghubungkan tujuan
instruksional dengan konten instruksional, sehingga menentukan sifat sampel item

17
tes dan tugas penilaian. Contoh grafik untuk unit cuaca menengah pertama kami
disajikan pada tabel 2.2. tabel ini menunjukkan jumlah total item tes dan tugas
penilaian serta persentase yang dialokasikan untuk setiap tujuan dan setiap area
konten. Untuk pengujian di ruang kelas, menggunakan jumlah item mungkin
cukup, tetapi persentasenya berguna dalam menentukan jumlah penekanan untuk
diberikan pada setiap area.
Tabel ini terbatas pada tujuan-tujuan yang dapat diukur dengan tes kelas
dengan item esai objektif atau respons terbatas. Ini mengecualikan sasaran yang
membutuhkan kinerja (mis. 4.5, presentasi lisan; 5.5, membuat peta cuaca, dan 6.1
hingga 6.3, menggunakan instrumen cuaca). Dengan demikian, untuk cakupan
yang komprehensif, tes kelas perlu ditambah dengan serangkaian tugas penilaian
kinerja. Bobot relatif yang akan diberikan pada hasil penilaian kinerja dan tes
kelas dalam penugasan nilai kursus harus ditentukan sesuai dengan kepentingan
relatif dari tujuan. Sangat penting bahwa tujuan penting yang tidak dapat dinilai
oleh tes kelas dapat diidentifikasi, sehingga rencana untuk menilai pencapaian
tujuan tersebut dapat dibuat. Dalam contoh ini, daftar sederhana dari lima tugas
penilaian kinerja sesuai dengan tujuan pembelajaran 4.5,5.5,6.1,6.2, dan 6.3,
bersama dengan rencana untuk bobot relatif yang akan diberikan kepada skor pada
tugas-tugas tersebut dan tes kelas, sudah cukup.
Tabel 2.2 disiapkan menggunakan langkah-langkah berikut :
1. Sebutkan tujuan pembelajaran umum di bagian atas tabel
2. Sebutkan area konten utama di sisi kiri tabel
3. Tentukan proporsi item tes apa yang harus dikhususkan untuk setiap tujuan dan
setiap area konten.
4. Baris bawah Tabel 2.2 menunjukkan bahwa 10 persen dari item harus
dikhususkan untuk pengetahuan tentang fakta-fakta spesifik, 40 persen untuk
memahami pengaruh faktor cuaca, dan 20 persen untuk interpretasi peta cuaca.
Demikian pula, kolom di kanan menunjukkan bahwa 20 persen dari item
berkaitan dengan tekanan udara, 30 persen dengan angin, dan seterusnya ke

18
bawah kolom. Biasanya, persentase ini ditetapkan terlebih dahulu, untuk
menunjukkan penekanan relatif yang harus diberikan untuk setiap tujuan dan
setiap area konten. Jumlah total item untuk setiap area kemudian ditentukan.
Misalnya, karena ini akan menjadi tes 60 item, enam item (10 persen) berkaitan
dengan tekanan udara. Dengan demikian, jumlah total item dihitung dan
terdaftar di bagian bawah dan bawah sisi kanan grafik. Angka-angka ini
kemudian digunakan sebagai panduan untuk menetapkan item tes ke setiap sel.
Misalnya, dua item (sekitar 33 persen dari enam) telah ditugaskan.

TABLE 2.2
Tabel spesifikasi untuk unit cuaca dalam Ilmu Pengetahuan SMP
  Menafsirka
Pengetahuan Mengerti
Tujuan n
Pengaruh
masing- Total
Persentas
Simbo Fakta masing Jumla
Ketentua e Item
konten l Spesifi Faktor Peta Cuaca h Item
n Dasar
Cuaca k pada
Formasi
Cuaca

1 2 2 4 3 12 20
Udara
tekan angin
Kelembaba 1 2 2 11 2 18 30
n dan
precpitasi 1 1 2 4 2 10 17
suhu Awan 1 2 1 5 5 14 23
2 2 2     6 10
6 9 9 24 12 60  
Total
jumlah
item persen 10 15 15 40 20   100
dari item

19
sel di sudut kiri bawah, menunjukkan bahwa tes akan berisi dua item yang
mengukur pengetahuan tentang istilah tentang awan. Namun, penugasan item ke
setiap sel tidak sepenuhnya soal mengikuti persentase. Beberapa sel mungkin
dibiarkan kosong, seperti yang ditunjukkan pada bagan, karena item di area
tersebut tidak pantas. Demikian pula, beberapa sel mungkin menerima sejumlah
besar item karena tugas belajar untuk sel itu mungkin telah menerima penekanan
yang lebih besar dalam pengajaran. Meskipun ada penyesuaian pada distribusi
item, jumlah item dalam sel tabel harus mendekati distribusi yang diinginkan dan
harus menambahkan hingga jumlah item yang diindikasikan untuk setiap kolom
dan baris. Distribusi akhir item dalam tabel spesifikasi harus mencerminkan
penekanan yang diberikan selama instruksi. Tujuan yang dianggap lebih penting
oleh guru harus diberikan lebih banyak soal tes. Ini tidak hanya berlaku untuk
item-item dalam tes kelas tetapi juga untuk kinerja tugas penilaian seperti itu
harus mencerminkan pentingnya tujuan. Demikian pula, area konten yang
menerima lebih banyak waktu instruksi harus dialokasikan lebih banyak item tes
dan tugas penilaian. Meskipun keputusan yang terlibat dalam membuat persiapan
tabel spesifikasi pengujian, bersama dengan yang memakan waktu, persiapan
tabel spesifikasi pengujian, bersama dengan daftar tugas penilaian kinerja yang
diperlukan untuk melengkapi tes, adalah salah satu yang terbaik berarti untuk
memastikan bahwa set total item tes dan tugas penilaian akan mengukur sampel
yang representatif dari tujuan yang relevan secara instruksional. Sebagaimana
dicatat dalam bab 3, ini memberikan bukti terkait konten bahwa tes akan
memberikan ukuran yang valid dari hasil pembelajaran yang dimaksudkan. Upaya
yang dilakukan untuk mengembangkan spesifikasi juga membuatnya lebih mudah
untuk mempersiapkan tes begitu rencana dikembangkan. Contoh Spesifikasi
Lainnya Karena cakupan yang luas, tabel spesifikasi sangat berguna dalam
membangun tes atau penilaian atas suatu unit atau kursus. Di sini tabel
memastikan bahwa masing-masing jenis hasil pembelajaran yang beragam akan
menerima penekanan yang sesuai dalam tes. Akan tetapi, apakah daftar

20
spesifikasi berguna dalam menyusun tes pada area yang lebih terbatas,
tergantung pada ruang lingkup hasil belajar yang akan dicakup oleh tes tersebut.
Jika domain tugas sangat terbatas, seperti ”penambahan fraksi dengan penyebut
yang sama, ”tabel spesifikasi mungkin tidak perlu. Disini kita bisa menulis
semua,atau hamper semua,tugas-tugas spesifik yang tercakup oleh hasil
pembelajaranini, sebagai berikut:
1) Menambahkan dua pecahan dengan menyebut yang sama di mana
jawabannya kurang dari satu (1/3 + 1/3).
2) Menambahkan dua pecahan dengan penyebut yang sama di mana
jawabannya sama dengan satu (1/3 + 2/3).
3) Menambahkan dua pecahan dengan penyebut yang sama di mana
jawabannya lebih besar dari satu(2/3 +2/3).
4) Menambahkan dua fraksi dengan penyebut yang sama dan mengurangi
jawaban untuk istilah terendah (4/6 + 4/6).
5) o Menambahkan lebih dari dua fraksi dengan penyebut yang sama dan
mengurangi jawaban (1/8+5/8+6/8).
Daftar tugas pembelajaran seperti ini menentukan dengan sangat jelas sifat tepat
dari kinerja yang terlibat dalam penambahan fraksi dengan penyebut yang sama
"kita bisa mendapatkan sampel yang cukup representatif dari tugas-tugas tersebut
dengan hanya membangun lima atau lebih item untuk setiap tugas. menggunakan
berbagai kombinasi angka.
Jika tes aritmatika kami mencakup domain pencapaian yang sedikit besar.
Katakan “penambahan fraksi,” kami mungkin sekarang menemukan tabel
spesifikasi yang cukup berguna. Sebuah ilustrasi dari tablo tersebut untuk tes lima
puluh item ditunjukkan pada Tabel 5.3. penggunaan tabel seperti itu tidak berarti,
tentu saja. bahwa kita tidak boleh membuat jenis rincian terperinci yang kita
lakukan untuk "penambahan fraksi dengan penyebut yang sama." Daftar tersebut
dengan menentukan sampel tugas yang akan dimasukkan dalam tes . Seperti

21
disebutkan sebelumnya. Ini memberikan jaminan yang lebih besar bahwa hasil
pembelajaran yang dimaksudkan akan diukur secara seimbang.
Menggunakan Sistem Klasifikasi Satu Arah. Untuk pengujian di beberapa area,
klasifikasi satu arah dari semua item mungkin dibutuhkan. Dalam merencanakan
tes membaca, misalnya, daftar keterampilan membaca dan jumlah item tes untuk
mengukur setiap keterampilan mungkin cukup untuk menentukan tes apa yang
akan diukur. Kontennya cukup konstan. Dengan demikian, daftar keterampilan
utama dapat disiapkan untuk digunakan dengan berbagai jenis bahan bacaan.
Contoh dari daftar tersebut disajikan pada tabel 2.3
TABLE 2.3
Daftar spesifikasi untuk uji lima puluh soal penambahan fraksi
tujuan instruksional Menambah Menambahkan Menambah Jumlah
kan Pecahan dan Angka kan Angka barang
Pecahan Campuran Campuran

Konten
Daerah
Penyebut sama 5 5 5 15
Penyebut tidak seperti
5 5 5 15
(dengan faktor umum)
Penyebut tidak seperti 6 7 7 20
(tanpa faktor umum)

Jumlah barang 16 17 17 50

TABLE 2.4
Daftar keterampilan membaca pemahaman dan jumlah item untuk setiap
keterampilan khusus
Kemampuan membaca Jumlah item
Identifikasi perincian yang dinyatakan dalam satu bagian 10
Identifikasi gagasan utama suatu bagian 10
Identifikasi urutan tindakan atau peristiwa 10
Identifikasi kesimpulan yang diambil dari suatu bagian 10
Jumlah total 50

22
Perlu dicatat bahwa setiap keterampilan dalam Tabel 2.4 dinyatakan dalam
istilah kinerja tertentu, dan bahwa sepuluh item digunakan untuk mengukur setiap
keterampilan. Ini memberikan interpretasi referensi-kriteria. Meskipun bahan yang
akan dibaca tidak termasuk untuk interpretasi referensi-kriteria. Meskipun bahan
yang akan dibaca tidak termasuk dalam spesifikasi, materi itu tentu saja harus dipilih
dengan cermat dalam hal tingkat minat dan keterbacaan. Lihat kotak "daftar periksa"

Tabel 2.5
CHEKLIST
Meninjau Spesifikasi dan Penilaian Tes
Ya Tidak
1. Apakah spesifikasinya selaras dengan ……… ………
tujuan pengujian penilaian?
2. Apakah spesifikasi menunjukkan sifat dan ……… ………
batasan domain prestasi?
3. Apakah spesifikasi menunjukkan jenis ……… ………
hasil pembelajaran yang akan diukur?
4. Apakah spesifikasi menunjukkan sampel ……… ………
hasil pembelajaran yang akan diukur?
5. Apakah jumlah item tes atau tugas ……… ………
penilaian ditunjukkan untuk setiap
subdivisi? ……… ………
6. Apakah jenis dan taska yang akan
digunakan sesuai untuk hasil yang akan
diukur ……… ………
7. Apakah distribusi barang dan tugas
memadai untuk jenis interpretasi yang
akan dibuat? ……… ………
8. Jika item sampel atau tugas dimasukkan,
apakah mereka menggambarkan atribut
yang diinginkan? ……… ………
9. Apakah spesifikasi, secara keseluruhan,
menunjukkan sampel representatif dari
taska yang relevan secara instruksional
yang sesuai dengan penggunaan yang
akan dibuat atau hasilnya?

23
D. Memilih Jenis – jenis Barang dan Tugas Penilaian Yang Tepat
Merupakan hal yang umum untuk membuat perbedaan antara tes kelas
yang terdiri dari item tes objektif dan penilaian kinerja yang mengharuskan siswa
untuk membangun tanggapan (mis., Menulis esai) atau melakukan tugas tertentu
(mis., Mengukur tekanan udara). Item tes objektif sangat terstruktur dan
mengharuskan siswa untuk memberikan satu atau dua kata atau untuk memilih
jawaban yang benar dari sejumlah alternatif. Mereka disebut obyektif karena
mereka memiliki hak tunggal atau jawaban terbaik yang dapat ditentukan
sebelumnya. Tugas penilaian kinerja, seperti pertanyaan esai, memungkinkan
siswa untuk memilih, mengatur, dan menyajikan jawaban dalam esai dari. Jenis
lain dari tugas penilaian kinerja mungkin mengharuskan siswa untuk
menggunakan peralatan, menghasilkan hipotesis, membuat pengamatan,
membuat sesuatu (mis., Model) atau perfom untuk audiens (mis., Memberikan
pidato). Untuk sebagian besar tugas penilaian kinerja, tidak ada hak tunggal atau
respons terbaik — mungkin ada beragam respons yang dianggap sangat baik.
Diperlukan penilaian ahli untuk menilai pertunjukan. Tidak ada konflik antara
item objektif yang sangat terbatas ini dan tugas penilaian kinerja yang jauh lebih
sedikit dibatasi. Untuk beberapa tujuan pengajaran, item objektif mungkin paling
efisien, sedangkan untuk yang lain penilaian kinerja mungkin terbukti paling
memuaskan. Setiap pendekatan harus digunakan di mana yang paling tepat,
dengan kesesuaian ditentukan oleh hasil pembelajaran yang akan diukur dan oleh
kelebihan dan keterbatasan masing-masing pendekatan.

1. Item Tes Objektif


Berbagai macam jenis item tes objektif, dapat digolongkan ke dalam item
yang mengharuskan siswa untuk memberikan jawaban dan item yang
mengharuskan siswa untuk memilih jawaban dari sejumlah alternatif yang
diberikan. Kedua kelas umum ini umumnya dibagi lagi menjadi tipe dasar
dari item tes objektif, diilustrasikan dalam contoh-contoh berikut.

24
CONTOH
Jenis persediaan
Jawaban singkat
Apa nama penulis Moby Dick? (Herman Melville)
Apa formula untuk asam klorida? (HCI)
Berapakah nilai X dalam persamaan2X + 5 = 9?(2)
Penyelesaian
Garis pada peta cuaca yang menghubungkan titik-titik dengan tekanan barometrik
yang sama yang disebut (isobars).
Formula untuk garam meja biasa adalah (NaCL)
Dalam persamaan 2X + 5 = 9; X = (2)
Jenis Seleksi
Benar-salah atau respons alternatif
(T) F virus adalah organisme terkecil yang diketahui
T F sebuah atom adalah partikel terkecil dari materi
Ya (tidak) dalam persamaan2X + 5 = 9,X sama dengan 3.
(Ya) tidak Asam berubah menjadi kertas lakmus merah
Sesuai
(C) 1. dan A kata sifat
(D) 2. anjing B kata keterangan
(G) 3. melompat C konjungsi
(F) 4. dia D kata benda
(B) 5. segera E Preposisi
F kata ganti
G kata kerja
Pilihan ganda
Dalam persamaan 2X + 5 = 9,2X means
A 2 plus X.

25
B 2 minus X
C 2 dibagi dengan X
(D) 2 berlipat ganda X
Di manakah dari kalimat berikut yang tidak disetujui subyek dan kata kerja?
A Ketika mereka menang, mereka bahagia.
(B) politik sulit dipahami.
C Mayoritas selalu benar
D Satu atau yang lain harus dipilih

Selain jenis dasar dari item tes objektif, ada banyak modifikasi dan kombinasi
jenis. Namun, ada sedikit yang bisa diperoleh dari daftar semua variasi yang
mungkin, karena banyak yang unik untuk tujuan atau bidang subjek tertentu.
Beberapa variasi yang lebih umum digunakan untuk mengukur pemahaman,
keterampilan berpikir, dan hasil pembelajaran kompleks lainnya akan
diilustrasikan nanti. Pemahaman tentang prinsip-prinsip konstruksi tes, dan
prinsip-prinsip yang berlaku untuk masing-masing prinsip konstruksi tes, dan
prinsip-prinsip yang berlaku untuk masing-masing jenis spesifik dari item tes
objektif, harus memungkinkan guru untuk membuat adaptasi yang paling sesuai
dengan spesialisasi mereka. tujuan.
Berbagai jenis item tes objektif memiliki satu fitur yang sama yang membedakan
mereka dari tugas penilaian kinerja: mereka menyajikan siswa dengan tugas yang
sangat terstruktur yang membatasi jenis respons yang dapat mereka buat. Untuk
mendapatkan jawaban yang benar, siswa harus menunjukkan pengetahuan khusus,
pemahaman, atau keterampilan yang disebut dalam item, mereka tidak bebas untuk
mendefinisikan kembali masalah atau mengatur dan menyajikan jawaban dengan
kata-kata mereka sendiri. Mereka harus memilih salah satu dari beberapa jawaban
alternatif atau memberikan kata, angka, atau simbol yang benar. Penataan masalah
dan pembatasan metode merespons ini berkontribusi pada penilaian obyektif yang
cepat, mudah, dan akurat. Di sisi negatif, penataan yang sama ini membuat item

26
tes objektif tidak sesuai untuk mengukur kemampuan untuk memilih, mengatur,
dan mengintegrasikan ide-ide. Untuk mengukur hasil seperti itu, kita harus
bergantung pada tugas penilaian kinerja.
Karena esai tertulis adalah bentuk tugas penilaian kinerja yang paling umum
digunakan, maka sebaiknya berfokus pada pertanyaan esai sebelum
mempertimbangkan jenis tugas penilaian kinerja lainnya. Pertanyaan esai ini
biasanya dipandang sebagai satu jenis item. Akan tetapi, klasifikasi yang
bermanfaat adalah klasifikasi yang didasarkan pada jumlah kebebasan merespons
yang diizinkan siswa. Ini termasuk pertanyaan esai tanggapan panjang, di mana
siswa diberikan kebebasan hampir lengkap dalam membuat tanggapan mereka,
dan pertanyaan esai respons terbatas, di mana sifat, panjang, atau organisasi
respons terbatas. Jenis pertanyaan esai ini diilustrasikan sebagai berikut:
CONTOH
Pertanyaan esai tanggapan panjang:
Jelaskan menurut Anda apa peran pemerintah federal dalam memelihara ekonomi
yang stabil di Amerika Serikat. Masukkan kebijakan dan program spesifik, dan
berikan alasan untuk proposal Anda.
Pertanyaan esai respons terbatas
Nyatakan dua keunggulan dan dua kelemahan mempertahankan tarif tinggi untuk
barang-barang dari negara lain.
__________________________________________________________________
__
Pertanyaan-pertanyaan esai tanggapan-diperpanjang memungkinkan siswa
untuk memutuskan fakta mana yang menurut mereka paling relevan, untuk
memilih metode organisasi mereka sendiri, dan untuk menulis sebanyak yang
diperlukan untuk jawaban yang komprehensif. Dengan demikian, pertanyaan-
pertanyaan semacam itu cenderung mengungkapkan kemampuan untuk
mengevaluasi ide-ide. Untuk mengaitkannya secara koheren, dan
mengekspresikannya secara ringkas. Pada tingkat lebih rendah, mereka juga

27
mencerminkan perbedaan individu dalam sikap, nilai, dan kemampuan kreatif.
Terlepas dari kebajikan yang tampak dari pertanyaan esai tanggapan panjang,
mereka memiliki dua kelemahan: (1) mereka tidak efisien untuk mengukur
pengetahuan tentang materi faktual karena pertanyaannya sangat luas sehingga
hanya sedikit sampel konten yang dapat dimasukkan dalam satu penilaian. dan (2)
penilaian sulit dan cenderung tidak dapat diandalkan karena tanggapannya
mencakup serangkaian informasi faktual dari berbagai tingkat kebenaran,
diorganisasikan dengan berbagai tingkat koherensi dan dinyatakan dengan
berbagai tingkat keterbacaan dan keringkasan.
Pertanyaan esai respon terbatas meminimalkan beberapa kelemahan dari
pertanyaan esai respon panjang. Membatasi tipe respons membuatnya lebih mudah
untuk mengukur pengetahuan materi faktual dan mengurangi kesulitan penilaian.
Di sisi lain, tugas yang lebih terstruktur yang disajikan oleh pertanyaan esai
dengan respons terbatas membuatnya kurang efektif sebagai ukuran kemampuan
untuk memilih, mengatur, dan mengintegrasikan ide-ide.
Baik pertanyaan esai tanggapan panjang maupun pertanyaan esai respons terbatas
dapat melayani semua tujuan secara setara. Jenis pertanyaan esai untuk digunakan
dalam situasi tertentu tergantung terutama pada hasil pembelajaran yang akan
diukur dan, pada tingkat lebih rendah, pada pertimbangan praktis seperti kesulitan
penilaian.
2. Jenis Penilaian Kinerja Lainnya
Ada banyak jenis tugas penilaian kinerja lainnya. Ujian meliputi presentasi
lisan, konstruksi grafik, diagram atau model, penggunaan peralatan atau
instrumen ilmiah, mengetik: dan memainkan alat musik. Tugas dipilih sehingga
kinerja sesuai sedekat mungkin dengan tujuan instruksional yang penting.
Perbedaan dapat dibuat antara tugas kinerja respons terbatas dan tugas kinerja
respons diperluas. Jenis-jenis ini diilustrasikan di bawah ini.

CONTOH

28
Tugas kinerja respons yang diperluas
Persiapkan laporan cuaca untuk keadaan lain dan buat presentasi lisan dari laporan
ke kelas menggunakan tampilan visual yang sesuai.
Tugas kinerja respons terbatas
Ukur dan catat kelembaban relatif

Keutamaan dan keterbatasan dari tugas kinerja respons yang diperluas dan
terbatas hampir sama dengan yang terdaftar untuk pertanyaan esai respons yang
diperluas dan yang dibatasi. Kebebasan yang diberikan oleh tugas kinerja respons
diperpanjang memungkinkan siswa untuk menampilkan keterampilan penting
seperti pemecahan masalah, perencanaan, organisasi, integrasi, dan kreativitas.
Pertanyaan jenis ini juga memberikan kesempatan untuk mengamati kinerja siswa
dalam konteks yang lebih realistis daripada yang mungkin dengan item tes
objektif. Di sisi lain, mereka memakan waktu untuk dikelola dan sulit untuk
dinilai.
Tugas kinerja respons terbatas biasanya lebih mudah untuk dinilai dan
membutuhkan lebih sedikit waktu daripada tugas kinerja respons panjang. Namun,
mereka umumnya kurang cocok untuk mengukur keterampilan tingkat tinggi yang
diukur oleh tugas-tugas kinerja respons panjang.
3. Keunggulan Komparatif Item Tes Objektif dan Tugas Penilaian Kinerja
Baik item tes objektif dan tugas penilaian kinerja dapat memberikan bukti
berharga tentang prestasi siswa. Masing-masing memiliki kelebihan dan
keterbatasan yang membuatnya lebih sesuai untuk beberapa tujuan daripada
untuk yang lain. Perbandingan nilai relatif dari tes item objektif dan penilaian
kinerja disajikan pada tabel 2.6.Dalam mempertimbangkan keunggulan
komparatif dari tes objektif-item dan penilaian kinerja, kita harus berhati-hati
untuk tidak jatuh ke dalam salah satu atau pemikiran ini;

29
TABLE 2.6
Keunggulan komparatif dari tes objektif dan penilaian kinerja
Tes Objektif Penilaian kinerja
Hasil belajar fisien untuk mengukur Tidak efisien untuk
diukur pengetahuan fakta. mengukur pengetahuan
Beberapa jenis (mis., fakta. Dapat mengukur
Pilihan ganda) juga dapat pemahaman,
mengukur pemahaman, keterampilan berpikir,
keterampilan berpikir, dan hasil pembelajaran
dan hasil kompleks kompleks lainnya
lainnya. Tidak efisien (terutama berguna jika
atau tidak sesuai untuk orisinalitas respons
mengukur kemampuan diinginkan). Cocok untuk
untuk memilih dan mengukur kinerja pada
mengatur ide, tugas yang sesuai dengan
kemampuan menulis, dan tujuan instruksional yang
beberapa jenis penting dalam konteks
keterampilan pemecahan yang realistis.
masalah.
Persiapan Sejumlah besar Hanya beberapa tugas
pertanyaan pertanyaan diperlukan yang diperlukan untuk
untuk ujian. penilaian.
Persiapannya sulit dan
memakan waktu.
Pengambilan Memberikan contoh Pengambilan sampel
sampel tentu saja konten kursus yang konten kursus biasanya
konten ekstensif karena terbatas karena sejumlah
banyaknya pertanyaan kecil tugas yang dapat
yang dapat dimasukkan dimasukkan dalam
dalam tes. penilaian.
Kontrol respons Penataan lengkap batas Kebebasan untuk
siswa tugas siswa untuk jenis merespons dengan cara
respons yang diminta. sendiri memungkinkan
Mencegah gertak sambal siswa untuk
dan menghindari menampilkan orisinalitas
pengaruh keterampilan dan menebak dapat
menulis, meskipun item diminimalkan.
jenis seleksi dapat
ditebak. Penilaian
obyektif.
Mencetak gol Penilaian obyektif Penilaian penilaian.

30
Pengaruh pada Biasanya mendorong Mendorong siswa untuk
pembelajaran siswa untuk berkonsentrasi pada unit
mengembangkan materi pelajaran yang
pengetahuan yang lebih besar, dengan
komprehensif tentang penekanan khusus pada
fakta-fakta spesifik dan kemampuan untuk
kemampuan untuk mengatur,
membuat diskriminasi mengintegrasikan, dan
yang baik di antara mengekspresikan ide
secara efektif. Esai dapat
mendorong kebiasaan
menulis yang buruk jika
tekanan waktu adalah
faktor (hampir selalu
demikian).
Keandalan Keandalan yang tinggi Keandalan biasanya
dimungkinkan dan rendah, terutama karena
biasanya diperoleh penilaian yang tidak
dengan tes yang konsisten dan sampel
dibangun dengan baik. tugas yang terbatas.

Untuk menggunakan item objektf atau tugas penilaian, kinerja. Seringkali lebih
baik menggunakan keduanya, dengan masing-masing mengukur hasil
pembelajaran tertentu yang paling cocok. Ini juga harus memiliki pengaruh yang
diinginkan pada pembelajaran siswa. Karena dalam mempersiapkan ujian
tersebut,siswa harus memperhatikan jenis-jenis spesifik hasil pembelajaran yang
diukur di item objektif sebagaimana akan sebagai sistem dan hasil kerja
terintegrasi diukur dwngan tugas-tugas penilaian kinerja. Memilih Jenis Barang
dan Tugas yang Paling Tepat. Prinsip dasar dalam memilih jenis item tes dan tugas
penilai untuk digunakan dalam memilih jenis item yang memberikan ukuran
paling langsung dari hasil pembelajaran yang dimaksudkan jika, sebgai contoh,
hasil belajar yang dimaksudkan adalah menulis, memberi nama, daftar, atau tugas
berbicara, harus meminta siswa untuk memberi jawaban. Jika hasilnya melibatkan
peralatan laboratorium untuk menyelesaikan masalah, tidak ada yang cukup dari
tugas kinerja laboratorium yang sebenarnya sudah cukup. Di sisi lain, jika tugas

31
membutuhkan identifikasi jawaban yang benar, tipe seleksi harus digunakan.
Dalam kasus-kasus di mana hasil belajar yang spesifik tidak memperjelas
penggunaan jenis IQ yang mana, jenis-pilihan akan disukai karena kontrol yang
lebih besar atas respon siswa dan obyektivitas penilaian. Tes objek item berikut
disiapkan untuk unit cuaca yang dibahas sebelumnya. Catatbagaimana setiap jenis
item objektif memberikan ukuran langsung dari hasil yang dirancang untuk diukur.
EXAMPLE . short-answer
Specific Learning Outcome Writes a definition of each
term
Arah: Tulis defenisi satu kalimat dari masing-
masing istilah beriku!
1. Cuaca
2. Kelembaban
3. Depan tersumbat
Hasil pembelajaran khusus: nama instrumen yang digunakan untuk mengukur
jumlah curah hujan di suatu wilayah tertentu disebut....
a. (an).................
Hasil belajar khusus: buat daftar karakteristik dari fenomena cuaca tertentu!
1. Daftar tiga karakter utama badai
Hasil belajar spesifik: mengukur kelembaban relatif
1. Gunakan instrumen yag sesuai untuk mengukur kelembaban relatif dan
mencatat nilaiyang diperoleh
Bagian II tes dan penilaian kelas
Item pilihan ganda
Hasil pembelajaran khusus: mengidentifikasi unit pengukuran yang digunakan
dalam melaporkan setiap elemen cuaca pada peta cuaca.
1. Peta cuaca Amerika Serikat menunjukkan tekanan udara masuk
A. Inci C. pound
B. Kaki D. milibar

32
Item Benar-Salah
Hasil Pembelajaran Khusus: membedakan antara prosedur yang benar dan salah
untuk menentukan setiap elemen cuaca.
T F 1. Titik embun ditentukan dengan sampel udara hingga bebas kelembaban.
T F 2. Langit-langit ditentukan dengan menggunakan balon yang naik pada
tingkat yang diketahui.
Item yang Cocok
Hasil Belajar Spesifik: mencocokkan setiap instrumen cuaca dengan elemen cuaca
yang diukur.
Arah: pada baris di sebelah kiri setiap elemen cuaca di kolom A, tulis di kolom B
dapat digunakan sekali, atau tidak sama sekali.
Kolom A kolom B
(B) 1. Tekanan udara A. Alat pengukur jurusan angin
(E) 2. Suhu udara B. Barometer
(C) 3. Kelembaban C. Hygrometer
(A) 4. Kecepatan angin D. Alat pengukur hujan
E. thermometer
F. Baling-baling angi

Dalam memutuskan item jenis sekeksi mana yang aan digunakan, praktik
umum adalah menggunakan item pilihan ganda jika itu akan mengukur hasil
belajar secara langsung seperti dua jenis lainnya. Penggunaan item Benar-Salah
biasanya paling berharga dalam hal-hal khusus dimana hanya ada dua alternatif
yang mungkin ( e. g., membedakan antara prosedur yang benar dan yang salah ).
Item yang cocok adalah bentu khusus dari item pilihan ganda dan harus digunakan
hanya jika serangkaian hal-hal yang homogen harus terkait ( misalnya, tanggal
dan acara, penulis dan buku, instrumen dan penggunaan). Item pilihan banyak
disukai untuk sebagian besar tugas jenis seleksi lainnya karena penggunaan empat
atau lima alternatif mengurangi peluang menebak jawaban dan memberikan

33
petunjuk kepada siswa kesalahpahaman. Lihat Lampiran F untuk contoh lebih
lanjut tentang bagaimana menghubungkan item tes dengan hasil pembelajaran
yang diinginkan.
Apakah item tes atau tugas penilaian benar-benar mengukur kinerja tertentu
yang diminta oleh hasil pembelajaran tertentu, tentu saja tergantung. Sebagian
besar pada keterampilan yang item tes atau tugas penilaian dibangun. Namun,
tidak ada keterampilan yang memungkinkan kita untuk mengembangkan tes atau
penilaian prestasi yang valid jika item atau tugas yang dipilih untuk digunakan
tidak tepat untuk mengukur hasil yang diinginkan.

E. Pertimbangan Dalam Menyiapkan Barang Uji Relevan Dan Tugas Penilaian


Konstruksi barang dan tugas harus didahului dengan serangkaian langkah
awal. Pertama, tujuan dari tes atau penilaian harus ditentukan. Kedua, serangkaian
spesifikasi harus dikembangkan. Ketiga, jenis item tes dan tugas penilaian kinerja
yang paling tepat harus dipilih. Akhirnya, barang dan tugas harus dikonstruksi
sesuai dengan spesifikasi yang dikembangkan selama langkah sebelumnya. Aturan
untuk membangun setiap jenis item objektif akan dibahas dalam bab 6 hingga 8,
dan aturan untuk menyusun penilaian kinerja akan dibahas dalam Bab 9 dan 10. Di
sini kita akan fokus pada beberapa pertimbangan umum yang terlibat dalam
menyiapkan item tujuan yang relevan dan tugas penilaian.
Mencocokkan Barang dan Tugas dengan Hasil yang Dimaksudkan
Tes assroom dan penilaian paling mungkin untuk memberikan ukuran yang valid
dari tujuan instruksional jika item tes dan tugas penilaian dirancang untuk
mengukur kinerja yang ditentukan oleh hasil pembelajaran tertentu. Proses
mencocokkan item tes dan tugas penilaian dengan hasil pembelajaran yang akan
diukur diilustrasikan sebelumnya. Pada dasarnya, ini melibatkan pemasangan
setiap item atau tugas sedekat mungkin dengan hasil yang diinginkan, sebagai
berikut:
 

34
CONTOH Hasil Belajar spesifik: mengidentifikasi fungsi struktur tubuh yang
diberikan.
Butir uji yang relevan:
Apa fungsi ginjal?
A. Menghilangkan produk limbah
B. Meningkatkan sirkulasi darah
C. Pertahankan pernapasan
D. Merangsang pencernaan
Dengan demikian, persiapan item tes yang relevan dan tugas penilaian berarti
menganalisis kinerja yang dijelaskan dalam hasil pembelajaran khusus (yaitu,
"Identifikasi fungsi ...") dan membangun item tes atau tugas penilaian yang
menghasilkan kinerja (yaitu, "Apa fungsi dari ...?"). Perhatikan bahwa hasil
pembelajaran spesifik menentukan jenis respons yang diharapkan dari siswa, tetapi
itu tidak menunjukkan konten kursus spesifik (mis., Ginjal) yang harus
diidentifikasi siswa. Menjaga hasil pembelajaran bebas dari konten kursus tertentu
memungkinkan untuk memasukkan tanggapan yang diinginkan ke berbagai bidang
konten. Sebagai contoh, siswa dapat diminta untuk mengidentifikasi fungsi
jantung, paru-paru, otot, atau struktur tubuh lainnya yang berkaitan dengan isi
kursus. Itu
kinerja siswa yang diinginkan dinyatakan dalam hasil pembelajaran khusus dapat
dikunci untuk setiap bidang konten tertentu melalui tabel spesifikasi.
Dalam beberapa kasus mungkin diinginkan untuk menyiapkan pola item umum
sebagai langkah perantara antara hasil belajar spesifik dan item tes. Pola item
umum untuk item tes ilustrasi kami adalah sebagai berikut:
CONTOH apa fungsi dari ..?
Pola item seperti ini dapat diselesaikan dengan menambahkan nama struktur tubuh
apa pun dan menggunakannya sebagai pertanyaan jawaban pendek atau dengan
mendaftar alternatif yang sesuai dan menggunakannya sebagai item pilihan ganda.
Dengan demikian, menggunakan pola item sebagai panduan, kita bisa

35
menghasilkan sejumlah besar item tes relavent untuk hasil belajar khusus ini.
Prosedur ini sangat berguna ketika file item pengujian sedang dipersiapkan atau
ketika lebih dari satu bentuk diperlukan (mis., Pretesting, post-testing, dan
pengujian ulang).
Ketika pola item digunakan sebagai panduan untuk menguji konstruksi, mereka
dapat diatur oleh tipe umum hasil pembelajaran.

CONTOH hasil pengetahuan


1. Apa nama dari ...?
2. Apa lokasi ...?
3. Apa karakteristik dari ...?
4. Apa fungsi dari ...?
Memahami Hasil
1. Apa alasan untuk ...?
2. Apa hubungan antara ...?
3. Manakah dari ini adalah contoh dari ...?
4. Manakah dari rangkuman terbaik ini ...?
Hasil Aplikasi
1. Metode apa yang terbaik untuk ...
2. Langkah apa yang harus diikuti untuk membangun ...?
3. Manakah dari ini menunjukkan aplikasi yang benar dari ...?
4. Manakah dari solusi ini yang benar untuk ...?
Pola barang seperti ini seharusnya tidak. Tentu saja, dikembangkan secara
sembarangan. Sebaliknya, mereka harus diturunkan dari hasil belajar spesifik yang
mereka wakili. Meskipun biasanya tidak akan mungkin untuk mengembangkan
pola item untuk semua hasil, daftar mereka akan membantu menghasilkan
kumpulan item tes yang relevan. Waktu pembuatan biaya tes yang dihemat dengan
menggunakan daftar seperti itu kemudian dapat digunakan untuk membangun item
yang lebih efektif untuk area-area di mana pola item umum tidak layak.

36
Memperoleh Sampel Barang dan Tugas yang representatif
Suatu tes atau penilaian, tidak peduli seberapa luas, hampir selalu merupakan
sampel dari banyak item atau tugas tes yang mungkin dapat dimasukkan. Kami
berharap siswa mengetahui ribuan fakta, tetapi kami dapat menguji hanya untuk
sejumlah fakta saja: kami mengharapkan siswa untuk mengembangkan
pemahaman yang berlaku untuk jumlah yang tidak terbatas,
tetapi kita dapat menguji aplikasi hanya dalam sejumlah situasi; dan kami berharap
siswa untuk mengembangkan keterampilan berpikir yang akan memungkinkan
mereka untuk memecahkan berbagai masalah, tetapi kami dapat menguji
kemampuan pemecahan masalah mereka dengan hanya sejumlah masalah. Di
setiap bidang konten dan untuk setiap hasil pembelajaran tertentu, maka, kami
hanya memilih sampel kinerja siswa dan menerimanya sebagai bukti prestasi di
bidang itu. Kami berasumsi bahwa respons siswa terhadap rangkaian item dan
tugas yang kami pilih tipical dari apa tanggapan mereka terhadap item dan tugas
lain yang diambil dari area yang sama. Ini berarti, tentu saja, bahwa sampel kami
yang terbatas harus dipilih sedemikian rupa sehingga mereka memberikan sampel
yang representatif sebanyak mungkin di masing-masing dari berbagai bidang di
mana tes atau penilaian sedang dikembangkan.
Sampling kami kemungkinan besar akan bersifat representatif ketika persiapan tes
atau penilaian dipandu oleh serangkaian spesifikasi yang disiapkan dengan cermat.
Kecuali jika tabel spesifikasi, atau perangkat serupa, digunakan sebagai panduan
dalam konstruksi, ada kecenderungan untuk membebani tes dengan item-item
yang mengukur pengetahuan tentang fakta-fakta yang terisolasi dan mengabaikan
hasil belajar yang lebih kompleks. Dalam penelitian resmi, misalnya, tidak jarang
memasukkan sejumlah besar item yang tidak proporsional yang mengukur
pengetahuan nama, tanggal, tempat, dan sejenisnya. Dalam ilmu pengetahuan,
mendefinisikan istilah dan struktur penamaan dan fungsi biasanya terlalu
ditekankan. Dalam matematika, keterampilan komputasi sering kali merupakan
satu-satunya hasil pembelajaran yang diukur. Dalam bagian bahasa dan literatur,

37
indentificatio dari partbof pidato, karakter literer, penulis, dan sejenisnya sering
terlalu menonjol. Hasil belajar ini ditekankan tidak dan sejenisnya sering terlalu
menonjol. Hasil-hasil pembelajaran ini ditekankan bukan karena kami
menganggap pengetahuan tentang fakta-fakta yang terisolasi lebih penting
daripada pemahaman, penerapan, interpretasi, dan berbagai keterampilan berpikir.
Sebaliknya, mereka biasanya menerima keunggulan yang tidak semestinya karena
kami merasa lebih mudah untuk membangun item tes semacam ini. Tanpa rencana
pengujian yang dikembangkan dengan cermat, kemudahan konstruksi terlalu
sering menjadi kriteria dominan dalam menghubungkan item-item tes. Sebagai
akibatnya, tes ini menggunakan sampel tugas belajar yang terbatas dan bias, dan
mengabaikan banyak hasil pembelajaran yang lebih penting.
Melengkapi pertanyaan tes objektif dengan tugas penilai kinerja adalah salah satu
cara untuk memastikan bahwa tujuan pembelajaran yang lebih luas diberikan
perhatian yang tepat. Namun, tidak efisien untuk hanya mengandalkan penilaian
kinerja untuk mengukur pemahaman yang lebih kompleks. Untuk alasan ini,
penting untuk menemukan cara membuat item tes objektif yang melakukan lebih
dari mengukur pengetahuan faktual. Salah satu pendekatan untuk tujuan ini
mengukur pencapaian yang kompleks adalah melalui penggunaan latihan
interpretatif. Pendekatan ini dibahas secara rinci dalam Bab 8.

BAGIAN II Tes dan Penilaian Ruang Kelas


Namber Item dan Tugas. Jumlah barang dan tugas, tentu saja, merupakan faktor
impor dan dalam memperoleh sampel yang representatif. Jumlah item dan jumlah
area tugas kinerja ditentukan ketika set spesifikasi dibangun dan tergantung pada
faktor-faktor seperti tujuan pengukuran, jenis item tes dan tugas penilaian yang
digunakan, usia siswa, dan tingkat reliabilitas diperlukan untuk penggunaan yang
efektif dari hasil tes atau penilaian. Dengan demikian, penilaian atas unit studi
sosial kelas tiga mungkin berisi tiga puluh item objektif, sedangkan tes survei
selama kursus studi sosial kelas sepuluh mungkin berisi lebih dari seratus item

38
objektif dan beberapa pertanyaan esai. Meskipun tidak ada aturan keras dan cepat
untuk menentukan jumlah item dan tugas, pertimbangan penting dari sudut
pandang pengambilan sampel adalah jumlah item atau tugas yang dikhususkan
untuk setiap area spesifik yang diukur. Kami ingin pengujian dan penilaian kami
cukup lama untuk memberikan sampel adequare dari setiap tujuan dan setiap area
konten. Sebagai patokan, diinginkan saat menyusun tes unit untuk menggunakan
setidaknya sepuluh item tes objektif untuk mengukur setiap hasil pembelajaran
tertentu. Jumlah ini, bagaimanapun, dapat diturunkan menjadi sedikitnya lima jika
tugas sangat terbatas (misalnya, "menambah angka satu digit," atau,
"Memanfaatkan nama yang tepat") dan siswa harus memberikan jawaban daripada
untuk pilih mereka. Untuk tes survei, di mana sampel item tes biasanya mencakup
area yang luas dan penekanannya pada skor total, menggunakan beberapa item tes
objektif untuk setiap hasil pembelajaran tertentu dan sepuluh atau lebih untuk
setiap tujuan umum mungkin akan cukup.
Masalah khusus pengambilan sampel muncul ketika hasil pembelajaran kompleks
sedang diukur, karena ini membutuhkan item tipe objektif yang lebih rumit
(disebut sebagai latihan interpretatif) dan tugas penilaian kinerja. Baik latihan
interpretatif dan tugas penilaian kinerja membutuhkan waktu administrasi yang
cukup, tetapi item tes tunggal atau tugas penilaian masih tidak memadai untuk
menentukan hasil yang diinginkan. Salah satu latihan yang menyerukan penafsiran
grafik, misalnya, tidak cukup untuk mengukur kemampuan menafsirkan grafik
secara memadai. Sifat data atau jenis grafik dapat menjadi faktor yang paling
berpengaruh dalam menentukan apakah ditafsirkan dengan benar. Ketika beberapa
grafik digunakan, efek dari faktor-faktor tersebut diminimalkan, dan kami
mendapatkan sampel yang lebih representatif dari kemampuan untuk menafsirkan
grafik.
Situasi serupa terjadi dengan penggunaan tugas penilaian kinerja. Kinerja setiap
tugas tunggal sangat bergantung pada sampel informasi tertentu yang diminta oleh
tugas tersebut, dan dengan demikian satu-satunya solusi yang layak adalah

39
membatasi setiap penilaian hasil yang kompleks pada area yang agak terbatas
(misalnya, interpretasi grafik, penyelesaian masalah) dan untuk menilai lebih
sering. Dalam hal apa pun, tujuan kami harus memperoleh sampel kinerja siswa
yang representatif sebanyak mungkin dalam setiap tugas penilaian area, semakin
besar kemungkinan sampel yang memadai dan semakin dapat diandalkan hasilnya.
Menghilangkan hambatan irellevant untuk kinerja
Saat menyusun item atau tugas penilaian, perhatian harus diberikan untuk
menghilangkan faktor-faktor asing yang mungkin menghalangi siswa untuk
melakukan yang terbaik. Jika siswa telah mencapai hasil pembelajaran tertentu
(mis., Pengetahuan tentang istilah), kami ingin mereka menjawab dengan benar
item tes yang mengukur pencapaian hasil belajar tersebut. Kami akan sangat tidak
senang (dan mereka juga) jika mereka menjawab item tes yang salah hanya karena
struktur kalimat terlalu kompleks, kosa kata terlalu sulit, atau jenis respons yang
menyerukan tidak jelas. Faktor-faktor ini, yang tidak sesuai dengan tujuan utama
pengukuran, membatasi dan memodifikasi respons siswa, dan mencegah mereka
menunjukkan tingkat pencapaian mereka yang sebenarnya. Faktor-faktor seperti
itu tidak adil seperti menentukan kemampuan berlari seseorang ketika pergelangan
kaki terkilir. Meskipun ukuran kemampuan berlari akan diperoleh, kinerja akan
dibatasi oleh faktor yang tidak ingin kami sertakan dalam pengukuran kami.
Salah satu cara untuk menghilangkan faktor-faktor yang tidak sesuai dengan
tujuan pengukuran adalah untuk memastikan bahwa semua siswa memiliki
keterampilan dan kemampuan yang diperlukan untuk membuat respons. Ini
disebut perilaku yang memungkinkan karena memungkinkan siswa untuk
membuat respons tetapi tidak dimaksudkan sebagai faktor penting dalam
pengukuran. Artinya, mereka adalah syarat tetapi tidak cukup kondisi untuk
merespon dengan benar atau melakukan tugas dengan baik. Mungkin perilaku
pemungkin yang paling penting dalam pengujian objektif adalah keterampilan
membaca. Dalam penilaian kinerja tertulis, keterampilan dalam ekspresi tertulis
merupakan faktor tambahan yang harus dipertimbangkan. Dalam mengukur

40
pemahaman, berpikir ski, dan hasil pembelajaran kompleks lainnya, pengetahuan
tentang fakta-fakta tertentu dan keterampilan komputasi sederhana juga mungkin
menjadi prasyarat yang diperlukan.
Maka, dalam menyusun tes dan penilaian, kita perlu mengupayakan hal-hal dan
tugas-tugas yang mengukur pencapaian hasil pembelajaran tertentu dan bukan
perbedaan dalam perilaku yang memungkinkan. Perbedaan dalam kemampuan
membaca, keterampilan komputasi, keterampilan komunikasi, dan sejenisnya
seharusnya tidak mempengaruhi respons siswa kecuali jika hasil tersebut secara
khusus diukur. Satu-satunya perbedaan fungsional antara siswa yang berprestasi
baik pada tugas dan mereka yang berprestasi rendah adalah kepemilikan
pengetahuan, pemahaman, atau hasil belajar lainnya yang diukur oleh tugas
tersebut. Semua perbedaan lain tidak sesuai dengan tujuan tugas, dan pengaruhnya
harus dihilangkan atau dikendalikan untuk hasil yang valid.
Masalah khusus dalam mencegah faktor-faktor luar dari mendistorsi pengujian dan
hasil penilaian kami adalah menghindari ambiguitas. Item tes objektif terutama
dapat disalahtafsirkan ketika kalimat yang panjang dan kompleks digunakan,
ketika kosakata sulit, dan ketika kata-kata yang tidak memiliki makna yang tepat
digunakan. Dengan demikian, dari sudut pandang tingkat kesulitan membaca dan
ketepatan makna, penangkal ambiguitas tampaknya menjadi pilihan kata yang
hati-hati dan penggunaan kalimat yang singkat dan ringkas. Dalam beberapa
kasus, ambiguitas dapat dikurangi dengan menggunakan gambar atau bahan
ilustratif lainnya harus, tentu saja, juga diperiksa dengan cermat untuk
memastikannya jelas dan tidak ambigu.
Suatu upaya juga harus dilakukan untuk menghindari bias ras, etnis, atau gender
dalam mempersiapkan item-item tes dan tugas penilaian kinerja. Kosakata dan
situasi tugas harus dapat diterima oleh berbagai kelompok ras dan etnis dan untuk
laki-laki dan perempuan, dan harus bebas dari stereotip. Misalnya dalam
mempresentasikan

41
BAGIAN II tes dan penilaian kelas
PANDUAN
Beberapa Kemungkinan Hambatan dalam Tes
Item dan Tast Assessment
1. Pernyataan yang mendua
2. Kata yang berlebihan
3. Kosakata yang sulit
4. Struktur kalimat yang kompleks
5. Instruksi tidak jelas
6. Bahan ilustrasi tidak jelas
7. Bias ras, etnis, atau gender

Karakter dalam masalah cerita, bagian bacaan, atau situasi ujian lainnya, minoritas
tidak boleh digambarkan dengan cara stereotip. Demikian pula, situasi tugas tidak
selalu menempatkan laki-laki dalam peran tradisional seperti atlet, eksekutif
bisnis, dan orang profesional dan perempuan dalam peran tradisional seperti ibu
rumah tangga, guru, dan perawat. Penggunaan peran yang berbeda secara
seimbang untuk minoritas dan pria dan wanita diperlukan jika kita ingin
menghindari bias sebagai kemungkinan barries untuk kinerja maksimal. Lihat
kotak “Pedoman” yang menyertai.

Menghindari Petunjuk yang Tidak Diinginkan dalam Item Tes Objektif

Item tes harus dibangun sehingga siswa memperoleh jawaban yang benar hanya
jika mereka telah mencapai hasil belajar yang diinginkan. Dalam prinsip
sebelumnya, kami prihatin dengan faktor-faktor yang mencegah petunjuk untuk
item berikut:

CONTOH Seekor lumba-lumba adalah

42
Sebuah tanaman.
B. Reptil.
C. Hewan.
D. Bird.
BAB 5 Perencanaan Tes Kelas dan Penilaian
Petunjuk seperti itu tidak terbatas pada item tipe seleksi, seperti yang ditunjukkan
pada item tipe supply berikut:
CONTOH Sepotong tanah yang sepenuhnya dikelilingi oleh air dikenal sebagai
Petunjuknya jauh lebih tidak jelas bagi orang yang membuat item tes ini daripada
petunjuk dalam ilustrasi pertama kami. Namun, bagi siswa yang mengikuti ujian,
itu sudah jelas. Dua jawaban yang paling masuk akal adalah pulau dan
semenanjung. Karena semenanjung dimulai dengan bunyi konsonan dan tidak
mengikuti artikel dan, itu dikesampingkan sebagai suatu kemungkinan. Ini tidak
berarti, tentu saja, bahwa siswa perlu mengetahui aturan untuk strukter tata bahasa
yang baik untuk menggunakan petunjuk; sebagian besar petunjuk dianalisis dalam
hal pengetahuan parsial dan firasat. Semenanjung tidak terdengar benar bagi siswa,
sehingga kata pulau digunakan dan jawaban yang benar diperoleh.
Mengarah ke jawaban yang benar juga dapat diberikan oleh asosiasi verbal
sederhana. Perhatikan bagaimana kata wind pada item berikut memberikan
petunjuk untuk jawabannya:
CONTOH instrumen manakah yang digunakan untuk menentukan arah angin?
A. Anemometer.
B. Barometer
C. Hygrometer.
D. Baling-Baling Angin.

      Daripada mengarahkan yang kurang informasi ke jawaban yang benar,


petunjuk sunh seharusnya membuat orang miskin berprestasi menjauh dari

43
jawaban yang benar. Dalam item berikut petunjuk yang sama membuat baling-
baling angin jawaban yang masuk akal (tetapi salah) untuk siswa thouse yang
belum belajar penggunaan berbagai instrumen cuaca.

CONTOH APA salah satu instrumen berikut digunakan untuk menentukan


kecepatan angin?
A. Anemometer.
B. Barometer.
C. Hygrometer.
D. Baling-Baling Angin.
    Petunjuk verbal tidak perlu sejelas ini. Faktanya, petunjuk yang muncul dalam
versi akhir suatu tes biasanya agak halus, karena didasarkan pada pengetahuan
parsial dan asosiasi verbal yang tidak mudah terlihat oleh pengamat biasa. Sebagai
contoh, sekilas item berikut tampaknya bebas dari petunjuk

BAGIAN II tes dan penilaian ruang kelas


contoh mana yang berikut ini yang digunakan untuk mencegah polio?
A. Gamma globuling.
B. Penicilling.
C. Vaksin Salk.
D. Sulfa
Akan tetapi, pemeriksaan item ini akan menunjukkan bahwa kata vaksin
memberikan petunjuk untuk jawabannya. Semua siswa perlu tahu untuk menjawab
item dengan benar adalah bahwa vaksin digunakan untuk mencegah penyakit.
Karena sebagian besar siswa memiliki keunggulan yang diperlukan untuk
membuat petunjuk itu jelas bagi mereka. Beberapa siswa juga mungkin telah
mengembangkan hubungan verbal antara salk ad polio dan merespons dengan
benar atas dasar itu. Dalam kedua kasus tersebut, pengetahuan sebagian dapat

44
mengarah pada jawaban yang benar dan mencegah item berfungsi sebagaimana
mestinya.
Jenis lain dari petunjuk halus adalah yang didasarkan pada kata-kata yang
digunakan untuk memenuhi syarat pernyataan. Sebagai contoh, pernyataan benar-
salah yang mencakup kualifikasi seperti kadang-kadang, biasanya, secara umum,
dan sejenisnya paling sering benar, sedangkan pernyataan yang mengandung
absolut seperti selalu, tidak pernah, tidak ada, dan hanya yang paling sering salah.
kata-kata seperti itu disebut penentu spesifik. Mereka sulit untuk dihapus dari item
benar-salah karena pernyataan benar umumnya harus memenuhi syarat, dan
pernyataan salah sering harus dinyatakan dalam istilah absolut untuk membuat
mereka jelas salah.
Petunjuk umum lainnya dalam item tipe seleksi meliputi (1) menyatakan jawaban
yang benar dalam bahasa buku teks atau lebih detail daripada jawaban yang salah,
(2) membuat jawaban yang benar lebih panjang dari jawaban yang salah, dan (3)
menempatkan jawaban yang benar di beberapa pola yang dapat diidentifikasi
(mis., T. F. T. F). Beberapa petunjuk ini lebih mungkin terdeteksi oleh siswa
berprestasi rendah yang putus asa mencari beberapa dasar untuk menjawab.
PANDUAN
Beberapa Petunjuk Umum dalam Item Tes
1. Inkonsistensi gramatikal
2. Asosiasi verbal
3. Penentu spesifik e. g., selalu)
4. Frase tanggapan yang benar
5. Panjang tanggapan yang benar
6. Lokasi tanggapan yang benar

BAB 5 Perencanaan Tes dan Penilaian Ruang Kelas

Saran Umum Untuk Menulis Item Tes dan Tugas Penilaian

45
Dalam menyiapkan satu set item tes atau tugas penilaian, ada beberapa aturan
umum yang berlaku untuk semua jenis item atau tugas. Ini akan dicantumkan di
sini. Aturan khusus untuk menulis setiap item atau jenis tugas akan dibatalkan dan
diilustrasikan dalam bab-bab berikut.
1. Gunakan spesifikasi tes dan penilaian Anda sebagai panduan. Spesifikasi
menggambarkan kinerja yang akan diukur dan sampel hasil pembelajaran untuk
diukur. Dengan demikian, mereka berfungsi sebagai bantuan untuk memilih jenis
item dan tugas untuk mempersiapkan, untuk menulis, dan untuk menentukan
berapa banyak item dan tugas yang diperlukan untuk setiap subdomain
pencapaian.
2. Tulis lebih banyak item dan tugas daripada yang dibutuhkan. Mempersiapkan
lebih banyak item tes dan tugas penilaian dari yang dibutuhkan akan
memungkinkan item dan tugas yang lebih lemah dibuang saat ditinjau kemudian.
Ini juga akan membuatnya lebih mudah untuk mencocokkan set akhir item dan
tugas dengan spesifikasi.
3. Tulis item dan tugas dengan baik sebelum tanggal pengujian.
Mengesampingkan item dan tugas selama beberapa hari dan kemudian
meninjaunya dengan pandangan baru akan mengungkapkan kurangnya kejelasan
atau ambiguitas yang diabaikan selama preoaration mereka. Seringkali
mengejutkan berapa banyak cacat yang lolos selama penulisan aslinya.
4. Tuliskan masing-masing item tes dan tugas penilaian sehingga menghasilkan
kinerja yang dijelaskan dalam hasil pembelajaran yang dimaksudkan. Baik selama
menulis dan mengulas, membandingkan tugas yang diminta siswa untuk dilakukan
dengan hasil pembelajaran yang dirancang untuk diukur untuk memastikan
keduanya cocok.
5. Tuliskan masing-masing item tes dan tugas penilaian sehingga tugas yang akan
dilakukan didefinisikan dengan jelas. Kejelasan diperoleh dengan merumuskan
dengan hati-hati pertanyaan dan instruksi, menggunakan bahasa yang sederhana

46
dan langsung, menggunakan tanda baca dan tata bahasa yang benar, dan
menghindari kata-kata yang tidak perlu.
6. Tulis setiap item atau tugas pada tingkat bacaan yang sesuai. Pertahankan
tingkat kesulitan membaca dan kosakata sesederhana mungkin untuk mencegah
faktor-faktor ini mendistorsi hasil. Respons siswa harus ditentukan oleh kinerja
yang diukur, bukan oleh beberapa faktor item atau tugas tidak dirancang untuk
diukur.
7. Tulis setiap item atau tugas sehingga tidak memberikan bantuan dalam
menanggapi item atau tugas lain. Kecuali jika diperhatikan selama penulisan, satu
item dapat memberikan informasi yang berguna dalam menjawab item lain.
Sebagai contoh, nama, tanggal, atau fakta yang secara tidak sengaja dimasukkan
dalam batang item pilihan ganda dapat dipanggil untuk item jawaban singkat di
bagian lain dari tes.
8. Tuliskan masing-masing item sehingga jawabannya adalah satu hal yang akan
disetujui oleh para ahli, atau, dalam hal tugas penilaian, tanggapan yang dinilai
sangat baik akan disetujui oleh para ahli.
Aturan ini mudah dipenuhi saat mengukur pengetahuan faktual tetapi lebih sulit
ketika mengukur hasil yang kompleks yang membutuhkan esai yang diperluas atau
jenis kinerja lainnya.
BAGIAN II Tes dan penilaian ruang kelas
9. Kapan pun item tes atau tugas penilaian direvisi, periksa kembali relevansinya.
Ketika meninjau item atau tugas untuk kesesuaian, kejelasan, kesulitan, dan
kebebasan dari petunjuk dan bias, beberapa revisi sering diperlukan. Setelah
merevisi item atau tugas, periksa untuk memastikan bahwa item tersebut masih
memberikan ukuran yang relevan dari hasil pembelajaran yang dimaksudkan.
Bahkan sedikit perubahan kadang-kadang dapat memodifikasi fungsi item atau
tugas.

47
Berfokus pada Peningkatan Pembelajaran dan Instruksi
Tujuan utama pengujian dan penilaian adalah untuk meningkatkan pembelajaran
siswa. Saat Anda menyusun tes dan penilaian di kelas, perlu diingat sejauh mana
itu mungkin berkontribusi, secara langsung atau tidak langsung, ke arah tujuan ini.
Tes dan penilaian kelas yang dibangun dengan baik harus meningkatkan kuantitas
dan kualitas pembelajaran siswa.
1. Tes dan penilaian dapat memiliki pengaruh yang diinginkan pada pembelajaran
siswa jika perhatian diberikan pada luasnya dan kedalaman konten dan hasil
pembelajaran diukur. Ketika kami memilih sampel konten yang representatif dari
semua area yang tercakup dalam instruksi kami, kami menekankan kepada siswa
bahwa mereka harus mencurahkan perhatian pada semua area. Mereka tidak dapat
mengabaikan beberapa aspek dari kursus dan mengerjakan ujian dengan baik.
Demikian pula, ketika tes kami mengukur berbagai jenis hasil pembelajaran, siswa
segera belajar bahwa banyak informasi faktual yang dihafal tidak cukup. Mereka
juga harus belajar menafsirkan dan menerapkan fakta, mengembangkan
pemahaman konseptual yang mendalam, menarik kesimpulan, mengenali asumsi,
mengidentifikasi hubungan sebab-akibat, menghasilkan hipotesis, memecahkan
masalah yang bermakna, dan sejenisnya. Ini mengecilkan hati siswa dari hanya
bergantung pada hafalan sebagai dasar untuk belajar, dan mendorong mereka
untuk mengembangkan penggunaan proses mental yang lebih kompleks.
Tulis item dan tugas dengan baik sebelum tanggal pengujian. Menyingkirkan item
dan tugas selama beberapa hari. Menulis lebih banyak item dan tugas daripada
yang dibutuhkan. Mempersiapkan lebih banyak item tes dan tugas penilaian dari
yang dibutuhkan akan memungkinkan item dan tugas yang lebih lemah dibuang
saat ditinjau kemudian. Ini juga akan membuatnya lebih mudah untuk
mencocokkan set akhir item dan tugas dengan spesifikasi.
3. dan kemudian meninjaunya dengan pandangan baru akan mengungkapkan
kurangnya kejelasan atau ambiguitas yang diabaikan selama preoaration mereka.
Seringkali mengejutkan berapa banyak cacat yang lolos selama penulisan aslinya.

48
4. Tuliskan masing-masing item tes dan tugas penilaian sehingga menghasilkan
kinerja yang dijelaskan dalam hasil pembelajaran yang dimaksudkan. Baik selama
menulis dan mengulas, membandingkan tugas yang diminta siswa untuk dilakukan
dengan hasil pembelajaran yang dirancang untuk diukur untuk memastikan
keduanya cocok.
5. Tuliskan masing-masing item tes dan tugas penilaian sehingga tugas yang akan
dilakukan didefinisikan dengan jelas. Kejelasan diperoleh dengan merumuskan
dengan hati-hati pertanyaan dan instruksi, menggunakan bahasa yang sederhana
dan langsung, menggunakan tanda baca dan tata bahasa yang benar, dan
menghindari kata-kata yang tidak perlu.
6. Tulis setiap item atau tugas pada tingkat bacaan yang sesuai. Pertahankan
tingkat kesulitan membaca dan kosakata sesederhana mungkin untuk mencegah
faktor-faktor ini mendistorsi hasil. Respons siswa harus ditentukan oleh kinerja
yang diukur, bukan oleh beberapa faktor item atau tugas tidak dirancang untuk
diukur.
7. Tulis setiap item atau tugas sehingga tidak memberikan bantuan dalam
menanggapi item atau tugas lain. Kecuali jika diperhatikan selama penulisan, satu
item dapat memberikan informasi yang berguna dalam menjawab item lain.
Sebagai contoh, nama, tanggal, atau fakta yang secara tidak sengaja dimasukkan
dalam batang item pilihan ganda dapat dipanggil untuk item jawaban singkat di
bagian lain dari tes.
8. Tuliskan masing-masing item sehingga jawabannya adalah satu hal yang akan
disetujui oleh para ahli, atau, dalam hal tugas penilaian, tanggapan yang dinilai
sangat baik akan disetujui oleh para ahli.
Aturan ini mudah dipenuhi saat mengukur pengetahuan faktual tetapi lebih sulit
ketika mengukur hasil yang kompleks yang membutuhkan esai yang diperluas atau
jenis kinerja lainnya.
BAGIAN II Tes dan penilaian ruang kelas

49
9. Kapan pun item tes atau tugas penilaian direvisi, periksa kembali relevansinya.
Ketika meninjau item atau tugas untuk kesesuaian, kejelasan, kesulitan, dan
kebebasan dari petunjuk dan bias, beberapa revisi sering diperlukan. Setelah
merevisi item atau tugas, periksa untuk memastikan bahwa item tersebut masih
memberikan ukuran yang relevan dari hasil pembelajaran yang dimaksudkan.
Bahkan sedikit perubahan kadang-kadang dapat memodifikasi fungsi item atau
tugas.

Berfokus pada Peningkatan Pembelajaran dan Instruksi


Tujuan utama pengujian dan penilaian adalah untuk meningkatkan pembelajaran
siswa. Saat Anda menyusun tes dan penilaian di kelas, perlu diingat sejauh mana
itu mungkin berkontribusi, secara langsung atau tidak langsung, ke arah tujuan ini.
Tes dan penilaian kelas yang dibangun dengan baik harus meningkatkan kuantitas
dan kualitas pembelajaran siswa.
1. Tes dan penilaian dapat memiliki pengaruh yang diinginkan pada pembelajaran
siswa jika perhatian diberikan pada luasnya dan kedalaman konten dan hasil
pembelajaran diukur. Ketika kami memilih sampel konten yang representatif dari
semua area yang tercakup dalam instruksi kami, kami menekankan kepada siswa
bahwa mereka harus mencurahkan perhatian pada semua area. Mereka tidak dapat
mengabaikan beberapa aspek dari kursus dan mengerjakan ujian dengan baik.
Demikian pula, ketika tes kami mengukur berbagai jenis hasil pembelajaran, siswa
segera belajar bahwa banyak informasi faktual yang dihafal tidak cukup. Mereka
juga harus belajar menafsirkan dan menerapkan fakta, mengembangkan
pemahaman konseptual yang mendalam, menarik kesimpulan, mengenali asumsi,
mengidentifikasi hubungan sebab-akibat, menghasilkan hipotesis, memecahkan
masalah yang bermakna, dan sejenisnya. Ini mengecilkan hati siswa dari hanya
bergantung pada hafalan sebagai dasar untuk belajar, dan mendorong mereka
untuk mengembangkan penggunaan proses mental yang lebih kompleks. tes dan
penilaian yang mengukur berbagai hasil pembelajaran juga harus mengarah pada

50
peningkatan prosedur pengajaran dan, dengan demikian, secara tidak langsung
meningkatkan pembelajaran siswa. Ketika kami menerjemahkan berbagai hasil
pembelajaran Membangun menjadi item tes dan tugas penilaian, kami
mengklarifikasi bangsa kita pemahaman, keterampilan berpikir, dan hasil belajar
yang kompleks lainnya. Klarifikasi ini memungkinkan kita untuk merencanakan
pengalaman belajar siswa secara lebih efektif dan meningkatkan tingkat dimana
kita menekankan pemahaman, keterampilan berpikir, dan hasil pembelajaran
kompleks lainnya dalam pengajaran kita. Tes atau penilaian yang dibangun dengan
baik sering kali mengarah pada tinjauan prosedur pengajaran dan mengabaikan
mereka yang mendorong pembelajaran hafalan.
3. Tes dan penilaian akan berkontribusi pada peningkatan hubungan guru-siswa
(dengan efek menguntungkan pada pembelajaran siswa) jika siswa melihat tes dan
penilaian sebagai langkah adil dan berguna untuk pencapaian mereka. Kita dapat
membuat keadilan terlihat dengan memasukkan sampel yang representatif dari
hasil pembelajaran yang telah ditekankan selama pengajaran, dengan menulis arah
yang jelas, dengan memastikan bahwa maksud dari setiap item atau tugas adalah
dan bahwa setiap item bebas dari segala jenis bias yang akan mencegah orang
yang berpengetahuan dari tampil
RINGKASAN
Merencanakan tes dan penilaian kelas melibatkan (1) menentukan tujuan
pengukuran, (2) mengembangkan seperangkat spesifikasi, (3) memilih jenis item
tes yang tepat dan tugas penilaian dan (4) menyiapkan satu set item dan tugas yang
relevan.
Tes dan penilaian kelas dapat digunakan untuk berbagai tujuan pengajaran, paling
baik dijelaskan dalam hal lokasi mereka dalam urutan pengajaran. Ada (1) pretest
di awal kursus atau unit untuk menentukan kesiapan belajar, untuk membantu
dalam perencanaan pengajaran, dan untuk membuat penempatan lanjutan; (2) tes
dan penilaian selama instruksi untuk meningkatkan dan mengarahkan
pembelajaran siswa dan untuk mengidentifikasi dan memperbaiki kesalahan

51
pembelajaran: amd (3) tes akhir penilaian dan penilaian yang digunakan pada
akhir kursus atau unit untuk menetapkan nilai, mensertifikasi pencapaian, atau
mengevaluasi pengajaran. Masing-masing jenis pengujian dan penilaian kelas ini
menempatkan tuntutan yang berbeda pada pengambilan sampel item dan tugas dan
jenis interpretasi yang digunakan (yaitu, kriteria-rujukan atau norma-rujukan).
Contoh kinerja siswa lebih cenderung representatif jika serangkaian spesifikasi
digunakan dalam merencanakan tes atau penilaian. Spesifikasi menentukan dan
membatasi domain pencapaian yang akan diukur dan menggambarkan sampel item
tes dan tugas penilaian yang harus disiapkan. Salah satu bentuk spesifikasi adalah
grafik dua arah yang disebut tabel spesifikasi. Membangun tabel melibatkan (1)
memperoleh daftar tujuan pembelajaran, (2) menguraikan konten kursus, dan (3)
menyiapkan grafik dua arah yang menghubungkan tujuan instuctional dengan
konten kursus dan menentukan jenis sampel yang diinginkan atau item dan tugas.
Meskipun daftar spesifikasi sangat berguna
Dalam mempersiapkan tes sumatif dan penilaian (karena cakupan yang luas), ini
juga berguna dalam mempersiapkan beberapa tes dan penilaian formatif. Namun,
dalam kasus lain, rencana pengujian atau penilaian mungkin terbatas pada daftar
singkat tentang hasil pembelajaran yang spesifik dan dinyatakan secara tepat, atau
mungkin memuat serangkaian spesifikasi yang komprehensif dan terperinci
dengan item atau tugas sampel ilustratif.
Kategori utama tes obyektif atau penilaian kinerja dapat dibagi lagi menjadi
beberapa jenis item tes dan tugas penilaian berikut:
Tes Objektif
A. Jenis suply
1. Jawaban singkat
2. selesai
B. jenis seleksi
1. Benar-salah atau alternatif-respons
2. Cocok

52
3. Pilihan ganda
Penilaian kinerja
A. Respon yang diperluas
B. Respon terbatas
Tes objektif memberi siswa tugas yang sangat terstruktur yang membatasi respons
mereka untuk memasok kata, frasa singkat. Angka, atau simbol atau memilih
jawaban dari sejumlah alternatif yang diberikan. Penilaian kinerja memungkinkan
siswa untuk merespon dengan memilih, mengatur, dan mempresentasikan ide atau
melakukan dengan cara yang mereka anggap tepat. Tes objektif dan penilaian
kinerja keduanya memiliki tujuan yang bermanfaat dalam mengukur prestasi
siswa. Jenis yang digunakan dalam situasi tertentu paling baik ditentukan oleh
hasil pembelajaran yang akan diukur dan oleh kelebihan dan keterbatasan unik
dari setiap pendekatan. Praktik yang baik adalah memasukkan item tes objektif
dan tugas penilaian kinerja dalam pengukuran komprehensif prestasi siswa.
Persiapan satu set item tes yang relevan dan tugas penilaian melibatkan (1)
mencocokkan item dan tugas dengan hasil pembelajaran secara langsung mungkin,
(2) mendapatkan sampel yang representatif dari semua hasil yang dimaksudkan,
(3) menghilangkan hambatan yang tidak relevan dengan menjawab. (4) mencegah
petunjuk yang tidak diinginkan terhadap respons, dan (5) berfokus pada
peningkatan pembelajaran dan pengajaran. Aturan untuk membuat setiap jenis
item tes objektif dan tugas penilaian kinerja akan dijelaskan dalam bab-bab
berikutnya.
LATIHAN PEMBELAJARAN
1. Jelaskan sifat dari pretest kesiapan dan Bagaimana hasilnya dapat digunakan
dalam pengajaran.
2. Jelaskan perbedaan antara tes formatif / penilaian dan tes sumatif / penilaian.
3. Apa keuntungan menggunakan grafik dua arah saat menyiapkan spesifikasi
untuk pengujian dan penilaian? Untuk jenis pengujian dan penilaian apa yang
paling berguna? Mengapa?

53
4. Mengapa penting untuk tes dan penilaian kelas untuk mengukur sampel yang
representatif dari hasil belajar yang cenderung?
5. Jenis informasi apa yang harus dipertimbangkan selama masing-masing langkah
berikut dalam menyusun tes dan penilaian?
Sebuah. Mengembangkan seperangkat spesifikasi.
b. Memilih jenis item tes dan tugas penilaian untuk digunakan.
c. Menulis item ujian dan tugas penilaian.
6. Sebutkan beberapa hasil pembelajaran yang paling baik diukur dengan item tes
objektif. Daftar beberapa yang membutuhkan penggunaan tugas penilaian kinerja.
7. Sebutkan sebanyak mungkin faktor spesifik yang dapat Anda pikirkan yang
mungkin mencegah beberapa siswa dari melakukan yang terbaik meskipun mereka
memiliki pengetahuan dan keterampilan yang dirancang untuk diukur oleh item
atau tugas.
8. Sebutkan sebanyak mungkin faktor spesifik yang dapat Anda pikirkan yang
memungkinkan beberapa siswa untuk menjawab soal tes objektif dengan benar
meskipun mereka memuji pengetahuan yang dirancang untuk diukur oleh item
tersebut.
9. Asumsikan bahwa Anda akan mempersiapkan tes unit singkat untuk unit kerja
dalam kursus di bidang pengajaran utama Anda. Bagaimana Anda akan
melanjutkan? Bagaimana perbedaan prosedur Anda jika itu adalah tes sumatif atau
penilaian akhir kursus?

BAB III
Kesimpulan dan Saran

1. Kesimpulan

54
Tes merupakan salah satu instrument yang digunakan dalam membandingkan
hasil pengukuran untuk ambil keputusan dalam penilaian. Siswa dapat diukur
kemampuannya melalui tes yang sesuai dengan jenjang atau tingkat kemampuan
serta perkembangan dari proses pembelajaran. Tes yang baik harus mampu
mengukur apa yang akan diukur (aspek Validitas),dan konsisten atau stabil dalam
mengukur apa yang akan diukur(aspek reliabilitas) Penilaian dapat dilakukan baik
secara formal maupun secara informal.disamping syarat utama itu,suatu tes
hendaklah(1)Objektif,(2)praktis,(3)norma.
Dapat disimpulkan bahwa esensi dari tes adalah suatu prosedur yang spesifik
dan sistematis untuk mengukur tingkah laku sesorang,atau suatu pengukuran yang
besifat objektif mengenai tinkah laku seseorang,sehingga tingkah laku tersebut
dapat digambarkan dengan bantuan angka,skala atau dengan system kategori.
Tujuan utama pengujian dan penilaian dikelas adalah untuk memperoleh informasi
yang valid,andal,berguna,mengenai prestasi siswa.
Tujuan Penggunaan dan Penilaian Kelas :
1.Prestesing
2.Oengujian dan penilaian diberikan selama instruksi
3.Pengujian dan penilaian diakhir instruksi
Pengembangan Spesifikasi untuk Uji dan Penilaian :
1.Membangun table spesifikasi
2.Tujuan instruksional untuk unit cuaca
3.Garis besar konten untuk unit cuaca
Memilih Jenis-jenis Barang dan Tugas Penilaian yang Tepat :
1.Item tes objektif
2.Jenis penilaian kinerja lainnya
3.Keunggulan komperatif item tes objektif dan tugas penilaian kinerja
Pertimbangan Dalam Menyiapkan Barang Uji Relevan dan Tugas Penilaian :
1.Tujuan dan tes atau penilaian harus ditentukan.
2.serangkaian spesifikasiharus dikembangkan

55
3.Jenis item tes dan tugas penilaian kinerja yang paling tepat harus dipilih

2. Saran
Dengan demikian,sebagai tenaga pendidik maka kita harus bisa mengetahui
dan memahami tes dan penilaian kelas untuk mengukur kemampuan dan
perkembangan peserta didik dari proses pembelajaran di sekolah.

DAFTAR PUSTAKA

56
Gronlund. N.E (1993).How to make acbievement tests and assessments (5 th
ed.).Bostom:Allyn & Bacon. Chapters 1 dan 2 describe the role of measurement in
instruction and provide guide-lines on planning achievement tests.

Millman.J.,& Greene,J.(1989). The specification and development of tests of


achievement and ability. In R.l. Linn (Ed), Educational measurement (3rd ed).New
York:macmillan. A comprehensive and advanced treatment of test development.

Popham,W.J.(1990).Modern educational measurement; A practitioner’s erspective


(2nd ed.). Englewood Cliffs, NJ: prentice-Hall. Chapter 9 describes the use of
detailed specifications in constructing criterion-referenced tests.

Prof.Dr.A.Muri Yusuf,M.Pd. Asesmen dan Evaluasi Pendidikan. Kencana Jakarta.


2015

57

Anda mungkin juga menyukai