Anda di halaman 1dari 22

HUBUNGAN PROSEDUR EVALUASI

TERHADAP TUJUAN INSTRUKSIONAL

A. Perencanaan Evaluasi Secara Umum


Ketika

guru

memutuskan untuk melakukan rancangan evaluasi dalam

pembelajaran, baik ulangan harian, ujian semester, dan lain-lain, minimal rencana ini
harus mencakup daftar hasil pembelajaran yang diinginkan dan teknik yang akan
digunakan dalam mengevaluasi kemajuan belajar siswa.
Grafik Mr Browns untuk rencana evaluasi umum menjelaskan sejumlah poin
penting tentang hubungan antara tujuan instruksional dan prosedur evaluasi. Untuk
melihat hasil belajar secara nyata, dapat diamati dengan perilaku murid. Akan tetapi,
tidak ada teknik evaluasi tunggal yang bisa memberikan bukti yang akurat tentang
prestasi mereka secara keseluruhan. Meskipun tes objektif yang ditunjukkan untuk
banyak hasil belajar, skala penilaian, catatan anekdot, dan teknik observasi lainnya
juga sering digunakan. Diagram ini juga menyoroti pentingnya pernyataan yang jelas
dari tujuan dan hasil pembelajaran dan dalam memilih teknik evaluasi. Bahkan,
ketika hasil pembelajaran secara jelas dinyatakan dalam hal perilaku murid, mereka
tidak hanya menunjukkan apa yang harus dievaluasi, tetapi mereka juga menyarankan
bagaimana untuk mengevaluasi. Sebagai contoh, kalimat "1.1 Mendefinisikan istilah
umum" memberikan indikasi jenis teknik evaluasi yang harus digunakan. Hal ini
menunjukkan bahwa murid harus memberikan definisi sendiri. Oleh karena itu, tes
jawaban singkat, di mana murid diberikan istilah yang dipilih dan diminta untuk
mendefinisikan istilah tersebut, adalah teknik evaluasi yang paling tepat. Item tes
objektif, seperti pertanyaan pilihan ganda, di mana murid harus hanya
mengidentifikasi definisi, akan tidak memadai untuk mengevaluasi hasil belajar ini,
seperti yang dinyatakan. Tentu saja, hasil belajar yang spesifik dapat disajikan
kembali untuk membaca "Mengidentifikasi makna umum istilah "sehingga item tes
objektif dapat digunakan. Namun, ini akan menjadi perubahan dalam perilaku

tertentu Mr Brown bersedia menerima sebagai bukti bahwa murid tahu istilah umum
yang digunakan dalam biologi. Jika ia percaya bahwa mengetahui istilah
mengharuskan murid dapat menentukan istilah dalam kata-katanya sendiri, satusatunya

prosedur

yang

memadai

evaluasi

adalah

meminta

murid

untuk

mendefinisikan istilah. Kemampuan untuk mengidentifikasi definisi yang benar tidak


dapat diterima sebagai bukti kemampuan murid untuk memberikan definisi yang
benar.
Tujuan dan Hasil Belajar Khusus
1. Siswa tahu istilah umum yang digunakan
dalam biologi ketika ia:
1.1 Mendefinisikan istilah umum.
1.2 Membedakan antara istilah umum
dengan makna dasar
1.3 Mengidentifikasi makna istilah umum
ketika digunakan dalam konteks.
6. Murid menunjukkan keterampilan berpikir
kritis ketika ia:
6.1 Membedakan antara fakta dan opini.
6.2 Menarik kesimpulan yang valid dari data
yang diberikan.
6.3 Mengidentifikasi asumsi yang mendasari
kesimpulan.
6.4 Mengidentifikasi keterbatasan data yang
diberikan.
8. Murid melakukan keterampilan ketika:
8.1 Menempatkan sampel dalam posisi
yang tepat.
8.2 Memotong secara terampil tanpa
merusak struktur yang akan dipelajari.
8.3 Memisahkan bagian struktural dari
sampel tanpa merusaknya
8.4 Menyelesaikan pembedahan dalam
waktu
yang ditentukan.
10. Murid menempatkan informasi biologi
ketika:
2

Teknik evaluasi

1.1 Test jawaban singkat


1.2 Test objektif
1.3 Test objektif

6.1 Test objektif


6.2 Test jawaban singkat
6.3 Test objektif
6.4 Test objektif
8.1 Checklist dan skala sikap
8.2 Checklist dan skala sikap

8.3 Checklist dan skala sikap


8.4 Checklist dan skala sikap

10.1

Menempatkan referensi dengan 10.1 Laporan penelitian.


menggunakan
katalog
kartu
Observasi
perpustakaan.
10.2
Mengidentifikasi sumber-sumber 10.2 Tes objektif
umum informasi biologi.
10.3
Menggunakan daftar isi dan 10.3 Observasi
indeks ketika mencari informasi dalam
buku-buku.
10.4
Mengidentifikasi
relevansi
10.4 Laporan penelitian. Observasi
informasi untuk masalah tertentu.
12. Murid menampilkan sikap ilmiah terhadap
fenomena biologis ketika ia:
12.1
Menunda penilaian sampai
semua fakta yang tersedia.
12.2
Mengidentifikasi
hubungan
sebab-akibat dalam data biologis.
12.3
Menunjukkan kesediaan untuk
mempertimbangkan interpretasi baru
dari data biologis.
12.4
Negara interpretasi data biologis
yang bebas dari bias.
12.5
Menunjukkan kepercayaan dalam
data biologis diperoleh dengan prosedur
ilmiah.

12.1 Catatan anekdot.


Tes objektif
12.2 Catatan anekdot.
Tes objektif
12.3 Catatan anekdot.
Tes objektif
12.3 Catatan anekdot.
Tes objektif

* * Teknik Evaluasi berkaitan dengan belajar hasil dengan angka yang sesuai.

Meskipun pembahasan kita telah terfokus pada satu hasil pembelajaran yang
spesifik, prinsip dasar menilai setiap hasil belajar secara langsung mungkin adalah
salah satu yang menjadi pembahasan pokok diagram tersebut. Misalnya, "6.1
membedakan antara fakta dan opini" dapat dievaluasi dengan tes objektif. Ini
hanyalah masalah menyajikan murid dengan sejumlah pernyataan dan memintanya
untuk menunjukkan yang merupakan fakta dan mana yang opini. Di sisi lain,
bagaimanapun, "6.2 Menarik kesimpulan yang valid dari data yang diberikan"
membutuhkan tes jawaban singkat karena hasilnya menunjukkan bahwa murid akan

menarik kesimpulan sendiri dan tidak hanya mengidentifikasi kesimpulan yang


diambil oleh orang lain. Demikian pula, semua hasil yang berkaitan dengan "8. Murid
melakukan pembedaha secara terampil" harus dievaluasi oleh beberapa perangkat
observasi seperti daftar atau skala penilaian. Pengetahuan tentang prosedur
pembedahan

tidak

dapat diterima

sebagai

bukti

keterampilan

membedah.

Pengetahuan tentang prosedur dapat dan harus diukur untuk kepentingan diri sendiri,
tetapi keterampilan dapat dievaluasi hanya dengan langsung mengamati dan menilai
prosedur murid dalam melakukan pembedahan dan produk yang dihasilkan. Di
bidang sikap ilmiah, seperti hasil belajar sebagai "12,1 penilaian menunda sampai
semua fakta yang tersedia" membutuhkan lebih dari satu jenis bukti karena sulitnya
evaluasi. Catatan anekdotal berdasarkan pengamatan sehari-hari di kelas dan
laboratorium akan memberikan bukti tentang perilaku khas murid dalam menghadapi
masalah ilmiah. Tetapi karena kurangnya kesempatan untuk mengamati semua siswa
di situasi yang membutuhkan perilaku ini dan karena sifat subjektif dari pengamatan
tersebut, juga diinginkan untuk menggunakan item tes objektif.. Item tes tersebut
hanya melengkapi catatan anekdot, namun, karena respon terhadap item tes objektif
tidak menunjukkan bagaimana murid biasanya akan bersikap ketika dihadapkan
dengan masalah yang bersifat ilmiah. Singkatnya, kedua metode tidak memadai tetapi
bersama-sama mereka saling melengkapi dan memberikan bukti yang lebih memadai
daripada baik akan sendirian. Untuk setiap tujuan instruksional, bagan evaluasi
menunjukkan teknik evaluasi yang memberikan bukti paling langsung dan memadai
mengenai sejauh mana perilaku murid itu sesuai dengan hasil pembelajaran yang
diinginkan.
Sebuah grafik evaluasi seperti Mr Brown, juga membuat penjelasan perlunya
perencanaan program evaluasi pada awal unit, atau kursus, instruksi. Jika data yang
evaluatif harus diperoleh dengan menggunakan catatan anekdot, skala penilaian, dan
perangkat pengamatan lainnya. Idealnya, perencanaan untuk evaluasi harus terjadi
pada waktu yang sama dengan rencana lain yang dibuat untuk pembelajaran, ketika

hal ini dilakukan, guru kadang-kadang menggabungkan tujuan pengajaran, metode


pengajaran, dan teknik evaluasi bersama-sama dalam satu rencana. Bagan berikut ini
merupakan versi sederhana dari rencana untuk tujuan Mr Whiteside dalam penalaran
aritmatika di tingkat kelas empat:
Tujuan
1. Murid menunjukkan kemampua
n penalaran aritmatika ketika ia:
1.1 Mengidentifikasi masalah
(yang tidak diketahui).
1.2 Mengidentifikasi fakta yang
diketahui relevan.
1.3 Mengidentifikasi
proses
aritmatika yangberhubungan
dikenal
dengan
yang
diketahui.
1.4 Memecahkan masalah
kuantitatif dengan menggunakan langkah-langkah di
atas.

Metode Pengajaran

Teknik Evaluasi

Menyajikan siswa dengan Observasi


dan
berbagai masalah cerita catatan anekdot.
yang mengandung fakta- Tes objektif
fakta lebih dari yang
diperlukan agar siswa
memperoleh latihan dalam
mengidentifikasi masalah,
dan memilih fakta yang
relevan
serta
dalam
menghitung jawaban.

Termasuk tujuan, metode pengajaran, dan teknik evaluasi dalam satu rencana
umum menyoroti keterkaitan antara aspek ini mengajar di kelas dan meyakinkan
bahwa perencanaan untuk evaluasi akan dilakukan pada awal pembelajaran. Dalam
menggunakan prosedur ini, bagaimanapun, kita harus berhati-hati untuk tidak
mencoba untuk menghubungkan metode pengajaran terlalu dekat dengan tujuan
instruksional. Salah satu metode (misalnya, diskusi kelas) mungkin berhubungan
dengan berbagai tujuan, seperti pengetahuan, pemahaman, keterampilan komunikasi,
dan penyesuaian sosial. Demikian pula, satu tujuan (misalnya, penghargaan) dapat
menjadi hasil akhir dari serangkaian pengalaman yang membutuhkan banyak metode
pembelajaran.. Dalam keterbatasan ini, rencana seperti yang dikembangkan oleh Mr

Whiteside dapat menambahkan arah umum untuk kedua pengajaran dan proses
evaluasi.
B. Menggunakan Daftar Spesifikasi
Tipe lain dari rencana evaluasi adalah bahwa disediakan oleh grafik dua arah
disebut tabel spesifikasi. Grafik tersebut menghubungkan tujuan instruksional dengan
isi kursus dan menentukan penekanan yang akan diberikan kepada masing-masing
jenis hasil belajar. Dimana tabel adalah untuk melayani sebagai rencana evaluasi
umum, semua tujuan instruksional umum untuk unit pembelajaran. Instruksi
tercantum di bagian atas tabel, dan semua bidang utama dari konten yang terdaftar di
sisi tabel. Sel-sel dalam tabel yang digunakan untuk menunjukkan jumlah item tes
harus siap untuk setiap hasil dari instruksi dan untuk menggambarkan bagaimana
hasil nontest yang akan dievaluasi. Sebuah versi sederhana dari tabel tersebut, untuk
unit cuaca dalam ilmu SMP, disajikan pada Tabel 3.1.
Ini akan dicatat dalam Tabel 3.1 bahwa dari lima puluh item dalam tes, dua belas
akan mengukur "pengetahuan tentang simbol dan istilah." Dua dari dua belas item
akan diisi tentang "tekanan udara," empat tentang "angin," dua tentang "suhu," dua
tentang "kelembaban dan curah hujan," dan dua tentang "awan.". Angka-angka di
kolom lain yang harus dibaca dengan cara yang sama. Karena hasil keterampilan
memerlukan evaluasi kinerja, kolom tersebut berisi deskripsi singkat tentang prosedur
evaluasi yang akan digunakan.
Penekanan relatif yang diberikan kepada masing-masing tujuan dan setiap
area konten dalam tabel spesifikasi, tentu saja harus mencerminkan penekanan
diberikan selama instruksi. Mereka hasil belajar yang menekankan sebagai lebih
penting, dan yang lebih banyak waktu instruksional dikhususkan, harus diberikan
bobot yang lebih besar dalam rencana evaluasi. Dalam tabel ilustrasi, misalnya dua
hasil keterampilan ditugaskan 50 persen dari evaluasi keseluruhan (persen 25 per

masing-masing) dan empat tujuan yang akan dievaluasi dengan tes tertulis ditugaskan
50 persen lainnya '( 10 sampai 16 persen masing-masing).
Beberapa guru lebih memilih untuk memperluas tabel spesifikasi dengan
memasukkan hasil pembelajaran yang spesifik untuk setiap tujuan instruksional
umum dan dengan daftar garis yang lebih rinci tentang isi pembelajaran. Ini adalah
pendekatan yang diinginkan asalkan jumlah spesifik tidak menjadi tidak terkendali.
Hal ini lebih layak di mana tabel spesifikasi didasarkan pada unit instruksi (seperti
dalam evaluasi formatif) daripada di mana tabel ini didasarkan pada hasil yang
diharapkan dari seluruh program (seperti dalam evaluasi sumatif).
C. Hubungan Item Tes dengan Tujuan (Hasil) Pembelajaran Khusus
Tabel spesifikasi menunjukkan jumlah item tes yang akan dikhususkan untuk
masing-masing tujuan instruksional umum. Ini adalah langkah pertama dalam
prosedur pengujian yang berkaitan dengan tujuan dan yang signifikan karena
memberikan beberapa jaminan bahwa setiap tujuan akan diwakili dalam tes sesuai
dengan kepentingan relatifnya. Pertanyaan utama, namun, dalam berhubungan
prosedur pengujian untuk tujuan, adalah: Apakah tanggapan murid disebut ditetapkan
oleh item tes langsung relevan dengan perilaku ditentukan oleh hasil pembelajaran
yang spesifik?

Tabel 1 Daftar Spesifikasi untuk materi cuaca IPA SMP


Pokok
Bahasan

Pengetahuan

Tujuan
Pemahaman

Keterampilan

Total
jumlah
item

Tekanan
udara
Angin
Suhu
Kelembaban
dan
hujan
awan
Jumlah
item
Persentase
evaluasi

Simbol
dan
istilah

Fakta
khusus

Faktor yang Peta


mempenga- cuaca
ruhi bentuk
cuaca
3
3

4
2
2

2
2
1

8
2
2

2
12

2
10

1
16

12

12%

10%

16%

12%

2
2
5

Penggunaan alat ukur

Penyusunan
peta cuaca

Mengamati
siswa
menggunakan
alat
ukur (skala
sikap)

Mengevalua
si peta yang
disusun
oleh siswa
(checklist)

11
16
8
10

5
50
25%

25%

100%

Mengklarifikasi Respon Siswa yang diharapkan


Kita dapat meningkatkan kepastian bahwa item-item test menimbulkan
perilaku murid yang relevan dengan lebih memperjelas respon murid diharapkan
untuk setiap hasil belajar tertentu. Hal ini dapat dilakukan dengan salah satu cara
berikut:
1. Menambah tiga level untuk daftar tujuan yang lebih khusus.
2. Menentukan kata kerja yang digunakan dalam hasil pembelajaran yang spesifik.
3. Gunakan item tes sampel untuk menggambarkan hasil yang diharapkan.
Masing-masing metode ini akan dibahas selanjutnya.
Pengertian

dari setiap hasil belajar yang spesifik dapat lebih diperjelas

dengan membuat daftar beberapa, atau semua, dari tugas-tugas tertentu siswa
diharapkan untuk melakukan dalam menunjukkan pencapaian hasilnya. Hal ini akan
memberikan tiga tingkat untuk setiap tujuan instruksional, sebagai berikut:
1. Mengetahui bagian-bagian pidato dalam bahasa Inggris.
1.1 Mengidentifikasi kata benda dalam kalimat.

1.11 Menggarisbawahi setiap kata benda.


1.12 Melingkari setiap kata benda umum.
Menambahkan tingkat ketiga kekhususan seperti ini mungkin berguna untuk
memperjelas beberapa tujuan belajar. Tugas spesifik menggambarkan dengan tepat
apa yang siswa akan lakukan untuk menunjukkan bahwa mereka dapat
mengidentifikasi kata benda. Perlu dicatat, bagaimanapun, bahwa hasil yang
dimaksud adalah mengidentifikasi kata benda. Proses menggarisbawahi dan
melingkari hanyalah sebuah cara yang digunakan sebagai indikator dari kemampuan
untuk mengidentifikasi. Dengan demikian, ketiga tingkatan itu menyediakan transisi
antara hasil belajar tertentu dan item tes, tetapi perilaku tertentu tidak hasil
pembelajaran di kanan mereka sendiri (yaitu, dalam contoh kita, kita tidak tertarik
untuk mengajar siswa bagaimana untuk menggarisbawahi dan melingkari, melainkan
suatu cara untuk mengidentifikasi. Kita menganggap mereka sudah bisa melakukan
yang pertama.) Ketiga tingkatan ini khusus menyoroti salah satu keuntungan
menggunakan tingkat tujuan, daripada daftar tugas tertentu, untuk menggambarkan
hasil yang diharapkan dari instruksi. Dengan tingkat, kita cenderung untuk
mencampur adukkan hasil yang diharapkan dari instruksi dengan indikator hasil
tersebut. Cara lain untuk menjelaskan respon murid yang diharapkan adalah untuk
mendefinisikan, atau menjelaskan, setiap kata kerja tindakan yang digunakan dalam
daftar hasil pembelajaran yang spesifik, seperti digambarkan dalam Tabel 3.2.
(Perhatikan Jenis Jawaban dan Uji Sample Tugas.) Prosedur ini sangat berguna di
mana para guru di lembaga, atau seluruh sekolah, yang mengembangkan tujuan
instruksional untuk setiap pelatihan dalam kurikulum. Menggambarkan jenis
tanggapan yang terkait dengan setiap kata kerja tindakan memberikan makna seragam
dari satu set tujuan yang lain dan, pada saat yang sama, menghilangkan kebutuhan
untuk menambahkan tingkat ketiga kekhususan untuk setiap rangkaian tujuan.
Termasuk contoh tugas-tugas tertentu, seperti digambarkan dalam Tabel 3.2, juga
membantu untuk menjelaskan arti dari setiap kata kerja tindakan.

Tabel 2. Illustrasi bagaimana mengklarifikasi respon siswa dengan kata kerja tindakan
Kata kerja
tindakan
Mengenali

Jenis Respon
Menunjukkan, menyentuh, menandai,
melingkari, mencocokkan, menambah

Contoh soal
Letakkan tanda X
pada segitiga yang
benar

Menamai

Memberikan label kata kerja (Lisan atau Apakah jenis sudut


dalam tulisan)
tersebut?

Membedakan
antara

Mengidentifikasi pemisah atau pembeda


dengan menandai, memisahkan kedalam
kelas, atau memilihkan ke dalam jenis
yang umum

Mendefenisikan

Memberikan deskripsi kata kerja (Lisan


atau tulisan) yang menerangkan arti yang
tepat atau inti dari permasalahan.
Memberikan ulasan verbal (Lisan atau
tulisan) pada bagian yang penting, sifat,
dan hubungan.

Menggambarkan

Mengklasifikasi
kan

Tempatkan kedalam kelompok yang


memiliki sifat umum, tempatkan pada
golongan tertentu

Memerintahkan

Daftar perintah, menempatkan pada


tempat tertentu, menyusun, menyusun
ulang.

Membangun

Menggambar, membuat,
menyiapkan, membangun

Mendemonstrasikan

Manakah pernyataan
dibawah ini yang
merupakan fakta
(Lingkari F) dan opini
(Lingkari O)?
Jelaskan masingmasing istilah
dibawah ini
Jelaskan
prosedur
dalam
mengukur
kelembaban relatif di
atmosfer
Tulislah nama dari
jenis
kata
ganti
dengan menggunakan
kalimat berikut ini
Susunlah peristiwa
sejarah berikut berdasarkan kronologinya

mendesain, gambarkanlah
sebuah grafik dengan
menggunakan
data
berikut
Membentuk seperangkat prosedur, kata kumpulkan peralatan
kerja keterangan
laboratorium
untuk
percobaan ini
10

Dalam beberapa kasus, misalnya di mana item tes yang akan dibangun oleh
orang lain, hal ini diinginkan untuk menggambarkan setiap hasil belajar tertentu
dengan satu atau lebih item uji model. Contoh-contoh yang disajikan pada bagian
berikut ini memberikan berbagai ilustrasi tentang bagaimana hal ini dapat dilakukan.
Dalam berkomunikasi niat instruksional Anda kepada orang lain, tidak ada yang
dapat menyampaikan hasil yang diinginkan sebagai item tes jelas sebagai ilustrasi. Ini
mengasumsikan, tentu saja, bahwa setiap item sampel uji secara langsung relevan
dengan hasil belajar tertentu yang diwakilinya.
Pencocokan Uji Produk untuk Hasil yang ditujukan
Mempersiapkan item tes yang secara langsung relevan dengan hasil belajar
yang spesifik yang akan diukur terutama soal pencocokan perilaku ditentukan oleh
hasil yang diinginkan dan perilaku diukur dengan item tes. Menyatakan hasil se
spesifik mungkin dan mendefinisikan kata kerja secara lebih rinci keduanya berguna
dalam hal ini, namun proses ini masih menjadi bahan analisis dan penilaian. Jika hasil
belajar tertentu panggilan untuk memasukkan jawaban (misalnya, nama, definisi),
item tes juga harus mensyaratkan bahwa jawabannya akan diberikan (bukan dipilih).
Jika hasil belajar tertentu dijadikan patokan untuk mengidentifikasi prosedur, item tes
harus diperhatikan hanya dengan proses identifikasi (bukan dengan hasil yang lebih
kompleks). Jika hasil belajar tertentu panggilan untuk melakukan prosedur, item tes
harus memerlukan kinerja yang sebenarnya (bukan deskripsi verbal bagaimana
melakukannya). Isu-isu seperti ini menyoroti perlakuan yang diperlukan dalam
menentukan apakah ada kecocokan yang baik antara hasil perlakuan yang dinyatakan
dan respon yang diharapkan pada item tes.
Contoh
Mendefinisikan istilah umum (Matematika Dasar)

11

Petunjuk: Dalam satu atau dua kalimat, definisikan masing-masing dari kata-kata
berikut.
1.
2.
3.
4.
5.

Bunga
Premi
Dividen
Jaminan
Keuntungan

Tujuan pembelajaran khusus: Mengidentifikasi prosedur untuk mengkonversi dari


satu ukuran ke ukuran yang lain. (Matematika Dasar)
1. Luas karpet diberikan dalam meter persegi. Bagaimana Anda menentukan
dalam kaki persegi?
a. Kalikan dengan 3
b. Kalikan dengan 9
c. Bagi dengan 3
d. Bagi dengan 9
2. Jumlah susu minuman keluarga dalam satu bulan dinyatakan dalam liter.
Bagaimana anda mengubahnya ke galon?
a. Kalikan dengan 4
b. Kalikan dengan 8
c. Bagi dengan 4
d. Bagi dengan 8
3. Ruang udara di ruangan dinyatakan dalam kaki kubik. Bagaimana Anda
mengubahnya ke meter kubik?
a. Kalikan dengan 9
b. Kalikan dengan 27
c. Bagi dengan 9
d. Bagi dengan 27
Tujuan Pembelajaran Khusus: Membedakan antara nilai-nilai relatif yang dinyatakan
dalam angka (Matematika Dasar)
1.

Manakah dari pecahan berikut ini lebih kecil dari satu setengah?
a. 2/4
b. 4/6
c. 3/8
d. 9/16
2. Manakah dari angka berikut yang menunjukkan nilai terbesar?
a. 2/3

12

b. 4/7
c. 5/9
d. 9/16
3. Manakah dari angka berikut yang memiliki nilai yang sama dengan
seperlima?
a. 2/20
b. 5/50
c. 25/75
d. 20/100
Tujuan Pembelajaran Khusus: Membedakan fakta dari opini (IPS dasar)
Petunjuk: Bacalah setiap pernyataan berikut dengan seksama. Jika Anda pikir
pernyataan itu adalah fakta, lingkaran "F." Jika Anda pikir pernyataan itu
adalah pendapat, lingkaran "O."
(F) O 1. George Washington adalah Presiden pertama Amerika Serikat.
F (O) 2. Abraham Lincoln adalah presiden terbesar kita.
(F) O 3. Franklin Roosevelt adalah satu-satunya Presiden yang terpilih tiga kali.
F (O) 4. Hawaii adalah negara bagian yang paling indah di Amerika Serikat
Tujuan Pembelajaran Khusus: Mengidentifikasi penggunaan umum dari alat
pengukur cuaca. (IPA dasar)
1. Manakah diantara instrumen berikut yang digunakan untuk menentukan
kecepatan angin?
a. Kincir angin
b. Anemometer
c. Altimeter
d. Radar
2. Manakah diantara instrumen berikut ini yang digunakan untuk menentukan
jumlah kelembaban di udara?
a. Altimeter
b. Barometer
c. Hygrometer
d. Radiosonde
Tujuan Pembelajaran Khusus: Mengidentifikasi hubungan sebab dan akibat. ( IPA
dasar)

13

Petunjuk: Dalam setiap pernyataan berikut, kedua bagian pernyataan adalah benar.
Anda harus memutuskan apakah bagian kedua menjelaskan mengapa bagian
pertama adalah benar. Jika tidak, lingkari "Ya." Jika tidak, lingkaran "Tidak"
Contoh:
(Ya) Tidak 1. Orang bisa melihat

karena

mereka memiliki mata.

Ya (Tidak) 2. Orang bisa berjalan

karena

mereka memiliki lengan.

Pada contoh pertama, bagian kedua dari pernyataan menjelaskan mengapa


"orang bisa melihat sehingga " ya " dilingkari. Dalam contoh kedua, bagian kedua
dari pernyataan tidak menjelaskan mengapa "orang bisa berjalan" sehingga "tidak"
dilingkari.
Bacalah setiap pernyataan berikut dan jawab dengan cara yang sama seperti diatas.
Ya (Tidak) 1. Beberapa ular gurun menetas dari telurnya karena cuaca panas di
padang pasir.
(Ya) Tidak 2. Laba-laba sangat berguna

karena mereka memakan insekta yang

berbahaya
(Ya) Tidak 3. Beberapa tanaman tidak memerlukan sinar matahari karena mereka
mendapatkan makanan mereka dari tanaman lain.
Ya (Tidak) 4. Air di laut menguap karena mengandung garam.
(Ya) Tidak 5. Ikan bisa mendapatkan oksigen dari air karena mereka memiliki
insang
Tujuan Pembelajaran Khusus: Mengidentifikasi alasan untuk tindakan atau peristiwa.
(Biologi)
1. Manakah diantara peristiwa berikut ini yang terbaik untuk menjelaskan
mengapa ganggang hijau mengeluarkan gelembung oksigen pada hari yang
cerah?
a. Transpirasi
b. Plasmolysis
c. Fotosintesis
14

d. Osmosis
2. Manakah diantara peristiwa berikut ini yang dapat menjelaskan mengapa
jamur roti dapat tumbuh di ruangan gelap?
a. Beberapa tanaman tidak menghasilkan makanan mereka sendiri.
b. Fotosintesis dapat berlangsung dalam gelap.
c. Klorofil membantu pertumbuhan tanaman dalam kegelapan.
d. Jamur roti mengambil karbon dioksida dan melepaskan oksigen di dua
tempat (gelap dan terang).
Tujuan Pembelajaran Khusus: Mengidentifikasi relevansi argumen. (Ilmu Sosial)
Petunjuk: Item di bagian tes harus didasarkan pada keputusan berikut:
Putusan : Usia suara yang sah di Amerika Serikat minimal delapan belas tahun.
Beberapa pernyataan berikut merupakan argumen untuk resolusi, beberapa
argumen terhadap hal itu, dan ada pula yang tidak atau untuk menentang
resolusi itu. Bacalah setiap pernyataan berikut dan lingkari.
F jika argumen untuk resolusi.
A jika argumen terhadap resolusi.
N jika tidak untuk atau menentang resolusi itu.
(F) A N 1. Kebanyakan orang secara fisik, emosional, dan dewasa secara intelektual
pada usia delapan belas tahun.
F A (N) 2. Banyak orang masih bersekolah pada usia delapan belas tahun.
F A (N) 3. Di kebanyakan negara diperbolehkan untuk mengendarai mobil pada usia
delapan belas tahun.
F (A) N 4. Kemampuan untuk memilih kecerdasan dengan bertambahnya usia.
F A (N) 5. Jumlah warga yang berusia delapan belas tahun di Amerika Serikat terus
meningkat setiap tahunnya
Contoh-contoh ini cukup untuk menunjukkan bagaimana item tes harus
berhubungan dengan hasil belajar yang spesifik. Meskipun semua bidang subjekmateri dan semua jenis hasil belajar tidak terwakili, prinsip dasarnya adalah sama.

15

Pernyataan hasil pembelajaran yang diinginkan dalam hal perilaku dan memilih atau
mengembangkan item tes yang menimbulkan perilaku tertentu.
D. Hubungan Prosedur Nontest Dengan Tujuan Pembelajaran Khusus
Dalam mengevaluasi beberapa keterampilan kinerja (misalnya, bernyanyi,
menari, berbicara), perlu untuk mengamati murid saat ia melakukan dan untuk
membuat penilaian mengenai efektivitas kinerja. Dalam kasus lain, adalah mungkin
untuk mengevaluasi keterampilan murid itu dengan menilai kualitas produk yang
dihasilkan dari penampilannya (misalnya, tema, lukisan, surat diketik, memanggang
kue, dan sebagainya). Dalam mengevaluasi penyesuaian sosial murid itu, mungkin
perlu untuk mengamati murid dalam situasi formal dan informal untuk menilai
kecenderungan ke arah agresi atau penarikan, hubungan dengan teman-temannya,
dan sejenisnya. Bahkan, setiap kali kita tertarik dalam mengevaluasi bagaimana
murid biasanya akan berperilaku dalam situasi, biasanya digunakan beberapa jenis
prosedur observasi.
Seperti prosedur pengujian, pemilihan atau pengembangan teknik observasi
harus berkembang dari tujuan dan hasil pembelajaran yang spesifik. Dalam kasus
skala penilaian atau daftar periksa, hasil pembelajaran yang spesifik menjadi dimensi
perilaku untuk diamati. Dalam contoh berikut, perhatikan bagaimana hasil
pembelajaran yang spesifik hanya membutuhkan sedikit modifikasi untuk menjadi
item dalam skala sikap:

Pidato
Tujuan Pembelajaran Khusus: Mempertahankan kontak mata yang baik dengan
penonton.
Item Skala Penilaian:

16

Seberapa efektifkah pembicara dalam mempertahankan kontak mata dengan


penonton?
_________1___________2___________3___________4___________5__________
Tidak efektif

Dibawah Rata-rata

Rata-rata Diatas Rata-rata

Sangat Efektif

Menulis tema
Tujuan Pembelajaran Khusus: Mengatur ide-ide dalam cara yang koheren.
Item Skala Penilaian:
Pengorganisasian ide
_________1___________2___________3___________4___________5__________
Kurang

Pertengahan

Jelas, koheren

Kerja Kelompok
Tujuan Pembelajaran Khusus: Berkontribusi ide-ide bermanfaat untuk diskusi
kelompok.
Item Skala Penilaian:
Seberapa sering murid menyumbangkan ide-ide bermanfaat untuk diskusi kelompok?
________1____________2___________3___________4___________5__________
Tidak pernah

Jarang

Kadang-kadang

Cukup Sering

Sering

E. Hubungan Tes Standar dengan Tujuan Lokal


Pentingnya berkaitan teknik evaluasi secara langsung mungkin dengan tujuan
instruksional dan hasil pembelajaran yang spesifik yang akan diukur tidak terbatas
pada perangkat buatan guru. Jenis relevansi juga merupakan pertimbangan utama
ketika memilih tes prestasi standar untuk tujuan instruksional. Idealnya, tes standar
harus mengukur kandungan subyek dan perubahan perilaku yang telah ditekankan
17

dalam program instruksional. Sejauh mana tes memenuhi cita-cita ini dapat
ditentukan hanya dengan pemeriksaan yang cermat dan tes yang sistematis.
Dalam menilai relevansi tes standar untuk program pembelajaran, hal ini
diinginkan untuk menganalisis soal tes dengan item. Seperti setiap item dipelajari,
catatan harus dibuat. Isi subjek-materi dan perubahan perilaku yang tampak untuk
diukur. Tabulasi ini nantinya bisa dibandingkan dengan area yang tercakup dalam
program instruksional untuk menentukan sejauh mana cakupan dan penekanan yang
memadai. Jika tabel spesifikasi telah dipersiapkan untuk kursus, analisis uji dapat
dibandingkan secara langsung ke tabel.
Kita jarang berharap untuk menemukan tes standar dalam perjanjian sempurna
dengan tujuan dan isi pokok bahasan ditekankan dalam kursus tertentu atau
kurikulum. Namun, analisis item tes akan membantu menentukan seberapa baik tes
benar-benar tidak mengukur apa yang kita ingin mengukur, daerah mana instruksional
yang diabaikan, dan yang daerah terlalu ditekankan. Informasi ini berguna dalam
menafsirkan hasil tes dan dalam mengembangkan perangkat evaluasi tambahan.
F. Menggunakan Tes Buatan Umum
Beberapa penerbit tes telah membangun bank tujuan instruksional dan item
tes yang cocok untuk berbagai mata pelajaran sekolah. Hal ini memungkinkan untuk
memberikan tes yang custom-made untuk menyesuaikan program instruksional lokal
tertentu. Sebuah prosedur khas untuk mendapatkan tes custom-mad adalah sebagai
berikut: (1) guru, dan personel sekolah lainnya, pilih dari daftar tujuan yang
mencerminkan hasil yang diharapkan dari program lokal, dan (2) penerbit memilih
tes yang sesuai item dan merakitnya menjadi satu atau lebih bentuk tes. Selain itu,
penerbit juga mungkin memberikan penilaian dan pelaporan layanan khusus.
Tes Buatan Umum sangat berguna untuk pengujian kriteria-direferensikan
karena mereka dapat dirancang untuk menghasilkan deskripsi dari pengetahuan
khusus dan keterampilan yang siswa peroleh. Mereka juga berguna untuk normareferenced testing (peringkat relatif dari murid), namun, karena mereka dapat

18

memberikan bukti kemajuan murid terhadap tujuan yang lebih kompleks dari
program lokal. Dalam kedua kasus, penting untuk memeriksa tes custom-made
dengan hati-hati, untuk memastikan bahwa setiap item, dan tes secara keseluruhan,
memuaskan mengukur perilaku murid ditentukan dalam tujuan instruksional.
G. Evaluasi Skala Luas
Tema utama yang berjalan di seluruh buku ini adalah bahwa evaluasi
merupakan bagian integral dari proses belajar-mengajar dan bahwa hal itu melibatkan
dua langkah dasar: (1) mengidentifikasi dan menentukan tujuan pengajaran, dan (2)
membangun atau memilih instrumen evaluasi yang terbaik menilai tujuan tersebut.
Dengan demikian, penekanan utama kami adalah pada sejauh mana ditentukan hasil
belajar untuk tertentu kursus atau kurikulum telah dicapai. Dalam sebuah artikel
tentang evaluasi dan program perbaikan, Cronbach telah menunjukkan bahwa ada
saat-saat itu mungkin diinginkan untuk mengevaluasi hasil melampaui orang-orang
yang telah ditetapkan untuk program tertentu atau kurikulum.
Dalam evaluasi saja, kita tidak perlu banyak khawatir tentang membuat alat
ukur sesuai dengan kurikulum. Namun mengejutkan deklarasi ini mungkin tampak,
dan bagaimanapun bertentangan dengan prinsip-prinsip evaluasi untuk keperluan lain,
ini harus menjadi posisi kita jika kita ingin tahu perubahan apa saja yang
memproduksi pada diri siswa. Evaluasi yang ideal akan mencakup langkah-langkah
dari semua jenis kemampuan yang cukup mungkin diinginkan di daerah yang
bersangkutan, bukan hanya hasil yang dipilih yang ini kurikulum mengarahkan
perhatian besar. Jika Anda hanya ingin tahu seberapa baik kurikulum adalah
mencapai nya tujuan, Anda cocok tes dengan kurikulum; tetapi jika Anda ingin
mengetahui seberapa baik kurikulum adalah melayani kepentingan nasional, Anda
mengukur semua hasil yang mungkin layak diperjuangkan. Salah satu mata pelajaran
matematika baru mungkin mengingkari setiap upaya untuk mengajar trigonometri
numerik, dan memang, mungkin membuang pekerjaan hampir semua komputasi. Hal
ini masih sangat masuk akal untuk bertanya seberapa baik lulusan kursus dapat
19

menghitung dan dapat memecahkan segitiga siku-siku. Bahkan jika pengembang saja
pergi sejauh untuk bersaing bahwa keterampilan komputasi ada tujuan yang tepat dari
instruksi sekunder, mereka akan menghadapi pendidik dan orang awam yang tidak
berbagi pandangan mereka. Jika dapat menunjukkan bahwa siswa yang datang
melalui program baru yang cukup mahir dalam perhitungan meskipun kurangnya
pengajaran langsung, yang ragu-ragu akan diyakinkan. Jika tidak, bukti membuat
jelas berapa banyak yang dikorbankan.
Meskipun komentar ini langsung berkaitan dengan evaluasi skala besar
proyek-proyek perbaikan kurikulum, ide dasar umumnya LI Cronbach, "Improvement
Course melalui Evaluasi," Teachers College Rekam 64, 680, 1963 [Dicetak ulang di
NE Gronlund (ed.),. Bacaan dalam Pengukuran dan Evaluasi . (New York:
Macmillan, 1968)] yang berlaku. Untuk beberapa tujuan, mungkin tepat untuk
menentukan kemajuan murid terhadap tujuan selain yang ditentukan untuk kursus
atau kurikulum. Seorang guru bahasa Inggris, misalnya, mungkin tidak melakukan
pengajaran langsung dari tata bahasa, tapi masih tertarik dalam mengukur
kemampuan murid dalam tata bahasa. Demikian pula, seorang guru sains mungkin
tidak mempertimbangkan ejaan suatu hasil yang diinginkan ilmu pengetahuan, tapi
masih tertarik dalam menentukan seberapa baik murid bisa mengeja istilah ilmiah
yang lebih kompleks. Itu selalu yang sah untuk bertanya berapa banyak belajar
insidental berlangsung, atau sebagai Cronbach telah menunjukkan, berapa banyak
yang dikorbankan di daerah-daerah tidak menerima pengajaran langsung.
Ketika mengevaluasi pada skala yang lebih luas, proses yang berkaitan
dengan prosedur evaluasi hasil belajar pada dasarnya sama. Namun, dalam kasus ini,
tentu saja, diperlukan untuk menghubungkan instrumen evaluasi secara langsung
mungkin untuk semua dari hasil yang akan diukur; bukan hanya orang-orang yang
telah diidentifikasi sebagai hasil yang diharapkan dari instruksi.

RINGKASAN
20

Tujuan instruksional akan berfungsi paling efektif dalam evaluasi kelas jika upaya
sadar dibuat untuk menghubungkan prosedur evaluasi terhadap hasil pembelajaran
yang spesifik dicakup oleh masing-masing tujuan. Upaya ini dapat difasilitasi oleh (1)
rencana umum evaluasi, (2) tabel spesifikasi, dan (3) pilihan teknik evaluasi yang
mengukur setiap hasil belajar paling dekat.
Sebuah rencana evaluasi umum terdiri dari daftar semua tujuan instruksional
umum dan hasil pembelajaran yang spesifik dengan indikasi jenis teknik evaluasi
yang akan digunakan untuk setiap hasil yang diinginkan. Untuk tujuan pengajaran,
metode yang akan digunakan dalam mencapai tujuan juga dapat dimasukkan.
Pengembangan rencana evaluasi umum menjamin bahwa ketentuan telah dibuat
untuk mengevaluasi semua tujuan instruksional dan peringatan guru untuk jenis-jenis
informasi evaluatif yang harus dikumpulkan secara berkala selama semester.
Sebuah tabel spesifikasi ini sangat berguna dalam perencanaan untuk evaluasi kelas.
Ini adalah bagan dua arah yang menghubungkan tujuan instruksional tentu saja
dengan isi subject-matter yang digunakan untuk mencapai tujuan. Ini panduan guru
dalam membangun tes dan instrumen evaluasi lain yang mengukur hasil yang
diharapkan dari instruksi secara seimbang.
Langkah yang paling penting dalam berhubungan prosedur evaluasi untuk
tujuan instruksional adalah dalam pemilihan, atau konstruksi, teknik evaluasi khusus
untuk digunakan. Dalam kasus kedua item tes dan instrumen evaluasi nontest, upaya
terpadu harus dilakukan untuk mendapatkan sampel perilaku murid yang mirip
dengan perilaku yang dijelaskan dalam hasil pembelajaran yang spesifik. Pencocokan
perilaku tes untuk hasil yang dimaksudkan dapat ditingkatkan dengan lebih
mendefinisikan kata kerja yang digunakan dalam hasil pembelajaran yang spesifik
dan dengan mengambil perawatan khusus ketika menilai korespondensi antara respon
tes diharapkan dan hasilnya perilaku menyatakan itu dirancang untuk mengukur.
Dalam beberapa kasus, kita mungkin akan tertarik dalam menentukan sejauh mana
program atau kurikulum yang memodifikasi perilaku murid di daerah selain yang ke
arah mana pengajaran diarahkan. Hal ini memerlukan prosedur evaluasi yang
21

melampaui hasil yang diharapkan dari instruksi, tetapi prinsip dasar yang berkaitan
instrumen evaluasi sedekat mungkin dengan hasil yang akan diukur masih relevan.

22

Anda mungkin juga menyukai