DAFTAR ISI
BAB III PERENCANAAN METODE DAN KEBUTUHAN PENILAIAN HASIL BELAJAR ---- 16
BAB IV MENGADMINISTRASIKAN TES/HASIL TES SESUAI DENGAN KAIDAH DAN
ETIKA PENILAIAN ---------------------------------------------------------------------- 24
A. Latar Belakang Penyusunan Tes Hasil Belajar------------------------------- 24
B. Penulisan Butir Soal Uraian/Esei----------------------------------------------- 28
1. Kekuatan Tes Uraian/Esei------------------------------------------------- 29
2. Kelemahan Tes Uraian/Esei----------------------------------------------- 30
3. Penggunaan Tes Uraian/Esei---------------------------------------------- 31
4. Klasifikasi Tes Uraian/Esei------------------------------------------------- 32
5. Berapa prinsip kontruksi butir soal tes uraian/esei-------------------- 39
C. Penulisan Butir Soal Objektif--------------------------------------------------- 41
D. Perbedaan Dan Persamaan Penilaian Dengan Tes Uraian Dan Tes Obyektif---
------------------------------------------------------------------------------------- 57
E. Beberapa Contoh Butir Soal dalam Lingkup Ranah Kogni----------------- 58
F. Konstruksi instrument Non-tes (Keterampilan/psikomotorik)------------- 59
G. Participation Charts (Bagan Partisipasi)-------------------------------------- 61
BAB V MENGOLAH HASIL PELATIHAN SESUAI DENGAN JENIS TES--------------------- 74
A. Penyusunan Perangkat Tes (Penyuntingan dan Penggandaan)---------- 74
B. Informasi dan Pelaksanaan tes------------------------------------------------ 75
1. Open vs close books (Catatan terbuka vs catatan tertutup)--------- 75
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 2 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
BAB VI MENGANALISIS NASKAH DAN BUTIR – BUTIR SOAL SESUAI DENGAN KAIDAH
DAN STANDAR KOMPETENSI YANG DITETAPKAN ----------------------------- 91
A. Alasan Perlunya Analisis Butir Soal------------------------------------------- 91
B. Karakterisktik Dan Spesifikasi Butir Soal------------------------------------- 92
BAB I
PENDAHULUAN
A. Tujuan Umum
Setelah selesai mengikuti pembelajaran ini peserta pelatihan mampu Melakukan
Penilaian Hasil Pelatihan berdasarkan materi pembelajaran sesuai dengan situasi
pembelajaran
B. Tujuan Khusus
Adapun tujuan mempelajari unit kompetensi melalui buku informasi Melakukan
Penilaian Hasil Pelatihan ini, sehingga pada akhir pelatihan diharapkan peserta
memiliki kemampuan sebagai berikut.
1. mempelajari Pengertian, kegunaan, dan etika penilaian hasil belajar;
2. mempelajari Perencanaan metoda dan kebutuhan penilaian hasil belajar;
3. Mengadministrasikan tes hasil belajar sesuai dengan kaidah dan etika penilaian;
4. Mengolah nilai hasil penilaian;
5. Menganalisis naskah dan butir soal sesuai dengan kaidah dan standar
kompetensi yang ditentukan.
BAB II
PENGERTIAN, KEGUNAAN, DAN ETIKA TES PENILAIAN HASIL BELAJAR
Dalam bagian ini akan diuraikan tentang pengertian, pengukuran tes, dan penilaian
serta peranannya dalam Pelatihan. Dalam pengertian akan dikemukakan arti umum dari
masing-masing konsep serta beberapa pendapat para penulis. Membicarakan peranan
pengukuran, tes dan penilaian dalam Pelatihan akan dicoba juga dikemukakan
beberapa isu penting dalam bidang ini, yang acapkali menjadi bahan perbedaan
pendapat di kalangan ahli Pelatihan dan masyarakat umum.
A. Pengertian Tes
Tes dapat didefinisikan sebagai suatu pertanyaan atau tugas atau seperangkat tugas
yang direncanakan untuk memperoleh informasi tentang trait atau atribut Pelatihan atau
psikologis yang setiap butir pertanyaan atau tugas tersebut mempunyai jawaban atau
ketentuan yang dianggap benar. Dengan demikian maka setiap tes menuntut keharusan
adanya respon dari subjek (orang yang dites) yang dapat disimpulkan sebagai suatu trait
yang dimiliki oleh subjek yang sedang dicari informasinya. Jadi bila ada tugas atau
pertanyaan yang harus dikerjakan oleh seseorang tetapi tidak ada jawaban atau cara
mengerjakan yang benar atau salah, atau suatu usaha pengukuran yang tidak
mengharuskan subjek untuk menjawab atau mengerjakan suatu tugas, maka itu
bukanlah tes.
Tes dapat dipilah-pilah ke dalam berbagai kelompok. Bila dilihat konstruksinya maka
tes dapat diklasifikasikan sebagai berikut:
a) Menurut bentuknya: Secara umum ada dua bentuk tes, yaitu butir tes bentuk
uraian (essay test) dan butir tes bentuk objetif (objective test). Dua bentuk butir
ini dapat dipilah lagi ke dalam beberapa tipe.
b) Menurut bentuknya: Butir tes uraian dapar diklasifikasikan ke dalam dua bentuk
tipe, yaitu tes uraian terbatas (restricted essay), dan tes uraian bebas (extended
essay). Butir tes objetif menurut tipenya dapat dibagi menjadi tiga, yaitu tes
benar-salah (true-false), butir tes menjodohkan (matching), dan butir tes pilihan
ganda (multiple choise).
c) Menurut ragamnya: Tiap tipe tes tersebut dalam butir b di atas dapat dipilah lagi ke
dalam ragam butir tes, yaitu:
1) Tipe tes uraian terbatas:
ragam tes jawaban singkat
ragam tes melengkapi
ragam tes uraian terbatas sederhana
2) tipe tes uraian bebas:
ragam tes urian bebas sederhana
ragam tes urian ekspresif
3) tipe tes objektif benar salah:
ragam benar salah sederhana
ragam benar salah denga koreksi
4) tipe tes objektif menjodohkan:
ragam menjodohkan sederhana
ragam menjodohkan hubungan sebab akibat
5) tipe tes objektif pilihan ganda:
ragam pilihan ganda biasa
ragam pilihan ganda hubungan antar hal
ragam pilihan ganda analisis kasus
ragam pilihan ganda kompleks
ragam pilihan ganda membaca diagram
B. Pengertian Pengukuran
Pengukuran diartikansebagai pemberian angka kepada suatu atribut atau karakteristik
tertentu yang dimiliki oleh orang, hal, atau objek tertentu menurut aturan atau
formulasi yang jelas. Misalnya untuk mengukur tinggi atau berat seseorang dengan
mudah kita memahami karena aturannya telah diketahui secara umum. Tetapi untuk
mengukur pendengaran, penglihatan atau kepekaan seseorang jauh lebih kompleks dari
itu, dan tidak semua orang dapat memahaminya. Dalam kegiatan seperti ini mungkin
saja aturan dan formulasi yang diikuti tidak lagi sederhana. Dalam melakukannya harus
diikuti seperangkat aturan atau formulasi yang disepakati secara umum oleh para ahli.
Kegiatan pengukuran itu menjadi lebih kompleks lagi bila akan mengukur karakteristik
psikologik seseorang, seperti kecerdasan, kematangan, atau kepribadiaan.
Demikian juga halnya dengan pengukuran dalam bidang Pelatihan. Kita hanya
mengukur atribut atau karakteristik peserta didik tertentu, bukan peserta didik itu
sendiri. Instruktur juga dapat mengukur penguasaan peserta Pelatihan dalam suatu
mata pembelajaran tertentu atau kemampuan dalam melakukan suatu keterampilan
tertentu yang telah dilatih, tetapi tidaklah mengukur peserta didik itu sendiri.
Pengukuran Pelatihan adalah salah satu pekerjaan profesional guru, instruktur atau
instruktur. Tanpa kemampuan melakukan pengukuran Pelatihan; seorang guru atau
instruktur tidak akan dapat mengetahui dengan persis di mana ia berada pada suatu
saat atau pada suatu kegiatan.
Dari definisi yang telah dikemukakan di atas terdapat dua karakteristik pengukuran
yang utama, yaitu (1) penggunaan angka atau skala tertentu, dan (2) menurut suatu
aturan atau formula tertentu.
C. Pengertian Penilaian
Penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan
informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan
instrumen tes maupun non-tes. Jadi maksud penilaian adalah memberi nilai tentang
kualitas sesuatu. Tidak hanya sekedar mencari jawaban terhadap pertanyaan tentang
apa, tetapi lebih diarahkan kepada menjawab pertanyaan bagaimana atau seberapa-
jauh sesuatu proses atau suatu hasil yang diperoleh seseorang atau suatu program.
Penilaian di sini diartikan sebagai padanan kata evaluasi.
Secara garis besar penilaian dibgi menjadi dua, yaitu penilaian formatif dan penilaian
sumatif (istilah ini pertama kali digunakan oleh Scriven (1967) dalam artikelnya berjudul
“The Methodology of evaluation”).
Penilaian formatif dilakukan dengan maksud memantau sejauh manakan suatu proses
Pelatihan telah berjalan sebagaimana yang direncanakan. Sedangkan penilaian sumatif
dilakukan untuk mengetahui sejauh mana peserta didik telah dapat berpindah dari
suatu unit pengpembelajaran ke unit berikutnya.
Dari uraian singkat mengenai pengertian tes, pengukuran, dan evaluasi di atas dapat
disimpulkan bahwa ketiga hal tersebut saling berhubungan satu dengan yang lain.
Penilaian hasil belajar baru dapat dilakukan dengan baik dan benar bila menggunakan
informasi yang diperoleh melalui pengukuran hasil belajar, yang menggunakan tes
sebagai alat ukurnya. Tentu saja tes hanya merupakan salah satu alat yang dapat
digunakan. Dapat saja informasi tentang hasil belajar tersebut diperoleh tanpa
menggunakan tes sebagai instrumen ukurnya. Misalnya dapat digunakan alat ukur
nontes, seperti observasi, skala rating, dan lain-lain.
1. Seleksi
Tes dan beberapa alat pengukuran digunakan untuk mengambil keputusan
tentang orang yang akan diterima atau ditolak dalam suatu proses seleksi. Untuk
dapat memutuskan penerimaan atau penolakan ini maka haruslah digunakan tes
yang tepat, yaitu tes yang dapat meramlakan keberhasilan atau kegagalan
seseorang dalam suatu kegiatan tertentu pada masa yang akan datang dengan
resiko yang terendah. Tes jenis ini banyak terjadi dalam masyarakat kita, karena
hampir selalu terjadi peminat untuk dari segi ini, maka acapkali tes seleksi yang
dilakukan hanya sekedar untuk memisahkan orang yang akan diterima dari orang
yang akan ditolak. Bukan untuk memperoleh calon yang paling besar
kemungkinan berhasil dalam pekerjaan atau program yang akan dilakukan.
2. Penempatan
Dalam pelaksanaan kursus atau latihan yang singkat biasanya dilakukan tes
penempatan, untuk menentukan tempat yang paling cocok bagi seseorang untuk
dapat berprestasi dan berproduksi secara efisien dalam suatu proses Pelatihan
atau pekerjaan. Tes seperti ini terutama didasarkan pada informasi tentang apa
yang telah dan apa yang belum dikuasi oleh seseorang.
4. Umpan balik
Hasil suatu pengukuran atau skor tes tertentu dapat digunakan sebagai umpan
balik, baik bagi individu yang menempuh tes maupun bagi instruktur atau
instruktur yang berusaha menstrnsfer kemampuan kepada peserta. Suatu skor
tes dapat digunakan sebagai umpan balik, bila telah diinterprestasi. Setidak-
tidaknya ada dua cara menginterpretasi skor tes, yaitu dengan membandingkan
skor seseorang dengan kelompoknya yang kedua dengan melihat kedudukan
skor yang diperoleh seseorang dengan kriteria yang ditentukan sebelum tes di
mulai. Untuk yang pertama dinamakan “norm reference test” dan yang kedua
dinamakan “criterion reference test”.
7. Pengembangan ilmu
Hasil pengukuran, tes, dan penilaian tentu saja akan dapat memberi sumbangan
yang berarti bagi perkembangan teori dan dasar Pelatihan ilmu seperti
pengukuran Pelatihan dan psikometrik sangat tergantung pada hasil-hasil
pengukuran, tes dan penilaian yang dilakukan sebagai kegiatan sehari-hari
instruktur dan pendidik. Dari hasil itu akan diperoleh pengetahuan empirik yang
sangat berharga untuk pengembangan ilmu dan teori.
E. Etika Tes
Kegiatan pengujian berperan sangat besar dalam sistem Pelatihan dan sistem
persekolahan. Karena pentingnya itu maka setiap tindakan pengujian selalu
menimbulkan kritik yang tajam dari masyarakat. Kritik tersebut tidak jarang datang dari
para ahli, di samping datang dari orang tua yang secara langsung atau tidak langsung
berkepentingan terhadap pengujian. Diantara beberapa kritik tersebut ada beberapa
yang harus menjadi perhatian sungguh-sungguh dari para praktisi dan ahli tes,
pengukuran dan penilaian. Kritik tersebut antara lain.
1. Tes senantiasa akan mencampuri rahasia pribadi tes. Setiap tes berusaha
mengetahui pengetahuan dan kemampuan peserta tes, yang dapat berarti membuka
kelemahan dan kekuatan pribadi seseorang. Di dalam masyarakat yang sangat
melindungi akan hak dan rahasia pribadi, masalah ini selalu akan menjadi gugatan
atau keluhan.
2. Tes selalu menimbulkan rasa cemas peserta tes. Memang sampai batas tertent rasa
cemas itu dibutuhkan untuk dapat mencapai prestasi terbaik. Tetapi tes acapkali
menimbulkan rasa cemas yang tidak perlu, yang justru dapat menghambat
seseorang mampu mendemonstrasikan kemampuan terbaiknya.
3. Tes acapkali justru menghukum peserta yang kreatif. Karena tes itu selalu menuntut
jawaban yang sudah ditentukan pola dan isinya, maka tentau saja hal itu tidak
memberi ruang gerak yang cukup bagi peserta yang kreatif.
4. Tes selalu terikat pada kebuadayaantertentu. Tidak ada tes hasil belajar yang bebas
budaya. Karena itu kemampuan peserta tes untuk memberi jawaban terbaik turut
ditentukan oleh kebuadayaan penyusun tes.
5. Tes hanya mengukur hasil belajar yang sederhana dan yang remeh. Hampir tidak
pernah ada tes hasil belajar yang mampu mengungkapakan tingkah laku peserta
secara menyeleuruh, yang justru menjadi tujuan utama Pelatihan formal apapun.
Karena banyak kritik yang tajam dari masyarakat terhadap praktek tes hasil Pelatihan,
makan para pendidik harus dapat melakukan tes dengan penuh tanggung jawab. Untuk
itu perlu ditegakkan beberapa etika tes, yang membedakan tindakan yang etis dan
tindakan yang tidak etis dalam pelaksanan tes secara profesional.
Praktek tes hasil belajar yang etis terutama mencakup empat hal utama :
a) Kerahasiaan hasil tes
Setiap instruktur atau pengajar wajib melindungi kerahasiaan hasil tes, baik secara
individual maupun secara kelompok. Hasil tes hanya dapat disampaikan kepada
orang lain bila :
1) Ada izin dari peserta yang bersangkutan atau orang yang bertanggung jawab
terhadap peserta didik (bagi peserta didik yang belum dewasa. Jadi dengan
demikian maka praktek menempelkan hasil tes di papan pengumuman dengan
identitas jelas peserta tes, merupakan pelanggaran terhadap etika ini.
2) Ada tanda-tanda yang jelas bahwa hasil tes tersebut menunjukkan gejala yang
membahayakan dirinya atau membahayakan kepetingan prang lain.
3) Pengampaian hasil tes tersebut kepada orang lain jelas-jelas menguntungkan
pesera tes.
b) Keamanan tes
Tes merupakan alat pengukur yang hanya dapat digunakan secara profesional.
Dengan demikain maka tes tidak dapat digunakan diluar batas-batas yang
ditentukan oleh profesionalisme pekerjaan instruktur/ guru. Dengan demikian maka
setiap pendidik harus dapat menjadmin keamaan tes, baik sebelum maupun
sesudah digunakan.
diikuti tanggung jawab profrsional. Bila hasil tes diinterpretasikan secara tidak patut,
dalam jangka panjang akan dapat membahayakan kehidupan peserta tes.
d) Pengunaan tes
Tes hasil belajar haruslah digunakan secara patut. Bila hasil tes belajar tertentu
merupakan tes baku, maka tes tersebut harus digunakan di bawah ketentuan yang
berlaku bagi pelaksanaan tes baku tersebut. Tak ada tes baku yang boleh
digunakan di luar prosedur yang ditetapkan oleh tes itu sendiri.
Disamping beberapa butir seperti yang diuraikan di atas, ada beberapa petunjuk
praktirs yang hendaknya ditaati oleh instruktur dalam tes:
a) Pelaksanaan tes hendaknya diberi tahu terlebih dahulu kepada peserta tes. Hanya
karena pertimbangan tertentu, yang sangat penting, yang membenarkan instruktur
tidak memberi tahu terlebih dahulu kepada peserta tes tentang tes yang akan
dilaksanakan. Bahkan kisi-kisi tes sebaiknya diberi tahu kepada peserta sebelum
melaksanakan tes.
b) Sebaiknya instruktur menjelaskan cara menjawab yang dituntut dalam suatu tes.
Petunjuk menjawab tes bukanlah sesuatu yang harus dirahasiakan. Petunjuk yang
bersifat menjebak harus dihindari.
c) Sebaiknya instruktur justru memotivasi peserta tes mengerjakan tsnya secara baik.
Jangan sampai seorang instruktur justru menakut-nakuti peserta dengan tes.
d) Bila instruktur menggunakan tes baku, maka hendaknya instruktur tersebut
bertanggung jawab penuh terhadap keamanan tes tersebut. Tidak ada tes baku
yang boleh digunakan dalam latihan.
e) Seorang instruktur dapat menggunakan hasil tes untuk mengindentifikasi kekuatan
dan kelemahan peserta tes, asalkan hal tersebut tetap menjadi rahasia peserta tes
dan pendidik yang bersangkutan.
f) Instruktur hendaknya menghindari diri dari keterlibatan dalam bimbingan tes yang
dapat diperkirakan akan mengganggu proses belajar peserta. Hal ini menjadi
penting bila instruktur yang bersangkutan justru terlibat dalam penyusunan butir tes
yang digunakan.
g) Adalah tidak etis bila seorang instruktur mengembangkan butir sola atau perangkat
soal yang paralel dengan suatu tes baku dengan maksud untuk digunakan dalam
bimbingan tes.
h) Adalah tidak etis untuk mendeskriminasikan peserta tertentu atau kelompok
tertentu yang boleh mengikuti suatu tes atau melarang mengikuti tes.
i) Adalah tidak etis untuk memperpanjang waktu atau menyingkat waktu dari yang
ditentukan oleh petunjuk tes.
j) Instruktur tidak boleh meningkatkan rasa cemas peserta tes dengan penjelasan
yang tidak perlu.
Secara lebih mendasar etika tes ini diatur dalam standar tes yang dikembangkan oleh
organisasi profesional seperti American Psychological Association (APA), America
Educational Research Association (AERA), dan National Council on Measurement in
Education (NCME). Terakhir ketiga organisasi profesional ini membentuk Panitia
bersama untuk menyusun standar dalam tes. Mereka menghasilkan buku yang
dinamakan “Standard for Educational and Psychological Testing (1985).
Dalam standard ini dicantumkan berbagai tolok ukur, seperti:
a) Techical Standards for Test Construction and Evaluation;
b) Professional Standards for Tes Use;
c) Standards for Particular Applications; dan
d) Standards for Aministrative Procedures
Semua standar ini mencakup dua aspek utama, yaitu tes hasil belajar dan tes psikologi.
Pelanggaran terhadap standar ini merupakan pelanggaran kepada etika profesi, yang
dalam hal tertentu dapat merupakan pelanggaran atau kejahatan.
BAB III
PERENCANAAN METODE DAN KEBUTUHAN
PENILAIAN HASIL BELAJAR
Tes baru akan berarti bila terdiri dari butir-butir soal yang menguji tujuan yang penting
dan mewakili ranah pengetahuan, kemampuan dan keterampilan secara representatif.
Untuk itu maka peranan perencanaan dalam pengujian menjadi sangat penting. Tes
tanpa rencana yang dapat dipertanggungjawabkan dapat menjadi usaha sia-sia, bahkan
mungkin akan mengganggu proses pencapaian tujuan.
Enam hal yang harus dipertimbangkan dalam perencanaan tes:
6. pengambilan sampel dan pemilihan butir soal;
7. tipe tes yang digunakan;
8. aspek yang akan diuji;
9. format butir soal;
10. jumlah butir soal, dan
11. distribusi tingkat kesukaran butir soal.
luas dan pentingnya pokok bahasan atau sub pokok bahasan tersebut. Sebagai
pedoman tentang tingkat kepentingan dari suatu pokok bahasan atau subpokok
bahasan dapat dilihat dari konstrbusinya terhadap keseluruhan bidang studi itu atau,
untuk mudahnya, keluasan pembahasan pokok bahasan dan atau subpokok bahasan
itu. Tidak ada batasan jumlah butir soal untuk satu pokok bahasan datau suatu
subpokok bahasan.
jumlah soal yang mewakili tiga level yang diharapkan lebih banyak dari jumlah soal
untuk tiga level berikutnya.
Tentu saja dalam menentukan jumlah ini harus mempertimbangkan waktu yang
tersedia, biaya yang ada, komplesitas tuga yang dituntut oleh tes, dan waktu ujian
diadakan.
7. Kisi-kisi tes
Kisi-kisi atau biasa juga sebagai tabel spesifikasi tes umumnya ditampilkan dalam bentuk
matriks yang menunjukkan proporsi dan jumlah angka mutlak dari setiap aspek butir
soal yang membentuk suatu perangkat tes. Dalam suatu kisi-kisi setidak-tidaknya harus
dengan mudah terbaca: (1) Pokok/Sub-pokok bahan yang diuji, (2) Kemampuan yang
diuji (level ranah kognitif), (3) Tingkat kesukaran butir soal, dengan asumsi
pertimbangan ada pada penulis soal.
Kisi-kisi yang sudah terisi menggambarkan proporsi banyaknya butir soal untuk setiap
pokok/sub pokok bahasan dan setiap tingkat kemampuan pada ranah kognitif.
MATAPEMBELAJARAN/TAHUN :
LAMA /WAKTU :
TIPE TES :
JUMLAH BUTIR TES :
JUMLAH
BUTIR SOAL
PROSENTASE 100
KETERANGAN:
C1 : Proses berpikir ingatan
C2 : Proses berpikir pemahanam
C3 : Proses berpikir penerapan
C4, 5, 6 : Proses berpikir analisis, sintesis, dan evaluasi
Mudah, Sedang, Sukar adalah tingkat kesukaran butir soal yang diinginkan. Menentukan tingkat
kesukaran ini didasarkan pada pertimbangan pembuatan soal.
Pokok/Sub Pokok bahasan di kolom 2 diambil dari GBPP (Garis-garis Besar Program Pengajaran), yang
ditarik dari Tujuan Pembelajaran l Khusus (TPK)
Format kisi-kisi yang diperlukan untuk mengembangkan perangkat tes yang hanya terdiri
dari tes pilihan ganda adalah seperti yang tercantum pada Kisi-kisi Tes Objektif. Adapun
langkah yang ditempuh untuk mengisi format tersebut adalah sebagai berikut :
1. Tentukan lamanya waktu pelaksanaan ujian yang direncanakan. Misalnya 90 menit.
2. Hitung banyaknya butir pilihan ganda yang dapat diselesaikan dalam waktu 90 menit.
3. Tentukan pokok bahasan dan subpokok bahasan yang harus diliput dalam tes
tersebut.
4. Tentukan proporsi banyaknya butir soal setiap pokok bahasan. Proporsi ini
tergantung pada tingkat kepentingan pokok bahasan satu terhadap yang lain.
Proporsi dinyatakan dalam persen(%) dan dicantumkan pada kolom paling kanan.
5. Tentukan prosentase/proporsi jenjang kemampuan berpikir dalam perangkat tes
tersebut. Prosentase ini dicantumkan pada baris paling bawah.
6. Dengan menggunakan data pada butir, 2, 4, dan 5 penyebaran butir soal pada
setiap kolom dapat dilaksanakan.
Kisi-kisi untuk tes bentuk uraian lebih sederhana dari tes objektif, karena pada tes
uraian proporsi masing-masing tingatk kemampuan berpikir (pemilahan jengang
berpikir) yang diukur tidak perlu dilaksanakan. Format kisi-kisi tes esei dicantumkan di
bawah ini.
MATAPEMBELAJARAN :
/TAHUN :
LAMA WAKTU :
TIPE TES :
JUMLAH BUTIR TES :
BUTIR SOAL
JUMLAH
PROSENTASE 100
Langkah yang ditempuh untuk mengisi FORMAT KISI-KISI RS ESEI lebih sederhana
yaitu:
1. Tentukan lamanya waktu pelaksanaan ujian yang direncanakan. Misalnya 90 menit.
2. Tentukan banyaknya butir soal uraian yang dapat diselesaikan dalam waktu 90
menit. Misalnya jumlah soal ada 8 butir.
3. Tentukan pokok bahasan dan subpokok bahasan yang harus diliputi dalam perangkat
tes tersebut.
4. Tentukan proporsi banyaknya butir soal setiap pokok bahasan. Proporsi ini
tergantung pada tingkat kepentingan pokok bahasan satu terhadap yang lain.
Proporsi/prosentase tersebut dicantumkan pada kolom paling kanan (9).
5. Distrubusikan jumlah butir soal pada kolom 7 sampai dengan kolom 3 menurut
proporsi yang didasarkan pada pertimbangan keterlaksanaannya. Kolom C2 sampai
dengan C6 diisi dengan angka yaitu jumlahnya butir soal yang mengukur proses
berpikir maksimal C2 atau C3 dan seterusnya. Contohnya: kolom C4 pada pokok
bahasan tertentu diisi dengan angka 2; ini berarti ada 2 butir soal yang masing-
masing akan mengukur proses berpikir tertinggi menganalisis. Dalam hal ini proses
berpikir yang lebih rendah seperti C3 atau C2 dan C1 sudah termasuk dalam
pertanyaan itu.
BAB IV
MENGADMINISTRASIKAN TES/HASIL TES SESUAI DENGAN KAIDAH DAN
ETIKA PENILAIAN
Kelemahan pokok pengukuran hasil belajar di lembaga Pelatihan pada umumnya tidak
terletak pada bentuk dan tipe butir soal yang digunakan, tetapi terutama terletak pada
bentuk dan kemampuan instruktur untuk mengkonstruksikan butir soal dengan baik.
Butir tipe apapun dapat digunakan untuk mengukur hasil belajar bila butir soal tersebut
dikonstruksikan dengan baik dan sesuai dengan tujuan yang ingin dicapai. Dengan kata
lain, butir soal objektif yang lebih baik akan sama baiknya dengan butir soal uraian yang
baik, atau sebaliknya butir soal uraian yang dikonstruksi secara tidak baik akan tidak
mengukur keberhasilan belajar, lebih baik butir soal objektif yang konstruksi dengan
baik. Jadi bila ada tanggapan bahwa suatu bentuk atau tipe butir soal akan lebih baik
dari butir soal yang lain, maka anggapan itu belum pernah teruji dalam penelitian.
Tes hasil belajar (THB) adalah salah satu alat ukur yang paling banyak digunakan untuk
menentukan keberhasilan seseorang dalam suatu proses belajar mengajar atau
menentukan keberhasilan suatu program Pelatihan. Alat ukur lainnya yang
penggunaannya sangat terbatas antara lain pedoman wawancara, pedoman observasi,
angket, skala sikap dan daftat isian. Kesemua alat ukur ini mempunyai peranan
tersendiri namun alat ukur yang satu dengan lainnya dapat saling mendukung dalam
pengukuran hasil belajar.
THB dibuat sedemikian sehingga mampu mengukur hasil belajar seperti pengetahuan
mengenai fakta atau istilah, pengertian mengenai sesuatu konsep atau prinsip,
kemampuan untuk menggunakan suatu konsep atau prinsip da bermacam-macam
kemampuan berpikri lainnya yang lebih tinggi tingkatannya dari mengingat atau
memahami. Demikian juga ranah keterampilah dan ranah sikap dari taxonomi tujuan
Pelatihan Bloom harus diperhitungkan dalam penyusunan THB. Jadi langkah pertama
ialah menentukan hasil belajar yang manakah yang akan diukur pada setiap kegiatan
belajar, pokok bahasan atau sub pokok bahasan. Langkah ini tentunya mengacu pada
tujuan instruksional yang ada pada setiap kegiatan belajar antara lain:
a) telah ditentukan tujuan instruksional untuk setiap kegiatan belajar;
b) tujuan itu dinyatakan dalam bentuk belajar yang masih umum;
c) seterusnya setiap tujuan; instruksional dijabarkan menjadi tujuan yang lebih
khusus lagi sehingga merupakan tingkah laku yag dapat diukur.
Pada hakekatnya tes untuk ketiga ranah kognitif, afektif dan psikomotor dapat
dikembangkan, namun dalam pelaksanaan terdapat penyimpangan yaitu lebih
diutamakan adalah pengukuran pencapaian ranah kognitif yang meliputi keenam tingkat
kemampuan berpikir. Dalam pengembangan butir soal, karena belum terbinanya
keterampilan yang mantap baik pada fase pengembangan (proses pembelajaran)
maupun fase pengukuran, maka tiga aspek berpikir yang terakhir yaitu analisis, sintesis
dan evaluasi dijadikan satu kategori dalam pengukuran. Pada waktu yang akan datang
penyimpangan ini semua harus dibetulkan.
2. THB disusun sedemikian sehingga benar-benar mewakili bahan yang telah dipelajari
Untuk keperlun ini diharapkan penyusun tes dapat mengambil sempel dengan tepat
tujuan instruksional manakah yang sepatutnya ditanyakan untuk mewakili setiap
kegiatan belajar. Pengambilan sampel ini tidaklah begitu sukar terutama bagi mereka
yang sudah mempunyai pengalaman mengajar, namun demikian perlu dibuat suatu
rencana yang menggambarkan pokok-pokok yang akan ditanyakan dan aspek-aspek
yang akan diukur.
Jika THB ingin mengukur sejauh manakah peserta dapat mengingat kembali apa yang
telah diajarkan pada pelajaran yang lalu maka bentuk b, seperti tipe pertanyaan
jawaban singkat ataupun bentuk isian atau salah benar. Seterusnya jika yang diukur
adalah kemampuan peserta untuk memberikan komentar mengenai suatu pendapat
maka bentuk tes yang diperkirakan terbaik adalah bentuk uraian (esei).
Tipe pilihan ganda mempunyai kemampuan untuk mengukur berbagai hasil belajar mulai
dari yang sederhana sampai pada yang kompleks. Misalnya pilihan ganda dapat
digunakan untuk menanyakan hal-hal yang berhubungan dengan fakta, prinsip, hukum
dan aplikasi dari hukum/prinsip, dan akhirnya mengenai tanggapan terhadap suatu
pertanyaan. Untuk mengurangi kelemahan butir soal tipe pilihan ganda, maka digunakan
5 (lima) variasi dalam tipe pilihan ganda: A. Pilihan Ganda Biasa, B. Analisis Hubungan
Antar Hal, C. Analisis Kasus, D. Melengkapi Berganda, dan E. Membaca Diagram,
Gambar, Grafik atau Tabel.
4. THB hendaknya disusun sesuai dengan tujuan penggunaan tes itu sendiri, karena tes
dapat disusun untuk keperluan:
a) Pre test dan post test
pre test adalah tes yang diberikan sebelum pembelajaran dimulai yang bertujuan untuk
mengetahui sejauh manakah peserta telah menguasai bahan yang akan diberikan (entry
behavior).
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 26 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Post test adalah tes yang diberikan sesudah proses pembelajaran diselesaikan,
tujuannya ialah mengetahui sejauh manakah peserta telah menguasai bahan yang telah
diajarkan (achievement). Perbedaan hasil kedua jenis tes ini akan ditentukan oleh proses
belajar dan mengajar, karena jika proses belajar dan mengajar “baik” maka akan
terdapat perbedaan yang besar antara hasil post test dengan pre test. Supaya kedua
hasil ini dapat dibandingkan sudah barang tentu pertanyaan-pertanyaan pada pre test
dibuat sama atau paralel dengan pertanyaan pada post test.
b) Matery test yaitu tes yang dirancang untuk mengukur kemampuan akan
penguasaan minimal yang harus dikuasai oleh peserta tes. Tes seperti ini biasanya
digunakan untuk menentukan tingkat ketuntasan penguasaan bidang studi atau bagian
bahan pembelajaran tertentu.
c) Tes diagnosik yaitu tes yang diberikan sesudah satu mata pelajaran disajikan,
tujuannya ialah untuk mengetahui apakah peserta mendapatkan kesukaran pada
bagaian tertentu dari pelajaran yang diberikan. Penyusunan tes untuk keperluan ini
biasanya dititikberatkan pada materi yang peserta sering melakukan banyak kesalahan,
jadi tidak didasarkan atas sampel yang harus mewakili bagaian yang telah dipelajari.
d) Tes pretasi belajar umum (general achievement, survey test) yaityu tes yang
diberikan sesudah para peserta mendapat pelajaran yang maksudnya untuk mengetahui
tingkat kemampuan peserta secara menyeluruh dan menempatkan mereka sessuai
dengan tingkat kemampuannya.
e) Tes formatif yaitu tes yang diberikan sesudah satu kegiatan belajar diselesaikan
yang bertujuan untuk mengumpulkan data/informasi tentang kualitas proses
pembelajaran tersebut.
f) Tes sumatif yaitu tes yang diberikan sesudah menyelesaikan kegiatan belajar
dalam satu periode tertentu. Tujuannya adalah untuk mengumpulkan data/informasi
dalam mengenai taraf serap peserta terhadap pelajaran yang diberikan.
Dalam penyusunan tes untuk pendekatan standar mutlak maupun standar relatif,
ketetapan (realibility) THB diusahakan sebaik mungkin. Maksudnya THB yang sama atau
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 27 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
yang setara jika diberikan untuk beberapa kali kepada satu kelompok peserta, hasilnya
tidak berbeda (tetap). Untuk mendapatkan hasil semacam ini biasanya dilakukan dengan
membuat jumlah butir pertanyaan yang banyak dalam satu perangkat (set) tes.
Memperbaiki proses pembelajaran merupakan tujuan utama dalam bagian ini dan tujuan
ini akan berhasil baik jika kelima prinsip dasar di atas telah dapat dipenuhi ditambah
dengan adanya tindak lanjut setelah jasil tes diketahui. Tindak lanjut ini dapat ditinjau
dari segi peserta, dari segi bahan ataupun dari segi alat-alat pelajaran. Dengan kata lain
seandainya hasil THB rendah maka harus diadakan analisis mengenai sebab-sebab
mengapa hasil itu rendah.
Hasil tes formatif oleh mahasiwa digunakan untuk menentukan tingkat penguasaan
setiap pelajaran. Sekiranya tingkat penguasan kurang dari 80% maka peserta tersebut
diharuskan membaca kembali kegiatan belajar yang bersangkutan atau kewajiban
instruktur untuk memperbaiki proses pembelajarannya.
Yang dimaksudkan dengan tes uraian dalam tulisan ini adalah butir soal yang
mengandung pertanyaan atau tugas yang jawaban atau pengerjaan soal tersebut
dilakukan dengan cara mengekspresikan pikiran peserta tes. Ciri khas uraian ialah
jawaban terhadap soal tersebut tidak disedikan oleh seorang yangh mengkonstruksi
butir soal, tetapi harus dipasok oleh peserta tes. Jadi yang terutama membedakan tipe
soal objektif dan tipe soal uraian adalah siapa yang menyediakan jawaban atau alttenatif
jawaban terhadap soal atau tugas yang diberikan. Butir soal uraian atau dalam bahasa
Inggrisnya dinamakan “essay test” hanya terdiri dari pertanyaan atau tugas (kadang-
kadang juga harus disertai dengan bebeerapa ketentuan dalam menjawab atau
mengerjakan soal tersebut), dan jawaban sepenuhnya harus dipikirkan oleh peserta tes.
Peserta tes bebas untuk menjawab pertanyaan yang diajukan. Setiap peserta dapat
memilij, menguhubungkan, dan menyampaikan gagasannya dengan menggunakan kata-
katanya sendiri. Dengan pengertian di atas maka segera akan kelihatan bahwa
pemberian skor terhadap jawaban tidak mungkin dilakukan secara objektif.
Ketercapaian kemampuan seperti ini dapat diukur dengan menggunakan tes uraian.
Tidaklah dengan sendirinya tes uraian menghasilkan pengukuran hasil belajar yang
kompleks. Masih sangat tergantung kepada kemampuan instruktur untuk
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 29 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
mengkonstruksi butir soal uraian. Bahkan kita tidak jarang menemui adanya butir soal
uraian yang menanyakan hal yang sederhana, yang sebenarnya jauh lebih efektif bila di
tes dengan menggunakan butir soal objektif.
b. Untuk menyelesaikan tes uraian dengan baik instruktur dan peserta harus
menyediakan waktu cukup banyak. Waktu peserta haruslah cukup banyak ketika
mengerjakan tes. Sedangkan instruktur harus menyediakan waktu yang banyak
untuk memeriksa. Bila kedua waktu ini tidak dapat dilaksanakan, maka sebaiknya tes
uraian tidak digunakan karena tes uraian yang tidak diperiksa dengan teliti tidak
dapat menjadi alat ukur Pelatihan yang efektif.
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 30 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
c. Jawaban peserta tes kadang-kadang disertai dengan bualan. Peserta tes yang kurang
menguasai bahan yang diujikan acapkali juga mencoba menjawab dengan
menguraikan hal lain yang tidak berhubungan dengan hal yang ditanyakan atau
dengan kata lain peserta tes membual. Jawaban yan tidak berharga inipun harus
dibaca oleh instruktur denga teliti.
d. Kemampuan menyatakan pikiran secara tertulis menjadi hal yang paling utam
membedakan presentasi belajar antar peserta. Padahal hanya hasil belajar yang
tertentu sajalah yang harus dikomunikasikan dalam bentuk tertulis. Sebagain besar
hasil belajar lain dinyatakan dalam bentuk tingkah laku atau sikap, bukan dalam
bentuk pernyataan tertulis.
a. Bila jumlah peserta atau peserta ujian terbatas maka soal uraian dapat digunakan
karena masih mungkin bagi instruktur untuk dapat memeriksa/menskor hasil ujian
tersebut secara baik. Bila peserta terlalu banyak, misalnya lebih dari seratus (100)
orang, maka akan menyita waktu instruktur terlalu banyak, sehingga penggunaan
soal uraian menjadi tidak efisien lagi.
b. Bila waktu yang dipunyai instruktur untuk mempersiapkan soal sangat terbatas,
sedangkan ia mempunyai waktu yang cukup untuk memeriksa hasil ujian, maka soal
urain dapat digunaka. Secara relatif, waktu yang dibutuhkan untuk mengkonstruksi
butir soal uraian tidak terlalu banyak.
d. Bila instruktur ingin memperoleh informasi yang tidak tertulis secara langsung di
dalam soal ujian tetapi dapat disimpulkan dari tulisan peserta tes, seperti sikap, nilai,
atau pendapat. Soal uraian dapat digunakan untuk memperoleh informasi tidak
langsung tersebut, tetapi harus digunakan dengan sangat hati-hati oleh instruktur.
e. Bila instruktur ingin memperoleh hasi pengalaman belajar pesertanya, maka tes
uraian merupakan salah satu bentuk yang paling cocok untuk mengukur pengalaman
belajar tersebut.
Pembatasan seperti itu sangat diperlukan sehingga jawaban peserta ujian. Peserta ujian
sepenuhnya diberi kebebasan untuk menjawab menurut gaya bahasa dan gaya
kognitifnya masing-masing. Dengan demikian maka jelaslah keterampilan mengipresikan
pikiran dalam bentuk tertulis akan besar sekali kontribusinya dalam menjawab soal ujian
tipe ini. Butir soal seperti ini baik digunakan untuk mengukur hasil bejalar pada tingkat
aplikasi, analisis, dan evaluasi.
dikehendaki. Batas itu meliputi konteks jawaban yang diinginkan jumlah butir jawaban
yang diharapkan, keluasan uraian jawaban, atah dan luas jawaban yang diminta.
Misalnya :
Untuk menjawab butir soal ini peserta tes jauh lebih terikat bila dibandingkan dengan
contoh terdahulu. Dalam soal tes uraian jenis ini peserta tes tidak dapat memilih dengan
bebas penyajiannya. Ia harus mengikuti instruksi butir soal untuk menjawab. Tetapi
peserta tes tetap mempunyai kebebasan untuk memberikan jawabannya menurut pola
kognitifnya sendiri, dan juga ia mempunyai kebebasan mengepresikan dalam gayanya
senidir. Karena bentuk jawaban yang dituntut butir soal jenis uraian terbatas sebaiknya
digunakan untuk mengukur hasil belajar tingkat pemahaman, aplikasi, dan analisi.
Tes uraian dapat pula diklasifikasi dalam kategori yang lain seperti yang dilakukan oleh
W. S. Monre dan R. E. Carter (1923) yang membedakan 20 jenis butir soal tes uraian,
yaitu butir soal yang :
1) Bersifat ingatan yang terpilih
Misalnya : Sebutkan tiga cara mencegah erosi di lahan kritis.
2) Bersifat ingatan evaluatif
Misalnya : Sebutkan nama dua tokoh yang paling besar peranannya dalam
pembaharuan Islam di Indonesia dalam abad keduapuluh.
3) Membandingkan dua hal terbatas :
Misalnya : Bandingkanlah taktik dan strategi perjuangan mencapai kemerdekaan
antara Ir. Soekarno dan Drs. Moh. Hatta.
Yang dimaksud dengan butir soal melengkapi adalah butir soal yang meminta atau
memerintah peserta untuk melengkapi suatu kalimat dengan satu frasa, satu angka atau
satu formula.
kemampuan mengingat fakta dan prinsip yang sederhana. Selain itu tipe butir soal ini
juga dapat digunakan untuk menguji kemampuan pada tingkatan yang lebih tinggi,
seperti pemahaman, aplikasi, bahkan evaluasi, asalkan dikonstruksi secara hati-hati.
Kekuatan utama butir soal tipe melengkapi ini adalah mudah dikonstruksi. Dalam waktu
yang relatif singkat dapat dikontruksi sejumlah butir soal. Dengan demikian butir soal
tipe ini dapat membantu instruktur yang harus mempersiapkan butir soal dalam waktu
yang singkat, tanpa mengorbankan mutu butir soal. Pengunaan tipe butir soal
melengkapi ini akan mampu menguji sebagian besar pokok bahasan dalam waktu yang
relatif singkat.
Butir soal tipe jawaban melengkapi ini tentu mempunyai keterbatasan. Keterbatasan
utamanya adalah tidak dapat menguji semua tingkat kemampuan hasil belajar. Karena
sifatnya yang membatasi jawaban pada satu kata, frasa, angka atau formula maka tidak
mungkin tes seperti itu mampu mengukur kemampuan mengekpresikan pikiran atau
memformulasi pendapat secara tepat. Butir soal tipe ini terlalu menekankan pada
kemampuan mengingat, sehingga hasil tes tidak akan menggambarkan keseluruhan
kemampuan hasil belajar.
(1) Kontruksilah butir soal yang mengukur hasil belajar yang penting saja.
Hasil belajar yang remeh (trivial) tidak perlu diujikan. Misalnya :
Lemah : Jumlah bayi yang meinggal sebelum mencapau usia enam tahun di
kecamatan ini tahun lalu adalah ...
Lebih baik : Di Kecamatan ini jumlah bayi yang meninggal sebelum mencapai usia
lima tahun dalam dua tahun terakhir adalah ... untuk setiap seribu
penduduk
(2) Kontruksilah butir soal yang mengandung permasalahan yang bersifat spesifik. Butir
soal itu haruslah menjamin bahwa hanya peserta tes yang menguasai isi pelaharan
yang dapat menjawab soal itu dengan baik.
Misalnya :
Lemah : Daun tembakau mengandung ...
Lebih baik : Bahan yang berbahaya bagi kesehatan yang terdapat dalam daun
tembakau adalah ...
(3) Kontruksilah butir soal mengharuskan peserta memberi jawaban yang secara faktual
benar. Misalnya :
Lemah : Orang merokok akan ...
Lebih baik : Kebiasaan merokok akan menyebabkan penyakit ...
(4) Kontruksilah butir soal dengan menggunakan bahasa yang jelas, dan tidak
mengandung arti yang mendua. Misalnya :
Lemah : Ibukota Kuwait yang diduduki Irak adalah ....
Lebih baik : Ibukota Kuwait adalah ...
(5) Bila yang ditanyakan menyangkut angka atau jumlah dari satu satuan tertentu, maka
sebaiknya nyatakan satuan tersebut dalam soal. Misalnya :
Lemah : Seorang anak umur 12 tahun sebaiknya setiap hari minum susu ...
Lebih baik : Seorang anak umur 12 tahun sebaiknya setiap hari minum susu murni ...
gelas
Contoh yang menggunakan bentuk asosiasi adalah : Apakah nama ibu kota propinsi
berikut ?
Irian Jaya .
Aceh ..
Bengkulu .
(1) Pergunakanlah kata-kata yang menuntut jawaban yang singkat dan tertentu.
Jawaban itu haruslah satu kata, satu frasa, sebuah angka, atau sebuah simbol.
Misalnya :
Lemah : Disebut apakah binatang pemakan binatang lain dan tumbuh-tumbuhan
?
Lebih baik : Termasuk klasifikasi apakah binatang pemakan binatang lain dan
tumbuh-tumbuhan ?
(2) Jangan menggunakan kalimat yang langsung diambil dari buku atau dari catatan.
Penggunaan kalimat yang langsung diambil dari buku atau catatan cenderung
mendorong peserta didik akan menghafal mati, tanpa berusaha memahami apa yang
dipelajarinya. Untuk menghindari kelemahan itu maka sebaiknya bahan ajaran yang
diambil dari buku tersebut disusun kembali dalam kalimat yang mudah dipahami oleh
peserta.
(3) Jangan sampai pertanyaan yang diajukan menjadi tes bahasa sedangkan maksudnya
untuk menguji materi pelajaran lain. Misal :
a. prinsip 1: Gunakanlah tipe tes uraian untuk mengukur hasil belajar yang cocok.
Hubungkanlah prinsip ini dengan kekuatan tes uraian yang telah dikemukakan di
atas.
b. prinsip 2: Beritahulah sebelumnya bahwa dalam tes yang akand atang akan
digunakan tipe tes uraian. Hal ini perlu dilakukan agar peserta tes lebih
siap dn agar tes yang dilaksanakan itu cukup adil.
c. prinsip 3: Batasilah ruang lingkup tes secara pasti, dengan demikian peserta tes tahu
dengan pasti bahan yang harus dipelajarinya. Hendaknya peserta tes juga
diberi tahu terlebih dahulu apakah bahan akan diambil dari buku ajar, atau
juga meliputi catatan pelajaran, hasil diskusi kelas, bacaan tambahan, atau
pengetahuan umum dari sumber yang tidak terbatas.
d. prinsip 4: Pertanyaan hendaknya terutama untuk mengukur tujuan hasil belajar yang
penting saja. Hal ini sangat perlu diperhatikan, akrena jumlah butir soal
dalam tes uraian sangat terbatas. Jadi pergunakanlah setiap butir soal
secara optimal untuk mengukur hasil belajar yang penting dan tidak
mungkin diukur dengan tipe soal lain.
e. prinsip 5: Jangan terlalu banyak menggunakan butir soal tipe uraian untuk mengukur
kemampuan mengingat. Tipe soal objektif jauh lebih efektif dan efisien bila
digunakan untuk mengukur kemampuan mengingat fakta.
g. prinsip 7: Jangan memberikan butir soal yang dapat dipilih atau dapat tidak
dikerjakan. Misalnya, janganlah membuat petunjuk soal sebagai berikut :
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 39 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Pilihlah dua dari tiga soal di bawah ini. Hal ini akan sangat menyukatkan
pemeriksa dan memberi skor yang adil.
h. prinsip 8: Setiap soal harus jelas apakah jenis terbatas atau jenis bebas. Dengan
demikian peserta tes dapat membatasi diri dalam memberikan responsnya.
i. prinsip 9: Makin banyak jumlah butir soal untuk setiap perangkat soal makin baik.
Jadi usahakan agar setiap tes menyajikan butir soal uraian sebanyak-
banyaknya sesuai dengan waktu yang tersedia.
j. prinsip 10: Tulislah petunjuk awal yang jelas, dan juga petunjuk untuk setiap
butir soal harus rinci dan dapat dipahami oleh peserta tes dengan jelas.
Dalam menulis petunjuk ini harus menggunakan struktur kalimat yang
sederhana. Tidak boleh ada dua tafsiran untuk setiap kalimat petunjuk
yang digunakan.
k. prinsip 11: Waktu yang tersedia haruslah diperkirakan cukup (tidak kurang dan
tidak lebih) untuk rata-rata kemampuan peserta tes. Jadi dapat
diperkirakan waktu yang tersedia akan berlebihan bagi peserta yang
pandai dan akan kekurangan bagi peserta yang kurang pandai.
l. prinsip 12: Hendaknya pertanyaan menuntur respon atau jawaban yang bersifat
baru atau pemikiran peserta tes. Jadi jangan hanya meminta jawaban yang
merupakan pengulangan dari hal yang telah diajarkan atu sesuatu yang
sudah ada di dalam buku. Tetapi lebih baik bila peserta mengeluarkan
pikiran orisinilnya.
m. prinsip 13: Dalam setiap perangkat tes hendaknya selalu ada kombinasi jenis
tes uraian terbatas dan jenis tes uraian bebas.
o. prinsip 15: Dalam setiap butir soal harus dijelaskan skor maksimal yang dapat
diperoleh bila jawabannya sesuai dengan yang diminta, dan jelaskan pula
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 40 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
p. prinsip 16: janganlah mulai kalimat butir soal dengan kata-kata seperti apa dan
siapa. Pertanyaan seperti itu hanya akan menghasilkan jawaban singkat
yang bersifat ingatan, yang sebaiknya tidak diuji dengan tes tipe uraian.
Dari tipe-tipe tersebut dapat dikembangkan beberapa modifikasi lagi. Misalnya tes
objektif pilihan ganda dapar dimodifikasi ke dalam 5 (lima) ragam berikut:
a. pilihan ganda biasa
b. pilihan ganda analisis hubungan antar hal
c. pilihan ganda analisis kasus
d. pilihan ganda kompleks
e. pilihan ganda yang menggunakan diagram, grafik, tabel atau gambar.
Kelima ragam tes objektif pilihan ganda ini sama struktur (formatnya) yaitu ada
pokok soal (stem) yang diikuti oleh sejumlah pilihan (options). Di antara pilihan ini ada
satu jawaban yang benar atau paling tepat (key). Pilihan di luar yang benar atau yang
paling tepat berfungsi sebagai pengecoh (distractors).
b) Perangkat soal dapat mewakili seluruh pokok bahasan. Keunggulan ini merupakan
kekuatan utama tipe tes benar-salah. Hal itu dapat dicapai karena setiap butir soal
benar-salah hanya membutuhkan waktu yang singkat untuk menjawabnya. Karena
itu dalam waktu yang relatif singkat dapat dicakup banyak butir soal. Butir-butir soal
soal tersebut dapat disusun dari segenap pokok bahasan yang tercakup dalam
bidang studi tersebut.
c) Mudah diskor. Karena hanya ada dua alternatif jawaban, maka setiap butir soal
hanya mempunyai dua alternatif skor, yaitu 1 (satu) untuk yang mengerjakannya
secara benar, dan 0 (nol) bagi yang menjawab salah. Dengan demikian penskoran
sangat mudah, dan dapat dilakukan oleh siapa saja, bahkan dapat dikerjakan oleh
mesin.
d) Alat yang baik untuk mengukur fakta dan hasil belajar langsung terutama yang
berkenaan dengan ingata. Butir soal tipe benar-salah mengukur kemampuan dasar
hasil belajar, yaitu dapat membedakan antara kenyataan dari yang bukan kenyataan
atau dari suatu yang benar dari yang salah. Tentu saja kebaikan ini tidak terlalu tepat
bila yang ingin diukur kemampuan membedakan secara lebih teliti.
2) Keterbatasan Butir Tipe Benar-Salah
b) Terlalu menekankan kepada ingatan. Bentuk butir soal tipe ini memaksa penulis butir
soal menguji hasil belajar langsung berbentuk ingatan. Bahkan kelemahan ini lebih
diperburuk lagi karena kesalahan para instruktur mengkonstruksi butir soal yang
mengambil pernyataan lansung dari buku ajar yang digunakan. Memang ada juga
kebaikan butir soal yang bersifat ingatan itu, yaitu dapat membedakan peserta tes
yang tahu dan peserta tes yang tidak tahu. Tetapi karena kelemahan yang pertama
tadi, mendorong kepada penebakan, maka kelemahan kedua ini makin menonjol.
c) Meminta respon peserta tes yang berbentuk pemilihan absolut. Sedangkan dalam
kenyataannya hasil belajar itu kebanyakan bukan lah sesuatu kebenaran absolut
tanpa kondisi, misalnya:
1. B – S : 1/3 = 0,3
2. B – S : Matahari terbit kemarin
3. B – S : Indonesia terdiri dari 27 propinsi
Butir soal nomor 1 sulit sekali untuk dinyatakan sebagai kebenaran absolut. Butir soal
nomor 2 seakan-akan merupakan kebenaran absolut. Tetapi kita coba lihat apakah
benar di seluruh permukaan bumi mahatari terbit kemarin. Apakah benar di kutub utara
atau kutub selatan matahari terbit kemarin? Butir soal nomor 3 juga seakan-akan
kebenaran mutlak tetapi bukankah pada tahun 1945 Indonesia tidak terdiri dari 27
propinsi?
Ada lima persyaratan yang harus dipenuhi oleh setiap butir soal tipe benar-salah untuk
dapat dikatakan sebagai butir soal yang baik, yaitu:
a) Setiap butir soal harus menguji atau mengukur hasil belajar peserta tes yang penting
dan bermakna, tidak menanyakan hal yang remeh (trivial). Misalnya:
Lemah : B – S Bung Hatta dilahirkan di Bukittinggi
Lebih baik : B – S Pemikiran Bung Hatta tentang hak asasi manusia telah
diabadikan dalam pasal-pasal UUD 1945
Mempersoalkan tempat kelahiran Bung Hatta tidak ada sangkut pautnya dengan
peranan Bung Hatta dalam perjuangan mencapai dan mempertahankan
kemerdekaan Indonesia. Sedangkan pikiran dan pendapat Bung Hatta tentang hak
asasi manusia mempunyai arti sejarah yang amat penting bagi Bangsa Indonesia.
b) Setiap butir haruslah menguji pemahaman, tidak hanya pengukuran terhadap daya
ingat. Butir soal tidaklah dianjurkan untuk menguji kemampuan mengingat kata atau
frasa yang terdapat dalam buku ajar atau bacaan lainnya. Misalnya:
Lemah :B–S Hukum Newton I menyatakan bahwa setiap benda akan
bergerak lurus beraturan atau diam, jika tidak ada resultan
gaya yang bekerja pada benda itu.
Lebih baik : B – S Penumpang bis yang duduk tenang dalam bis yang berjalan
dengan kecepatan 80 Km per jam akan terdorong ke depan
bila bis diberhentikan secara tiba-tiba.
Dalam butir soal yang pertama di atas jelas hanya menguji kemampuan menghafal
bunyi hukum Newton 1 (Hukum Kelembaman), yang bila dapat dijawab oleh peserta
tes dengan benar, penguji belum mendapat kepastian peserta mengerti akan hukum
kelembaman tersebut. Tetapi dengan soal berikutnya penguji akan dapat
memastikan bahwa mahasisw tahu tentang hukum kelembaman dan dapat
memahaminya dengan baik.
e) Mudah diskor. Seperti semua butir soal objektif, butir soal tipe menjodohkan inipun
dapat diskor tanpa terikut serta nilai dan pendapat pemeriksa.
Keterbatasan butir soal tipe ini ialah terlalu mengandalkan pada pengujian aspek
ingatan. Untuk dapat menghindari kelemahan ini maka konstruksi butir soal tipe ini
harus dipersiapkan secara hati-hati.
Lemah:
Kolom Pertama Kolom kedua
1. Ir. Soekarno A. Pemerataan hasil pembangunan.
2. Pertanian B. Makhluk laut yang melahirkan.
3. Persaingan bebas C. Proklamator kemerdekaan.
4. Ikan paus D. Demokrasi liberal.
E. Prioritas pembangunan.
Lebih baik:
Kolom Pertama Kolom kedua
1. Soekarno A. Bapak Koperasi Indonesia.
2. Suharto B. Bapak Palang Merah.
3. Moh. Hatta C. Bapak Pramuka Indonesia.
4. Sultan Hamengkubowono D. Bapak Pembangunan.
E. Bapak Revolusi Indonesia.
b) Pernyataan di bawah ini kolom kedua harus lebih banyak dari pernyataan di bawah
kelompok pertama. Untuk memudahkan penyediaan lembaran jawaban yang
seragam, maka dianjurkan supaya jumlah pernyataan di bawah kolom pertama
berkisar antara 3 atau 4 buah. Sedangkan pernyataan di bawah kolom kedua adalah
5. dengan demikian lembaran jawaban akan seragam dengan bentuk butir soal
pilihan ganda lainnya.
a. Danau Ranau
b. Danau Maninjau
2 c. Danau Singkarak
*d. Danau Toba
e. Danau Laut Tawar
Bagian pertanyaan dari soal di atas disebut stem (pokok soal) dan bagian kedua
dinamakan option (pilihan). Dari contoh ini jelasskan bahwa stem dapat terdiri dari
pernyataan dan pertanyaan. Sedangkan option terdiri dari beberapa pilihan, dan salah
satu alternatif pilihan itu adalah jawaban yang benar terhadap pertanyaan (dalam hal ini
yang ditandai dengan asterik (*). Jawaban tersebut dinamakan kunci jawaban. Jadi
dalam option ada pilihan yang bukan kunci. Alternatif jawaban yang bukan kunci
dinamakan pengecoh atau distractors atau foils.
a) Butir soal tipe pilihan ganda dapat dikonstruksi dan digunakan untuk mengukur
segala level tujuan instruksional, mulai dari yang paling sederhana sampai dengan
yang paling kompleks, kecuali tujuan yang berupa kemampuan mendemonstrasikan
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 47 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
keterampilan menyatakan sesuatu yang ekspresif. Misalnya tujuan yang ingin diukur
adalah memperhatikan keindahan tulisan, kemampuan membuat gambar, atau
kemampuan mendemonstrasikan keseimbangan tubuh. Hal-hal tersebut tidak akan
dapat diukur dengan butir soa objetif manapun, termasuk butir soal tipe pilihan
ganda.
b) Karena karaktristik dari butir pilihan ganda hanya menuntut waktu kerja peserta tes
sangat minimal, maka setiap perangkat tes yang menggunakan butir soal pilihan
ganda sebagai alat ukur dapat menggunakan jumlah butir soal yang relatif banyak
dan karena itu maka penarikan sampel pokok bahasan yang akan diujikan dapat lebih
luas. Jadi setiap perangkat tes dapat mencakup hampir seluruh cakupan bidang
studi.
c) Penskoran hasil kerja peserta dapat dikerjakan secara objektif. Dengan demikian
maka tidak ada unsur subyektifivitas pemeriksa masuk kedalam skor hasil ujian.
Bahkan karena sifatnya maka penskoran dapat dilakukan oleh mesin. Karena itu pula
maka dapat dikerjakan dalam waktu yang sangat singkat. Bagi instruktur yang harus
mengajarkan banyak mata pelajaran dan memegang banyak kelas dan peserta dalam
waktu yang bersamaan akan dapat dibantu oleh penggunaan tipe butir soal ini dalam
tes, tanpa mengorbankan mutu alat ukur dan obyektivitas hasil ujian.
d) Tipe butir soal dapat dikonstruksi sehingga menuntut kemampuan peserta tes untuk
membedakan berbagai tingkatan kebenaran sekaligus. Misalnya dapat dikonstruksi
suatu butir soal dengan option yang seluruhnya benar, tetapi dalam tingkatan
kebenaran yang berbeda. Peserta tes diminta untuk menyatakan butir jawaban yang
paling benar diantara semua jawaban yang benar tersebut. Hal ini juga merupakan
keunggulan yang sukar diperoleh dari butir soal tipe lain.
e) Jumlah option yang dapat disediakan melebihi dua. Karena itu akan dapat
mengurangi keinginan peserta untuk menebak.
Biasanya keinginan menebak menjadi lebih besar bila probabilitas untuk benar makin
besar. Jadi bila option lebih dari dua, maka probabilitas untuk tebakannya akan
berkurang dari 50%. Tentu hal ini tidak berlaku bagi peserta tes yang memang ingin
menebak.
f) Tipe butir soal pilihan ganda memungkinkan dilakukan analisis butir soal secara baik,
butir soal dapat dikonstruksi dengan dilakukan uji coba terlebih dahulu. Bila uji coba
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 48 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
butir soal tersebut ternyata mengandung kelemahan (setelah dianalisis) maka dapat
dilakukan perbaikan, karena dari hasil analisis dapat dideteksi kelemahan butir soal
tersebut. Hal itu tidak mungkin dilakukan secara empirik pada tipe butir soal yang
lain.
g) Tingkat kesukaran butir soal dapat dikendali, dengan hanya mengubak tingkat
homogenitas alternatif jawaban. Makin homogen alternatif jawaban, maka makin
tinggi tingkat kesukarannya, dan sebaliknya makin kurang homogenitas alternatif
jawaban, maka makin rendah tingkat kesukaran butir soal.
h) Informasi yang diberika lebih kaya. Butir soal ini dapat memberikan informasi tentang
peserta tes lebih banyak kepada instruktur, terutama bila butir soal itu memiliki
homogenitas yang tinggi. Setiap pilihan peserta tes terhadap alternatif jawaban
merupakan suatu informasi tersendiri tentang penguasaan kognitif peserta tes dalam
bidang yang dites. Dengan demikian maka bentuk soal ini baik digunakan untuk
mengukur daya serap peserta, dan mendiagnosa kelemahan peserta.
Selain kekuatan tipe butir soal pilihan ganda yang telah dikemukanan di atas, tentu
saja tipe butir soal ini tidak terlepas dari kelemahan-kelemahan. Kelemahan itu banyak
juga yang merupakan kelemahan semua bentuk butir soal objektif. Misalnya, dengan
butir soal seperti ini tidak terhindari dari besarnya dorongan untuk mempersoalkan hal-
hal yang bersifat remeh (tivial). Pertanyaan atau pernyataan yang dibuat acapkali
mengandung pengertian mendua, sehingga akan sangat menyukarkan bagi peserta yang
belajar dengan baik. Karena itu banyak sekali kritik orang terhadap butir soal objektif.
Kritik itu terutama datang dari orang yang telah kawakan dengan masalah
pengukuranhasil belajar. Karena itu pula banyak kritik itu yang tidak didasarkan pada
kenyataan empirik dan sikap yang terlalu memuja butir esei tanpa mengetahui
kelemahan utama butir soal yang demikian itu.
jawaban tidak homogen. Butir soal yang seperti ini tidak terlalu bernilai untuk
mengukur kemamuan peserta tes.
b) Ada kecenderungan bahwa instruktur mengkonstruksi butir soal tipe ini dengan
hanya menguji atau mengukur aspek ingatan, atau aspek yang paling rendah dalam
ranah kognitif. Tidak berarti bahwa aspek ini tidak penting dalam hasil belajar. Tetapi
bila sebagian besar butir soal itu hanya menguji satu aspek kognitif, maka perangkat
tes tidak terlalu berarti sebagai alat pengukur keberhasilan belajar secara
menyeluruh.
c) “Testwise” mempunyai pengaruh yang berarti terhadap hasil tes peserta. Jadi makin
terbiasa seseorang dengan bentuk tes tipe pilihan ganda, makin besar kemungkinan
ia akan memperoleh skor yang lebih baik (lihat hasil penelitian Alker et. Al, 1967).
Kenaikan skor karena testwise ini sungguh pun cukup berarti tetapi tidak akan
sampai mengganggu interpretasi hasil individual, asalkan instruktur menyadari
adanya pengaruh itu.
Karena itu ada semacam kesepakatan diantara para penulis buku tes dan pengukuran
bahwa jumlah option yang baik adalah berkisar antara empat atau lima saja. Tentu saja
tidak hanya jumlah option yang menentukan baik buruknya butir soal. Yang lebih
penting lagi ialah option tersebut disusun menurut kaidah-kaidah yang benar.
Mutu butir soal tipe pilihan ganda sangat tergantung kepada kemampuan orang yang
mengkonstruksi butir soal tipe ini. Butir soal yang dibuat secara serampangan atau
dibuat oleh orang yang tidak terlatih akan berbahaya bagi proses Pelatihan secara
keseluruhan karena akan mengarah kepada interpretasi yang salah kepada kemampuan
atau hasil belajar peserta tes. Jadi pelatihan dan pengetahuan tentang prinsip
penyusunan butir soal tipe ini akan sangat menentukan hasil pengukuran hasil belajar.
Dalan tes bentuk pilihan ganda, selain pokok soal yang harus jelas ruamusnya dan tidak
merupakan pernyataan yang dapat ditafsirkan bermacam-macam sehingga meragukan
artinya, atau tidak jelas maksudnya, rumusan pilihan yang benar dan pengecohnya
harus dibuat hampir sama. Penulis soal selalu bertanya pada dirinya. Apakah yang ingin
ditanyakan telah ditulis (dikomunikasikan) dengan baik. Apakah terdapat “petunjuk”
pada alternatif jawaban yang benar.
Berikut ini dikemukakan beberapa prinsip pokok dalam konstruksi butir soal tipe
pilihan ganda.
1. saripati permasalahan harus ditempatkan pada pokok soal (stem). Inti permasalahan
dalam butir soal tersebut harus dicantumkan dalam rumusan pokok soal, sehingga
dengan membaca pokok soal, peserta sudah dapat menentukan jawaban sebelum
dilanjutkan membaca pilihan jawaban. Persyaratan ini tidak berlaku bagi
pengembangan butir soal kesusasteraan.
Contoh:
Yang kurang baik.
Pulau jawa adalah pulau yang ......
A. menghasilkan banyak minyak
B. penduduknya terpadat
C. dijadikan objek wisata
D. mendapat julukan pulau perca
Contoh:
Yang lebih baik.
Pulau yang terpadat penduduknya di Indonesia adalah pulau .....
A. Sumatera
B. Jawa
C. Kalimanta
D. Sulawesi
Contoh kedua lebih baik dari contoh yang pertama karena membaca pokok soal
peserta sudah dapat membuat jawaban sebelum membaca pilihan A, B, C dan D.
Contoh:
Yang kurang baik
Penulis contoh 2 dibuah menjadi:
Pulau yang terpadat penduduknya di Indonesia adalah:
A. pulau Sumatera
B. pulau Jawa
C. pulau Kalimantan
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 51 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
D. pulau Sulawesi
3. Hindari rumusan kata yang berlebihan. Tidak selalu penjelasan terinci mempermudah
pengertian, justu dapat membingungkan dan mengaburkan pengertian. Yang penting
rumusan yang baik yang berisi, padat, dan jelas tanpa kata-kata “kembang”.
Contoh:
Yang kurang baik.
Kalau butir 2 ditambah rumusannya menjadi:
Pulau yang terpadat penduduknya di Indonesia sehingga sukar untuk meningkatnya
produksi pangan adalah pulau .....
A. Sumatera
B. Jawa
C. Kalimanta
D. Sulawesi
4. Kalau pokok soal merupakan pernyataan yang belum lengkap, maka kata atau kata-
kata yang melengkapi harus diletakkan pada ujung pernyataan, bukan di tengah-
tengah kalimat.
Contoh:
Yang kurang baik
Menurut De Bakey, ...... adalah penyeban penyakit penyempitan pembuluh darah.
A. cholesterol
B. kelebihan berat
C. merokok
D. tekanan batin
Contoh:
Yang lebih baik
Menurut De Bakey, penyakit penyempitan pembuluh darah disebabkan oleh ......
A. cholesterol
B. kelebihan berat
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 52 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
C. merokok
D. tekanan batin
5. Susunan alternatif jawaban dibuat teratur dan sederhana. Cara menyusun altenatif
jawaban dibuat berderet dari atas ke bawah. Kalau yang dideretkan itu terdiri dari
satu kata, urutan ke bawah dibuat berdasarkan alfabet, kalau dideretkan bilangan,
urutan ke bawah berdasarkan bilangan yang makin bertambah besar atau makin
menurun, atau diurutkan berdasarkan panjang kalimat.
6. Hindari penggunaan kata-kata teknis atau ilmiah atau istilah yang aneh atau
mentereng. Perlu diingat bahwa tes yang dikembangakn bertujuan untuk mengukur
materi pelajaran, kalau materi tersebut tidak menyangkut perbendaharaan, janganlah
menggunakan istilah teknik atau aneh.
Contoh:
Yang kurang baik:
Apakah kritik utama ahli psikologi terhadap tes?
q. Tes menimbulkan ancienty.
r. Tes selalu disertai cultural bias.
s. Tes hanya mengukur hal-hal yang trivial.
t. Tes tergantung pada kemampuan kognitif guru.
Contoh:
Yang lebih baik
Apakah kritik utama ahli psikologis terhadap tes?
A. Tes menimbulkan rasa cemas.
B. Tes sangat tergantung pada nilai budaya tertentu.
C. Tes mengukur hasil belajar yang tidak penting.
D. Tes sangat ditentukan oleh pengetahuan guru.
7. Semua pilihan jawaban harus homogen dan dimungkinkan sebagai jawaban yang
benar. Ciri khas pilihan ganda dari tes objektif yang lain adalah pada pilihan ganda
semua alternatif jawaban ada kemungkinan sebagai jawaban yang benar, sehingga
peserta terpaksa membaca dan memikirkan semua pilihan dan menentukan yang
mana yang paling tepat untuk menjawab pertanyaan tersebut. Hindari pengecoh
yang dengan melihat sepintas peserta sudah dapat menentukan pengecoh tersebut
tidak ada sangkutannya dengan pokok soal atau pengecoh tersebut adalah jawaban
yang tidak masuk akal.
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 53 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Contoh:
Yang kurang baik
Siapakah di antara nama-nama di bawah ini yang menemukan telepon?
u. Bell
v. Marconi
w. Morse
x. Pasteur
Yang lebih baik
Siapakah di antara nama-nama di bawah ini yang menemukan telepon?
A. Bell
B. Marconi
C. Morse
D. Edison
8. Hindari keadaan dimana jawaban yang benar selalu ditulis lebih panjang dari
jawaban yang salah. Ada kecenderungan peserta memilih jawaban yang lebih
panjang dan lebih terinci sebagai jawaban yang benar. Oleh karena itu penulis soal
berusaha agar pengecoh dan jawaban yang benar ditulis sama panjang dengan
rincian yang sama pula.
Contoh:
Yang kurang baik
Agar air panas dalam teko tidak cepat dingin, maka teko tersebut dibungkus dengan
.....
A. kain
B. seng
C. tembaga
D. timah
Pilihan B, C, dan D termasuk logam, A bukan logam
Dalam contoh ini A jawaban yang benar, ada petunjuk bahwa A lain dari 3 pilihan
berikutnya.
Contoh:
Yang lebih baik
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 54 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Air panas akan bertahan panas jika disimpan dalam bejana yang terbuat dari ......
A. alumunium
B. keramik
C. plastik
D. seng
10. Hindari menggunakan pilihan yang berbunyi “ semua jawaban di atas benar” atau
“tidak ada satupun yang di atas benar”. Adanya pilihan semacam ini sebenarnya
mengurangi jumlah alternatif pilihan, karena kalau peserta sudah mengenal satu atau
dua di antara empat pilihan sebagai jawaban pilihan ketiga peserta tersebut akan
memilih “semua jawaban yang di atas benar”. Hal yang sama berlaku untuk “tidak
satupun yang di atas benar”.
11. Gunakan tiga atau lebih alternatif pilihan. Kalau hanya ada dua pilihan saja, bentuk
ini sama dengan bentuk salah-benar. Dua pilihan berarti tebakan tinggi sedangkan
kalau lima pilihan alternatif faktor tebakan menurun yaitu 20 persen. Banyak pilihan
yang disediakan sangat ditentukan oleh usia peserta tes dan juga tergantung pada
sifat bahan yang disajikan.
12. Pokok soal diusahakan tidak menggunakan ungkapan atau kata-kata yang bermakna
tidak tentu, misalnya: kebanyakan, seringkali, kadang-kadang dan sejenisnya.
Contoh:
Yang kurang baik
Kebanyakan hewan hidupnya di dalam air, bernapas dengan ......
A. insang
B. kulit
C. paru-paru
D. insang dan paru-paru
Contoh:
Yang lebih baik
Berudu bernapas dengan .....
A. insang
B. kulit
C. paru-paru
D. insang dan paru-paru
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 55 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
13. Pokok soal sedapat mungkin dalam pernyataan datau pertanyaan positif. Jika
terpaksa menggunakan pernyataan negatif maka kata “negatif tersebut digarisbawahi
atau ditulis tebal.
Contoh:
Yang kurang baik
Pada semua tumbuhan yang berhijau daun, fotosintesis tidak akan terjadi tanpa ......
A. udara, tanah, dan air
B. cahaya, udara, dan tanah
C. air, cahaya, dan udara
D. air, tanah, dan cahaya
D. Perbedaan Dan Persamaan Penilaian Dengan Tes Uraian Dan Tes Obyektif
Bila dibandingkan antara tes uraian dan tes objektif, terdapat berbagai perbedaan dan
persamaan. Perbandingan kedua bentuk tes tersebut dapat terlihat pada tabel berikut
ini.
Jumlah sampel Dapat mengukur lebih banyak Hanya dapat menanyakan beberapa
sampel pertanyaan sehingga pertanyaan sehingga kurang
benar-benar mewakili materi mewakili materi yang diajarkan.
yang diajarkan
Menyusun Menyusun pertanyaan yang Menyusun pertanyaan yang baik
pertanyaan baik sulit dilakukan dan sulit tetapi lebih mudah
memakan waktu yang banyak dibandingkan pertanyaan objektif,
waktu yang digunakan cukup singkat
Berikut ini disajikan senarai contoh butir soal dalam ranah kognitif, memuat klasifikasi
taksonomi tujuan Pelatihan yang dikembangkan oleh Benyamin S. Bloom, dkk (1956).
1. Pengetahuan (KNOWLEDGE)
2. Pemahaman
2.20 Interpretasi
Bila di bagian luar sebuah peti kelihatan jelas ada gambar payung yang terkembang
maka tindakan apakah yang harus dilakukan oleh kuli yang mengangkat peti
tersebut ?
A. Membongkarnya bila da hujan
B. Menyimpannya di tempat yang teduh
C. Tidak membalik peti tersebut
D. Memayungi peti tersebut bila dibawa pergi
2.30 Ekstrapolasi
Dalam bulan Juli 1969 seorang pegawai golongan II/a tidak mampumembeli
sebuah sepeda motor, sedangkan dalam tahun 1989 rata-rata pegawai negeri
golongan yang sama sudah dapat membeli sebuah motor. Dari kenyataan ini dapat
diartikan bahwa pegawai negeri ....
A. sudah lebih makmur
B. sudah lebih rajin menabung
C. lebih suka berhutang
D. lebih banyak berpergian
E. perlu diteliti penghasilannya
3. Aplikasi
Suatu persegi panjang yang liasnya 100 cm2, dengan panjang sisinya 20 cm. Bila
kita ingin luasnya tetap sedangkan lebarnya dijadikan 8 cm, maka berapa besarkan
panjangnya harus dikalikan ?
A. 1,250
B. 0,750
C. 0,675
D. 0,500
E. 0,375
Di atas telah dibicarakan dua bentuk butir soal (tes) yaitu butir soal uraian dan bentuk
butir soal objektif. Kedua bentuk butir soal tersebut dimaksudkan untuk diujikan kepada
peserta guna memperoleh informasi tentang hasil belajar mereka. Informasi tentang
hasil belajar peserta tidak hanya dapat diperoleh melalui tes, tetapi dapat juga diperoleh
melalui alat pengukuran bukan tes seperti pedoman observasi, skala sikap, daftar cek,
catatan anekdotal, dan jaringan sosiometrik. Berikut ini akan dibicarakan penggunaan
alat-alat pengukuran seperti itu, terutama yang besar sekali kemungkinannya unuk
diterapkan dalam pengukuran hasil belajar peserta.
Pedoman observasi baik untuk kerja lapangan maupun kerja di laboratorium sangat
banyak kegunaannya bagi pengukuran keberhasilan belajar peserta, terutama hasil
belajar yang mengutamakan penampilan kemampuan atau keterampilan dalam Pelatihan
profesional. Karena pada umumnya kebanyakan hasil belajar yang bersifat keterampilan
sukar diukur dengan tes, maka digunakan teknik pengukuran lain yang dapat memberi
informasi yang lebih akurat.
Alat ukur untuk memperoleh informasi hasil belajar non-tes terutama digunakan untuk
mengukur perubahan tingkah laku yang berkenaan dengan ranah kognitif, afektif,
maupun psikomotor terutama yang berhubungan dengan apa yang dapat dibuat atau
dikerjakan oleh peserta didik daripada apa yang diketahui atau dipahaminya. Dengan
kata lain alat pengukuran seperti itu terutam berhubungan dengan penampilan yang
dapat diamati daripada pengetahuan dan proses mental lainnya yang tidak dapat diamati
dengan indera.
Di samping itu, alat ukur seperti ini memang merupakan satu kesatuan dengan alat ukur
tes lainnya, karena pada umumnya mengukur apa yang diketahuinya, dipahami,
diaplikasikan atau yang dapat dikuasai oleh peserta didik dalam tingkat proses mental
yang lebih tinggi. Tetapi belum ada jaminan bahwa mereka miliki dalam kemampua
mental itu dapat didemontrasikan dalam tingkah lakunya. Karena itu dibutuhkan
beberapa alat ukur lain yang dapat memeriksa kemampuan atau penampilan tentang
apa yang telah diketahui dan dimiliki dalam tindakan sehari-hari. Jadi alat ukur non-tes
merupakan bagian keseluruhan dari alat ukur hasil belajar peserta didik.
Alat ukur keberhasilan belajar non-tes yang umum digunakan, yaitu:
1. Particapation charts atau bagan partisipasi
2. Check List atau daftar cek
3. “Rating Scale” atau skala lajutan
4. Attitude Scales atau skala sikap
Keempat alat ukur ini mempunyai karakteristik yang sama, yaitu yang memberi respon
atau yang mengisi alat ukur itu adalah penilai. Karena itu perlu diusahakan untuk
mencari teknik yang memungkinkan bias pribadi pengamat atau pencatat dapat
ditiadakan atau dikurangi sampai pada tahap minimal dalam tugasnya. Untuk
mengurangi kemungkinan bias tersebut maka beberapa saran berikut ini akan dapat
membantu agar informasi yang diperoleh lebih sahih.
1. Rencanakan terlebih dahulu apa yang akan diamati. Perencanaan ini amat penting
karena pengalaman menunjukkan bahwa ketika terjadi pengamatan, si pengamat
sangat mudah tertarik pada hal-hal yang remah bila hal tesebut menarik
perhatiannya. Dalam perencanaan itupun acapkali terjadi kesukaran untuk
menentukan tingkah laku yang akan diamati, yaitu tingkah laku yang paling besar
kontribusinya untuk menjelaskan hasil belajar peserta. Untuk mengatasi kesukaran
ini maka pada waktu merencanakan alat observasi harus senantiasa diingat tujuan
observasi dan keberartian tingkah laku yang akan diamati itu dalam kerangka
pengukuran hasil belajar.
3. setipa hasil obervasi harus segera ditulis laporannya segera setelah observasi
dilakukan. Penulisan laporan dengan segera akan mengurangi penyimpangan dari
kenyataannya, karena ingatan pengamat akan mudah sekali terkontaminasi oleh hal-
hal lain yang kita amati setelah obervasi.
Salah satu tujuan yang ingin dicapai dalam suatu proses belajar mengajar ialah
keikutsertaan peserta didik secara sukarela dalam kegiatan belajar mengajar tersebut.
Jadi keikutsertaan tersebut selain merupakan salah satu usaha memudahkan peserta
didik unutk memahami konsep yang sedang dibicarakan dan meningkatkan daya tahan
ingatan mengenai suatu isi pelajaran tertentu, juga dimaksudkan untuk menjadikan
proses belajar mengajar sebagai alat meningkatkan percaya diri, harga diri, dan lain-lain.
Untuk itulah maka keikutsertaan secara suka rela (participation) sudah merupakan
tujuan proses belajar mengajar.
Dengan demikian keikutsertaan peserta didik dalam suatu proses belajar mengajar harus
diukur, karena ia memiliki informasi yang kaya sekali tentang hasil belajar yang bersifat
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 61 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
PARTICIPATION CHARTS
: .
: .
Mata Pembelajaran : .
Topik : .
Tanggal : .
Waktu : .
Tujuan : .
.
Kualitas Kontribusi *)
No. Nama **)
Sangat Tidak
Penting Meragukan
Berarti Relevan
1 Aan Abdullah IIII III - -
2 Budi Santosa II II I I
3 Cucu Juariah III III - -
4 Dedeh Sutriah I II - II
5 Endang Kastono III - I II
6 Faisal Harahap I - III II
7 Gugun Gumila - II - -
8 Hani Fadilah I II - -
9 Ibrahim IIII I - I
10 Joko Daryanto II III - -
Frekuensi partispasi dalam kegiatan telah memberikan berbagai informasi yang berguna
untuk penelitian hasil belajar. Tentu saja “participation charts” saja belumlah cukup
untuk dapat menarik kesimpulan yang memadai. Karena itu maka instrumen ini haruslah
dipakai bersama-sama dengan instrument lain, seperti tes, atau “rating scale”, atau
“attitude scales”
1. Check List
Check list pada dasarnya mempunyai kemiripan bentuk rating scale. Perbedaanya ialah
dalah esensi dan penggunaannya. Dalam ranting scale esensinya ialah untuk
menentukan derajat atau peringkat dari suatu unsur, komponen, trait, karakteristik, atau
orang, baik dalam bandingannya dengan suatu kriteria tertentu maupun dibandingkan
dengan anggota kelompok lain. Sedangkan check list, esensinya ialah untuk menyatakan
ada atau tidak adanya suatu unsur, komponen, trait, karakteristik, atau kejadian dalam
suatu peristiwa, tugas atau salah kesatuan yang kompleks.
Jadi dalam check list pengamat hanya dapat menyatakan ada atau tidak adany suatu hal
yang sedang diamati, bukan memberi peringkat atau derajat kualitashal tersebut.
Check list sangat bermanfaat untuk mengukur hasil belajar baik yang berupa produk
maupun prosedur atau proses yang dapat dirinci ke dalam komponen-komponen yang
lebih kecil, terdefinisi secara operasional dan atau sangat spesifik. Check list yang
digunakan untuk mengamati suatu hasil belajar yang tidak terinci secara jelas dan tidak
terdefinisi secara baik tidak terlalu bermanfaat untuk dijadikan sebagai alat ukur.
Suatu check list makin besar manfaatnya bila tersusun dari komponen yang lengkap.
Jadi berbeda dengan watak dari alat ukur lainnya, check list justru menghendaki
dicantumkannya semua komponen yang mungkin diamati, baik komponen penting atau
komponen yang remeh (trivial). Bagaimanapun remehnya suatu komponen, tetap akan
memberikan sumbangan yang berarti bagi keutuhan keseluruhan yang sedang diamati.
Tentu saja jumlah komponen yang dimasukkan ke dalam check list masih tetap dibatasi
oleh waktu yang tersedia untuk mengamati dan kemampuan pengamat untuk
memperhatikan komponen yang dicantumkan dalam daftar tersebut.
Check list terdiri dari dua, yaitu komponen yang akan diamati dan tanda yang
menyatkan ada atau tidak adanya komponen tersebut dalam observasi. Untuk jelasnya,
satu contoh berikut ini merupakan check list untuk mengukur kemampuan hubungan
interpersonal murid di sekolah dasar kelas 1 (satu) dan 2 (dua).
Petunjuk: Berilah tanda cek (V) di tempat yang telah disajikan dalam tabel berikut, untuk
setiap pertanyaan yang disajikan.
18 Mempunyai seorang atau beberapa orang yang dianggap paling akrab .......
19 Memiliki kelompok teman yang tetap .......
Contoh di atas merupakan suatu check list yang keseluruhannya berindikasi positif.
Artinya makin banyak komponen itu ada, makin banyak hubungan interpersonal yang
dimiliki oleh peserta didik yang diamati.
Kekuatan check list ialah ia sangat fleksibel untuk mencek kemampuan untuk semua
jenis dan tingkat hasil belajar. Ia dapat digunakan untuk semua mata pelajaran. Namun
mutu check list yang digunakan akan sanagt tergantung dari kejelasan komponen yang
dinyatakan dalam daftar, keutuhan komponen itu sebagai bagian menyeluruh dari
kemampuan yang diukur, dan kemampuan pengamat untuk karakteristik atau trait
tertentu. Misalnya, suatu daftar cek (check list) yang dikembangkan oleh Mehren dan
Lehmann (1969) untuk mengukur penyesusaian diri dan penyesuaian sosial untuk
peserta didik SD hanya terdiri dari 9 komponen. Tetapi acapkali juga daftar cek terdiri
dari suatu daftar yang panjang. Misalnya daftar cek (Check List) yang disusun oleh Ralph
W. Tyler untuk menguji keterampilan menggunakan mikroskop. Check List tersebut
terdiri dari 83 butir komponen.
Yang dimaksud dengan “rating scale” ialah alat pengukur non-tes yang menggunakan
suatu prosedur terstruktur untuk memperoleh informasi tentang sesuatu yang
diobeservasi pada sesuatu dalam hubungannya dengan yang lain. Biasanya rating scale
berisikan seperangkat pernyataan tentang karakteristik atau kualitas yang dimiliki oleh
sesuatu yang diukur tersebut. Jadi suatu rating scale terdiri dari dua bagian utama,
yaitu: (1) adanya pernyataan tentang keberadaan atau kualitas keberadaan dari suatu
unsur atau karakteristik tertentu, dan (2) adanya semacam tes objektif, yaitu adanya
stem dan option. Misalnya, Alex Inkeles dalam kegiatan penelitiannya mengenai manusia
modern (Becoming Modern) menggunakan format tes melengkapi pilihan di mana pokok
soal diiringi dengan 3 pilihan.
Setiap pasang pernyataan dan penilaian itu dapat dianggap sebagai sebutir soal dalam
rating scale tersebut.
Petunjuk: Nyatakanlah tingkatan setiap pernyataan atau jawaban pertanyaan berikut ini
dengan cara melingkari salah satu angka yang ada di depan pernyataan atau
pertanyaan tersebut. Angka-angka itu mengandung makna:
1 = tidak memuaskan
2 = di bawah rata-rata
3 = rata-rata
4 = di atas rata-rata
5 = sempurna
2) Angka untuk seperangkat rating scale tertentu haruslah mempunyai arti yang sama.
Misalnya dalam satu perangkat rating scale bila sekali digunakan angka 1 (satu)
barmakna kurang atau tidak ada, maka untuk keseluruhan rating scale itu digunakan
arti yang sama. Jangan sampai terjadi dalam satu butir pertanyaan 1 (satu) berarti
tidak ada, dan dalam pernyataan lain 1 (satu) berarti sangat baik.
3) Jumlah kategori angka yang digunakan supaya diusahakan cukup bermakna, tetapi
tidak terlalu renik sehingga tidak jelas lagi perbedaan arti satu angka dengan angka
lainnya. Sebagai patokan hendaknya pembagian sampai dengan tujuh itu masih
dapat dibedakan secara jelas arti satu angka dari angka lainnya. Misalnya 1 = hampir
tidak ada; 2 = kurang; 3 = di bawah rata-rata; 4 = rata-rata; 5 = di atas rata-rata; 6
= cukup; 7 = sempurna. Bila lebih dari tujuh kategori dapat menimbulkan
kebingungan bagi orang yang akan memberi penilaian. Tetapi juga harus diingat
angka itu tidak juga terlalu kasar, misalnya hanya terdiri dari 2 (dua) kategori. Bila
akan menyatakan dua kategori, maka sebaiknya tidak menggunakan rating scale,
tetapi gunakan “check list”.
5) Bila rating scale itu akan mengukur suatu prosedur, maka sebaiknya pertanyaan atau
pernyataan disusun secara urut berdasarkan dalam suatu pelaksanaan prosedur.
6) Bila rating scale akan mengukur suatu hasil, maka komponen rating scale disusun
menurut urutan dari mudah diamati ke yang lebih sukar diamati.
Berikut ini salah satu contoh rating scale untuk mengukur kemampuan menulis peserta
didik kelas satu SD. Rating scale ini digunakan untuk mengukur prosedur dan hasil
tulisan tangan.
Rating scale seperti dicontohkan di atas tentu dapat disusun dengan baik merinci lagi
aspek yang diukur bila dikehendaki pengukuran yang lebih teliti. Tetapi juga harus
diperhatikan bahwa rating scale yang terlalu kecil akan membutuhkan waktu untuk
menyusun alat ukurnya. Untuk pengukuran yang akan digunakan oleh guru dalam
mengobservasi kegiatan yang mencakup prosedur dan hasil kegiatan hendaknya guru
menyusun alat ukur yang cukup sederhana, tetapi mempunyai validitas dan reliabilitas
yang dapat diandalkan.
Di bawah ini dicantumkan contoh penggunaan “numerical rating scale” dalam format
observasi pelaksanaan:
1. Praktek Mengajar (PPL/PKM)
Contoh ini tidak mencantumkan semua kegiatan mulai dari tahap persiapan sampai
dengan tahap akhir kegiatan (penilaian/umpan balik) tetapi hanya mengambil tahap
tertentu.
1. Praktek Mengajar
a. Dalam persiapan mengajar calon guru tercantum upaya menyusun langkah-
langkah mengajar. Instruktur/instruktur yang akan memberi nilai pada persiapan
yang dibuat oleh calon instruktur tersebut menggunakan format observasi berikut.
Menyusun langkah-langkah mengajar
Penjelasan: Langkah-langkah mengajar (pendahuluan, kegiatan inti, dan penutup)
hendaknya memnuhi kriteria berikut :
a. Sesuai dengan tujuan
b. Sesuai dengan materi yang akan diajarkan
c. Sesuai dengan perkembangan peserta
d. Sesuai dengan waktu yang tersedia
e. Sesuai dengan sarana yang tersedia
f. Sesuai dengan lingkungan
g. Sistematis
h. Memungkinkan keterlibatan siswa
Dengan dicantumkan penjelasan (kriteria) untuk setiap skala penilaian para pengamat
memiliki pedoman dalam memilih skala sehingga hasil akhirnya lebih objektif, persepsi
pengamatan dapat dibuat hampir sama terhadap apa yang dinilainya. Dengan kata lain
reliabilitas pengukuran menjadi legbih baik.
3. Skala Sikap
dapat diukur. Bila salah satu kriteria ini tidak dapat dipenuhi, maka konstrak tersebut
tidak dapat digunakan dlam penelitian ilmiah.
Berbagai definis telah dikembangkan oleh para ahli psikologi tentang sikap. Pada tahun
1928 Louis Thurstone mendefinikan sikap, yang disempurnakan pada tahun tahun 1931,
dan akhirnya diperbaiki lagi pada tahun 1946 sehingga menjadi: Sikap adalah identitas
kecenderungan positif atau negatif terhadap suatu objek psikologis tertentu.
Sikap lebih umum definisi Thustone ini dapat dirumuskan sebagai: Attitude is (1) affect
for a against, (2) evaluation of, (3) like or dislike of, or (4) positiveness or negativeness
toward a psychological object.
Untuk mengukur sikap maka haruslah dikonstruksi skala sikap. Konstruksi skala sikap ini
harus dimulai dengan menentukan dan mendefinisikan objek sikap yang akan diukur itu.
Jadi yang pertama yang harus dilakukan adalah mengindentifikasi objek sikap atau
dengan kata lain mengindentifikasi “sikap terhadap apa?”. Dengan demikian maka harus
ditentukan batas-batas objek sikap yang akan diukur itu. Pengukuran itu sendiri akan
sangat bergantung kepada kemampuan untuk membatasi objek sikapnya. Misalnyam,
bila ingin mengukur sikap orang terhadap hukuman mati, atau terhadap bunuh diri, atau
terhadap kaum fundamentalis, maka terlebih dahulu haruslah diidentifikasikan secara
persis apa yang dimaksud dengan hukuman mati, bunuh diri, atau kaum fundamentalis
tersebut.
Setelah pembatasan objek sikap itu, maka mulai dikumpulkan butir-butir pernyataan
tentang objek sikap tersebut, sehingga terdapat kumpulan sejumlah besar pernyataan
tentang objek sikap tersebut. Barulah kemudian ditentukan format jawaban yang akan
digunakan, dan cara penskoran.
Untuk memperoleh suatu skala sikap yang secara baik dapat mengukur sikap terhadap
suatu objek sikap tertentu maka butir-butir pernyataan sikap yang telah dikonstruksi itu
harus diujicoba, dan hasil uji coba itu dianalisis, untuk menentukan butir pernyataan
mana yang akan digunakan dalam skala sikap. Biasanya butir yang mempunyai koefisien
korelasi yang tinggi dengan skor keseluruhanlah yang digunakan dalam skala. Butir
pertanyaan yang koefisien korelasinya rendah terhadap skor keseluruhan dibuang dari
skala sikap. Dengan demikian maka diperoleh seperangkat skala sikap yang mengukur
suatu sikap terhadap suatu objek sikap tertentu. Dengan kata lain korelasi antar butir
soal cukup tinggi.
Ada beberapa teknik konstruksi skala sikap. Yang terkenal antara lain:
a. Skala Likert
b. Skala Thurstone
c. Skala Guttmann
BAB V
PENGOLAHAN HASIL PELATIHAN SESUAI DENGAN JENIS TES
Pada bab V ini akan dibahas beberapa aspek pengadministrasian. Yang dimaksud
dengan pengadministrasian tes dalam kaitan pembahasan sekarang ini adalah
pelaksanaan tes mulai dari proses penyuntingan naskah tes, sampai dengan
mengerjakan tes. Langkah-langkah itu meliputi penyuntingan tes, penggandaan naskah
tes, pelaksanaan tes. Selain itu dalam bab V ini juga dibicarakan kekuatan dan
keterbatasan beberapa cara pelaksanaan tes dan beberapa media tes.
“guessing formula” atau “correction formula” akan diterapkan atau tidak. Dalam
petunjuk tes itu juga harus tercantum cara peserta tes untuk mengubah
jawabannya. Misalnya bila ia pada mulanya memilih jawaban tertentu, tetapi
kemudian ia ingin mengubah jawaban tersebut, haruslah dijelaskan cara yang
harus ditempuhnya.
Tes yang tidak mengijinkan para peserta tes membuka buku atau catatan mempunyai
keuntungan/kekuatan:
a. membiasakan para peserta untuk memahami isi buku atau catatan yang dimilikinya
sebab jika tidak, akan tidak berhasil dalam ujian.
b. Membiasakan para peserta untuk berpikir sendiri, bukan menggantungkan diri
kepada buku atau catatan yang ada.
c. Membiasakan para peserta membuat rangkuman mengenai isi buku atau catatan
yang dipelajarinya.
Keterbatasan dari tes yang tidak mengijinkan membuka buku atau catatan antara lain:
a. mendorong peserta untuk melihat pekerjaan temannya (nyontek) apabila sudah
betul-betul tak berhasil menemukan jawabannya.
b. kaburnya prinsip bahwa buku itu digunakan, bukan untuk dihafal. Bahwa dalam
kehidupan nyata kelak buku ini memang untuk digunakan. Seorang jaksa akan
mempelajari dan membuka-buka KUHP menjelang mengajukan tuntutannya;
seorang insinyur sipil akan melihat tabel-tabel perhitungan konstruksi baja pada saat
harus menghitung konstruksi sebuah jembatan; seorang dokter akan melihat buku
patologi pada saat akan menentukan diagnosis pasein yang ditanganinya; dan masih
banyak contoh-contoh lain.
Sifat rahasia atau terbuka itu tidak hanya diterapkan pada pengadministrasian tes tetapi
juga pada hasil tes. Kekuatan dan keterbatasan hasil tes yang diumumkan itu antara
lain.
Kekuatan-kekuatannya adalah:
a. Peserta tes yang lulus, apalagi kalau nilainya bagus, akan menjadi bangga karena
diketahui oleh teman-temannya. Dan ini akan memacu untuk belajar lebih baik lagi
atau sekurang-kurangnya untuk mempertahankannya.
b. Terjadi semacam perasaan dilayani secara layak dan perasaan dihargai.
c. Tumbuh kepercayaan para peserta kepada lembaga Pelatihan di mana mereka
belajar, khususnya kepada instruktur yang bersangkutan bahwa tes beserta
penilaiannya dilakukan secara objektif. Kepercayaan ini makin kuat lagi apabila hasil
pekerjaan tes dikembalikan kepada mereka, dan instruktur yang bersangkutan
memberi kesempatan kepada para peserta untuk membahas kunci jawabannya dan
mempersoalkan nilai mereka.
d. Pihak instruktur tentu akan mengoreksi dan memberi nilai kepada setiap pekerjaan
peserta tes dengan cermat karena tidak ingin kepercayaan peserta kepada dirinya
hilang karena kecerobohannya.
Keterbatasannya adalah:
a. Membuat malu peserta yang tidak lulus atau nilainya rendah yang pada gilirannya
akan menghapuskan motivasi belajarnya.
b. Kesempatan untuk demokratis seperti yang diutarakan pada keuntungan butir c di
atas dapat saja cenderung manjadi protes-protes yang mengarah kepada keadaa
“chaos”.
Jika hasil tes tidak diumumkan, maka kekuatan-kekuatannya antara lain adalah :
a. Tidak akan terjadi protes-protes dari pihak peserta tes yang akan merepotkan para
instruktur maupun lembaga Pelatihan yang bersangkutan.
b. Jika dipandang perlu, nilai seorang peserta tes dapat diputuskan dengan
mengikutsertakan faktor-faktor non tes, kerajinan misalnya.
a. Dapat dilaksanakan secara individual sehingga lebih cermat dan dapat dilakukan
“probing” sehingga penguji mengetahui persisi dimana posisi hasil belajar peserta
didik yang bersangkutan.
b. Kemampuan-kemampuan seperti yang ada pada tes terulis yang telah diuraikan di
atas dapat dipantai secara langsung oleh instruktur yang mengujinya.
c. Dengan tes lisan memungkinkan terjadinya komunikasi dua arah dan dialog aktif. Ini
mendorong peserta menyiapkan diri sebaik-baiknya.
d. Peserta dapat mengemukakan argumentasi-argumentasinya secara lebih bebas
sehingga instruktur yang menguji mengetahui persis jalan pikiran peserta.
dengan situasi praktek “tiruan”. Dalam praktek tiruan ini peserta umumnya justru
kikuk; jadi tidak berlangsung wajar.
Rangkuman
Latihan
Dalam uraian berikut akan dibicarakan bagaimana mengolah hasil tes kognitif dan tes
keterampilan sehingga diperoleh skor setiap peserta tes. Dari skor inilah diturunkan nilai
mereka.
Untuk mengukur kemampuan berpikir dapat dikembangkan tes bentuk objektif atau tes
bentuk uraian baik terbuka maupun uraian terbatas. Mengola tes bentuk objektif lebih
cepat, sederhana dan mudah dibandingkan dengan tes bentuk uraian. Simaklah kedua
uraian berikut untuk membandingkan prosedur yang ditempuh dalam memeriksa hasil
tes.
Pelatihan K3
A B C D A B C D A B C D
1. 21. 41.
2. 22. 42.
3. 23. 43.
4. 24. 44.
5. 25. 45.
6. 26. 46.
7. 27. 47.
8. 28. 48.
9. 29. 49.
10. 30. 50.
11. 31. 51.
12. 32. 52.
13. 33. 53.
14. 34. 54.
15. 35. 55.
16. 36. 56.
17. 37. 57.
18. 38. 58.
19. 39. 59.
20. 40. 60.
a) Salinkan format lembaran jawaban (format 5.1.) di atas kertas transparan. Cara
menyalin dapat dengan mengkopi atau meletakkan satu lembar kertas transparan di
atas lembar jawaban kemudian membuat kota-kotak sesuai dengan format 5.1.
Hitunglah berapa jumlah butir yang benar dengan memperhatikan lingkaran yang
tumpang tindih dengan tanda pada lembar jawaban peserta. Jumlah ini adalah skor yang
dicapai oleh peserta. Untuk menghindari kekeliruan, sebaiknya Anda menghitung pula
jawaban yang salah dengan melihat jawaban peserta yang berada di luar lingkaran.
Seharusnya jumlah jawaban yang benar dan jumlah jawaban yang salah serta jawaban
yang kosong (kalau ada) harus ama dengan skor maksimum (jumlah semua butir
pertanyaan).
Pada waktu membicarakan pengembangan butir tes uraian dianjurkan agar pertanyaan
dibatasi atau dibuat tertutup sehingga jawaban untuk soal tersebut tidak memberik
kemungkinan jawaban yang bermacam-macam. Dengan tes uraian terbatas atau
tertutup kemungkinan jawabannya sudah dibatasi sehingga pedoman penilaiannya lebih
mengarah pada penilaian objektif. Pedoman penilaian yang dibuat penyusun butir soal
inilah yang akan digunakan sebagai acuan dalam memeriksa lembar jawaban ujian
uraian. Namun sebelum menggunakan pedoman penilaian tersebut perlu diperiksa lebih
dahulu apakah jawaban yang diminta oleh penulis soal sudah sesuai dengan tingkat
penguasaan peserta tes.
Mengolah hasil observasi yang mengukur kemampuan keterampilan fisik tidaklah sukar.
Pengolah menjumlahkan semua skor sesuai dengan skor yang dipilih olehpenguji.
perhaikanlah conoh penilaian keterampilan dalam permainan bulu tangkis di bawah ini.
Ada 4 aspek yang menjadi pusat perhatian dalam permainan bulu tangkis yaitu :
1) kemampuan servis
2) kemampuan pukulan
3) memilih strategi
4) mengatur kaki dan kedudukan (posisi)
Setiap aspek diberi skor dari 3 sampai dengan 1 sesuai dengan pedoman berikut :
a) diberi skor 3 kemampuan yang diamati di atas kemampuan rata-rata
b) diberi skor 2 kalau kemampuan yang diamati berada pada kemampuan rata-rata
c) diberi skor 1 kalau kemampuan yang diamati dibawah kemampuan rata-rata.
Keempat aspek yang diamati pada permainan bulu tangkis diuraikan diatas sasaran
pengamatan berikut :
1. Kemampuan servis :
a) kedudukan bulu ayam (shuttlecock) pada waktu akan 3 2 1
memberi servis
b) kedudukan raket pada saat selesai memberi servis 3 2 1
c) kedudukan pemain pada waktu memberi servis 3 2 1
d) tinggi servis menurut teknik servis yang digunakan. 3 2 1
2. Kemampuan Pukulan :
a) Pukulan tinggi-tinggi dan dalam 3 2 1
b) Pukulan smash pukulan d atas kepala dan 3 2 1
persis di depan lawan
c) Pukulan drive tajam dan pendek di atas net 3 2 1
d) Pukulan drop 3 2 1
3. Memilih strategi :
a) Menempatkan pukulan pada saat seluruh 3 2 1
lapangan
b) Menampilkan berbagai pukulan pada 3 2 1
berbagai kesempatan
c) Menggunakan kesempatan atas kelemahan 3 2 1
lawan
d) Menggunakan pukulan terbaik yang dimiliki 3 2 1
sendiri
e) Kedudukan yang lentur di tengah-tengah 3 2 1
Dalam contoh tersebut terdapat 4 aspek yang menjadi bjek penilaian. Setiap aspek
memiliki empat sasaran pengamatan. Jika setiap sasaran mendapat skor maksimum 3,
maka skor maksimum untuk 4 aspek tersebut adalah
4 x 4 x 3 = 48
(aspek) (sasaran pengamatan) (skor maksimum)
Jadi skor setiap peserta bergerak antara 16 sampai dengan 48 kecuali diantara sasaran
observasi ada yang tidak diisi. Selanjutnya rentangan skor setiap aspek dapat dihitung
yaitu berada antara 4 - 12. Dengan memperhatikan skor yang dicapai oleh setiap pemain
dapatlah diketahui kekuatan dan kelemahan seseorang pada setiap aspek.
Bilamana pertanyaan yang diberikan dalam ujian tertulis, maka cara mengolahnya sama
dengan cara mengolah tes yang mengukur ranah ognitif baik bentuk objektifmaupun
bentuk uraian.
Bab ini terdiri dari dua bagian yaitu bagian yang berkenaan dengan Penilaian Acuan
Norma dan bagian tentang Penilaian Acuan Patokan. Konsep-konsep yang
dikembangkan berikut ini merupakan acuan dalam pemberian nilai. Dalam kondisi
lembaga Pelatihan sebagaimana sekarang ini, masing-masing pendekatan ini tentu tidak
dapat dilaksanakan secara murni, di sana-sini perlu diadakan penyesuaia yang kadang-
kadang merupakan kombinasi dari kedua pendekatan ini.
Patokan dalam proses pembelajaran selalu mengacu pada tujuan pembelajaran umum
dan tujuan pembelajaran khusus. Keberhasilan seseorang dalam proses pembelajaran
ditentukan oleh tingkat penguasaan tujuan pembelajaranl. Dengan kata lain nilai atau
kelulusan seseorang ditentukan oleh penguasaan tujuan pembelajaran. Jadi berbeda
dengan penilaian acuan norma di mana nilai atau kelulusan seseorang ditentukan oleh
kelompoknya.
Penilaian dengan pendekatan patokan (Penilaian Acuan Patokan, PAP) selalu digunakan
dalam sistem belajar tuntas. Sesuai dengan namanya yaitu belajar tuntas, semua tujuan
instruksional yang mudah atau yang sukar, yang penting dan yang kurang penting harus
benar-benar dikuasai. Misalnya dalam belajar tuntas berhitung di SD kelas 1 dinyatakan
setiap anak didik harus menguasai penjumlahan dan pengurangan bilangan 1 sampai 10.
untuk penguasaan yang tuntas, kriteria yang dikembangkan antara lain, Anak didik
dapat:
a) menentukan angka 1 s/d 10 dengan tepat
b) menentukan angka yang mendahului atau yang mengikuti satu angka
c) menentukan angka yang mana lebih besar dari yang mana atau angka yang mana
lebih kecil dari yang mana
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 86 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
untuk mengukur apakah ke delapan tujuan di atas semuanya telah dikuasai oleh anak
didik, maka untuk setiap tujuan harus ada butir tesnya. Kalau digambarkan secara grafis
akan diperoleh:
Jadi untuk mengetahui penguasaan 1) dapat ditulis beberapa butir soal. Dari sejumlah
butir soal ini dapat diketahui kelemahan anak untuk tujuan 1). Kemungkinan kelemahan
itu membedakan angka 3 dengan 8, angka 4 dengan 7, angka 6 dengan 9, dan
sebagainya. Kalau kelemahan sudah diketahui maka guru dapat memberikan perlakuan
khusus untuk mengatasi kelemahan tersebut bagi mereka yang sudah menguasai dapat
diperluas penguasaanya pada tujuan tersebut sebelum pindah pada tujuan berikutnya
2).
Dari contoh ini dapat diketahui bahwa penguasaan tujuan 1) benar-benar tuntas. Setiap
tujuan di atas mulai 1) sampai dengan 8) dilakukan seperti pada contoh.
Ada persamaan pengembangan butir soal untuk penilaian acuan norma dengan penilaian
acuan kriteria antara lain keduanya menentukan lebih dahulu hasil kemampuan apa
yang akan diukur dan cara pengukuran yang bagaimana yang paling tepat untuk melihat
kemampuan tersebut (dengan tes tertulis, lisan, pengamatan dan sebagainya).
Pada pengembangan butir soal untuk keperluan acauan norma, tingkat kesukaran
soal harus diperhatikan. Butir soal yang dikembangkan tidak seluruhnya mudah dan
tidak seluruhnya harus yang sukar, tetapi kombinasi dari butir soal yang mudah, sedang
dan sukar sehingga keseluruhan butir soal tersebut tingkat kesukarannya disekitar 50%.
Pada pengembangan butir soal untuk acuan kriteria tingkat kesukarannya tidak
diperhatikan karena maksud soal ini bukan membedakan peserta yan pintar dari peserta
yang bodoh, tetapi tingkat penguasaan seseorang terhadap bahan atau tujuan
instruksional. Juga daya pembeda tidak diperhatikan dalam penilaian acuan kriteria,
justru yang menjadi perhatian adalah daya serap peserta. Sebaiknya semua bahan atau
tujuan instruksional dapat dikuasai oleh peserta (tingkat penguasaan 100%).
Penguasaan 100% bahan sukar dicapai sehingga ada lembaga yang menerapkan cukup
dengan tingkat penguasaan 75% to atau 80%.
Seperti diuraikan di atas tingkat kemampuan atau kelulusan seseorang ditentukan oleh
tercapai tidaknya kriteria. Misalnya seseorang dikatakan telah menguasai satu pokok
bahasan bilamana ia telah menjawab dengan betul 80% dari butir soal yang berasal dari
pokok bahasan tersebut. Jawaban yang benar 80% atau lebih menyatakan bahwa ia
telah lulus, sdangkan jawaban yang kurang dari 80% menyatakan yang bersangkutan
belum berhasil, ia harus mengulang kembali.
Rangkuman
Latihan
BAB VI
ANALISIS NASKAH DAN BUTIR – BUTIR SOAL SESUAI DENGAN KAIDAH DAN
STANDAR KOMPETENSI YANG DITETAPKAN
Dalam bab VI ini akan dibahas analisis soal yang mencakup analisis butir soal dan
analisis perangkat soal. Dalam analisis butir soal, perhatian terutama ditujukan kepada
menilai mutu butir soal, yang berdasarkan pada tiga karakteristik buti soal yaitu: (1)
tingkat kesukaran, (2) daya beda butir soal, dan (3) berfungsi tidaknya pilihan. Mutu
butir soal tersebut akan dipertimbangkan atas dasar tiga karakteristik ini, dan dilakukan
dengan menggunakan pendekatan klasik.
Perangkat soal yang dianalisis mutunya dengan menggunakan dua spesifikasi pula,
yaitu: (1) validitas, dan (2) reliabilitas. Kedua spesifikasi ini merupakan hal yang paling
esensial dalam menilai mutu perangkat soal. Analisis ini diusahakan dengan
menggunakan cara yang paling sederhana, sehingga dapat dilakukan oleh setiap
instruktur, walaupun tanpa paket komputer tertentu.
Butir soal buatan instruktur pada umunya dikonstruki secara tergesa-gesa dan tidak
dapat diujicoba sebelum diadministrasikan. Akibatnya banyak butir soal yang digunakan
dalam ujian tidak dapat menghasilkan informasi yang tidak benar atau tidak akurat
tentang tingkat kemampuan peserta. Hal ini tentu saja dapat berakibat jauh, karena
hasil ujian itu acapkali digunakan untuk mengambil keputusan tentang masa depan
peserta.
Bila keputusan yang diambil didasarkan pada informasi yang tidak benar atau tidak
akurat, yang disebabkan oleh alat yang digunakan untuk mengumpulkan informasi yaitu
butir tes yang tidak terkontruksi secara baik, maka tentu saja keputusan demikian itu
adalah keputusan yang tidak dapat dipertanggung jawabkan. Jadi jelaslah bahwa
dibutuhkan adanya alat yang dapat dipercaya yang dapat mengukur apakah alat ukur
(butir soal) yang digunakan memang dapat dijadikan dasar untuk menentukan
keputusan yang bijaksana. Inilah peran yang harus dimainkan oleh analisis butir soal,
yaitu mengukur butir soal yang akan atau yang telah digunakan.
Hasil pengukuran itu akan memberi keyakinan pada instruktur akan tepatnya keputusan
yang diambilnya terhadap mahasisa. Butir soal yang ternyata terlalu lemah, akan sukar
dipertanggung jawabkan untuk dijadikan sebagai dasar penentuan keputusan, terutama
keputusan yang sifatnya mengenai peserta secara individual.
Ada beberapa alasaan mengapa diperlukan analisis butir soal. Alasan tersebut antara
lain:
1. Untuk dapat mengetahui kekuatan dan kelemahan butir tes, sehingga dapat
ditentukan butir yang baik atau yang harus direvisi.
2. Untuk menyediakan informasi tentang spesifikasi butir soal secara lengkap,
sehingga akan lebih memudahkan bagi instruktur dalam menyusun perangkat soal
yang akan memenuhi kebutuhan ujian dalam bidang dan tingkat tertentu.
Pertama harus dibedakan dua istilah yang berkenaan dengan analisis butir soal, yaitu
karakateristik butir soal dan spesifikasi butir soal. Yang dimaksud dengan karakteristik
butir soal ialah parameter kuantitatif butir soal. Sedangkan yang dimaksud dengan
spesifikasi butir ialah paramerter kualitatif butir soal yang ditentukan atas dasar
penilaian ahli (expert judgement).
Dalam bidang tes dan pengukuran, dikenal beberapa karakteristik butir soal. Untuk tes
hasil belajar umumnya dipertimbangkan 3 (tiga) karakterisktik butir soal, yaitu:
a) tingkat kesukaran
b) daya beda
c) berfungsi tidaknya pilihan
Ketiga karakteristik butir soal ini secara bersama-sama akan menentukan mutu butir
soal. Bila salah satu dari ketiga karakteristik ini tidak memenuhi persyaratan maka mutu
butir soal akan turun. Dan masing-masing karakteritik itu dapat dikalkulasi dengan
mudah, tanpa membutuhkan kemampuan statistik yang kompleks atau kemampuan
matematik yang tinggi. Dengan demikian maka ketiga karakteristik itu akan dapat
dikalkulasi oleh setiap instruktur.
a) Tingkat Kesukaran/Indeks Fasilitas
Yang dimaksud tingkat kesukaran butir soal ialah proporsi peserta tes menjawab benar
terhadap butir soal tersebut. Tingkat kesukaran butir soal biasanya dilambangkan
dengan p. Makin benar nilai p (yang berarti makin besar proporsi yang menjawab benar
terhadap butir soal tersebut), makin rendah tngkat kesukaran butir itu. Yang berarti butir
soal itu makin mudah. Tingkat kesukaran butir soal berkisar antara 0.0 sampai degan
1.0. Bila butir soal mempunyai tingkat kesukaran 0.0 berarti tidak seorangpun peserta
tes dapat menjawab butir soal tersebut secara benar. Tingkat kesukaran 1.0 berarti
bahwa semua peserta tes dapat menjawab butir soal itu secara benar.
Dari rumus itu kita tahu bahwa tingkat kesukaran butir soal itu sangat dipengaruhi oleh
tingkat kemampuan anggota kelompok peserta tes. Bila satu butir soal diadministrasikan
kepada dua kelompok peserta tes yang berbeda tingkat kemampuannya maka hasilnya
dapat diperkirakan akan berbeda pula. Dengan demikian maka dapat dikatakan bahwa
tingkat kesukaran butir soal tidak sepenuhnya merupakan ukuran karakteristik butir soal
itu saja, tetapi lebih merupakan kemampuan rata-rata kelompok peserta tes. Karena itu
bila kita jumpai suatu butir tes yang mempunyai tingkat kesukaran 0.45, maka
interpretasinya ialah butir soal itu mempunyai tingkat kesukaran 0.45 untuk kelompok
tes tersebut.
Tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal tertentu itu baik
atau tidak baik. Tingkat kesukaran butir soal hanya menunjukkan bahwa butir soal itu
sukar atau mudah untuk kelompok peserta tertentu. Butir soal hasil belajar yang terlalu
sukar atau terlalu muda tidak banyak memberi informasi tentang butir soal itu atau
peserta tes. Untuk tes hail belajar, tingkat kesukaran yang dianggap baik adalah bila
berkisar 0.50. Atau dengan kata lain, makin dekat tingkat kesukaran suatu butir soal tes
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 93 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
hasil belajar ke 0.50, makin baik butis soal tersebut bagi kelompok tertentu. Sebaliknya
makin jauh tingkata kesukarannya dari 0.50 maka makin kurang informasi yang kita
peroleh tentang butir soal dan kelompok peserta tes.
Untuk dapat mengkalkulai tingkat kesukaran butir soal maka perlu dibuat tabel skor hasil
tes sebagai berikut:
Jumlah 10 8 7 7 7 6 7 8 7 3
P 1.0 0.8 0.7 0.4 0.7 0.6 0.7 0.8 0.7 0.3
Contoh di atas memperlihatkan bahwa tingkat kesukaran soal nomor 1 adalah 10:10 =
1.0, sedangkan butir soal nomr 10 tingkat kesukarannya adalah 3:10 = 0.3. Jadi soal
nomor 1 sangat mudah bagi kelompok peserta tes ini, sedangkan butir soal no 10 dapat
dikategorikan sebagai soal yang sukar untuk kelompok peserta tes tersebut. Jika jumlah
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 94 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
peserta besar (50 orang atau lebih) maka perlu dibuat 3 kelompok, yaitu kelompok atas,
tengah, dan bawah untuk memudahkan analisis. Kelompok tengah tidak diikutsertakan
dalam analisis butir soal.
Tingkat kesukaran perangkat soal (naskah ujian) dapat ditentukan dengan menjumlah
tingkat kesukaran semua butir soal, kemudian dibagi dengan butir soal. Secara singkat
tingkat kesukaran perangkat soal dirumuskan sebagai berikut:
b
P(naskah ujian)
N
1.0 0.8 0.7 0.4 0.7 0.6 0.7 0.8 0.7 0.3
p (naskah ujian) 0.67
10
Untuk sederhananya, tingkat kesukaran butir dan perangkat soal dapat dibagi menjadi
tiga kelompok, yaitu mudah, sedang, dan sukar. Sebagai patokan dapat digunakan tabel
berikut:
Tabel 6.2: Tingkat Kesukaran
Untuk menyusun suatu naskah ujian sebaiknya digunakan butir soal yang tingkat
kesukarannya berimbang sebagai berikut:
Sukar = 25%
Sedang = 50%
Mudah = 25%
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 95 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Dalam penggunaan butir soal dengan komposisi seperti itu maka dapat diterapkan
penilaian berdasarkan acuan norma atau acuan patokan. Bila komposisi butir soal dalam
suatu naskah ujian tidak berimbang, maka penggunaan penilaian acuan norma tidaklah
tepat, karena informasi kemampuan yang dihasilkan tidaklah akan terdistribusi dalam
suatu kurva normal.
b) Daya Beda
Daya beda butir soal ialah indeks yang menunjukkan tingkat kemampuan butir soal
membedakan kelompok berprestasi tinggi (kelompok atas) dari kelompok yang
berprestasi rendah (kelompok bawah) di antara para peserta tes. Karena daya beda
dihitung dari hasil tes kelompok peserta ujian tertentu, maka dalam penafsiran daya
bedapun haruslah selalu dikaitkan dengan kelompok peserta tes (kelompok sampel)
tertentu itu.
Daya beda suatu butir soal yang didasarkan pada hail tes suatu kelompok belum tentu
akan berlaku pada kelompok yang lain, apalagi bila tingkat kemampuan masing-masing
kelompok peserta tes itu berbeda. Misalnya, suatu butir soal yang diujikan kepada
peserta jurusan sosiologi akan sangat berbeda hasilnya bila butir soal itu diujikan kepada
peserta jurusan matematika. Daya beda butir soal biasa disimbolkan dengan D (huruf
kapital).
5) Kurangilah proporsi kelompok atas dari kelompok bawah, dan diperolehlah indeks
daya beda butir soal tersebut.
Bila data pada Tabel 6.1 di atas diterapkan untuk menghitung daya beda butir soal
nomor 5, maka akan diperoleh daftar sebagai berikut:
Gani 10
Carik 9
Duliman 8 –- Kelompok atas
Buhari 7
Fatonah 7
Hamid 7
Adam 6
Joni 5 –- kelompok bawah
Elia 4
Inem 4
Apabila jumlah peserta besar (lebih dari 50 orang), maka perlu dibuat pembagian 3
kelompok: atas, tengah, dan bawah untuk memudahkan analisis.
Kelompok atas yang menjawab benar soal nomor 5 adalah 5 orang, sedangkan
kelompok bawah hanya 2 orang. Dengan demikian proporsi kelompok atas yang
menjawabn benar adalah 1.0, dan kelompok bawah adalah 0.4. Jadi daya beda butir
soal nomor 5 adalah 1.0 - 0.4 = 0.6
Dari kalkulasi diatas kita dapat menyusun rumus daya beda:
Ba - B b
D
0.5T
Indeks atau koefisien daya beda berkisar antara +1.0 sampai dengan -1.0. daya beda
+1.0 berarti bahwa semua anggota kelompok atas menjawab benar terhadap butir soal
itu, sedangkan kelompok bawah seluruhnya menjawab salah terhadap butir soal itu.
Sebaliknya daya beda -1.0 berarti semua anggota kelompok atas menjawab salah butir
soal itu, sedangkan kelompok bawah seluruhnya menjawab benar terhadap butir soal
itu.
Daya beda yang dianggap masih memadai untuk sebutir soal ialah apabila sama atau
lebih besar dari +0.25. Bila lebih kecil dari itu, maka butir soal tersebut dianggap kurang
mampu membedakan peserta tes yang mempersiapkan diri dalam menghadapi tes
tersebut dari peserta tes yang mempersiapkan diri dalam menghadapi tes tersebut dari
peserta tes yang tidak mempersiapkan diri. Bahkan bila daya benda itu menjadi negatif,
maka butir soal itu sama sekali tidak dapat dipakai sebagai alat ukur prestasi belajar
peserta. Karena itu butir soal tersebut harus dikeluarkan dari perangkat soal, atau tidak
dihitung dalam penentuan skor peserta. Makin tinggi daya beda suatu soal, maka makin
baik butir soal tersebut, dan sebaliknya makin rendah beda dayanya, maka butir soal itu
dianggap makin tidak baik.
Untuk menentukan berfungsi tidaknya pengecoh, diadakan analisis butir soal. Untuk
keperluan analisis ini lembar jawaban peserta ujian yang termasuk kelompok atas dan
kelompok bawah yang dijadikan sumber informasi. Distribusi jawaban kedua kelompok
ini untuk setiap butir dimasukkan dalam satu tabel seperti contoh di bawah ini.
a. Butir Soal No. 1
Pilihan
A B* C D
Kelompok
Atas 0 4 1 1
Bawah 1 2 1 1
Jumlah 1 6 2 1
Jawaban yang benar adalah B (diberi tanda bintang), kebanyakan peserta (pada
kelompok ini) memilih B. Pengecoh A, C, dan D ada yang memilih terutama mereka
yang masuk kelompok bawah. Dengan demikian dapat disimpulkan bahwa pengecoh
berfungsi sebagai jawaban yang salah. Jadi butir soal No. 1 semua pilihan sudah
berfungsi.
Pilihan
A B C D*
Kelompok
Atas 0 1 1 3
Bawah 0 1 2 2
Jumlah 0 2 3 5
Jawaban yang benar adalah D, dan kebanyakan peserta memilih D. Pengecoh B dan
C ada yang memilih, tetapi pengecoh A tidak ada yang memilih; kelompok bawah
sendiri tidak seorang pun yang tertarik untuk memilih A. Jadi butir soal no. 2 harus
diperbaiki terutama pilihan A.
Pilihan
A* B C D
Kelompok
Atas 1 2 2 0
Bawah 3 0 1 1
Jumlah 4 2 3 1
Jawaban yang benar adalah A, peserta paling banyak memilih A terutama Kelompok
Bawah. Pilihan B, C, dan D berfungsi. Tetapi Kelompok Atas justru pilihanya pada B
dan C. Jadi butir soal No. 3 harus diperbaiki atau diganti. Sebaran jawaban seperti ini
kemungkinan disebabkan oleh rumusan pokok soal (stem) yang kurang baik atau
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 99 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
pilihan B dan C cukup menarik sebagai jawaban yang benar atau pilihan A yang perlu
diperbaiki
Ada dua spesifikasi butir soal yang harus dipertimbangkan dalam analisis butir soal, yaitu
(1) validitas isi butir soal, dan (2) keakuratan pengukuran tujuan yang ingin dicapai.
Setiap butir soal secara spesifik mengukur satu bagian tertentu dari isi pelajaran yang
telah diajarkan. Bagian itu dapat berupa satu konsep, satu preposisi, satu dalil, satu
sikap, atau satu keterampilan tertentu. Masalah yang mungkin timbul ialah butir soal
yang dikonstruksi untuk mengukur suatu bagian pelajaran tertentu, karena
konstruksinya yang lemah ternyata tidak akurat mengukur yang mau diukur tersebut.
Dalam hal itu butir soal tersebut tidaklah merupakan butir soal yang cukup baik.
Untuk menentukan apakah suatu butir soal merupakan alat ukur yang baik untuk suatu
hasil belajar tertentu maka diperlukan adanya analisis isi pelajaran. Analisis seperti ini
hanya dapat dilakukan oleh seorang yang menguasai bidang studi tersebut dengan baik.
Jadi analisis validitas ini haruslah dilakukan oleh seorang ahli bidang studi. Analisis harus
dimulai dengan mengadakan kajian terhadap kisi-kisi soal. Dalam kisi-kisi itu ditentukan
bahwa butir soal tertentu dimaksudkan untuk mengukur pokok bahasan atau sub pokok
bahasan tertentu. Jadi kisi-kisi harus dijadikan sebagai pokok tolak ukur analisis.
Aspek kedua yang harus dianalisis secara kualitatif oleh seorang ahli bidang studi ialah
apakah butir soal yang digunakan mengukur tujuan Pelatihan tertentu yang ditetapkan
dalam kisi-kisi. Untuk melakukan analisis ini dibutuhkan penguasaan akan tujuan
Pelatihan. Karena di Indonesia pengaruh perumusan tujuan Pelatihan masih sangat
dipengaruhi oleh taksonomi tujuan Pelatihan oleh B. Bloom, dan kawan-kawan (1956),
penilaian haruslah dilakukan oleh seorang yang memahami dan menguasai bidang ini.
Yang penting untuk diperhatikan bahwa butir soal yang tidak secara akurat mengukur
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 100 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
tujuan yang telah ditetapkan akan merupakan butir soal yang mubazir. Bahkan bila butir
soal tersebut diikutsertakan dalam pertimbangan untuk menentukan keputusan bagi
seseorang, maka keputusan tersebut dapat berakibat jauh di masa yang akan datang
bagi peserta. Suatu tes yang terdiri dari butir soal yang baik belum tentu akan
menjadikan perangkat soalnya sendiri menjadi baik. Masih ada dua hal yang harus
diperhatikan dalam menilai soal ujian, yaitu reliabilitas dan validitas tes. Berikut ini akan
dibahas kedua hal tersebut secara sederhana dan singkat
Penutup
Secara keseluruhan buku ini telah membicarakan serba singkat hal-hal yang berkenaan
dengan pengukuran hail belajar peserta. Mulai dari pengertian mengenai istilah-istilah
penting dalam tes dan pengukuran, sampai dengan masalah yang berkenaan dengan
konstruksi butir dan perangkat soal serta penilaian hail belajar. Tentu saja, karena sifat
buku ini hanya merupakan pengenalan, tidaklah cukup bagi seorang instruktur untuk
berpegang kepada buku singkat ini. Untuk itu maka dianjurkan para instruktur membaca
buku acuan yang disebutkan pada akhir buku ini.
Bagi para instruktur muda yang telah mengikuti program pelatihan perlu melatih diri
untuk mengkonstruksi butir soal. Tanpa latihan tersebut, kemahiran mengkonstruksi
butir soal tidak ada diperoleh. Kemahiran konstruksi butir soal tersebut tidak hanya
sekedar pengetahuan dan pemahaman. Ia lebih merupakan keterampilan yang dapat
diperoleh melalui latihan yang terus menerus. Latihan tersebut harus senantiasa
dihubungkan dengan tujuan yang telah dirumuskan dalam proses pembelajaran yang
dirancang. Latihan secara setapak demi setapak dilakukan, mulai dari konstruksi butir
soal untuk ranah kognitif yang paling rendah, yaitu pengetahuan, dan berlanjut terus ke
yang paling kompleks yaitu evaluasi. Untuk itu dianjurkan agar setiap instruktur
mengkonstruksi butir soal bersamaan dengan melakukan persiapan mengajar. Sehingga
pada akhir semester, instruktur telah mempunyai sejumlah butir soal yang dengan
mudah dapat dipilih untuk digunakan dalam ujian akhir semester, sesuai dengan kisi-kisi
yang telah disusun.
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 101 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Hal lain juga harus mendapat pengertian setiap instruktur ialah kemampuan
konstruksi butir soal harus disertakan pula dengan kemampuan pengskoran secara
objektif, penilaian hasil belajar dengan menggunakan skor sebagai dasar yang objektif.
Dan akhirnya setiap instruktur diharapkan dapat menggunakan hasil penilaian hasil
belajar peserta untuk membantu instruktur sendiri dan peserta dalam mencapai tujuan
proses pembelajaran.
Penilaian/ Asessment
Dasar-Dasar Penilaian Berbasis-Kompetensi
Sistem Berbasis-kompetensi mana yang saya gunakan/akan saya gunakan ?
Apa perbedaaan utama dari dua sistem berbasis kompetensi yanbg ada saat ini?
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 102 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Bagaimana saya bisa mengetahui kalau sistem yang saya gunakan berbasis
kompetensi
Spesifikasi Kompetensi
1. Kompetensi didasarkan pada analisis peran profesional dan/atau formulas!
tanggung jawab profesional.
2. Pernyataan kompetensi menjelaskan hasil yang diharapkan dari kinerja dari fungsi
yang terkait secara profesional, pengetahuan, keterampilan dan s1kap yang sangat
penting untuk kinerja fungsi tersebut.
3. Pemyataan kompetensi memfasilitasi penilaian berpatokan pada kriteria (criterion-
referenced assessment).
4. Kompetensi diperlakukan sebagai alat prediksi (predictor) tentatif atas efektivitas
profesional dan harus mengikuti prosedur validasi terus-menerus.
5. Kompetensi ditetapkan dan diumumkan sebelum diberlakukan.
6. Pembelajar yang menyelesaikan program CEBT menunjukkan serangkaian profil
kompetensi.
7. Ukuran kompetensi secara valid berhubungan dengan pernyataan kompetensi.
8. Ukuran kompetensi bersifat spesifik, realistis, dan sensitif terhadap suasana.
9. Ukuran kompetensi mendiskriminasikan berdasarkan seperangkat standar untuk
mendemonstrasikan kompetensi.
10. Data yang disediakan melalui pengukuran kompetensi dapat dikelola (manageable)
dan bermanfaat dalam pembuatan keputusan.
11. Ukuran dan standar kompetensi ditetapkan dan diumumkan sebelum diberlakukan.
Memulai dari Langkah yang Benar ?
Kami akan memperkenalkan penilaian berbasis-kompetensi merupakan pernyataan yang
amat luas. Apabila organisasi Anda sedang mempertimbangkan untuk mengembangkan
sistem penilaian berbasis-kompetensi, dan Anda bertanggung jawab untuk melakukan
riset awal atau proses implementasinya, pertimbangkan hal-hal berikut ini sebelum
membuat keputusan pasti:
Sistem apa yang paling baik dalam memenuhi kebutuhan kami?
Apa implikasi dari masing-masing sistem tersebut?
Apa perbedaan utama dari sistem-sistem tersebut?
Apa yang ingin kita nilai?
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 103 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
kompetensi pekerjaan?
kompetensi pribadi?
kompetensi umum?
ketiganya atau kombinasi di antaranya?
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 104 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 105 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 106 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Apa perbedaanya
Bagaimana beroperasinya
dengan sistem penilaian
proses penilaian?
berbasis kompetensi
Proses Penilaian
Proses adalah serangkaian tindakan atau peristiwa, atau urutan operasional. Kita
dapat mengatakan bahwa semua bentuk penilaian melibatkan urutan operasional
sebagai berikut:
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 107 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Penilaian Berbasis-Kompetensi
Apabila tujuan
penilaian Juga Membandingkan level
untuk sertifikasi pembelajaran yang dicapai
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 108 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Penilaian Berbasis-Kompetensi
Anda mungkin menemukan perbedaan utama dalam pendekatan penilaian berbasis-
kompetensi:
fokus pada 'hasil';
penilaian bersifat individual;
tidak ada nilai persentase;
tidak ada perbandingan dengan hasil individu lain;
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 109 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Proses penilaian-penilaian
berbasis-kompetensi
Membuat penilalan mengenai pencapaian
terhadap semua hasil kinerja yang
dipersyaratkan
Apabila tujuan
penilaian Juga Menerbitkan sertifikat untuk
untuk kompetensi yang dicapai
sertifikasi
Membuat rencana pengembangan
untuk bidang-bidang 'yang belum
kompeten'
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 110 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Sertifikasi Penilaian
karya
Audit keterampilan
Prapembelajaran
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 111 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 112 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Tujuan Penilaian
Penilaian untuk Sertifikasi
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 113 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Pandangan Berbasis-Kompetensi
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 114 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Penerapan Praktis
Apabila tujuan
Menerbitkan sertifikat untuk
penilaian adalah kompetensi yang dicapai
sertifkasi
Membuat rencana
pengembangan untuk bidang-
bidang 'yang belum kompeten'
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 115 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
IKHTISAR
Alur ini membantu Anda memahami lebih mendalam mengenai struktur dan isi
standar berbasis-kompetensi, memandu cara menyusun rencana penilaian dan
penggunaannya. Anda juga akan dibantu untuk mempertimbangkan faktor-faktor utama
yan dapat memengaruhi efektivitas penilaian.
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 116 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Kriteria Kinerja
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 117 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 118 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 119 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 120 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 121 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Bagaimana cara
Metode apa yang
mengetahui metode
seharusnya saya
gunakan? yang tepat?
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 122 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 123 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
DAFTAR PUSTAKA
A. Dasar Perundang-undangan
1. Depdikbud 1977. Alat penilaian Kemampuan Guru. Jakarta.
B. Buku Referensi
1. Adams, G. S. & Torgerson, T. L. 1964. Measurement and Evaluation in Education,
Psychology, and Guidance. N.Y.: Holt Renehard and Winston.
2. Anastasi, A. 1961. Pyschological Testing. N.Y.: The Macmillan
3. Blood, D. F. & Budd, W. C., 1972. Educational Measurement and Evaluation. N.Y.:
Harper & Row.
4. Blood, B. S., ed. 1956. Taxonomy of Educational Objectives: The Classsification of
Educational Goals, Handbook I: Cognitive Domain. New York: Longmans, Green
and Co.
5. Ebel, R. L., & Frisbie, D. A. 1986. Essentials of Educational Measurement.
Engleewood Clifts, N. J.: Prentice-Hall.
6. Gronlund, N. E. 1971. Measurement and Evaluation in Teaching. N.Y.: The
Macmillan.
7. Hambleton, R. K., & Swaminathan, H. 1985. Item Response Theory: Principle and
Application. Boston: Kluwer. Nijhoff Pub.
8. Lindeman, R. H. 1967. Educational Measurement. N. J.: Scott Foreman an
Company.
9. Mehrens, W. A., & Lehmann, I. J. 1973. Measurement and Evaluation in Education
and Psychology. N.Y.: Holt; Rinehart and Winston.
10. Monroe, W. S., & Robert E. Carter. 1923. The Use of Different Types of Thought
Questions in Secondary Schools and Their Relative Difficulty for Students. Urbana:
III.: University of Illinois Bulletin 20, No. 34.
11. Noll, V. H. 1957. Introduction to Educational Measurement. Boston: Houghton
Mifflin.
12. Sax, G. 1980. Principles of Educational and Psychological Measurement and
Evaluation. Belmont, CA: Wadsworth.
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 124 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 125 dari 126
Buku Informasi Versi: 2016
Modul Pelatihan Berbasis Kompetensi Kode Modul
Jabatan Kerja Keinstrukturan (Training Of Trainers) INA 5750.4 11 01 14 07
A. Daftar Peralatan/Mesin
B. Daftar Bahan
Judul Modul Melakukan Penilaian Hasil Belajar Halaman: 126 dari 126
Buku Informasi Versi: 2016