13u/<,u;1.15
Prasetya lrawan
Dilarang mengutip sebagian atai.J selu{llh buku inl atau diperbanyak dengan
tujuan komersiaJ dala,m be~tuk ~papuot-.npa:seijin PAU~PPAI
Universitas Terbuk:a;kecuali untUk kepertuan'penulisan artikel atau karangan
ilmiah dengan menyebutkan buku ini sebagai sumber
Edisi Revisi
Cetakan I : Mei 2001
371.26
ZAI ZAINUL, Asmawi
p· Penilaian hasi! belajar I Asmawi Zainul, Noehi Nasution;
penyunting Ida Malati Sadjati. --Jakarta: PAU-PPAI, Universitas
Terbuka, 2001.
205 p.; 21 em.
ISBN 979.:&89-199-9
TimTeknis ZaiFUISyall
Desain Cover Tim PAU-PPAI
Sambutan
' ' / . .i .. . • .·• .:.~' ._·' ~"' ; .• :·· ·.,. . ' . - - : '. • ;
Direktur,
Suprodjo Pusposutardjo
NIP. 130257144
KATA PENGANTAR-
Hal aman
v
Ill. Konstruk.si Butir Soal ............................ .......... 31
Latar Belakang ........... _............. .. . . .... . . . . .. . .. . . . . . 31
B. Penulisan Butir Soal Uraian/Esei ........................ 37
1. Pengertian Tes Uraian/Esei ........................ ..
2. Kekuatan Tes Uraian/Esei ............................ 38
3. Kelemahan Tes Uraian/Esei ....................... .
4. Penggunaan Tes Uraian/Esei ....................... · 42
5. Klasifikasi Tes Uraian/Esei .. . .. . .. .. . .. .. .. .. .. .. . .. . 43
1) Butir Soal Tipe Jawaban Melengkapi ..... .... 49
2) Butir Soal Tipe Jawaban Singkat . . . . . .. . . . . . . . 51
6. Beberapa Prinsip Konstruksi Butir Soal Tes
Uraian/Esei ........................-. . . . . .. . . . .. . .. . . .. . . . 55
7. Pedoman Penskoran (Marking Scheme).......... 57
C. Penulisan Butir Soal Objektif ................ , . .. . .. .. . . . . 61
1 .. Pengertian ............................................... 61
a. Butir Soal Tipe Benar-Salah ........... , .. . .. .. . 62
b. BUtir Soal Tipe Menjodohkan .... ...... ........ 70
c. · Butir Soal Tipe Pilihan Ganda . . . . . . . . . . . . . .. . . . 72
2. Perbedaan dan Persamaan Tes Uraian dan Tes
Objektif ............................... : . . . . . . . . . . . . . . . . . . . 89
D. Beberapa Contoh ButirSoal DalamUngkup Ranah
Kognitif ....................................................... .
E. Konstruksi Instrumen Non-Tes ........................... 101
1. Participation Charts (Bagan Partisipasi) ........... 103
Check Lists .............................................. 106
3. Rating Scale (Skala lajuan) ......................... .
4. Skala Sikap ............................................ :.
Rangkuman ........................................................ 131
Latihan ............................................................... 132
vi
B. Peiaksanaan Tes ............................................ "136
1. Open vs Close Books (Catatan Terbuka vs
Catatan Tertutup) ...................................... 136
2. Tes Diumumkah vs Dirahasiakan .................. 138
3. Tes Usan atau Tes Tertulis .......................... 140
4. Tes Tindakan atau Praktek . . . . . . . . .. . . .. . . . . . .. . .. . . 141
Rangkuman .................................... "................... 142
Latihan .................. ~.. . . . . . . .. . . .. . . . . . . . . . . . . . . .. . . . .. . . . . . . . 142
vii
c. Jl.arakteristik Perangkat Tes ;.. : ..... , .•.... ~ ... ~., .. , . 185
(1) Reliabilitas ............ ~ ................ : ........... 185
(2) V~Hditas ........... , ........ ~ ........ ; .........: ...... 189
Rangkuman ...... , ;... ;......... :... ..": ~ .·.. 1, .• , ........ , • ; ..... : .... 190
Latihan ......................................." ............................. 190
viii
Deskripsi Mata Ajaran
1
B. Tujuan lnstruksional Khwm.s
2
· I. PENGERTIAN, KEGUNAAN, DAN ETIKA TES,_PENGUKURAN, .
DAN'=PENILAIAN . .
1.. Tes
3
c. Test often coonotes the presentation ofa standard set of~uestions to be
answered. (Mehrens & Lehmann, 1973). .
4
d) ragam pilihan ganda kompleks
e) ragam pilihan ganda membaca diagram
2. Pengukuran
5
belbet~an;a
definisi pengukuran yang dirumuskan
pendidikan dan psikologi yang acapkali
persons or
pengukuran
sebagai . "Measurement is quantitative descriptions pupil
behavior".
c. Georgia S. Adams (1964) merumuskan pengukuran sebagai "Nothing
more than careful observations of actual performance under standard
conditions".
d. Victor H. Noll (1957) mengemukakan dua karakteristik utama
pengukuran, "quantitativeness" dan "constancy of units". Atas
dasar dua ini ia menyatakan "Since measurement is a
quantitative process, results. of measurement are always expressed in
numbers.
e. William A
pengukuran seiJa<~al
other device that allows us to obtain information in a is
measurement".
f.
6
Dari definisi yang telah dikemukakan di atas terdapat dua karakteristik
pengukurari yang utama, yaitu (1) penggunaan angka atau skala tertentu,
dan (2) menurut suatu aturan atauformulatertentu. . · ·
. J{arena pengukuran menggunakan angka atau skala terteniu, maka untuk
lebih memaha.llli penggunaan angka :atau skala terseout kepad(i ·para dosen
ditunttit untuk mengetahui dan memahaini karakteristik angka atau skala.
. Skala atau angka itu dapat diklaSifikasi kedalam 4 (empat). kategop, .yaitu :
(}) skala nominal; yaitu skala yang bersifat katagorikal. Misalnya, hila sebutir
soal dapat dijawab• benar oleh mahasiswa,, maka. ia meridapat skor 1 {Sa.tu),
. jika ia menjawab salah maka ia memperoleh skor 0 (nol). {2) Skala ordinal,
yaitlf angka yang menunjukkim adanya urutan, tanpa memp~rsoalkan jarak
antar urutan tersebut. Misalnya, angka. yang menunjuk urutan ranking
mahasiswa dalam suatu ·mata. kuliah tertentu. •Mahasiswa yang memperoleh
ranking l (satuHidak berarti dua kaH lebih pandai dari mahasiswa ranking 2
(dua). Jarak kepandaian mahasiswa ranking 1 dengan ranking 2 tidak sama
dengan jarak .kepandaian mahasiSwa ranking 2 dengan ranking ·3, dan·
seterusnya~ (3) Skala atau angka interval, yaitu angka yang menunjukkan
adanya jarak yang sama dari angka. yang berurutan. Misalnya, angka Km
untuk mengukur jarak. Jarak antara. Km 1 dengan Km 2 sarna dengan jarak
antara Km 3 denganKm 4, dan seterusnya. (4) Skala atau angka rasio, yaitu
angka yang memiliki semua karakteristik angka atau. skala· yang terdahulu
dan ditambah dengan satu karakteristik ·lagi, yaitu skala tersebut berlanjut
terus ke atas dan ke bawah. Jadi memiliki nol mutlak. Misalnya, tinggi badan:
seorang .. Bila ada tinggi badan manusia 75 em dan yang lainnya 150 em,
maka tinggi yang pertama setengah dari yang k~ua, atau manusia kedua 2
kali lebih tinggi dari yang pertarna. Sebaliknya seseorang yang memiliki IQ:
· 70 dan yang lain IQ: 140, tidak dapat dikatakan orang kedua dua kali lebih
eerdas dari yang pertama, kar.ena skala IQ adalah skala interval.
7
3. Permaian
8
yang baik dim apa yang diharapkan. D~ngan detl1ikian basil penguku,ran
. yang ben~r merupakan dasar yang kokoh untuk mel<:\kukan penilaian.
' . . . . ..
-_-~ecara garis -_besar Penilaian dapat dil5agj menjadi -dua, yaitu penUaian -
{ormatif dan penilaiEm ~limatif (istilah ini _pertama kali dfgunakan oleh
Scnven (1967) dalam arljkelnya berjudui "The Methodology ·of evaluation".
·Penilaian: fotrn~fif ··-di1akukan' derigan ·maksud -·merirantau sejauh·· inanakah
sl!atu proses 'perididikah telah berjalan sebagaimana 9ang diren~nakan.
Sedangkan penilaian sumatif- dilakukan untuk mengetahui -.- sejauhrrtarla
.peserta didik telah d_g.pat ·berpindah ·- dari -. suatu unit · perigkuliah ke unit
:berikutnya. - . . · --- ·
Dari uraian singkat mengenai pengertian tes, pengukuran, dan ·evaluasi
·di atas dapat dishnpulkah bahwa ketigahaltersebut
·' . '
saling
.
berbubungim satu ·
'
dengan yang lain. Penilaian ·basil· belajar haru dapat dilakukan dengan baik
dan b,enar .pila menggunakan informasi yang diperoleb melalui pengukuran
hasil belajar, yang menggunakan tes sebagai alat ukurnya. Tentu saja tes
banya merupakan salah satu alat yang dapat digunakan. Dapat saja
inforinasi tentang _basil belajar tersebut diperoleh taripa mEmggunakan tes
sebagai instrumen ukurnya. Misalnya dapat digunakan alat ukur nontes,
seperti observasi, skala ratirrg; dan lain-lain. .
a. Seleksi
b. Penempatan
c. Diagnosis remedial
10
. diinterpretasL Setidak-tidaknya ada dua cara men~interpretasi skor tes, ~aifu
dengan membandihgkan skor seseorang dengah kelompoknya yang· kedua
dengan . melihat kedudukan skor yang. diperoleh seseorang der'l.gan kriteria
yang ditentukan sebetum tes dl mulat: Ontl.ik~ yang pertama diriamakan.
"norm reference test"·dan yahg kedua dimimaka:n "crif~rion reference test".
g. Pengembangi:m ilmu ·
Hasil perigukuran, tes, dan penilaian tentu saja akan dapat memberi
sutnbangan_ yang berarti bagi perkembangan teori dan dasar pendidikan. '
Ilmu seperti pengukuran pendidikan dan psikometrik sangat tergantung pada
hasil-hasil pengukuran, tes dan penilaian yang dilakukan sebagai kegiatan
sehari-hari dosen dan pendidik. Dari hasil itu akan diperoleh pengetahuan
empirik yang sangat berharga untuk pengembangan ilmu dim teori.
11
5. Etika tes
12
' '
Karena 1Janyak. kritik · yang tajam c;lari masyarakat terhadap piaktEtk tes
hasil pendidikan, maka para pendidik harus dapat. melakukan tes dengan
periuh. ti}nggung Jawab .. Ontuk itU perlu ditegakkan· beberapa ~tika tes, yang
membedakc:m tindakan yang efis dim tindaka'n yang tidak etis dalam
pela~anaan .tes sedna profesional:
· Pr~ktektes hasil
. ' -
belajaryang etis•terutatna mencakup empathal utama::
. ·. . ' . .,. . ·
.
Setiap do~en atau pengajar wajib. melindungi kerahasiaan hasil tes, baik
secara individual maupun secara kelompok Hasil · tes· hanya dapat "'
disampaikan kepac;Ia orang lain hila: _
1) Ada izin dari. mahasiswa. yang bersangkutan atau orang yang
bertanggungjawab terhadap peserta didik (bagi peserta didikyanghelum
.dewasa). Jadi dengan derniki~ maka praktek menempelkan hasil tes di
papan .pengumuman dengan .identitas ·jelas peserta tes, merupakan
-pelanggaran terhadap etika inL
2) Ada tanda-tanda yang jelas bahwa hasil tes tersebtit menunjukkan gejala
yang membahayakan dirinya atau membahayakan kepentingan orang
~~- '
13
c. -Jnterpretasi hasil tes
d. Penggunaan tes
Tes hasil belajar haruslah digunakan secara patut Bila tes hasil belajar
tertentu merupakan tes baku, maka tes tersebut harus digunakan di bawah
ketentuan yang berlaku bagi pelaksanaan tes baku tersebut. Tak ada tes baku
yang boleh digunakan di luar prosedur yang ditetapkan oleh tes itu sendiri.
Di samping beberapa butir seperti yang diuraikan di atas, ada beberapa
petunjuk praktis yang hendaknya ditaati oleh dosen dalam tes:
a. Pelaksanaan tes hendaknya diberi tahu terlebih dahulu kepada peserta
tes. Hanya karena pertimbangan tertentu, yang sangat penting, yang
dapat membenarkan dosen tidak memberi tahu terlebih dahulu kepada
peserta tes tentang tes yang akan dilaksanakan. Bahkan kisi-kisi tes
sebaiknya diberi tahu kepada peserta tes sebelum melaksanakan tes.
b. Sebaiknya dosen menjelaskan cara menjawab yang dituntut dalam suatu
tes. Petunjuk menjawab tes bukanlah sesuatu yang harus dirahasiakan.
Petunjuk yang bersifat menjebak harus dihindari.
c. Sebaiknya dosen justru memotivasi peserta tes mengerjakan tesnya
secara baik. Jangan sampai seorang dosen justru menakut-nakuti
mahasiswa dengan tes.
d. Bila dosen menggunakan tes baku, maka hendaknya dosen tersebut
bertanggung jawab penuh terhadap keamanan tes tersebut. Tidak ada tes
baku yang boleh digunakan dalam latihan. ·
14
e. Seorang dosen dapat menggunakan hasil tes untuk mengidentifikasi
kekuatan dan kelemahan peserta tes, asaikan hal tersebut tetap menjadi
rahasia peserta tes dan pendidik.yang bersangkutan.
f. Dosen hendaknya menghindari diri dari keterlibatan dalam bimbingan
tes yang dapat diperkirakan akan mengganggu proses belajar mahasiswa.
Hal ini menjadi penting bila dosen .yang bersangkutan justru terlibat
dalam penyusunan butir tes yang digunakan.
g. Adalah tidak etis. biia seorang dosen mengembangkan butir soal atau .
perangkat soal yang paralel dengan suatu tes baku dengan maksud untuk
digunakan dalam bimbingan tes.
h. Adalah tidak etis untuk mendiskriminasikan mahasiswa tertentu atau
kelompok terlentu yang boleh mengikuti suatu tes atau melarang
mengikuti tes.
i. Adalah tidak etis untuk memperpanjang waktu atau menyingkat waktu
dari yang ditentukan oleh petunjuk tes.
·j. · Dosen tidak boleh meningkatkan rasa cemas peserta tes dengan
penjelasan yang tidak perlu.
Secara lebih mendasar etika tes ini diatur dalam standar tes yang
dikembangkan oleh organisasi profesional seperli American Psychological
Association (APA), American Educational Research Association (AERA), dan
National Council on Measurement in Education (NCME). Terakhir ketiga
organisasi profesional ini membentuk Panitia bersama untuk menyusun
standar dalam tes. Mereka menghasilkan buku yang dinamakan "Standard
for .Educational and Psychological Testing (1985).
Dalam Standard ini dicantumkan berbagai toiok ukur, seperti:
1. Technical Standards for Test Construction and Evaluation;
2. Professional Standards for Test Use;
3. Standards for Particular Applications; dan
4. Standards for Administrative Procedures:
15
Semua standar ini mencakUp dua aspek utama, yaitu tes hasil belajar
dan tes psikologi. Pelanggaran terhadap standar ini merupakan pelanggaran
kepada ·etika profesi, yang dalam hal tertentu dapat merupakan pelanggaran
atau kejahatan.
Rangkuman
Tes adalah suatu pemyataan arou tugas atau seperangkat tugas yang
direncanakan untuk memperoleh informasi tentang trait/atribut
pendidikan atau psikologik yang setiap butir pertanyaan atau tugas
tersebut mempunyai jawaban atau ketentuan yang dianggap ·benar. T es
dapat.diklasifikasikan menurut.bentuk, tipe dan.ragamnya.
Pengukuran adalah pemb.erian angka kepada suatu atribut atau
karakteristik tertentu yang dimiliki oleh orang, hal atau objek tertentu
menurut aturan atau formulasi yang jelas. Karakteristik dari pengukuran
adalah penggunaan angka atau skala tertentu dan menggunakan suatu
aturan atau formula tertentu.
Penilaian adcilah suatu proses untuk mengambil keputusan dengan
menggunakcm informasi·yang diperoleh melalui pengukuran hasil belajar,
baik yang menggunakan instrumen tes maupun non~tes.~ Dengan kata
lain, penilaian adalah pemberian nilai terhadap kualitas sesuatu.
Keterkaitan an.tara.tes, pengukuran, penilaian: Penilaian hasil belajar
baru · dapat dilakukan dengan baik dan benar bila menggunakan
informasi yang diperoleh melalui pengukuran hasil belajar yang
menggunakan tes sebagai alat ukumya.
Kegunaan tes, pengukurcm, dan penilaian dalam pendidikan antara
lain adalah untuk seleksi, penempatan, diagnosa dan remedial, umpan
1• balik, memotioosi dan membimbing, perbaikan kurikulum dan program
pendidikan serta pengembangan ilmu.
16
Di dalam melakukan. tes·harus di ingatmengenai etikanya. Etika tes
meliputi kerahasiaan hasil tes, keamanan tes, interpretasi .hasil. tes dan'
penggunaan tes.
. Latiha:m
17
II. PERENCANAAN TES
Tes baru akan berarti bila terdiri dari butir-butir soal yang menguji tujuan
yang penting dan mewakili ranah pengetahuan, kemampuarr dan
keterampilan secara representatif. lJntuk itu maka peranan perencanaan
dalam pengujian menjadi. sangat penting. Tes tanpa rencana· yang dapat
dipertanggungjawabkan dapat menjadi usaha sia-sia, bahkan mungkin akan
mengganggu proses pencapaian tujuan. Enam hal yang harus
dipertimbangkan dalam perencanaan tes:
Tes hasH belajar (achievement test) haruslah disusun atas butir-butir soal
yang terpilih, yang. secara akademik dapat dipertanggungjawabkan sebagai
sampel yang representatif dari ilmu atau bidang studi yang diuji dengan
perangkat tes tersebut. Proses pemilihan atau sampling butir soal itu tidak
mungkin dapat dilakukan secara acak (random). Hanya seorang ahli ·dalam
bidang studi yang tahu secara lebih baik apakah butir-butir soal itu cukup
representatif atau tidak. Pemilihan itu dilakukan atas dasar pertimbangan
pentingnya konsep, generalisasi, · daHl, atau teori yang diuji da!am
hubungannya dengan peranannya terhadap bidang studi tersebut secara
keseluruhan. Karena itu tidak mungkin pemilihan itu dilakukan oleh orang
awam dalam bidang studi tersebut.
Untuk memperoleh butir-butir yang mewakili keseluruhan konsep yang
penting dalam suatu bidang studi, biasanya bidang studi itu dipilah-pilah
menjadi beberapa pokok bahasan (major content areas) dan sub pokok
bahasan (specific content areas). T entu saja tidak pedu. ada jumlah butir soal
yang sama untuk setiap pokok bahasan, Jumlah soal dalam setiap pokok
bahasan atau subpokok bahasan hendaknya sebanding dengan luas dan
pentingnya pokok bahasan atau sub pokok bahasan tersebut. Sebagai
pedoman . tentang tingkat · kepentingan c.lari suatu pokok bahasan a tau
subpokok bahasan dapat dilihat dari kontribusinya terhadap keseluruhan
bidang studi itu atau, untuk mudahnya, keluasan pembahasan pokok
bahasan dan atau subpokok bahasan itu. Tidak ada batasan jumlah Qutir
soal untuk satu pokok bahasanatau suatu subpokok bahasan.
Ebel dan Frisbie membagi tiga tipe soal: (1) esei, (2) objektif, dan (3)
problem matematik. Di samping itu masih juga dikenal soal-soal. penampilan
dan soal Hsan. Ada kesalahfahaman yang umum terjadi dikalangan
pengguna tes, yaitu anggapanyang menyatakan suatu tipe tes lebih baik dari
tipe tes lainnya dalam mengukur ranah kognitif tertentu. Berbagai penelitian
telah m€munjukkan perbedaan yang berarti dalam mengukur level ranah
kognitif yang sama. Soal esei yang baik sama dapat mengukur ranah kognitif
yang manapun seperti yang dapat diukur oleh soal objektif yang baik, atau
sebaliknya. Dan menghasil.kan ranking subyek yang tidak berbeda.
Pemilihan tipe tes yang akan digunakan lebih banyak ditentukan oleh
kemampuan .dan waktu yang tersedia pada penyusun tes dari pada
kemampuan peserta tes a tau aspek yang ingin diukur.
20
3. Aspek.Kemampuan yangDiuji
Balk tes objektif niaupun tes esei mengenal berbagai format. _Misalnya,
dalam tes ,objektif, acapkaU dipilih- format A (Pilihcm ·Ganda), format B
(Pilihan Ganda Analisis Hubungan Antar Hal}, format C (Pilihan Ganda
Analisis Kasus); atau ·format b (Pilihan :Ga:nda Kompleksr Berbagai
penelitian juga telah menunjukkan bahwa berbagai format butir soal ini tidak
menunjukkan perbedaan efektivitas yang berarti· untuk mengukur·berbagai
level ranah kognitif, asalkan dikonstruksi sama baiknya. Bahkan format butir
soal B-S pun dapat mengukur level ranah koghitif yang tinggi, asalkan
dikonstruksi secara: cermat oleh ahli bidang studi ·dan ahli konstruksi tes.
Perbedaan antar format butir soal tersebut tidak terletak pada efektivitasnya
21
mengulmr level kemampuan, tetapi lebih banyak pada penerkaannya (dalam
hal pe5ertates kurang menguasai bahan yang di tes). .
Jumlah butir ~Qal tentu saja tidak ada ketentuim yang pasti. Tetapi yang
harus diingat. ialah jumlah .. butir soal berhubungan .. langsung dengan
reliabilitas tes dan representasi isi bi<lang studi yang di tes. Makin ·be5ar
jumlah hutir s~al yang digunakail dalam suatu tes maka kemungkinan akan
makin tinggi reliabilitasnya, l?aik dalam arti stabilitas maupun internal
konsistensinya: Dilihat dari segi jumlah inilah maka tes objektif mempunyai
kekuatan yang lel:>ih dari tes esei. Karena tugas yang harus diselesaikan
dafam tes objektif · itu sangat singkat, maka · kemungkinan untuk
menggunakan jumlah butir soal yang besar menjadi lebih besar pula.
Sedangkan tes esei tidak memungkinkan mEmggunakan jumlah item yimg
bc;uiyak. Dengan demikian representasi bidang studi dan reliabilitas tes
objektif akan lebih baik dari ·tes eseL
Jumlah butir soal itu haruslah direncanakan:
a. jumlah keseluruhim.
·b.·· jumlah untuk setiap pokok bahasan/topik/content area. ·
c. jumlah untuk setiap format.· -
d. jumlah untuktiap kategori tingkat kesukaran. ·
e. jumlah.untuk setiapaspek pada ranah kognitif.
>
22
6. Distrib~si Tiogkat Kesukaran
. . . -
24
KISI-KISI TES OBJEKTIF
PROGRAM STUDt
MATAKULIAH .
SEMESTERITAHUN :
t.AMA klJIAN'
· TIPETES :
JU~t,AH BUTIR TES :
.
JENJANG KEMAMPUAN DAN TINGI<AT KESUKAAAN
. . C1 C2 C3 C4;5 6 ..
POKOK BAHASAf:J M s. s M s s M. s M s s s JUMLAH
NO DAN u E u u E u ~u E U; tJ E; (J ·suTIR·· %
• . SOB POKOK.;. ' D D ··I<>' D .o K D D K 1).. D· .K SOAL !
BAHASAN A A• A A A .A :A A . . A A A 4 .
H N R H N R H N ~ H ·,. N .· ~
G G .G G :··;-··-·:
· ..
.JUMLAH
.BUTIR SOAL ·
PROSENTASE 100
KETERANGAN:
• C1 ProSes berpikir ingatan
• C2 : Pro8es berpikir pemahaman
• C3 :: Proses berpikir penerapan
• C4, 5, 6 : Proses berpikir anatisis, sintesis, dan evaluasi
• Mudati, Sedang, Sukar ad~ah tingkat kesukaran butir soal yang diinginkan. Menentukan tingkat kesukaran
ini didasarkan pada pertimbangan pembuatan soal.
• Pokok!Sub Pokok Bahasan di kolom 2 diambil dari--GBPP·(Garis-garis Besar Program Pengajaran}, yang
ditarik dari Tujuan t.nstruksional Khusus (TIK).
Format kisi-kisi yang .diperlukan untuk mengembangkan perangkat tes
yang hanya terdiri dari tes pilihan ganda adalah seperti tercantum pada Kisi-
kisi Tes Objektif (di halaman 25). Adapun langkah yang ditempuh untuk
mengisi format tersebut adalah sebagai berlkut: ·
1. Tentukan lamanya waktu pelaksanaan ujian · yang direncanakan.
Misalnya 90 menit.
~. Hitung banyaknya butir soal pilihan ganda. yang dapat diselesaikan
dalam waktu 90 menit. ·
3. Tentukan pokok bahasan dan subpokok bahasan yang harus diliput
dalam tes Jersebut.
4. Tentukan proporsi banyaknya butir soal setiap pokok bahasan., Proporsi
ini · tergantung pada tingkat kepentingan pokok bahasan satu ·terhadap
yang lain. Proporsi dinyatakan dalam persen(%) dan dicantumkan pada
kolom paling kanan.
5. Tentukan prosentase/proporsi jenjang kemampuan berpikir dalam
perangkat ·tes tersebut. Prosentase ini dicantumkan pada baris paling
bawah.
6. Dengan menggunakan data pada butir 2, 4, dan 5 penyebaran butir soal
pada setiap kolom.dapat dilaksanakan.
tes
Kisi-kisi. untuk tes bentuk uraian lebih sederhana dari objektif, karena
pada tes uraian proporsj masing-masing tingkat kemampuan berpikir
(pemilahan jenjang berpikir) yang diukur tidak periu dilaksanakan. Format
kisi-kisi tes esei dicantumkan di bawah ini.
26
FORMAT KISI-KISI TES URAIAN
PROGRAM STUDI/JURUSAN :
MATAKULlAH
SEMESTERITAHUN
LAMAUJIAN
BENTUKTES
JUMLAH BUTIR TES
j
r
I
JUMLAH
I BUTIRSOAL
I PROSENTASE 100
\ " ·.
Sekiranya dalam satu perangkat tes terdapat dua bentuk tes yaitu pilihan
ganda dan uraian, maka kisi-kisinya dapat dibuat dua yang terpisah atau
gabungan. Baik dipisah maupun digabungkan pengisian kisi-kisi selalu
dimulai dengan aloka13i waktu untuk masing-masing bentuk soal. Kalau
alokasi waktu sudah ditentukan langkah selanjutnya mengikuti langkah di
· atas. Contoh kisi-kisi gabungan tes bentuk objektif dan uraian tertutup
terdapat pada halaman 30. ·
28
Rangkuman
Latitlan
' '
PROGRAM STUD!
MATAKULIAH
LAMAUJIAN
JUMLAH SOAL OBJEKTIF . URAIAN: ........... .
SEMESTER
,
BENTUK OBJEKTIF BENTUK URAIAN TERBATAS
POKOK BAHASAN DAN ASPEK BERPIKIR
NO C1 C2 C3 C4,5,6 JUMLAH % JUMLAH %
SUBPOKOK BAHASAN TERTINGGI
A B C D E A B C D E A B C D E A B C D E SOAL C2 C3 C4 C5 C6 SOAL
~-
1!!1
j
~
~
1--- ;:I
JUMLAHSOAL ~
PROSENTASE 100
.. mo
Ill -. -- - .I
- ... gam soal yc:utu melengkapi pilihan (pilihan ganda ,biasa, anaUsis hubung
pilihan kompleks, dan membaca diagram, grafik, tabel, atau gambar.
~~ -·. -
I
Q
~
~
IIJ. KONSTRUKSIBUTIR SOAL
A. latar Beiakang
31
Jadi dengan demikian maka bab ini pada _dasamya_ akan menguraikan
dan tnelatih bagaimana cara-cara pengkonstruksian butir soal yang baik,
dengan anggapan bahwa butir soal yang baik akan tetap dapat mengukur
secara akurat, apapun bentuk dan tipe soalnya. Dengan demikian Anda
diharapkan tidak hanya"membaca teks yang terdapat dalam bab ini, tetapi
mengerjakan semua latihan yang ditugaskan. Yang perlu dihayati ialah
kemampuan menyusun butir soal dengan baik tidak hanya bersifat
pengetahuan atau pemahaman, tetapi lebih berupa keterampilan. Bahkan
untuk mencapai tahapan mahir: dalam · kemampuan mengkonstruksi butir
soal, maka aspek kiat akan mempunyai peranan yang penting. Guna
mencapai kemampuan konstruksi butir soal yang mahir dengan kiatnya itu
dibutuhkan pelatihan yang ter:us menerus.
TesHasil Belajar.(THB) adalah salah satu alat ukur yang paling banyak
digunakan untuk menentukan keberhasilan seseorang dalam suatu proses
belajar mengajar atau untuk menentukan keberhasilan suatu program
pendidikan. Alat ukur lainnya yang penggunaannya sangat terbatas antara
lain pedoman wawancara, pedoman observasi, angket, skala sikap dan
daftar isian. Kesemua alat ukur mempunyai peranan tersendiri namun alat
ukur yang satu dengan lainnya dapat saHng mendukung dalam pengukuran
hasil belajar.
Adapun penyusunan tes hasH beiajar adalah sebagai
32
konsep atau prinsip, kemampuan untuk menggunakan suatu konsep atau
prinsip dan bermacam-macam kemampuan berpikir lainnya yang lebih tinggi
tingkatannya dari mengingat atau memahami. Demikian juga ranah
keterampilan dan ranah sikap dari taxonomi tujuan pendidikan Bloom harus
diperhitungkan dalam penyusunan THB. Jadi langkah pertama ialah
menentukan hasil belajar yang manakah yang akan diukur pada setiap
kegiatan belajar, pokok bahasan atau sub pokok bahasan. Larigkah ini
tentunya mengacu pada tujuan instruksional yang ada pada setiap kegiatan
belajar antara lain:
a. telah ditentukan tujuan instruksional untuk setiap kegiatan helajar;
b. tujuan itu dinyatakan dalam bentuk belajar yang masih umum;
c. seterusnya setiap tujucm; instruksional dijabarkan menjadi tujuanyang
lebih khusus lagi sehingga merupakan tingkah laku yang dapat diukur.
Pada hakekatnya tes untuk ketiga ranah kognitif, afektif dan psikornotor
dapat dikembangkan, namun dalam pelaksanaan terdapat penyimpangan
yaitu yang lebih diutamakan adalah pengukuran pencapaian ranah kognitif
yang meliputi keenam tingkat kemampuan berpikif. Dalam pengembangan
butir soal, karena belum terbinanya keterampilan yang mantap baik pada
fase pengembangan (proses pembelajaran) maupun fase pengukuran, maka
tiga aspek berpikir yang terakhir yaitu analisis, sintesis dan evaluasi dijadikan
satu kategori dalam pengu,kuran. Pada waktu yang akan datang
penyimpangan ini semua harus dibetulkan.
33
menggambarkan pokok-pokok yang akcm ditanyakan dan aspek-aspek yang
akan diukur.
34
dalam tipe pilihan ganda: · A: PiJihan · Ganda Btasa, B. Arialisis
Hubungan Antar Hal, C. Analisis Kasus, D. Melengkapi Berganda, dan
E; M~mbaca Diagram, Gambar, Grafik atau Tabel.
35
d. Tes prestasi belajar umum (general achievement, survey test) yaitu tes
yang diberikan sesudah para mahasiswa mendapat pelajaran yang
maksudnya untuk mengetahui tingkat kemampuan mahasiswa secara
menyeluruh dan menempatkan mereka sesuai dengan tingkat
kemampuannya.
e. Tes formatif yaitu tes yang diberikan sesudah satu kegiatan belajar
diselesaikan yang oertujuan untuk mengumpulkan data/informasi tentang
kualitas proses pembelajaran tersebut.
f. T es sumatif yaitu tes yang diberikan sesudah menyelesaikan kegiatan
belajar dalam satu periode tertentu. Tujuannya adalah untuk
mengumpulkan data/informasi dalam mengenai taraf serap mahasiswa
terhadap pelajaran yang telah diberikan.
36
berarti bahwa kelompok · yang terdiri dari peserta didik yang seiuruhnya
pandai harus diberi pertanyaan yang sukar. Sebaliknya satu kelompok
peserta didik yang semuanya kurang harus diberi pertanyaan yang relatif
mudah.
Pendekatan pengukuran yang digunakan di berbagai universitas
umumnya mengacu pada criterion reference.
Yang dimaksud dengan tes uraian dalam tulisan ini adaiah butir soal
yang mengandung pertanyaan atau tugas yang jawaban atau pengerjaan
soal tersebut harus dilakukan dengan cara mengekspresikan pikiran peserta
tes. Ciri khas tes uraian ialah jawaban terhadap soal tersebut tidak
37
disediakan oleh orang yang mengkonstruksi butir soal, tetapi harus dipasok
oleh pesertates. Jadi yang terutama membedakan tipe.soal objektif dan tipe
soal uraian adalah siapa yang menyediakan jawaban atau altematif jawaban
terhadap soal atau tugas yang diberikan. Butir soal tipe uraian atau dalam
bahasa Inggrisnya dinamakan "essay test" hanya terdiri dari pertanyaan atau
tugas (kadang-kadang juga harus disertai dengan beberapa ketentuan dalam
menjawab atau mengerjakan soal tersebut), dan jawaban sepenuhnya harus
dipikirkan oleh. peserta tes. Peserta tes bebas untuk menjawab pertanyaan
yang diajukan. Setiap peserta' tes dapat memilih, menghubungkan, dan
menyampaikan gagasannya dengan menggunakan kata-katanya sendiri.
Dengan pengertian di atas maka. segera akan kelihatan bahwa pemberian
skor terhadap jawaban soal tidak mungkin dilakukan secara objektif.
Soal uraian mempunyai beberapa kelebihan yang tidak dapat atau sukar
diperoleh melalui penggunaan tipe butir soallain. Kelebihan itu an tara lain:
a. Tes uraian dapat digunakan dengan baik untuk mengukur hasil belajar
yang kompleks. ·Pada umumnya hasil belajar bersifat kompleks. Tetapi
sebagian besar dari hasil belajar yang kompleks dapaf dirinci menjadi
beberapa hasil belajar yang lebih sederhana. Rincian hasH belajar yang
sederhana itu secara terbatas dapat berdiri sendiri, dan secara bersama-
sama beberapa hasH belajar sederhana itu akan membentuk hasil belajar
yang kompleks. Pengukuran hasil belajar yang seperti ini tidak menuntut
penggunaan tes tipe uraian. Misalnya, bila hasil belajar yang akan diukur
berupa pemahaman dari suatu prinsip yang kompleks. Pemahaman
seperti itu selalu dapat diuraikan menjadi bagian-bagian yang sederhana.
Tetapi ada pula· beberapa hasH belajar lain yang sifatnya kompleks dan
bila dirinci menjadi hasil belajar yang lebih sederhana dapat kehilangan
arti globalnya, sebab hubungan antara komponen hasil belajar yang satu
dengan yang lain sangat erat, misalnya hasil yang bersifat ekspresif ata4
38
kreatif. Hasil belajar yang seperti ini sebaiknya atau seharusnya cliukur
dengan menggunakan tes uraian. Norman E. Gronlund (1971, hal.
1969) mengidentifikasi hasH belajar seperti yang tersebut di bawah ini:
1} kemampuan mengaplikasikan prinsip.
2) kemarnpuan menginterpretasi hubungan.
3) kemampuan mengenal dan menyatakan inferensi.
4} · kemampuan mengenal relevansi dari suatu ·informasi.
5) kemampuan merumuskan dan mengenal hipotesis.
6) kemampuan merumuskan dan mengenal kesimpulan yang sahih.
7) kemampuan mengidentifikasi asumsi yang mendasarkan suatu
kesimpulan.
8) kemampuan mengenal keterbatasan data.
9) kemampuan mengenal dan menyatakan masalah.
10) kemampuan mendesain prosedur eksperimen.
40
dan pengetahuan . . yc;mg ·.·. diajarkan . di sekolah menuntut ad~nya
kemampuan menyatakan pikiran dalam bentuk tertulis ..
·41
b. Untuk menyelesaikan tes uraian dengan baik dosen dan mahasiswa
harus menyediakan waktu cukup banyak. Waktu mahasiswa haruslah
cukup banyak ketika mengetjakan tes. Sedangkan dosen harus
menyediakan waktu yang banyak untuk memeriksa; Bila kedu.a waktu ini
tidak dapat dilaksanakan, maka sebaiknya tes uraian tidak digunakan,
kar~ma tes uraian yang tidak diperiksa dengan teliti tidak dapat menjadi
alat ukur pendidikan yang efektif.
c. Jawaban peserta tes kadang-kadang disertai dengan bualan. Peserta tes
yang kurang menguasai bahan yang diujikan acapkali juga mencoba
menjawab dengan. menguraikan hal lain yang tidak berhubungan dengan
hal yang ditanyakan a.tau dengan kata lain peserta tes membual.
Jawaban yang tidak berharga inipun harus dibaca oleh dosen dengan
teliti.
d. Kemampuan menyatakan pikiran secara tertulis menjadi hal yang paling
utama membedakan prestasi belajar antar mahasiswa. Padahal hanya
hasil belajar yang {Err!entu sajalah yang harus dikomunikasikan dalam
bentuk tertulis. Sebagian besar hasil belajar lain dinyatakan dalam
bentuk tingkah laku atau sikap, bukan dalam bentuk pemyataan tertulis.
a. Bila jum!ah mal}asiswa atau peserta ujian terbatas maka soal uraian
dapat digunakan karena masih mungkin bagi dosen untuk dapat
memeriksa/menskor hasil ujian tersebut secara baik. Bila peserta ujian
terlalu banyak, misalnya iebih dari seratus (100) orang, maka akan
menyita waktu dosen terlalu banyak, sehingga penggunaan soal uraian
menjadi tidak efisien lagi.
b. Bila waktu yang dipunyai dosen untuk mempersiapki:\n soal sangat
terbatas, sedangkan ia mempunyai waktu yang cukup .untuk memeriksa
hasil ujian, maka soal uraian dapat digunakan. Secara relatif, waktu yang
dibutuhkan untuk mengkonstruksi butir soal uraian tidak terlalu banyak.
42
c. Bila · tujuan instruksional yang ingir1 dicapai adalah kemampuan
mengekspresikan pikiran dalam bentuk tertulis, menguji kemampuan
menulis dengan baik, atau kemampuan penggunaan bahasa secara
tertib,.maka haruslah menggunakan tes uraian ..
d. Bila dosen ingin memperoleh informasi yang tldak tertulis. secara
langsung di dalam soal ujian tetapidapat disimpulkan dari tulisan peserta
tes, seperti sikap, nilai, afau pendapat Soal uraian dapat digunakan
untuk memperoleh informasi tidak langsung · tersebut, tetapi harus
digunakan dengan sangat hati-hati oleh dosen.
e. Bila · dosen ingin memperoleh hasil pengalaman belajar mahasiswanya,
maka tes ·uraian merupakan salah satu bentuk yang paling cocok untuk
mengukur pengalaman belajar tersebut.
Tes uraian secara umum dapat dibagi menjadi dua jenis, yaitu tes uraian
bebas, te5 uraian terbuka, (extended response) dan tes uraian terbatas, tes
uraian objektif, (restricted response). Pembedaan kedua jenis tes uraian ini
adalah besamya kebebasan yang diberikan kepada peserta tes untuk
mengorganisasikan, menuHs dan menyatakan·pikiran dan gagasannya.
pad~ Ill~ itu beserta para pemimpinnya· tJraian Anda hendaknya tidak
rnelebihi 2 halarnan. -
.- .. tll.'ltuk de1pat menjawab bu,tir soal ini dengan baik, ma~ peserta tes haru,s
wemilikL , kemampuan ._ rnenginQ~t fakta historis sekitar perjuarigan
•. k~m,~rg~kaC!tt kemuciiC1n ro~milih{C1kta- yang t~rp~J.'ltlrlg di antara ~mua fakta ·
yc;ulg · ~kan -. mendU~urig argumentasi jawabannya. Setelah _itu ia: harus
- tnengorganisasikan dalam pikirannya fa~ dan menyusunnya .dalam suatu
-.• _p_r(Ii~nyang .loois da11' denga1l rnEmggunakan _- bahasa yapg dapat _dipahami
·ole})oranglain;-Dengan·kta laindalam.menjawab tes uraian -bebas; seorang
p~erta · ujian harus- mulai·dengan pengetaf!u~n yang hersifat faktual,
k~mudian mengevaluasi fakta yang. dimilikinya, mengorganisasikan fakta
- pilihannya • itu ke dalam · suah,t susunan . yang logis,- dan akhirnya
menyajikannya dalain suatU uraian naratif ya:r1g dapat dimengerti orang lairi.
Kalapp\ln _ada batasan. himyalah panjangnya uraian yang clitentukan 6ieh
pembuat butix: soal. Pemba~n · seperti .- itu -sangat diperlukan · sehingga ia
dapat- memperkirakan· \-\(aktU yang harus disediakannya untuk memeriksa
jawaban peserta uj1an. Peserta ujian sepentihnya diberi kebebasan untuk
tnenjawab menurut gaya bahasa dan gaya kognitifnya masing-masing.
Dengan demikian maka jelaslah keterainpilan mEmgekspresikan pikiran
dalam bentuk tertulis akan besar sekali kontribusinya dalam menjawab soal
ujian tipe ini. Butir soal seperti ini baik digunakan untuk rnengukur hasil
belajar pada tingkat aplikasi; analisis, sintesis, dan evalpasi. _ ·
Dalam menjawab .tes uraian terbatas, peserta tes. lebih dibatasi oleh
berbagai rambu~rambu yang ditentukan dalam butir soal. Keterbatasan itu
mencakup format, isi, dan ruang lingkup ja~aban. _Jadi soal tes u_raian
terbatas ini harus menentukan batas jawaban yang dikehendakL B~tas itu
mehputi konteks jawaban yang diinginkan, jumlah butir jawaban yang
44
diharapkan, keluasan uraian jawaban, arah dan luas jawaban yang diminta.
Misalnya:
Untuk menjawab butir soal ini peserta tes jauh lebih terikat bila
dibandingkan dengan contoh terdahulu. Dalam soal tes uraian jenis ini
peserta tes tidak dapat memilih dengan bebas penyajiannya. Ja harus
mengikuti instruksi butir soal untuk menjawab. Tetapi peserta tes tetap
mempunyai kebebasan untuk memberikan jawabannya tnenurut pola
kognitifnya sendiri, dan juga Ia mempunyai kebebasan mengekspresikan
dalam gayanya sendiri. Karena bentuk jawaban yang dituntut butir soal jenis
uraian terbatas sebaiknya digunakan untuk mengukur hasil belajar tingkat
pemahaman, aplikasi, dan analisis.
Tes uraian dapat pula diklasifikasi dalam ~tegori yang lain seperti yang
dilakukan oleh W. S. Monroe dan R. E. Carter (1923) yang membedakan 20
jenis butir soal tes uraian, yaitu butir soal yang:
9) Menganalisis.
Misalnya: Dalam setiap perundingan antara Republik Indonesia dengan
Belanda pada masa perjuangan mempertahankan
kemerdekaan Indonesia, Belanda selalu mengusulkan agar
Indonesia berbentuk negara serikat. Alasan-alasan politis
apakah yang mendasari usul Belanda tersebut?
46
10) Menyatakan hcibungan.
Misalnya: Apakah sebabnya rumah harus mempunyai ventilasi yang
c_ukup?
47
17) Membuat garis besat.
Misalnya: Tulislah secara garis besamya cara untuk menghitung harga
satuan suhu dari skala Celsius ke skala Fahrenheit.
Ada beberapa ragam tes uraian terbatas, antara lain ragam tes
melengkapi dan ragam tes jawaban singkat.
48
1) Butir Soai.Tipe Jawaban M•lengkapi
Yang. dimaksud dengan butir soal melengkapi adalah butir soal yang
meminta atau rnemerintah peserta .• untuk metengkapi suatu. kalirnat dengan·
satu.frasa, satu angka atau satu formula;
a) Kekuatan da.n·Keter:batasan
49
b) Beberapa petunjuk penulisan.butir soal tipejawaban melengkapi
Untuk memperoleh butir soal tipe jawaban melengkapi yang baik, maka
beberapa petunjuk berikut ini diharapkan akan membantu:
(1) .Konstruksilah butir soal.yang mengukur hasil belajar yang penting saja.
HasH belajar yang remeh (trivial) tidak perlu diujikan. Misalnya:
Lemah Jumlah bayi yang meninggal sebelum mencapai usia enam
tahun di kecamatan ini tahun lalu adalah ...
Lebih baik: Di Kecamatan ini jumlah bayi yang meninggal sebelum
mencapai usia lima tahun dalam dua tahun terakhir adalah
... untuk setiap seribu penduduk.
(4) Konstruksilah butir soal dengan menggunakan bahasa yang jelas, dan
tidak mengandung arti yang mendua. Misalnya:
Lemah Ibukota Kuwait yang diduduki Irak adalah ...
Lebih baik : Ibukota Kuwait adalah ...
'
(5) Bila yang ditanyakan menyangkut angka atau jumlah dari satu
tertentu, maka sebaiknya nyatakan satuan tersebut dalam soal. Misalnya:
50
,Lemah : Seorang anak umur 12 tahun sebaiknya setiap hari minum
susu ...
Lebih baik : Seorang anak umur 12 tahun sebaiknya setiap hari
minum susu mumi ... gelas.
(6} Setiap butir soal sebaiknya hanya berisi satu jawaban yang harus
dikeljakan oleh peseri:a tes. Misalnya:
Lemah Suatu propinsi dibagi menjadi beberapa ... , yang
·selanjutn.ya dibagi lagi ·menjadi ·beberapa ... , dan kemudian
dibagi lagi menjadi beberapa .,., dan akhimya unit terkecil
disebut ....
Lebih baik: Propinsi Jawa Barat dibagi menjadi ... kabupaten dan kota
madya.
Yang dimaksud dengan tipe butir soal jawaban singkat iaiah butir soal
berbentuk pertanyaan yang dapat dijawab dengan satu kata, satu frasa, satu
angka atau satu formula.
Butir soal tipe jawaban singkat ini termasuk salah satu tipe yang paling
mudah dikonstruksi. Hal ini terutama disebabkan oleh butir soal ini hanya
akan mengukur hasil belajar yang sederhana, yaitu yang bersifat ingatan.
Hanya baik digunakan untuk mengukur kemampuan pemecahan masalah
untuk bidang Matematika dan Ilmu Pengetahuan Alam (IPA). Kekuatah
lainnya butir soal tipe ini ialah mengharuskan peseri:a tes menulis
jawabannya, bukan memilih jawaban yang telah tersedia. Dengan demikian
maka akan dapat meminimaikan kemungkinan menebak.
e-· Ada:~ua·ket~rbatasan utama-_butir soal tipe jawaban singkat. ~rii, yaitu
idak dapat mengukur_ basil beh1jar yang kompleks dan sulit dinilai. Karen_a
;ifatnya yang sed~rbana,_.· maka butir. sqal.·tipe ini bal1ya mengh;asilkan
:espons singkat yang sederbana.. Respons singkat ·yang seperti itu tidak ~ .
nerhungkinkan untok mengukur basil helajar .yang lebib kompleks.
!S~panyakan hanya terpatas pada haslL helajar yarig bersifat ,ingatan, •dan
paling tinggi banya bersifat pemahamari. Untuk rtiatematika atau IPA ·masib
r:nungkin untuk . rn.engukuJ;-_,kemampuan pen~rapim . (aplikasi). Di atas
ke.m~puan-·.itu suda,b -JiclalqnUl)g@n la,gi diukur _dengan butir soal tipe ini.
1;3er~enaan dengan kesederhanaannya itu inakil acapkali menimbulkan
keterbatasan kedua, yaitu sulit-dinilai. Hanya butit'. ~oal yang dikonstruksi
se.;~ra.hati:qati yang tidakc~~nim~l!llmn masalah ini..Misalnya:
.. ' - .
Berapakab jumlab propinsi di Indonesia?
52
b) Klasifikasi butir soal jawaban singkat
Secara umum ada dua variasi butir soal tipejawaban singkat, yaitu:
yang menggunakan bentuk pertc:myaan, dan (2} yang menggunakan bentuk
asosiasi.. Contoh yang menggunakan bentuk pertanyaan adalah:
Irian Jaya
Aceh
TimorTimur
Bengkuiu
Berikut ini beberapa petunjuk untuk menulis butit soal jawaban singkat,
yang disertai contoh sederhana.
(1) Pergunakanlah kata-kata yang menuntut jawaban yang singkat dan
tertentu. Jawaban itu haruslah satu kata, satu. frasa, sebuah angka, atau
sebuah simbol. Misalnya:
Lemah Disebut apakah binatang pemakan binatang lain dan
tumbuh-tumbuhan?
Lebih baik : Termasuk klasifikasi apakah binatang pemakan binatang
lain dan tumbuh-tumbuhan?
(2) Jangan menggunakan kalimat yang langsung diambil dari buku atau dari
catatan. Penggunaan kalimat yang langsung diambil dari buku atau
catatan cenderung mendorong peserta didik akan menghafal mati, tanpa
berusaha memahami apa yang dipelajarinya. Untuk menghindari
kelemahan itu maka sebaiknya bahan ajaran yang diambil. dari buku
tersebut disusun kembali dalam kalimat yang mudah dipahami oleh
mahasiswa.
54
(6) ·sebaiknya hanyasatu jawaban.untuk satu pertanyaan. Misalnya:
Lemah . Siapakah pro)damator kemerdekaan
· Indonesia?
Lebih baik : Siapakah . · yang .· membacakan teks Proklamasi
Kemerdekaan Indonesia tanggaLl7 Agustus 1945? ·
.Ada beberapa pri)lSip penulisan. butir l;Oal· tes. uraian~ ·Prinsip ini bersifat
umum dan. masih harus diuraikan menjadi prinsip yarig operasional oleh
setiap. mahasiswa yang sedarig belajar tes dan· evaluasi· pendidikan. Prinsip
itv antara lain adalah: .. . ··. . . ·
a. prinsip 1: Gunakanlah ·. tipe tes uraian tintUk mengukur basil belajar
. yang cocok. Hubungkanlah prinsip ini dengan kekuatan tes
uraian yang· telah dikemuRakan di atas. ··
b. prinsip2: Beritahulah sebelumnya bahwadalamtes·yang akan datang
akan digunakan tipe tes uraian. Hal ini perlu dilakukan agar
peserta tes lebih. siap dan .agar tes yang dilaksanakan itu .
cukup adil.
c.. prinsip 3: Batasilah ruang lingkup tes secara· pasti, dengan demikian
peserta testahu dengaripasti bahan yang harus dipelajarinya.
Hendaknya peserta tes juga diberi tahu terlebih dahulu
apakah bahan akan diambil dari buku ajar, atau juga meliputi
catatan pelajaran, hasil diskusi kelas; bacaan tambahan, atau
pengetahuan umutn dari sumber yang tidak terbatas.
d. prinsip 4: ·Pertanyaan hendaknya terutama untuk mengukur tujuan
hasil belajar yang .penting saja. Hal ini sangat perlu'
diperhatikan, karena jUmlah butir soal dalam tes ura~an
sangat terbatas. Jadi pergunakanlah setiap butir soal secara
optimal untuk rhengukur hasil belajar yang penting. dan tidak
mungkin diukur dengan tipe soallain.
e. prinsip 5: .Jangan terlalu hanyak m.enggunakan butir soal tipe uraian
untuk m.engukur kemampuan mengingat. Tipe soal objektif
jauh k~bih. efektif dan efisien hila digunakan untuk mengukur
kemampuan mengingat fakta~ ' .
f. prinsip 6: kem.ampuan dan ket~mpilan menulis peserta tes haruslah·
menjadi pertimbangan utama dalam konstruksi butir soal
uraian.
g. prinsip 7: . Jangari memberikan butir soal yang dapat dipilih a tau. dapat
tidak diketjakan. Misalnya, janganlah membuat pehmjuk
soal sebagili berikut: Pilihlah dua cfari tiga soal di bawah ini.
Hal ini ~kan sangat menyukarkcm pemeriksa dan memberi
skor yarig adiL · ·
.h. prinsip 8: Setiap soal harus jelas apakah jenis ·terbatas ·. atau jenis
bebas. Dengan demikian _peserfa tes dapat membatasi diri
dalam memberikan responsnya.
i. prinsip 9: Makin banyak jumlah butir soal untuk setiap perangkat soal
makin baik..Jadi.·usahakan agar setiap tes menyajikan butir
soal uraian sebanyak~banyaknya sesuai dengan waktu yang
tersedia.. · · '/
j. prinsip 10: Ti.tlislah petunjuk awal yang jelas, dan juga petunjuk untuk
., setiap butir. soal haru.s rinci dan dapat dipanami oleh peserta
tes dengan jelps. Dalam menulis petunjuk ini harus
menggunakan struktur. kalimat yang sederhana. Tidak boleh
ada dua .. tafsiran untuk setiap kalimat petunjuk yang
digunakan.
k. prinsip 11: Waktu yi:mg tersediA haruslah diperkirakan cukup (tidak
kurang dan tidak lebih) untuk rata-rata kematnpuan peserta
tes. ·Jadi dapat diperkirakan waktu yang tersedia akan
berlebihan bagl mahasiswa yang pandai dan akan
kekurangan bagi mahasiswa yang kurang pandat
l. .prinsip 12: Hendaknya pertanyaan menuntut respon atau jawaban yang
bersifat baru atau pemikiran peserta tes. Jadi jangan hanya
56
.. .
Butir soal bentuk objektif cara memeriksanya mudah, cepat dan basil
penilaiannya objektif. Butir soal bentuk uraian memeriksanya sulit dan lama
karena jawabannya bervariasi, hasil penilaiannya ·cenderung subjektif. Pada
bagian ini akan diuraikan cara-cara penilaian yaQg bertujuan untuk
mengurangi subjektivitas dan menlngkatkan objektivitas. Untuk'
mendapatkan penilaian yang lebih objektif perlu diperhatikan:
a. Apakah jawaban yang paling baik l,lntuk satu butir pertanyaan uraiari?
b, Butir..butir apa saja yang.. hams terdapat dalam · jawaban pertanyaan
uraian?
57
c. Apakah ada butir yang lebih penting di antara butir-butir jawaban yang
. diharapkan?
58
.· Oi bawah ini dicantumkan· salah. · satu · contoh butir soar, teritang
menuliskan .TIK, ·dUengkapi. dengan pedoman skqrtng semi satu lembar .
jawaban salah 'seorang peserta tijian. ·
Butirsoal:
Di baw~h ini dicaritumkan satu TIK yang berbunyi>:
"Anak didik dapat menunjti~Monumen Lubangbuaya".
Bagaitnana pendapat Anda 'tentang TIK tersebut dllihat dari persyaratan
rumusan TIK seperti, sasaran1 perubahcm ting}{ah)akU; ,tirtgkatan ·
perubahan tingkah lak:u,. relevansi dan kondist Tuliskari·l'llmus~ TIK ·
sesuai dengan.komentarAnda. . · ·
; _...,...___ ··~ - -·-
-- ·~
·Skor
· · Sasaran: -belum dituliskan dEmgan teoat c 1
Perubahan tingl<ah; laku: sl1datt operasioflal atau ttapat diukur dan hanva .s8tu 1
· · perub@han pngkah laku. . 1
. Tingl<atan perub'ahan til'lgkali laku: belumada .· · 1
·Relevansi : tidak ditulis 1
Kondisi : tidak ditulis 1
'\-. '1·
""\t:.,... -
Seharusnya TIK berbunyi:
~nak didik kelas W SO, di JSkarta. jika dihadapkan pada satu gambar foetal,
.,,, (1) ' ' (2) ' (3)
ia dapat menunjukkan dengan tepat ietak Monumen lubangbuaya.
(4) (5) ' (6)
masing-masing (1 ); {2), (3), (4); (5), dan (6) diberi skor Y:z.
Dengan demikian skor maksimurn TIK 3
Maksimum skor 9
Catatan: Tidak selalu penulis soal mengharapkan semua kata kunc~ di atas
harus dicanfumkan· peserta ujian: :Adcf pehulis yang menganggap. jawaban
sudah betul sekiranya peserta dapatniencantumkan 8 dari 9 atau 7 dari 9
bahkan ada Y,Rng hanya_ 6 dari 9 kata kunci.
f'-'!J~I'\It: ..
~ -("',,~.\~ ~ \~ttil"~~
\h\ ( ..\t
D~ngan menggunakan Pedoman Skoring di atas, cobalah periksa
jawaban peserta ujian di-bawah int
"Jawaban"
Apakah skomya 5,5? Jika ya, berarti pedoman sudah digunakan dengan
tepat, jika tidak, perlu diteliti kembali di mana kelirunya.
60
c. Penu1isan ·Butir Soal Objektif
1. Pengerihm
Yang dimaksud dengan butir soal objektif dalam tulisan ini adalah butir
soal yang telah mengandung kemungkinan jawaban yang harus dipilih a tau
dikerjakan oleh peserta tes. Jadi kemungkinan jawaban telah dipasok oieh
pengkonstruksi butir soal. Peserta hanya harus memilih jawaban dari
kemungkinan jawaban yang telah disediakan. Dengan demikian
pemeriksaan atau penskoran jawaban peserta tes sepenuhnya dapat
dilakukan secara objektif oleh pemeriksa. Karena sifatnya yang objektif itu
maka tidak selalu penskoran harus dilakukan oleh manusia. Pekerjaan
tersebut dapat dilakukan oleh mes!n, misalnya mesin scanner. Jadi yang
dimaksud dengan tes objektif ialah tes yang dapat diskor secara objektif.
Secara umum ada tiga tipe tes objektif, yaitu:
a. benar salah (true false)
b. menjodohkan (matching)
c. pilihan ganda (multiple choice)
Kelima ragam tes objektif pilihan ganda ini sama struktur (formatnya)
yaitu ada pokok soal (stem) yang diikuti oleh sejumlah pilihan (options). Di
antara pilihan ini ada satu jawaban yang benar atau paling tepat (key).
Pilihan di luar yang benar atau yang paling tepatberfungsi sebagai pengecoh
(distractors).
Butir s.oal tipe benar-salah (True-false item) adalah butir soal yang terdiri
dari pemyataan, yang disertai dengan altematif jawaban yaitu menyatakan
pemyataan tersebut benar.atau salah, ataukeharusan memilih satu dari dua
alternatifjawe).ban lainnya. Altematif jawaban itu dapat saja berbentuk benar-
salah atau setuju tidak setuju, baik tidak baik, a tau cara lain. asalkan altematif
itu mutual eksklusif;'
62
c) Mudah *'qiskor; Karena ·. hanya ·ada dua altematif jawaban, in aka: setiap
butir ,soal hanya mempunyai dua altematif skor, yaifu 1 (safufuntuk
yang mengerjakannya. SE!cara benar, ,dan 0 (not) bagi ·yang menjawab
· salah. Dengim demikian. penskorc:m sangat mudah, dim dapat dilakukan
oleh siapa saja, bahkan'dapat dikerjakanoleh me~in. ..· . .
d) Alat yang baik untuk mengukur fakla dan hasil belajar langsung terutama
.yang berkenai:m .dengan ihgatan. Butii soal npe Eeriar~satah' ·mengukur
kemampuan · dasar · hasil belajar, . ya1tu dapat membedakari antara
. kenyataan darl yang bukari kenyataan atau darl suatU yang ·benar darl
'yang salah. Tentu saja kebaikan itll tidak ferlalu· tepat hila yang ingi:n .
. diukur.ketnampuan membedakan secara·tebih teliti. · .
63
yang bersifatingatan itu, yaitu dapat membedak.ari peserta tes y~ng tahu
danpeserta tes yang tidak tah.u: TetapLkarena kelemahan yang pertama
tadi, yaitu .m~ndorong kepada penebakan, maka kelemahan kedua: ini
m~n menohjol. . . . . .
c)· MeiTlinta respon peserta tes yang .berbentuk · penilaian . absolut: ·
Sedangkan .· dalam kenyataan~ya hasilbelajar· itu kebanyakan bukan lah
-sesuatu:kebenaran absolut tanpa:· kondisi, misalnya: · .
·1. · B- S 113 == 0,3 ...
2.. B- S . .Matahari terbit kemarin
3: B - S IJ1dcmesi~ terdirl dari 27 propinsi.
Ada lima persyaratan yang harus dipenuhi oleh setiap butir soal tipe
benar..,salah untuk dapatdikatakan seb(;lgai butir soal,yang baik, yaitu:
a) Setiap butir soal harus menguji ·atau m~ngukur hasil belajar peserta tes
yang penting dan bermakna; tidak menanyakan hal yang remeh (trivial}.
Misa1nya: .
Lemah B - S Bung Hatta dilahirkan di Bukittinggi
Lebih baik : B - S Pemikiran Bung Hatta tentang hak asasi .man usia
te1ah diabadikan dal(;lm pasal-pasal UUD 1945.
64
pendapat Bung. Haifa tent?lng hak asasi manusia mempunyai arti sejarah
y~ng amat pehting bagi BangsaJndonesia. '
Dalam butir soal yang pertama di ·atas jelas banya· menguji kemampuan
menghafal bunyi ·hukum Newton 1 (Hukum Kelernbaman), yang bila
·clapat dijawab oleh peserta tes dengan benar, penguji belurn mendapat ·..
kepastian bahwa mahasiswa. mengerti akan hukum kelembaman
tersebut. Tetapi dengan soal b~rikutnya penguji akan dapat memastikan
bahwa .mahasiswa tahu tentarig hukum · kelembaman dan dapat
memaham,inya dengan •baik.
65
Lebih baik : B - S Dalam masyarakat patriliriial pihak calon
pengantin pria diharapkan · lebih mengambil
inisiatifdari pada pihak eaton pengant_in wanita.
Dalam soal yang pertama kurtci yang diharapkan adalah B. Tetapi kunii .
tersebut ·tidak berlaku hagi ·. masyarakar matrilinial. Karena itu haruslah
secara eksplisit dinyatakan dalam butir soal tentang . kondisi . yang
menentukan kunci })utir soal tersebut.
d) Butif ·so.al yang baik harusl~h jelas jawabannya bagi seorang .peserta tes
· yang belajar, dan jawaba11 yang $alah kelihatan lebih seakan-akan benar
bagi peserta tes yang tidak belajar dengan haik. Jadi butir soal tersebut
·. dapat secara jelas membedakan orang yang belajar dari orang:yang tidak
belajar. Misalnya: · .· . .· _ ...
B -S Makanan kaleng. lebih mahal harganya dari pada makanan
segar .. (S)
B- S. Bahasa ilmiah yang digunakan di pesantren dLJawa .Sarat
pada· awal abad .ke 20 adalah bahasa Arab .dan bahasa Jawa .
.(B) ..
Bagi peserta tes yang. tidak pemah belajar tentang prinsip ekonomi tentu
akan menyangka bahwa makanan kaleng akan lebih mahal dari
makanan segar, karena harga kemasan itu sendiri telah menyebabkan
harga bahan makanan ·tersebut menjadi lebih tinggi. Sedangkan. karena
jumlah permintaan akan rriakanan segar jauh lebih .. banyak daii
permintaan makanan kaleng, . menyebabkan . harga makanan segar
menjadi lebih mahal. Demikian pula halnya dengan bahasa ilmiah di
.pesantren di Jawa Barat. Bagi orang yang tidak tabu sejarah pendidikan
dengan baik akan menyangka bahwa bahasa Sunda lah yang digunakan
dalam buku-buku pelajaran utama di pesantren di daerah Sunda. Jadi
jawaban itu akan menarik bagi orang yang tidak belajar.
66
e) Pemyataan dalam butir soal harus dinyatakan secara jelas dan
mEmggunakan bahasa yang baik dan benar. Soal yang jelas itu hila
dalam soal tersebut hanya mempersoal~n satu gagasan saja. Selain itu
. pemyataan satu gagasan itu haruslah disusun dalam tata kalimat yang
.baik dan beriar dan tida:k mengandung p~hg~rtian mendua; K.arena· tidak
boleh mehgandung pengertian mendua itu maka butir soal itu harus
dinyatakan .dalam: kalimat .yang .$E$ingkal · mungkin. Jangan
mengguhakan kalimat berana:k yang tidak jelas. · Untuk dapat
menyatakcm · butir · soal ihi · secara·· jelas maka sebaiknya · ·tida:k
.. menggunakan kata"'kata ·negatif yang. mengaburkarianti..•Misalnya~
Leman : B ~ S Kekalahati Jermah terhadap Sekutu dalam Perang
. . Dunia II•· bukan disebabkart oleh ·ketidak Jt}ampuan
Jerrhan . dalam . strategi .r~emenangkan
pertempuran tetapi lebih disebabkan ,, oleh
kelemahan sei'J'la~gat perang rakyat Jerman.
·. Lebih baik : B- S Hilangnya semangat perang rakyat Jerman adalah
penyebab utama kekalahart Jennan .terhadap
sekutu dalam Perang Dunia II .
68
Misalnya:
B -S Bila ·dib.ulatkan ke dua angka di belakang koma, Pi berriilai
sama dEmgan 3;41.
B- S ~·· . Bila air dipanaskan dari 15° C menjadi 50° C maka volumenya
·. · . akan tetap.
Dalam tipe modifikasi seperti ini setiap soal bagian haruslah dihitung
sebagai satu butir soal.
69
b. Butir soal tipe ·menjodohkan
Butir soal/ tipe menjodohkan di tulis dalam dua kolom. Kolom pertama
adalah pokok soal a tau stem atau biasa juga disebut premis. Kolom kedua
adalah kolom jawaban. Tugas peserta ujian ialah menjodohkan pemyataan-
pemyataan di bawah kolom premis dengan pemyataan-pemyataan yang
ada di bawah kolom jawaban.
Bila tes harus dikerjakan di lembaran jawaban yang terpisah, maka
pemyataan .di bawah koloJTI pertama ditulis 1.1rutan nom or, dimulai dengan
nomor urut setelah nomor urut soal sebelumnya. Dengan demikian setiap
nomor pemyataan dibawah kolom. pertama adalah sebuah stem butir soal
yang alternatif jawabannya secara bersama terdapat di bawah kolom kedua,
Misalnya:
70
b) Dapat menguji kemampuan menghubungkan dua baik yang
berhubungan langsung maupun tidak secara langsung.
c) Mudah dikonstruksi sehingga dosen dalam waktu yang
dapat mengkonstruksi sejumlah butir soal yang cukup unh1k menguji satu
pokok bahasan tertentu.
d) Dapat meliputi seluruh bidang studi yang diuji. Dengan demikian
perangkat soal yang menggunakan tipe butir soal ini lebih merata dan
keseluruhan pokok bahasan dan subpokok bahasan dapat terwakili
secara memadai.
e) Mudah diskor. Seperti semua butir soal objektif, butir soal tipe
menjodo~kan inipun dapat diskor tanpa terikut serta nilai dan pendapat
pemeriksa.
Lemah
Kolom pertama Kolomkedua
1. Ir. Soekamo A. Pemerataan hasil pembangunan.
2. Pertanian B. Makhluk laut yang melahirkan.
3. Persainganbebas C. Proklamator kemerdekaan.
4~ Ikan paus D. Demokrasi liberal.
E. Prioritas pembangunan.
Lebih baik:
Kolom pertama Kolom kedua
1. Soekamo A. Bapak Koperasi Indonesia
2. Suharto B. Bapak Paiang Merah
3. Moh. Hatta C. Bapak Pramuka Indonesia
4. Sultan Hamengku- D. Bapak Pembangunan
buwono E. Bapak Revolusi Indonesia
Tipe butir soal ini adalah yang paling populer dalam kelompok butir soal
objektif. Tipe butir soal ini dalam bahasa Inggris dikenal dengan nama
multiple choice item (butir soal pilihan majemuk atau ganda). Yang
dimaksud dengan tipe butir soal pilihan ganda ialah suatu butir
jawabannya dari umumnya
jawaban berkisar antara 4 (empat) atau 5 Tentu jumlah altematif
tersebut tidak boleh terlalu banyak. Bila aitematif itu lebih dari lima maka
akan sangat membingungkan peserta tes, juga akan sangat
menyukarkan pengkonstruksi butir
Sebutir soal tipe pilihan ganda terdiri dari dua bagian, yaitu (1)
pemyataan a tau disebut juga stem, dan· (2) altematif jawaban a tau disebut
juga option. Stem mungkin dalam bentuk pemyataan atau dapat juga
. 72
berupa pertanyaan. Bila dalam bentuk pertanyaan, merupakan pertanyaan
yang lengkap atau pemyataan yang tidak lengkap. Misalnya:
a. Danau Ranau -
b. Danau Maninjau
2 c. Danau Singkarak
*d. Danau Toba
e. Danau Laut tawar
Bagian pertama dari soal di atas disebut stem (pokok soal) dan bagian
kedua dinamakan option (pilihan). Dari contoh ini jelaslah bahwa stem
dapat terdiri dari pemyataan dan pertanyaan. Sedangkan option terdiri dari
beberapa pilihan, dan salah satu. dari altematif pilihan itu adalah. jawaban
yang benar terhadap pertanyaan (dalam hal ini yang ditandai dengan asterik
(*). Jawaban tersebut dinamakan kunci ja"Yaban. Jadi dalam option ada
pilihan yang bukan kunci. Altematif jawaban yang bukan dinamakan
pengecoh atau distractors atau foils.
a) Butir soal tipe pilihan ganda dapat dikonstruksi dan digunakan untuk
mengukur segala level tujuan instruksional, mulai dari yang paling
sederhana sampai dengan yang paling kompleks, kecuali tujuan yang'
berupa kemampuan mendemonstrasikan keterampilan menyatakan
sesuatu yang ekspresif. Misal tujuan yang ingin diukur adalah
memperlihatkan keindahan tulisan, kemampuan membuat gambar, atau
kemampuan mendemonstrasikan keseimbangan.tubuh. Hal-hal tersebut
73
' / .
tidak ·akan. dapf:it ·diukur. dengan butir soal objektif. manapun, termasuk
butir soal tipe .pilihan. g~nda:
b) Karena karakteristik dari butir 5oal pilihan ganda hanya menuntut waktu ·
.kerja · peserta tes sangaf minimal, maka setiap · petangkat tes yang
mengguhakan, butir · soal pllihan . ganda sebagai ·. alat ukur dapat
menggunakan jumlah butir soal yang refatif banyak -dan karena litu maka
pen~rikan sampel pokok baha$ln yang akan diujiki:m dapat lebih luas.
Jadi. setiap perangkat .tes dapat mencakup hampir seluruh cakupan
biaang studL · ·
c) Penskoran ha5il kerja peserta dapat dikerjakan secara objektif. Dengan
demikian maka tidak. ada unsur subyektivitas pemeriksa.·masuk kedalam
skor' hasil Ujian. · Bahkari karena sifatnya maka penskoran dapat
dilakukan oleh mesin. Karena itu pula maka dapaf dikerjakan dalam
· waktu yang sangat singkat. Bagi dos~n yang harus mengajarkan·.banyak
,.mata . pelajaran· dan memegang ·banyak· kelas ·dan mahasiswa dalam
waktu yang bersamaan akan dapat dibantu oleh penggunaan- tipe butir
soal ini dalam tes, tampa mengorbankan mutu ·alat ukur dan obyektivitas
hasil ujian. )
d} Tipe ,butir soal dapat. aikonstruksi sehingga menuntut kemampuan
peserta tes untuk _mernbedakan berbagai tingkatan ·kebenaran •sekaligus.
Misalnya dapaL dikonstruksi suatu butir soal dengan· option yang
seluruhnya benar, tetapi da)am tingkatan kebenaran yang berbeda.
Peserta tes diminta untuk menyatakan butir jawaban yang paling benar
diantara semua jawaban yang benar tersebut. Hal ini merupakan
keunggulan yang sukar diperoleh dari butir soal tipe lain.
e) Jumlah option yang dapat disediakan melebihi dua. Karena itu akan
dapat mengurangi keinginan peserta tes untuk menebak.
Biasanya keinginan menebak menjadi lebih besar bila probabilitas untuk
benar makin besar, Jadi bi~a option lebih dari dua, maka ·probabilitas
untuk benar tebakannya akan kurang dari 50%. Tentu hal ini tidak
berlaku bagi p~serta tes yang memang ingin menebak.
74
f) Tipe butir soal pilihan ganda memungkinkan dilakukan analisis butir soal
secara baik. Butir soal dapat dikonstruksi dengan dilakukan uji coba
terlebih dahulu. Bila dalam uji coba soa! tersebut temyata
mengandung kelemahan (setelah dianaHsis). maka dapat dilakukan
perbaikan, karena dari hasH analisis dapat dideteksi kelemahan butir soal
tersebut. Hal ini tidak mungkin dHakukan secara empirik pada tipe butir
soal yang lain.
g) Tingkat kesukaran butir soal dapat dikendali, dengan hanya mengubah
tingkat homogenitas altematif jawabcm. Makin · homogen altematif
jawaban, maka makin tinggi tingkat kesukarannya, dan sebaliknyamakin
kurang homogenitas altematif jawaban, maka ~makin rendah tingkat
kesukaran butir soal.
h) lnformasi yang diberikan lebih kaya. Butir soal ini dapat memberikan
informasi tentang peserta tes Jebih banyak kepada dosen, terutama hila
butir soal itu memiliki homogenitas yang tinggi. Setiap pilihan peserta tes
terhadap alterriatif jawaban merupakan suatu informsi tersendiri ten tang
pengy.asaan kognitif peserta tes dalam bidang yang dites. Dengan
demikian maka bentuk soal ini baik digunakan untuk mengukur daya
serap mahasiswa, dan mendiagnqsa kelemahan mahasiswa.
Selain kekuatan tipe butir soal pilihan ganda yang telah dikemukakan
atas, tentu saja tipe butir soal-ini tidak terlepas dari kelemahan-kelemahan.
Kelemahan itu banyak juga yang merupakan kelemahan semua bentuk butir
soal objektif. Misalnya, dengan butir soal seperti ini tidak terhindari dari
besamya dorongan untuk mempersoalkan hal-hal yang bersifat remeh '
(trivial). Pertanyaan atau pemyataan yang dibuat acapkali mengandung
pengertian mendua, sehingga akan sangat menyukarkan bagi mahasiswa
yang belajar dengan baik. Karena itu banyak sekali kritik orang terhadap
butir soal objektif. Krltik itu terutama datang dari orang yang telah kawakan
75
dengan masalah pengukuran hasil belajar: Karena itu pula banyak kritik itu
yang tidak didasarkan pada kenyataan empirik dan sikap yang terlalu
memuja butir soal esei tanpa mengetahuikelemahan utama bentuk·butir soal
yang demikian itu.
Keterbatasan pokok butir soal tipe pilihan ganda antara lain:
a) Sukar dikonstruksi. Kesukaran dalam mengkonstruksi butir soal tipe ini
terutama untuk rnenemukan altematifjawaban yang homogen. Acapkali
dosen ·mengkonstruksi butir soal dengan hanya satu alterriatif jawaban
yang tersedia, yaitu kund · jawaban. Altematif lainnya dicari dan
ditemukan secara tergesa-gesa, sehingga jawaban tidak hornogen. Butir
soal yc:mg seperti fni tidak terlalu bemilai untuk mengukur kemampuan
peserta tes.
76
Bilabutir soal itu mempt,tnyai dua option {B~S), maka tingkat penerkaannya
0.50. Bila butir soal itu mempunyai tiga option, maka tingkat penerkanhya
adalah 0.33, untuk butir soal dengan empat option tingkat penerkaannya
~adalah 0.25. Dan butir soal yang mempunyai 5 optiontingkat penerkaannya
adalah 0.20. Prinsipnya ialah makin kecil tingkat penebakan, makin baik
butir soal tersebut. Tetapi butir soal yang~ terlalu banyak optionnya juga
bukan merupakan butir soal yang baik konstruksinya. Karena itu ada
semacam kesepakatan diantara para penulis buku tes dan pengukuran
bahwa jumlah option yang baik adalah berkisar antara empat atau lima saja.
· Tentu saja tidak hanya jumlah option yang menentukan baik buruknya
butir soal. Yang lebih penting ialah option tersebut disusun menurut kaidah-
kaidah yang benar.
Mutu butir so.al tlpe pilihan ganda sangat tergantung kepada kemampuan
orang yang mengkonstruksi butir soal tipe ini. Butir soal yang dibuat secara
serampangan a tau dibuat oleh orang yang tidak ferlatih akan berbahaya bagi
proses pendidikan secara keseluruhan karena akan mengarah kepada
interpretasi yang salah kepada kemampuan atau hasil beiajar peserta tes.
Jadi pelatihan dan· pengetahuan tentang prinsip penyusunan butir soal tipe
ini akan sangat menentukan hasil pengukuran hasil belajar. Dalam tes bentuk
pilihan ganda, selain pokok soal yang harus jelas rurnusnya dan tidak
rnerupakan pernyataan yang dapat ditafsirkan berrnacam-macarn sehingga
meragukan artinya, a tau tidak jelas maksudnya, rumusan pilihan yang benar
dan pengecohnya harus dibuat hampir sama. PenuHs soal selalu bertanya
pada dirinya. Apakah yang ingin ditanyakan telah dituliskan
(dikomunikasikan) dengan baik. Apakah terdapat "petunjuk" pada altematif
jawaban yang benar.
Berikut ini dikemukakan beberapa prinsip pokok dalam konstruksi butir
soal tipe pilihan ganda.
Saripgti perrnasalahan .· haru.s ditempatkan pada pokok so9l. (stem). Inti
permasalaha~ .. d~la~ butlr soal tersebut harus · dicanfumkan · dalam
rumusan pokok soal, sehingga dengan membaca pokok soal, mahasiswa
sudah dapat menentukan jawaban sebelum dilanjutkan membaca pilihan
jawaban. Persyaratan ini tldak bedaku bagi pengembangan butir · soal
kesl:ls~steraan. ·
Contoh:
Yang kurang baik.
PulauJawa adalah pulau yang ....
A. menghasilkan banyak minyak
B. penduduknya. terpadat
C. dijadikan objek wisata
D. mendapat julukan pulau Perea
Contoh:
Yang lebih ·baik.
Pulau yang· terpadat penduduknya di Indonesia adalah pulau ....
A Sumatera
B. Jawa
C. Kalimantan
D. Sulawesi
Contoh yang kedua lebih baik dari contoh yang pertama karena
membaca pokok soal mahasiswa sudah dapat membuat jawaban
sebelum membaca pilihan A, B, C dan D.
78
Contoh:
Yang kurang baik
Penulisan contoh 2 diubah menjadi:
Pulau yang terpadat penduduknya di Indonesia .adalah ....
A. Pl.,l.l~u Sumatera
· B. pulau Jawa
C. pulau Kalimantan
D. pulau Sulawesi .
Contoh:
Yang kurang baik.
Kalau butir soal 2 ditambah rumusarmya menjadi:
Pulau yang terpadat penduduknya di Indonesia
rr1eningkatkai1 p~()ciUksi pan~Cir1 adalah pulau ....
·K·su-mafeia· ·· · · ·· ·· · ··· · ·
B. Jawa
C. Kalimantan
D. Sulawesi.
79
Contoh:
yang kurang bails
Menurut De Bakey, .... adalah penyebab penyakit R_enyempitan
pembo.luh darah: ---~"·-.
·A cholesterol
B. kelebiha}:l berat
C. merokok
D. tekanari batin
.Contoh: ·.
·xang lebihh!=),ik
~-- Menurut De Bakey, penyakit penyempitan pembuluh. darah. disebabkan
oleh ....
A:' ,cholesterol
S. kelebihan berat .
·c. merokok
D. tekanan batill ·
6. Hindari penggunaan kata-kata teknis atau ilmiah atau istilah yang an~h
atau mentereng. Perlu diingat ~ahwa tes yang dikembangkan bertujuan
untuk mengukur materi pelajaran, kalau materi tersebut tidak
menyangkut perbendaharaan, janganlah mengguna~f! istilah teknik
atau aneh. -~-- ----~-- · .
Contoh:
Yang kurang balk
Apakah kritik utama ahli psikolog~ terhadap
A Tes menimbulkan ~~~.
R Tes selalu disertai cultural bias.
C. Tes hanya mengukur hal-hal yang trivial.
D. Tes tergantung pada kemampuan kognitif guru.
Contoh:
Yang lebih baik
Apakah kritik utama ahll psikologi terhadap tes?
A Tes menimbulkan rasa cemas.
B. Tes sangat tergantung p;;danil~i budayatertentu.
C. Tes mengukur hasilbelajar yang tidak penting.
D. Tes sangat ditentukan oleh pengetahuanguru.
Contoh:
Yang kurang baik
Siapakah di antara nama-nama di bawah ini yang menemukan telepon?
A. Bell
B. Marconi
·c. Morse
D. Pasteur
Yang lebih baik · . · · ·· · ·. · , · .
Siapakah di antara nama-nama di bawah ini yimg menemukan telepon?
.A. -Bell
B. Marconi
C. Morse
D. Edison
8. Hindari keadaandimana Jpwaban V<:Jng benar selal..,·difulis•lebih.panjang
dari jawaban yang salah; Ada kecenderungan mahasiswa · memilih
jawaban yang lebihpanjang dan yang lebjhterincl sebagai jawaban yang
benck ·Oleh karen.a. dtu penulis soal bel\$aha .agar pengecoh · dan
]awaban yang benar qitulis sama panjang dengan rincian yang sama
pula. -
Contoh:.•
.• Yang kurang .baik
Agar air .panas- ·dalam teko tidak ·cepat dingin. -maka teko tersebut
dibungkus deng!'n ··· ·
.A,. kain · v~
B. seng v
C. tembaga ,/
D. timah ,./
Pilihan B, C, dan D termasuk logam, A bukan logam.
Oalam contoh ini A jawaban yang benar, ada petunjuk bahwa A lain dari
3 pilihan berikutnya.
82
Contoh: .
Yang lebih baik
Air panas ~kan bertahan panas jika disimpan dalam bejana yang terbuat
dari ....
A. alumunil.lm
B. keramik
c. plastik
D. seng
11. Gunakqn tiga atau lebih alterncttifpilihan. Kalau hal1ya ada dua· pilihan,
bentuk ini sama dengan bentuk salah:.benar. Dua pilihari berarti
tebakannya tinggi sedangkan kalau lima pilihan faktor tebakan menurun
· yaitu 20 persen. Banyaknya··pilihan yang ·disediakah sangat ditentukan
oleh usia peserta tes dan juga tergantung pada sifat bahp.n yang
disajikan. . ·
12. Pokok soal diusahakan tidak menggunakan ungkapan ·atau kata- kata
yang bermakna tidak tentu, misalnya': kebanyakan, seringkali, kadang-
kadang dan sejenisnya.
Contoh:
Yang kurarig baik
Kebanyakan hewan hidupnya di dalam air, bemafas dengan ....
A. insang ·
83
B. kulit
C. paru-paru
D. insang dan paru-paru
Contoh:
Yang lebih baik
Berudu bemafas dengan ....
A. insang
B. kulit
C. paru-paru
D. insang dan paru-paru;
13. Pokok soal sedapat mungkin dalam pemyataan atau pertanyaan positif.
Jika terpaksa menggunakan pemyataan negatif maka kata negatif
tersebut digarisbawahi atau ditulis tebal.
Contoh:
Yang kurang baik.
Pada semua tumbuhan yang berhijau daun, fotosintesis tidak akan terjadi
tanpa ....
A. udara, tanah, dan air
B. cahaya, ·udara, dan tanah
C. air, cahaya, dan udara
D. tanah, cahaya
84
Semua contoh di atas berlaku pada tipe soal pil.ihan ganda.
Untuk lebih meningkatkan kemampuan butir soal tipe ini dalam
mengukur hasil belajar, maka digunakan beberapa ragam dari tipe pilihan
ganda.
Ragam tersebut adalah:
a. pilihan ganda biasa
b. pilihan ganda analisis.hubungan antar hal
c. pilihan ganda analisis kasus
d. pilihan ganda kompleks
e. pilihan ganda yang menggunakan diagram, gambar, grafik a tau tab~L
Berikut ini adalah uraian singkat tentang masing-masing butir tes di atas.
Butir soal Hubungan Antar Hal terdiri "dari dua pemyataan. Kedua
pemyataan ini dihubungkan oleh kata "SEBAB". Jadi ada dua kemungkinan
hubungan kedua pemyataan tersebut yaitu ada hubungan sebab akibat atau
tidak ada hubungan sebab akibat. Supaya kedua pemyataan ini termasuk
pilihan _ganda maka harus dicari variabel lain yang dapat mengukur
kemampuan mahasiswa. Variabel tersebut adalah kualitas pemyataan yaitu
apakah pemyataan pertama benar atau salah dan apakah pemyataan kedua
benar atau salah. Dengan adanya berbagai hal yang harus dinilai dari dua '
pemyataan tersebut maka dapatlah dikembangkan tes bentuk Hubungan
Antar Hal dengan petunjuk penyelesaian sebagai berikut:
85
Untuk srial~soal berikut ini, pilihlah:
A·. Jika kedua pemyataan benar dan keduanya menunjukkan hubungan
sebab akibat.
B.· Jika .· pemyataan .pertama dan kedua benar tetapi tidak menunjukkan
hubungan sebab akibat. . . ·
C. Jika salah satu dari pemyataan tersebut salah.
D. J~ kedua perilya:taansalah.
contoh: · · . . . .. .. .
Frekuensi detak:nadi seOJang·yang baru berlari cepat akan naik.
. - . . . SE8AB
·.Pada waktu Ian cepat denyut Jantung bertambah c~at.
Contoh:
"Kadit Lantas Polda ·. Jatim Letkol Pol. Dra. Watie Soemarsono
menjel~kan jumlah kecelakaan lalu lintas · di jatim bulan Januari -
November 1986 sebanyak 7090 kasus atau meningkat 4,87 persen,
dibanding tahun 1985 periode yang sama. Meningkatnya kecelakaan lalu
· lintas itu antara lain karena terhentinya Operasi Zebra menjadi operasi
rutin lalu lintas. Di samping itu pengguna jalan hanya berdisiplin jika ada
petugas".
Kompas, 31 Desember 1986, Halaman XVI
86
Pertanyaan:
2) Dalam periode yang sama di tahun 1986 kasus kecelakaan lalu Hntas di
Jatim meningkat 4,87 persen dibandingkan dengan tahun 1985. Dari
data ini
A dapat dibuat kesimpulan bahwa kecelakaan lebih banyak tetjadi
pada tahun 1985 dibandingkan dengan tahun 1986
B. belum dapat dibuat kesimpulan tentang jumlah kecelakaan karena
kasus kecelakaan bulan Desember belum dilaporkan
C. sudah dapat dipastikan bahwa kasus kecelakaan selama tahun 1986
lebih banyakletjadi dari pada tahun 1985
D. tidak dapat dibuat generalisasi karena banyak kasus kecelakaan yang
tidak dilaporkan yang bersangkutan kepada polisi lalu lintas
Dari contoh ini dapat dikatakan bahwa dari satu kasus dapat dibuat
beberapa pertanyaan dan aspek berpikir yang diukur pada proses
berpikir yang lebih tinggi dari pemahaman.
d. Pilihan Ganda
87
justru..jawabannya yang benar dapat leblh dari satu, mungkin 2 ,3 atau <~.
Jadi p~a ragam ·Melengkapi Berganda diperbolehkan menuliskan keempat
aifernatif .pilihan sebagai jawaban yang benar, tidak ada perigecoh. Dengan
.kata lain j_ikci semua altematif pilihan benar, janganlah dimasukkan pada
ragam Mel~ngkapi · Pilihan · tei:api, harus dimas\,lkkan ke dalam rag am
Melengkapi Berganda. Adapun petunjuk·untuk melengkapi berganda adalah:
Cont9h:: .
Salah .safu vitamin· yang larut dalam lemak .adalah vitamin. A yang
t~patdalam .....
(1) minyak,ikan dan tel\,lr
(2} .bayam ikan dan telur
(3) air susu dan wortel
. . .
e. Pilihan Ganda menggunakan Diagram, G(lmbar, Grafi~ atau Tabel, ·
-·~.~___..,.,.,"';~~----,.~-_,...,......,.........._.,...._...,_.,.,.,--;~-~,,.-,..~.-'.~"-· """'
Bentuk soal ini mirip dengah Ahalisis Kasus balk struktur maupun pola
J>ertanyaannya. Bedanya dalam tes bentuk ini tidak disajikan kasus dalam
bentuk cerib~ra atau peristiwa tetapi kasus tersebut berupa diagram·,. gambar,
grafik atau tabel. ·
88
Contoh: . .
. Tabel 3 di bawah ini menggambcrrkan rata-rata suhu dan curah hujari· di
kotaX. . · ·
...
Udara(°C). Jan Feb -Mar AJ>L Mei Jun Jul Agt Sep Okt Nop Des
Suhu udara (OC) 28,9. 29,9 313
o, 29,9 29,1 28,6 27,9 28,1 28,9 28,7 28,4 28,6
Bila dibandingkan antara tes uraian dan tes objektif, terdapat berbagai '·
perbedaan dan persamaan. Perbandingan kedua bentuk tes tersebut dapat
terlihat pada tabel berikut ini:
89
PERBANDINGAN ANTARA TES OBJEKTIF.
DENGAN TES URAIAN
JUOllah sampel
' .,··?.. . .
. Qapat rnenguk\lr . lebih H~Y~. clapat · menanyakan
banyak sampel pertanyaan beberapa . petf.anyaan se-
sehingga benar~benar hingga kurang . m~akili
mewakili ,materi . y~. materi yang diajarl<an.
c.liajarkan.
90
..TES OBJEKTIF TES lJilAIAN ·
91
Beberapa Contoh Butir Soal dalam lingkup Ranah Kognitif
· Berikut ini disajikan senarai contoh butlr soal dalam ranah kognitif,
memuat klasifikasi taksonomi tujuan pendidikan yang dikembangkan oleh
Benyamin S. Bloom, dkk {1956).
1.20 Pengetahuan tentang cara dan alat yang berhubungan dengan hal
yang spesifik.
92
1.21. Pengetahuan tentang konvensi.
Proses pengambilan keputusan dalam sistem demokrasi Pancasila
selalu harus diusahakan melalui ....
A.· merujuk kepada aturanyang berlaku
B. musyawarah untuk mufakat
C. kesepakatan antar fraksi
D. pemungutan suara atau voting
E. kebijaksanaan yang sesuai dengan nilai agama
.94
,.
2.00. Pemahaman
2.10. Translasi.
Dalam REPELITA _V program peme,.intah· terutama ditujukan untUk
membangun da{l!rah Indon~ia Bagian Timur. Dengan .demikian
daerah manakah yang. akan rnendapat prioritas dalaiTl pembangunan
sarana perhuburigan dalam tahun 1992?
A Aceh
B. Bali
C.· Kaliman~n Barat
D. Irian Jaya ·
E. Jawa Timur . ·
· 2.20. lnterpretasi.
. Bila- di bagian luar sebuah peti keUhatan jelas ada gambar .payung
·y(lng terkembang maka tindakan _apakah yang harus dilakukan oleh
kuli yang rriengangkat p~ti tersebut? .·
A. Membongkamya hila ada hujan
B. Menyimpannyadi tempat yang teduh
C. Tidak meinbalik peti tersebtit
E.. Memayungi peti tersebut bila dibawa pergi
2.30. Ekstrapolasi.
Dalam bulan Juli_1969 seorang pegawai .golongan Il/a tidak mampu
. membeli sebuah sepeda motor, sedang dalam tahun 1989 rata~rata
pegawai negeri golongan yang sama sudah _dapat membeli sebuah
motor. Dari keriyataan ini dapat diartikan bahwa pegawai negeri ....
A sudah lebih makmur
B. sudah lebih rajin menabung
C. lebih suka berhutahg
D. lebih banyak bepergian
E. perlu diteliti penghasilannya
3"-00 Aplikasi
. . .
4.00 Analisis
96·.
4.20. Analisis hubungan.
97
Nyafakan benar atau saiahnya pemyataan ini.
1. Keluarga yang berpenghasilan besar merniliki uang cukup
untuk rnernbayar dokter.
2. Sernua keluarga yang membutuhkan perawatan dokter dapat
mernperolehnya
3. Keluarga yang· berpenghasilan kecil tidak mernbayar biaya
pengobatan
4. Keluarga yang berpenghasilan kecil tidak rnemperoleh
perawatan dokter yang dibutuhkannya
5. Keluarga ya.ng berpenghasilan besar lebih banyak sakit
daripada keluarga yang.berpenghasilan kecil
6. Kelua.rga yang berpenghasilan besar rnernperoleh perawatan ·
dokter lebih banyakdari yang dibutuhkannya.
98
s.oo Sintesif':
5.10. Memproduksl komunikasikhas. .
· Tulislah sebuah karangan pendek (tidak lebih dari setengah halam~m)
yang mengemukakan .salahsatu pengalaman nyata Anda yang sangat
. menakutkan~
99
6;00 Evaluasi
100
- -
101
apa yang diketahui, dipahami, ·diapiikasikan .atau yang dapat dikuasai oleh
peserta didik dalam tingkatan proses mentaL yang lebih tinggi. Tetapi belum
ada jaminan bahwa yang mereka miliki dalam kemampuan mental itu dapat
didemonstrasikan dalam tingkah lakunya. Karena itu dibutuhkan beberapa
alat ukur lain yang dapat memeriksa kemampuan atau penampilan tentang
apa yang telah diketahui dan dimiliki dalam tindakan sehari-hari. Jadi alat
f
ukur non-tes merupakan bagian ·keseiuruhan dari alat ukur hasH belajar
peserta didik.
Alatukur keberhasilan belajar non~tes yang umumdigunakan, yaitu:
1. Participation. Charts atau bagan. partisipasi
2. Check Ustsatau daftarcek
3. "Rating Scale" atau skala lajuan.
4. Attitude Scales atau skala sikap
Keempat alat ukur ini mempunyai karakteristik yang sama, yaitu yang
memberi respons a tau yang mengisi alat ukur itu adalah penilaL Karena itu
periu diusahakan untllk mencari teknik yang memungkinkan bias pribadi
pengamat a tau pencatat dapat ditiadakan atau· dikurangi sampai pada. tahap
minimal dalam ·melakukan tugasnya. Untuk. mengurangi kemungkinan bias
tersebut maka beberapa saran ber1kut ini akan dapat membantu agar
informasi ·yang diperoleh lebih sahih:
102
Harus disadari kemungkinan teijadinya kesalahan sampel. Katakanlah
bila kita mengamati seseorang di pagi hari kemungkinan besar akan
menghasilkan informasi yang .lain sama sekaH bila kita mengamatinya di
sore hari.
3. Setiap hasil observasi harus segera ditulis laporannya segera setelah
observasi dilakukan. Penulisan laporan dengan segera akan mengurangi
penyimpangan ·dari kenyataanf\ya, .kar~ma ingatan pengamat akan
mudah sekali terkontaminasi oleh hal-hal lain yang kita amati setelah
observasi.
4. lnterpretasi harus dilakukan setelah pengamat mengendapkan ifl.formasi
yang telah diperoleh melalui observasi, interpretasi ha",;ls dilandasi
kriteria yang sudah disepakati, sehingga il1terpretasi tidak menjadi terlalu
subjektif.
5. Suatu latihan diperlukan pada saat petugas lapangan menggunakan
perangkat instrumen non-tes. Latihan ini bertujuan untuk menyamakan
persepsi tentang perangkat instrumen tersebut.
Salah satu tujuan yang ingin dicapai dalam · suatu proses belajar
mengajar. ialah keikutsertaan peserta didik secara sukarela dalam kegiatan
belajar mengajar tersebut. Jadi keikutsertaan tersebut selain merupakan salah
sq.tu usaha memudahkan peserta didik untuk memahami konsep yang
sedang dibicarakan dan meningkatkan daya tahan ingatan mengenai suatu
isi pelajaran tertentu, juga dimaksudkan untuk menjadikan proses beiajar
mengajar sebagai ahat merlingkatkan percaya diri, harga diri, dan lain-lain.
Untuk itulah maka keikutsertaan secara suka rela (participation) sudah
merupakan tujuan proses belajar mengajar.
Dengan demikian keikutsertaan peserta didik daiam suatu proses belajar
mengajar harus diukur, karena ia memiliki informasi yang kaya sekali tentang
hasil belajar yang bersifat non-kognitif. Kemauan untuk berpartisipasi dan
keterlibatan dalam kegiatan belajar mengajar, baik yang terstruktur maupun
103
.yang kurang terstruktur, merupalsan ~alah satu indikasi teritang keterHbatan
peserta dfdik dalam kegiatan belajar a tau kemampuan: peserta didik untuk
meny~uaikan -diri dengan • kelompoknya a tau p£nerimaan · peserta didik
tertentu datam kelompok tertentu. _
. Sung~hpun participation chart l?elum·dapat memberi informasi tentang
alasan seseorahg 'untuk ikut serta .- dafam suatu kegiatan, tetapi pola
keikutse$a~ dalam akti:v:itas -sudah dapat menjelaskan suatu. hasil · belajar
~~cang penting yang bersifat non-kognitif, yang lebih . bersifat · afektif yaitu
- kehendak 1,.mtuk. ikut serta. .
.
104
PARTICIPATiON CHARTS
Fakultas
Jurusan
Mata Kuliah:
Topik
Tanggal
Waktu
Tujuan:
Kualitas Kontribusi *)
No Nama*~) Sangat
Penting Meragukan
Tidak
Berarti · Relevan
1 AanAbdullah 1m III - -
2 Budi Santosa II n I I
3 Cucu Juariah m III - -
4 Dedeh Sutriah I II - II
5 Endang Kastono m - I u
6 Faisal Harahap I - m II
7 Gugun Gumila - II - -
8 Hani Fadilah I n - -
9 Ibrahim nn I - I
10 Joko Daryanto II m - -
J
105
Frekuensi parlisipasi dalam kegiatan telah. memberikan berbagai
informasi yang berguna untuk penilaian hasil belajar. Tentu saja
"participation charts" saja belumlah cukup untuk dapat menarik kesimpulan
yang memadai. Karena itu maka instrumen ini haruslah dipakai bersama-
sama dengan instrumen lain, seperti tes, atau "rating scale", atau "attitude
scales".
2. Check Lists
106
Bagaimanapun remehnya suatu komponen, tetap .akan
sumbangan yang berarti bagi keutuhan keseluruhan yang sedang diamati.
Tentu saja jumlah komponen yang .dimasukkan ke dalam check masih
tetap dibatasi cleh waktu yang tersedia untuk mengamati dan kemampuan
pengamat untuk memperhatikan komponen yang dicantumkan dalam ·. daftar
tersebut.
Check list terdiri dari dua, yaitu komponen yang akan diamati tanda
yang menyatakan. ada atau tidak adanya komponen tersebut dalam
observasi. Untuk jelasnya, satu contoh berikut ini merupakan check list untuk
mengukur kemampuan hubungan interpersonal murid di sekolah dasar kelas
1 (satu) dan 2 (dua). · ·
Petunjuk: Berilah tanda cek (V) di tempat yang telah disediakan dalam tabel
berikut, untuk setiap pemyataan yang disajikan.
107
No Aspek yang diamati Cek
13 Mengucapkan rasa simpati kepada orang lain yang mendapat
kemalangan
14 Memulai pembicaraan kepada orang lain dengan topik yang
disenangi orang lain itu /
15 Memberi ucapan selamat kepada anggota keluarga yang ulang
tahun
16 Menunjukkan sikap ·Iebih menyenangi beberapa temap dari
pada ternan lain
17 Lebih senang bergaul dengan ternan yang berlainan kelamin
18 Mempunyai seorang atau beberapa orang ternan yang
dianggap paling akrab
19 Nemiliki kelompok ternan yang tetap
108
.·. ·. b(bawah tnt~altar. cek untuk ·mefte~kan kualitas kegiatan kelompok
'(iatam!satu perco\>aan kimia. .. 7
r. •w' .
Kertas sarnla.,_-,
. EJektroda
Alat:-alat: ~
1. Baterai dengari tempatnya 6. Telepa Petrie (1) ·
2. Tombol 7. Gelas Piala (1)
3. Kabel 8. Pengaduk (1)
4. Jepit bergerigi 9. Kertas saring (1) .
5. KaYJatNi-Cr
109
FORMAT OBSERVASI
110
d. Mengukur volume larutan kanji menggunakan gelas ukur. 0
e. Mencampur, larutan garam Fenolftalein dan larutan kanji
dicampur dalam gelas piala.
f. Mengaduk larutan menggunakan gelas .pengaduk.
g. Pada saat melakukan elektroUsa, mula-mula menggunakan
tegangan rendah kemudian tegangannya ditinggikan.
Menggunakan gela5 pengaduk pada waktu menuangkan D
Iarutan dari gelas piala ke telepa Petrie.
111
tentang sesuatu yang diobservasi, yang meny~takan posisi sesuatu dillam
hubungannya dengan yang lain. Biasanya rating scale berisikan seperangkat
pemyataan tentang karakteristik atau kualitas dari sesuatu yang akan diukur
beserta pasangannya yang berbentuk semacam cara menilai yang
menunjukkan peringkat karakter atau kualitas yang dimiliki oleh sesuatu
yang diukur tersebut. Jadi suatu rating scale terdiri dari:- dua bagian utama,
yaitu: (1) adanya pemyataan tentang keberadaan atau kualitas keberadaan
dari suatu unsur atau karakteristik tertentu, dan (2) adanya semacam
petunjuk penilaian tentang pemyataan tersebut. Komponen ini mirip dengan
tes· objektif, yaitu adanya stem· dan option. ·Misalnya,. Alex lnkeles. dalam
kegiatan penelitiannya mengenai ·manusia modem (Becoming Modem)
menggunakan format tes melengkapi pilihan di. mana pokok soal diiringi
dengan 3. pilihan.
Setiap pasang pemyataan dan. penilaian itu dapat dianggap sebagai
sebutir soal dalam rating scale tersebut.
Ada beberapa tipe rating scale, yaitu:
a. Numerical rating scale.
b. . Descriptive graphic rating scale.
c. Ranking methods rating scale.
d. Paired comparisons rating scale
112
Petunjuk: Nyatakanlah tingkatan setiap pemyataan atau jawaban pertanyaan
berikut ini dengan cara meUngkari salah satu angka yang ada di
depan pemyataan atau pertanyaan tersebut. Angka-angka itu
mengandung makna:
1 = tidak memuaskan
2 = di bawah rata-rata
3 = rata-rata
4 · = di atas rata-rata
5 sempuma
113
. keseluruhan tating ·scale, itu digunakan ·arti yang sama. Jarigan ·samp~i
terjadi dalain satti butir pemyataan 1 (satu) berarti·tideik ada, dan dalam
pemyataan lain 1 (satu) berarti sangat baik.
3) ·. Jumlah kategori angka yang digunakan supaya dit1sahakan cukup.
beirilakna; tetapi tidak terlalu renik set)ihgga tidak jEdas lagi 'perbedaan
alii satu angka. ·deng~m. angka lainnya. Sebagai, pato~n hendaknya
kategoriSasi angka yang digunakan itutidak m~ebihF7 (tujuh) kategori,
Peinbagian sampai dengan tujuh itu maSih,dapat dibedakcm sec;arajelas
arti satu 'angka dari angka lainnya; ·Misalnya: l = hatnpir'tidak ada; 2 =
=
kurang; 3 ~ ·di bawah rata-rata; 4 rata-rata; 5 = di atas rata-rata; 6 ~
cukup ; 7 = sem'puma. Bila leblh dari h!juh kategbri dapat menimbulkan
··keh_ingungim bagi orang yang.akan memberi penilaian. Tetapijuga harus
diingat angka itu· tidak jtiga· terlalu kasar; mi$alnya hariya terdiri dari 2
·(dll:a) kategorL Bila akan inenyatakari dua kategorl, maka sebaiknya
tidak menggunakan rating scale, ·tetapi gun~ ..check list". . ·
· 4) Setiap perriyataan atau pertanyaan hendaknya hanya men~kur satu ·
karakteristik atau satu komponen. Karakteristik yang .dipilih hendaknya
·yang pen1ing dalam keseluruhan bagian yang akan diukur itu. Jadi tak
usah memasukkan karakteristik a tau komponen' yang' remeh dalam. suatu
rating scale~
5) Bila rating scale itu akan mengukur suatu prosedur, inaka sebaiknya
pertanyaa:n atau pemyataan disusun secara urut berdasarkan urutan
pelaksanaan prosedur. ·.
6) ~ila rating scale·akan mengukur suatu hasil, maka komponen rating scale
disusun menurut
. ,
urutan dari mudah diamati ke, yangJebih sukar diamati.
-
Berikut ·ini salah satu contoh rating scale untuk mengukur kemampuan
menuliS peserta didik kelas satu SO. Rating scale ini digunakan untuk ·
mengukur prosedur dan hasil tuliSan tangan.
114
No Aspek yang diukur 1 2 3 4 5
1 Cara memegang pensil
2 Posisi duduk waktu menulis '
I
'
3 Posisi tangan terhadap kertas I
Rating scale seperti dicontohkan di atas tentu dapat disusun dengan iebih
merind lagi aspek yang diukur bila dikehendaki pengukuran yang lebih teliti.
Tetapi juga harus diperhatikan bahwa rating scale yang terlalu rind akan
membutuhkan waktu untuk menyusun alat ukumya. Untuk pengukuran yang
akan digunakan oleh guru dalam mengobservasi kegiatan yang mencakup
prosedur dan hasH kegiatan hendaknya guru menyusun alat ukur yang cukup
sederhana, tetapi roompunyai validitas dan reliabilitas yang dapat
diandalkan.
Di bawah ini dicantumkan 2 contoh penggunaan "numerical rating scale 1'
dalam format observasi pelaksanaan:
1. Praktek Mengajar (PPUPKM)
2. Praktikum Kimia (titrasi)
115
... : .. . .
Kedua contoh initidak mencantumkan ~mua kegiatan mulai dari tahap
persia})a,n sampai dengan tahap .akhir kegiatan (penilaian/umpan ·balik)
_tetapi :hanya mengambil tahap tertentu.
l. PraktekMengajiir - 7
:
116
b. Pada waktu prakt~k mengajar, calon guru harus mengakhiri
pembelajaran. Instruktur/dosen yang menilai pelaksanaan
pembelajaran tersebut dapat menggunakan format observasi berikut:
117
2. Praktikum Kimia (Titrasi asam-basa)
Untuk melakukan titrasi, sebagaimana terjadi pada praktek mengajar,
juga melalui sejumlah tahapan kegiatan, antara Jain tahap persiapan,
tahap membuat larutan baku (standard), melaksanaka.n titrasi,
menghitung konsentrasi. larutan, membuat laporan tertulis. Contoh
berikut hanya mencantumkan format observasi untuk.Jahap pelaksanaan
titrasi. Format tersebut menggunakan "numerical rating scale". Kegiatan
yang akan dilakukan selama titrasi adalah:
a. memasukkan iarutan baku (sebut larutan A) ke dalam buret.
b. mengukur volume larutan yang akan ditentukan konsentrasinya
(sebut larutan X} dengan pipet.
c. menuangkan larutan X ke dalam labu Erlenmeyer.
d. meneteskan indik~tor ke dalam larutan X.
e. meneteskan larutan A dari buret ke dalam larutan X dalam labu.
f. membuatkedua larutan (Adan X) bercampur dengan baik.
g. menemukan titik ekivalensi yang tepat.
·us
3 Duadeskriptor yang dapat diamati ·
4 Tiga deskriptor yang dapat diamati
5 Semua deskriptor.dapat diamati
ll9
6. Bagaimana kemampuan Akurat Kabur
menarik kesimpulan?
7. Bagaimana sikap terhadap Meng- Menganggap
pendapat orang lain? hargai enteng
·Setiap komponen dari graphic rating scale dapat dideskripsi lebih akurat,
sebab dapat ditentukan di ·mana saja sepanjang gads kbntinum yang ada di
depan pertanyaan atau pemyataan. Dengan secara keseluruhan akan mudah
dilihat profil dari kemampuan siswa yang bersangkutan dalam diskusi.
120
siswa. yang . inenduduki peringkat pertama dalam kemar;npuan
membacanya, . dalam .arti ·ranking 1 (pertama) .adalah. yang
kemampuannya terbaik. '·
Nama.siswa Rankin
Ahmad
Badu
Cicyl
Dedi.
Elly .......
Fatimab
Gurjita·
Hanifah
·. ldham
Johan
Kamal
121
Petunjuk: .Tentukanlah kedudukan relatif setiap anggota kelompok di bawah
ini, dalam setiap aspek yang ditetapkan, dengan cara memberi
angka untuk setiap kolom. Angka 1 (satu) berarli ranking pertama,
dalam arli bahwa 1 (satu) =yang terbaik. »
Tipe rating scale ini dilakukan dengan cara membandingkan hasH kerja
atau tugas seorang murid dengan murid lainnya, jadi setiap kali dilakukan
pembandingan hasil· karya ·.atau tugas seorang murid secara berpasangan.
Dalam pembandingan itu dibandingkan hasil kerja yang lebih baik. Jadi
setiap kali dilakukan pembandingan antara dua peserla diputuskan satu
peserta · lebih baik dari peserta lainnya. Dengan demiki2m pada akhir
pembandingan akan diperoleh informasi tentang kedudukan anak tersebut
diantara ternan sejawatnya. Hasil pembandingan itu dimasukkan ke
matriks sebagai berikut.
122
Contoh: Paired Comparison Rating Scale tulisan tangan murid kelas dua
SD
Nama Maman Nana Osman Poppi· Qosim Ratih Susi Jumlah
Maman 1 0 1 1 0 1 4
Nana 0
1... 0sman 1
..
Poppi 0 ..·
Qosim 0
Ratih 1
Susi 0
123
Kelemahan utamanya ialah tidak jelas hal yang dibandingkan. Artinya
aspek yang dibandingkan tidak dinyatakan secara rind. Akibatnya bagi
pengguna hasil pengukuran akan sukar menginterpretasikan hasilnya.
Secara·umum setiap·perigguna rating scale sebagai alat pengu)mran hasil
belajar haruslah menyadari kemungkinan "error" yang akan dihadapL
Sumber error tersebut antara lain: .·
a. Rating scale itu sendiri sebagai sumber error. Hal ini ciisebabkan oleh trait
atau hal yang diukur tidak ·didefinisikan secara jelas a tau tidak
menggunakan pengertian umum yang berlaku untuk istilah tertentu.
Sehingga orang yang melakukan observasi tidak. tahu dengan pasti apa
yang harus diperhatikan. Selain itu kesalahan itu mungkin juga
disebabkan oleh. tidakjelasnya arti skala yang digunakan. Misalnya bila
seorang pengamat harus membedakan antara sangat baik, baik, sedang,
kurang dan sangat kurang akan · sangat menyulitkan pengamat bila
semua. istilah itu tidak dirumuskan a tau dicantumkan kriterianya dengan
jelas.
b. Sumber error yang kedua ialah si pengamat atau orang yang memberi
rating. Kesalahan yang bersumber pada rater atau observer ini biasanya
terjadi dalam bentuk yang dinamakan "halo effect", "severity effect",
"central tendency error", dan "logical .error" .
Yang dimaksudkan dengan "halo effect" ialah kesalahan atau error yang
bersumber dari menggeneralisasi satu hasil pengamatan .kepada aspek
lain. Misalnya bi!a kita tahu bahwa seseorang mempunyai kemampuan
matematika yang tinggi, kita akan cenderung untuk memberi skor tinggi
pula pada kemampuan bahasa, IPS; IPA, dan kemampuan PMP orang
tersebut. Karena itu kita cenderung memberi skor tinggi terhadap
kemampuan seseorang. Demikian pula terhadap orang yang berprestasi
rendah dalam satu aspek yang kita amati, kita cenderung untuk memberi
skor yang rendah pula kepada semua aspek yang lain.
Severity effect adalah kecenderungan untuk memberi skor rendah
kepada orang yang diamatL Hal itu acapkali terjadi pada dosen yang
124
kurang berpengalaman, karena menganggap peserta didik ·sebagai orang
yang tidak .tahu apa-apa. Kesalahan ini juga disebabkan oleh tidak
digunakannya kriteria yang bakuuntuk memberi skor.
Central tendency error, juga di~babkan tidak diterapkannya kriteria
secara baik. Karena adanya rasa kurang percaya diri dipihak rater atau
orang yang mengamati, maka ia cenderung untuk memberi skor yang
"aman" yaituyang mendekati skorrata-rata.
Logical error ialah kesalahan yang .disebabkan oleh penggunaa:n logika .
atau pengetahuan yang telah dimiliki. Misalnya hila seseorang memiliki
kemampuan bahasa yang baik, maka secara logis dapat diterima bila
kemampuan berpikir runtunnya. pun akan baik. Karena itu maka
pemberian ·skor dilakukan bukan atas dasar hasil pengamatan yang teliti,
tetapi lebih .didasarkan pada kesimpulan logis a tau berdasarkan hasil
studi yang pemah dilakukan rates terdahulu.
c. Sumber error yang ketiga ialah hakekat trait atau karakter yang dirating
tidaklah mudah untuk diobse:rvasi. Misalnya bila kita ingin merating sikap
seseorang atau pemahaman seseorang. Trait yang akan diobse:rvasi itu
bukanlah sesuatu yang mudah diamati. Untuk dapat memperoleh
informasi yang akurat dibutuhkan waktu yang cukup lama. Sedangkan
rating acapkali harus dikerjakan dalam waktu yang singkat. Karena itu
informasi yang diperoleh .untuk sampai pada rating yang tepat
didapat. Sehingga terjadi error dalam rating.
125
karakt~ristik lain yang bukat1 m~rupakim ha'silbelajaryang:penting untuk
diukUr sebailmya tidak dirating. _· ·
c. Dalam komponen rating scale sebaiknya · tidak digunakan -istilah..:istilah
yang kabur artin,ya. - · ,
d. Skala hendaknya disusun dalam perbedaan ~yang jelas. Misalnya antara
sangat ·baik. dengan __baik. sekali sukar dibedakan, ,.ka:rena .terlalu renik
perbedaannya. Karena- itu lebih baik bila diguncikan sangat baik dengan
· baik $aj'a, , .
e.; Guru>yang akan mengadministrasikan rating scale terlebih dahulu harus
mengenal•5ecara l?aik !J'ait. atau orang yang a_kan dirating. .
f.. Setiap komponeil rating. scale hendaknya hanya berdimensi tunggal.
· Jangan sampai satu kompcinen mengandung dua hal sekaligus·.
g. Petunjuk melakukan .atau m~ngadministrasikan rating scale tersebut
harus j~las, dan 'tidak perlu diinterpretasi lagi oleh pelaksana. ·
h. Setiap akari mengadministrasikan rating •scale harus dfdahului dengan
· latihan: Melalui latihan persepsi para pelaksana dapat diseragamkan.
4. Skala
'
Sikap
"~
126
Secara lebih · umum d~nisi Thurstone ini ··dapat di.rumuskah sebagai:
Attitude is (1) affect for or against, (2) evaluation of, (3}.like or dislike. o£1 or
( 4) p6sitiveness or negativeness toward a psychologicat object.
Untuk mengukur sikap· m~ haruslah dikonstruksi skala sikap.
Konstruksi skala sikap .ini harus dim~;~lai de1;1gan menentukan · dan
. melldefiniSikan objek sikap. yang akap diukur itu. Jadi yang pertama yang
.hams .dllaku.kan :adalab~meng!dentifikasi .objek sikap atau dengari kata lain ·
. mengidentifikasi ''sikap terhadap··'apa?" .. Oengal'l. den:Hkian·. 11)aka harus
ditentukan batas~batas objek sikap yang akan diukur itu. Pengukuran itu
sendiri akan sangat tergantung kepada ke.:Oampuan·untuk ·membatasi objek
sikapnya.. Misalpya, bjla ingin rnenguk:ur sikap orang terhad~p hukuman .
mati, atau terhadap bunuh ·diri, .atau. terhadap.kaumJundamen~•·· maka
terlebjh dahulu haf\isla:ll.diidentifikasikan secara •persis apa . yang dimaksud
dengan hukumanmati, bunuhdiri, atau .kfl.urn fundamenta~is tersebut.
Setelahpembatasah objeksikap itu, maka mulai dikumpul~n.butir~butir
pernyataan tentang objek sil~ap tersebut, sehingga terdapat~· kumpulan
sejumlah besar pemyataan te_ntang objek sikap tersebut. Barulah kemudian
. ditentukan formatjawaban yang.akan digunakan,··dan cara penskoran.
Untuk memperoleh ·suatu skala sikap yang secara baik dapaf mengukur
sikap. terhadap suatu .objek sikap tertentu maka butir~butir pemyataan ·sikap
yang. teJah. dikonstruksi itu ·hal'US diujicoba, dan hasH· uji coba 'itu dianalisis,
unfuk menentukan butirpemyataan mana yang ·al«m diguriakan dalarn skala
sikap, Btasanyabutir yang mempl,t:nyai kpefisien ko.relasi yang tioggi dengan
skor keseluruhanlah yang digunakan dalam skala. Butir p~rta,nyaan yang
·koefisieii korelasinya rendah terhadap skor kes~luruhan dibuang darl skala
sikap. Dengan de111ikian maka diperoleh seperangkat ·skala sikap yang
rnengukur $Uatu sikap terhadap suatu objek sikap terten:tu. Dengan .Ireta lain
korelasi at)tar butir soal cukup tinggi. . ·
. Ada beberapa .teknik konstruksi skala sikap. Yang terkenal antara lain:
a. · Skali} Likert. ' ·
b.. Skala Thurstone
c. Skala Guttmann
I
127
a~ Skala Likert
128
'
Pemyataan itu dapat dalam bentuk negatif atau dapat pula daiam bentuk
positif. Bila pemyataan itu positif, misainya: Saya menyukai mobil bermotor
disel, maka skor besar adalah bila dinyatakan secara positif. Tetapi bila
pemyataan dibuat secara negatif, misainya: Motor disei sukar distater, maka
skor besar adalah bila sikap negatif.
Petunjuk: Jawablah semua butir soal di bawah ini, dengan kategori jawaban
sebagai berik\Jt:
A = sangat setuju
B = setuju
C = tidak punya pendapat
D = tidak setuju
E = sangat tidak setuju
b. Skala Thurstone
129
Untuk tidak terlalu bertele-tele daiam uraian tentang skaia sikap ini, maka
daiam kesempatan ini hanya akan diuraikan secara singkat metode "Equal-
appearing Intervals" saja.
Untuk mengembangkan skala sikap dengan metode ini, maka langkah
yang harus ditempuh adalah:
a) pemilihan dan mengidentifikasi objek sikap secara seksama.
b) menyusun pemyataan opini mengenai objek sikap' yang akan diukur
sebanyak mungkin. Tentu saja konstruksi pemyataan opini tersebut
haruslah sesuai dengan kriteria penyusunan pemyataan skala sikap yang
· baku, seperti halnya juga pada skala Likert. Perbedaannya hanyalah
pada skala Thurstone harus ada kemungkinan untuk sikap netral. Dalam
penyusunan atau konstruksi butir-butir pemyataan itu diharapkan akan
mencakup keseluruhan aspek evaluatif dari objek sikap yang
bersangkutan mulai yang paling positif sampai yang paling negatif.
c) Tidak ada ketentuan jumlah pemyataan yang harus ada dalam skala
sikap, tetapi biasanya skala sikap Thurstone menuntut jumlah butir
pemyataan yang lebih banyak.
d) Langkah berikutnya ialah mencari "favorability values" atau disebut juga
"scale values" untuk setiap pemyataan.
e) Setelah itu maka ditentukan jarak-jarak skala yang akan digunakan untuk
skala sikap final yang akan digunakan, dengan cara membagi nilai skala
dengan jumlah pemyataan yang digunakan.
f) semua pemyataan yang menempati kedudukan pada interval yang sama
itu diambil sebagai bagian dari skala final yang akan digunakan.
Biasanya skala yang akan digunakan dalam skala sikap Thurstone
berkisar antara 7 sarnpai dengan 11. Tetapi jarak "scale values" yang
digunakan tidak perlu dengan angka bulat. Dengan cara ini diperoleh
seperangkat pemyataan tentang objek sikap yang akan diukur. Dan
pemyataan itulah yang akan digunakan dalam skaia sikap.
130
c. Skala Guttmann
Hal yang khas dari skala Guttmann ini ialah penyusunan sedtere!tan
pemyataan tentang opini tentang suatu objek. sikap secara berurutan.
Responden diminta untuk menyatakan pendapatnya tentang pemyataan itu.
Bila ia setuju dengan pemyataan pada nomor urut tertentu, maka semua
pemyataan dibawahnya dianggap disetujuL
Misalnya:
1. Pengguguran kanc;lungan dapat diterima apapun alasannya.
2. ·Pengguguran kandungan dapat diterima hila untuk alasan KB.
3.. Pengguguran kandungan dapat diterima hila sebagai akibat perkosaan.
4. Pengguguran kandungan dapat diterima hila temyata bayi dalam
kandungan mengalami cacat serius.
5. Pengguguran kandungan dapat diterima hila ibu dalam keadaan bahaya.
Rangkuman
131
untuk menskonstr~ksi butir soal dengan baik. Di samping .itu,· tes
dianggap bukan s~bagai alat ttkur, tetapi sebagai alat pendidikan yang
terp~nting dalam proses pendidikan. PO.daha/1 fungsi utama tes hasil
belajar(achi'euement.test) ialah· menguktJr. keberhasilan beld)ar se_seorang
c;zta!.~osek~lpmpok mahasiswa,. bukannyaproses pendidikan.
Tes J-/asil Belajar (THB). ·adalah salah 5atu alat ;ukur yang paling
banyak digunakan. ,untuk menentukan keberhasilan .- seseorang dalam
Suatu· proses be/ajar .mengajar atau untuk menentukan· keberhasiJan Sl,ldtu
program pendidikan. Terdapat dua jenis tes yang paling sering
digunakan, ' yaitu tes .uraian dan tes.. ob}ekti]. Caraccarq.. penulisan butir
so.al uraianberbeda dengan petrulisan butir soal objektif, demikian pun
-k~r,i(ltan dan. ke/emahan antat keduanya berbeda pula:· Untuk rnenilai
butir-butir ~oaJ · w:aian bi~nya dibua.t pedoman skoring (Marking
Scheme). . . ·
L~tiban
1. Coba Anda jela,skan apa yang mendasari penyusunan tes hasil belajar?
2. ·.Apa kekuatan dan kelemahan tes uraian?.. · ··
;3. Kapan tes uraian sebaiknya digu.nakan?
4, Secqra umum, .coba Anda jelaskan kekuatan dan kelemahan tes objektif?
5.. Kapan sebaiknyc;tJes objektif pigunakan?
6. Apa saja yang Anda ketahy,i tentang instrumen non-tes, dari segi
.pengertian, contoh-contoh dan kegunaannya?
132
IV. PENGADMINISTRASIAN TES
133
• zmnut, fi... aan :JVasoefwn, :JV.
134
i. Hindarilah meletakkan kund jawaban dalam suatu pola tertentu.
135
B. Pelaksan.aan Tes
136
Sebaliknya, keterbatasan-keterbatasannya dapat berupa:
a. para mahasiswa mungkin saja malas . membaca buku atau catatan
dengan alasan dalam ujian akan bebas meiihat buku atau catatan.
b. mereka yang jarang ll'lembuka bukU/catatan akan habis waktu ujiannya
untuk mencari/membolak balik lembaran buku untuk mendapatkan
jawaban.
c. ada kecenderungan para siswa malas berpikir, hal yang sangat mudah
pundicarijawabannya di dalambuku atau catatan..
d. bagi. mahasiswa yang .alat kelengkapan .belajamya minimal akan
dirugikan.
Tes yang tidak mengijinkan para peserta tes membuka buku atau catatan
mempunyai keuntungan/kekuatan:
a. membiasakan para mahasiswa untuk memahami isi buku atau catatan
yang dimilikinya sebab jika tidak, akan tidak berhasil dalam ujian.
b. membiasakan para mahasiswa untuk berpikir sendiri, bukan
menggantungkan diri kepada buku atau catatan yang ada.
c. membiasaKan para mahasiswa membuat rangkuman mengenai isi buku
atau catatan yangdipelajarinya.
137
pada saat akan menentukan .·diagnosis pasien yang ditanganinya; dan
masih banyak contoh-contoh lain.
138
para mahasiswa untuk m~mbahas kunci · jawabannya dan
mempersoalkan nilai m~reka.
d. Pihak dosen tentu akari mengoreksi dan memberi nilai kepada setiap
pekerJaan peserta ·. tes dengan cemiaf karena. tidak · ingin · kepercayaan
mahasiswa kepada dirinya hUang
'- ' . .. '
karena kecerobohannya. ·
- K~terbatasannya aclalah: .-
a. Membuat malu mahasiswa yang tidak lulus atau nilainya rendah yang
pada gilirannya akan menghapuskan motivasi belajamya. ·
b. Kesempatan untuk demokratisseperti yang diutarakan pada keuntungan
butir c di atas dapat saja cenderung menjadi prot~-protes yang
meng~rah kepada keadaan "chaos".. . . _ _
c. Dosen yang ·karena ~tu dan lain hal tidak dapat mengumumkan tepat
Waktu, akan merasa me11lplln9a1 beban mental yang berat dan merriang
dapat menjurus kepada cemoohan oleh para mahasiSwa. .
d. Memerlukan kemampuan administrasi yang prima yang memerlukan
fasilitas dan dana tambahan.
',, . -· . ' b , ,.
139•
-b. DapaLsaja terjadi seseorang dosen ltu "main hakim sendiri" tanpa
diketahui oleh siapa pun. . ..
c. Para mahasiswa tldak merasakan ha5il jerih payahnya padahal hasil yang
. diperoleh ini memberi motivasi .yang sangat. penting dalam pr0 ses ·
belajar,
o.140 ....
saat waktu tes habis peserta tes yang bersangkutan belum beranjak ke
butir tes yang lain.
141
b. Membuat pergantian suasana sehingga kejenuhan dapat dikurangi atau
dihilangkan.
t-
·1+ Rangkuman
.
Pengadministrasian tes adalah pelaksanaan tes, mulai dari proses
penyuntingan naskah tes sampai dengan mengerjakan tes. Langkah-
langkah pengadministrasian tes meliputi penyuntingan tes, penggandaan
naskah tes dan pelaksanaan tes.
J\ latihan
142
V. PENGOLAHAN DAN PENDEKATAN PENILAIAN
1. Pengolahantla..ITes.
Dalatn merakit tes, salah satu komponen yang harus diperhatik.an yaitu
mempersiapkan lembar jawaban. Salah satu contoh lembar jawaban
terdapat pada foiTha't 5.1. · F~rmat semacam ini digunak.an bilamana
pemeriksaan dilakuk.an secara ·manual '(diperiksa sendiri ·oleh dosen atau
panitia). Bilamana lembaijawaban diperiksa dengan alat pembaca khusus•
(scanning machine), lembar jawaban tidak dapat menggunakan kertas biasa
tetapi rrienggunakan··kertas khusus yang·dapat dibaca oleh mesin pembaca.
Kertas serriacam ini dapat djpesan melalui agen komputer. ·
143
FORMAT 5.1: FORMAT J-EMBAR JAWABAN
Nama: ........................-..... ·
A 8 C D A B C .D A B C. . D
/
1. . 21 . 41 .
2.
. ; " '.
22. / 42.
3. 23. 43.
4.- 24. ""
44.
5. 25. 45.
6. 26. ' '46.
7. 27. .7.
,._: 28. ~
8.' 48.
9. 29. 49.
10. 30. 50.
11. . 31_, 51 .
12. 32. 52.
13. 33. 53.
14. 34.
"
54.
15. 35. 55.
16. 36. 56.
17. 37. 51.
18. 38. 58.
19. 39. 59.
20. 40. '60.
Memeriksa hasil tes objektlf dengan cara manual
langkah berikut:
a) Salinkan format lembar jawaban (format di atas kertas
Cara menyalin dapat dengan memfotocopi atau meletakkan satu lembar
kertas transparan di atas lembar jawaban kemudian tnembuat kotak-
kotak sesuai dengan Format 5.1.
145
"Pikirkanlah sebaik-baiknya sebelum tnenjawab setiap soal, karena
SETIAP JAWABAN YANG SALAH AKAN .MENGAKIBATKAN
PENGURANGAN NILAI".
Nama: ............................ .
A B C D A 8 C D A B C D
3. () 23. 0 43.
4. 0 24. () 44.
7. () 27. . 47.
8. () 28. () 48.
9. 0 29. 0 49.
10. 0 30. () 50.
11. 0 31. 0 51.
12. 0 32. 0 52. I
147
FORMAT 5.3: LEMBAR JAWABAN DAN KUNCI JAWABAN
A B C D A B c D A B c D
1. IC) X 21. 41.
2. () X 22. 42.
3. 10 23. 43.
4. X IC) 24.
.
44 •
5. 0 45.
6. IC) X 26. 46.
7. () X 27. 47.
8. X () 28. 48.
9. X0 29. 49.
10. I® 30. 50.
11. X () 31. 51.
12. 0 32. 52.
13. () X 33. 53.
14. X () 34. 54.
15. 0 35. 55.
16. X I() 36. 56.
17. X () 37. 57.
18. Q9 38. 58.
19. X () 39. 59.
20. 10 X 40. 60.
18 SKOR: 22
148
Contoh: Peserta ujian · pilihan berganda dengan 4 altematif ·. pilihan
rnenj~wab betul 65 butir•. dijawab salah 15 butir dari 80 butir soal.
· Jadi ·skor peserta adalah:
. .. 15 ·. 15. ·.
Skor=65--.-·-· =65--·- ·
· · n-1·.·. 4....,1
. ~65...,-5=60
149
tidak ditinjau kembali dapat mengakibatkan banyak peserta tidak Iulus. Di
/ samping itu, jika terlalu sulit arti. konsep yang diharapkan (sebagai
konsekwensi dari proses_ berpikir yang terlalu berat) maka .pedoman
penilaian perlu di ujicobakan. Itu1ah sebabnya dalam tata cara pemeriksaan
butir~ soal uraian langkah-langkah yang haru$ ditempuh ad~ah sebagai
berikut: ·
a) Ambil lembar jawaban ujian (LJU) peserta sekitaf 10%. Pengambilan
dilakukan secara acak; Bilamana Anda telah mengetahui kemampuan .
peserta misalnya· _mahasiswa yang Anda ajar seridiri, sehingga _Anda.
mengetahui be~ar siapa yang p~ndai di kelas itu; siapa yang sedang saja
tingkat 'kemampuannya · -dan siapa · peserta · tes . yang . kurang
kemampuannya; maka ·pemilihan secara acak tidak · diperlukari, ·tetapi
pilih peRetjaan darrsalah seoiang peserta tes yang pandai, dua peketjaan
- dan pesert.a yang kemampuannya sedang dan peketjaan dari seorang
yang kemampuannya ktirang. .
151
·. Setiap aspek diberi,skor dari 3 ,gampai dengan 1 sesuaLdengan p~domah
berikut:
af diberi skor 3 kalau kemampuan yang diamati di atas kemampuan rata-
rata
b) diberi skor 2. ~au kemampuan yang diamati berada pada .k~mampuan
rata~rata
c) diberi skor 1 kalau kemampuan yang diamati di .- bawah kemampuan
rata-rata. · ·
2. Kemampuiin Pukulan:
d) pukulan drop 3 2 1
. 1!52
3. Memilih Strategi:
153
Jadi skor setiap peserta tes bergerak antara .16 sampai den!fcm 48 kecuali
diantara sasaran observasi ada yang tidak diisi. Selanjutnya rentangan .skor
setiap asp,ek dapat dihitung. yaitu berada antara 4 - 12. Dengan
inemperhatikan skor yang dicapai oleh setiap pemain dapatlah diketahui
k~kuatan ·dan kelemahan seseorang ·pada setiap aspek. ·
Bilarnana pertanyaan yang diberika:n dalatn ujian~ tertulis, maka cara
mengolahnya sama dengan cara r:nengolah tes yang mengukur ranah kognitif
baik bentuk objektif maupun bentuk .uraian.
. ' . .
154
Contoh:
1. Satu kelompok anak didik terdiri dari 9 orang mendapat skor (nilai
mentah)
50,45,45,40,40,40,40,35,35,30
Dari skor ini dapat dibaca bahwa perolehan nilai tertinggi adalah 50 dan
perolehan terendah 30. Dengan demikian nilai tertinggi diberikan kepada
skor tertinggi, misalnya nilai 10, 'secara proporsional skor di atas dapat
diberi nilai 10, 9, 9, 8.
55 43 39 38 37 35 34 32
52 43 40 37 36 35 34 30
49 43 40 37 36 35 34 28
48 42 40 37 35 34 33 22
46 39 38 37 36 34 32 21
155
Tabel5.2: Pengolahan Nilai Mentah Menjadi (1-10)
Jika nilai mentah yang paling tinggi 55 dib~ri nilai 10, maka nilai untuk:
52 .
52 adalah -. x 10
55 ...
= 9,5
49
49 adalah - x 10
55
= 9,0
.
dan seterusnya.
156
PEKERTI-AAI([Jenifaian :Jfasi{<&fajar e
157
Di bawah ini digambarkan penyebaran kemampuan anggota kelompok
menurut kuroa normal
Percentage of Cases Under Potions
of the Normal Curve
Standard
Deviations -4cr -10" 0 +1cr
Begitu juga jumlah anak didik yang mendapat skor 60 ke bawah, adalah:
60 sampai dengan (60-1 S.B.) adalah 34,13%
(60-1 S.B.) sampai dengan (60-2 S.B.) adalah 13,59%
(60-2 S.B.) sampai dengan (60-3 S.B.) adalah 2,14%
158
Dengan perkataan lain jumlah anak didik. yang. memperoleh ·skor antara
(+1 S.B. s.d ~ l S.B.) adalah 68,26%, yang mendapat·skor( +2 S.B. s.d- .2
S.B.) adalah 95,44%. . . ·~ .. . . . .
Selimjutnya akan diuraikan .bagaimana inencarL skor rata-rata dan
besamya sirhpangan baku menurut cara yang J)al~ng sederhana.
a. Jumlah skor 1/6 dari mahasiswa yang memperoleh skor tinggi yaitu
jumlah =55+ 52+ 49+ 48 + 46+ 43 = 336
.
C*l W.L. Jenkins dalam EdwardS, C.H., et. al (1977) dalam Planning, Teaching and
Evaluating, Nelson Hall, Chicago.
159
c. Simpangan Baku =
Jtnriah skor 1/6 peserta kelorqrlc tinggi- Jumlah skor 1/6 peserta keloll'p)k rerrlili ·
1/2 peserta
160
Tabel5.3.: Konversi Skor Mentah Ke dalam Nilai 1 -
Contoh 2.
Juga dari Tabel 5.2.
Mahasiswa yang mendapat skor mentah 32 dengan menggunakan Tabel 5.3.
nilainya adalah:
Skor mentah = skor rata-rata + ... S.B.
· (misalkan .... = a)
32 = 38,9 +ax 6,9
32-38,9 =a+ 6,9
a .= - = -1
6,9
Jadi koefisien (a) S.B = 1 atau 1 Simpangan Baku di bawah skor rata-rata
atau
-1 S.B terletak antara 0, 75 S.B dengan
-1,25 S.B tepat di tengah 0,75 S.B dengan -1,25 S.B atau
pada nilai tengah antara 4 dan 3 yaitu 3,5.
161
Pemberian nilai dengan huruf didasarkan pada besamya skor rata-rata
dan simpangan baku. Blood dan Budd (1972, h: 201) menggunakan
rentangan berikut untuk masing-masing nilai:
Dalam salah satu harian ibu kota terdapat .satu advertensi mengenai
kesempatan bagi pemuda Indonesia untuk menjadi penerbang dengan syarat
antara lain:
1) Pria
2) Warga Negara Indonesia
3) Tinggi badan minimal165 em
4) Panjang kaki minimal 100 em
162
belum menguasai bahan tersebut. Patokan dalam proses pembeiajaran selalu
mengacu pada tujuan inshuksional umum dan tujuan instruksional khusus.
Keberhasihm seseorang dalam proses pembelajaran ditentukan oleh tingkat
penguasaan tujuan instruksional. Qengan kata ·lain nilai atau kelulusan
seseorang ditentukan oleh penguasaan tujuan instruksional. Jadi berbeda
dengan penilaian acuan norma di mana nilai ·atau kelulusan seseorang
ditentukan oleh kelompoknya.
Penilaian dengan pendekatan patokan (Penilaian Acuan Patokan, PAP)
selalu digunakan dalam sistem belajar tuntas. Sesuai dengan namanya yaitu
belajartuntas, semua tujuan instruksional yang mudah atau yang sukar, yarig
penting dan yang kurang penting harus benar-benar dikuasai. Misalnya
dalam belajar tuntas berhitung di SD kelas 1 dinyatakan setiap anak didik
harus menguasai penjumlahan dan pengurangan bilangan 1 sampai 10.
Untuk penguasaan yang tuntas, kriteria yang dikembangkan antara lain,
Anak didik dapat:
1) 2) 3) 4) 5) 6) 7)
Tl T2 T3 T4 T5 T6 T7
163
Contoh: 1) berbunyi: .anak didik kelas 1 SO dapat menunjukkan
.. angka l s/d 9·
T1 mungkin: a. linSJ<ari angka tiga pada 1, 2, 3, 4, 5
b. Hngkari angka empatpada 3, 4, 5, 6, 7,
8 dan seterusnya .
dahulu'. hasil keiJlampuan apa yari.g -akan diukur'dan cara. pengukuran yang
bagairnana yang paling tepaf untuk meiihat kemampuan tersebut (dengan tes
tertulis; lisan, pengarnatan dan sebagainya}. .
Padapengembangan butir soal untuk keperluan acuan norma, tingkat
kesukaran soal hams diperhatikan. Butit soal yang dikembangkari tidak
seluruhnya mudah dan tidak seluruhnya harus yang sukar, tetapi kombinasi
dari butir. soal yang mudah, sedarig dan sukar. sehingga keseluruhan butir
soal ters~but tingkat kesukarannya disekitar 50%. Pada pengembangan butir
soal l;lntuk acuan kriteria tingkat. kesukarannya- tidak diperhatikan· karena
maksud soal ini bukan membedakan mahasiswa yang pintar dari mahasiswa
164
yang bodoh, tetapi melihat tingkat penguasaan seseorang terhadap bahan
atau tujuan instruksionaL Juga daya pembeda tidak diperhatikan dalam
penilaian acuan kriteria, justru yang menjadi perhatian adalah daya serap
mahasiswa. Sebaiknya semua bahan atau tujuan instruksional dapat dikuasai
oleh mahasiswa (tingkat penguasaan tOO%). Penguasaan 100% bahan sukar
dicapai sehingga ada lembaga yang merasa cukup dengan tingkat
penguasaan 75% to atau 80%.
165
dalam satu rentetan kegiatan belajar. Pemberian tes semacam ini secara
periodik juga dapat memacu atau memotivasi mahasiswa untuk lebih
giat dalam belajar.
d) Mendiagnosa tingkat penguasaan kelas dapat dilaksanakan dengan
menggunakan hasil diagnosa individual. Tujuan instruksional yang
merupakan masalah bagi kebanyakan mahasiswa merupakan sasaran
.yang paling tepat untuk merancang kegiatan perbaikan (remediation).
e) Juga hasH monitoring individual dapat dijadikan sebagai monitoring
.kelompok atau hasH monitoring kelas; Dari waktu ke waktu kemajuan
kelompok atau kelas dapat dipetakan. Hasil pemetaan ini dapat
memperkirakan kemajuan yang diperoleh pada waktu yang akan datang.
f) Dengan tes acuan patokan penilaian pelaksanaan kurikulum dapat
diketjakan. Kemampuan masing-masing mahasiswa untuk
menyelesaikan kurikulum secara kumulatif akan dapat menentukan
keterlaksanaan kurikulum. Pelayanan kumulatif dosen terhadap masing-
m~sing mahasiswa juga menggambi:u metode yang paling tepat guna
dan tepat waktu.
g) Proyek atau program baru terlebih-lebih yang berlatarbelakang kegiatan
inovasi banyak menggunakan pendekatan acuan patokan. Dengan
pendekatan ini kelemahan proyek atau program dapat segera diketahui
dan diadakan penyesuaian agar dicapai hasil yang paling optimal.
h) Beberapa lembaga pendidikan yang ingin melacak kemampuan khusus
para mahasiswa dalam satu bidang sttidi, pendekatan acuan kriteria
adalah yang paling tepat untuk mendeteksinya. Sesuai dengan
pengalaman, ada sejumlah mahasiswa yang sangat menguasai
eiektronika tetapi kurang dalam arus kuat, sejumlah mahasiswa memiliki
ketelitian yang cukup tinggi tetapi kurang dalam berpikir rasional. Potensi
ini semua kalau dibina akan memotivasi individu dan kelompok dalam
belajar.
3) Penilaian Berdasarkan Acuan Patokan (PAP)
167
Rangkuman
Latihan
. 1~
VI. ANAL!SIS SOAL
Dalam bab VI ini akan dibahas anali.Sis soal yang mencakup analisis bUtit;
soal dan analiSis perclngkat soal~. Dalam . analisis .butir soal,· perhatian
· terutama ditujukan kepada menilai mutu. butir soal, yang berdasarkan pada. v
yga karakteristik butir soal yaitu: (l) tingkat kesukaran, (2) daya beda butir
soal, . dan (3) berfungsi tidaknya pilihan. Mutu. butir . soal tersebut akan
djpertimbangkan atas' dasar tiga · karakteristik ·. ini;. ·dan· dilakukan dengan
menggunakan pendekatan klasik. V · ·
. Perangkat. s6al· •akan .dianalisis . mutunya · dengan menggunakan· .dua
spesifikasi. pula, yaitu: · (l) validitas, dan (2) reliabilitas. Kedua spesifikasi ini v
merupakan hal yang paling esensial dalam menilai mutu perangkat soal.
Analisis ini diusahakan dergim menggunakan cara yang paling sederhana,
sehingga· da:pa~ dilakukan. oleh setiap dosen, walaupun tanpa paket
komputer tertentu. Tentu-saja di paspr banyak dijual paket analisis.·butir soal
. yang juga dapat,digunakan· oleh. dosen, seperti ·misalnya programJteman;
Tetapi penggunaan paket program seperti itu masih menuntuf .adanya
kemahi,ran untuk dapat menj~ankannya. ~rena itu maka hal tersebut itu
· tidak dibahas dalam bab ini.
' ' '
169
Kemampuan ini menjadi ·lebih. penting bagi .para' doseri. karena kita
belum t~rbiasa untuk menggunakan butir ._tes baku.· Bahkan di .Indonesia
belum ada tes baku yang dapat diperoleh dengan mudah oleh para pekerja
profesional,·karena metnangbelum ada badan.;badan pengembang tesbaku
· yang menyediakan tes. hasil belajar secara komersial. Di beberapa negara
maju hat·. ini tidak terlalu m.enjadi masalah,. karen~. telah tumbuh berbagai
,b~n danlen.'lbaga yang·~engem~angkantes baku secara komersiaL Yang
· dibutuhkari ialah 5etiap dosen. haruslah memenuhi .persyaratan untuk dapat
.~~mbelf dan Il'l~~gg~nakrin ._ tes briku te~~but.
. ·.- . . . ·,. _.' ' .
'
Per5yaratan
..,,.....
. .
fersebut
.
.
adalah
-
· latar bE:dakc:mg pendidik~n yang dipunyai oleh dosen, dan pengakucm
t:>rganisasi profesi akan kemampuan dosen itu untu)t dapat menggunakan tes
baku pada levelterlentu, . ·
· Kenya"an ini memperkuat alasan akan.· keharusan pagi setiap .dosen
untuki:lapaJmengembangkan butlr dan perangkattesnya sendiri yang secara
. akademi~ dapat dipertanggung jawabkan sebagai alat ukur keberhasilan
belajar. Kemampuan itu harus pula disertai .dengan kemampuan
menganalisis butir dan perangkat soal, sehingga ~tiap butir dan perangkat
soal yang digunakan benar-benar merupakan alat ukur yang baik dan
'ie~rcay~; ·; ··· · ·
170
keputusar1 demikian~ itu adalah ·keputusan .yang tidak dapat .dipertangglmg
. jawabkan; Jadi jelaslah bahwa. dibutuhkan adanya alat yang dapat diperdlya
yang dapatmengukl,lr apakah alatqkur (l:>utirsoal) yangdJgun~ memang
dapat dijadikan .da.Sar untuk menentukan keputusan yang bijaksana. lnilah
J)eran yang harus dimainkan oleh analisis butir soal, yaitu: mengukur butir
soal yang akan a~' yMg te~; ttigunakan; Hasil pengttkuran itu akan
memberi. keyakinan· pada •dosen<akan ·tepatnya ·keputusan· yang diambilnya
terhadap / mahasiswa.. ~utir soal•. yapg · ternyata .· tertalu lemah, akan sukiir
diPertanggung ·jawabkim ··. untuk · dijadikan sebagai da.Sar·. ·penentuan.
keputusan, terutama kepu~ yang sifatnya mengenai mahasiswa secara
h1dividua[ . ..
Kelemahan itu tidaklah terletak pada bentuk ~tau tipe' butir soal yang
digtitnikari; tetapi lebih banyak ditentuka.n oleh apakah butir soal itu
dikonstruksi secara baik atau tidak. Butir soal objektifakan sama baiknya
untuk mengukur keberh~ilan belajar maha5iswa dengan butir soal uraian
yang dik6nstruksi secara baik.. Bahkan.dalam. beberapa hal butir soal uraian
(essei) jauh lebih besar resikonya dari pa.da butir soal objektif,'karena mutu
butir. soal uraian. ti9ak hanya terletak pada Jremampuan mahasiswa untuk
menjawab soal· te~but, .teiclpi lebih .. bariyak dite.~tUkan ·oleh ·kemampuan
dan objektivitas dosen. dalam menskor hasil tes tetsebut. .
. . Selain itu butir soalobje~tif dapat dla~allsis secara lebih akurat dan
bertanggung jawab, sehingga dapat diketahui kelemahannya secara lebih
tepat. Hampir tidak mungkin atau belum ditemukan teknik analisis kuantitatif
yang. dapat mendeteksi kelemahannya secara akurat. Yang dapat dilakukan
hanyalah anal isis ku-alitatif, yang banyak .tergantung pada ·kerriampuan
penguasaan orang ypng melakukan analisis tersebut pada bidang studi yang
bersangkutan; Karena' itu maka uraian selanjutnya ini terutama akan
dipus~tkan pada butir soal objektif. . ·
Butir soal tiraiari ·dikonstrUksi untuk digunakan hanya satu kali (tak dapat
dipakai ulang dalam ·tes berikutnya). Karena itu butir tes uraian sebenamya
tidak membutuhkan analisis butir Soal setelah butir . soal tersebut
diadministrasikan. Karena itu pula maka butir tes uraian .tidak dapat
171
. .
Yang dimaksud tingkat kesukaran butir soal ialah proporsi peserta tes
menjawab benar terhadap butir soal tersebut. Tingkat kesukaran butir soal
biasanya dilambangkan dengan p. Makin besar nilai p (yang berarti makin
besar proporsi yang menjawab benar terhadap butir soal tersebut), makin
rendah tingkat kesukaran butir soal· itu. Yang berarti butir ·soal itu makin
mudah. Tingkat kesukaran butir soal be;kisar antara 0.0 sampai dengan 1.0.
Bila butir soal mempunyai tingkat kesukaran 0.0 berarti tidak seorangpun
peserta tes dapat menjawab hutir soal· tersebut secara benar. Tingkat
.k.esukaran 1. 0. beradi. bah.wa semua.peserlaJes dapatmenjawab butir soal itu
secara·benar.
Dari rumus itu kita tahti hahwa tlngkat kesukaran butir soal sartgat
dipengaruhi oleh tingkat kemampuan anggota kelompok peserta tes. Hila
satu butir soal diadministrasikan kepada dua kelompok peserta tes yang
berbeda tingkat kemampuannya maka hasilnya dapat diperkirakan akan
berbeda pula. Dengan demikian maka dapat dikatakan bahwa tingkat
kesukaran butir soal tidak sepenuhnya merupakan ukuran karakteristik butir
soal saja, tetapi lebih merupakan kemampuan rata-rata kelompok peserta
tes ..·Karena itu bila kita jumpai suatu butir tes yang mempunyai tingkat
kesukaran 0.45, maka interpretasinya ialah bahwa butir soal itu mempunyai
. tingkat kesukaran 0.45 untuk kelompok peserta testersebut.
Thigkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal
tertentu itu baik atau tidak baik. Tingkat kesukaran butir soal hanya
menunjukkan bahwa butir soal itu sukar atau mudah untuk kelompok
peserta tes tertentu. Butir soal hasil belajar yang terlalu sukar atau terlalu
174
mudah tidak banyak memberi informasi tentang butir soaLata~ peserta tes.
• Untuk tes hasU belajar, tingkat ke$ukaran yang di~nggap baik adaiah bUa ,./
,berkisar sekitar 0:50. Atau dengan kata lain, makin_ dekat tingkat.kesukaran
suatu·butir soal tes hasil belajar ke 0.50, makin baik butir·soal tersebut bagi
kelompok tertentu; 5eballknya,makin jauh tingkat .kesukarannya dari 0.50
. maka makin kurang informasi yang kita ·peroleh- tentang butir wal dan
kelompok peserta tes~ ·.. · · ·
Untuk dapat mengkalkulasi .tingkat kesukaran butir soal maka perlu
· dibuat tabel skor hasil tes sebagai berikut: .,.. .: . ·
,..
-·
. ' '
.
Tabel 6.1: Skor Hasil Tes Mata Kuliah So5iologi
(mahasiswa program 51, N = 10)
. ·.
Nama Nomor butir soal
Murid 1 2 3 4 5 6 7 8 9 10 Jumlah
Adam 1 . 1 1 0 0 1 1 l 0 0 6
Buhari 1 1 0 0 1 l 0 l 1 1 7
'
Carik 1 1 1 1 1 1 1 1 1 0 9
Duliman 1 0 1 1 1 1 1 1 0 1 8
Elia 1 1 0 0 1 0· 0 0 1 0 4
Fatonah
..
1 0 1 1 1 0 1 1 1 0 7
Gani 1 1 l 1 1 1 1 1 1 1 1.0
Hamid 1 1 1 0 1 1 0 1 1 0 7
lnem 1 1 0 0 0 0 1 0 1 0 4
Joni 1 1 1 0 0 0 1 1 0 0 5
Jumlah 10 8 7 4 7 6 7 8 7 3
p
.
1.0 0.8 0.7 0.4 0.7 0.6 0.7 0.8 0.7 0.3
.
Keterangan: a. 1 = jawaban benar
b. 0 = jawaban salah
c. Dalam contoh ini butir soal hanya 10 buah
175
Contoh di atas memp~rlihatkan bahwa tingkat kesukaran soal nomor J
adalah 10: 10 ::: 1:0, sedangkan butir soal nomor 10 tingkat kesukarannya
ad.alah 3 :·to = 0.3. Jadf soal nornor 1 sangat mudah bagi kelompok peserta
tes ini, sedangkan butir soal nomor-10 dapat dikategorikan sebagai soalyang
sukar untU.k. kelompok peserta tes tersebut Jika jumlah mahasiswa besar (50
ora~ atau lebih} maka perlu dibuatpembagian 3 kelompok, yaitu kelompok
atas, _tengah. dan bawah untuk mefn1,1dahkan analisis. Kelompok tengah tidak
diikutsertakan dalarri analisis butir soal.
Tingkat. kesukara~ . perangkat soal (naskah ujian) dapat ditentukan
dengan menjumlah tingkat kesukaran semua butir soal.l. kemudian dibagi
den:gan jurnlah ·butir soal. Secara singkat tingkat kesukaran perangkat soal
dapat dirurnuskan sebagai berikut: ., . ·
I:b· /.
P(naskah ujiim) = N V
176.
Tabel6.2: Tingkat Kesukaran
Sukar. = 25%
Sedang= 50%
Mudah = 25%
Dalam penggunaan butir soal dengan komposisi seperti itu maka dapat
diterapkan penilaian berdasar acuan norma atau acua11 patokan. Bila
komposisi butir soal dalam suatu naskah ujian tidak berimbang, maka
penggunaan penilaian acuan norma tidaklah tepat, karena informasi
kemampuan yang dihasilkan tidaklah akan terdistribusi dalam suatu kurva
normaL
177
suatu butir · soal yang diujikan kepada mahasiswa jurusan sosiologi akan
sangat berbeda hasil dan interpretasinya bila butir soal t~rsebut diujikan
kepada mahasiswa jurusan matematika. Daya beda butir soal biasa
disimbolkan dengan D (huruf kapital). Langkah-langkah untuk mengkalkulasi
daya beda adalah sebagai berikut:
a. susunlah urutan peserta tes berdasarkan skor yang diperolehnya, ·mulai
dari skor tertinggi sampai ke skor terendah.
h. bagilah peserta tes tersebut menjadi dua kelompok yang sama
jumlahnya. Bila jumlah ·peserta tes ganjil, maka peserta yang di tengah-
tengah tak usah dimasukkan kedalam salah satu kelompok. Kelompok
pertama dinamakan kelompok prestasi tinggi (kelompok atas) dan
kelompok kedua dinamakan kelompok prestasi rendah kelompok
bawah). Bila jumlah peserta cukup besar (lebih dari 50) maka diambil
27% dari kelompok atas dan 27% dan kelompok bawah,.
c. hitunglah jumlah kelompok atas yang menjawab benar terhadap butir
soal yang akan dikalkulasi daya bedanya. Demikian pula untuk
kelompok bawah.
d. kalkulasilah proporsi peserta yang menjawab benar terhadap butir soal
tersebut untuk masing-masing kelompok.
e. kurangilah proporsi keiompok atas dari kelompok. bawah, dan
diperolehlah indeks daya beda butir soal tersebut.
Bila data pada Tabel nomor 6.1 di atas diterapkan untuk menghitung
day a beda butir soal nom or 5, maka akan .diperoleh daftar sebagai
berikut:
Gani 10
Carik 9
Duliman 8 Kelompok atas
Buhari 7
Fatonah 7
178
Hamid 7
Adam 6
JOni 5 ·Ketompokbawah.
Elia 4
lnem · 4
- - . . ·. . .
. . . Ba -Bb'
D= . . .
. Q.ST.
. .: . ·. .· .. . . ,
' '
Indeks atau koefis1en d~yabeda b,erki~ antara + l.OJsarnpai dengan
;.1.0. Daya beda + 1.0 _berarti bahwa semua anggota kelompok atas
menjawab_. benar··. terhadap butir soal itu, sedangkari· kelompok bawah
selurubnya menjawab_ salah · terhadap butir soal ifu .. Sebalik11ya · daya beda
-1.0 berarti bahwa semua anggota kele>mpok atas menjawab bUtir soal satan
itu, sedangkan kelompok bawah seluruhnya· menjawab benar terhadap butir
soal ifu.
179
,Daya beda- yang diangg~p masih . memadai untuk sebuijt. ,SOilll
-~~"'' ~ i ·
ialah
~;-''••'><"""-c...-,"';('w-«:•"-""C:,".,'••,'""'""'~:''"'-~·c-:,~' '!'""'""-'-~-"'~~·?r'"'"''·,.,....·-;~-""':";"""""' ,_.,._,._~ ~ ~'"'f">~;p:$f.~~·'i~ s~ l)liJdii(~ .. .. 4. j _ . 3)!!1
apabila sama atau lebih besar dari +0:25. Bila lepih kecil dari itu,.maka butir
soat· tersebut ~i.~ns~ap.k~r~~~"6~~a~§~:E~~ yang "
mempersiapkan am
aaiam menghadapi te5 tersebut dari peserta tes. yang.
tidak mernpersiapkan diri. Bahkan ·. bila daya beda itu menjadi negatif, maka
butir soal ifu sama sekali tidak dapat dipakai sebagai alat ukui: prestasi
b,elqjc:u,,,J1la~asi~a. -~\&rena •· itu-.butir s()al·· ter$,~b\it · h;trus dikeluarkan, ·dari
p~rdngk,at·wal, .atau tidakdihJ~ng dalam·.pe.nentuaJ1· skoi lll.ahasiswg.• ~aldi1
tinggi ·daya bed.a suatu butlr soal, maka makin baik butir soal tersebut, .clan
sebiiliknya rn.akiri rendah ·gaya bedanya, maka. butir soal itu. dianggap rnakin
tidak baik. , ..
,Cara kalkulasi daya beda yang Jelah · didemonstrasikan di atas
merupakan car,a;yangpaling.sederhanp, g.~. dapat dilakukanAengan mudah
oleh setiap do&en:.YaJ"lg terlatiK [)isa:tnping.~a. \tu ~sjh ·acia be}?erapa cara
lagi yang dapat digUnakan untUk mengkalkulasi daya. b,eda butir soal. Cara-
cara te~ebut antara lain dengan korelasi. Kalkulasi korela:Si ' tintuk .
menentukan daya beda butir soc:U terlalum.emakan tenaga dan waktu; bila
harus dtlakukan secara manual ..Karena itu tidak dianjurkan untuk dilakukan
oleh dosen .. Tetapl bila dosen mengguna~p. ,komputer sebagai' alat. bantu,
atau .menggunak(ln pereipgkat.lunakkomputer ·b~rupa program analisis butir
soal.yang dijual ~ebas di pasar, rnakal~~ih baik digunakan koefisien korelasi
t~~b.ut. . ~~-,,~i~£lJ§~!<g~l§L~!L~~•l• ...Y~Da,~.lii-~s!~~~Q,,"~~IJ~~k
r:!}~J.:lghitu~ day~'pedaJ~.'t!!r~.v~: r ' •
(a) Koefisien korefasi. oiseriai, yaifu huboogan korelasi antara dua skor, yaitu
, skor butir soai dan skor keselqruhan dan peserta tes yang sama. ,
{b) 'Koe~i~I1,kprelasi point biSerial, yang pacia prinsipnya sama saja dengan
· korelaSi bi~rial, te~pi dengan cara menghitUng yang berbeda dan dasar
teoritik' yang betbeda pula. . ..· .· . . . . . . . ·
Berbeda d&f tingkat kesukaran, daya ·beda butir soal s~cara .··langsung
menentukan kualitas butii soal, dalam arti kualitas konstruksi butir soaL
. ana suafu butil' soal rendah daya '~dimya; maka konstruksi butir soal
tersebut dapat dinilai sebagai tidak baik. Karena itu pulalah maka bila.
180 .
akan merevisi butiuoal, patokan utama yang arum digunakan ialah daya
beda butir .soal.
Dengan menggunakan cara. kalkulasi yang sama setiap option dalam
suatu butlr soal dapat dihitung daya bedanya. Hanya untuk ·option yang
bukan .pilihan (yaitu option pengecoh) daya bedanya haruslah negatif.
Artinya anggota kelompok bawah haruslah lebih banyak memilih
pengecoh dari pada anggota kelompok atas. Bila semua daya beda
pengecoh itu dikalkulasi,·· maka ·akan sangat memudahkan· perevisi soal
memperbaiki soal tersebut, karena secara langsung dapat dilihat di mana
letak masalah konstruksi butir soal tersebut
p = 0.458
r bis = 0.096
rp bis = 0.123
181
{3) Berfungsi Tidaknya Pilihan
Ke::;;--~an
. A B* c D
Atas 0 4 1 0
Bawah 1 2 1 1
Jumlah 1 6 2 1
182
· (b) ButirSoal No.2
Ke ~ A B
-
c D*
Atas 0 1 1 3
-,,
'
Bawah ",
0 1 2 2
Jumlah 0 2 3 5
'
Atas >
1 2 2 0
Bawah 3 0 1 1
Jumlah 4 2 3 1
183
pilihan B dan C cukup menarik sebagaijawaban yang·berian~:tali ii)ilihan
A yang p,edu diperbaiki.
b. .Spesifi~ast
.. Butir. Soal
. ,;r·:.~ ')
Setiap butir soal secara spesifik mengukur satu bagian tertentu dari isi
pelaj.ara.·.n. Y
..ang telah diajarkan. }3agian' itu dapat berupa satu .konsep.. satu
preposisi; satu dalil, satu sikap, atau satu keterampilan tertentu. Masalah
yang mungkin timbul ialah b4tir soai yang dikonstruksi untuk mengukur
suatu bagian pelajaran tertentu, karena konstruksinya yang lemah temyata
~ se_£ara~~1!@1.J:neoQ't.LkJJ.I.Y~IJJLf!l~~-~k~:1Jal'am 'hal 'itu butir
soal tersebuttidaklah rnerupakan butit soal yang cukup baik. . . .
Untuk menenfukan apaka:h suatu hutir soal merupakal) alat ukui·yang
baik untuk suatu hasil belajar terteritu maka diperlukan adanya analisis isi
' ' / . . . ~ttl:¢> .• ~~
pe~ajaran. Analisis seperti ini hanya dapat dilakukan oleh seoranfi yang
menguasai·· bidang sfudi tersebut dengan baik. Jadi analisis· valichtas .isi
haruslah dilakukan oleh seorang ahli bidang studi. Analisis harus dimulai
dengan mengadakan ~i~,n,; terhac!ap ~· k~si·ki~i · ..~P~ .Dalam ~.. ~!;!:~tu
ditentukan bahwa butir soal tertentu itu dimaksudkan untuk mengukur,pokok
bahasan atau sub pokok bahasan tertentu. Jadi kisi-kisi harus dijadikan
.sebagai tolok ukur analisis. . ·
184
.(2} Keterukurantujuan
Aspek · kedua yang harus dianalisis secara kualitatif -oleh se<>rang ahli
bidang.' studi ialah · apakah butir soal: yang diaunakan mengukur. tujuan
.penQidikan tertentu. ·. yang · ditetapkan dalcun. kisi~kisi. Untuk ·. melakukat1
amuisis ·. ini dibutuhkan penguasaan:. akan .tujuan pendidikan:. Karena ~,i.
JndoJ:lesia,pengarult peruniusan tujuan pendidikan. masih .sangat. dipengar\lfil'. ·
.oleh tcU<sonomi tujuan wndidikart oleh B. Bloom; dan kawan~kaw~{1956),
.penilaian haruslah.Qilakukan. ol~b ~orang yang mernahami_ dan ffiengtiasai
\)iqang ini. Yang ;penting~untuk dipex;hatikan bahwa butir soal. yang tidak
secar:a akurat rnengukur h1Juan yang. telah ditetapkan akan m~rupakaJ1 buti~ :
soal.· Y:cil:)g mubazir. ~hkan bUa · .butir soat: .• te~ebut . ciukutserta~n. clal~ .
pertirnb~ngan .\J:ntuk• menentul«tn . keputU~an· bagi. ·seseorangl. .. · .maim
. ;keputusatt, tersebut. dapat ·. berakipat i~t,lh .~li m!llsa yang akan ·d~~.ng bagi
.ma~a.sis~a·.•~~~;~iie;~!Lct~fla~~~·J?:stl\l~.~~.~·
m~njf!di~a9 eer~ll~~}s~~~~~~~~~!U~?l,k. Mas~,h~~~.d~~J~~~~~
haf\.ls diperhatikan dalam menilai goal ujian, yaitu rellabilitas a~;Jl~vat~ditas
·~'serihit~ "ini. ·ak~ .rlib;h;·~k~<ii~a:··hiu. 'tersebut "'~'Cara ";;'ci~~h~n~··aan
. !iw~at. . . .
185
memaksa mahasiswa menebak, atau mungkin juga karena butir soal yang
membentuk perangkat ujian terlalu sedikit sehingga tidak dapat mewakili
keseluruhan bahan yang diujikan.
Untuk mengetahui sejauh mana suatu tes memang dapat dipercaya
sebagai alat ukur yang akan dapat menggambarkan kemampuan peserta tes,
kita ·perlu inembahas satu aspek penting dalam tes, yaitu reliabilitas tes.
Konsep reliabilitas ini secara umum dapat diartikan sebagai sejauh mana
suatu alat ukur dapat diyakini memberikan informasi yang konsisten dan
tidak mendua tentang karakteristik peserta tes yang diujikan.
Tentu saja suatu tes ·dapat dikatakan reliabiHtas bila skor yang diperoleh
melalui tes itu merupakan skor yang sesungguhnya menggambarkan
kemampuan 1'eserta tes, bukan karena berspekulasi yang akan melahirkan
skor yang kebetulan. Untuk itulah maka dalam membahas reliabilitas tes
pertama-tama kita harus memahami hakekat skor hasil tes. Skor yang
diperoleh peserta tes pada dasamya merupakan skor yang secara langsung
berhubungan dengan alat ukurdan kondisi ekstemal sewaktu pengujian itu
berlangsung. Kondisi ekstemal itu tidak dapat didefinisikan sepenuhnya.
Demikian pula dengan alat ukur yang digunakan tidak diketahui sepenuhnya
kekuatan dan kelemahannya. J.adi skor yang diperoleh seorang peserta tes
adalah skor yang kemungkinan besar mengandung kekeliruan. Kekeliruan itu
sendiri tidak dapat diketahui. Seandainya skor itu tidak mengandung unsur
kekeliruan, maka skor yang diperoleh peserta tes itu adalah skor yang
sesungguhnya. Tetapi skor yang sesungguhnya itupun tidak kita ketahui.
Untuk itu maka kita kenal adanya tiga bentuk skor dalam setiap hasil tes: (1)
skor yang diperoleh (obtained score), (2) skor yang sesungguhnya (true
score), dan (3) kekeliruan (error) skor. Secara teoritik ketiga unsur ter!ebut
berhubungan: skor yang diperoleh = skor sesungguhnya - kekeliruan.
Secara operasional reliabilitas dapat didefinisikan sebagai koefisien korelasi
antara dua perangkat skor yang dihasilkan oleh perangkat tes yang sama
atau paralel yang diadministrasikan kepada sekelompok peserta tes yang
sama. Dengan demikian maka secara operasional reliabilitas tes merupakan:
186
a.
C;
187
· b~nar-benar ekuivalen, walaupun tes tersebut dikonstruksi untuk
.J11engu)<ur tujuan dan isi yang~r;a.-· ·'··· ···~~····''·,.,.,.·~..c •.
KR-20·= ~[SD2
ri -1
-L;pq]
. 50 2
188
Beliabilitas perangkat soal sgca@ umum dapat dipengaruhi oleh:
a. Objektivitas dalam penskoran tes. Tes yang tidak dapat diskor secara
objektif tentu saja reliabilitasnya akan
,Variabilitas peserta tes. Makin bervariasi peserta tes, kemungkinan
reliabilitas akan meningkat. Seluruh peserta tes sama
kernampuannya akan menghasilkan reliabilitas.tes yang
c. Jumlah butir soal dalam perangk~t tes. Makin banyak butir soal maka
makin tinggi re!iabiHtas perangkat tes tersebut.
(2) Validitas
Aspek lain yang sangat penting dalam menilai perangkat soal ialah aspek
validitas tes. Validitas tes dapat didefinisikan sebagai seberapa jauh
perangkat tes itu berguna dalam mengambil keputusan yang rei evan dengan
tujuan yang telah ditentukan. Atau secara sederhana dapat dikatakan bahwa
validitas tes berarti seberapa jauh tes .itu memang mengukur kemampuan
dalam bidang studi yang ingin diukur dengan tes tersebut, atau yang sesuai
dengan tujuan yang telah dirumuskan terlebih dahulu.
Untuk tes hasil belajar, aspek validitas yang penting
dikenal dengan nama validitas isi (content v~lidity). Yang dimaksud ,""'""~'"'
validitas isi ialah ukuran yang menunjukkan sejauh mana skor
oe1rasostas1 dengan penguasaan peserta tes dalam bidang studi
Untuk
yang bidang studi terset1u
nu<<.UHULU daripada analisis kuantitatif. Orang yang
menguasa1 IS! studi yang dites tentu dapat melakukan
penilaian tentang isi tes.
Selain itu masih dikenal beberapa jenis validitas tes lainnya, seperti:'
validitas prediktif, validitas serempak (concurrent validity) dan validitas
konstrak. Tiga jenis validitas yang disebut belakangan ini tidak bahas
lebih lanjut, karena tidak terlalu kuat hubungannya dengan kebutuhan
penilaian perangkat soal hasil belajar.
189
. . .
Hal-hal ya~g mempengaruhi validitas tes adalah:
a. ti11gkat ·reliabitas te$, M~n tinggi· reliabit;· t~: ~~ makin tinggi pula
validitas tes. . . . "" .. . ·-
b~ khusqs untuk validitas prediktif, jarak antara petnberian tes dengan
. tingkah laku yang dirainallmntenhi akBn beipel1ganih. Jarak waktu ·yang
terlalu jauh akan mengmangi validitcis predi}<tif' tes .. ter5ebui, karena
besamya pengaruh fakt()r lain terhadap tingkah laku yang diramalkan .
.. " -. . , 0 ·~ • - ••• • .... ~ '.. ••• '··"'
Rangkuman
Ana/isis sda./ mencakup ana/isis butir soal dan perangkat soal. Ana/isis
butir soal,dilihatdari tingkatkesukatannya, daya bedimya dan ber.fungsi
tidakriya piiihan. Serpentara ana/isiS perangkat soallebih ditujukan pada
.tingkat validitas dan te/iabilitas. ·· .
..
Latihan··
.r
190
Penutup
191
Dattar Pustak~
Undeman, R. rL
1967. Educational Measurement., N. J.: Scott Foresman
and Company.
192
PEKERTI·AAIPenilaian 1fasil 0ela}4r-•
.
193
Senarai Kata-:-Kata Penting
DayaBeda
angka atau skala yang menunjukkan kemampuan butir soal untuk
membedakan kelompok peserta tes yang berprestasi tinggi dari kelompok
peserta tes yang berprestasi renda:h.
Distractor (Pengecoh)
adalah option yang bukan •kunci, sebagai altematif yang mirip dengan
kunci; berguna bagi pengujian tingkat penguasaan peserta tes ten tang hal
yang dipertanyakan dalam butir soal bersangkutan.
Formatif
penggunaan tes untuk memperoleh umpan balik selama proses
pembelajaran sedang berlangsung. Hasil penilaian formatif dapat
digunakan untuk memperbaiki proses pembe!ajaran yang sedang
berlangsung tersebut.
Evaluasi Sumatif .
peniiaian yang dilakukan pada akhir dari suatu unit kegiatan belajar-
mengajar tertentu untuk mengambil keputusan tentang berhasil atau
194
gagalnya suatu proses pembelajaran secara keseluruhan suatu mata
kuliah.
Homogenitas
biasanya dikatakan terhadap option dalam tipe tes objektif yang
menunjukkan tingkat kemiripan dari semua altematif ·jawaban yang
disediakan.
Kemenduaan (Ambiguity)
salah satu kelemahan butir soal yang disebabkan kunci yang· meragukan,
terutama bila kundtersebut dinilai oleh ahli.
Kunci Jawaban
salah satu option atau altematif jawaba~ yang benar dalam suatu
soal objektif.
Mastery Test
tes yang dirancang untuk mengukur kemampuan akan penguasaan
minimal yang harus dikuasai oleh peserta tes. Tes seperti ini biasanya
digunakan i.mtuk menentukan tingkat ketuntasan penguasaan bidang
studi atau bagian bahan pelajaran tertentu.
195
yang mengharuskan peserta tes menjodohkan masing-masing butir pada
·kelompok soal dengan salah satu altematif keiompokjawaban.
Nilai (Grade)
angka atau skala tertentu yang· menggambarkan tingkat kemampuan
peserta tes, yang menggambarkan kedudukan peserta tes tersebut
diantara peserta tes lain atau penguasaannya terhadap suatu bidang
studi atau mata kuliah tertentu. Nilai diperoleh melalui pengolahan dad
hasii atau skor tes.
Option
altematif pilihan, keseluruhan kemungkinan jawaban yang disediakan
dalam satu butir soal objektif.
Pengukuran (Measurement)
pemberian angka kepada suatu atribut atau karakteristik seseorang,
peristiwa atau objek menurut suatu aturan atau ketentuan atau formula
tertentu .
Penilaian (Eualuasi}
suatu proses penilaian untuk mengambil keputusan, dengan
menggunakan informasi yang diperoleh melalui pengukuran hasH belajar,
baik yang menggunakan instrumen tes ataupun non tes.
Power Test
tes yang terdiri dari butir-butir soal dengan tingkat kesukaran yang tinggi,
dan secara relatif mempunyai batas waktu yang longgar untuk
meresponnya.
196
. Rating Scale (Skala Sikap)
salah •satu tipe lnstrumen pengukuran hasil· belajar . non-tes · yang
digunakan untuk r:nencatathasil0bservasi s~car.a sistematis.
ReliabilitaS
· suatu ;koefisiel'l ·.Yang meninijukkari ~jauh mana. $uatt( tes sec~ra
konsisten trterriberif<ari informasl
yang sama: Koeft81e~ retiaoilimi> dapat
· menufijukkan tingJ<at stabilitas, ekuavalen~i, dan konsistensi dari $uatU
· tes·
?·
· ·sample Test ·
. tes atau suatU ujian yahg butir-butir soalnya dipilil~ darisuatu populasi
butfr soaftertentu. . .
Skala lhterual
·skala atauangka yang mertdliki perbedaan yang sama antcir ahgka yang
· beniJ:Utah. Misalriya ~mgka penanggaliu1 (kalender} ·
'-·-<:"', . . ·. .:,> .. ' .
Skala Nominal
skala a tau angka. yang ·. bersifat · ku~itati{, yang i:neinbedakan .suatU
.· kategoti d.an ,kat~ori laip.pya .tanpa mellunjukkan UJ'Utan. ' S~ala. ini
hanya membedakan obJek dalam kat~ori, •djskret. Misalnya nom or
pun~ng pemain sepakbola. · ··
Skala Ordinal.
· skala ~ang r:nembedal<an objek atas rangking atau urutan, ....tanpa
memperhatikan mutu dari perbedaan itu. Misalnya perbedaan nilai yang
diperoleh mahasiswa dalam suatu mata kuliah. ,
,197
kala rasio
. skala atau angka yang mempunyai nol absolut dan interval yang sama
antar angka yang berurutan. Misalnya: skala jarak.
kor
angka yang diberikan kepada ~rta tes, yang mendeskripsikan secara
kuantitatifkemampuapnyamenjawab satu butir soal tertentu.
peed Test
tes yang terdiri dari butir-butir soal yang mudah dan sederhana sehingga
dapat diperkirakan seluruh ·peserta tes dan dapat dijawab a tau direspon
secara benar kecuali mereka yang tidak hati-hati. Tes seperti ihl biasanya
wakturiya sangat ketat.
es·(Test)
suatu tugas atau seperangkat tugas/pertanyaan yang direnc?nakan untuk
memperoleh informas1 tentang trait atau atribut pendidikan atau ·
psikologik yang seti~p butimya . mempunyai jawaban atau ketentuan
yang dianggap benar. ·
. TesBuatan Goru(Teacher:~madeTest). · .. . . . ·
tes yang dikonstruksi oleh pengajar atau dosen yang biasanya tanpa uji
coba lebih -~hulu dan tidpk lllempupyai. kelompok .norma yang tetap.
199 ..
Tes Penempatan (Placement Test)
tes yang dirancang untuk memprediksi program maksimal yang dapat
diikuti oleh seorang peserta didik pada saat tertentu.
r;ngkat Kesukaran
angka atau skala yang menunjukkan proporsi peserta tes menjawab
benar terhadap suatu butir soal tertentu. Makin besar koefisien tingkat
kesukarannya berarti makin besar proporsi peserta tes yang menjawab
benar terhadap butir soal tersebut; yang berarti bahwa butir soal tersebut
makin mudah.
faliditas
· acapkali di-Indonesia-kan dengan istilah kesahihan. Validitas suatu tes
didefinisikan sebagai derajat kemampuan tes mengukur apa yang
seharusnya ia ukur, atau secara populer dapat dikatakan sebagai derajat
kemampuan memberikan informasi. yang dimaksudkan ketika tes
tersebut dibuat. ·Secara teknis validitas dapat didefinisikan sebagai
seberapa jauh suatu alat ukur atau tes sesuai dengan kriteria yang
ditetapkan.
:00
_lndeks .Materi Pe~befajaran
201
Pengukuran 5, 15 berganda 79
Menggunakan gambar,
Penilaian,
Definisi 7, 15 grafik, tabel, diagram 80
Formatif 8 Rating Scale (Skala Lajuan) (RS)
Sumatif 8 Numerical RS 99
Kegunaan 9 Pengembangan NRS 100
Acuan norma (PAN) 10,138, Contoh 102
146 Descriptive graphical RS 102
Acuan kriteria (PAKIPAP) 10, Ranking method RS 103
146 Paired comparison RS 105
Perbandingan tes objektif Reliabilitas 169
dengan tes uraian 81 Scanning machine 126
Pelaksanaan tes,
Skala sikap 109
Diberitahukan 120 Skala Likert 111
Usan 123 Skala Thurstone 112
Perbuatan/tindakan 124 Skala Guttmann 113
Perencanaan tes,
Skor rata-rata, 142
Pengambilan sampel 17 Menghitung 143
Tipe/ragam tes 18
Aspek kemampuan 18 Simpangan baku, 142
Jumlah butir soal 20 Menghitung 143
Pilihan ganda, 65 Sintesis (proses berpikir) 89
Pengecoh 66 Tes,
Pokoksoal 66 Definisi 3, 15
. Keterbatasan 68 Bentuk, tipe, ragam 4
Pririsip konstruksi 70 Awal (pre test) 30
Biasa 77 Akhir (post test) 30
Analisis hubungan antar hal 77 Diagnostik 31
Analisis kasus 78 Formatif 31
Kompleks/melengkapi
202
Prestasi belajar 31
Tarap serap 31
Uraian
Konstruksi tes uraian 49
Pedoman skoring tes
uraian 51
kata kunci tes uraian 53
Validitas 171
203
RIWAYAT HIDUP PENULIS
204
PEKERTt-AAI<Penifaian Jfasi{<Befajare
205