TEKNIK TES DAN TEKNIK NON TES SEBAGAI ALAT EVALUASI HASIL
BELAJAR
Menurut pengertian bahasa kata evaluasi berasal dari bahasa inggris evaluation yang
berarti penilaian atau penaksiran. Sedangkan menurut pengertian istilah evaluasi merupakan
kegiatan yang terencana untuk mengetahui keadaan sesuatu obyek dengan menggunakan
instrumen dan hasilnya dibandingkan dengan tolak ukur untuk memperoleh kesimpulan.1[2]
Evaluasi bukan sekedar menilai suatu aktivitas secara sepontan dan insidental, melainkan
merupakan kegiatan untuk menilai sesuatu secara terencana, sistematik, dan terarah berdasarkan
atas tujuan yang jelas.
A. TENIK TES
1. Pengertian tes
Tes berasal dari bahasa latin testum yang berarti alat untuk mengukur tanah. Dalam bahasa
Perancis kuno, kata tes berarti ukuran yang dipergunakan untuk membedakan antara emas
dengan perak serta logam lainnya. 2[3] sedangakan menurut sumadi surya brata, mengertikan tes
adalah pertanyaan-pertanyaan yang harus dijawab dan atau perintah-perintah yang harus
dijalankan, yang mendasarkan testee menjawab pertanyaan-pertanyaan atau atau melakaukan
perintah-perintah itu, meyelidiki mengambil kesimpulan dengan cara membandingkan dengan
standar atau testee lainnya.
Dari kedua pengertian diatas maka dapat diketahui bahwa tes adalah alat pengukuran
berupa pertanyaan, perintah, dan petunjuk yang ditunjukan kepada testee untuk mendapatkan
respon sesuai dengan petunjuk itu. Atas dasar respon tersebut ditentukan tinggi rendahnya akor
dalam bentuk kuantitatif selanjutnya dibandingkan dengan standar yang telah ditentukan untuk
ditarik kesimpulan yang bersifat kuantitatif.
2. Fungsi Tes
Secara umum, ada dua macam fungsi yang dimiliki oleh tes, yaitu:
a. Sebagai alat pengukur terhadap peserta didik.
b. Sebagai alat pengukur keberhasilan program pengajaran, sebab melalui tes tersebut akan dapat
diketahui sudah seberapa jauh program pengajaran yang telah ditentukan.
3. Penggolongan Tes
Sebagai alat pengukur, tes dapat dibedakan menjadi beberapa jenis atau golongan,
tergantung dari segi mana atau dengan alasan apa penggolongan tes itu dilakukan.
a. Penggolongan Tes Berdasarkan Fungsinya Sebagai Alat Pengukur Perkembangan/
Kemajuan Belajar Peserta Didik.
1) Tes seleksi. Sering dikenal dengan istilah “ujian ringan” atau “ujian masuk”. Tes ini
dilaksanakan dalam rangka penerimaan calon siswa baru, di mana hasil tes digunakan untuk
memilih calon peserta didik yang tergolong paling baik dari sekian banyak calon yang mengikuti
tes.
2) Tes awal. Tes awal sering dikenal dengan istilah pre-test. Tes jenis ini dilaksanakan dengan
tujuan untuk mengetahui sejauh manakah materi atau bahan pelajaran yang akan diajarkan telah
dapat dikuasai oleh para peserta didik. Jadi tes awal adalah tes yang dilaksanakan sebelum bahan
pelajaran diberikan kepada peserta didik. Karena itu maka butir-butir soalnya dibuat yang
mudah-mudah.
3) Tes akhir. Sering dikenal dengan post-test. Tes akhir dilaksanakan dengan tujuan untuk
mengetahui apakah semua materi pelajaran yang tergolong penting sudah dapat dikuasai dengan
sebaik-baiknya oleh para peserta didik.
4) Tes diagnostic. Adalah tes yang dilaksanakan untuk menentukan secara tepat , jenis kesukaran
yang dihadapi oleh para peserta didik dalam suatu mata pelajaran tertentu. Dengan diketahuinya
jenis-jenis kesukaran yang dihadapi oleh peserta didik itu maka lebih lanjut akan dapat dicarikan
upaya berupa pengobatan yang tepat. Tes ini juga bertujuan ingin menemukan jawab atas
pertanyaan “Apakah peserta didik sudah dapat menguasai pengetahuan yang merupakan dasar
atau landasan untuk dapat menerima pengetahuan selanjutnya?”
5) Tes formatif. Adalah tes hasil belajar yang bertujuan untuk mengetahui, sudah sejauh manakah
peserta didik “telah terbentuk” (sesuai dengan tujuan pengajaran yang telah ditentukan) setelah
mereka mengikuti proses pembelajaran dalam jangka waktu tertentu. Perlu diketahui bahwa
istilah “formatif” itu berasal dari kata “form” yang berarti “bentuk”.
6) Tes sumatif. Adalah tes hasil belajar yang dilaksanakan setelah sekumpulan satuan program
pengajaran selesai diberikan. Di sekolah tes ini dikenal dengan istilah “Ulangan Umum” atau
“EBTA” (Evaluasi Belajar Tahap Akhir), dimana hasilnya digunakan untuk mengisi rapor atau
mengisi ijazah (STTB). Tes sumatif dilaksanakan secara tertulis, agar semua siswa memperoleh
soal yang sama. Butir-butir soal yang dikemukakan dalam tes sumatif ini pada umumnya juga
lebih sulit atau lebih berat daripada butir-butir soal tes formatif.
c. Penggolongan Lain-lain
Ditilik dari segi banyaknya orang yang mengikuti tes, tes dapat dibedakan menjadi dua
golongan, yaitu:
1) Tes individual, yakni tes di mana tester hanya berhadapan dengan satu orang testee saja, dan;
2) Tes kelompok, yakni tes di mana tester berhadapan dengan lebih dari satu orang testee.
Ditilik dari segi waktu yang disediakan bagi testee untuk menyelesaika tes, tes dapat
dibedakan menjadi dua golongan, yaitu:
1) Power test, yakni tes di mana waktu yang disediakan buat testee untuk menyelesaikan tes
tersebut tidak dibatasi, dan;
2) Speed test, yakni tes di mana waktu yang disediakan buat testee untuk menyelesaikan tes
tersebut dibatasi.
Ditilik dari segi bentuk responnya, tes dapat dibedakan menjadi dua golongan,yaitu:
1) Verbal test, yakni suaut tes yang menghendaki respon (jawaban) yang tertuang dalam bentuk
ungkapan kata-kata atau kalimat, baik secara lisan maupun secara tertulis, dan;
2) Nonverbal test, yakni tes yang menghendaki respon (jawaban) dari testee bukan berupa
ungkapan kata-kata atau kalimat, melainkan berupa tindakan atau tingkah laku; jadi respon yang
dikehendaki muncul dari testee adalah berupa perbuatan atau gerakan-gerakan tertentu.
Apabila ditinjau dari segi cara mengajukan pertanyaan dan cara memberikan jawabannya, tes
dapat dibedakan menjadi dua golongan, yaitu:
1) Tes tertulis, yakni jenis tes dimana tester dalam mengajukan butir-butir pertanyaan atau soalnya
dilakukan secara tertulis dan testee memberikan jawabannya juga secara tertulis.
2) Tes lisan, yakni tes di mana tester di dalam mengajukan pertanyaan-pertanyaan atau soalnya
dilakukan secara lisan, dan testee memberikan jawabannya secara lisan pula.
3) Observasi Eksperimental
Observasi eksperimental adalah observasi yang dilakukan secara nonpartisipatif tetapi
sistematis. Tujuannya untuk mengetahui atau melihat perubahan, gejala-gejala sebagai akibat
dari situasi yang sengaja diadakan.
Sebagai alat evaluasi , observasi digunakan untuk:
a) Menilai minat, sikap dan nilai yang terkandung dalam diri siswa.
b) Melihat proses kegiatan yang dilakukan oleh siswa maupun kelompok.
c) Suatu tes essay / obyektif tidak dapat menunjukan seberapa kemampuan siswa dapat
menjelaskan pendapatnya secara lisan, dalam bekerja kelompok dan juga kemampuan siswa
dalam mengumpulkan data
b. Sifat Observasi
Observasi yang baik dan tepat harus memilki sifat-sifat tertentu yaitu:
1. Hanya dilakukan sesuai dengan tujuan pengajaran
2. Direncanakan secara sistematis
3. Hasilnya dicatat dan diolah sesuai dengan tujuan
4. Dapat diperika validitas, rehabilitas dan ketelitiaanya.
c. Kelebihan dan Kelemahan Observasi
Observasi sebagai alat penilain nontes, mempunyai beberapa kelebihan, antara lain:
1. Observasi dapat memperoleh data sebagai aspek tingkah laku anak.
2. Dalam observasi memungkinkan pencatatan yang serempak dengan terjadinya suatu gejala atau
kejadian yang penting
3. Observasi dapat dilakukan untuk melengkapi dan mencek data yang diperoleh dari teknik lain,
misalnya wawancara atau angket
4. Observer tidak perlu mengunakan bahasa untuk berkomunikasi dengan objek yang diamati,
kalaupun menggunakan, maka hanya sebentar dan tidak langsung memegang peran.
Selain keuntungan diatas, observer juga mempunyai beberapa kelemahan, antara lain:
1. Observer tiidak dapat mengungkapkan kehidupan pribadi seseorag yang sangat dirahasiakan.
Apabila seseorang yang diamati sengaja merahasiakan kehidupannya maka tidak dapat diketahui
dengan observasi. Misalnya mengamati anak yang menyayi, dia kelihatan gembira, lincah .
Tetapi belum tentu hatinya gembira, dan bahagia. Mungkin sebaliknya, dia sedih dan duka tetapi
dirahasiakan.
2. Apabila si objek yang diobservasikan mengetahui kalau sedang diobservasi maka tidak mustahil
tingkah lakunya dibuat-buat, agar observer merasa senang.
3. Observer banyak tergantung kepada faktor-faktor yang tidak dapat dapat dikontrol sebelumya.
2. Wawancara (interview/al-Hiwar)
Wawancara merupakan suatu cara yang dilakukan secara lisan yang berisikan pertanyaan-
pertanyaan yang sesuai dengan tujuan informsi yang hendak digali. wawancara dibagi dalam 2
kategori, yaitu pertama, wawancara bebas yaitu si penjawab (responden) diperkenankan untuk
memberikan jawaban secara bebas sesuai dengan yang ia diketahui tanpa diberikan batasan oleh
pewawancara. Kedua adalah wawancara terpimpin dimana pewawancara telah menyusun
pertanyaan pertanyaan terlebih dahulu yang bertujuan untuk menggiring penjawab pada
informasi-informasi yang diperlukan saja.
Wawancara adalah suatu tehnik penilain yang dilakukan dengan jalan percakapan (dialog)
baik secara langsung (face to pace relition) secara langsung apabila wawancara itu dilakukan
kepada orang lain misalnya kepada orang tuannya atau kepada temanya. Keberhasilan
wawancara sebagai alat penilaian sangat dipengaruhi oleh beberapa hal :
a. Hubungan baik pewawancara dengan anak yang diwawancarai. Dalam hal ini hendaknya
pewawancara dapat menyesuikan diri dengan orang yang diwawancarai
b. Keterampilan pewawancara
Keterampilan pewawancara sangat besar pengaruhnya terhadap hasil wawancara yang dilakukan,
karena guru perlu melatih diri agar meiliki keterampilan dalam melaksanakan wawancara.
c. Pedoman wawancara
Keberhasilan wawancara juga sangat dipengaruhi oleh pedoman yang dibuat oleh guru sebelum
guru melaksanakan wawancara harus membuat pedoman-pedoman secara terperinci, tentang
pertanyaan yang akan diajukan.
3. Angket (Questionnaire/Istifta)
Angket juga dapat dipergunakan sebagai alat bantu dalam rangka penilaian hasil belajar.
Berbeda dengan wawancara di mana penilai berhadapan secara langsung dengan peserta didik
atau dengan pihak lainnya, maka dengan menggunakan angket, pengumpulan data sebagai bahan
penilaian hasil belajar yang jauh lebih praktis, menghemat waktu dan tenaga. Hanya saja,
jawaban-jawaban yang diberikan acapkali tidak sesuai dengan kenyataan yang sebenarnya;
apalagi jika pertanyaan-pertanyaan yang diajukan dalam angket itu kurang tajam, sehingga
memungkinkan bagi responden untuk memberikan jawaban yang diperkirakan akan melegakan
atau memberikan kepuasan kepada pihak penilai.
Angket dapat diberikan langsung kepada peserta didik, dapat pula diberikan kepada para
orang tua mereka. Pada umumnya tujuan penggunaan angket atau kuesioner dalam proses
pembelajaran terutama adalah untuk memperoleh data mengenai latar belakang peserta didik
sebagai salah satu bahan dalam menganalisis tingkah laku dan proses belajar mereka.
2. Teknik penyusunan dan pelaksanaan tes hasil belajar, criteria yang baik
1. Validitas
Kata valid sering diartikan dengan : tepat, benar, absah dan shahih. Jadi kata validitas
ketepatan, kebenaran, keabsahan. Apabila dikaitkan dengan fungsi tes sebagai alat pengukur
maka sebuah tes dikatakan valid apabila alat ukur tersebut dapat dengan tepat mengukur apa
yang hendak diukur atau diungkap lewat tes tersebut. Jadi tes hasil belajar dapat dinyatakan
valid (alat pengukur keberhasilan) dengan secara tepat dapat mengukur atau mengungkap
hasil-hasil belajar yang telah dicapai oleh peserta didik setelah menempuh proses belajar
mengajar dalam waktu tertentu[2]
Contoh : Diperoleh informasi bahwa Si A beratnya 80 kg setelah diukur dengan
timbangan beras yang benar memang hasilnya demikian beratnya berdasarkan hasil
timbangan.
Untuk tes hasil belajar aspek validitas yang paling penting adalah validitas isi. Yang
dimaksud dengan validitas isi adalah ukuran yang menunjukkan sejauh mana skor dalam tes
yang berhubungan dengan penguasaan peserta tes dalam bidang studi yang diuji melalui
perangkat tes tersebut. Untuk mengetahui tingkat validitas isi tes, diperlukan adanya
penilaian ahli yang menguasai bidang studi tersebut.
2. Reliabilitas
Kata reliabilitas dari kata reliability (Inggris) yang artinya dapat dipercaya. Tes yang
reliable jika memberikan hasil yang tetap (consistent) apabila diteskan berkali-kali. Jika kepada
siswa diberikan tes yang sama yang pada waktu yang berlainan, maka setiap siswa akan tetap
berada dalam urutan rangking yang sama tetap (ajeg) dalam kelompoknya. Validitas
berhubungan dengan ketepatan sedangkan reliabilitas berhubungan dengan ketetapan atau
keajekan.`
Sebuah tes dikatakan relibel apabila hasil-hasil pengukuran yang dilakukan dengan
menggunakan tes tersebut secara berulang kali terhadap subyek yang sama hasilnya tetap
sama atau sifatnya stabil.[3] Yang dimaksud Stabil disini yaitu tetap berada pada urutan
kelompoknya ketika tes dilakukan berulang-ulang meskipun terjadi perubahan nilai secara
keseluruhan oleh kelompoknya tetapi pada posisi urutan rangkingnya tetap atau berubah
tetapi perubahannya tidak berarti. Jadi penekannanya bukan pada tetapnya nilai tetapi pada
tetapnya posisi urutan nilai atau rangking dalam kelompoknya. Walaupun tampaknya hasil
tes pada tes kedua lebih baik karena kenaikannnya dialami oleh semua siswa maka tes
yang digunakan dapat dikatakan memiliki reliabilitas yang tinggi. Kenaikan hasil yang
kedua bisa jadi disebabkan adanya pengalaman yang diperoleh pada waktu mengerjakan tes
pertama.
Contoh
Tabel Nilai Tes Pertama dan Kedua
Cahya 8 9
Darma 5 6
Elvi 6 7
Firda 7 8
Pada tabel tersebut di atas menunjukkan hasil tes pertama dan hasil tes kedua yang
dicapai oleh siswa secara keseluruhan cenderung mengalami kenaikan tetapi pada posisi
rangkingnya tetap yang berarti alat tes yang digunakan dalam menilai hasil belajar tersebut
reliable atau dapat dipercaya.
Menurut Ngalim Purwanto suatu tes disebut andal (reliability) jika ia dapat
dipercaya, konsisten atau stabil.[4]
3. Objectivitas
Objektif berarti tidak adanya unsur pribadi yang mempengaruhinya bukan subjectif.
Sebuah tes dikatakan memiliki objectivitas apabila dalam melaksanakan tes tidak ada faktor
subjectif yang mempengaruhi terutama dalam sistem skornya.
Apabila dikaitkan dengan reliabilitas maka objectivitas menekankan ketetapan
(consistency) pada sistem skoring, sedangkan reliabilitas menekankan ketetapan dalam hasil tes.
Ada 2 faktor yang mempengaruhi subjectivitas dari sesuatu tes yaitu bentuk tes dan penilai :
1. Bentuk Tes
Tes yang berbentuk uraian akan memberi banyak kemungkinan kepada sipenilai untuk
memberikan penilaian menurut caranya sendiri. Untuk menghindari masuknya unsur
subjektivitas dari penilai maka sistem skoringnya dapat dilakukan dengan cara sebaik-
baiknya antara lain lain dengan membuat pedoman skoring terlebih dahulu.
2. Penilai
Subjectivitas dari penilai akan dapat masuk secara agak leluasa terutama dalam tes
bentuk uraian. Faktor-faktor yang mempengaruhi subjectivitas antara lain kesan penilai
terhadap siswa, tulisan bahasa, kelelahan untuk menghindari subjektivitas maka harus mengacu
pedoman terutama menyangkut masalah pengadministrasian yaitu kontinuitas dan
komprehensivitas.
Sedangkan Menurut Prof. Drs. Anas Sujiono Suatu tes belajar dapat disebut tes
belajar yang obyektif apabila tes tersebut disusun dan dilaksanakan menurut apa adanya.
Ditinjau dari segi isi atau materinya artinya bahwa materi tes diambilkan atau bersumber
dari materi atau bahan pelajaran yang telah diberikan sesuai dengan instruksional khusus
yang telah ditentukan atau bahan pelajaran yang telah dipelajari oleh peserta didik yang
dijadikan acuan dalam penyusunan hasil belajar tersebut.[5]
4. Praktibilitas (practibility)
Sebuah tes disebut memiliki praktibilitas yang tinggi apabila tes tersebut bersifat praktis,
Tes yang praktis adalah tes yang :
1. Mudah dilaksanakan, tidak menuntut peralatan yang banyak dan memberi kebebasan
kepada siswa mengerjakan terlebih dahulu bagian yang dianggap mudah. Karena
bersifat sederhana dalam arti tidak memerlukan peralatan yang sulit pengadaannya[6]
2. Mudah pemeriksaannya artinya bahwa tes itu dilengkapi kunci jawaban maupun
pedoman skoringnya. Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat
diberikan atau diawali orang lain.
3. Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat diberikan atau
diawasi oleh orang lain
5. Ekonomis
Pelaksaan tes tersebut tidak membutuhkan ongkos atau biaya yang mahal, tenaga yang
banyak serta waktu yang lama.[7]
KESIMPULAN
Berdasarkan uraian diatas dapat diambil kesmpulan bahwa ciri-ciri tes yang baik
adalah sebagai berikut :
1. Validitas, valid apabila alat ukur tersebut dapat dengan tepat mengukur apa yang
hendak diukur atau mengungkap lewat tes tersebut.
2. Reliabilitas, hasil-hasil pengukuran yang dilakukan dengan menggunakan tes tersebut
secara berulang kali terhadap subyek yang sama hasilnya tetap sama atau sifatnya
stabil dalam kelompoknya.
3. Objectivitas, artinya dalam melaksanakan tes tidak ada faktor subjectif yang
mempengaruhi terutama dalam sistem skornya.
4. Praktibilitas, (practibility) baik kepraktisan yang terkait dalam pelaksanaannya
maupun kemudahan dalam pemeriksaannya.
5. Ekonomis, tidak memerlukan ongkos, tenaga dan waktu yang banyak.
Ada beberapa prinsip dasar yang perlu dicermati didalam menyusun tes hasil belajar agar
tes tersebut dapat mengukur tujuan instruksional khusus untuk mata pelajaran yang telah
diajarkan, atau mengukur kemampuan dan keterampilan peserta didik yang diharapkan setelah
mereka menyelesaikan suatu unit pengajaran tertentu.
1. Pertama, tes hasil belajar harus dapat mengukur secara jelas hasil belajar (learning out
comes) yang telah ditetapkan sesuai dengan tujuan instruksional. Kejelasan mengenai
pengukuran hasil belajar yang dikehendaki akan memudahkan bagi guru dalam
menyusun butir-butir soal tes hasil belajar.
2. Kedua, butir-butir soal tes hasil belajar harus merupakan sampel yang representatif dari
populasi bahan pelajaran yang telah diajarkan, sehingga dapat dianggap mewakili seluruh
performan yang telah diperoleh selama peserta didik mengikuti suatu unit pengajaran.
3. Ketiga, bentuk soal yang dikeluarkan dalam tes hasil belajar harus dibuat bervariasi,
sehingga betul-betul cocok untuk mengukur hasil belajar yang diinginkan sesuai dengan
tujuan tes itu sendiri.Untuk mengukur hasil belajar yang berupa keterampilan misalnya,
tidak tepat jika hanya menggunakan soal-soal yang berbentuk essay test yang jawabannya
hanya mengurai dan bukan melakukan atau mempraktekkan sesuatu. Demikian pula
untuk mengukur kemampuan menganalisis suatu prinsip, tidak cocok jika digunakan
butir-bitir soal yang berbentuk objective test yang pada dasarnya hanya mengungkap
daya ingat peserta didik.
4. Keempat, tes hasil belajar harus didesain sesuai dengan kegunaannya untuk memperoleh
hasil yang diinginkan.Pernyataan tersebut mengandung makna, bahwa desain tes hasil
belajar harus disusun relevan dengan kegunaan yang dimiliki oleh masing-masing jenis
tes.
5. Kelima, tes hasil belajar harus memiliki reliabiltas yang dapat diandalkan. Artinya,
setelah tes hasil belajar itu dilaksanakan berkali-kali terhadap subyek yang sama, hasilnya
selalu sama atau relatif sama. Dengan demikian tes hasil belajar itu hendaknya memiliki
keajegan hasil pengukuran yang tidak diragukan lagi
6. Keenam, tes hasil belajar disamping harus dapat dijadikan alat pengukur keberhasilan
belajar siswa, juga harus dapat dijadikan alat untuk mencari informasi yang berguna
untuk memperbaiki cara belajar siswa dan cara mengajar guru itu sendiri.
4.
A. Teknik Penyusunan Perangkat Tes
Tes adalah cara (yang dapat dipergunakan) atau prosedur yang (yang perlu di tempuh)
dalam rangka pengukuran dan penilaian di bidang pendidikan. Menurut BSNP ada hal yang perlu
diperhatikan dalam penilaian hasil belajar peserta didik antara lain:
1. Penilaian ditujukan untuk mengukur pencapaian kompetensi
2. Penilaian menggunakan acuan kriteria yakni berdasarkan pencapaian kompetensi peserta didik
setelah mengikuti proses pembelajaran
3. Bentuk soal yang dikeluarkan dalam tes hasil belajar harus dibuat bervariasi
4. Penilaian dilakukan secara menyeluruh dan berkelanjutan
5. Hasil penilaian ditindaklanjuti dengan program remedial bagi peserta didik yang pencapaian
kompetensinya di bawah kriteria ketuntasan dan program pengayaan bagi peserta didik yang
telah memenuhi kriteria ketuntasan.
6. Penilaian harus sesuai dengan kegiatan pembelajaran
Menurut Suharsimi (2003) tes yang baik harus mempunyai syarat-syarat sebagai berikut: 1)
Harus efisien (Parsimony) 2) Harus baku (Standardize) 3) Mempunyai norma 4) Objektif 5)
Valid (Sahih) 6) Reliabel (Andal ). Pedoman yang dikeluarkan BSNP (2007) tedapat 10 syarat
yaitu: (1) Sahih (valid), (2) objektif, (3) Adil, (4) terpadu), (5) terbuka, (6) menyeluruh dan
berkesinambungan, (7) sistematis, (8) menggunakan acuan kriteria, (9) akuntabel, dan (10)
reliabel.
Tes dibuat dengan langkah-langkah berikut, yaitu: menentukan tujuan tes/soal, penentuan
jenis dan bentuk soal, menyusun kisi-kisi, penulisan butir soal, pemantapan butir atau validasi
soal dan kunci jawaban dan merakit soal menjadi perangkat tes. Bentuk-Bentuk Tes Hasil
Belajar dan Teknik Penyusunannya, yaitu:
a. Tes hasil belajar bentuk uraian
Tes uraian adalah butiran soal yang mengandung pertanyaan atau tugas yang jawaban atau
pengerjaan soal tersebut harus dilakukan dengan cara mengekspresikan pikiran peserta tes secara
naratif. Ciri khas tes uraian ialah jawaban terhadap soal tersebut tidak disediakan oleh orang
yang mengkontruksi butir soal, tetapi disusun oleh peserta tes. Karakteristiknya sebagai berikut
1. tes tersebut berbentuk pertanyaan atau perintah yang menghendaki jawaban berupa uraian atau
paparan kalimat yang pada umumnya cukup panjang.
2. bentuk-bentuk pertanyaan atau perintah itu menuntut kepada peserta tes untuk memberikan
penjelasan, komentar, penafsiran, membandingkan, membedakan dan sebagainya.
3. jumlah butir soalnya umumnya terbatas, yaitu berkisar antara lima sampai dengan sepuluh butir.
4. pada umumnya butir-butir soal tes uraian itu diawali dengankata-kata: "Jelaskan......",
"Terangkan......", "Uraikan ......", "Mengapa ......", "Bagaimana ......" atau kata-kata lain yang
serupa dengan itu.
Tes uraian dibagi menjadi dua golongan yaitu tes uraian bebas (extended response) dan tes
uraian terbatas (restricted response). Pembedaan kedua tipe tes uraian ini adalah atas dasar
besarnya kebebasan yang yang diberikan kepada peserta tes untuk mengorganisasikan, menulis
dan menyatakan pikiran, tingkat pemahaman terhadap pokok permasalahan dan gagasannya.
Kelebihan tes berbentuk uraian: 1) tes uraian dapat dengan baik mengukur hasil belajar
yang kompleks, 2) tes bentuk uraian terutama menekankan kepada pengukuran kemampuan
mengintegrasikan berbagi buah pikiran dan sumber informasi kedalam suatu pola berpikir
tertentu, yang disertai dengan keterampilan pemecahan masalah, 3) bentuk tes uraian lebih
meningkatkan motivasi peserta didik untuk melahirkan kepribadiannya dan watak sendiri, 4)
kelebihan lain tes uraian ialah memudahkan guru untuk menyusun butir soal, 5) tes uraian sangat
menekankan kemampuan menulis. kelemahan tes uraian: 1) tes uraian pada umumnya kurang
dapat menampung atau mencakup dan mewakili isi dan luasnya materi atau bahan pelajaran yang
telah diberikan kepada testee, yang seharusnya diujikan dalam tes hasil belajar, 2) cara
mengoreksi jawaban soal tes uraian cukup sulit, 3) dalam pemberian skor hasil tes uraian,
terdapat kecenderungan bahwa pemberi tes (guru) lebih banyak bersifat subyektif, 4) pekerjaan
koreksi terhadap lembar-lembar jawaban hasil tes uraian sulit untuk diserahkan kepada orang
lain, 5) daya ketepatan mengukur (validitas) dan daya keajegan mengukur (reliabilitas) yang
dimiliki oleh tes uraian pada umumnya rendah sehingga kurang dapat diandalkan sebagai alat
pengukur hasil belajar yang baik.
Petunjuk operasional yang dapat dijadikan pedoman dalam penyusunan butir soal tes
uraian:
1. Diusahakan bentuk soal dapat mencakup ide-ide pokok dari materi yang telah diajarkan
2. Untuk menghindari kecurangan peserta didik, kalimat dalam soal tes sebisa mungkin berbeda
dengan susunan kalimat yang terdapat pada buku.
3. Setelah soal selesai dibuat, segera membuat jawaban yang dikehendaki oleh pemberi tes.
4. Pertanyaan dan perintah yang dibuat harus bervariasi
5. Kalimat soal harus secara ringkas, padat, dan jelas
6. Kemukakan pedoman tentang cara mengerjakan atau menjawab buitr soal tersebut
Langkah-langkah penyusunan tes uraian dengan memenuhi kriteria dan prinsip pengukuran
1. Penentuan tujuan tes, Tujuan tes perlu dinyatakan secara eksplisit dan jelas, agar tes benar-benar
mengukur apa yang hendak diukur.
2. Penyusunan kisi-kisi tes, Menurut Balitbang Depdikbud dikutip Suyata (1997:21) kisi-kisi yang
baik harus memenuhi kriteria diantaranya (1) dapat mewakili isi kurikulum secara tepat, (2)
komponen-komponen jelas dan mudah dipahami, (3) dapat dilaksanakan atau disusun
soalnya.Secara umum komponen-komponen yang biasa dimuat dalam penyusunan kisi-kisi tes
prestasi belajar adalah sebagai berikut: (1) jenis sekolah/jenjang sekolah, (2) tingkat sekolah, (3)
bidang Studi / mata pelajaran, (4) tahun pelajaran, (5) kurikulum yang diacu/ dipergunakan, (6)
jumlah soal, (7) bentuk soal, (8) standar kompetensi , (9) kompetensi dasar, (10) materi yang
akan diujikan/dijadikan soal, (11) indikator, (12) nomor urut soal (jika diperlukan).
3. Penulisan butir soal, Pusat Penelitian Sistem Pengujian dikutip Suyata (1997:22) menambahkan
perlunya rumusan soal tes uraian yang menggunakan kata tanya atau perintah yang menuntut
jawaban uraian, seperti mengapa, jelaskan, uraikan, tafsirkan, dan sebagainya, serta rumusan soal
tes uraian perlu menggunakan bahasa yang sederhana dan sesuai kaidah bahasa yang berlaku.
4. Penelaahan soal tes uraian, Tujuan kegiatan adalah untuk melihat dan mengkaji setiap butir soal
agar menghasilkan soal dengan kualitas yang baik. Penelaahan butir soal dilakukan dengan cara
menyesuaikan butir soal dengan kisi-kisi tes, kurikulum, atau buku sumber. Langkah ini juga
dimaksudkan untuk menjaga validitas isi tes.
Penskoran tes uraian, Djiwandono (2008: 59) menjelaskan bahwasanya penskoran tes
subyektif dalam bentuk esei tidak dilakukan dengan menggunakan kunci jawaban seperti pada
penskoran tes obyektif, melainkan dengan menggunakan rambu-rambu penskoran (scoring
guide), yang memuat pedoman, kadang-kadang sekadar kriteria, yang menyebutkan jawaban
yang diharapkan dalam hal relevansi isi, susunan, bahasa yang digunakan termasuk ejaan,
bahkan panjang dan pendeknya jawaban, dan lain-lain.
Kriteria penskoran tes esai secara analitik: 1) relevansi isi dan jawaban peserta tes dengan
jawaban yang diharapkan, 2) kecukupan isi jawaban peserta tes tentang masalah yang
ditanyakan, 3) kerapian dan kejelasan penyusunan isi jawaban peserta tes, 4) lain-lain yang perlu
dan relevan dengan bidang kajian dan titik berat sasaran tes (dengan uraian dan rinciannya),
misalnya penggunaan bahasa yang lugas dan mudah dimengerti.
Djiwandono (2008: 6) menjelaskan dengan memberikan contoh rincian kriteria dengan
tingkatan ketercapaian kriteria dan alokasi skor pada tes esei. Seandaianya semua kriteria itu
diperlakukan sama berat tanpa pembobotan, dan dengan contoh rentangan skor 4, 3, 2, 1 yang
menunjukkan tingkat ketercapaian kriteria yang menggambarkan tingkat mutu esei. Jika
penskoran dilakukan tanpa pembobotan dalam arti bahwa semua kriteria dianggap sama berat
dan dialokasikan rentangan skor yang sama, maka skor jawaban esei seorang peserta tes
diperoleh dengan menjumlahkan skor-skor yang diperolehnya. Jika penskoran dilakukan dengan
pembobotan, maka bobot masing-masing kriteria perlu ditentukan berdasarkan pentingnya
berbagai komponen kemampuan dalam melakukan pekerjaan yang ditugaskan.
Suyata (1997:23) menguraikan beberapa cara yang dapat dilakukan berkaitan dengan
kegiatan penskoran tersebut:
1. Model jawaban, buat contoh jawaban yang benar dari tiap soal sebagai model
2. Penskoran keseluruhan dan bagian demi bagian, penskoran keseluruhan adalah cara penskoran
yang tidak dibagi-bagi atas elemen-elemen. Penskoran bagian demi bagian lebih dianjurkan, buar
daftar poin-poin penting dalam tiap jawaban
3. Satu butir untuk seluruh peserta, Jawaban hendaknya dibaca tiap butir untuk seluruh peserta tes,
agar reliabilitas skor dapat dipertahankan.
4. Buat poin penting untuk setiap jawaban soal, Agar penskoran dapat dilakukan dengan lebih
obyektif, untuk setiap soal perlu dibuat daftar poin-poin penting yang perlu ada.
Manfaat yang dapat diperoleh melalui tes, pengukuran dan penilaian antara lain
sebagaimana diuraikan berikut ini.
1. Seleksi, untuk menentukan naik tidaknya atau lulus tidaknya seorang siswa
2. Penempatan, tes untuk keperluan ini terutama didasarkan pada informasi tentang apa yang telah
dan apa yang belum dikuasai oleh seseorang
3. Diagnosis dan remedial, untuk mengetahui perlu tidaknya suatu pelajaran diulang kembali atau
tidak
4. Umpan balik, hasil suatu pengukuran yang berupa skor tes dapat digunakan untuk keperluan
umpan balik baik untuk individu maupun untuk keperluan pengajar
5. Memotivasi dan membimbing belajar, hasil tes seyogyanya dapat memotivasi untuk lebih
berprestasi, dan dapat menjadi pembimbing untuk belajar. Tes yang dimaksud adalah tes
formatif.
6. Perbaikan kurikulum dan program pendidikan, didasarkan pada hasil penilaian pendidikan yang
tepat pula, sehingga hal itu tidak sia-sia belaka.
7. Pengembangan ilmu, hasil tes, pengukuran dan penilaian yang tepat sudah jelas akan dapat
memberikan konstribusi bagi pengembangan teori dasar pendidikan.
8. Memberikan laporan kepada orang tua, dengan tujuan agar diperoleh gambaran oyektif tentang
perkembangan anaknya, untuk kemudian menyikapinya. Tes yang dimaksud adalah tes sumatif.
Kegiatan tes, pengukuran dan penilaian berperan sangat besar dalam sistem pendidikan dan
sistem persekolahan, karena pentingnya itu maka setiap tindakan tes, pengukuran dan penilaian
selalu menimbulkan kritik yang tajam dari masyarakat. Kritik tersebut antara lain:
1. Tes senantiasa akan mencampuri rahasia pribadi peserta tes, yang dapat berarti membuka
kelemahan dan kekuatan pribadi seseorang.
2. Tes selalu menimbulkan rasa cemas peserta tes, yang dapat menghambat seseorang
mendemonstrasikan kemampuan terbaiknya.
3. Tes acapkali justru menghukum peserta didik yang kreatif, karena tes itu selalu menuntut
jawaban yang sudah ditentukan pola dan isinya.
4. Tes selalu terikat pada kebudayaan tertentu. Karena itu kemampuan peserta tes untuk memberi
jawaban terbaik turut ditentukan oleh kebudayaan penyusun tes.
5. Tes hanya mengukur hasil belajar yang sederhana dan yang remeh. Hampir tidak pernah ada tes
hasil belajar yang mampu mengungkapkan tingkah laku peserta didik secara menyeluruh, yang
justru menjadi tujuan utama pendidikan formal apapun.
Untuk itu perlu ditegakan beberapa etika tes, yang membedakan tes yang etik dan tindakan
yang tidak etik dalam pelaksanaan tes secara professional. Praktek tes hasil belajar yang etik
terutama mencangkup empat hal utama :
1. Kerahasiaan Hasil Tes
Hasil tes hanya dapat disampaikan kepada orang lain bila: a) ada izin dari peserta didik
yang bersangkutan atau orang yang bertanggung jawab terhadap peserta didik (bagi peserta didik
yang belum dewasa), b) ada tanda-tanda yang jelas terhadap hasil tes tersebut menunjukan gejala
yang membahayakan dirinya atau membahayakan kepentingan orang lain, c) bila penyampaian
hasil tes tersebut kepada orang lain jelas-jelas menguntungkan peserta tes.
2. Keamanan tes
Tes merupakan alat pengukur yang hanya dapat digunakan secara professional. Dengan
demikian tes tidak dapat digunakan diluar batas-batas yang ditentukan oleh profesionalisme
pekerjaan guru.
3. Interpretasi Hasil Tes
Interpretasi hasil tes harus diikuti tanggung jawab professional. Bila hasil tes diinterpretasi
secara tidak patut, dalam jangka panjang akan dapat membahayakan kehidupan peserta tes.
4. Penggunaan Tes
Tes hasil belajar haruslah digunakan secara patut. Bila tes hasil belajar tertentu merupakan
tes baku, maka tes tersebut harus digunakan di bawah ketentuan yang berlaku bagi pelaksanaan
tes baku tersebut.
Beberapa petunjuk praktis yang hendaknya ditaati oleh pendidik dalam tes:
1. Pelaksaan tes hendaknya diberi tahu terlebih dahulu kepada peserta tes.
2. Sebaiknya pendidik menjelaskan cara menjawab yang dituntut dalam suatu tes.
3. Sebaiknya pendidik memotivasi peserta tes mengerjakan tesnya secara baik bukan menakut-
nakuti peserta didik.
4. Bila pendidik menggunakan tes baku, maka hendaknya pendidik tersebut bertanggung jawab
penuh terhadap keamanan tes tersebut.
5. Seorang pendidik dapat menggunakan hasil tes untuk mengidentifikasi kekuatan dan kelemahan
peserta tes, asalkan hal tersebut tetap menjadi rahasia peserta tes dan pendidik yang
bersangkutan.
6. Guru hendaknya menghindari diri dari keterlibatan dalam bimbingan tes yang dapat diperkirakan
akan menggangu proses hasil belajar peserta didik.
7. Tidak etik bila seorang guru mengembangkan butir soal atau perangkat soal yang paralel dengan
suatu tes baku dengan maksud untuk digunakan dalam bimbingan tes.
8. Tidak etik untuk mendiskriminasikan peserta didik tertentu atau kelompok tertentu yang boleh
mengikuti suatu tes atau melarang mengikuti tes.
9. Tidak etik untuk memperpanjang waktu atau menyingkat waktu yang telah ditentukan oleh
petunjuk tes.
10. Guru tidak boleh meningkatkan rasa cemas peserta tes dengan penjelasan yang tidak perlu.
Merakit soal adalah menyusun soal yang siap pakai menjadi satu perangkat/paket tes atau
beberapa paket tes paralel. Dasar acuan dalam merakit soal adalah tujuan tes dan kisi-kisinya.
Mundilarto (2010) menyatakan empat langkah mengembangkan kisi-kisi soal tes yaitu
menuliskan Kompetensi dasar, daftar materi dan submateri, menentukan indicator, dan
menentukan jenis tagihan, bentuk dan jumlah soal. Para pendidik dapat merakit soal menjadi
suatu paket tes yang tepat, apabila para pendidik memperhatikan langkah-langkah perakitan soal.
Berikut langkah-langkah perakitan soal.
1. Mengelompokkan soal-soal yang mengukur kompetensi dan materi yang sama, kemudian soal-
soal itu ditempatkan dalam urutan yang sama.
2. Memberi nomor urut soal didasarkan nomor urut soal dalam kisi-kisi.
3. Mengecek setiap soal dalam satu paket tes apakah soal-soalnya sudah bebas dari kaidah “Setiap
soal tidak boleh memberi petunjuk jawaban terhadap soal yang lain”.
4. Membuat petunjuk umum dan khusus untuk mengerjakan soal.
5. Membuat format lembar jawaban.
6. Membuat lembar kunci jawaban dan petunjuk penilaiannya.
7. Menentukan/menghitung penyebaran kunci jawaban (untuk bentuk pilihan ganda), dengan
menggunakan rumus berikut.
8. Menentukan soal inti (anchor items) sebanyak 10 % dari jumlah soal dalam satu paket.
9. Menentukan besarnya bobot setiap soal (untuk soal bentuk uraian)
10. Menyusun tabel konversi skor
Skor dari soal bentuk pilihan ganda tidak dapat langsung digabung dengan skor uraian. Hal
ini karena tingkat keluasan dan kedalaman materi yang ditanyakan atau penekannya dalam kedua
bentuk itu tidak sama. Dalam ilmu pengukuran, konversi dapat disusun melalui konversi biasa
dan konversi yang terkalibrasi dengan model respon butir.
a. Konversi biasa (model pengukuran secara klasik)
Penggunaannya biasa digunakan guru di sekolah, yaitu untuk memperoleh nilai murni
peserta didik. Misalnya biila menghendaki skor maksimum 10 digunakan rumus (skor perolehan:
skor maksimum) x 10. Konversi seperti ini memiliki dua kelemahan, pertama adalah bahwa
setiap butir soal dihitung memiliki tingkat kesukaran yang sama, kedua adalah bahwa tingkat
kesukaran butir soal tidak ditempatkan/dikalibrasi pada skala yang sama.
Keterbatasan model pengukuran secara klasik adalah seperti berikut: 1) tingkat
kemampuan dalam teori klasik adalah “true score”, b) tingkat kesukaran soal didefinisikan
sebagai proporsi peserta didik dalam kelompok yang menjawab benar soal, c) daya pembeda,
reliabilitas, dan validitas soal/tes didefinisikan berdasarkan grup peserta didik.
Konversi nilai berdasarkan teori tes klasik memiliki kelemahan, yaitu 1) tingkat kesukaran
dan daya pembeda tergantung pada sampel; 2) penggunaan metode dan teknik untuk desain dan
analisis tes dengan memperbandingkan kemampuan peserta didik pada pembagian kelompok di
atas, tengah, bawah, 3) konsep reliabilitas tes didefinisikan dari istilah tes paralel; 4) tidak ada
dasar teori untuk menentukan bagaimana peserta didik memperoleh tes yang sesuai dengan
kemampuan peserta didik; 5) standar kesalahan pengukuran hanya berlaku untuk seluruh peserta
didik.
b. Konversi yang terkalibrasi
Adalah konversi nilai yang disusun berdasarkan kemampuan peserta didik dari tingkat
kesukaran butir soal yang terkalibrasi dengan model Rasch (Item Response TheoryDalam
konversi yang terkalibrasi skalanya didasarkan dua hal penting, yaitu tingkat kesukaran dan
tingkat kemampuan peserta didik. Soal ditempatkan pada tingkat kesukaran dan kemampuan
peserta didik yang telah disamakan skalanya.
Kelebihan model Rasch atau teori respon butir secara umum adalah bahwa: 1) model ini
tidak berdasarkan grup dependen, 2) skor peserta didik dideskripsikan bukan tes dependen, 3)
model ini menekankan pada tingkat butir soal bukan tes, 4) model ini tidak memerlukan paralel
tes untuk menentukan reliabilitas tes, 5) model ini merupakan suatu model yang memberikan
suatu pengukuran ketepatan untuk setiap skor tingkat kemampuan. Kelebihan teori respon butir
adalah: 1) responden dapat diskor pada skala yang sama, 2) skor responden dapat dibandingkan
pada dua atau lebih bentuk tes yang sama, 3) semua bentuk soal memperoleh perlakuan melalui
cara yang sama, 4) tes dapat disusun sesuai keahlian berdasarkan tingkat kemampuan yang akan
dites.