Anda di halaman 1dari 8

Menurut Mudjijo (1995) (Mudjijo. Tes Hasil Belajar.

Jakarta: Bumi Aksara,


1995) ada 4 ciri tes

yang baik

yaitu : Validitas, reliabilitas, kemudahan dan

kepraktisan. Kemudahan dalam hal ini yaitu mudah dilaksanakan dan kepraktisan
dalam hubungannya dengan biaya dan waktu untuk melaksanakan dan yang terakhir
analisis butir soal. Tes yang baik berarti soal tersebut memiliki butir soal yang
baik.
Menurut Arikunto (2002) (Arikunto

Suharsimi,

Dasar- Dasar

Evaluasi

Pendidikan, Jakarta : PT. Bumi Aksara,Edisi Revisi 2002)suatu tes dapat dikatakan
baik apabila memenuhi lima persyaratan, yaitu :
1.

Validitas
Kata valid sering diartikan dengan : tepat, benar, absah dan shahih. Jadi kata

validitas ketepatan, kebenaran, keabsahan. Apabila dikaitkan dengan fungsi tes


sebagai alat pengukur maka sebuah tes dikatakan valid apabila

alat ukur

tersebut dapat dengan tepat mengukur apa yang hendak diukur atau diungkap
lewat tes tersebut. Jadi tes hasil belajar dapat dinyatakan valid (alat pengukur
keberhasilan) dengan secara tepat dapat mengukur atau mengungkap hasil-hasil
belajar yang telah dicapai oleh peserta didik setelah menempuh proses belajar
mengajar dalam waktu tertentu.
Untuk tes hasil belajar aspek validitas yang paling penting adalah validitas isi.
Yang dimaksud dengan validitas isi adalah ukuran yang menunjukkan sejauh
mana skor dalam tes yang berhubungan dengan penguasaan peserta tes dalam
bidang studi yang diuji melalui perangkat tes tersebut. Untuk mengetahui tingkat
validitas isi tes, diperlukan adanya penilaian ahli yang menguasai bidang studi
tersebut.
2.

Reliabilitas
Kata reliabilitas dari kata reliability (Inggris) yang artinya dapat dipercaya. Tes

yang reliable

jika memberikan hasil

yang tetap (consistent) apabila diteskan

berkali-kali. Jika kepada siswa diberikan tes yang sama yang pada waktu yang
berlainan, maka setiap siswa akan tetap berada dalam urutan rangking yang sama
tetap (ajeg)

dalam

kelompoknya. Validitas berhubungan dengan ketepatan

sedangkan reliabilitas berhubungan dengan ketetapan atau keajekan. Sebuah tes


dikatakan

relibel

apabila

hasil-hasil pengukuran

yang

dilakukan dengan

menggunakan tes tersebut secara berulang kali terhadap subyek yang sama
hasilnya tetap sama atau sifatnya stabil.
3.

Objectivitas
Objektif berarti tidak adanya unsur pribadi yang mempengaruhinya bukan

subjectif. Sebuah tes dikatakan memiliki objectivitas apabila dalam melaksanakan


tes tidak ada faktor subjectif yang mempengaruhi terutama dalam sistem skornya.
Apabila dikaitkan dengan reliabilitas maka objectivitas menekankan ketetapan
(consistency) pada sistem skoring, sedangkan reliabilitas menekankan ketetapan
dalam hasil tes. Ada 2 faktor yang mempengaruhi subjectivitas dari sesuatu tes
yaitu bentuk tes dan penilai:
a. Bentuk Tes
Tes yang berbentuk uraian akan memberi banyak kemungkinan kepada
sipenilai untuk memberikan penilaian menurut caranya sendiri. Untuk
menghindari

masuknya

unsur

subjektivitas

dari

penilai

maka sistem

skoringnya dapat dilakukan dengan cara sebaik-baiknya antara lain lain


dengan membuat pedoman skoring terlebih dahulu.
b. Penilai
Subjectivitas dari penilai akan dapat masuk secara agak leluasa terutama dalam
tes bentuk uraian. Faktor-faktor yang mempengaruhi subjectivitas antara lain
kesan penilai terhadap siswa, tulisan bahasa, kelelahan untuk menghindari
subjektivitas maka harus mengacu pedoman terutama menyangkut masalah
4.

pengadministrasian yaitu kontinuitas dan komprehensivitas.


Praktibilitas (practibility)
Sebuah tes disebut memiliki praktibilitas yang tinggi apabila tes tersebut

bersifat praktis, Tes yang praktis adalah tes yang :


1.

Mudah dilaksanakan, tidak menuntut peralatan yang banyak dan memberi


kebebasan kepada siswa mengerjakan terlebih dahulu bagian yang dianggap
mudah. Karena bersifat sederhana dalam arti tidak memerlukan peralatan
yang sulit pengadaannya.

2.

Mudah pemeriksaannya artinya bahwa tes itu dilengkapi kunci jawaban


maupun pedoman skoringnya. Dilengkapi dengan petunjuk-petunjuk yang jelas
sehingga dapat diberikan atau diawali orang lain.

3.

Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat diberikan


atau diawasi oleh orang lain.

Pengembangan alat penilaian


A. Pengembangan Tes
Ada delapan langkah yang perlu ditempuh dalam mengembangkan tes hasil
belajara atau prestasi belajar, yaitu : (1) menyusun spesifikasi tes; (2) menulis soal
tes; (3)menelaah soal tes; (4) melakukan ujicoba tes; (5) menganalisis butir soal; (6)
memperbaiki tes; (7) merakit tes; (8) melaksanakan tes; (9) menafsirkan hasil tes
(Mardapi, 2007: 88). (Mardapi, D. (2007). Teknik penyusunan instrumen tes dan
nontes. Yogyakarta: Mitra Cendikia Press.)
1) Menyusun Spesifikasi Tes
Langkah awal dalam mengembangkan tes adalah menetapkan spesifikasi tes
yang berisis tentang uraian yang menunjukkan keseluruhan karakteristik yang
harus dimiliki suatu tes. Spesifikasi tes akan mempermudah dalam menulis soal
dan siapa saja yang menulis soal akan menghasilkan tingkat kesulitan yang
relatif sama. Penyusunan spesifikasi tes mencakup kegiatan berikut ini :
a. Menentukan Tujuan Tes Terdapat empat macam tes yang digunakan
lembaga pendidikan, yaitu tes penempatan, tes diagnostik, tes formatif, dan
tes sumatif.
b. Menyusun Kisi- Kisi Kisi-kisi merupakan tabel matrik yang berisi
spesifikasi soal-soal yang akan dibuat. Kisi- kisi ini merupakan acuan bagi
pembuat soal sehingga siapapun yang menulis soal akan menghasilkan soal
yang isi dan tingkat kesulitannya relatif sama. Terdapat empat langkah
dalam mengembangkan kisi-kisi tes, yaitu: (1) Menulis tujuan umum, (2)
Membuat daftar pokok bahasan dan sub pokok bahasan yang akan diujikan,
(3) Membuat indikator, (4) Menentukan jumlah soal tiap pokok bahasan
dan sub pokok bahasan

c. Menentukan Bentuk Tes


Bentuk tes objektif yang sering digunakan adalah bentuk pilihan ganda,
benar-salah, menjodohkan, dan uraian objektif. Tes uraian dapat
dikategorikan uraian objektif dan non-objektif. Tes uraian yang objektif
sering digunakan pada sains dan teknologi atau biadang sosial yang
jawaban soalnya sudah pasti, dan hanya satu jawaban yang benar. Tes
uraian non-objektif sering digunakan pada bidang ilmu sosial, yaitu yang
jawabannya luas dan tidak hanya satu jawaban yang benar, tergantung
argumentasi peserta tes. Bentuk tes dikatakan non-objektif apabila
penilaian yang dilakukan cenderung dipengaruhi subjektivitas dari penilai.
d. Menentukan Panjang Tes
Penentuan panjang tes berdasarkan pada cakupan materi ujian dan
kelelahan peserta tes. Pada umumnya tes tertulis menggunakan waktu 90
menit sampai 150 menit, namun untuk tes jenis praktek bisa lebih dari itu.
Penentuan panjang tes berdasarkan pengalaman saat melakukan tes.
Khusus untuk tes baku penentuan waktu berdasarkan hasil uji coba. Namun
tes untuk ulangan di kelas penentuan waktu berdasarkan pengalaman dari
tiap tenaga pengajar.Waktu yang diperlukan untuk mengerjakan tes bentuk
pilihan ganda adalah 2 sampai 3 menit untuk tiap butir soal bergantung
pada tingkat kesulitan soal. Untuk tes bentuk uraian tes ditententuka
berdasarkan pada kompleksitas jawaban yang dituntut.
2) Menulis Soal Tes
Penulisan soal merupakan langkah menjabarkan indikator menjadi pernyataanpernyataan yang karakteristiknya sesuai dengan kisi-kisi yang telah dibuat.
Setiap pertanyaan perlu disusun dengan baik sehingga jelas hal yang ditanyakan
dan jelas pula jawabannya.
3) Menelaah Soal Tes
Menelaah soal perlu dilakukan untuk memperbaiki soal jika ternyata dalam
pembuatannya masih ditemukan kekurangan dan kesalahan. Telaah dilakukan
oleh ahli yang secara bersama atau individu mengoreksi soal yang telah dibuat.
4) Melakukan Ujicoba Tes

Tahap ini dilakukan untuk memperbaiki kualitas soal yang telah disusun. Data
yang diperoleh adalah data empirik, terkait reliabilitas, validitas, tingkat
kesukaran, pola jawaban, efektifitas pengecoh, daya beda, dan lain-lain.
5) Menganalisis Butir Soal
Tiap butir soal perlu dianalisis lebih lanjut. Melalui ananlisis butir ini dapat
diketahui antara lain: tingkat kesukaran butir soal, daya beda, dan juga
efektifitas pengecoh.
6) Memperbaiki Tes
Langkah selanjutnya adalah memperbaiki bagian soal yang belum sesuai
dengan yang diharapkan berdasarkan analisis butir soal. Beberapa butir soal
mungkin sudah ada yang baik, butir soal yang kurang baik diperbaiki kembali,
sedangkan butir yang lain dapat dibuang jika tidak memenuhi standar kualitas
yang diharapkan.
7) Merakit Tes
Keseluruhan butir soal yang sudah dianalisis dan diperbaiki kemudian dirakit
menjadi satu kesatuan tes. Dalam merakit soal, hal-hal yang dapat
mempengaruhi validitas soal seperti nomor urut soal, pengelompokan butir
soal, lay out, dan sebagainya juga harus diperhatikan.
8) Melaksanakan Tes
Selanjutnya, tes yang telah disusun diberikan kepada testee (orang yang
ditujukan untuk mengerjakan tes). Pelaksanaan tes memerlukan pemantauan
atau pengawasan agar tes tersebut benar-benar dikerjakan oleh testee dengan
jujur dan sesuai dengan ketentuan yang telah digariskan.
9) Menafsirkan Hasil Tes
Hasil tes menghasilkan data kuantitatif berupa skor. Skor kemudian ditafsirkan
menjadi nilai, rendah, menengah, dan tinggi. Tinggi rendahnya nilai dikaitkan
dengan acuan penilaian. Ada dua macam acuan penilaian yang sering
digunakan dalam psikologi dan pendidikan, yaitu acuan norma dan kriteria.
B. Langkah Pengembangan instrumen nontes
Seperti halnya pengembangan instrumen tes, pengembangan instrumen nontes
juga memiliki langkah- langkah yang harus diikuti, yaitu: menentukan spesifikasi
instrumen; menulis instrumen; menentukan skala instrumen; menentukan sistem

penskoran;

menelaah

instrumen;

merakit

instrumen;

melakukan

ujicoba;

menganalisis hasil ujicoba; memperbaiki instrumen; melaksanakan pengukuran;


dan menafsirkan hasil pengukuran.
1) Spesifikasi Instrumen
Spesifikasi intrumen terdiri atas tujuan, dan kisi-kisi instrumen. Tujuan
pengembangan instrumen nontes sangat tergantung pada data yang akan dihimpun.
Instrumen nontes mencakup afektif dan psikomotorik. Ditinjau dari tujuannya,
instrument ranah afektif dibedakan menjadi lima, yaitu instrumen sikap, minat,
konsep diri, nilai, dan moral. Ada empat hal yang perlu diperhatikan ketika
menyusun spesifikasi instrumen, yaitu: tujuan pengukuran, kisi-kisi instrumen,
bentuk dan format instrumen, dan panjang instrumen.
a. Instrumen minat bertujuan untuk memperoleh informasi tentang minat siswa
terhadap mata pelajaran. Selanjutnya hasil pengukuran terhadap minat
digunakan untuk meningkatkan minat siswa terhadap mata pelajaran.
b. Instrumen sikap bertujuan untuk mengetahui sikap siswa terhadap suatu objek.
Misalnya, siskap siswa terhadap kegiatan sekolah, guru, dll. Sikap terhadap
mata pelajran bisa positif bisa negatif. Hasil pengukuran sikap berguna untuk
menentukan stretegi pembelajaran yang tepat bagi siswa.
c. Instrumen konsep diri bertujuan untuk mengetahui kekuatan dan kelemahan
diri sendiri. Siswa melakukan evaluasi secar objektif terhadap potensi yang ada
dalam dirinya. Karakteristik potensi siswa sangat penting untuk menentukan
jenjang karirnya. Informasi kekuatan dan kelemahan siswa digunakan untuk
menentukan program yang sebaiknya ditempuh oleh siswa.
d. Instrumen nilai bertujuan untuk mengungkap nilai dan keyakinan individu.
Informasi yang diperoleh bisa positif bisa negatif. Hal-hal yang positif
diperkuat, sedangkan yang negatif diperlemah dan akhirnya dihilangkan.
e. Instrumen moral bertujuan untuk mengungkap moral. Informasi moral
seseorang diperoleh melalui pengematan atas perbuatan yang ditampil-kan dan
laporan diri, yaitu dengan mengisi kuesioner. Informasi hasil pengamatan
bersamaan dengan hasil kuesioner menjadi informasi penting tentang moral
seseorang.
2) Menulis Instrumen

Instrumen disusun berdasarkan kisi-kisi yang telah dibuat. Instrumen dapat


berbentuk pernyataan atau pertanyaan. Kaidah yang perlu diperhatikan ketika
menulis butir instrument adalah:
a. Hindari kalimat yang mengandung banyak interpretasi
b. Rumusan pernyataan/pertanyaan singkat
c. Satu pernyataan hanya mengandung satu pikiran yang lengkap
d. Pernyataan dirumuskan dengan kalimat sederhana
e. Hindari penggunaan kata-kata selalu, semua, tidak pernah, dan sejenisnya
f. Hindari pernyataan tentang fakta, atau yang dapat diinterpretasikan sebagai
fakta.
3) Menentukan skala instrumen
Ada beberapa skala yang biasa digunakan dalam mengukur ranah afektif, di
antaranya adalah skala Likert, Thrustone, dan Beda Semantik. Langkah-langkah
pengembangan skala:
a. Menentukan objek sikap yang akan dikembangkan skalanya
b. Menyusun kisi-kisi instrumen (skala sikap)
c. Menulis butir pernyataan
d. Melengkapi butir pernyataan dengan skala sikap (bisa genap, 4 atau 6, dan bisa
ganjil 5 atau 7)
4) Sistem Penskoran
Sistem penskoran yang digunakan tergantung pada skala yang digunakan.
Misalnya, apabila digunakan skala Thrustone, maka skor tertinggi tiap butir adalah
7 dan terendah 1. Selanjutnya dilakukan analisis untuk tingkat siswa dan tingkat
kelas, yaitu dengan mencari rerata dan simpangan baku skor. Hasil analisiss
digunakan untuk menafsirkan ranah afektif dari setiap siswa dan kelas terhadap
suatu objek. Hasil tafsiran perlu ditindak lanjuti oleh guru dengan melakukan
perbaikan-perbaikan, seperti perbaikan metode pembelajaran, penggunaan alat
peraga, dll.
5) Telaah Instrumen
Kegiatan pada telaah instrumen adalah meneliti tentang: (a) kesesuaian antara
butir pertanyaan/pernyataan dengan indikator, (b) kekomunikatifan bahasa yang
digunakan, (c) kebenaran dari tata bahasa yang digunakan, (d) ada tidaknya bias
pada pertanyaan/pernyataan, (e) kemenarikan format instrumen, (f) kecukupan
butir instrumen, sehingga tidak membosankan.
6) Merakit Instrumen

Setelah instrumen diperbaiki, selanjutnya dirakit dengan memperhatikan


format, tata letak, urutan pernyataan dan pertanyaan. Format harus menarik.
Urutan pernyataan sesuai dengan aspek yang akan diukur.
7) Ujicoba Instrumen
Setelah dirakit, instrumen diujicobakan. Sampel ujicoba dipilih yang
karakteristiknya mewakili popoulasi yang ingin dinilai. Ukuran sampel minimal 30
orang, bisa berasal dari satu sekolah atau lebih. Pada saat ujicoba, yang perlu
dicatat adalah saransaran dari responden atas kejelasan pedoman pengisisan
instrumen, kejelasan kalimat, waktu yang digunakan, dll.
8) Analisis Hasil Ujicoba
Analisis hasil uji coba meliputi variasi jawaban tiap butir pertanyaan/
pernyataan. Apabila skala instrumen 1 sampai 5, maka bila jawaban bervariasi dari
1 sampai 5 berarti instrumen tersebut baik. Namun apabila jawaban semua
responden sama, misalnya 3 semua, maka instrumen tergolong tidak baik.Indikator
yang digunakan adalah besarnya daya beda atau korelasi antara skor butir dengan
skor total. Bila daya beda butir lebih dari 0,3 maka instrumen tegolong baik.
Indikator lain yang diperhatikan adalah indeks kehandalan atau reliabilitas.
Besarnya indeks reliabilitas sebaiknya minimal 0,7.
9) Perbaikan Instrumen
Perbaikan dilakukan terhadap butir-butir pertanyaan/pernyataan yang tidak
baik. Perbaikan berdasarkan hasil ujicoba dan saran masukan dari responden.
10) Pelaksanaan Pengukuran
Pelaksanaan pengukuran sebaiknya dilakukan pada saat responden tidak lelah.
Ruang untuk pelaksanaan pengukuran harus representatif, baik kondisi ruang,
tempat duduk, ataupun yang lain. Diusahakan responden tidak saling bertanya
ketika pengukuran dilaksanakan. Pengisian instrumen dimulai dengan penjelasan
tujuan pengisian, manfaat bagi responden, dan pedoman pengisian instrumen.
11) Penafsiran Hasil Pengukuran
Hasil pengukuran berupa skor atau angka. Menafsirkan hasil pengukuran
disebut dengan penilaian. Untuk menafsirkan hasil pengukuran diperlukan suatu
kriteria. Kriteria yang digunakan tergantung pada skala dan jumlah butir yang
digunakan.

Anda mungkin juga menyukai