Menurut Anas Sujiono apabila kata valid dikaitkan dengan fungsi tes sebagai
alat pengukur maka tes dikatakan valid adalah apabila tes tersebut dengan secara
1
tepat, secara benar, secara sahih, atau secara abash dapat mengukur apa yang
seharusnya diukur, dengan kata lain tes dapat dikatakan telah memiliki validitas
apabila tes tersebut dengan secara tepat, benar, sahih atau abash telah dapat
mengungkapkan atau mengukur apa yang seharusnya diungkap atau di ukur lewat tes
tersebut.1
2. Reliabilitas
Reliabel artinya handal atau dapat dipercaya. Suatu tes dapat dipercaya apabila
hasil yang diperoleh konstan atau tetap tidak menunjukkan perubahan yang berarti
walaupun diadakan tes lebih dari satu kali. Reliabilitas menyangkut persoalan
stabilitas dari hasil yang dicapai oleh tes tersebut. Ada 3 faktor yang berpengaruh
terhadap stabilitas hasil sesuatu tes yaitu: testi, tester dan alat pengukur itu sendiri.
Reliabilitas menunjuk kepada ketetapan dari nilai yang diperoleh sekelompok
individu dalam kesempatan yang berbeda dengan tes yang sama ataupun yang itemnya
ekuivalen.
Instrument yang reliable merupakan alat untuk mengetahui adanya perubahan
antara skor sebelum dan sesudah percobaan. Dianggap bahwa perubahan itu terjadi
atas pengaruh variable eksperimen itu, malah di anggap bahwa perubahan itu
disebabkan oleh variable eksperimen itu. Walaupun tidak dapat dibuktikan bahwa
antara variable eksperimen dan perubahan terdapat hubungan sebab-akibat, namun
dapat mendukung anggapan itu. Di samping itu, reliability ini juga merupakan syarat
bagi validitas suatu tes. Tes yang tidak reliable dengan sendirinya tidak valid. Jika tes
itu tidak reliable, jadi senantiasa menunjukkan hasil yang berbeda-beda, dapat
disangsikan pula validitasnya.2
3. Kesukaran
Tingkat kesukaran dalam suatu tes merupakan suatu hal yang perlu
dipertimbangkan, karena tes psikologis berbeda dengan tes hasil belajar. Jika soal
yang diberikan dalam tes psikologis terlalu mudah, maka semua akan dijawab dengan
baik. Tapi tidak akan bisa mengungkapkan apa yang sebenarnya begitu juga dengan
soal yang begitu rumit. Misalnya pada tes intelegensi (IQ) yang sudah ditentukan
tingkat kesukarannya untuk umur tertentu, soal tes IQ untuk murid SD akan berbeda
dengan murid SMP. Kesukaran item didefinisikan sebagai persentase manusia yang
menjawab item dengan benar.Kesukaran item ditentukan beberapa hal antara lain
umur siswa. Dalam keadaan lain kesukaran item digunakan untuk menentukan
tingkatan, tujuan testing untuk membedakan antara siswa yang memiliki berbagai
tingkat pengetahuan mengenai suatu subyek.
4. Diskriminasi
Dalam analisis beda, arah kecendrungan alternatif jawaban pada item dipilih
menjadi dua, jawaban satu dan dua. Pembagian arah jawaban tes tidak mengandung
arti bahwa jawaban satu lebih baik daripada jawaban dua. Pembagian tersebut hanya
sebagai kode. Bila kemungkinan jawaban suatu item terdiri dari dua alternatif, maka
penentuan arah jawaban dapat dilakukan dengan mudah.
Suatu tes dapat dikatakan diskriminatif apabila mampu menunjukkan adanya
perbedaan-perbedaan yang kecil dari sifat-sifat tertentu dari individu individu yang
berbeda-beda.4
Yogyakarta:Pustaka pelajar,2003.
3
5. Balance
Suatu tes yang baik harus seimbang. Semua aspek yang akan di ukur tak hanya
menumpuk pada suatu item tertentu hingga hasil tes dapat mengukur apa yang akan
diukur dan dapat mengungkapkan apa yang sebenarnya yang harus diungkapkan.5
4
Zainul dan Nasution, Penilaian Hasil Belajar (Jakarta: Dirjen Dikti, 2001),hlm 17.
5 5
Sudijono,Anas.1998.Pengantar Evaluasi Pendidikan. Jakarta:PT Raja Grafindo Persada.76.
kedua True-False item bersifat ambigo. Seringkali ke ambigo-an ini dirasakan oleh
siswa yang tidak mempunyai pengetahuan yang dibutuhkan untuk menjawapab item.
Argumen ketiga pendidik yakin bahwa siswa dapat memperoleh skor tinggi dengan
4
menebak, karena hanya dua pilihan maka siswa mempunyai kesempatan 50 % untuk
mendapatkan jawaban benar atau salah dengan menebak.
c. Matching Item
Matching terdiri dari dua paralel daftar, yang satu berisi stimulus atau stem yang
lain berisi respon yang mngkin.Tugas siswa adalah mencocokkkan bentuk dari dua
daftar, hal ini adalah menyeleksi respon ang paling cocok untuk setiap stimulus.
Stimulus dapat menggunakan pernyataan verbal. Bagaimanapun, matching item
cocock untuk beberapa tipe materi.
d. Short answer
Short answer memberikan beberapa tipe item yang akan direspon siswa dengan
kata, phrase, kalimat, simbol atau nomer. Short-answer item yang sering digunakan
adalah melengkapi item dengan kalimat atau beberapa kata yang hilang. e. Essay
Question.
Essai question terdiri dari pernyataan, seringkali beberapa kalimat panjang yang
menggambarkan situasi dan atau problem. Tugas siswa adalah menulis essay untuk
menjawab problem yang dituju. Jawaban ini mungkin satu paragraf atau beberapa
halaman. Perbedaan antara short answer dengan essay question adalah panjangnya
respon yang dibutuhkan. Pada essay question lebih ditekankan pada
mengorganisasikan dan menggabungkan materi. Problem dapat dilakukan
pendekatan dengan berbagai cara.
f. Problems
Dalam beberapa cara problem memberikan fungsi yang sama dalam kursus
matematika dan science sebagai essay question yang dikerjakan dalam studi sosial
dan kursus humanity. Situasi dan atau beberapa informasi disajikan dan tugas siswa
adalah memberikan solusi.
7. Kespesifikan
Suatu tes psikologis dilakukan untuk dapat mengungkapkan kompetensi
seseorang, seperti tes intelegensi harus dapat mengungkapkan kemampuan dasar dan
intelegensi orang tersebut, demikian juga dengan tes bakat yang harus mampu
mengungkapkan bakat yang dimiliki seseorang.3
8. Kecepatan
3 Dewa Ketut Sukardi. 1997. Analisis Tes Psikologis. Jakarta: Rinneka Cipta.
5
Mengacu kepada waktu dalam pelaksanaan tes. Waktu dalam pelaksanaan tes
itu tidak terlalu lama dan tidak terlalu cepat. Untuk menentukan tes yang baik dan
efisien maka dapat dipertimbangkan melalui try out.
KESIMPULAN
6
Sebagai suatu alat pengukur yang digunakan untuk mengukur, membandingkan
dan memperoleh suatu informasi yang akurat, maka suatu tes yang baik harus memiliki
syarat-syarat tertentu, yaitu:
1. Validitas
2. Reliabilitas
3. Kesukaran
4. Diskriminasi
5. Balans
6. Efisiensi, Objektifitas
7. Kespesifikan
8. Kecepatan
Daftar pustaka
Dewa Ketut Sukardi. 1997. Analisis Tes Psikologis. Jakarta: Rinneka Cipta.
Amir Daien Indrakusuma. 1993. Evaluasi Pendidikan. Malang: Penerbit IKIP Malang.
Frederick G. Brown. (terjemahan oleh Yuenda Vicky Larasati). 2009. Measuring Classroom.
Achievement. (http://pdf.database.com/mengukur-pencapaian-siswa.html)
7
Sudijono,Anas.1998.Pengantar Evaluasi Pendidikan. Jakarta:PT Raja Grafindo Persada.
Azwar, Saifuddin.,Reliabilitas dan validitas, Yogyakarta:Pustaka pelajar,2003.