Anda di halaman 1dari 6

KARAKTERISITIK TES YANG BAIK

Tes secara sederhana dapat diartikan sebagai himpunan pertanyaan yang harus
dijawab, pernyataan-pernyataan yang harus dipilih/ditanggapi, atau tugas tugas yang harus
dilakukan oleh peserta tes dengan tujuan untuk mengukur suatu aspek tertentu dari peserta
tes. Untuk dapat menjadi alat ukur yang baik dan dapat memberikan informasi yang akurat
maka setiap soal sebagai bagian dari konstruksi tes harus dijaga kualitasnya. Salah satu
teknik penilaian yang digunakan yang digunakan untuk menilai kemampuan belajar anak
adalah dengan tes.
Sebuah tes harus memenuhi syarat-syarat tertentu sebagai alat pengukur, sebab
memang tidak jarang kesimpulan penting ditarik dan keputusan penting diambil
berdasarkan informasi-informasi yang berhasil diperoleh melalui penggunaan tes, padahal
di lain pihak kita menyadari kelemahan-kelemahannya yang sebagaian terletak pada
kurang cermatnya kita memerikasa alat pengukur (tes) itu sendiri. Kadang-kadang tes
yang dipergunakan tidak benar-benar mengukur apa yang mau diukur, hasil pengukuran
tidak cukup mantap, tidak ada patokan interpretasi yang cukup tegas tentang benar
tidaknya suatu jawaban, dan kadang tes itu tidak cukup mampu menunjukkan perbedaan-
perbedaan kemampuan. Untuk itu, diperlukan karakteristik atau syarat-syarat yang harus
dipenuhi dalam pembuatan tes yang baik.
Berikut adalah pandangan para ahli mengenai karakteristik suatu tes yang baik:
1. Prof. Drs. Anas Sudijono dalam bukunya yang berjudul
“Pengantar EvaluasiPendidikan” (2005: 93) mengatakan bahwa setidak-tidaknya ada
empat karakteristik yang harus dimiliki oleh tes yang baik yaitu: valid, reliable, objektif,
dan praktis.
2. Masrun MA dan Dra. Sri Mulyani Martaniah (1974: 117) mengatakan bahwa suatu tes
yang baik harus memiliki minimal tiga hal, yaitu: validitas, reliable, dan
kemampuan membandingkan.
3. Dra. Suharsimi AK mengatakan bahwa suatu tes yang baik harus memenuhi empat syarat,
yaitu: validitas, reliabilitas, objektifitas, dan praktikabilitas.
4. Arikunto & Suharsimi dalam bukunya “Dasar-dasar Evaluasi Pendidikan” mengatakan
bahwa syarat-syarat tes yang baik adalah: validitas, reliabilitas, objektivitas,
praktikabilitas, dan ekonomis.
5. Miller (1991: 91) dan Gronlund & Lin (1990: 47) menyatakan bahwa ada tiga hal yang
harus diperhatikan dalam menentukan suatu alat ukur yang berkualitas,
yaitu:validitas, reliabilitas, dan praktikabilitas.
Dari beberapa pendapat para ahli di atas dapat kita lihat bahwa tidak ada yang
bertentangan antara yang satu dengan yang lain, tetapi saling melengkapi, sehingga dapat
disimpulkan bahwa kriteria tes yang baik melingkupi:
1. Validitas
Kata valid sering diartikan dengan : tepat, benar, absah dan shahih. Jadi kata
validitas ketepatan, kebenaran, keabsahan. Apabila dikaitkan dengan fungsi tes sebagai
alat pengukur maka sebuah tes dikatakan valid apabila alat ukur tersebut dapat
dengan tepat mengukur apa yang hendak diukur atau diungkap lewat tes tersebut. Jadi
tes hasil belajar dapat dinyatakan valid (alat pengukur keberhasilan) dengan secara
tepat dapat mengukur atau mengungkap hasil-hasil belajar yang telah dicapai oleh
peserta didik setelah menempuh proses belajar mengajar dalam waktu tertentu.
Contoh : Diperoleh informasi bahwa Si A beratnya 80 kg setelah diukur
dengan timbangan beras yang benar memang hasilnya demikian beratnya berdasarkan
hasil timbangan.
Untuk tes hasil belajar aspek validitas yang paling penting adalah validitas isi.
Yang dimaksud dengan validitas isi adalah ukuran yang menunjukkan sejauh mana
skor dalam tes yang berhubungan dengan penguasaan peserta tes dalam bidang studi
yang diuji melalui perangkat tes tersebut. Untuk mengetahui tingkat validitas isi tes,
diperlukan adanya penilaian ahli yang menguasai bidang studi tersebut.
Jenis-jenis validitas yang dapat dipakai sebagai kriterium, dalam menetapkan
tingkat kehandalan tes, diantaranya adalah:
a. Validitas Permukaan (Face Validity): Validitas ini sering pula disebut sebagai validitas
tampang. Validitas jenis ini menggunakan kriterium yang paling sederhana karena yang
menjadi kriterianya hanya tampang atau penampakan dari instrumen itu sendiri. Apabila
tes sebagai instrumen pengukuran, berdasar pengamatan sepintas telah dapat mengungkap
fenomena yang akan dicari, bila secara sepintas sudah dianggap baik, maka alat tersebut
sudah dapat dianggap memenuhi kriteria face validity, sehingga tidak diperlukan adanya
pertimbangan mendalam.
b. Validitas konsep (Construct Validity): Validitas ini disebut juga sebagai validitas
konstruksi teori. Dalam hal ini alat ukur dikatakan valid apabila item sebagai alat ukur
telah mencerminkan konsep perilaku yang diukur, dan memiliki tingkat kesesuaian dengan
konstruksi teoritiknya. Validitas konstruksi ini sering pula disebut sebagai logical Validity.
Penggunaan validitas logis terutama dalam pengukuran-pengukuran gejala perilaku yang
abstrak misalnya ukuran tentang kesetiakawanan, kematangan emosi, sikap terhadap KB,
motivasi dan sebagainya.
c. Validitas Isi (Content Validity): Sesuai dengan namanya validitas ini disebut pula sebagai
validitas isi, pada validitas ini yang menjadi kriterium untuk menetapkan valid atau
tidaknya alat ukur adalah isi/substansi dari variabel yang akan diukur, sehingga pada
umumnya validitas ini hanya digunakan untuk mengukur variabel dengan cakupan materi
yang jelas, misalnya saja dalam tes hasil belajar, alat ukur digunakan untuk dapat
mengukur penguasaan siawa terhadap kompetensi bidang studi yang dipersyaratkan.
Derajad validitas menunjuk pada kemampuan tes dalam menggambarkan topik-topik dan
ruang lingkup cakupan materi yang akan diukur. Apabila alat ukur yang dikembangkan
telah representatif, dalam arti mewakili semua cakupan materi, maka alat ukur tersebut
telah memenuhi syarat content validity. Karena secara umum cakupan materi bidang studi
biasanya berpedoman pada kurikulum yang telah ditetapkan maka content validity sering
pula disebut sebagai “Curriculair Validity”.
d. Concurrent Validity: Validitas ini dikenal pula dengan nama validitas bandingan, karena
dalam menetapkan tingkat validitas alat ukur diperlukan kriterium luar yang berupa alat
ukur lain yang serupa dan sudah dibakukan validitasnya. Apabila hasil pengukuran yang
dilakukan dengan alat ukur baru, mempunyai tingkat kesesuaian dengan hasil yang
pengukuran yang diperoleh dari alat ukur yang sudah dibakukan, maka tes sebagai alat
ukur ini dianggap memenuhi concurrent validity.
e. Factorial Validity: Dalam kegiatan penelitian, tidak jarang terjadi sebuah skala
pengukuran variabel terdiri dari beberapa faktor. Faktor-faktor tersebut diperoleh berdasar
demensi/indikator dari variabel/gejala yang diukur, sesuai yang terungkap dalam
konstruksi teoritisnya. Meskipun variabel terdiri dari beberapa faktor, prinsip homogenitas
untuk keseluruhan faktor harus tetap dipertahankan. Disamping perlu dicegah adanya
overlap antara satu faktor dengan faktor yang lain. Sehingga kriterium yang digunakan
dalam factorial validity ini dapat dilihat dengan menghitung homogenitas skor setiap
faktor dengan total skor, serta homogenitas antara skor dari faktor yang satu dengan skor
dari faktor yang lain.Di samping pembagian validitas dengan jenis-jenis seperti telah
diuraikan diatas, terdapat pula pembagian validitas yang hanya dikelompokkan menjadi
dua kelompok besar yaitu validitas eksternal dan validitas internal.

2. Relevan
Kata reliabilitas dari kata reliability (Inggris) yang artinya dapat dipercaya. Tes
yang reliable jika memberikan hasil yang tetap (consistent) apabila diteskan berkali-kali.
Jika kepada siswa diberikan tes yang sama yang pada waktu yang berlainan, maka setiap
siswa akan tetap berada dalam urutan rangking yang sama tetap (ajeg) dalam
kelompoknya. Validitas berhubungan dengan ketepatan sedangkan reliabilitas
berhubungan dengan ketetapan atau keajekan.`
Sebuah tes dikatakan relibel apabila hasil-hasil pengukuran yang dilakukan
dengan menggunakan tes tersebut secara berulang kali terhadap subyek yang sama
hasilnya tetap sama atau sifatnya stabil. Yang dimaksud Stabil disini yaitu tetap
berada pada urutan kelompoknya ketika tes dilakukan berulang-ulang meskipun
terjadi perubahan nilai secara keseluruhan oleh kelompoknya tetapi pada posisi
urutan rangkingnya tetap atau berubah tetapi perubahannya tidak berarti. Jadi
penekannanya bukan pada tetapnya nilai tetapi pada tetapnya posisi urutan nilai
atau rangking dalam kelompoknya. Walaupun tampaknya hasil tes pada tes kedua
lebih baik karena kenaikannnya dialami oleh semua siswa maka tes yang digunakan
dapat dikatakan memiliki reliabilitas yang tinggi. Kenaikan hasil yang kedua bisa
jadi disebabkan adanya pengalaman yang diperoleh pada waktu mengerjakan tes
pertama.
Contoh
Tabel Nilai Tes Pertama dan Kedua

Nama Siswa Pengetesan Pengetesan Kedua


Pertama
Ahmad 5,5 6,6

Arman 6 7

Cahya 8 9

Darma 5 6

Elvi 6 7

Firda 7 8

Pada tabel tersebut di atas menunjukkan hasil tes pertama dan hasil tes kedua
yang dicapai oleh siswa secara keseluruhan cenderung mengalami kenaikan tetapi
pada posisi rangkingnya tetap yang berarti alat tes yang digunakan dalam menilai
hasil belajar tersebut reliable atau dapat dipercaya.
Menurut Ngalim Purwanto suatu tes disebut andal (reliability) jika ia dapat
dipercaya, konsisten atau stabil.
Kerlinger (1986: 443) mengemukakan bahwa reliabilitas dapat ukur dari tiga
kriteria yaitu:
1) Stability, adalah kriteria yang menunjuk pada keajegan (konsistensi) hasil yang ditunjukan
alat ukur dalam mengukur gejala yang sama, pada waktu yang berbeda.
2) Dependability, yaitu kriteria yang mendasarkan diri pada kemantapan alat ukur atau
seberapa jauh alat ukur dapat diandalkan.
3) Predictability, karena perilaku merupakan proses yang saling berkait dan
berkesinambungan, maka kriteria ini mengidealkan alat ukur yang dapat diramalkan
hasilnya dan meramalkan hasil pada pengukuran gejala selanjutnya.
Dengan mencermati pendapat di atas, maka batas reliabilitas atau keajegan dapat
diartikan sebagai konsistensi skor yang diperoleh dari orang yang sama, pada gejala yang
sama. Untuk itu ada kemungkinan skor pembanding, mungkin berupa skor yang diperoleh
dari alat ukur yang sama pada kesempatan yang berbeda, atau skor yang diperoleh dari alat
ukur lain yang seimbang. Kerlinger menyatakan bahwa reliabilitas instrumen dikatakan
baik bila alat tersebut dikenakan pada obyek yang sama, akan mendapatkan hasil yang
sama pada beberapa kesempatan yang berbeda.
3. Objectivitas
Objektif berarti tidak adanya unsur pribadi yang mempengaruhinya bukan
subjectif. Sebuah tes dikatakan memiliki objectivitas apabila dalam melaksanakan tes
tidak ada faktor subjectif yang mempengaruhi terutama dalam sistem skornya.
Apabila dikaitkan dengan reliabilitas maka objectivitas menekankan ketetapan
(consistency) pada sistem skoring, sedangkan reliabilitas menekankan ketetapan dalam
hasil tes. Ada 2 faktor yang mempengaruhi subjectivitas dari sesuatu tes yaitu bentuk
tes dan penilai :
a. Bentuk Tes
Tes yang berbentuk uraian akan memberi banyak kemungkinan kepada sipenilai
untuk memberikan penilaian menurut caranya sendiri. Untuk menghindari masuknya
unsur subjektivitas dari penilai maka sistem skoringnya dapat dilakukan dengan cara
sebaik-baiknya antara lain lain dengan membuat pedoman skoring terlebih dahulu.
b. Penilai
Subjectivitas dari penilai akan dapat masuk secara agak leluasa terutama dalam tes
bentuk uraian. Faktor-faktor yang mempengaruhi subjectivitas antara lain kesan penilai
terhadap siswa, tulisan bahasa, kelelahan untuk menghindari subjektivitas maka harus
mengacu pedoman terutama menyangkut masalah pengadministrasian yaitu kontinuitas
dan komprehensivitas.
Sedangkan Menurut Prof. Drs. Anas Sujiono Suatu tes belajar dapat disebut
tes belajar yang obyektif apabila tes tersebut disusun dan dilaksanakan menurut apa
adanya. Ditinjau dari segi isi atau materinya artinya bahwa materi tes diambilkan
atau bersumber dari materi atau bahan pelajaran yang telah diberikan sesuai dengan
instruksional khusus yang telah ditentukan atau bahan pelajaran yang telah
dipelajari oleh peserta didik yang dijadikan acuan dalam penyusunan hasil belajar
tersebut.[5]
4. Praktibilitas (practibility)
Sebuah tes disebut memiliki praktibilitas yang tinggi apabila tes tersebut
bersifat praktis, Tes yang praktis adalah tes yang :
a. Mudah dilaksanakan, tidak menuntut peralatan yang banyak dan memberi kebebasan
kepada siswa mengerjakan terlebih dahulu bagian yang dianggap mudah. Karena
bersifat sederhana dalam arti tidak memerlukan peralatan yang sulit pengadaannya
b. Mudah pemeriksaannya artinya bahwa tes itu dilengkapi kunci jawaban maupun
pedoman skoringnya. Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat
diberikan atau diawali orang lain. Dilengkapi dengan petunjuk-petunjuk yang jelas
sehingga dapat diberikan atau diawasi oleh orang lain
5. Ekonomis
Pelaksaan tes tersebut tidak membutuhkan ongkos atau biaya yang mahal, tenaga
yang banyak serta waktu yang lama.

Referensi:

http://makalahpendidikanislamlengkap.blogspot.com/2015/06/ciri-ciri-tes-yang-baik-evaluasi.html
http://indahputrisantri0.blogspot.com/2015/03/karakteristik-tes-yang-baik.html
http://alamakkasiannyami.blogspot.com/2013/03/kriteria-tes-yang-baik.html
Arikunto Suharsimi, Dasar- Dasar Evaluasi Pendidikan, Jakarta : PT. Bumi Aksara,Edisi Revisi 2002
Sudijono Anas, Pengantar Evaluasi Pendidikan. Jakarta : Raja Grafindo Persada, 1996
Putro Widoyoko Eko, Evaluasi Program Pembelajaran, Yogyakarta: Pustaka, Pelajar, 2009
Mudjijo. Tes Hasil Belajar. Jakarta: Bumi Aksara, 1995
Purwanto Ngalim , Prinsip-Prinsip Dan Teknik Evaluasi Pendidikan ,Bandung : Remaja Rosda Karya, 1994

Anda mungkin juga menyukai