Evaluasi dilakukan untuk menentukan kualitas atau nilai dari kegiatan
pembelajaran yang telah dilaksanakan baik menyangkut tujuan, materi, metode,
media, sumber belajar, lingkungan maupun sistem penilaian itu sendiri. Agar
dapat mengukur dengan benar dan tepat apa yang hendak diukur maka alat
ukur (tes) yang digunakan harus memenuhi kriteria standar pengukuran. Ada
beberapa pendapat para ahli tentang ciri-ciri tes yang baik diantaranya :
Menurut Mudjijo ada 4 ciri tes yang baik yaitu : Validitas, reliabilitas, kemudahan
dan kepraktisan. Kemudahan dalam hal ini yaitu mudah dilaksanakan dan
kepraktisan dalam hubungannya dengan biaya dan waktu untuk melaksanakan dan
yang terakhir analisis butir soal. Tes yang baik berarti soal tersebut memiliki
butir soal yang baik.[1]
Menurut Suharsimi Arikunto suatu tes dapat dikatakan baik apabila memenuhi
lima persyaratan, yaitu :
1.Validitas
Kata valid sering diartikan dengan : tepat, benar, absah dan shahih. Jadi kata
validitas ketepatan, kebenaran, keabsahan. Apabila dikaitkan dengan fungsi tes
sebagai alat pengukur maka sebuah tes dikatakan valid apabila alat ukur
tersebut dapat dengan tepat mengukur apa yang hendak diukur atau diungkap lewat
tes tersebut. Jadi tes hasil belajar dapat dinyatakan valid (alat pengukur
keberhasilan) dengan secara tepat dapat mengukur atau mengungkap hasil-hasil
belajar yang telah dicapai oleh peserta didik setelah menempuh proses belajar
mengajar dalam waktu tertentu[2]
Contoh : Diperoleh informasi bahwa Si A beratnya 80 kg setelah diukur dengan
timbangan beras yang benar memang hasilnya demikian beratnya berdasarkan
hasil timbangan.
Ada 4 (empat) macam validitas tes yang seringkali menjadi perhatian untuk
menguji kualitasnya, yaitu: (a) validitas isi; (b) validitas susunan (konstruksi); (c)
validitas bandingan; dan (d) validitas ramalan.
a. Validitas Isi
Validitas isi merupakan ukuran yang digunakan untuk mengetahui ketepatan dari
suatu instrumen (tes) bila ditinjau dari aspek isi (konten/materi). Pengecekan
validitas isi dapat dilakukan dengan cara membandingkan isi (konten/materi) tes
dengan komponen-komponen yang seharusnya diukur.
c. Validitas Bandingan
Validitas bandingan sebuah tes adalah ketepatan suatu tes bila ditelaah berdasarkan
hubungannya (korelasi) terhadap keadaan yang sebenarnya dari siswa saat
pengukuran (assessmen) dilakukan.
d. Validitas Ramalan
Validitas ramalan adalah ketepatan sebuah tes (instrumen) bila dilihat dari
kemampuannya untuk meramalkan keadaan individu (siswa) pada masa yang akan
datang.
Untuk tes hasil belajar aspek validitas yang paling penting adalah validitas isi. Yang
dimaksud dengan validitas isi adalah ukuran yang menunjukkan sejauh mana skor
dalam tes yang berhubungan dengan penguasaan peserta tes dalam bidang studi
yang diuji melalui perangkat tes tersebut. Untuk mengetahui tingkat validitas isi
tes, diperlukan adanya penilaian ahli yang menguasai bidang studi tersebut.
2.Reliabilitas
Kata reliabilitas dari kata reliability (Inggris) yang artinya dapat dipercaya. Tes yang
reliable jika memberikan hasil yang tetap (consistent) apabila diteskan berkali-kali.
Jika kepada siswa diberikan tes yang sama yang pada waktu yang berlainan, maka
setiap siswa akan tetap berada dalam urutan rangking yang sama tetap (ajeg) dalam
kelompoknya. Validitas berhubungan dengan ketepatan sedangkan reliabilitas
berhubungan dengan ketetapan atau keajekan.`
Sebuah tes dikatakan relibel apabila hasil-hasil pengukuran yang dilakukan
dengan menggunakan tes tersebut secara berulang kali terhadap subyek yang
sama hasilnya tetap sama atau sifatnya stabil.[3] Yang dimaksud Stabil disini
yaitu tetap berada pada urutan kelompoknya ketika tes dilakukan berulang-ulang
meskipun terjadi perubahan nilai secara keseluruhan oleh kelompoknya tetapi
pada posisi urutan rangkingnya tetap atau berubah tetapi perubahannya tidak
berarti. Jadi penekannanya bukan pada tetapnya nilai tetapi pada tetapnya
posisi urutan nilai atau rangking dalam kelompoknya. Walaupun tampaknya hasil
tes pada tes kedua lebih baik karena kenaikannnya dialami oleh semua siswa
maka tes yang digunakan dapat dikatakan memiliki reliabilitas yang tinggi.
Kenaikan hasil yang kedua bisa jadi disebabkan adanya pengalaman yang
diperoleh pada waktu mengerjakan tes pertama.
Contoh
Tabel Nilai Tes Pertama dan Kedua
Pada tabel tersebut di atas menunjukkan hasil tes pertama dan hasil tes kedua
yang dicapai oleh siswa secara keseluruhan cenderung mengalami kenaikan
tetapi pada posisi rangkingnya tetap yang berarti alat tes yang digunakan dalam
menilai hasil belajar tersebut reliable atau dapat dipercaya.
Menurut Ngalim Purwanto suatu tes disebut andal (reliability) jika ia dapat
dipercaya, konsisten atau stabil.
1) Test-retest reliability
Tehnik ini adalah teknik satu tes. Tes retest berarti dua kami melaksanakan tes
yang sama pada kelompok yang sama. Dalam rangka tehnik ini perlu dijaga bahwa
pada pelaksanaan yang pertama murid tidak mengambil/menyalin soal. Tehnik ini
disebut self correlation dan koeisien yang diperoleh disebut coefficient of stability.
2) Split-half reliability
Metode aplit-half reliability adalah metode satu tes. Perangkat tes yang diberikan
dianggap dua macam tes yang sejajar, jadi satu test dibagi dua (spli haf) dalam
memeriksa dan membuat skor murid. Pembagian yang dimaksud dilaksanakan
dengan item bernomor genap dan item bernomor ganjil. Hal ini lebih baik karena
biasanya perangkat tes tersusun dari item yang mudah menuju item yang sukar.
Jadi dalam menskor jawaban dibuat dua set skor yaitu skor murid dalam tes yang
bernomor ganjul dan skor murid dalam tes yang bernomor genap. Kedua skor ini
bernomor ganjil dan skor murid dalam tes yang bernomor genap. Kedua skor ini
dicari korelasinya dan koefisien yang diperoleh menunjukkan tingkat
reliabilitasnya tes yang disebut coefficient of internal consistency atau split- halves
correlation.
3) Reliabilitas Equivalent
Teknik ini disebut juga mencari reliabilita dengan metode dua tes. Dalam hal ini
disusun dua set tes yang equivalen. Tes yang equivalent berarti bahwa bahan,
bentuk dan tingkat kesukaran butir soal adalah sejajar/ parallel yang berbeda
hanyalah perumusan kalimat dari setiap butir soal. Di samping itu tes yang
equivalen dapat juga diartikan. Dua set tes yang mempunyai kriteria yang sama
dan tingkat kesukaran yang sama. Kedua tes ini diberikan kepada kelompok yang
sama secara berturut- turut (jarak pelaksanaan yang pertama dan kedua tidak
terlalu lama, lebih kurang satu atau dua hari). Skor masing-masing anak dari kedua
tes itu dihitung korelasinya, dengan rumus korelasi langsung. Angka korelasi yang
diperoleh diebut coefficient of equivalent atau correlation of equivalent. Semakin
besar koefisien korelasi yang diperoleh itu semakin tinggi pula reliabilitas dari tes
tersebut.
4) Inter-item Consistency
tes.
Item yang kalimatnya terlalu pendek apalagi angat mudah diingat akan mengurangi
reliabilitas tes karena setelah pelaksanaan yang pertama murid akan membahasnya
dan bila dilaksanakan untuk kedua kalinya semua murid telah dapat menjawwab
dengan benar. Demikian juga item yang kalimatnya terlalu panjang akan
menimbulkan keraguan dalam member jawaban atau murid tidak berusaha
menjawabnya.
Item yang sangat sukar dan sangat mudah akan mengurangi tingkat reliabilitasnya
te, karena
item yang sangat sukar akan selalu salah dijawab oleh kemungkinan seluruh kelas
sukar akan selalu dijawab oleh kemungkinan seluruh kelas sebaiknya item yang
sangat mudah akan selalu benar dijawab oleh kemungkinan seluruh murid.
Sehingga bila dalam perangkat tes terdapat banyak item yang kesukarannys
ekstrim akan mengurangi variasi skor dengan demikian akan mengurangi tingkat
reliabilitas.
Jumlah waktu yang dipergunakan hendaknya disesuaikan denngan jumlah item dan
tingkat kesukaran item. Waktu yang “agak lama”, dimana setengah atau lebih dari
murid yang dites sudah selesai sebelum waktu yang ditentukan habis, akan
mengurangi sifat reliabilitas apalagi kalau metode perhitungannya melalui test-
retest.
kedua akan banyak Kondisi murid dan kondisi/situasi tempat pelaksanaan tes erat
hubungannyadenga tingkat reliabilita tes. Murid yang kurang keungguhan bekerja
akan menghasilkan nilai yang kurang reliable.
c. Butir soal yang sudah diketahui anak, jelas akan mengurangi tingkat reliabilitas
tes. Hal inilah yang menyebabkan diadakannya kode etik tes psikologis.
3.Objectivitas
Objektif berarti tidak adanya unsur pribadi yang mempengaruhinya bukan subjectif.
Sebuah tes dikatakan memiliki objectivitas apabila dalam melaksanakan tes tidak ada
faktor subjectif yang mempengaruhi terutama dalam sistem skornya.
Apabila dikaitkan dengan reliabilitas maka objectivitas menekankan ketetapan
(consistency) pada sistem skoring, sedangkan reliabilitas menekankan ketetapan
dalam hasil tes. Ada 2 faktor yang mempengaruhi subjectivitas dari sesuatu tes yaitu
bentuk tes dan penilai :
Bentuk Tes
Tes yang berbentuk uraian akan memberi banyak kemungkinan kepada sipenilai
untuk memberikan penilaian menurut caranya sendiri. Untuk menghindari masuknya
unsur subjektivitas dari penilai maka sistem skoringnya dapat dilakukan dengan
cara sebaik-baiknya antara lain lain dengan membuat pedoman skoring terlebih
dahulu.
Penilai
Subjectivitas dari penilai akan dapat masuk secara agak leluasa terutama dalam tes
bentuk uraian. Faktor-faktor yang mempengaruhi subjectivitas antara lain kesan
penilai terhadap siswa, tulisan bahasa, kelelahan untuk menghindari subjektivitas
maka harus mengacu pedoman terutama menyangkut masalah pengadministrasian
yaitu kontinuitas dan komprehensivitas.
Sedangkan Menurut Prof. Drs. Anas Sujiono Suatu tes belajar dapat disebut tes
belajar yang obyektif apabila tes tersebut disusun dan dilaksanakan menurut apa
adanya. Ditinjau dari segi isi atau materinya artinya bahwa materi tes diambilkan
atau bersumber dari materi atau bahan pelajaran yang telah diberikan sesuai
dengan instruksional khusus yang telah ditentukan atau bahan pelajaran yang
telah dipelajari oleh peserta didik yang dijadikan acuan dalam penyusunan hasil
belajar tersebut.[5]
4. Praktibilitas (practibility)
Sebuah tes disebut memiliki praktibilitas yang tinggi apabila tes tersebut bersifat
praktis, Tes yang praktis adalah tes yang :
Mudah dilaksanakan, tidak menuntut peralatan yang banyak dan memberi kebebasan
kepada siswa mengerjakan terlebih dahulu bagian yang dianggap mudah. Karena
bersifat sederhana dalam arti tidak memerlukan peralatan yang sulit
pengadaannya[6]
Mudah pemeriksaannya artinya bahwa tes itu dilengkapi kunci jawaban maupun
pedoman skoringnya. Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat
diberikan atau diawali orang lain.
Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat diberikan atau
diawasi oleh orang lain
5. Ekonomis
Pelaksaan tes tersebut tidak membutuhkan ongkos atau biaya yang mahal, tenaga
yang banyak serta waktu yang lama.[7]
DAFTAR KEPUSTAKAAN
Arikunto Suharsimi, Dasar- Dasar Evaluasi Pendidikan, Jakarta : PT. Bumi
Aksara,Edisi Revisi 2002
Sudijono Anas, Pengantar Evaluasi Pendidikan. Jakarta : Raja Grafindo Persada,
1996
Putro Widoyoko Eko, Evaluasi Program Pembelajaran, Yogyakarta: Pustaka,
Pelajar, 2009
Mudjijo. Tes Hasil Belajar. Jakarta: Bumi Aksara, 1995
Purwanto Ngalim , Prinsip-Prinsip Dan Teknik Evaluasi Pendidikan , Bandung :
Remaja Rosda Karya, 1994