1. Kepraktisan
Kepraktisan mengacu pada masalah administrasi logistik, membumi, yang terlibat dalam
pembuatan, pemberian, dan penilaian instrumen penilaian. Ini termasuk “ biaya , jumlah
waktu yang diperlukan untuk membangun dan mengelola , kemudahan penilaian , dan
kemudahan menafsirkan/melaporkan hasil” ( Mousavi , 2009, hal. 516).
Biaya
- Tes seharusnya tidak terlalu mahal untuk dilakukan.
- Biaya untuk yang terakhir harus tetap sesuai anggaran.
- Hindari melakukan tes yang membutuhkan anggaran berlebihan.
Waktu
- Tes harus tetap dalam batasan waktu yang tepat.
- Tes tidak boleh terlalu panjang atau terlalu pendek.
Administrasi
- Tes tidak boleh terlalu rumit atau rumit untuk dilakukan.
- Tes harus cukup sederhana untuk mengelola.
Skor
- Proses penilaian harus sesuai dengan alokasi waktu.
- Sebuah tes harus disertai dengan rubrik penskoran, kunci jawaban, dan
sebagainya untuk memudahkan dalam penskoran.
2. Keandalan
Tes yang andal adalah konsisten dan dapat diandalkan. Itu berarti bahwa Jika Anda
memberikan tes yang sama kepada siswa yang sama atau siswa yang cocok pada dua
kesempatan yang berbeda, tes tersebut harus menghasilkan hasil yang serupa.
2) Keandalan Penilai
Sebaliknya, keandalan berkaitan dengan proses penilaian. Faktor-faktor yang
dapat mempengaruhi reliabilitas dapat berupa kesalahan manusia, secara
subyektif, dan bias dalam proses penilaian.
Maka untuk meningkatkan derajat reliabilitas tes semacam ini, guru sebagai
penyelenggara hendaknya mempertimbangkan segala hal yang berkaitan dengan
penyelenggaraan tes tersebut.
Misalnya, jika kita ingin melakukan tes pendengaran, kita harus menyediakan
ruangan yang sangat nyaman untuk mendengarkan. Kebisingan dari luar kamar
tidak bisa masuk ke kamar. Sistem audio harus jelas untuk semua siswa. Bahkan
kita harus memperhatikan pencahayaan, kondisi meja dan kursi juga.
4) Uji Keandalan
Reliabilitas tes mengacu pada tes itu sendiri. Apakah tes cocok dengan batasan
waktu. Terkadang sifat tes itu sendiri dapat menyebabkan kesalahan pengukuran.
Hal tersebut dapat disebabkan oleh penulisan soal yang kurang baik yaitu; Item
yang ambigu atau memiliki lebih dari satu jawaban yang benar.
Jadi butir-butir tes harus jelas sehingga tidak akan berakhir dengan ambiguitas.
Kemudian tes yang terlalu banyak itemnya, artinya tes tersebut tidak boleh terlalu
panjang atau pendek.
3. Keabsahan
Validitas suatu tes adalah “sejauh mana kesimpulan yang dibuat dari hasil penilaian
sesuai, bermakna, dan berguna dalam kaitannya dengan tujuan penilaian” ( Gronlund ,
1998, hal. 226).
Brown mengusulkan lima cara untuk menetapkan validitas, yaitu:
1) Bukti Terkait Konten
Jika sebuah tes benar-benar mengambil sampel materi pelajaran tentang mana
kesimpulan harus ditarik, dan jika tes itu mengharuskan peserta tes untuk melakukan
perilaku yang diukur, itu dapat mengklaim bukti validitas terkait konten, yang sering
disebut sebagai validitas terkait konten (mis. , Hughes, 2003; Mousavi , 2009).
Jadi korelasi antara isi tes dan keterampilan bahasa, struktur, dll yang dimaksudkan
untuk diukur harus sangat jelas. Dan soal tes harus benar-benar mewakili tujuan
pembelajaran.
Validitas konstruk mengacu pada konsep atau teori yang melandasi penggunaan
kemampuan tertentu termasuk kemampuan berbahasa.
Validitas konstruk menunjukkan bahwa hasil tes benar-benar mewakili konstruk yang
sama dengan kemampuan siswa yang diukur ( Djiwandono , 1996:96).
4) Validitas Konsekuensial (dampak)
Validitas konsekuensial mencakup semua konsekuensi dari sebuah tes, termasuk
pertimbangan seperti akurasinya dalam mengukur kriteria yang dimaksud,
pengaruhnya terhadap persiapan peserta tes, dan konsekuensi sosial (yang diinginkan
dan tidak diinginkan) dari interpretasi dan penggunaan tes.
Bachman dan Palmer (2010), Cheng (2008b), Choi (2008), Davies (2003), dan Taylor
(2005) menggunakan istilah dampak untuk merujuk pada validitas konsekuensial,
mungkin lebih luas mencakup banyak konsekuensi penilaian, sebelum dan sesudah.
administrasi tes.
5) Validitas Wajah
“Validitas wajah mengacu pada sejauh mana sebuah tes terlihat benar, dan tampaknya
mengukur pengetahuan atau kemampuan yang diklaim untuk diukur, berdasarkan
penilaian subyektif dari peserta ujian yang mengikutinya, personel administrasi yang
memutuskan penggunaannya, dan lain-lain. pengamat yang tidak canggih secara
psikometrik” ( Mousavi , 2009, hal. 247).
Jadi suatu tes dikatakan memiliki validitas muka jika dilihat oleh penguji lain, guru,
moderator, dan siswa seolah-olah mengukur apa yang seharusnya diukur.
Dalam tes berbicara, misalnya validitas muka dapat ditunjukkan dengan kegiatan
berbicara sebagai kegiatan utama dalam tes tersebut. Tes harus fokus pada aktivitas
siswa dalam berbicara, bukan yang lain.
Perhatikan bahwa validitas muka dapat mempengaruhi siswa dalam melakukan tes
maka untuk mengatasi hal ini, penyusun tes harus mempertimbangkan hal-hal
berikut:
Siswa akan lebih percaya diri jika mereka menghadapi format yang diharapkan
dengan konstruksi yang baik dengan tugas-tugas yang familiar.
Siswa akan kurang cemas jika tes jelas dapat dilakukan dalam batas waktu yang
diberikan.
Siswa akan optimis jika soal-soalnya jelas dan tidak rumit (sederhana)
Siswa akan merasa mudah mengerjakan tes jika petunjuknya sangat jelas
Siswa akan kurang khawatir jika tugas terkait dengan tugas kuliah mereka
(validitas isi).
Siswa akan merasa nyaman jika tingkat kesulitan menghadirkan tantangan yang
masuk akal
4. Keaslian
Keaslian berkaitan dengan "kata yang sebenarnya".
Bachman dan Palmer (1996) mendefinisikan autentisitas sebagai “tingkat korespondensi
karakteristik tugas tes bahasa yang diberikan dengan fitur tugas bahasa target” dan
kemudian menyarankan agenda untuk mengidentifikasi tugas bahasa target tersebut dan
mengubahnya menjadi valid. item tes.
Otentisitas adalah derajat kesesuaian ciri-ciri tugas tes bahasa yang diberikan dengan ciri-
ciri tugas bahasa sasaran Brown (2004:28).
Jadi Guru hendaknya mengonstruksi tes dengan butir-butir tes yang berpeluang untuk
digunakan atau diterapkan dalam konteks kehidupan nyata sehari-hari.
4. Beberapa organisasi tematik untuk item disediakan, seperti melalui cerita atau episode.
5. Cuci kembali
washback mengacu pada efek tes pada instruksi dalam hal bagaimana siswa
mempersiapkan diri untuk ujian.
Washback Positif
Washback positif memiliki pengaruh menguntungkan pada pengajaran dan
pembelajaran. Artinya guru dan siswa memiliki sikap positif terhadap ujian atau
ulangan, dan bekerja dengan rela dan kolaboratif menuju tujuannya (Cheng &
Curtis, 2008:10).
Tes yang baik harus memiliki efek yang baik.
Tes yang memiliki washback negatif dianggap memiliki pengaruh negatif pada
pengajaran dan pembelajaran.