Principles of Language Assessment Presentation

Prinsip Penilaian Bahasa
Ada 5 prinsip penilaian bahasa; kepraktisan, keandalan, validitas, keaslian, washback .
1. Kepraktisan
Kepraktisan mengacu pada masalah administrasi logistik, membumi, yang terlibat dalam
pembuatan, pemberian, dan penilaian instrumen penilaian. Ini termasuk “ biaya , jumlah
waktu yang diperlukan untuk membangun dan mengelola , kemudahan penilaian , dan
kemudahan menafsirkan/melaporkan hasil” ( Mousavi , 2009, hal. 516).
 Biaya
- Tes seharusnya tidak terlalu mahal untuk dilakukan.
- Biaya untuk yang terakhir harus tetap sesuai anggaran.
- Hindari melakukan tes yang membutuhkan anggaran berlebihan.
 Waktu
- Tes harus tetap dalam batasan waktu yang tepat.
- Tes tidak boleh terlalu panjang atau terlalu pendek.
 Administrasi
- Tes tidak boleh terlalu rumit atau rumit untuk dilakukan.
- Tes harus cukup sederhana untuk mengelola.
 Skor
- Proses penilaian harus sesuai dengan alokasi waktu.
- Sebuah tes harus disertai dengan rubrik penskoran, kunci jawaban, dan
sebagainya untuk memudahkan dalam penskoran.
2. Keandalan
Tes yang andal adalah konsisten dan dapat diandalkan. Itu berarti bahwa Jika Anda
memberikan tes yang sama kepada siswa yang sama atau siswa yang cocok pada dua
kesempatan yang berbeda, tes tersebut harus menghasilkan hasil yang serupa.
Keandalan terbagi menjadi 4 macam, yaitu:

1) Keandalan Terkait Siswa
Keandalan semacam ini mengacu pada penyakit sementara, kelelahan, "hari yang
buruk", kecemasan, dan faktor fisik atau psikologis lainnya, yang dapat membuat
skor yang diamati menyimpang dari skor "sebenarnya" seseorang.
2) Keandalan Penilai
Sebaliknya, keandalan berkaitan dengan proses penilaian. Faktor-faktor yang
dapat mempengaruhi reliabilitas dapat berupa kesalahan manusia, secara
subyektif, dan bias dalam proses penilaian.
Keandalan semacam ini terbagi dalam dua kategori, yaitu:

 Keandalan antar penilai
Itu terjadi ketika dua atau lebih pemberi skor menghasilkan skor yang konsisten
dari tes yang sama, kemungkinan kurangnya perhatian terhadap kriteria
penilaian, kurangnya pengalaman, kurangnya perhatian, atau bahkan bias.
 Keandalan intra-penilai
Ini adalah kejadian umum untuk guru kelas karena kriteria penilaian yang
tidak jelas, kelelahan, bias terhadap siswa “baik” dan “buruk” tertentu,
atau kecerobohan sederhana.
3) Uji Keandalan Administrasi

Ketidakandalan juga dapat dihasilkan dari kondisi di mana tes diberikan.
Hal ini dapat disebabkan oleh faktor administrasi.
mis . berisik dari luar, variasi fotokopi, jumlah cahaya di berbagai bagian ruangan,
variasi suhu, bahkan kondisi meja dan kursi.
Maka untuk meningkatkan derajat reliabilitas tes semacam ini, guru sebagai
penyelenggara hendaknya mempertimbangkan segala hal yang berkaitan dengan
penyelenggaraan tes tersebut.
Misalnya, jika kita ingin melakukan tes pendengaran, kita harus menyediakan
ruangan yang sangat nyaman untuk mendengarkan. Kebisingan dari luar kamar
tidak bisa masuk ke kamar. Sistem audio harus jelas untuk semua siswa. Bahkan
kita harus memperhatikan pencahayaan, kondisi meja dan kursi juga.
4) Uji Keandalan
Reliabilitas tes mengacu pada tes itu sendiri. Apakah tes cocok dengan batasan
waktu. Terkadang sifat tes itu sendiri dapat menyebabkan kesalahan pengukuran.
Hal tersebut dapat disebabkan oleh penulisan soal yang kurang baik yaitu; Item
yang ambigu atau memiliki lebih dari satu jawaban yang benar.
Jadi butir-butir tes harus jelas sehingga tidak akan berakhir dengan ambiguitas.
Kemudian tes yang terlalu banyak itemnya, artinya tes tersebut tidak boleh terlalu
panjang atau pendek.
3. Keabsahan
Validitas suatu tes adalah “sejauh mana kesimpulan yang dibuat dari hasil penilaian
sesuai, bermakna, dan berguna dalam kaitannya dengan tujuan penilaian” ( Gronlund ,
1998, hal. 226).
Brown mengusulkan lima cara untuk menetapkan validitas, yaitu:
1) Bukti Terkait Konten
Jika sebuah tes benar-benar mengambil sampel materi pelajaran tentang mana
kesimpulan harus ditarik, dan jika tes itu mengharuskan peserta tes untuk melakukan
perilaku yang diukur, itu dapat mengklaim bukti validitas terkait konten, yang sering
disebut sebagai validitas terkait konten (mis. , Hughes, 2003; Mousavi , 2009).
Jadi korelasi antara isi tes dan keterampilan bahasa, struktur, dll yang dimaksudkan
untuk diukur harus sangat jelas. Dan soal tes harus benar-benar mewakili tujuan
pembelajaran.
2) Bukti Terkait Kriteria

Dalam kasus penilaian kelas buatan guru, bukti terkait kriteria paling baik
ditunjukkan melalui perbandingan hasil penilaian dengan hasil beberapa ukuran lain
dari kriteria yang sama.
Validitas semacam ini menekankan pada hubungan antara skor tes dan hasilnya. Dan
skor tes harus benar-benar mewakili kriteria yang hendak diukur dalam tes tersebut.
Bukti terkait kriteria terbagi dalam dua kategori, yaitu:
 Validitas bersamaan
Suatu tes dikatakan memiliki validitas konkuren jika hasilnya didukung oleh
kinerja konkuren lainnya di luar penilaian itu sendiri (Brown, 2004:24). Misalnya,
validitas skor tinggi pada ujian akhir kursus bahasa asing akan diverifikasi oleh
kemahiran bahasa yang sebenarnya.
 Validitas prediktif
Validitas prediktif suatu penilaian menjadi penting dalam kasus tes penempatan,
rangkaian penilaian penerimaan, dan tes prestasi yang dirancang untuk
menentukan kesiapan siswa untuk “melanjutkan” ke unit lain. Kriteria penilaian
dalam kasus seperti itu bukan untuk mengukur kemampuan bersamaan tetapi
untuk menilai (dan memprediksi) kemungkinan keberhasilan peserta tes di masa
depan. Misalnya, tes TOEFL atau IELTS dimaksudkan untuk mengetahui
seberapa baik kemampuan bahasa Inggris seseorang di masa depan.
3) Bukti Terkait Konstruksi

Konstruk adalah teori, hipotesis, atau model apa pun yang mencoba menjelaskan
fenomena yang diamati di alam semesta persepsi kita. Konstruksi mungkin atau
mungkin tidak diukur secara langsung atau empiris, verifikasi mereka sering
membutuhkan data inferensial.
Validitas konstruk mengacu pada konsep atau teori yang melandasi penggunaan
kemampuan tertentu termasuk kemampuan berbahasa.
Validitas konstruk menunjukkan bahwa hasil tes benar-benar mewakili konstruk yang
sama dengan kemampuan siswa yang diukur ( Djiwandono , 1996:96).
4) Validitas Konsekuensial (dampak)
Validitas konsekuensial mencakup semua konsekuensi dari sebuah tes, termasuk
pertimbangan seperti akurasinya dalam mengukur kriteria yang dimaksud,
pengaruhnya terhadap persiapan peserta tes, dan konsekuensi sosial (yang diinginkan
dan tidak diinginkan) dari interpretasi dan penggunaan tes.
Bachman dan Palmer (2010), Cheng (2008b), Choi (2008), Davies (2003), dan Taylor
(2005) menggunakan istilah dampak untuk merujuk pada validitas konsekuensial,
mungkin lebih luas mencakup banyak konsekuensi penilaian, sebelum dan sesudah.
administrasi tes.
Validitas konsekuensial mengacu pada konsekuensi sosial dari penggunaan tes

tertentu untuk tujuan tertentu.
Penggunaan tes dikatakan memiliki validitas konsekuensial sejauh masyarakat
mendapat manfaat dari penggunaan tes tersebut.
5) Validitas Wajah
“Validitas wajah mengacu pada sejauh mana sebuah tes terlihat benar, dan tampaknya
mengukur pengetahuan atau kemampuan yang diklaim untuk diukur, berdasarkan
penilaian subyektif dari peserta ujian yang mengikutinya, personel administrasi yang
memutuskan penggunaannya, dan lain-lain. pengamat yang tidak canggih secara
psikometrik” ( Mousavi , 2009, hal. 247).
Jadi suatu tes dikatakan memiliki validitas muka jika dilihat oleh penguji lain, guru,
moderator, dan siswa seolah-olah mengukur apa yang seharusnya diukur.
Dalam tes berbicara, misalnya validitas muka dapat ditunjukkan dengan kegiatan
berbicara sebagai kegiatan utama dalam tes tersebut. Tes harus fokus pada aktivitas
siswa dalam berbicara, bukan yang lain.
Perhatikan bahwa validitas muka dapat mempengaruhi siswa dalam melakukan tes
maka untuk mengatasi hal ini, penyusun tes harus mempertimbangkan hal-hal
berikut:
 Siswa akan lebih percaya diri jika mereka menghadapi format yang diharapkan
dengan konstruksi yang baik dengan tugas-tugas yang familiar.
 Siswa akan kurang cemas jika tes jelas dapat dilakukan dalam batas waktu yang
diberikan.
 Siswa akan optimis jika soal-soalnya jelas dan tidak rumit (sederhana)
 Siswa akan merasa mudah mengerjakan tes jika petunjuknya sangat jelas
 Siswa akan kurang khawatir jika tugas terkait dengan tugas kuliah mereka
(validitas isi).
 Siswa akan merasa nyaman jika tingkat kesulitan menghadirkan tantangan yang
masuk akal
4. Keaslian
Keaslian berkaitan dengan "kata yang sebenarnya".
Bachman dan Palmer (1996) mendefinisikan autentisitas sebagai “tingkat korespondensi
karakteristik tugas tes bahasa yang diberikan dengan fitur tugas bahasa target” dan
kemudian menyarankan agenda untuk mengidentifikasi tugas bahasa target tersebut dan
mengubahnya menjadi valid. item tes.
Otentisitas adalah derajat kesesuaian ciri-ciri tugas tes bahasa yang diberikan dengan ciri-
ciri tugas bahasa sasaran Brown (2004:28).
Jadi Guru hendaknya mengonstruksi tes dengan butir-butir tes yang berpeluang untuk
digunakan atau diterapkan dalam konteks kehidupan nyata sehari-hari.
Brown (2004:28) juga mengusulkan pertimbangan-pertimbangan yang mungkin berguna

untuk menghadirkan keaslian dalam sebuah tes. Mereka:
1. Bahasa dalam tes dibuat sealami mungkin.
2. Item dikontekstualisasikan daripada diisolasi.
3. Topik bermakna (relevan, menarik) bagi peserta didik.
4. Beberapa organisasi tematik untuk item disediakan, seperti melalui cerita atau episode.
5. Tugas mewakili, atau mendekati, tugas dunia nyata.
5. Cuci kembali
washback mengacu pada efek tes pada instruksi dalam hal bagaimana siswa
mempersiapkan diri untuk ujian.
Pengaruh itu sendiri bisa positif atau negatif:
 Washback Positif
Washback positif memiliki pengaruh menguntungkan pada pengajaran dan
pembelajaran. Artinya guru dan siswa memiliki sikap positif terhadap ujian atau
ulangan, dan bekerja dengan rela dan kolaboratif menuju tujuannya (Cheng &
Curtis, 2008:10).
Tes yang baik harus memiliki efek yang baik.
Misalnya, UN (Ujian Nasional) akan menuntut siswa untuk lebih memperhatikan

pelajaran, mempersiapkan segala sesuatu yang berkaitan dengan UN dengan lebih
matang, mempelajari pelajaran dengan hati, dan sebagainya. UN juga akan
menuntut guru untuk mengajar pelajaran lebih keras dari sebelumnya,
memberikan pelajaran tambahan kepada siswanya, dan memberikan tips dan trik
untuk belajar secara efektif dan efisien. Sejauh kegiatan tersebut meningkatkan
kegiatan dan motivasi tersebut, UN dapat dikatakan memiliki backwash yang
positif.
 Washback Negatif
Washback negatif tidak memberikan pengaruh yang menguntungkan pada
pengajaran dan pembelajaran (Cheng dan Curtis, 2008:9).
Tes yang memiliki washback negatif dianggap memiliki pengaruh negatif pada
pengajaran dan pembelajaran.
Misalnya, jika UN mempengaruhi guru untuk lebih fokus pada pelajaran UN

kemudian cenderung mengabaikan pelajaran lain yang tidak berkontribusi
langsung terhadap kelulusan ujian, maka UN dapat dianggap memiliki washback
negatif . Apalagi jika UN mengancam siswa dalam menghadapi ujian, siswa akan
merasakan banyak kecemasan menghadapi ujian. Mereka harus lulus UN kalau
tidak mereka akan gagal. Konsekuensinya tentu akan mempengaruhi siswa dalam
menghadapi UN. Mereka akan jatuh bahwa mereka berada di bawah tekanan.
Sehingga akan mempengaruhi prestasi siswa. Maka dapat disimpulkan bahwa jika
UN memiliki efek seperti ini, ia memiliki washback negatif .

Principles of Language Assessment Presentation

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Principles of Language Assessment Presentation

Diunggah oleh

Hak Cipta:

Format Tersedia

Prinsip Penilaian Bahasa

Ada 5 prinsip penilaian bahasa; kepraktisan, keandalan, validitas, keaslian, washback .

Keandalan terbagi menjadi 4 macam, yaitu:

Keandalan semacam ini terbagi dalam dua kategori, yaitu:

3) Uji Keandalan Administrasi

2) Bukti Terkait Kriteria

3) Bukti Terkait Konstruksi

Validitas konsekuensial mengacu pada konsekuensi sosial dari penggunaan tes

Brown (2004:28) juga mengusulkan pertimbangan-pertimbangan yang mungkin berguna

1. Bahasa dalam tes dibuat sealami mungkin.

2. Item dikontekstualisasikan daripada diisolasi.

3. Topik bermakna (relevan, menarik) bagi peserta didik.

5. Tugas mewakili, atau mendekati, tugas dunia nyata.

Pengaruh itu sendiri bisa positif atau negatif:

Misalnya, UN (Ujian Nasional) akan menuntut siswa untuk lebih memperhatikan

Misalnya, jika UN mempengaruhi guru untuk lebih fokus pada pelajaran UN

Anda mungkin juga menyukai