Anda di halaman 1dari 4

LAE WEEK 2

PRACTICALLY
In assessing the practicality of a test, considerations like staying within budget, time
constraints, clear administration directions, and efficient use of resources are vital. A test must
not exceed available time or material resources, and scoring should be feasible within set
constraints. A story illustrates practicality gone awry: a misplaced audio recording during a
placement test led to improvised dictation, complicating scoring and delaying results. Lack of
prior material check and misaligned scoring procedures highlight the importance of practical
considerations, especially time management, in testing.

Kepraktisan mengacu pada masalah logistik, membumi, dan administratif yang terlibat
dalam pembuatan, pemberian, dan penilaian instrumen penilaian. Hal ini mencakup "biaya,
jumlah waktu yang dibutuhkan untuk membuat dan mengelola, kemudahan dalam pemberian
skor, dan kemudahan dalam menafsirkan/melaporkan hasilnya" (Mousavi, 2009, hlm. 516). Tes
yang tidak memenuhi kriteria tersebut tidak praktis. Pertimbangkan atribut-atribut kepraktisan
berikut ini:
TES YANG PRAKTIS
 tetap berada dalam batas anggaran
 dapat diselesaikan oleh peserta tes dalam batasan waktu yang sesuai
 memiliki petunjuk yang jelas untuk administrasi
 menggunakan sumber daya manusia yang tersedia secara tepat
 tidak melebihi sumber daya material yang tersedia
 mempertimbangkan waktu dan usaha yang dibutuhkan untuk merancang dan menilai

RELIABLE
Tes yang dapat diandalkan adalah konsisten dan dapat dipercaya. Jika Anda memberikan
tes yang sama kepada siswa yang sama atau siswa yang sepadan pada dua kesempatan yang
berbeda, tes tersebut seharusnya menghasilkan hasil yang serupa. Ada beberapa faktor yang
dapat menyebabkan ketidakandalan tes, seperti faktor siswa, penilaian, administrasi tes, dan tes
itu sendiri.

1. Ketidakandalan Terkait Siswa: Faktor-faktor seperti penyakit sementara, kelelahan,


kecemasan, dan faktor fisik atau psikologis lainnya dapat membuat hasil tes berbeda dari "nilai"
yang sebenarnya. Kekhawatiran ini dapat diatasi dengan memberikan tips untuk mengurangi
kecemasan siswa.

2. Ketidakandalan Penilai:Kesalahan manusia, subjektivitas, dan bias dapat mempengaruhi


proses penilaian. Penting untuk memastikan keandalan antar-penilai dan keandalan dalam
penilaian internal.
3. Ketidakandalan Administrasi Tes:Ketidakandalan dapat disebabkan oleh kondisi administrasi
tes, seperti gangguan suara luar saat penggunaan rekaman audio, variasi dalam penyalinan,
pencahayaan ruangan, dan kondisi meja dan kursi.
4. Ketidakandalan Tes:Kadang-kadang, sifat tes itu sendiri dapat menyebabkan kesalahan
pengukuran. Tes dengan item pilihan ganda harus dirancang dengan hati-hati untuk memastikan
keandalan.

Ketidakandalan tes dapat disebabkan oleh banyak faktor, termasuk bias penilai, item tes yang
buruk, dan tes yang terlalu panjang atau terbatas oleh waktu. Oleh karena itu, penting untuk
memperhatikan semua aspek ini dalam mengembangkan dan mengadministrasikan tes.

A reliable test is consistent and dependable. When the same test is given to the same
student or matched students on different occasions, it should produce similar results. There are
several factors contributing to test unreliability, such as student-related factors, scoring, test
administration, and the test itself.

1. Student-Related Unreliability: Factors like temporary illness, fatigue, anxiety, and other
physical or psychological elements may cause observed scores to deviate from a student's true
score. Strategies to reduce student-related unreliability, such as providing tips to minimize
anxiety, can be beneficial.

2. Scorer Reliability: Human error, subjectivity, and bias can affect the scoring process. It's
crucial to ensure consistency among scorers and within internal scoring procedures.

3. Test Administration Unreliability: Unreliability may arise from the conditions under which the
test is administered, such as external noise disturbances affecting audio recordings or variations
in room lighting and furniture conditions.

4. Test Reliability:Some tests inherently contribute to measurement errors. Tests with multiple-
choice items need careful design to ensure reliability, including balanced difficulty levels and
well-designed distractors.

Unreliability in tests can stem from various factors, including scorer bias, poorly constructed test
items, and tests that are either too lengthy or constrained by time limits. Therefore, it's
essential to consider and address these factors when developing and administering tests.

VALIDATY

Validitas, aspek paling rumit dari efektivitas sebuah tes, merujuk pada ketepatan,
kebermanfaatan, dan kegunaan inferensi yang ditarik dari hasil penilaian. Ini melibatkan
penilaian evaluatif terpadu tentang sejauh mana bukti empiris dan dasar teoretis mendukung
kecukupan dan kesesuaian inferensi dan tindakan berdasarkan skor tes. Validitas mencakup
berbagai atribut:
1. Mengukur apa yang diusulkan untuk diukur: Tes yang valid secara akurat mengukur konstruk
yang dimaksud dan tidak menilai variabel yang tidak relevan.
2. Bergantung pada bukti empiris:Ini melibatkan kinerja yang secara langsung mewakili kriteria
tes dan memberikan informasi yang bermakna tentang kemampuan peserta tes.
3. Didukung oleh dasar teoritis:Tes yang valid didukung oleh argumen atau dasar teoretis.

Membangun validitas tidaklah mudah dan tidak memiliki ukuran final yang mutlak. Sebaliknya,
itu bergantung pada beberapa jenis bukti, termasuk kesesuaian dengan tujuan kursus, korelasi
dengan pengukuran independen, pertimbangan konsekuensi di luar pengukuran kriteria, dan
persepsi validitas peserta tes. Validitas adalah masalah derajat daripada penentuan yang
sederhana ya atau tidak.

Validity, the most intricate aspect of a test's effectiveness, refers to the appropriateness,
meaningfulness, and usefulness of the inferences drawn from assessment results. It involves an
integrated evaluative judgment of whether empirical evidence and theoretical rationales
adequately support the inferences and actions based on test scores. Validity encompasses
various attributes:

1. Measuring what it proposes to measure: A valid test accurately measures the intended
construct and does not assess irrelevant variables.
2. Reliance on empirical evidence: It involves performance that directly samples the test's
criterion and offers meaningful information about the test-taker's ability.
3. Supported by theoretical rationale: A valid test is backed by a theoretical argument or
rationale.

Establishing validity is not straightforward and doesn't have a final, absolute measure. Instead, it
relies on multiple types of evidence, including alignment with course objectives, correlation
with independent measures, consideration of consequences beyond criteria measurement, and
test-taker perception of validity. Validity is a matter of degree rather than a simple yes or no
determination.

WASHBACK

Washback, also known as the effect of testing on teaching and learning, is an essential
aspect of consequential validity. It can be either beneficial or harmful, influencing both what
and how teachers teach and what and how learners learn. Factors contributing to beneficial
washback include providing feedback that enhances language development, offering learners
adequate preparation opportunities, and ensuring tests are more formative than summative.
Washback can have positive manifestations in classroom-based assessment, such as improving
learning through feedback and preparation for assessments. It also promotes intrinsic
motivation, autonomy, and self-confidence in language acquisition.

Washback, juga dikenal sebagai efek pengujian terhadap pengajaran dan pembelajaran,
adalah aspek penting dari validitas konsekuensial. Ini dapat berdampak baik atau buruk,
mempengaruhi apa dan bagaimana guru mengajar serta apa dan bagaimana siswa belajar.
Faktor yang berkontribusi pada washback yang menguntungkan termasuk memberikan umpan
balik yang meningkatkan perkembangan bahasa, menawarkan kesempatan persiapan yang
memadai bagi siswa, dan memastikan tes lebih bersifat formatif daripada sumatif. Washback
dapat memiliki manifestasi positif dalam penilaian berbasis kelas, seperti meningkatkan
pembelajaran melalui umpan balik dan persiapan untuk penilaian. Ini juga mempromosikan
motivasi intrinsik, otonomi, dan kepercayaan diri dalam pemerolehan bahasa.

Anda mungkin juga menyukai