KERANGKA TEORI
Validitas
a. Definisi Validitas
Tes valid jika menguji apa yang seharusnya diuji. Dengan kata lain, tes dikatakan valid jika
mengukur secara akurat apa yang ingin diukur. Karena itu, tidak valid, misalnya, untuk menguji
kemampuan menulis dengan pertanyaan esai yang membutuhkan pengetahuan spesialis tentang
sejarah atau biologi - kecuali diketahui bahwa semua siswa berbagi pengetahuan ini sebelum
mereka melakukan tes. Validitas adalah konsep yang menunjuk kondisi ideal - untuk dikejar,
tetapi tidak untuk dicapai. Seperti yang disiratkan oleh akar kata-kata itu, validitas berkaitan
dengan kebenaran, kekuatan, dan nilai. Sebaliknya, validitas itu seperti integritas, karakter yang
harus dinilai.
b. Jenis Validitas
1. Konsep Validitas
Konsep validitas mengacu pada pertanyaan apakah teori yang didukung oleh temuan
memberikan eksperimen terbaik yang tersedia dari hasil. Konsep validitas yang difokuskan pada
jenis tes yang digunakan untuk mengukur kemampuan. Sebuah tes, bagian dari tes, atau teknik
pengujian dikatakan memiliki konsep validitas jika dapat ditunjukkan bahwa tes tersebut hanya
mengukur kemampuan yang seharusnya diukur. Kata "membangun" mengacu pada kemampuan
yang mendasari (atau sifat) yang dihipotesiskan dalam teori kemampuan bahasa. Konsep
Validitas adalah kegiatan penelitian, sarana untuk menguji teori dan dikonfirmasi, dimodifikasi.
2. Validitas Konten
Suatu tes dikatakan memiliki validitas konten jika isinya merupakan sampel
representatif dari keterampilan bahasa, struktur, dll. Jelas bahwa tes tata bahasa, misalnya, harus
terdiri dari item yang menguji pengetahuan atau kontrol tata bahasa. Tapi ini sendiri tidak
menjamin validitas konten. Tes akan memiliki validitas konten hanya jika itu termasuk sampel
yang tepat dari struktur yang relevan. Pentingnya validitas konten, sebagai berikut:
a. Semakin baik validitas konten tes, semakin besar kemungkinan itu menjadi ukuran yang
akurat dari apa yang seharusnya diukur.
b. Tes semacam itu kemungkinan memiliki akibat yang buruk. Area yang tidak diuji cenderung
menjadi area yang diabaikan dalam proses belajar mengajar.
3. Menghadapi Validitas
Sebuah tes dikatakan mempunyai cara menghadapi validitas jika terlihat seolah-olah
mengukur apa yang seharusnya diukur. Misalnya, tes yang berpura-pura mengukur kemampuan
pengucapan tetapi yang tidak mengharuskan kandidat untuk berbicara mungkin dianggap kurang
menghadapi validitas. Menghadapi Validitas bukanlah konsep ilmiah, namun sangat penting. Tes
yang tidak memiliki rupa validitas mungkin tidak dapat diterima oleh kandidat, guru, otoritas
pendidikan atau pengusaha.
4. Kriteria-Terkait Validitas
Pendekatan lain untuk menguji validitas adalah untuk melihat sejauh mana hasil tes
dengan yang disediakan oleh beberapa penilaian independen dan sangat tergantung pada
kemampuan peserta. Penilaian independen ini merupakan ukuran kriteria yang diuji dalam tes
ini. Pada dasarnya ada dua jenis validitas terkait kriteria, yaitu validitas konkuren dan validitas
prediktif.
a. Validitas Konkuren
Validitas konkuren atau serentak ditetapkan ketika tes dan kriteria diberikan pada waktu yang
hampir bersamaan.
b. Validitas Prediktif
Validitas prediktif menyangkut sejauh mana tes dapat memprediksi kinerja peserta di masa
depan.
2. Reliabilitas
Reliabilitas sering didefinisikan sebagai konsistensi suatu pengukuran. Tes yang baik
harus memberikan hasil yang konsisten. Misalnya, jika kelompok yang sama dari siswa
mengambil tes yang sama dua kali dalam dua hari - tanpa merefleksikan tes pertama sebelum
mereka tes lagi - mereka harus mendapatkan hasil yang sama pada setiap kesempatan. Jika
mereka mengikuti tes serupa lainnya, hasilnya harus konsisten. Jika dua kelompok yang sama-
sama mengikuti tes, rentang penandaannya akan sama. Reliabilitas menunjukkan bahwa suatu
instrumen dapat dipercaya digunakan sebagai alat teknik pengumpulan data ketika instrumen
tersebut cukup baik.
Dalam praktiknya, "reliabilitas" ditingkatkan dengan membuat instruksi tes benar-benar
jelas, membatasi ruang lingkup dalam jawaban, dan memastikan bahwa kondisi pengujian tetap
konstan.
Skor pada tugas tes dengan Reliabilitas Skor pada tugas tes dengan
karakteristik A karakteristik
3. Kegunaan (kepraktisan)
Kegunaan terutama berkaitan dengan cara-cara di mana tes akan di implementasikan,
dan sebagian besar apakah akan dikembangkan dan digunakan. Meskipun pertimbangan
kegunaan secara logis mengikuti pertimbangan kualitas lain. Dengan demikian, menentukan
kegunaan tes yang diberikan melibatkan pertimbangan sumber daya yang akan diperlukan untuk
mengembangkan tes operasional yang memiliki keseimbangan kualitas, alokasi dan pengelolaan
sumber daya yang tersedia.
4. Dampak
Kualitas tes lainnya adalah dampaknya terhadap masyarakat dan sistem pendidikan pada
individu dalam sistem tersebut. Dampak dari penggunaan tes pada tingkat ke-dua , mereka
adalah tingkat mikro, dalam hal individu yang dipengaruhi oleh penggunaan tes tertentu, dan
tingkat makro, dalam hal sistem pendidikan atau masyarakat.
a. Washback
Dampak dari aspek yang telah menjadi minat khusus bagi para peneliti dan praktisi pengujian
bahasa adalah apa yang disebut sebagai ‘washback” dan sebagian besar diskusi tentang ini
berfokus pada proses (pembelajaran dan instruksi). Washback sebagai dampak langsung
pengujian pada individu secara luas.
Nilai dan tujuan juga menurun seiring waktu, sehingga masalah-masalah seperti
kerahasiaan dan akses ke informasi, privasi, yang sekarang dianggap oleh banyak orang sebagai
hak dasar peserta tes, pada satu waktu bahkan bukan masalah pertimbangan. Contoh-contoh lain,
dampak potensial pada praktik pengajaran bahasa di negara tertentu menggunakan jenis tugas tes
tertentu, seperti item pilihan ganda atau jenis wawancara lisan tertentu, dalam banyak digunakan
tes berisiko tinggi pada tingkat nasional.
Dampak dari penggunaan tes perlu dipertimbangkan dalam nilai-nilai dan tujuan
masyarakat dan program pendidikan di mana itu terjadi, dan sesuai dengan konsekuensi potensial
dari penggunaan tersebut.
5. Keaslian
Keaslian adalah tingkat korespondensi dari karakteristik tugas tes bahasa. Keaslian
adalah kualitas pengujian yang penting karena ini menghubungkan tugas pengujian dengan
domain generalisasi yang diinginkan agar interpretasi skor bisa digeneralisasikan. Alasan lain
untuk menganggap keaslian menjadi penting adalah karena efek potensial pada persepsi peserta
tes dan pada kinerja mereka.
keaslian
Karakteristik tugas Karakteristik tugas
TLU tes
6. Karakteristik pengaturan
Karakteristik ini meliputi:
a. Pengaturan fisik, itu termasuk lokasi, tingkat kebisingan, suhu, dan pencahayaan.
b. Pengaturan peserta, ini adalah orang-orang yang terlibat dalam tugas.
c. Waktu tugas, adalah waktu di mana tes berlangsung.
8. Karakteristik input
a. Format
b. Bahasa input
c. Karakteristik topikal
BAB III
KESIMPULAN
Ada lima kualitas pengujian: validitas, reliabilitas, keaslian, dampak, dan praktis.
Kelima kualitas uji ini semuanya berkontribusi pada manfaat, sehingga tidak bisa dievaluasikan
secara independen satu sama lain. Selain itu, kepentingan relatif dari kualitas yang berbeda ini
akan bervariasi dari satu situasi pengujian ke yang lain. Sehingga, kegunaan pengujian hanya
dapat dievaluasi untuk situasi pengujian tertentu.