Anda di halaman 1dari 9

BAB II

KERANGKA TEORI

A. Tes Kualitas Bahasa


Pendekatan tradisional untuk menggambarkan kualitas telah membahas ini sebagai karakteristik
yang kurang lebih independen, menekankan perlunya memaksimalkan semuanya. Penguji bahasa
telah diberitahu bahwa kualitas reliabilitas dan validitas pada dasarnya bertentangan, atau bahwa
tidak mungkin untuk merancang tugas-tugas tes yang otentik dan pada saat yang sama dapat
diandalkan. Posisi yang jauh lebih masuk akal adalah bahwa meskipun ada ketegangan di antara
kualitas tes yang berbeda, ini tidak perlu mengarah pada total abondement. Pandangan kami
bahwa alih-alih menekankan ketegangan di antara kualitas yang berbeda, pengembangan
pengujian perlu mengenali saling melengkapi mereka. Kegunaan rumus dapat dinyatakan
sebagai gambar di bawah ini.
Kegunaan = Keandalan + Bangun Validitas + Keaslian + Interaktivitas + Dampak + Kepraktisan.
Kegunaan tes dapat digambarkan sebagai fungsi dari beberapa kualitas yang berbeda, yang
semuanya berkontribusi dalam cara yang unik tetapi saling terkait dengan kegunaan keseluruhan
dari tes yang diberikan. Prinsip-prinsip desain pengujian dan pengembangannya, adalah sebagai
berikut:
Prinsip 1: Kegunaan keseluruhan dari tes yang harus dimaksimalkan, bukan kualitas individu
yang mempengaruhi kegunaan.
Prinsip 2: Kualitas uji individual tidak dapat dievaluasi secara independen, tetapi harus
dievaluasi dalam hal efek gabungannya terhadap keseluruhan manfaat tes.
Prinsip 3: Uji kegunaan dan keseimbangan yang tepat di antara kualitas yang berbeda tidak dapat
ditentukan secara umum, tetapi harus ditentukan untuk setiap situasi pengujian tertentu.

Validitas
a. Definisi Validitas
Tes valid jika menguji apa yang seharusnya diuji. Dengan kata lain, tes dikatakan valid jika
mengukur secara akurat apa yang ingin diukur. Karena itu, tidak valid, misalnya, untuk menguji
kemampuan menulis dengan pertanyaan esai yang membutuhkan pengetahuan spesialis tentang
sejarah atau biologi - kecuali diketahui bahwa semua siswa berbagi pengetahuan ini sebelum
mereka melakukan tes. Validitas adalah konsep yang menunjuk kondisi ideal - untuk dikejar,
tetapi tidak untuk dicapai. Seperti yang disiratkan oleh akar kata-kata itu, validitas berkaitan
dengan kebenaran, kekuatan, dan nilai. Sebaliknya, validitas itu seperti integritas, karakter yang
harus dinilai.

b. Jenis Validitas

1. Konsep Validitas
Konsep validitas mengacu pada pertanyaan apakah teori yang didukung oleh temuan
memberikan eksperimen terbaik yang tersedia dari hasil. Konsep validitas yang difokuskan pada
jenis tes yang digunakan untuk mengukur kemampuan. Sebuah tes, bagian dari tes, atau teknik
pengujian dikatakan memiliki konsep validitas jika dapat ditunjukkan bahwa tes tersebut hanya
mengukur kemampuan yang seharusnya diukur. Kata "membangun" mengacu pada kemampuan
yang mendasari (atau sifat) yang dihipotesiskan dalam teori kemampuan bahasa. Konsep
Validitas adalah kegiatan penelitian, sarana untuk menguji teori dan dikonfirmasi, dimodifikasi.

2. Validitas Konten
Suatu tes dikatakan memiliki validitas konten jika isinya merupakan sampel
representatif dari keterampilan bahasa, struktur, dll. Jelas bahwa tes tata bahasa, misalnya, harus
terdiri dari item yang menguji pengetahuan atau kontrol tata bahasa. Tapi ini sendiri tidak
menjamin validitas konten. Tes akan memiliki validitas konten hanya jika itu termasuk sampel
yang tepat dari struktur yang relevan. Pentingnya validitas konten, sebagai berikut:
a. Semakin baik validitas konten tes, semakin besar kemungkinan itu menjadi ukuran yang
akurat dari apa yang seharusnya diukur.
b. Tes semacam itu kemungkinan memiliki akibat yang buruk. Area yang tidak diuji cenderung
menjadi area yang diabaikan dalam proses belajar mengajar.

3. Menghadapi Validitas
Sebuah tes dikatakan mempunyai cara menghadapi validitas jika terlihat seolah-olah
mengukur apa yang seharusnya diukur. Misalnya, tes yang berpura-pura mengukur kemampuan
pengucapan tetapi yang tidak mengharuskan kandidat untuk berbicara mungkin dianggap kurang
menghadapi validitas. Menghadapi Validitas bukanlah konsep ilmiah, namun sangat penting. Tes
yang tidak memiliki rupa validitas mungkin tidak dapat diterima oleh kandidat, guru, otoritas
pendidikan atau pengusaha.

4. Kriteria-Terkait Validitas
Pendekatan lain untuk menguji validitas adalah untuk melihat sejauh mana hasil tes
dengan yang disediakan oleh beberapa penilaian independen dan sangat tergantung pada
kemampuan peserta. Penilaian independen ini merupakan ukuran kriteria yang diuji dalam tes
ini. Pada dasarnya ada dua jenis validitas terkait kriteria, yaitu validitas konkuren dan validitas
prediktif.
a. Validitas Konkuren
Validitas konkuren atau serentak ditetapkan ketika tes dan kriteria diberikan pada waktu yang
hampir bersamaan.
b. Validitas Prediktif
Validitas prediktif menyangkut sejauh mana tes dapat memprediksi kinerja peserta di masa
depan.

2. Reliabilitas
Reliabilitas sering didefinisikan sebagai konsistensi suatu pengukuran. Tes yang baik
harus memberikan hasil yang konsisten. Misalnya, jika kelompok yang sama dari siswa
mengambil tes yang sama dua kali dalam dua hari - tanpa merefleksikan tes pertama sebelum
mereka tes lagi - mereka harus mendapatkan hasil yang sama pada setiap kesempatan. Jika
mereka mengikuti tes serupa lainnya, hasilnya harus konsisten. Jika dua kelompok yang sama-
sama mengikuti tes, rentang penandaannya akan sama. Reliabilitas menunjukkan bahwa suatu
instrumen dapat dipercaya digunakan sebagai alat teknik pengumpulan data ketika instrumen
tersebut cukup baik.
Dalam praktiknya, "reliabilitas" ditingkatkan dengan membuat instruksi tes benar-benar
jelas, membatasi ruang lingkup dalam jawaban, dan memastikan bahwa kondisi pengujian tetap
konstan.
Skor pada tugas tes dengan Reliabilitas Skor pada tugas tes dengan
karakteristik A karakteristik

3. Kegunaan (kepraktisan)
Kegunaan terutama berkaitan dengan cara-cara di mana tes akan di implementasikan,
dan sebagian besar apakah akan dikembangkan dan digunakan. Meskipun pertimbangan
kegunaan secara logis mengikuti pertimbangan kualitas lain. Dengan demikian, menentukan
kegunaan tes yang diberikan melibatkan pertimbangan sumber daya yang akan diperlukan untuk
mengembangkan tes operasional yang memiliki keseimbangan kualitas, alokasi dan pengelolaan
sumber daya yang tersedia.

Kegunaan = Sumber Daya Yang Tersedia / Sumber daya yang diperlukan.


Jika kegunaan ≥ 1, pengembangan dan penggunaan tes praktis
Jika kegunaan ≤ 1, pengembangan dan penggunaan tes tidak praktis
Kepraktisan adalah masalah sejauh mana tuntutan spesifikasi pengujian tertentu dapat dipenuhi
dalam batas-batas sumber daya yang ada. Kepraktisan berguna karena memungkinkan kita untuk
menentukan "level ambang" dalam situasi pengujian tertentu. Jika tuntutan sumber daya dari
spesifikasi pengujian tidak melebihi sumber daya yang tersedia pada setiap tahap dalam
pengembangan pengujian, maka pengujian tersebut praktis dan penggunaan pengujian dapat
dilanjutkan. Dengan demikian, tes praktis adalah tes yang di desain, dikembangkan, dan
penggunaannya tidak membutuhkan lebih banyak sumber daya daripada yang tersedia.
Untuk menilai kepraktisan, kita perlu sumber daya yang diklasifikasikan menjadi tiga jenis,
yaitu:
a. Manusia
Mereka termasuk penulis tes, pencatat skor atau penilai, dan administrator ujian.
b. Material
Ruangan untuk tes, peralatan seperti kertas, gambar,mesin ketik.
c. Waktu
Ini terdiri dari waktu pengembangan tes (waktu dari awal proses pengembangan tes hingga
pelaporan skor).

4. Dampak
Kualitas tes lainnya adalah dampaknya terhadap masyarakat dan sistem pendidikan pada
individu dalam sistem tersebut. Dampak dari penggunaan tes pada tingkat ke-dua , mereka
adalah tingkat mikro, dalam hal individu yang dipengaruhi oleh penggunaan tes tertentu, dan
tingkat makro, dalam hal sistem pendidikan atau masyarakat.

Pengambilan tes dampak Makro:


dan penggunaan masyarakat,
skor tes sistem pendidikan
mikro: individu

a. Washback
Dampak dari aspek yang telah menjadi minat khusus bagi para peneliti dan praktisi pengujian
bahasa adalah apa yang disebut sebagai ‘washback” dan sebagian besar diskusi tentang ini
berfokus pada proses (pembelajaran dan instruksi). Washback sebagai dampak langsung
pengujian pada individu secara luas.

b. Dampaknya pada individu


Individu akan dipengaruhi oleh minat, atau yang memegang “tiang”, dalam penggunaan tes yang
diberikan dalam situasi tertentu.
1. Dampak pada peserta tes
Peserta tes dapat dipengaruhi oleh tiga aspek dari prosedur pengujian:
- Pengalaman mengambil beberapa kasus dalam mempersiapkan ujian,
- Umpan balik yang mereka terima tentang kinerja mereka dalam ujian, dan
- Keputusan yang mungkin dibuat berdasarkan nilai ujian mereka.

2. Dampak pada guru


Kelompok kedua individu yang secara langsung dipengaruhi oleh tes adalah pengguna
tes, dan dalam program pengajaran, pengguna tes yang paling di pengaruhi adalah guru. Seperti
disebutkan di atas, dampak pada program pengajaran, seperti yang diterapkan oleh guru kelas.
Salah satu cara untuk meminimalkan potensi dampak negatif pada pengajaran adalah dengan
mengubah cara menguji sehingga karakteristik tes dan tugas-tugas tes sesuai lebih dekat dengan
karakteristik program pengajaran.
Dampaknya pada masyarakat dan sistem pendidikan
Pengembang pengujian dan pengguna pengujian harus selalu mempertimbangkan
sistem nilai sosial dan pendidikan yang menginformasikan penggunaan pengujian kami.
Pertimbangan nilai dan tujuan sangat kompleks dalam hal pengujian bahasa kedua atau asing,
karena situasi ini tak terhindarkan membawa kita ada pada kesadaran bahwa nilai-nilai dan
tujuan yang menginformasikan penggunaan tes dapat bervariasi dari satu budaya ke budaya
lainnya. Sebagai contoh, satu budaya dapat memberi nilai besar pada upaya dan pencapaian
individu, sedangkan dalam budaya lain, kerja sama dan penghormatan terhadap otoritas mungkin
sangat dihargai.

Nilai dan tujuan juga menurun seiring waktu, sehingga masalah-masalah seperti
kerahasiaan dan akses ke informasi, privasi, yang sekarang dianggap oleh banyak orang sebagai
hak dasar peserta tes, pada satu waktu bahkan bukan masalah pertimbangan. Contoh-contoh lain,
dampak potensial pada praktik pengajaran bahasa di negara tertentu menggunakan jenis tugas tes
tertentu, seperti item pilihan ganda atau jenis wawancara lisan tertentu, dalam banyak digunakan
tes berisiko tinggi pada tingkat nasional.
Dampak dari penggunaan tes perlu dipertimbangkan dalam nilai-nilai dan tujuan
masyarakat dan program pendidikan di mana itu terjadi, dan sesuai dengan konsekuensi potensial
dari penggunaan tersebut.

5. Keaslian
Keaslian adalah tingkat korespondensi dari karakteristik tugas tes bahasa. Keaslian
adalah kualitas pengujian yang penting karena ini menghubungkan tugas pengujian dengan
domain generalisasi yang diinginkan agar interpretasi skor bisa digeneralisasikan. Alasan lain
untuk menganggap keaslian menjadi penting adalah karena efek potensial pada persepsi peserta
tes dan pada kinerja mereka.

keaslian
Karakteristik tugas Karakteristik tugas
TLU tes

B. MENGGAMBARKAN TUGAS: BAHASA DIGUNAKAN DALAM TES BAHASA

Karakteristik tugas menarik karena beberapa alasan, yaitu:


1. Karakteristik ini menyediakan tautan antara tugas dalam domain yang berbeda - domain tugas
uji dan domain tugas non-tes - dan memungkinkan untuk memilih atau merancang tugas uji yang
sesuai dengan cara-cara khusus untuk menggunakan tugas-tugas bahasa.
2. Karakteristik tugas akan membantu menentukan tingkat dan cara di mana kemampuan bahasa
tugas terlibat.
3. Tingkat korespondensi antara karakteristik tugas tes yang diberikan dan tugas penggunaan
bahasa tertentu.
4. Karakteristik tugas tes berpotensi dikontrol dengan cara tes bahasa dirancang dan
dikembangkan.
1. Bahasa yang digunakan Tugas
Dua aspek tugas yang relevan dengan penggunaan bahasa dan pengujian bahasa:
a. Individu harus memahami hasil seperti yang ingin dicapai
b. Individu perlu memiliki beberapa gagasan tentang kriteria di mana kinerja akan dinilai.
Tugas penggunaan bahasa adalah kegiatan yang melibatkan individu dalam menggunakan bahasa
untuk mencapai tujuan atau sasaran tertentu dalam situasi tertentu.

2. Penggunaan bahasa dalam tes bahasa


Secara umum, penggunaan bahasa dapat didefinisikan sebagai penciptaan atau
interpretasi makna yang dimaksudkan dalam wacana oleh seorang individu, atau sebagai
negosiasi dinamis dan interaktif dari makna yang dimaksud antara dua atau lebih individu dalam
situasi tertentu.

3. Domain Penggunaan Bahasa Target (TLU)


Penggunaan bahasa target sebagai serangkaian tugas penggunaan bahasa tertentu yang
kemungkinan akan ditemui peserta tes di luar tes itu sendiri, dan yang ingin disimpulkan tentang
kemampuan bahasa untuk digeneralisasi. Ada dua jenis domain penggunaan bahasa target yang
menarik khusus untuk pengembangan tes bahasa.
a. Domain kehidupan nyata, di mana bahasa digunakan pada dasarnya untuk tujuan komunikasi.
b. Domain instruksi bahasa, di mana bahasa digunakan untuk tujuan pengajaran dan
pembelajaran bahasa.

4. Karakteristik Tugas Tes


Karakteristik tugas yang digunakan selalu cenderung memengaruhi skor tes hingga
tingkat tertentu, sehingga hampir tidak ada tes yang hanya menghasilkan informasi tentang
kemampuan yang ingin kita ukur.

5. Kerangka karakteristik tugas bahasa


Kerangka kerja karakteristik tugas terdiri dari serangkaian fitur untuk menggambarkan
lima aspek tugas: pengaturan, rubrik tes, input, respons, dan hubungan antara input dan respone.
Kerangka adalah untuk memberikan dasar untuk pengembangan dan penggunaan tes bahasa. Ini
melibatkan tiga kegiatan:
a. Menjelaskan tugas TLU sebagai dasar untuk merancang tugas tes bahasa,
b. Menjelaskan tugas tes yang berbeda untuk memastikan komparabilitasnya dan sebagai sarana
untuk menilai
c. Membandingkan karakteristik TLU dan tugas tes untuk menilai keaslian.

6. Karakteristik pengaturan
Karakteristik ini meliputi:
a. Pengaturan fisik, itu termasuk lokasi, tingkat kebisingan, suhu, dan pencahayaan.
b. Pengaturan peserta, ini adalah orang-orang yang terlibat dalam tugas.
c. Waktu tugas, adalah waktu di mana tes berlangsung.

7. Karakteristik uji rubrik


a. Instruksi, bahasa (asli, target), saluran (aural, visual), spesifikasi prosedur dan tugas.
b. Struktur, jumlah bagian / tugas, urutan bagian, jumlah tugas
c. Waktu
d. Metode penilaian

8. Karakteristik input
a. Format
b. Bahasa input
c. Karakteristik topikal

9. Karakteristik respon yang diharapkan


a. Format, sebagai berikut: saluran, bentuk, bahasa, jenis
b. Bahasa respons yang diharapkan
c. Karakteristik bahasa

10. Hubungan antara input dan respons


a. Reaktivitas: sejauh mana input atau respons secara langsung mempengaruhi input dan respons
selanjutnya.
- Tugas resiprokal adalah tugas di mana pengambil atau pengguna bahasa menggunakan bahasa
dengan lawan bicara lainnya.
- Non-resiprokal, tidak ada umpan balik atau interaksi antara pengguna bahasa.
- Adaptif, perkembangan terbaru dalam pengukuran penggunaan tes adaptif di mana tugas-tugas
tertentu yang disajikan kepada peserta tes ditentukan oleh respons terhadap tugas-tugas
sebelumnya.
b. Lingkup hubungan: jumlah atau rentang input yang harus diproses agar peserta tes atau
pengguna bahasa merespons seperti yang diharapkan.
- Cakupan luas: tugas yang membutuhkan peserta tes atau pengguna bahasa untuk memproses
banyak input dapat dikarakterisasi.
- Cakupan sempit: tugas yang hanya memerlukan pemrosesan input dalam jumlah terbatas dapat
dikarakterisasi.
c. Keterkaitan hubungan: sejauh mana respons yang diharapkan dapat didasarkan terutama pada
informasi dalam input, atau apakah peserta tes atau pengguna bahasa juga harus bergantung pada
informasi dalam konteks atau dalam pengetahuan topikalnya sendiri.
- Langsung: respons utamanya mencakup informasi yang diberikan dalam input.
- Tidak langsung: respons mencakup informasi yang tidak diberikan dalam input.

11. Aplikasi kerangka kerja karakteristik tugas


a. Menggunakan daftar periksa karakteristik tugas untuk membandingkan karakteristik tugas
penggunaan bahasa target dan tugas tes
b. Menggunakan daftar periksa karakteristik tugas untuk membuat jenis tugas tes yang baru

BAB III
KESIMPULAN

Ada lima kualitas pengujian: validitas, reliabilitas, keaslian, dampak, dan praktis.
Kelima kualitas uji ini semuanya berkontribusi pada manfaat, sehingga tidak bisa dievaluasikan
secara independen satu sama lain. Selain itu, kepentingan relatif dari kualitas yang berbeda ini
akan bervariasi dari satu situasi pengujian ke yang lain. Sehingga, kegunaan pengujian hanya
dapat dievaluasi untuk situasi pengujian tertentu.

Tugas penggunaan bahasa adalah kegiatan yang melibatkan individu dalam


menggunakan bahasa untuk mencapai tujuan tertentu dalam situasi atau pengaturan tertentu. Dua
penggunaan penting dari kerangka kerja karakteristik tugas adalah (1) membuat template untuk
menggambarkan situasi TLU dan tugas tes untuk mengevaluasi sejauh mana dua tugas ini saling
berhubungan, dan (2) memvariasikan karakteristik metode pengujian tertentu untuk membuat
metode pengujian baru.

Anda mungkin juga menyukai