Dosen Pengampu :
Miftakhul Maesaroh, S.S., M.Pd.
Disusun oleh :
Riyatus Sholikatin (202210083)
Puji syukur kami haturkan kehadirat Allah Swt. yang telah melimpahkan rahmat dan
hidayah-Nya sehingga kami bisa menyelesaikan makalah tentang “Langkah-Langkah
Menyusun Tes Bahasa Arab”.
Tidak lupa juga kami mengucapkan terima kasih kepada semua pihak yang telah turut
memberikan kontribusi dalam penyusunan makalah ini. Tentunya, tidak akan bisa maksimal
jika tidak mendapat dukungan dari berbagai pihak.
Sebagai penyusun, kami menyadari bahwa masih terdapat kekurangan, baik dari penyusunan
maupun tata bahasa penyampaian dalam makalah ini. Oleh karena itu, kami dengan rendah
hati menerima saran dan kritik dari pembaca agar kami dapat memperbaiki makalah ini.
Kami berharap semoga makalah yang kami susun ini memberikan manfaat dan juga inspirasi
untuk pembaca.
Penulis
BAB I
PEMBUKAAN
A. Latar Belakang
Tes Bahasa Arab merupakan salah satu dari alat evaluasi pembelajaran Bahasa
Arab, di mana evaluasi merupakan salah satu komponen penting dalam kurikulum
pembelajaran Bahasa Arab. Untuk mendapatkan hasil tes yang baik, bermakna, dan
bermutu, maka perlu adanya perencanaan tes Bahasa Arab sesuai dengan tahapan
penyusunannya, yaitu di antaranya: (Persiapan, Pemilihan materi tes, Menentukan
bentuk dan jenis tes, Menentukan jumlah butir tes, Menentukan skor, Membuat kisi-
kisi, Menyusun butir tes berdasarkan kisi-kisi, Uji coba tes yang telah disusun), dan
juga perlu adanya analisa terhadap tes Bahasa Arab yang sudah direncanakan dan
diujicobakan terhadap siswa baik itu menganalisa Tingkat kesukaran soal, Daya
Pembeda dan fungsi distractor, sehingga hasil tes bahasa Arab siswa yang kita
dapatkan itu valid dan reliabel.
Dalam pelaksanaan penyusunan tes bahasa Arab, tidak jarang dijumpai proses
penyusunannya yang “asal buat”, tanpa memperhatikan prosedur yang benar.
Penyusun tes membiasakan diri “mencomot” butir-butir soal dari “sana-sini”
kemudian merangkaikannya menjadi sebuat tes bahasa Arab, tanpa melihat apakah
butir-butir soal yang dikembangkan itu benar-benar mengukur kemampuan
ataukompetensi yang seharusnya diukur. Belum lagi instrumen dan cara penilaiannya
monoton. Model penyusunan tes seperti ini berdampak pada ketidaksahinan tes yang
dibuat. Implikasinya instrumen tes yang dibuat kurang atau tidak memenuhi
persyaratan tes yang baik.
B. Rumusan Masalah
1. Apa saja langkah-langkah menyusun tes bahasa arab ?
2. Bagaimana karakteristik tes yang baik ?
C. Tujuan pembahasan
1. Untuk mengetahui apa saja langkah-langkah menyusun tes bahasa arab
2. Untuk mengetahui bagaimana karakteristik tes yang baik
BAB II
PEMBAHASAN
3
Moh. Matsna HS, Pengembangan Evaluasi dan Tes Bahasa Arab, (Tanggerang : Alkitabah, 2012),
hal. 77-78
Apabila soal yang dibuat mempunyai tingkat kesukaran yang berbeda-beda,
maka pihak pembuat tes dapat memberikan bobot yang berbeda. Artinya, suatu
butir tes diberi bobot tinggi apabila butir tes tersebut lebih sulit dan lebih
kompleks bila dibandingkan dengan butir tes lain.
Dengan mengingat kedua jenis tes tersebut kita dapat menjelaskan perbedaan
pada pemberian skornya, yaitu sebagai berikut :
a. Untuk tes objektif dalam menentukan benar dan salahnya jawaban terhadap
suatu butir tes penilai hanya mencocokkan jawaban dengan kunci jawaban
yang tersedia. Sedangkan untuk tes subjektif penilai seringkali masih perlu
mempertimbangkan betul salahnya suatu jawaban yang tidak persis sama
dengan yang tertulis pada kuncinya.
b. Sebagai akibat dari perlunya pertimbangan penilai terhadap suatu jawaban,
maka otomatis proses pemberian skor untuk tes subjektif akan lebih lama
dibandingkan dengan proses pemberian skor pada tes objektif.
c. Jawaban terhadap tes objektif bersifat pasti, harus persis dengan kuncinya,
maka korektornya tidak harus seseorang yang ahli di bidang yang diteskan.
Sedangkan untuk tes subjektif, diperlukan korektor yang menguasai bidang
yang diteskan.
d. Siapapun yang mengoreksi tes objektif hasil skornya tidak akan bervariasi,
sedangkan pada tes subjektif berbeda korektor mungkin saja menghasilkan
skor yang berbeda.
Dari uraian diatas dapat disimpulkan bahwa pemberian skor untuk tes
subjektif lebih kompleks dan lebih rumit, sedangkan untuk tes objektif lebih
mudah dan lebih sederhana.4
6. Membuat Kisi-kisi
Tujuan pembuatan kisi-kisi adalah membuat spesifikasi yang jelas tentang apa
yang akan ditanyakan. Tujuan membuat kisi-kisi adalah supaya apa yang akan kita
usahakan mengenai sasaran. Kisi-kisi yang baik harus mewakili isi kurikulum
suatu lembaga yang bersangkutan, komponen-komponen nya diuraikan dengan
jelas dan mudah dipahami serta memberikan indokator yang jelas pula.5
Selain itu juga harus memperhatikan hal-hal berikut :
4
Erta Mahyudin, Pengembangan Evaluasi dan Tes Bahasa Arab, (Tanggerang : Alkitabah, 2012),
hal. 78 & 210
5
Moh. Matsna HS, Pengembangan Evaluasi dan Tes Bahasa Arab....... hal. 79
a. Waktu untuk melaksanakan tes
b. Topik-topik yang akan ditanyakan
c. Jenis soal yang akan digunakan
d. Jumlah soal setiap soal secara keseluruhan maupun tiap-tiap topik
e. Persentase soal yang mudah dan yang sulit setelah diuji cobakan
Dalam membuat kisi-kisi soal, dapat dilakukan langkah-langkah berikut :
a. Menuliskan kompetensi dasar dan indikator capaian hasil belajar yang
terdapat dalam silabus/kurikulum
b. Menuliskan daftar pokok/sub pokok bahasan yang akan diujikan
c. Menentukan jumlah butir soal setiap pokok/sub pokok bahasan, jumlah
soal hendaknya representatif untuk untuk setiap pokok /sub pokok bahasan
yang diujikan dengan pertimbangan pentingnya pokok/sub pokok bahasan
tersebut. Selain itu, dalam menentukan jumlah soal juga perlu
mempertimbangkan waktu yang tersedia untuk pelaksanaan tes.
d. Menentukan bentuk soal tes, dalam menentukan bentuk tes, perlu
mempertimbangkan karakteristik materi yang hendak diukur. Jika tes itu
untuk mengukur pemahaman mufradat, qawaid, istima’, dan qiraah, maka
bisa digunakan bentuk tes pilihan ganda. Namun jika tes itu untuk
mengukur kemampuan menulis dan berbicara, maka lebih tepat jika
menggunakan bentuk tes uraian atau mengarang.6
7. Menyusun Butir Tes Berdasarkan Kisi-Kisi
Dalam penyusunan butir soal ini, ada rambu-rambu yang sebaiknya
diperhatikan oleh guru atau pembuat tes, yaitu :
a. Bahasa yang digunakan jelas dan lugas
b. Stem (pernyataan pokok) pada setiap butir tes (pilihan ganda) hanya berisi
satu permasalahan
c. Panjang jawaban untuk setiap option (khusus untuk pilihan ganda) relatif
sama
d. Letak jawaban yang benar disusun secra acak, artinya harus dihindari letak
jawaban benar yang berpola, misalnya berpola ab, ac, dan ad atau berpola
aa, bb, cc, dan dd.
8. Uji Coba Tes yang telah disusun
6
Yelfi Dewi, Evaluasi dan tes Bahasa Arab Pedoman bagi Guru, Mahasiswa dan Praktisi Pendidikan
Bahasa Arab.......hal. 47-48
Idealnya sebelum tes diberlakukan kepada siswa, perlu dilakukan uji coba
terlebih dahulu. Uji coba ini bertujuan untuk mengetahui apakah tes yang disusun
benar-benar tes yang baik atau apakah tes yang disusun itu memiliki tingkat
kesulitan yang normal dan benar-benar dapat membedakan kelompok teste yang
memiliki kemampuan tinggi dan rendah. Untuk mengetahui hal itu, maka setelah
tes uji coba dilakukanlah analisis terhadap jawaban siswa. Diantara variabel yang
dianalisis adalah analisis tingkat kesulitan, analisis daya beda, dan analisis
reliabilitas.7
9
Al-khuli, Al-ikhtbarat Al-Lughawiyyah. Shuwailih (Al-Urdun): Darul Falah, thn 2000.
10
Djiwandono, Tes Bahasa dalam Pengajaran. (Bandung: ITB, 1996).
JJB = Jumlah jawaban benar
JPT = Jumlah peserta tes.
Berkaitan dengan hal ini, Oller menyatakan bahwa suatu butir tes dinyatakan
layak jika indeks tingkat kesulitannya berkisar antara 0,15 sampai dengan 0,85. Ada
pendapat lain yang mengatakan bahwa suatu butir tes dianggap baik bila mempunyai
p antara 10% sampai 90%.11 Hal ini berarti, bahwa apabila indeks suatu butir tes di
bawah 0,15 atau 0,10, maka butir tes tersebut tergolong terlalu sulit. Sebaliknya,
apabila indeks suatu butir tes lebih dari 0,85 atau 0,90, maka butir tes tersebut
tergolong terlalu mudah sehingga butir tes tersebut perlu direvisi atau tidak
digunakan. Sebagai contoh, apabila suatu butir tes dijawab benar oleh tujuh peserta
tes dari jumlah keseluruhan peserta sebanyak 30, maka tingkat kesulitan butir tes
terebut adalah 23%, atau 0,23. Apabila suatu butir tes dijawab benar oleh dua peserta
tes dari jumlah keseluruhan peserta sebanyak 30, maka tingkat kesulitan butir tes
tersebut adalah 6,67% atau 0,067. Berdasarkan indeks tersebut (0,23), maka butir tes
dengan angka tergolong baik. Sementara itu, tingkat kesukaran sebesar 6,67%
menunjukkan bahwa butir tes tersebut tergolong sulit. Implikasinya, butir tes ini harus
direvisi atau tidak digunakan.
Karakteristik yang keempat adalah daya beda (darajatut tamyiz). Sebuah tes
dikatakan memiliki daya beda yang baik manakalah tes tersebut dapat membedakan
antara siswa kelompok tinggi dan kelompok rendah. Menurut Joni, suatu soal
dikatakan mempunyai kemampuan diskriminasi (daya beda) yang benar apabila soal
tersebut dijawab benar oleh lebih banyak anggota kelompok pintar (upper group) bila
dibandingkan dengan anggota kelompok tidak pintar (lower group). Sebagai
gambaran, apabila satu kelas terdiri dari 30 teste, maka diambil 27% sebagai
kelompok atas dan 27% sebagai kelompok bawah. Dengan demikian ada 8 teste
(dibulatkan) berdasarkan urutan skor sebagai kelompok atas (upper group), yaitu teste
peringkat 1 sampai 8 dan 8 teste dari bawah berdasarkan urutan skor sebagai
kelompok bawah (lower group), yaitu teste peringkat 23 sampai 30. Semakin tinggi
295 tingkat daya beda atau diskriminasi suatu butir tes, semakin tinggi pula
kemampuannya untuk membedakan peserta yang pandai dari yang kurang pandai.
Kemampuan diksriminasi atau daya beda dapat dinyatakan dengan % dengan
mempergunakan simbul D.
Untuk menentukan daya beda suatu butir tes dapat digunakan rumus berikut.
11
Joni, T. Raka. Pengukuran dan Penilaian Pendidikan. (Surabaya: Karya Anda 1986).
∑ benar upper - ∑ benar lower
D= ─────────────── x 100%
∑ kelompok (upper atau lower)
Dalam menentukan rentangan indeks daya beda dari suatu tes, dapat
digunakan rumus yang dikemukakan oleh Djiwandono sebagai berikut.
0,50 atau lebih : baik
antara 0,20 dan 0,50 : sedang
di bawah 0,20 : kurang
0 : tidak ada deskriminasi
- (negatif) : negatif
Sebagai contoh, apabila suatu butir soal dijawab benar oleh enam teste dari
kelompok atas dan seorang teste dari kelompok bawah, maka cara penghitungannya
adalah sebagai berikut.
6−1
D= ×100=0 , 63
8
Dengan demikian, butir soal tersebut memiliki daya beda yang baik, karena
indeks daya beda menunjukkan angka 0,63 (> 0,50). Ini berarti, bahwa butir tes ini
dilihat dari D-nya dapat membedakan kelompok atas dan bawah.
BAB III
PENUTUP
A. Kesimpulan
Adapun Tahapan –tahapan yang dilalui dalam penyusunan tes bahasa, yaitu:
Persiapan, Pemilihan materi tes, Menentukan bentuk dan jenis tes, Menentukan
jumlah butir tes, Menentukan skor, Membuat kisi-kisi, Menyusun butir tes
berdasarkan kisi-kisi, Uji coba tes yang telah disusun.
Penyusunan tes bahasa, khususnya tes bahasa Arab seharusnya
memperhatikan standar tes yang baik. Standar tes yang baik itu meliputi standar
validitas atau kesahihan (Ash-shidqu), reliabilitas (Ats-tsabat), dan memiliki tingkat
kesulitan (darajatush shu’ubah) dan daya beda (darajatut tamyiz) yang baik. Dari
keempat standar ini, yang lebih prinsip dan lebih aplikatif pelaksanaannya bagi
pendidik adalah standar validitas. Hal ini karena standar kesahihan ini (kesahihan
logis) lebih pada proses penyelarasan antara tujuan tes dengan substansi butir-butir
soal yang disusun dan untuk menentukan tingkat kesahihan ini dapat dilaksanakan
sebelum tes diberlakukan. Sementara itu, ketiga standar yang terkahir ini
pelaksanaannya setelah tes diberlakukan dan masih diperlukan tahapan-tahapan
berikutnya.
DAFTAR PUSTAKA