EnengDianjafraconsultan
6 years ago
A. Pengertian Tes
Istilah tes diambil dari kata “testum” suatu pengertian dalam bahasa
Perancis kuno yang berarti piring untuk menyisihkan logam-logam mulia. Ada
pula yang mengartikan sebagai sebuah piring yang dibuat dari tanah. Dalam
perkembangannya, istilah tes diadopsi dalam psikologi dan pendidikan.
Tes merupakan suatu teknik atau cara yang digunakan dalam rangka
melaksanakan kegiatan pengukuran, yang didalamnya terdapat berbagai
pertanyaan, pernyataan atau serangkaian tugas yang harus dikerjakan atau
dijawab oleh peserta didik untuk mengukur aspek perilaku peserta
didik. Menurut seorang ahli bernama James Ms. Cattel, pada tahun 1890 telah
memperkenalkan pengertian tes ini kepada masyarakat melalui bukunya yang
berjudul “mental test and measurement”. Selanjutnya di Amerika Serikat tes ini
berkembang dengan cepat sehingga dalam tempo yang tidak begitu lama
masyarakat mulai menggunakannya.
Banyak ahli yang mulai mengembangkan tes ini untuk berbagai bidang,
namun yang terkenal adalah sebuah tes intelegensi yang disusun oleh orang
Perancis bernama Binet, yang kemudian di bantu penyempurnaannya oleh
Simon, sehingga tes tersebut dikenal sebagai tes binet-simon (tahun 1904).
–Tes: adalah merupakan alat atau prosedur yang digunakan untuk mengetahui
atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang
sudah ditentukan. Untuk mengerjakan tes ini tergantung dari petunjuk yang
diberikan misalnya : melingkari salah satu huruf di depan pilihan jawaban,
menerangkan, mencoret jawaban yang salah, melakukan tugas atau suruhan,
menjawab secara lisan dan sebagainya.
–Testing: testing merupakan saat pada waktu tes itu dilaksanakan atau testing
saat pengambilan tes.
–Testee :(dalam istilah Indonesia tercoba), adalah responden yang sedang
mengerjakan, dinilai atau diukur, baik mengenai kemampuan, minat, bakat,
pencapaian dan sebagainya.
Tes objektif yang juga dikenal dengan istilah tes jawaban pendek (short answer
test) tes ya-tidak (yes-no test) dan test model baru (new tipe test) adalah salah
satu jenis tes hasil belajar yang terdiri dari butir-butir soal (item) yang dapat
jawab oleh testee dengan jalan memilih salah satu jawaban (atau lebih) di antara
beberapa kemungkinan jawaban yang dapat dipasangkan pada masing-
masing items atau dengan cara mengisikan (menuliskan) jawaban berupa kata-
kata atau simbol-simbol tertentu pada tempat atau ruang yang telah disediakan
untuk masing-masing butir items yang bersangkutan.
Dilihat dari sistem penskorannya, tes objektif akan menghasilkan skor yang
sama. Sebagaimana nama yang digunakannya, soal objektif adalah soal yang
tingkat kebenarannya objektif. Oleh karenanya, tes objektif adalah tes yang
dalam pemeriksaannya dapat dilakukan secara objektif (Arikunto, 1995: 165).
Karena sifatnya yang objektif maka penskorannya dapat dilakukan dengan
bantuan mesin. Soal ini tidak memberi peluang untuk memberikan penilaian
yang bergradasi karena dia hanya mengenal benar dan salah. Apabila respons
siswa sesuai dengan jawaban yang dikehendaki maka respons tersebut benar
dan biasa diberi skor 1. Apabila kondisi yang terjadi sebaliknya, maka respons
siswa salah dan biasa diberi skor 0. Jawaban siswa bersifat mengarah kepada
satu jawaban yang benar (convergence).
Tes hasil belajar bentuk objektif sebagai salah satu bentuk tes hasil belajar tepat
digunakan apabila tester berhadapan dengan kenyataan-kenyataan disebutkan
berikut ini:
Seperti halnya tes uraian, sebagai alat pengukur keberhasilan belajar peserta
didik, tes objektif ini disamping memiliki keunggulan-keunggulan juga
memiliki kekurangan-kekurangan.
1. Tes objetif sifatnya lebih representatif dalam hal mencakup dan mewakili
materi yang telah diajarkan kepada peserta didik atau telah diperintahkan
kepada peserta didik untuk mempelajarinya.
2. Tes objektif lebih memungkinkan bagi tester untuk bertindak lebih objektif,
baik dalam mengoreksi lembar-lembar soal, menentukan bobot skor
maupun dalam menentukan hasil nilai tesnya.
3. Mengoreksi tes objektif jauh lebih mudah dan lebih cepat dibandingkan
dengan tes uraian, bahkan dapat menggunakan menggunakan alat-alat
kemajuan teknologi misalnya mesin scanner.
4. Berbedanya dengan tes uraian, maka tes objektif memberikan kemungkinan
kepada orang lain untuk ditugasi atau dimintai bantuan guna mengoreksi
hasil tes tersebut.
5. Butir-butir soal pada tes objektif jauh lebih mudah dianalisis, baik dari segi
derajat kesukarannya, daya pembedanya, validitas maupun reliabilitasnya.
Adapun dari segi kelemahan dari tes objektif antara lain adalah:
1. Menyusun butir-butir soal tes objektif adalah tidak semudah seperti halnya
menyusun tes uraian.
2. Tes objektif pada umumnya kurang dapat mungukur atau mengungkap
proses berpikir tinggi atau mendalam.
3. Dengan tes objektif, terbuka kemungkinan bagi testee untuk bermain
spekulasi, tebak terka, adu untung dalam memberikan jawaban soal.
4. Cara memberikan jawaban soal pada tes objektif dimana dipergunakan
simbol-simbol huruf yang sifatnya seragam seperti A, B, C, D dan sebagainya
ini memungkinkan peluang bagi testee untuk saling bekerja sama.
Pertama, untuk dapat menyusun butir-butir soal tes objektif yang bermutu
tinggi, pembuat tes (dalam hal ini guru, dosen dan lain-lain) harus membiasakan
diri dan sering berlatih, sehingga dari waktu ke waktu ia akan dapat merancang
dan menyusun butir-butir soal tes objektif dengan lebih baik dan lebih
sempurna.
Kedua, setiap kali alat pengukur hasil belajar berupa tes obyetif itu selesai
digunakan, hendaknya dilakukan penganalisisan item dengan tujuan dapat
mengidentifikasi butir-butir item mana yang sudah termasuk dalam kategori
“baik” dan butir-butir item mana yang masih termasuk dalam kategori “kurang
baik” dan “tidak baik”.
Keempat, agar tes obyektif disamping mengungkap aspek ingatan atau hafalan
juga dapat mengungkap aspek-aspek berpikir yang lebih dalam, maka dalam
merancang dan menyusun butir-butir item tes obyektif hendaknya tester
menggunakan alat bantu berupa tabel spesifikasi soal atau yang sering dikenal
dengan istilah blue print atau kisi-kisi soal. Dengan menggunakan alat bantu
tersebut diharapkan akan terjadi keseimbangan antara butir soal (yang
jumlahnya cukup banyak itu) dengan aspek-aspek psikologis (yang seharusnya
diungkapkan dalam tes tersebut).
Kelima, dalam menyusun kalimat soal-soal tes obyektif, bahasa atau istilah-
istilah yang dipergunakan hendaknya cukup sederhana, ringkas, jelas dan
mudah dipahami oleh testee. Susunan kalimat yang berkepanjangan istilah-
istilah yang tidak jelas atau meragukan dapat berakibat terjadinya hambatan
bagi testee untuk memberikan jawabannya.
a) Pengertian
Tes menjodohkan adalah butir soal atau tugas yang jawabannya dijodohkan
dengan seri jawaban. Dengan kata lain, tugas peserta tes hanya menjodohkan
premis dengan salah satu seri jawaban. Tes menjodohkan terdiri atas dua bagian
(kolom), yaitu :
1) Bagian pertama disebut seri stem, atau premis, atau pokok soal yang dapat
berbentuk pernyataan atau pertanyaan.
(a) Kolom pertama atau lajur kiri untuk stem atau pokok soal
b) Teknik Penyusunan
3) Seyogyanya seri pertanyaan atau pernyataan tidak lebih dari lima item,
karena kalau lebih akan membingungkan dan mengurangi homogenitas
1) Sangat baik untuk menguji hasil belajar tentang istilah, definisi, peristiwa,
dan penanggalan
4) Tidak dapat mengukur hasil belajar yang kompleks, baik dari segi domain
maupun dari segi tinngkat kesulitan, khususnya domain afeksi dan motorik.
d) Contoh soal
Kelompok A Kelompok B
Sk = B
Dengan ketentuan :
1. Pengertian
Tes pilihan ganda adalah butir soal atau tugas yang jawabannya dipilih dari
alternatif yang lebih dari dua. Alternatif jawaban kebanyakan berkisar antara 4
(empat) dan 5 (lima). Nitko (2007) menjelaskan tujuan dasar dari tugas
penilaian, soal pilihan ganda adalah untuk mengidentifikasi siswa yang telah
mencapai tingkat (atau diperlukan) pengetahuan (keterampilan, kemampuan,
atau kinerja) cukup dari target pembelajaran yang dinilai. Pilihan ganda terdiri
atas dua bagian, yaitu :
b) Alternatif bukan kunci disebut dengan pengecoh atau distractor atau foils
a) Umumnya hanya ada satu jawaban benar atau jawaban terbaik pada soal
pilihan ganda
d) Memeriksa kembali seluruh tes untuk memastikan pilihan yang benar tidak
mengikuti pola yang mudah dipelajari
e) Hindari ungkapan pada pilihan benar yang textbook atau gaya klise
Sedangkan menurut Nitko (2007) merinci beberapa kelebihan dari tes pilihan
ganda ini, yakni sebagai berikut:
3) Tes pilihan ganda fokus pada membaca dan berpikir. Tes tidak menuntut
siswa untuk menggunakan proses menulis dalam kondisi pemeriksaan.
Lebih rincinya tes pilihan ganda ini memiliki kelebihan sebagai berikut :
2) Dapat menggunakan tes yang relatif banyak yang mewakili bahan ajar
yang lebih luas
4) Penskoran hasil kerja peserta tes dapat dikerjakan oleh mesin atau orang
lain secara objektif, karena sudah ada kunci jawaban
5) Menuntut kecermatan yang tinggi untuk membedakan jawaban yang
paling benar di antara jawaban yang benar
Setiap tes memiliki kelemahan tersendiri, menurut Popham (1995) tes ini hanya
perlu mengenali sebuah jawaban benar. Tes ini tidak butuh menghasilkan
jawaban benar. Sedangkan Nitko (2007) menjelaskan beberapa kelemahan dari
soal pilihan ganda, yaitu sebagai berikut :
1) Siswa harus memilih diantara daftar pilihan yang telah ditetapkan, bukan
menciptakan atau mengekspresikan ide-ide atau solusi mereka sendiri.
3) Karena biasanya hanya satu pilihan dari soal yang sebagai kunci yang
benar, siswa yang pintar menjadi dihukum untuk tidak memilih jawaban yang
benar. Siswa yang pintar dapat mendeteksi cacat dalam soal pilihan ganda
karena ambiguitas dari kata-kata, sudut pandang yang berbeda, atau
pengetahuan mata pelajaran tambahan, sedangkan siswa lain tidak mungkin
mendeteksinya.
Lebih lanjut kelemahan tes pilihan ganda ini dapat dirinci sebagai berikut:
3) Kurang cocok untuk mengukur hasil belajar yang menyeluruh atau total
6) Tidak dapat mengukur hasil belajar yang komplesk, baik dari segi domain
maupun dari segi tingkat kesulitan, khususnya domain afeksi dan motorik
1) Melengkapi Pilihan
Soal dalam bentuk ini terdiri atas kalimat pokok yang berupa pernyataan yang
belum lengkap diikuti oleh empat atau lima kemungkinan jawaban yang dapat
melengkapi pernyataan tersebut. Responden atau testee diminta untuk memilih
salah satu dari kelima kemungkinan jawaban yang tersedia. Dalam bentuk
ini hanya satu jawaban benar, seperti dalam contoh diatas, dan perhatikan
contoh soal berikut ini:
Dalam bentuk soal tersebut kita dapat mengenal adanya variasi lain, yaitu
variasi bentuk “tidak” dan variasi bentuk “kecuali”. Kedua bentuk ini
memerlukan kemampuan diskriminatif dari yang dites.
Petunjuk:
Soal:
Sebab
(kunci: a)
Soal test bentuk ini merupakan simulasi keadaan nyata; jadi seolah-olah yang
diuji diharapkan kepada keadaan sebenarnya. Kasus yang diberikan biasanya
berupa cerita atau uraian tentang kejadian, situasi, proses dan hasil percobaan
ataupun penelitian, yang ada hubungannya dengan bidang studi atau mata
pelajaran yang akan diujikan. Dari satu kasus dapat dibuat lebih dari satu
pertanyaan atau soal didahului oleh satu kasus. Contoh:
Petunjuk:
Untuk soal berikut ini disediakan suatu teks yang harus dipahami secara
cermat. Kemudian menyusul soal-soal yang memasalahkan hal-hal yang
berhubungan dengan isi teks. Pilih salah satu jawaban yang paling tepat pada
soal-soal yang mengiringi teks.
Pada suatu waktu disuatu daerah banyak terdapat awan, udara panas, dan kilat
serta halilintar silih berganti. Yang menyebabkan udara menjadi panas ialah:
Bentuk soal ini hampir sama dengan bentuk soal “melengkapi pilihan”, yaitu
satu pernyataan yang tidak lengkap diikuti dengan beberapa kemungkinan.
Perbedaannya ialah, pada bentuk “melengkapi berganda” ini kemungkinan yang
benar satu, dua, tiga, atau empat. Contoh:
Petunjuk:
Dibawah ini terdapat soal-soal yang mempunyai kejadian yang dapat timbul
bersama.
Pilihlah:
Soal: Salah satu vitamin yang larut dalam lemak adalah vitamin A yang
terdapat didalam:
Bentuk ini mempermasalahkan atau mengacu pada gambar, diagram grafik, dan
sejenisnya. Yang ditanyakan adalah kelainan, keadaan, atau gejala yang
terungkap didalamnya. Permasalahannya diajukan dengan suatu gambar,
diagram, atau grafik yang bersangkutan. Bentuk soalnya sama dengan bentuk
“melengkapi lima pilihan”.
Contoh:
Grafik berikut menggambarkan konsumsi bensin di Provinsi A dalam tujuh tahun terakhir
1. 40
2. 43
3. 44
4. 45
5. 47
Rumus untuk mencari skor dalam tes tipe pilihan ganda ada 2 macam, yaitu :
1) Sistem Denda
Dengan ketentuan
1 = bilangan tetap
Contoh :
Jumlah soal tes ganda = 20 butir soal. Pilihan jawaban (option) sebanyak 5
buah. Kartika dapat menjawab dengan betul sejumlah 13 butir soal, jawaban
yang salah berjumlah 4 butir soal dan 3 butir soal tidak dikerjakan. Maka skor
untuk Kartika adalah :
Sk = B
Dengan ketentuan :
Jadi yang dihitung adalah hanya jawaban yang benar saja, sedangkan jawaban
yang salah tidak mempengaruhi skor.
1. Pengertian
Tes benar salah adalah butir soal atau tugas yang berupa pernyataan yang
jawabannya menggunakan pilihan pernyataan benar atau salah. Alternatif
jawaban dapat berbentuk:
1) Benar-salah
2) Setuju-tidak setuju
3) Baik-tidak baik
1. Teknik Penyusunan
1) Pastikan pernyataan tes bersifat absolut benar atau salah sesuai dengan
kondisinya.
7) Seyogyanya jumlah antara jawaban yang benar dan yang salah seimbang
4) Mudah diskor oleh dosen/guru secara langsung atau oleh orang lain,
karena sudah ada kunci jawaban
8) Tidak dapat mengukur hasil belajar yang kompleks, baik dari segi domain
maupun dari segi tingkat kesulitan, khususnya domain afeksi dan motorik
1. Contoh soal
1) Sistem Denda
Sk = B – S
Dengan ketentuan :
Contoh :
Jumlah soal tes = 100 butir soal. Ahmad dapat menjawab dengan betul sejumlah
70 butir soal, jawaban yang salah berjumlah 25 butir soal dan 5 butir soal tidak
dikerjakan. Maka skor untuk Ahmad adalah :
70 – 25 = 45
Kelebihan system denda akan mengurangi kemungkinan peserta tes untuk
berspekulasi (untung-untungan) dalam menjawab soal tes, namun
kelemahannya ada kemungkinan seorang peserta memperoleh skor negatif.
Sk = B
Dengan ketentuan
Jadi yang dihitung adalah hanya jawaban yang benar saja, sedangkan jawaban
yang salah tidak memengaruhi skor akhir.
Apabila jawaban Ahmad dalam contih di atas menggunakan sistem tanpa denda,
maka Ahmad memperoleh skor = 70.
Kekurang sistem tanpa denda adalah mendorong peserta tes untuk berspekulasi
(untung-untungan) dalam menjawab soal tes, namun kelebihannya adalah tidak
ada peserta tes yang memperoleh skor negatif.
Tes melengkapi adalah butir soal atau tugas yang jawabannya diisi oleh peserta
tes dengan melengkapi satu kata, satu frasa, satu angka, satu rumus, atau satu
formula. Butir soal ini berupa kalimat pernyataan yang belum selesai sehingga
peserta harus melengkapi kalimat penyataan tersebut.
1. Teknik Penyusunan
Kurang baik:
Lebih baik:
Petunjuk ini sesuai dengan sifat item tipe jawaban melengkapi yang memang
memusat pada jawaban yang diinginkan. Dengan menulis pertanyaan sambil
memperhatikan jawaban yang kita kehendaki maka dapat dijaga bahwa hanya
akan ada satu jawaban yang layak diberikan terhadap item.
Baik:
Kurang baik:
5) Jangan menggunakan kata atau kalimat yang langsung dikutip dari buku.
Kurang baik:
Komentar: Kalimat di atas tidak lebih daripada kutipan batasan pengertian harga
rata-rata atau mean. Pertanyaan demikian itu hanya mengungkap kemampuan
menghafal dan tidak mengukur pengertian.
Lebih baik:
Lima orang siswa mempunyai 270 permen. Rata-rata permen yang dimiliki
seorang siswa adalah…
d) Tidak dapat mengukur hasil belajar yang kompleks, baik dari segi domain
maupun dari segi tingkat kesulitan, khususnya domain kognisi dan afeksi.
1. Contoh soal
1. Teori kritik sastra Arab klasik disebut …
2. Teori strukturalisme genetik dikembangkan oleh …
3. Karya agung Kahlil Gibran …
4.
Sebelum menyusun kisi-kisi dan butir soal perlu ditentukan jumlah soal setiap
kompetensi dasar dan penyebaran soalnya. Untuk lebih jelasnya, perhatikan
contoh penilaian akhir semester berikut ini.
Jumlah soal 40 5 2
1. Penyusunan Kisi-kisi
Keterangan:
Isi pada kolom 2, 3. 4, dan 5 adalah harus sesuai dengan pernyataan yang ada di
dalam silabus/kurikulum. Penulis kisi-kisi tidak diperkenankan mengarang
sendiri, kecuali pada kolom 6.
1. Kisi-kisi harus dapat mewakili isi silabus/kurikulum atau materi yang telah
diajarkan secara tepat dan proporsional.
2. Komponen-komponennya diuraikan secara jelas dan mudah dipahami.
3. Materi yang hendak ditanyakan dapat dibuatkan soalnya.
1. H. Analisis Tes
Validitas tes adalah tingkat keabsahan atau ketepatan suatu tes Tes yang valid
(absah = sah) adalah tes benar-benar mengukur apa yang hendak diukur. Tes
matematika kelas dua SMP, hendaknya benar-benar mengukur hasil belajar
matematika siswa SMP kelas dua; bukan siswa SMP kelas tiga atau siswa SD
kelas enam. Dan bukan mengukur hasil belajar dalam bidang studi lainnya. Tes
yang disusun untuk mengukur hasil belajar mata pelajaran Bahasa Indonesia
pada kelas tertentu, hendaknya tidak menyimpang sehingga mengukur hasil
belajar matematika, IPS, atau Bahasa Indonesia pada tingkat/kelas lain.
1) Apakah bahasa dan susunan kalimat (redaksi) tiap butir soal cukup jelas
dan sesuai dengan kemampuan siswa ?
2) Apakah isi jawaban yang diminta tidak membingungkan ?
4) Jangan sampai siswa tahu isi jawabannya tetapi tidak tahu bagaimana cara
menjawab soal bersangkutan.Apakah tes itu telah disusun berdasar
kaidah/prinsip penulisan butir soal?
Tes yang tidak mengikuti kaidah penulisan butir soal akan tampaksemrawut
sehingga membingungkan siswa. Setiap tes paling sedikit harus diperiksa
melalui analisis validitas permukaan. Walaupun analisis ini tergolong paling
lemah, namun lebih baik daripada tidak ada analisis sama sekali. Tentu saja akan
lebih baik bila suatu tes dianalisis lebih lanjut.
Tingkat validitas isi juga dapat diketahui dengan analisis rasional. Pada
prinsipnya dilakukan pemeriksaan terhadap tiap butir soal, apakah sudah sesuai
dengan TIK atau pokok bahasan yang akan diteskan. Pengujian validitas isi
dilakukan dengan menjawab pertanyaan berikut.
Penyimpangan yang tidak kentara perlu dihilangkan. Semakin banyak soal yang
menyimpang, semakin rendah tingkat validitas isi.
Validitas ini menunjukkan sejauh mana skor tes bersangkutan dapat digunakan
meramal keberhasilan siswa di masa mendatang dalam bidang tertentu. Cara
menghitungnya sama seperti validitas kriteria, dalam hal ini skor tes
dikorelasikan dengan keberhasilan siswa di masa datang. Misalnya antara nilai
UAN (Ujian Akhir Nasional) di SMP, dengan prestasi belajar di SMA dalam
mata pelajaran yang sama.
Suatu tes yang baik biasanya memiliki angka validitas 0,50 atau lebih; tentu saja
angka itu makin tinggi makin baik. Suatu tes dengan angka validitas kurang dari
0,50 belum tentu buruk. Mungkin kriterianya yang buruk atau keliru
menentukan kriteria.
Reliabilitas tes adalah tingkat keajegan (konsistensi) suatu tes, yakni sejauh
mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg/konsisten
(tidak berubah-ubah). Sebaliknya, tes yang tidak reliabel seperti karet untuk
mengukur panjang, hasil pengukuran dengan karet dapat berubah-ubah (tidak
konsisten).
Cara mengetahui reliabilitas tes Ada tiga cara mengetahui reliabilitas tes. Pada
prinsipnya diperoleh dengan menghitung koefisien korelasi antara dua
kelompok skor tes.
Satu tes (yakni tes yang akan dihitung reliabilitasnya), diteskan terhadap
kelompok siswa tertentu dua kali dengan jangka waktu tertentu (misalnya satu
semester atau satu catur wulan). Skor hasil pengetesan pertama dikorelasikan
dengan skor hasil pengetesan kedua. Koefisien korelasi yang diperoleh
menunjukkan koefisien reliabilitas tes tersebut.
Cara ini mengharuskan adanya dua tes yang paralel, yakni dua tes yang disusun
dengan tujuan yang sama (hanya sedikit berbedaan redaksi, isi atau susunan
kalimatnya). Dua tes tersebut diadministrasikan pada satu kelompok siswa
dengan perbedaan waktu beberapa hari saja. Skor dari kedua macam tes tersebut
dikorelasikan dengan teknik yang sama seperti pada metode testretest. Koefisien
korelasi yang diperoleh menunjukkan tingkat reliabilitas tes.
Cara ini paling mudah dan seyogyanya diterapkan oleh para guru pada semua
tes yang diberikan kepada siswanya. Tidak perlu mengulangi pelaksanaan tes
atau menyusun tes yang paralel. Cukup satu tes dan diadministrasikan satu kali
kepada sekelompok siswa (minimal 30 siswa).
Pada saat penyekoran, tes dibelah menjadi dua sehingga tiap siswa memperoleh
dua macam skor, yakni skor yang diperoleh dari soal-soal bernomor ganjil dan
skor dari soal-soal bernomor genap. Skor total diperoleh dengan menjumlah
skor ganjil dan genap. Selanjutnya skor-ganjil dikorelasikan dengan skor-genap,
hasilnya adalah koefisien korelasi rgg, atau koefisien korelasi ganjil-genap.
Karena tes dibelah jadi dua, maka koefisien korelasi ganjil-genap tersebut
dikoreksi sehingga menjadi koefisien reliabilitas. Rumusnya sebagai berikut:
rtt =
Keterangan:
rgg = koefisien korelasi ganjil-genap (separoh tes tes dengan separoh lainnya)
Kriteria:
Baik buruknya tes tergantung pada butir-butir soal yang ada di dalamnya. Oleh
sebab itu untuk mendapatkan tes yang baik perlu dipilih butir-butir yang baik.
Butir yang buruk harus dibuang, yang kurang baik perlu direvisi. Untuk
mengetahui kualitas tiap butir soal perlu analisis satu persatu. Analisis meliputi
perhitungan daya pembeda, tingkat kesukaran, homogenitas tes serta analisis
distraktor/pengecoh pada tes pilihan ganda.
Daya pembeda menunjukkan sejauh mana tiap butir soal mampu membedakan
antara siswa yang menguasai bahan dengan siswa yang tidak menguasai bahan.
Butir soal yang daya pembedanya rendah, tidak ada manfaatnya, malahan dapat
merugikan siswa yang belajar sunguh- sungguh.
Tingkat kesukaran menunjukkan apakah butir soal tergolong sukar, sedang atau
mudah. Tes yang baik memuat kira-kira 25% soal mudah, 50% sedang dan 25%
sukar. Butir soal yang terlalu sukar sehingga hampir tidak terjawab oleh semua
siswa atau terlalu mudah sehingga dapat dijawab oleh hampir semua siswa,
sebaiknya dibuang karena tidak bermanfaat.
Pada tes pilihan ganda, tiap butir soal menggunakan beberapa pengecoh
(distraktor / penyesat / option). Tiap pengecoh hendaknya bermanfaat atau
berfungsi, yakni ada sejumlah siswa yang memilihnya. Pengecoh yang tidak
dipilih sama sekali oleh siswa berarti tidak berfungsi mengecohkan siswa,
sebaliknya pengecoh yang dipilih oleh hampir semua siswa berarti terlalu mirip
dengan jawaban yang benar.
Butir soal tes pilihan ganda jumlahnya cukup besar, biasanya antara 50-100
butir, bahkan ada yang sampai 200 butir dengan ragam soal yang berbedabeda.
Untuk keperluan analisis, lembar jawaban siswa merupakan dokumen utama
yang harus ada. Analisis lengkap meliputi semua hal, sedang analisis singkat
hanya meliputi: reliabilitas belah-dua, daya pembeda atau tingkat kesukaran.
Langkah-langkah analisis butir soal adalah sebagai berikut.
1) Berilah tanda silang pada lembar jawaban, mana butir soal yang dijawab
benar dan mana yang salah. Yang benar diberi skor satu, yang salah diberi nol.
Untuk pemberian nilai, boleh saja jawaban benar diskor 4 dan jawaban salah
didenda 1.
2) Skor tiap lembar jawaban (tiap siswa) dijumlahkan, dengan 3 macam skor:
(1) jumlah skor soal bernomor ganjil, (2) jumlah skor soal bernomor genap, dan
(3) skor total.
1) Berdasar skor total, susunlah nama atau nomor siswa dari tertinggi hingga
terendah. Ambil 27% siswa yang skor-totalnya tinggi atau 27 % Kelompok
Atas, dan 27% yang rendah (Kelompok Bawah).
2) Buatlah tabel, khusus untuk siswa kelompok Atas dan kelompok Bawah.
Jumlah kolom dalam tabel minimal sama dengan jumlah butir soal, sehingga
memuat seluruh jawaban siswa. Tanda 1 artinya jawaban betul dan 0 artinya
jawaban salah. Tabel ini digunakan untuk menghitung daya pembeda maupun
tingkat kesukaran butir soal.
3) Hitung jumlah jawaban yang benar (bertanda 1), baik pada Kelompok
Atas maupun pada Kelompok Bawah. Lihat contoh.
Pada prinsipnya, daya pembeda dihitung berdasar selisih jawaban benar pada
Kelompok Atas dan Kelompok Bawah, dibagi dengan jumlah siswa pada salah
satu kelompok tersebut. Dikalikan 100% agar diperoleh angka bulat (bukan
pecahan, tetapi persen). Masih ada beberapa teknik dan rumus menghitung daya
pembeda, namun cara di atas paling sederhana sehingga cocok untuk para guru.
Tabel skor yang digunakan disini sama dengan tabel skor untuk menghitung
daya pembeda, tetapi menggunakan rumus:
Makin besar harga TK, makin mudah butir soal tersebut, sehingga dapat juga
disebut ‘‘tingkat kemudahan”
Tingkat kesukaran tiap butir soal lebih baik bila dihitung berdasar jawaban
seluruh siswa yang ikut tes (bukan hanya kelompok unggul dan asor yang
berjumlah 54%). Tetapi hal ini sulit dilaksanakan, kecuali menggunakan
komputer.
Butir soal yang homogen, koefisien korelasinya sama atau di atas batas
signifikasi (batas kritis korelasi). Butir soal yang tidak/kurang homogen
koefisien korelasinya negatif atau lebih kecil dari batas signifikansi. Butir soal
tersebut mungkin mengukur aspek lain di luar bahan yang diajarkan (soal tidak
sesuai dengan tujuan pengajaran), maka sebaiknya direvisis atau dibuang.
1. Analisis distraktor/pengecoh.
Pada tes pilihan ganda ada beberapa option/alternatif jawaban yang sengaja
dimasukkan sebagai pengecoh (distraktor).
Pengecoh dianggap baik bila jumlah siswa yang memilih pengecoh itu sama
atau mendekati jumlah ideal.
Catatan: Bila semua siswa menjawab benar pada butir soal tertentu (semua
sesuai kunci), maka IPc = 0 artinya buruk (semua pengecoh tidak berfungsi).
Untuk analisis pengecoh perlu dibuat tabel khusus agar setiap butir soal
diketahui berapa siswa yang menjawab a, berapa yang menjawab b, berapa yang
menjawab c, dan seterusnya. Tentu saja sangat memakan waktu dan tenaga. Bila
diolah dengan komputer dan data sudah dimasukkan dalam disket, pengolahan
ini hanya memerlukan waktu beberapa detik saja.
BAB III
KESIMPULAN
1. Tes merupakan suatu teknik atau cara yang digunakan dalam rangka
melaksanakan kegiatan pengukuran, yang didalamnya terdapat berbagai
pertanyaan, pernyatan atau serangkaian tugas yang harus dikerjakan atau
dijawab oleh peserta didik untuk mengukur aspek perilaku peserta didik.
2. Tes objektif adalah tes yang semua informasi yang diperlukan peserta tes
untuk memberikan respon telah disediakan oleh penyusun tes, sehingga
peserta tes tinggal memilihnya. Tes objektif yang sering digunakan adalah
bentuk pilihan ganda, benar salah, menjodohkan, dan uraian objektif.
3. Secara umum, ada dua macam fungsi yang dimiliki oleh tes, yaitu:
4. Sebagai alat pengukur terhadap peserta didik.
5. Sebagai alat pengukur keberhasilan program pengajaran, sebab melalui tes
tersebut akan dapat diketahui seberapa jauh program pengajaran yang telah
ditentukan, telah dapat dicapai.
1. Sebuah tes yang dapat dikatakan baik sebagai alat pengukur harus
memenuhi persyaratan tes, yaitu memiliki: validitas, reliabilitas, dan
obyektivitas
2. Ada dua unsur penting dalam validitas ini. Pertama, validitas menunjukan
suatu derajat, ada yang sempurna, ada yang sedang dan ada pula yang
rendah. Kedua, validitas selalu dihubungkan dengan suatu putusan atau
tujuan yang spesifik.
3. Objektivitas dimaksud adalah bahan pelajaran yang telah diberikan dan
diperintahkan untuk dipelajari oleh peserta didik itulah yang dijadikan
acuan dalam pembuatan atau penyusunan tes hasil belajar tersebut.
DAFTAR PUSTAKA
Abad, F.J. et al. (2009). “The Multiple-Choice Model Some Solutions for
Estimation of Parametes in The Presence of Omitted Responses”. Sage
Publications. 33, (3), 200-221.
Azwar, Saifuddin. (2012). Tes Prestasi : Fungsi Pengembangan Pengukuran
Prestasi Belajar. Yogyakarta : Pustaka Pelajar Offset.
Kim, Jee, Soen. dan Hanson, B.A. (2002). “Test Equating Under The Multiple
Choice Model”. Sage Publications. 26, (3), 225-270.
Mardapi, Djemari. (2008). Teknik Penyusunan Instrumen Tes dan Non tes.
Yogyakarta : Mitra Cendikia
Scharf, E.M. dan Baldwin, L.P. (2007). “Assessing Multiple Choice Question
(MCQ)Tests – A Mathematical Perspective”. Sage Publications. 8, (1), 31-47.
Schochet, Peter. Z. (2009). “An Approach for Addressing the Multiple Testing
Problem in Social Policy Impact Evaluations”. Sage Publications. 33, (6), 539-
567.
Zimmerman, D.W. dan Williams, R.H. (2009). “A New Look at the Influence
of Guessing on the Reliability of Multiple-Choice Tests”. Sage
Publications. 27, (5), 357-371.
bentuk menjodohkan terdiri atas kumpulan soal dan kumpulan jawaban yang keduanya
dikumpulkan pada dua kolom yang berbeda, yaitu kolom sebelah kiri menunjukkan kumpulan
persoalan, dan kolom sebelah kanan menunjukkan kumpulan jawaban. Jumlah pilihan jawaban
dibuat lebih banyak dari jumlah persoalan.
Bentuk soal menjodohkan sangat baik untuk mengukur kemampuan peserta didik dalam
mengidentifikasi informasi berdasarkan hubungan yang sederhana dan kemampuan
menghubungkan antara dua hal. Semakin banyak hubungan antara premis dengan respon
dibuat, maka semakin baik soal yang disajikan.