(41-55)
Abstract; The purpose of this research was to determine the difference of the item
difficulty levels, the item discrimination powers, and the test reliabilities between the
ordinary multiple choice (OMC) test and the association multiple choice (AMC) test.
The population of the research was the second grade students of SLTPN 15 Bekasi,
consisting 112 respondents. This quasi experimental research had utilized two group,
randominized subjects post-test only design, using two treatments for each respondent,
by giving them the OMC test and the AMC test after three week. The result of this
research showed that the items difficulty levels of the AMC test was higher or the AMC
test was more difficult than the OMC test. The research also indicated that the items
discrimination powers of the AMC test was higher or the AMC test was more effective
to differentiate between the higher ability testee and the lower ability testee than the
items the OMC test. This research also indicated that not different test reliability
between the AMC test and the OMC test.
Keywords: the difficulty level, the discrimination power, the reliability test, the
ordinary multiple choice (OMC), the association multiple choice (AMC).
Abstrak; Penelitian ini bertujuan untuk mengetahui perbedaan tingkat kesukaran, daya
pembeda butir soal dan reliabilitas tes bentuk pilihan ganda biasa (PGB) dan pilihan
ganda asosiasi (PGA). Penelitian ini dilakukan kepada siswa kelas II SLTP 15 Bekasi di
semester 2, yang terdiri dari 112 siswa. Ini adalah penelitian kuasi eksperimen dengan
rancangan dua kelompok subyek diacak dengan hanya pemberian tes akhir. Penelitian
dilakukan dengan cara setiap siswa dikenai dua kali perlakuan yaitu diberikan tes
dengan bentuk pilihan ganda biasa, tiga minggu kemudian diberikan lagi tes dengan
bentuk pilihan ganda asosiasi. Hasil penelitian menunjukkan bahwa butir soal tes
bentuk pilihan ganda asosiasi memiliki tingkat kesukaran lebih tinggi atau bentuk
pilihan ganda asosiasi lebih sukar daripada tes bentuk pilihan ganda biasa. Penelitian ini
juga menyimpulkan bahwa butir soal tes bentuk pilihan ganda asosiasi memiliki daya
pembeda lebih tinggi atau tes bentuk pilihan ganda asosiasi lebih mampu membedakan
peserta tes yang berkemampuan tinggi dan yang berkemampuan rendah daripada tes
bentuk pilihan ganda biasa. Disimpulkan juga bahwa tidak ada perbedaan reliabilitas tes
antara tes bentuk pilihan ganda asosiasi dan tes bentuk pilihan ganda biasa.
Kata-kata kunci: tingkat kesukaran, daya pembeda, reliabilitas tes, tes bentuk Pilihan
ganda biasa (PGB), tes bentuk pilihan ganda asosiasi (PGA).
1
SOSIO e-KONS Vol.6 No.1 2014 Nani Hanifah, Perbandingan tingkat ...(41-55)
dengan benar, makin sukar soal itu. perbedaan persentase dari 27 % siswa
Dengan demikian soal yang dijawab yang mendapat nilai tinggi (kelompok
benar oleh 85 % siswa, dinyatakan atas) dan 27 % siswa yang mendapat nilai
mempunyai tingkat kesukaran 0,85, rendah (kelompok bawah). Soal yang
tentunya soal ini lebih mudah dari soal mempunyai indeks daya pembeda antara
yang mempunyai tingkat kesukaran 20 % 0,15 sampai 0,20 atau lebih tinggi
(0,20). menunjukkan daya pembeda yang baik.
Berdasarkan pendapat-pendapat
Daya Pembeda Soal (Discrimination yang telah dikemukakan di atas, daya
Power) pembeda soal adalah kemampuan soal
Dali S. Naga (2002:67) untuk membedakan kelompok peserta tes
mengatakan bahwa daya pembeda soal berkemampuan tinggi dan kelompok
adalah kemampuan soal dengan skornya peserta tes yang berkemampuan rendah.
dapat membedakan peserta tes dari Nilai daya pembeda dinyatakan melalui
kelompok tinggi dan kelompok rendah. indeks daya pembeda. Makin tinggi atau
Dengan kata lain makin tinggi daya makin besar indeks daya pembeda soal,
pembeda soal makin banyak peserta dari makin besar soal tersebut dapat
kelompok tinggi yang dapat menjawab membedakan antara kelompok tinggi dan
soal dengan benar dan makin sedikit kelompok rendah. Untuk menghitung
peserta tes dari kelompok rendah yang daya pembeda soal mengambil dari 27 %
dapat menjawab soal dengan benar. Agar kelompok tinggi dan 27 % dari kelompok
dapat diterima maka nilai D rendah. Nilai indeks daya pembeda soal
(discrimination: daya pembeda soal) berkisar antara –1 sampai +1. Jika siswa
adalah 0,30 atau lebih. Sedangkan untuk kelompok tinggi dapat menjawab soal
dapat dinyatakan cukup memuaskan dengan benar lebih besar dari siswa
adalah 0,40 ke atas. kelompok rendah maka indeks daya
Menurut Charles D. Hopkins dan pembeda positif. Jika siswa kelompok
Richard L. Antes (1999:159), indeks tinggi dan rendah sama-sama dapat
daya pembeda soal mengukur bagaimana menjawab soal dengan benar maka soal
baiknya sebuah soal membedakan tingkat tersebut mempunyai daya pembeda nol.
kemampuan siswa. Indeks daya pembeda Jika siswa kelompok rendah dapat
soal bernilai – 1,00 sampai +1,00. Makin menjwab soal dengan benar lebih besar
tinggi nilai D sebuah soal, makin baik dari kelompok tinggi maka soal tersebut
soal tersebut membedakan siswa yang mempunyai daya pembeda negatif. Soal
berkemampuan tinggi dari siswa yang yang mempunyai indeks daya pembeda
berkemampuan rendah. Soal yang negatif dan nol, dibuang karena soal
mempunyai nilai D = 0,40 dianggap tersebut tidak dapat membedakan siswa
sangat efektif dalam membedakan siswa yang mempunyai kemampuan tinggi dan
yang berkemampuan tinggi dan rendah.
berkemampuan rendah. Soal yang
mempunyai nilai D antara 0,20 sampai Reliabilitas Tes
0,39 dianggap memuaskan. Soal yang Nama lain dari reliabilitas adalah
mempunyai nilai D lebih rendah dari 0,39 ketetapan, kepercayaan, kemantapan,
harus diperbaiki. keterandalan, keajegan atau kestabilan.
Sedangkan fernandes (2004:27) Sedangkan yang dimaksud dengan
mengatakan bahwa daya pembeda soal reliabilitas tes adalah sebagai berikut:
adalah kemampuan memisahkan siswa menurut Anne Anastasi dan Susan
pandai dan siswa kurang. Sedangkan Urbina (2007:63), reliabilitas tes adalah
indeks daya pembeda soal adalah kestabilan skor yang diperoleh dari orang
8
SOSIO e-KONS Vol.6 No.1 2014 Nani Hanifah, Perbandingan tingkat ...(41-55)
9
SOSIO e-KONS Vol.6 No.1 2014 Nani Hanifah, Perbandingan tingkat ...(41-55)
yang sama ketika diuji ulang dengan tes Hasil penelitian yang dilakukan
yang sama pada situasi yang berbeda. oleh Yahya Umar (2010:80),
Suatu tes dikatakan reliabel jika hasil tes menunjukkan bahwa soal bentuk pilihan
sama pada seseorang walaupun telah ganda (biasa dan asosiasi) cukup efektif
diadakan pengetesan ulang pada waktu untuk mengungkapkan pengetahuan
yang berbeda. tentang proses pada bidang sosiologi dan
T. Raka Joni (2006:36) efektif mengungkapkan kemampuan
mengatakan bahwa suatu tes dikatakan analisis dan penilaian hubungan kausal
reliabel sebuah tes adalah ketetapan hasil pada mata pelajaran Fisika.
tes. Sebuah reliabilitas tes memberi nilai Hasil penelitian yang dilakukan
yang sama kepada individu yang sama oleh Sudjarwadi (2009:101),
pada setiap hasil tes. menunjukkan bahwa soal bentuk pilihan
Sedangkan Syaifuddin Azwar ganda kompleks (asosiasi) memberikan
(2006:180) mengatakan bahwa istilah tingkat kesukaran, daya pembeda dan
reliabilitas sering disamakan dengan reliabilitas yang tinggi dibandingkan
consistency, stability, yang pada dengan soal pilihan ganda biasa pada
prinsipnya menunjukkan sejauh mana mata pelajaran Kimia.
pengukuran itu dapat memberikan hasil Hasil penelitian yang dilakukan
yang relatif tidak berbeda jika dilakukan oleh Maria Ulfa (2008:130),
pengukuran kembali terhadap subyek menunjukkan bahwa soal bentuk pilihan
yang sama. ganda asosiasi mempunyai tingkat
Crocker dan Algina (1996:6) kesulitan yang lebih tinggi dari pada soal
menyebutkan bahwa tinggi rendahnya pilihan ganda biasa dan soal benar salah
koefisien reliabilitas dipengaruhi oleh pada mata pelajaran Agama.
beberapa faktor antara lain: (1) panjang Hasil penelitian yang dilakukan
tes, (2) kecepatan (batas waktu) oleh A.D. Hehahia (2007:90),
mengerjakan tes, (3) homogenitas menunjukkan bahwa terdapat pengaruh
kelompok, (4) kesukaran butir soal. banyaknya alternatif soal bentuk pilihan
Menurut Dali S. Naga (2008:50), ganda (biasa dan asosiasi) terhadap
cara menghitung reliabilitas yaitu: (1) reliabilitas, tingkat kesukaran, daya
reliabilitas stabilitas (uji-ulang uji), (2) pembeda butir soal.
reliabilitas ekivalensi (uji-uji setara), (3)
reliabilitas konsistensi internal (pilah METODOLOGI PENELITIAN
paro: Spearman Brown, politomi: Variabel bebas dalam penelitian
1,2,3,4,5: Alpha Cronbach, dan dikotomi: ini adalah bentuk soal tes yang terdiri
0-1: Kuder-Richardson). dari: 1) bentuk soal pilihan ganda biasa,
Berdasarkan teori-teori yang telah 2) bentuk soal pilihan ganda asosiasi.
dikemukan di atas, dapat disimpulkan Sedangkan variabel terikatnya adalah: 1)
bahwa reliabilitas suatu tes adalah tingkat kesukaran butir soal, 2) daya
keajegan suatu tes. Tes dikatakan reliabel pembeda butir soal, 3) reliabilitas tes.
apabila menunjukkan hasil yang sama Penelitian dilaksanakan di SMPN
walaupun dilakukan tes berulang ulang. 15 Bekasi pada mata pelajaran ekonomi.
Reliabilitas dinyatakan dengan angka dan Populasi penelitian adalah siswa kelas II
dikenal sebagai koefisiensi reliabilitas. sebanyak 320 orang. Untuk mengambil
Makin tinggi koefisien reliabilitas sebuah sampel penelitian menggunakan teknik
tes makin tinggi pula reliabilitas tes Stratified Proporsional Random
tersebut. Sampilng sehingga didapat sampel
penelitian sebanyak 112 orang.
Kajian Penelitian Yang Relevan
10
SOSIO e-KONS Vol.6 No.1 2014 Nani Hanifah, Perbandingan tingkat ...(41-55)
11
SOSIO e-KONS Vol.6 No.1 2014 Nani Hanifah, Perbandingan tingkat ...(41-55)
12
4. Pengujian Persyaratan Analisis
a. Pengujian Normalitas
Pengujian normalitas data tingkat kesukaran, daya pembeda butir soal dan
reliabilitas tes dilakukan dengan menggunakan uji-L. Ringkasan hasil uji normalitas pada
tabel sebagai berikut:
5. Pengujian Homogenitas
Pengujian homogenitas data tingkat kesukaran, daya pembeda butir soal dan
reliabilitas tes dilakukan dengan menggunakan uji-F. Ringkasan hasil uji homogenitas
pada tabel sebagai berikut:
Tabel 8. Hasil Uji Homogenitas
Kesimpulan
Variabel N Fhitung Ftabel α=0,05
H0 Distribusi
Tingkat 36 1,0158 1,76 Diterima Homogen
Kesukaran
Daya 36 1,6667 1,76 Diterima Homogen
pembeda
Reliabilitas 7 1,5469 4,21 Diterima Homogen
6. Pengujian Hipotesis
Pengujian hipotesis data tingkat kesukaran, daya pembeda butir soal dan
reliabilitas tes dilakukan dengan menggunakan uji-t. Ringkasan hasil uji hipotesis
pada tabel sebagai berikut:
b. Pembahasan
Dari deskripsi data hasil bahwa koefisien reliabilitas tes bentuk
penelitian menunjukkan bahwa tingkat pilihan ganda biasa sebesar 0,6630
kesukaran terkecil (soal paling sukar) sedangkan koefisien reliabilitas tes
pada tes bentuk pilihan ganda asosiasi bentuk pilihan ganda asosiasi sebesar
(0,244) dibandingkan dengan tes bentuk 0,6844. Hal ini menunjukkan bahwa
pilihan ganda biasa (0,327). Sedangkan reliabilitas tes bentuk pilihan ganda
tingkat kesukaran terbesar (soal paling asosiasi tidak lebih tinggi dari tes bentuk
mudah) pada tes bentuk pilihan ganda pilihan ganda biasa atau tidak
asosiasi (0,789) dibandingkan dengan tes menunjukkan perbedaan yang berarti,
bentuk pilihan ganda biasa (0,848). Pada hasilnya hampir sama.
kriteria tingkat kesukaran soal, makin Hasil pengujian normalitas data
kecil angka yang diperoleh maka makin tingkat kesukaran butir soal
sulit soal itu. Hal ini menunjukkan menunjukkan bahwa Lhitung = 0,1353
bahwa tes bentuk pilihan ganda asosiasi lebih kecil dari Ltabel = 0,1477 (Lhitung <
lebih sukar dibandingkan dengan tes
Ltabel α = 0,05) pada butir soal tes bentuk
bentuk pilihan ganda biasa.
Dari deskripsi data hasil pilihan ganda biasa, berarti H0 diterima
penelitian daya pembeda butir soal menunjukkan bahwa sampel penelitian
menunjukkan pada tes bentuk pilihan berasal dari kelompok populasi yang
ganda asosiasi, butir soal amat baik: 3 = berdistribusi normal.
8,33 %, baik: 25 = 69,44 %, cukup: 8 = Hasil pengujian normalitas data
22,23 % dan jelek: 0 %, dibandingkan tingkat kesukaran butir soal,
pada tes bentuk pilihan ganda biasa, butir menunjukkan bahwa Lhitung = 0,1118
soal amat baik: 0 %, baik: 0 %, cukup: 35 lebih kecil dari Ltabel = 0,1477 (Lhitung <
= 97,22 %, jelek: 1 = 2,78 %. Hal ini Ltabel α = 0,05) pada butir soal tes bentuk
menunjukkan bahwa tes bentuk pilihan pilihan ganda asosiasi, berarti H0
ganda asosiasi mempunyai daya pembeda diterima menunjukkan bahwa sampel
lebih baik daripada tes bentuk pilihan penelitian berasal dari kelompok populasi
ganda biasa, dengan kata lain tes bentuk yang berdistribusi normal.
pilihan ganda asosiasi lebih mampu Hasil pengujian normalitas data
membedakan siswa yang berkemampuan daya pembeda butir soal, menunjukkan
tinggi dan siswa bekemampuan rendah. bahwa Lhitung = 0,1366 lebih kecil dari
Dari deskripsi data hasil Ltabel = 0,1477 (Lhitung < Ltabel α = 0,05)
penelitian reliabilitas tes menunjukkan pada butir soal tes bentuk pilihan ganda
biasa, berarti H0 diterima
menunjukkan
bahwa sampel penelitian berasal dari diterima, menunjukkan bahwa sampel
kelompok populasi yang berdistribusi penelitian berasal dari kelompok populasi
normal. yang homogen.
Hasil pengujian normalitas data Hasil pengujian hipotesis pertama
tingkat kesukaran butir soal, menunjukkan bahwa thitung = 2,8435 lebih
menunjukkan bahwa Lhitung = 0,0779 besar dari ttabel α 0,05 = 1,667 (thitung >
lebih kecil dari Ltabel = 0,1477 (Lhitung < ttabel) berarti H0 ditolak. H1 diterima.
Ltabel α = 0,05) pada butir soal tes bentuk Dengan demikian hipotesis pertama
pilihan ganda asosiasi, berarti H0 diterima yaitu butir soal bentuk pilihan
diterima menunjukkan bahwa sampel ganda asosiasi mempunyai tingkat
penelitian berasal dari kelompok populasi kesukaran yang lebih tinggi daripada
yang berdistribusi normal. butir soal pilihan ganda biasa, keduanya
Hasil pengujian normalitas data dari kisi-kisi soal yang sama.
reliabilitas tes, menunjukkan bahwa Hasil pengujian hipotesis kedua
Lhitung = 0,1165 lebih kecil dari Ltabel = menunjukkan bahwa thitung = 11,866 lebih
0,3000 (Lhitung < Ltabel α = 0,05) butir soal besar dari ttabel α 0,05 = 1,667 (thitung >
tes bentuk pilihan ganda biasa berarti H0 ttabel) berarti H0 ditolak. H1 diterima.
diterima menunjukkan bahwa sampel Dengan demikian hipotesis kedua
penelitian berasal dari kelompok populasi diterima yaitu butir soal bentuk pilihan
yang berdistribusi normal. ganda asosiasi mempunyai daya pembeda
Hasil pengujian normalitas data yang lebih tinggi daripada butir soal
reliabilitas tes, menunjukkan bahwa pilihan ganda biasa. Berarti butir soal
Lhitung = 0,2358 lebih kecil dari Ltabel = pilihan ganda asosiasi lebih mampu
0,3000 (Lhitung < Ltabel α = 0,05) butir soal membedakan antara peserta tes yang
tes bentuk pilihan ganda asosiasi, berarti berkemampuan tinggi dan peserta tes
H0 diterima menunjukkan bahwa sampel yang berkemampuan rendah. keduanya
penelitian berasal dari kelompok populasi dari kisi-kisi soal yang sama.
yang berdistribusi normal. Hipotesis penelitian ketiga
Hasil pengujian homogenitas data mengatakan bahwa diduga tes bentuk
tingkat kesukaran butir soal pilihan ganda asosiasi mempunyai
menunjukkan Lhitung = 1,0158 lebih kecil reliabilitas tes yang lebih tinggi daripada
dari Ltabel = 1,7600 (Lhitung < Ltabel α = tes bentuk pilihan ganda biasa. Dari hasil
0,05), berarti H0 diterima, menunjukkan pengujian hipotesis ketiga menunjukkan
bahwa sampel penelitian berasal dari bahwa thitung = 0,3133 lebih besar dari
kelompok populasi yang homogen. ttabel = α 0,05 = 1,782 (thitung < ttabel)
Hasil pengujian homogenitas data berarti H0 diterima. H1 ditolak. Dengan
daya pembeda butir soal menunjukkan demikian hipotesis penelitian ketiga
Lhitung = 1,6667 lebih kecil dari Ltabel = ditolak, yaitu reliabilitas tes bentuk
1,7600 (Lhitung < Ltabel α = 0,05), berarti pilihan ganda asosiasi tidak lebih tinggi
H0 diterima, menunjukkan bahwa sampel dari tes bentuk pilihan ganda biasa
penelitian berasal dari kelompok populasi karena reliabilitas tes bentuk pilihan
yang homogen. ganda asosiasi (0,6844) tidak mempunyai
Hasil pengujian homogenitas data perbedaan yang berarti, tidak jauh
reliabilitas tes, menunjukkan Lhitung = berbeda atau hampir sama dengan tes
1,5469 lebih kecil dari Ltabel = 4,210 bentuk pilihan ganda biasa (0,6630).
(Lhitung < Ltabel α = 0,05), berarti H0 keduanya dari kisi-kisi soal yang sama.
SIMPULAN DAN SARAN DAFTAR PUSTAKA
Kesimpulan Anastasi, Anne dan Susan Urbina. Tes
Berdasarkan hasil penelitian Psikologi. Jakarta: Prenhallindo,
dan pembahasan maka disimpulkan 2007.
sebagai berikut: Arikunto, Suharsimi. Dasar-dasar
1. Butir soal tes bentuk pilihan ganda Evaluasi Pendidikan. Jakarta:
asosiasi mempunyai tingkat Bumi Aksara, 2009.
kesukaran yang lebih tinggi daripada Azwar, Saifuddin. Tes Prestasi.
butir soal bentuk pilihan ganda biasa. Yogyakarta: Pustaka Pelajar,
2. Butir soal tes bentuk pilihan ganda 2006..
asosiasi mempunyai daya pembeda Azwar, Saifuddin.
yang lebih tinggi daripada butir soal
bentuk pilihan ganda biasa. Reliabilitas, Validitas,
3. Reliabilitas tes bentuk pilihan ganda Interpretasi dan Komputasi.
asosiasi tidak mempunyai perbedaan Yogyakarta:
yang berarti, tidak jauh berbeda atau Liberty, 2006.
hampir sama dengan reliabilitas tes Depdikbud. Pedoman Penulisan Soal
bentuk pilihan ganda biasa. Hasil Belajar IPS. Jakarta:
Balitbang, Sisjian, 2007.
Saran Depdiknas. Pedoman Penulisan Soal
Berdasarkan kesimpulan yang Bentuk Pilihan Ganda IPS
telah dikemukakan maka SMP. Jakarta: Dinas Pendas,
disarankan: 2004.
1. Siswa SMP dan SMA hendaknya Blood, Don F. dan Budd William.
sering dilatih untuk mengerjakan Educational Measurement and
soal bentuk pilihan ganda asosiasi Evaluation. New York: Harper
agar terbiasa dan tidak asing lagi and Row, 2002.
sehingga dapat dengan mudah Crocker, L dan J. Algina. Introduction to
mengerjakan soal bentuk pilihan Classical and Modern Test
ganda asosiasi pada seleksi masuk Theory. New York: Holt,
perguruan tinggi negeri negeri. Rinehart and Winston Inc, 1996.
2. Dalam penyelenggaraan tes prestasi Crombach, Lee J. Essential Of
belajar mulai dari tes formatif Psychologycal Testing. New
sampai tes sumatif termasuk Ujian York: Harper & Row, 2004.
Nasional (UN)/Ujian Sekolah (US) Fernandes, H.J.X. Testing and
hendaknya diikutsertakan soal Measurement. Jakarta:
bentuk pilihan ganda asosiasi Depdikbud, 2004.
bersama soal bentuk lain agar soal Gronlund, Norman E. Contruction
tes atau ujian lebih bervariasi. Achievement Test. Englewood
3. Perlu menambah jumlah soal bentuk Chiffs: Prentise-Hall, 2002.
pilihan ganda asosiasi yang lebih Hehahia, A.D. Pengaruh Jumlah
banyak di bank soal. Untuk Alternatif Tes Obyektif Bentuk
memperoleh butir soal yang bermutu Pilihan Ganda Terhadap
hendaknya melalui uji coba yang Reliabilitas, TingkkatKesukaran
terus menerus sampai menemukan dan Daya Pembeda. Tesis.
butir soal yang memenuhi syarat. Jakarta: PPsUNJ, 2007.
Hopkins, Charles D dan Antes, Richard
L.Classroom Measurement and
Evaluation. Illionis, F.E.
Peacock, 1999.
SOSIO e-KONS Vol.6 No.1 2014 Nani Hanifah, Perbandingan tingkat ...(41-55)
19