Anda di halaman 1dari 15

ANALISIS BUTIR SOAL ULANGAN UMUM

MATA PELAJARAN FIQIH MADRASAH IBTIDAIYAH


KELAS IV (STUDI KASUS DI MADRASAH IBTIDAIYAH
WAHID HASYIM)
Adhi Setyawan
Pelem Lor, Baturetno, Banguntapan, Bantul
Email : adhi_iwan@yahoo.com

p
ABSTRACT
Teachers used test to measure the competence and effectiveness of
instructional programs. Test must be tested in quality empirically. The item still
must be tested by trial, and result of this test obtained evidence about quality of
item test. By doing the examination hence a test can be applied in evaluating.
Repairs, omission or thing required in evaluating. At this article brief analysis to
ulangan umum fiqih at Madrasah Ibtidaiyah class IV. With examinee 20 students.
Test analysis applies program ITEMAN version 3.00. ITEMAN represents of the
Classiccal Test Theory. Based on analysis item, the test need to revise. The test is
midlle difficulty because mean P is 0.570.
Keyword: Item Analysis, ITEMAN
I. Pendahuluan
Standar penilaian pendidikan 1 adalah standar nasional pendidikan
yang berkaitan dengan mekanisme, prosedur, dan instrumen penilaian
hasil belajar peserta didik. Sedangkan difinisi penilaian pendidikan itu
sendiri adalah proses pengumpulan dan pengolahan informasi untuk
menentukan pencapaian hasil belajar peserta didik.
Penilaian pendidikan yang ada dalam pendidikan Indonesia
berdasarkan lampiran peraturan menteri pendidikan nasional nomor 20
tahun 2007 tanggal 11 juni 2007 meliputi :
1. Ulangan adalah proses yang dilakukan untuk mengukur pencapaian
kompetensi peserta didik secara berkelanjutan dalam proses

Salinan lampiran peraturan menteri pendidikan nasional nomor 20 tahun


2007 tanggal 11 juni 2007 standar penilaian pendidikan
1

83

pembelajaran, untuk memantau kemajuan, melakukan perbaikan


pembelajaran, dan menentukan keberhasilan belajar peserta didik.
2. Ulangan harian adalah kegiatan yang dilakukan secara periodik untuk
mengukur pencapaian kompetensi peserta didik setelah menyelesaikan
satu Kompetensi Dasar (KD) atau lebih.
3. Ulangan tengah semester adalah kegiatan yang dilakukan oleh
pendidik. untuk mengukur pencapaian kompetensi peserta didik
setelah melaksanakan 8 9 minggu kegiatan pembelajaran. Cakupan
ulangan meliputi seluruh indikator yang merepresentasikan seluruh
KD pada periode tersebut.
4. Ulangan akhir semester adalah kegiatan yang dilakukan oleh pendidik
untuk mengukur pencapaian kompetensi peserta didik di akhir
semester. Cakupan ulangan meliputi seluruh indikator yang
merepresentasikan semua KD pada semester tersebut.
5. Ulangan kenaikan kelas adalah kegiatan yang dilakukan oleh pendidik
di akhir semester genap untuk mengukur pencapaian kompetensi
peserta didik di akhir semester genap pada satuan pendidikan yang
menggunakan sistem paket. Cakupan ulangan meliputi seluruh
indikator yang merepresentasikan KD pada semester tersebut.
6. Ujian sekolah/madrasah adalah kegiatan pengukuran pencapaian
kompetensi peserta didik yang dilakukan oleh satuan pendidikan
untuk memperoleh pengakuan atas prestasi belajar dan merupakan
salah satu persyaratan kelulusan dari satuan pendidikan. Mata
pelajaran yang diujikan adalah mata pelajaran kelompok mata
pelajaran ilmu pengetahuan dan teknologi yang tidak diujikan dalam
ujian nasional dan aspek kognitif dan/atau psikomotorik kelompok
mata pelajaran agama dan akhlak mulia serta kelompok mata pelajaran
kewarganegaraan dan kepribadian yang akan diatur dalam POS Ujian
Sekolah/Madrasah
Penilaian pendidikan pada jenjang pendidikan dasar dan menengah
terdiri atas: 1). Penilaian hasil belajar oleh pendidik; 2). Penilaian hasil
belajar oleh satuan pendidikan; dan 3). Penilaian hasil belajar oleh
Pemerintah. Sedangkan penilaian pendidikan pada jenjang pendidikan
tinggi terdiri atas: 1). Penilaian hasil belajar oleh pendidik; dan 2). Penilaian
hasil belajar oleh satuan pendidikan tinggi.
Terdapat standar pendidik dan kependidikan untuk dapat
dikatakan menjadi guru yang professional. Standar Pendidik dan Tenaga
Kependidikan2 adalah kriteria pendidikan prajabatan dan kelayakan fisik
maupun mental, serta pendidikan dalam jabatan. Pendidik adalah tenaga
kependidikan yang berkualifikasi sebagai guru, dosen, konselor, pamong
2

84

Undang-undang nomor 20, Pasal 13, dan PP 19, Pasal 1, ayat 7

belajar, widyaiswara, tutor, instruktur, fasilitator dan sebutan lain yang


sesuai
dengan
kekhususannya,
serta
berpartisipasi
dalam
menyelenggarakan pendidikan. Salah satu kemampuan guru yang
professional adalah guru yang mampu mengevaluasi peserta didiknya
dengan tepat dan benar. Evaluasi ini tentunya melalui pengukuran dan
pengujian.
Berdasarkan latar belakang tersebut, maka artikel ini disusun.
Analisis soal tes ulangan umum mata pelajaran Fiqih semester I kelas IV
tahun pelajaran 2008/2009 di Madrasah Ibtidaiyah Wahid Hasyim
Kabupaten Sleman. Tes yang dianalisa berbentuk tes pilihan ganda pada
soal ulangan umum semester.
II. Analisis Butir Soal
Fungsi ukur tes akan optimal terlihat jelas apabila tes tersebut
mampu memberikan data yang valid dan reliabel dalam mengukur.
Validitas didefinisikan sebagai ukuran seberapa cermat suatu instrument
melakukan fungsi ukurnya3 sedangkan reliable prinsipnya adalah
menunjukkan sejauhmana pengukuran itu dapat memberikan hasil yang
relative tidak berbeda bila dilakukan pengukuran kembali pada subyek
yang berbeda4.
Secara garis besar ada dua cara menganalisis soal. Pertama,
menganalisis soal secara teoritik atau kualitatif dan Kedua, analisis soal
secara empiris atau analisis secara kuantitatif. Analisis soal secara kualitatif
dapat dilakukan sebelum diujicoba, yaitu dengan cara mencermati
kesesuaian butir yang mencerminkan kemampuan dasar dengan indikator
yang diukur.
Terdapat dua cara dalam melakukan analisa secara kuantitatif yaitu
cara klasik dan cara modern. Butir-butir soal masih harus diuji dengan
menggunakan data melalui ujicoba, sehingga hasil tes ini diperoleh bukti
mengenai kualitas butir tes. Pengujian ini dapat mencegah terjadinya
kesalahan dalam pengukuran. Siswa yang seharusnya memenuhi standar
kelulusan tapi karena soal yang jelek maka haknya untuk lulus menjadi
batal. Selain itu koleksi soal-soal berkualitas dan teruji akan membantu
guru dalam menentukan keputusan secara efisien dan efektif.
Program iteman dengan pendekatan klasik digunakan untuk
menentukan kualitas butir soal berdasakan data empirik hasil uji coba.
Hasil dan analisis butir soal mencakup informasi mengenai tingkat

Djemari Mardapi, Pengembangan Instrumen Penelitian Pendidikan,


(2005), hal 18
4 Djemari Mardapi, Pengembangan Instrumen Penelitian Pendidikan,
(2005), hal 47
3

85

kesukaran soal, daya pembeda soal, dan statistik sebaran jawaban


(pengecoh dan kunci) setiap butir. Selain itu juga menghasilkan statistik tes
yang meliputi reliabilitas tes, standart error dan distribusi skor. Hasil
analisis program ITEMAN berupa file statistik yang terdiri dari statistik
butir soal dan statistik tes/skala dan skor yang diperoleh tiap-tiap peserta
tes.
Secara umum analisa butir soal menggunakan iteman adalah sebagai
berikut:
Scale Statistics
---------------N of Items
30
N of Examinees
20
Mean
17.100
Variance
10.890
Std. Dev.
3.300
Skew
0.379
Kurtosis
0.987
Minimum
11.000
Maximum
26.000
Median
17.000
Alpha
0.503
SEM
2.328
Mean P
0.570
Mean Item-Tot.
0.246
Mean Biserial
0.315
Keterangan:
N of Items: Jumlah butir soal dalam tes yang dianalisis sejumlah 30
butir soal
N of Examines: Jumlah peserta tes adalah 20 siswa
Mean: Skor rata-rata peserta tes adalah 17.100
Variance: Varian sebesar 10.890
Std. Deviasi yaitu 1.195, simpangan baku dari hasil ujian
Skew: menunjukkan kemiringan distribusi skor peserta tes yang
memberikan gambaran tentang bentuk distribusi skor peserta tes, yakni
sebesar 0.379
Kurtosis: besaran kurtosis yaitu 0.987, digunakan untuk mengukur
distribusi data.
Minimum: Skor terendah adalah 11.000
Maximum: Skor tertinggi 26.000
Median: Skor tengah adalah 17.000
Apha: 0.503 menunjukkan reliabilitas soal 50,3 % ini menunjukkan
rekomendasi bahwa soal harus diperbaiki.

86

SEM (Standart Error Measurement): kesalahan pengukuran untuk


setiap tes skala, yaitu sebesar 2.328
Mean P: Rerata tingkat kesukaran adalah 0.570. Rata-rata tingkat
kesukaran soal berkategori sedang karena diantara range 0,31 0,70
Mean Item-Tot: Rerata indeks daya pembeda (koef point biserial) yaitu
sebesar 0.246
Mean biserial: Rerata indek daya pembeda (koef. Biserial) yaitu 0.315
Korelasi biserial daya pembeda masih kecil itu sebabnya disarankan
soal (butir jawaban) perlu direvisi. Sebaiknya 0,40 1,00
Tabel 1. Hasil Analisis Butir Soal Mata Pelajaran Fiqih.
No
Soal
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.

Tingkat Kesukaran

Daya Beda

Sedang
Sedang
Sedang
Sedang
Mudah
Sedang
Sukar
Sedang
Mudah
Mudah
Mudah
Sedang
Mudah
Sedang
Sedang
Sedang
Sedang
Sedang
Mudah
Sedang
Sedang
Mudah
Sedang
Sedang
Sedang
Sedang

Tidak baik
Baik
Tidak baik
Sedang
Baik
Baik
Sedang
Perlu revisi
Tidak baik
Tidak baik
Tidak baik
Perlu revisi
Tidak baik
Tidak baik
Sedang
Sedang
Baik
Perlu revisi
Baik
Sedang
Baik
Tidak baik
Baik
Perlu revisi
Sedang
Perlu revisi

87

27.
28.
29.
30.

Sukar
Sedang
Sedang
Mudah

Tidak baik
Tidak baik
Baik
Tidak baik

1 . Tingkat kesukaran
Tingkat kesukaran (difficult level) (P) pada analisis butir soal secara
klasik merupakan skala rata-rata peserta tes yang menjawab benar suatu
butir soal. Untuk mengetahui tingkat kesukaran soal dapat diperoleh
dengan beberapa cara: (1) skala kesukaran linier, (2) skala biserial (3) skala
davis dan (4) skala menjawab benar. Dalam analisis skala yang digunakan
adalah proporsi menjawab benar. Adapun besaran tingkat kesukaran
berkisar 0 sampai dengan 1. Menurut Bahrul Hayat tingkat kesukaran
suatu butir soal dapat dikategorikan menjadi tiga yaitu:
Tabel 2. Tingkat Kesukaran

Pendapat ini sejalan dengan Allen dan Yen bahwa indeks kesukaran
yang sedang berkisar antara 0,30 sampai dengan 0,70. Berdasarkan
Sumarna Surapranata soal yang diterima5 adalah soal yang terletak pada
rentang tingkat kesukaran 0,30 sampai dengan 0,7. Hal ini dilakukan
mengingat tingkat kesukaran antara 0,30 sampai dengan 0,7 merupakan
soal yang homogen dan dapat menghasilkan penyebaran skor yang luas.
Berdasarkan hasil analisis iteman dan merujuk pada tabel 2 Tingkat
Kesukaran di atas diperoleh hasil sebagai berikut :
No Kategori
Butir soal
1
Mudah
5, 9, 10, 11, 13, 19, 22, 30
2
Sedang
1,2,3,4,6,8,12, 14,15,16,17,18,20,21,23,24,25,26,28,29
3
Sukar
7, 27

Sumarna Surapranata (2004: 47), Analisis, validitas, Reliabiitas dan


Interpretasi Hasil Tes. Rosda Karya. Bandung
5

88

Dari analisa tingkat kesukaran tersebut dua soal yang tergolong


sukar adalah
soal no 7

soal no 27
27. Yang termasuk puasa wajib adalah .

2. Daya Beda
Daya beda soal merupakan kemampuan suatu soal yang dengan
skornya dapat membedakan antara siswa dan kelompok tinggi (prestasi
tinggi) dengan siswa dan kelompok rendah (kurang pandai). Makin tinggi
daya beda butir makin banyak peserta dan kelompok tinggi yang dapat
menjawab butir dengan benar serta makin sedikit peserta dan kelompok
rendah yang dapat menjawabnya dengan benar.
Daya beda butir soal yang biasa digunakan dalam tes hasil belajar
adalah dengan cara menggunakan indeks korelasi antara skor butir dengan
skor totalnya. Daya beda dengan cara ini disebut juga validitas internal,
karena korelasi diperoleh dan dalam tes itu sendini. Daya pembeda soal
dapat dihihat dan besarnya koefisien korelasi biserial maupun koefisien
point bisenial. Nilai korelasi point biserial selalu lebih rendah
dibandingkan dengan nilai korelasi biserial. Hal mi masih dipengaruhi
oleh tingkat kesukaran soal.
Koefisien daya beda bergerak dan -1 sampai +1. Daya beda butir
instrument lebih dari 0,30 yaitu korelasi antara skor butir dengan skor total
maka butir tersebut tergolong baik6. Soal yang memiliki validitas soal
diatas 0,30 merupakan soal yang baik sebagaimana dikemukakan. Daya
pembeda di atas 0,30 merupakan soal yang termasuk dapat membedakan

Djemari Mardapi, Pengembangan Instrumen Penelitian Pendidikan,


(2005), hal 78
6

89

kelompok berkemampuan tinggi dengan kelompok yang berkemampuan


rendah.7

No
1
2
3
4.

Tabel 3. Daya Beda Soal


Kategori
Butir soal
Baik
2, 5, 6, 17, 19, 21, 23, 29
Soal sedang dapat diterima
4, 7, 15, 16, 20, 25
Soal perlu revisi
8, 12, 18, 24, 26
Soal tidak baik
1,3,9,10,11,13,14,22,27,28,30

Berikut soal-soal yang perlu direvisi


Soal no 8

Soal no 12
12. Perhitungan untuk menentukan Bulan Ramadhan dengan ilmu
a. Matematika
c. Falak/ hisab
b. Astronomi
d. Geografi
Soal no 18
18. Amalan-amalan di bulan Ramadhan diantaranya
a. Qiyamu Ramadhan (sholat
c. Memperbanyak amal
tarawih)
kebaikan
b. Tadarus Al-Quran
d. a,b,c semua benar
Soal no 24

Sumarna Surapranata (2004), Analisis, validitas, Reliabiitas dan


Interpretasi Hasil Tes. Rosda Karya. Bandung
7

90

Soal no 26

3. Pengecoh / Distraktor
Pengecoh dalam tes penting adanya. Semakin berfungsi pengecohnya
maka semakin berkualitas pula kualitas tes tersebut. Apabila tingkat
kesukaran pada butir sedang maka proporsi pengecohnya minimal 0,05.

91

Apabila tingkat kesukarannya mudah maka proporsinya bisa kurang dari


0,05 asalkan pengecoh yang lain relatif sama. Berdasarkan hal tersebut
maka analisa distraktor dapat disajikan tabel berikut:
Tabel 4. Hasil Analisis Distraktor
No
Soal
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.

92

Daya Beda
Tidak baik
Baik
Tidak baik
Sedang
Baik
Baik
Sedang
Perlu revisi
Tidak baik
Tidak baik
Tidak baik
Perlu revisi
Tidak baik
Tidak baik
Sedang
Sedang
Baik
Perlu revisi
Baik
Sedang
Baik
Tidak baik
Baik
Perlu revisi
Sedang
Perlu revisi
Tidak baik
Tidak baik
Baik
Tidak baik

Tingkat
Kesukaran
Sedang
Sedang
Sedang
Sedang
Mudah
Sedang
Sukar
Sedang
Mudah
Mudah
Mudah
Sedang
Mudah
Sedang
Sedang
Sedang
Sedang
Sedang
Mudah
Sedang
Sedang
Mudah
Sedang
Sedang
Sedang
Sedang
Sukar
Sedang
Sedang
Mudah

Distraktor
Diterima
Revisi

Tolak
B,C,D

A,B, D
A,B, D
A, C,D
B,C,D
B,C,D
A,B,C
A, C,D
B,C,D
A,B,C
A,B, D
A,B, D
A,B, D
A,B,C
A, C,D
A,B,C
A,B, D
A,B,C
A,B, D
A,B, D
B,C,D
A,B, D
B,C,D
A,B,C
B,C,D
A, C,D
B,C,D
A, C,D
A,B, D
A,B,C

III. Kesimpulan
Penggunaan program Iteman khususnya dalam menginterpretasi hasil tes
sebagai ketrampilan mengajar guru diaharapkan menambah kompetensi
guru dalam melakukan kegiatan evaluasi. Fungsi ukur tes akan optimal
terlihat jelas apabila tes tersebut mampu memberikan data yang valid dan
reliabel dalam mengukur. Berdasarkan analisis butir soal ulangan umum
semester pada mata pelajaran Fiqih adalah merekomendasikan soal perlu
direvisi. Nilai Apha: 0.503 menunjukkan reliabilitas soal 50,3 % ini
menunjukkan rekomendasi bahwa soal harus diperbaiki. Rerata tingkat
kesukaran pada soal tersebut (Mean P) adalah 0.570 menunjukkan soal
berkategori sedang karena diantara range 0,31 0,70.

93

DAFTAR PUSTAKA
Allen, Mary J. Dan Yen, Wendy M, Intoduction to Measurement Theory.
Monterey, California: Cole Publishing Company,1979.
Badan Standar Nasional Pendidikan, Panduan Penyusunan Kurikulum
Tingkat Satuan Pendidikan Jenjang Pendidikan Dasar Dan Menengah,
2006.
Hayat, Bahrul. Manual Item and Test Analisis (Iteman): Pedoman Penggunaan
ITEMAN, Jakarta: Balitbang depdikbud, 1997.
Masrun, Reliabilitas dan Pendekatannya, Yogyakarta: Fakultas Psikologi
UGM, 1975.
Sumarna Surapranata Analisis validitas, Reliabilitas, dan Interpretasi Hasil Tes,
Bandung: Rosda Karya, 2004.
Suryabrata, S., Psikologi Pendidikan, Jakarta: Rajawali Pres, 1987.
Peraturan Menteri Pendidikan Nasional Republik Indonesia No 20 Tahun 2007
tentang Standar Penilaian Pendidikan

94

LAMPIRAN SOAL
Mata Pelajaran : FIQIH
Kelas
: IV (Empat)
Waktu
: 07.30 09.00

10. Perbuatan yang dapat membatalkan puasa adalah


a. Tidur
c. Mencium bau rokok
b. Mandi
d. Muntah dengan sengaja

95

11. Kita berpuasa karena menjalankan perintah ....


a. Orang tua
c. Allah SWT
b. Guru ngaji
d. Malaikat dan Rasul
12. Perhitungan untuk menentukan Bulan Ramadhan dengan ilmu ...
a. Matematika
c. Falak/hisab
b. Astronomi
d. Geografi
13. Allahumma laka shumtu dan seterusnya adalah doa ....
a. Akan berpuasa
c. Akan berbuka
b. Selesai berbuka
d. Selesai tarawih
14. Berikut ini contoh puasa sunat yaitu ....
a. Puasa Ramadhan
c. Puasa Kifarat
b. Puasa Nadzar
d. Puasa Arofah
15. Hukum puasa pada tanggal 1 syawal adalah ...
a. Wajib
c. Makruh
b. Haram
d. Sunah
16. Dibawah ini adalah manfaat menjalankan ibadah puasa, kecuali ..
a. Melatih disiplin spiritual
c. Menjaga kesehatan tubuh
terutama perut
b. Menjadi dasar disiplin
d. Ngirit makan
moral
17. Orang yang sangat tua dapat mengganti puasanya dengan cara ...
a. Membayar pajak
c. Membayar fidyah
b. Membayar zakat
d. Berhaji
18. Amalan-amalan dibulan Ramadhan diantaranya ...
a. Qiyamu Ramadhan (sholat
c. Memperbanyak amal
tarawih)
kebaikan
b. Tadarus Al-Quran
d. A,b,c benar
19. Sholat tarawih dikerjakan setelah sholat ...
a. Maghrib
c. Isya
b. Shubuh
d. Asar
20. Al-Quran pertama kali turun pada bulan ........
a. Dzulhijjah
c. Ramadhan
b. Syaban
d. Syawal

96

21. Duduk dalam masjid dengan dzikir dan niat disebut ....
a. Itikaf
c. Ibadah
b. Sholat
d. Musyawarah
22. Nabi Muhammad saw paling gemar berpuasa pada hari ...
a. Selasa dan rabu
c. Senin dan kamis
b. Jumat dan sabtu
d. Sabtu dan minggu

97

Anda mungkin juga menyukai