p
ABSTRACT
Teachers used test to measure the competence and effectiveness of
instructional programs. Test must be tested in quality empirically. The item still
must be tested by trial, and result of this test obtained evidence about quality of
item test. By doing the examination hence a test can be applied in evaluating.
Repairs, omission or thing required in evaluating. At this article brief analysis to
ulangan umum fiqih at Madrasah Ibtidaiyah class IV. With examinee 20 students.
Test analysis applies program ITEMAN version 3.00. ITEMAN represents of the
Classiccal Test Theory. Based on analysis item, the test need to revise. The test is
midlle difficulty because mean P is 0.570.
Keyword: Item Analysis, ITEMAN
I. Pendahuluan
Standar penilaian pendidikan 1 adalah standar nasional pendidikan
yang berkaitan dengan mekanisme, prosedur, dan instrumen penilaian
hasil belajar peserta didik. Sedangkan difinisi penilaian pendidikan itu
sendiri adalah proses pengumpulan dan pengolahan informasi untuk
menentukan pencapaian hasil belajar peserta didik.
Penilaian pendidikan yang ada dalam pendidikan Indonesia
berdasarkan lampiran peraturan menteri pendidikan nasional nomor 20
tahun 2007 tanggal 11 juni 2007 meliputi :
1. Ulangan adalah proses yang dilakukan untuk mengukur pencapaian
kompetensi peserta didik secara berkelanjutan dalam proses
83
84
85
86
Tingkat Kesukaran
Daya Beda
Sedang
Sedang
Sedang
Sedang
Mudah
Sedang
Sukar
Sedang
Mudah
Mudah
Mudah
Sedang
Mudah
Sedang
Sedang
Sedang
Sedang
Sedang
Mudah
Sedang
Sedang
Mudah
Sedang
Sedang
Sedang
Sedang
Tidak baik
Baik
Tidak baik
Sedang
Baik
Baik
Sedang
Perlu revisi
Tidak baik
Tidak baik
Tidak baik
Perlu revisi
Tidak baik
Tidak baik
Sedang
Sedang
Baik
Perlu revisi
Baik
Sedang
Baik
Tidak baik
Baik
Perlu revisi
Sedang
Perlu revisi
87
27.
28.
29.
30.
Sukar
Sedang
Sedang
Mudah
Tidak baik
Tidak baik
Baik
Tidak baik
1 . Tingkat kesukaran
Tingkat kesukaran (difficult level) (P) pada analisis butir soal secara
klasik merupakan skala rata-rata peserta tes yang menjawab benar suatu
butir soal. Untuk mengetahui tingkat kesukaran soal dapat diperoleh
dengan beberapa cara: (1) skala kesukaran linier, (2) skala biserial (3) skala
davis dan (4) skala menjawab benar. Dalam analisis skala yang digunakan
adalah proporsi menjawab benar. Adapun besaran tingkat kesukaran
berkisar 0 sampai dengan 1. Menurut Bahrul Hayat tingkat kesukaran
suatu butir soal dapat dikategorikan menjadi tiga yaitu:
Tabel 2. Tingkat Kesukaran
Pendapat ini sejalan dengan Allen dan Yen bahwa indeks kesukaran
yang sedang berkisar antara 0,30 sampai dengan 0,70. Berdasarkan
Sumarna Surapranata soal yang diterima5 adalah soal yang terletak pada
rentang tingkat kesukaran 0,30 sampai dengan 0,7. Hal ini dilakukan
mengingat tingkat kesukaran antara 0,30 sampai dengan 0,7 merupakan
soal yang homogen dan dapat menghasilkan penyebaran skor yang luas.
Berdasarkan hasil analisis iteman dan merujuk pada tabel 2 Tingkat
Kesukaran di atas diperoleh hasil sebagai berikut :
No Kategori
Butir soal
1
Mudah
5, 9, 10, 11, 13, 19, 22, 30
2
Sedang
1,2,3,4,6,8,12, 14,15,16,17,18,20,21,23,24,25,26,28,29
3
Sukar
7, 27
88
soal no 27
27. Yang termasuk puasa wajib adalah .
2. Daya Beda
Daya beda soal merupakan kemampuan suatu soal yang dengan
skornya dapat membedakan antara siswa dan kelompok tinggi (prestasi
tinggi) dengan siswa dan kelompok rendah (kurang pandai). Makin tinggi
daya beda butir makin banyak peserta dan kelompok tinggi yang dapat
menjawab butir dengan benar serta makin sedikit peserta dan kelompok
rendah yang dapat menjawabnya dengan benar.
Daya beda butir soal yang biasa digunakan dalam tes hasil belajar
adalah dengan cara menggunakan indeks korelasi antara skor butir dengan
skor totalnya. Daya beda dengan cara ini disebut juga validitas internal,
karena korelasi diperoleh dan dalam tes itu sendini. Daya pembeda soal
dapat dihihat dan besarnya koefisien korelasi biserial maupun koefisien
point bisenial. Nilai korelasi point biserial selalu lebih rendah
dibandingkan dengan nilai korelasi biserial. Hal mi masih dipengaruhi
oleh tingkat kesukaran soal.
Koefisien daya beda bergerak dan -1 sampai +1. Daya beda butir
instrument lebih dari 0,30 yaitu korelasi antara skor butir dengan skor total
maka butir tersebut tergolong baik6. Soal yang memiliki validitas soal
diatas 0,30 merupakan soal yang baik sebagaimana dikemukakan. Daya
pembeda di atas 0,30 merupakan soal yang termasuk dapat membedakan
89
No
1
2
3
4.
Soal no 12
12. Perhitungan untuk menentukan Bulan Ramadhan dengan ilmu
a. Matematika
c. Falak/ hisab
b. Astronomi
d. Geografi
Soal no 18
18. Amalan-amalan di bulan Ramadhan diantaranya
a. Qiyamu Ramadhan (sholat
c. Memperbanyak amal
tarawih)
kebaikan
b. Tadarus Al-Quran
d. a,b,c semua benar
Soal no 24
90
Soal no 26
3. Pengecoh / Distraktor
Pengecoh dalam tes penting adanya. Semakin berfungsi pengecohnya
maka semakin berkualitas pula kualitas tes tersebut. Apabila tingkat
kesukaran pada butir sedang maka proporsi pengecohnya minimal 0,05.
91
92
Daya Beda
Tidak baik
Baik
Tidak baik
Sedang
Baik
Baik
Sedang
Perlu revisi
Tidak baik
Tidak baik
Tidak baik
Perlu revisi
Tidak baik
Tidak baik
Sedang
Sedang
Baik
Perlu revisi
Baik
Sedang
Baik
Tidak baik
Baik
Perlu revisi
Sedang
Perlu revisi
Tidak baik
Tidak baik
Baik
Tidak baik
Tingkat
Kesukaran
Sedang
Sedang
Sedang
Sedang
Mudah
Sedang
Sukar
Sedang
Mudah
Mudah
Mudah
Sedang
Mudah
Sedang
Sedang
Sedang
Sedang
Sedang
Mudah
Sedang
Sedang
Mudah
Sedang
Sedang
Sedang
Sedang
Sukar
Sedang
Sedang
Mudah
Distraktor
Diterima
Revisi
Tolak
B,C,D
A,B, D
A,B, D
A, C,D
B,C,D
B,C,D
A,B,C
A, C,D
B,C,D
A,B,C
A,B, D
A,B, D
A,B, D
A,B,C
A, C,D
A,B,C
A,B, D
A,B,C
A,B, D
A,B, D
B,C,D
A,B, D
B,C,D
A,B,C
B,C,D
A, C,D
B,C,D
A, C,D
A,B, D
A,B,C
III. Kesimpulan
Penggunaan program Iteman khususnya dalam menginterpretasi hasil tes
sebagai ketrampilan mengajar guru diaharapkan menambah kompetensi
guru dalam melakukan kegiatan evaluasi. Fungsi ukur tes akan optimal
terlihat jelas apabila tes tersebut mampu memberikan data yang valid dan
reliabel dalam mengukur. Berdasarkan analisis butir soal ulangan umum
semester pada mata pelajaran Fiqih adalah merekomendasikan soal perlu
direvisi. Nilai Apha: 0.503 menunjukkan reliabilitas soal 50,3 % ini
menunjukkan rekomendasi bahwa soal harus diperbaiki. Rerata tingkat
kesukaran pada soal tersebut (Mean P) adalah 0.570 menunjukkan soal
berkategori sedang karena diantara range 0,31 0,70.
93
DAFTAR PUSTAKA
Allen, Mary J. Dan Yen, Wendy M, Intoduction to Measurement Theory.
Monterey, California: Cole Publishing Company,1979.
Badan Standar Nasional Pendidikan, Panduan Penyusunan Kurikulum
Tingkat Satuan Pendidikan Jenjang Pendidikan Dasar Dan Menengah,
2006.
Hayat, Bahrul. Manual Item and Test Analisis (Iteman): Pedoman Penggunaan
ITEMAN, Jakarta: Balitbang depdikbud, 1997.
Masrun, Reliabilitas dan Pendekatannya, Yogyakarta: Fakultas Psikologi
UGM, 1975.
Sumarna Surapranata Analisis validitas, Reliabilitas, dan Interpretasi Hasil Tes,
Bandung: Rosda Karya, 2004.
Suryabrata, S., Psikologi Pendidikan, Jakarta: Rajawali Pres, 1987.
Peraturan Menteri Pendidikan Nasional Republik Indonesia No 20 Tahun 2007
tentang Standar Penilaian Pendidikan
94
LAMPIRAN SOAL
Mata Pelajaran : FIQIH
Kelas
: IV (Empat)
Waktu
: 07.30 09.00
95
96
21. Duduk dalam masjid dengan dzikir dan niat disebut ....
a. Itikaf
c. Ibadah
b. Sholat
d. Musyawarah
22. Nabi Muhammad saw paling gemar berpuasa pada hari ...
a. Selasa dan rabu
c. Senin dan kamis
b. Jumat dan sabtu
d. Sabtu dan minggu
97