Anda di halaman 1dari 23

Makalah Ini Di Tujukan Untuk Memenuhi Tugas Mata Kuliah Pengembangan

Evaluasi Pembelajaran

Dosen Pengampu :
Atiqatul Musyarofah, M.Pd.I

Disusun Oleh :
Rifqy Fauzan Romadhoni
Rendy Firmansyah
Rivani Noer Maulidi
Rizal Nanda Saputra

PROGRAM STUDI PENDIDIKAN AGAMA ISLAM


FAKULTAS TARBIYAH INSTITUT AGAMA
ISLAM IBRAHIMY GENTENG-BANYUWANGI
DESEMBER 2021
KATA PENGANTAR

Puji dan syukur Alhamdulillah penulis panjatkan kehadirat Allah


SWT. Berkat rahmat dan ridho-Nya penulis dapat menyelesaikan makalah ini
sebagai tugas kelompok dalam Perkuliahan di Institut Agama Islam Ibrahimy
Genteng Banyuwangi.

Dalam penyusunan makalah ini penyusun sangat menyadari bahwa,


masih banyak terdapat kekurangan dan kekeliruan baik isi maupun cara
penulisan yang di karenakan keterbatasan ilmu pengatahuan dan pengalaman
yang penulis miliki.

Oleh karena itu penulis sangat mengharapkan kritik dan saran yang
membangun dari semua pihak demi sempurnanya penyusunan makalah ini di
masa yang akan datang. Semoga Allah SWT Membalas dan Melimpahkan
rahmat dan hidayah-Nya atas bantuan yang telah diberikan kepada penulis
dalam penyusunan makalah ini.

Akhirnya, semoga makalah ini dapat bermanfaat bagi kami serta bagi
pembaca pada umumnya.

Genteng, 30 November 2021

Penyusun
DAFTAR ISI

Halaman Judul .............................................................................................. i

Kata Pengantar......................................................................................................ii
Daftar Isi................................................................................................................iii

BAB I PENDAHULUAN ............................................................................... 1


A. Latar Belakang ..................................................................................... 1
B. Rumusan Masalah ............................................................................... 1
C. Rumusan Makalah ................................................................................ 1

BAB II PEMBAHASAN ................................................................................ 2


A. Analisis Butir Soal Secara Kualitatif dan Kuantitatif ........................ 2
B. Manfaat Dari Menganalisis Butir Soal ............................................... 2

BAB III PENUTUP ...................................................................................... 8


A. Kesimpulan ........................................................................................ 8
B. Penutup ............................................................................................... 8

DAFTAR PUSTAKA ..................................................................................... 9


BAB I

PENDAHULUAN

A. Latar Belakang

Dalam dunia pendidikan, penilaian merupakan bagian yang tidak


terpisahkan dari proses belajar mengajar. Sistem penilaian yang baik akan
mendorong guru menggunakan strategi mengajar yang lebih baik dan
memotivasi anak untuk belajar lebih giat. Penilaian biasanya dimulai dengan
kegiatan pengukuran. Pengukuran (measurement) merupakan cabang ilmu
statistika terapan yang bertujuan untuk membangun dasar-dasar
pengembangan tes yang lebih baik sehingga menghasilkan tes yang berfungsi
secara optimal, valid, dan reliabel.

Proses belajar mengajar dilaksanakan tidak hanya untuk kesenangan atau


bersifat mekanis saja tetapi mempunyai misi atau tujuan bersama. Dalam
usaha untuk mencapai misi dan tujuan itu perlu diketahui apakah usaha yang
dilakukan sudah sesuai dengan tujuan? Untuk mengetahui apakah tujuan
pendidikan sudah tercapai perlu diadakan tes. Sebuah tes yang dapat baik
sebagai alat pengukur harus dianalisis terlebih dahulu. Dalam menganalisis
butir soal dalam tes harus memperhatikan daya serap, tingkat kesukaran, daya
beda, fungsi pengecoh, validitas dan reabilitas. Hal tersebut dilakukan agar tes
yang diberikan kepada siswa sesuai dengan daya serap siswa, tingkat
kesukarannya, dan soal yang diberikan pun harus valid. Sehingga, tujuan dari
pembelajaran dapat tercapai.

2. Rumusan Masalah

Rumusan masalah dalam makalah ini, yaitu:

1. Apakah yang dimaksud dengan analisis butir soal secara kualitatif dan
kuantitatif?
2. Bagaimana cara mengaplikasikan analisis butir soal secara kualitatif dan
kuantitatif?
3. Apa manfaat dari menganalisis butir soal?

3. Tujuan

Tujuan dari penyusunan makalah ini, yaitu:

1. Mendeskripsikan pengertian analisis butir soal secara kualitatif dan


kuantitatif.
2. Mengaplikasikan analisis butir soal secara kualitatif dan kuantitatif.

3. Mengetahui manfaat dari menganalisis butir soal.


BAB II

PEMBAHASAN

A. Analisis Butir Soal Secara Kualitatif dan Kuantitatif

Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan


berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap).
Penelaahan ini biasanya dilakukan sebelum soal digunakan atau diujikan.
Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah
setiap soal ditelaah dari segi materi, konstruksi, bahasa atau budaya, dan kunci
jawaban atau pedoman penskorannya.

Dalam menganalisis butir soal, terdapat dua teknik. Yaitu teknik kualitatif
dan teknik kuantitatif.

1. Teknik Analisis Secara Kualitatif

Ada beberapa teknik yang dapat digunakan untuk menganalisis butir


soal secara kualitatif, diantaranya adalah teknik moderator dan teknik
panel. Teknik moderator merupakan teknik berdiskusi yang di dalamnya
terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir
soal didiskusikan secara bersama-sama dengan beberapa ahli seperti guru
yang mengajarkan materi, ahli materi, penyusun atau pengembang
kurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi.
Teknik ini sangat baik karena setiap butir soal dilihat secara
bersamasama berdasarkan kaidah penulisannya. Di samping itu, para
penelaah dipersilakan mengomentari berdasarkan kompetensinya
masingmasing. Setiap komentar atau masukan dari peserta diskusi dicatat.
Setiap butir soal dapat dituntaskan secara bersama-sama, perbaikannya
seperti apa. Namun, kelemahan teknik ini memiliki kelemahan karena
memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal.

Teknik berikutnya adalah Teknik Panel yakni suatu teknik menelaah


butir soal berdasarkan kaidah penulisan butir soal. Kaidah itu diantaranya
materi, konstruksi, bahasa atau budaya, kebenaran kunci jawaban atau
pedoman penskoran. Caranya beberapa penelaah diberikan butir-butir
soal yang akan ditelaah, format penelaahan, dan pedoman penilaian atau
penelaahan. Pada tahap awal, semua orang yang terlibat dalam kegiatan
penelaahan disamakan persepsinya, kemudian mereka berkerja
sendirisendiri di tempat berbeda. Para penelaah dipersilakan memperbaiki
langsung pada teks soal dan memberikan komentarnya serta memberikan
nilai pada setiap butir soal dengan kriteria: soal baik, perlu diperbaiki,
atau diganti.

Dalam menganalisis butir soal secara kualitatif, penggunaan format


penelaahan soal akan sangat membantu dan mempermudah prosedur
pelaksanaannya. Format penelaahan soal digunakan sebagai dasar untuk
menganalisis setiap butir soal. Format penelaahan soal yang dimaksud
adalah format penelaahan butir soal: uraian, pilihan ganda, tes perbuatan
dan instrumen non-tes

2. Analisis Butir Soal Secara Kuantitatif

Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan


pada data empirik. Data empirik ini diperoleh dari soal yang telah diujikan.
Ada dua pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara
klasik dan modern.

Analisis butir soal secara klasik adalah proses penelaahan butir soal
melalui informasi dari jawaban peserta didik tes guna meningkatkan mutu

butir soal yang bersangkutan dengan menggunakan teori tes klasik. Kelebihan
analisis butir soal secara klasik adalah murah, sederhana, familiar, dapat
dilaksanakan sehari-hari dengan cepat menggunakan komputer, dan dapat
menggunakan data dari beberapa peserta didik atau sampel kecil (Millman dan
Greene, 1993: 358). Analisis jenis butir ini yang lazim digunakan dalam
praktik di lapangan, terutama oleh guru disekolah.
Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik
adalah setiap butir soal ditelaah dari segi: tingkat kesukaran butir, daya
pembeda butir, dan penyebaran pilihan jawaban (untuk soal bentuk obyektif)
atau fungsi pengecoh pada setiap pilihan jawaban, reliabilitas dan validitas
soal.

1. Tingkat Kesukaran

Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu


soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam
bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan
dalam bentuk proporsi yang besarnya berkisar 0,00 - 1,00 (Aiken (1994:
66). Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil
hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00
artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki
TK= 1,00 artinya bahwa siswa menjawab benar. Perhitungan indeks
tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya,
skor ratarata yang diperoleh peserta didik pada butir soal yang
bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini
dipergunakan untuk soal selected response item, yaitu (Nitko, 1996: 310).

Tingkat Kesukaran (TK) =


Jumlah siswa yang menjawab benar butir soal jumlah
siswa yang mengikuti tes

Atau dengan menggunakan rumus:

P = B/N

P = proporsi (indeks kesukaran)

B = jumlah siswa yang menjawab benar

N = jumlah peserta tes


Tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes.
Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki
tingkat kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang
memiliki tingkat kesukaran tinggi atau sukar, dan untuk keperluan diagnostik
biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah atau
mudah.

Klasifikasi tingkat kesulitan soal dapat menggunakan kriteria berikut:

Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi


guru dan kegunaan bagi pengujian dan pengajaran (Nitko, 1996: 310-313).
Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep terhadap
pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar
mereka, (2) memperoleh informasi tentang penekanan kurikulum atau
mencurigai terhadap butir soal yang bias. Adapun kegunaannya bagi
pengujian dan pengajaran adalah: (a) pengenalan konsep yang diperlukan
untuk diajarkan ulang, (b) tanda-tanda terhadap kelebihan dan kelemahan pada
kurikulum sekolah, (c) memberi masukan kepada siswa, (d) tanda-tanda
kemungkinan adanya butir soal yang bias, (e) merakit tes yang memiliki
ketepatan data soal.

Contoh :
Tes formatif IPA, 10 soal bentuk pilihan ganda, option 4, dengan proporsi 2
soal mudah, 6 soal sedang dan 2 soal sukar, jumlah siswa = 20 orang.

Dalam mencari indeks kesukaran menggunakan rumus yang telah


ditulis di atas: P = B/N = 18/20
P = 0,90
Dari contoh di atas diperoleh hasil, yaitu : soal nomor 1, 3, 4, 5, 8 dan 9, terdapat
kesesuaian antara judgement dengan hasil analisa, soal nomor 2 yang di
judgement mudah ternyata termasuk soal sedang, soal nomor 6 yang di
judgement sedang ternyata termasuk soal mudah, soal nomor 7 yang dijudgement
sedang, ternyata termasuk sukar dan soal nomor 10 yang dijudgement sukar,
ternyata termasuk soal sedang.
Atas dasar hasil di atas, soal yang harus diperbaiki adalah:

Soal nomor 2, diturunkan ke dalam kategori mudah,

Soal nomor 6, dinaikkan ke dalam kategori sedang,

Soal nomor 7 diturunkan ke dalam kategori sedang, Soal nomor 10,


dinaikkan ke dalam kategori sukar.

2. Daya Pembeda

Daya pembeda soal adalah kemampuan suatu butir soal dapat


membedakan antara siswa yang menguasai materi yang ditanyakan dan siswa
yang belum menguasai materi yang diujikan. Daya pembeda butir soal
memiliki manfaat berikut. Pertama untuk meningkatkan mutu setiap butir soal
melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal
dapat diketahui apakah butir soal itu baik, direvisi atau ditolak.

Kedua, untuk mengetahui seberapa jauh masing-masing soal dapat


mendeteksi atau membedakan kemampuan siswa, yaitu siswa yang telah
memahami atau belum memahami materi yang diajarkan guru. Apabila suatu
soal tidak dapat membedakan kedua kemampuan siswa itu maka butir soal itu
dapat dicurigai kemungkinannya: a) Kunci jawaban butir soal itu tidak tepat.
b) Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar. c)
Kompetensi yang diukur tidak jelas. d)Pengecoh tidak berfungsi. e)Materi
yang ditanyakan terlalu sulit, sehingga banyak siswa yang menebak dan f)
Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada
yang salah informasi dalam butir soalnya.
Untuk menentukan daya pembeda dibedakan menjadi kelompok kecil
(kurang dari 100 orang) dan kelompok besar (100 orang ke atas).
1) Untuk kelompok kecil seluruh kelompok testee dibagi dua sama besar, 50%
kelompok atas dan 50% kelompok bawah.
Contoh Perhitungan

Dari hasil analisis tes yang terdiri dari 10 butir soal yang dikerjakan oleh 20 orang
siswa, terdapat dalam tabel sebagai berikut:

Berdasarkan nama-nama siswa dapat kita peroleh skor-skor sebagai berikut:


A=5 F=6 K=7 P=3

B=7 G=6 L=5 Q=8


C=8 H=6 M=3 R=8
D=5 I=8 N=7 S=6
E = 10 J=7 O=9 T=6
Dari angka-angka yang belum teratur kemudian dibuat array (urutan penyebaran),
dari skor yang paling tinggi ke skor yang paling rendah.

Kelompok atas Kelompok bawah

10 6

9 6

8 6

8 6

8 6

8 5

7 5

7 5

7 3

7 3

10 orang 10 orang

Array ini sekaligus menunjukkan adanya kelompok atas (J A) dan kelompok bawah
(JB) dengan pemiliknya sebagai berikut:

Kelompok atas (JA) Kelompok bawah (JB)


B=7 A=5
C=8 D=5
E = 10 F=6
I =8 G=6
J =7 H=6

K=7 L=5
N=7 M=3
O=9 P=3
Q=8 S=6
R=8 T=6
10 orang 10 orang
Perhatikan pada tabel analisis 10 butir soal 20 siswa.

Dibelakang nama siswa dituliskan huruf A atau B sebagai tanda kelompok. Hal ini
mempermudah menentukan BA dan BB.

BA = banyaknya siswa yang menjawab benar pada kelompok atas (A)

BB = banyaknya siswa yang menjawab benar pada kelompok bawah

(B)

Sudah disebutkan di atas bahwa soal yang baik adalah soal yang dapat
membedakan antara anak pandai dengan anak bodoh, dilihat dari dapat dan
tidaknya mengerjakan soal itu.

Marilah kita perhatikan tabel analisis lagi, khusus untuk butir soal nomor 1.

1 Dari kelompok atas yang menjawab betul 8 orang

2 Dan kelompok bawah yang menjawab betul 3 orang


Kita terapkan dalam rumus indeks diskriminasi:

JA = 10 JB = 10

P A = 0,8 P B = 0,3
BA = 8 BB = 3

Maka, D = P A - P B

1= 0,8 – 0,3

2= 0,5
Dengan demikian, maka indeks diskriminasi untuk soal nomor 1 adalah 0,5
(Daya pembeda baik, soal diterima).

Sekarang kita perhatikan butir soal nomor 8:

JA = 10 JB = 10

P A = 0,8 P B = 0,9
BA = 8 BB = 9

Maka, D = P A - P B

1= 0,8 – 0,9

2= -0,1

Butir soal ini jelek karena lebih banyak dijawab benar oleh kelompok bawah
dibandingkan dengan jawaban benar dari kelompok atas. Ini berarti bahwa
untuk menjawab soal dengan benar, dapat dilakukan dengan menebak.

3. Fungsi pengecoh (distracter function)

Pada saat membicarakan tes objektif bentuk multiple choice item tersebut
untuk setiap butir item yang dikeluarkan dalam tes hasil belajar telah
dilengkapi dengan beberapa kemungkinan jawab, atau yang sering dikenal
dengan istilah option atau alternatif. Option atau alternatif itu jumlahnya
berkisar antara 3 sampai dengan 5 buah, dan dari kemungkinan-kemungkinan
jawaban yang terpasang pada setiap butir item itu, salah satu diantaranya
adalah merupakan jawaban betul (kunci jawaban), sedangkan sisanya adalah
merupakan jawaban salah. Jawaban-jawaban salah itulah yang biasa dikenal
dengan istilah distractor (pengecoh).
Fungsi pengecoh dimaksudkan untuk mengetahui seberapa besar peserta
yang tidak memiliki kunci jawaban (option) pada bentuk soal pilihan ganda.
Untuk soal pilihan ganda, alternatif jawaban menurut kaidah harus homogen
dan logis sehingga setiap pilihan jawaban (opition) dapat berfungsi atau ada
yang memilih. Setiap pengecoh dapat dikatakan berfungsi apabila ada yang
memilih. Setiap pengecoh dapat dikatakan berfungsi apabila terpilih minimal
sebanyak 5% dari jumlah peserta.untuk menghitungnya dapat digunakan
rumus sebagai berikut:
ℎ ℎ ℎ x 100% ℎ ℎ

Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu :


menganalisis pola penyebaran jawaban item. Adapun yang dimaksud dengan
pola penyebaran jawaban item adalah suatu pola yang dapat menggambarkan
bagaimana testee menentukan pilihan jawabnya terhadap
kemungkinankemungkinan jawab yang telah dipasangkan pada setiap butir
item. Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan
alternatif yang dipasang pada butir item tertentu, sama sekali tidak dipilih
oleh testee. Dengan kata lain, testee menyatakan ―blangko. Pernyataan
blangko ini sering dikenal dengan istilah omit dan biasa diberi lambang
dengan huruf O. Sebagai tindak lanjut atas hasil penganalisaan terhadap
fungsi distraktor tersebut maka distraktor yang sudah dapat menjalankan
fungsinya dengan baik dapat dipakai lagi pada tes-tes yang akan datang,
sedangkan distraktor yang belum dapat
berfungsi dengan baik sebaiknya diperbaiki atau diganti dengan distraktor
yang lain (Anas, 2011:408).

4. Reliabilitas Skor Tes

Realibilitas adalah tingkat atau derajat konsistensi dari suatu instrumen,


reliabilitas tes berkenaan dengan dengan pertanyaan, apakah suatu tes teliti
dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu tes
dapat dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan
pada kelompok yang sama pada waktu yang sama pada waktu atau
kesempatan yang berbeda.
Menurut Gronlun, ada empat faktor yang dapat mempengaruhi
reliabilitas, yaitu :

1. Panjang tes, yaitu banyaknya soal tes. Ada kecenderungan, semakin


panjang suatu tes akan lebih tinggi tingkat reliabilitas suatu tes, karena
semakin banyak soal, maka akan semakin banyak sampel yang diukur
dan proporsi jawaban yang benar semakin semakin banyak, sehingga
faktor tebakan akan semakin rendah.

2. Sebaran skor, besarnya sebaran skor akan membuat tingkat reliabilitas


menjadi lebih tinggi, Karena koefesien reliabilitas yang lebih besar
diperoleh ketika peserta didik tetap pada posisi yang relative sama dalam
satu kelompok pengujian ke pengujian berikutnya. Dengan kata lain,
peluang selisih dari perubahan posisi dalam kelompok dapat
memperbesar koefesien reliabilitas.

3. Tingkat kesukaran, dalam penilaian yang menggunakan pendekatan


penilaian acuan norma, baik untuk soal yang mudah maupun sukar,
cenderung menghasilkan tingkat reliabilitas yang rendah. Hal ini
disebabkan antara hasil tes yang mudah dengan hasil tes yang sukar
keduanya dalam satu sebaran skor yang terbatas. Untuk tes yang mudah,
skor akan berada dibagian atas dan akhir dari skala penilaian. Bagi kedua
tes (mudah dan sukar), perbedaan antar peserta didik kecil sekali dan
cenderung tidak dapat dipercaya. Tingkat kesukaran soal yang ideal
untuk meningkatkan koefesien reliabilitas adalah soal yang menghasilkan
sebaran skor berbentuk genta atau kurva normal.

4. Objektivitas, menunjukkan skor tes kemampuan yang sama antara


peserta didik yang satu dengan peserta didik lainnya. Peserta didik
memperoleh hasil yang sama dalam mengerjakan suatu tes. Jika peserta
didik memiliki tingkat kemampuan yang sama, maka akan memperoleh
hasil tes yang sama pada saat mengerjakan tes yang sama. Objektivitas
prosedur tes yang tinggi akan memperoleh reliabilitas hasil tes yang tidak
dipengaruhi oleh prosedur penskoran.

Konsep reliabilitas mendasari kesalahan pengukuran yang mungkin


terjadi pada suatu proses pengukuran atau pada nilai tunggal tertentu,
sehingga menimbulkan perubahan pada susunan kelompoknya. Misalnya,
guru mengetes peserta didik dengan instrumen tertentu dan mendapat nilai 70.
Kemudian pada kesempatan yang berbeda dengan instrumen yang sama, guru
melakukan tes kembali, ternyata peserta didik tersebut mendapat nilai 75.
Artinya, tes tersebut tidak reliabel, karena terjadi kesalahan pengukuran. Tes
yang reliabel adalah apabila koefesien reliabilitasnya tinggi dan kesalahan
baku pengukurannya rendah.

Analisis butir secara modern yaitu penelaahan butir soal dengan


menggunakan Item Response Theory (IRT) atau teori jawaban butir soal.
Teori ini merupakan suatu teori yang menggunakan fungsi matematika
untuk menghubungkan antara peluang menjawab benar suatu scal dengan
kemampuan siswa. Nama lain IRT adalah latent trait theory (LTT), atau
characteristics curve theory (ICC).
Asal mula IRT adalah kombinasi suatu versi hukum phi-gamma
dengan suatu analisis faktor butir soal (item factor analisis) kemudian
bernama Teori Trait Latent (Latent Trait Theory), kemudian sekarang
secara umum dikenal menjadi teori jawaban butir soal (Item Response
Theory) (McDonald, 1999: 8).

B. Manfaat Analisis Butir Soal

Kegiatan analisis butir soal memiliki banyak manfaat, diantaranya: (1)


dapat membantu pengguna tes dalam mengevaluasi kualitas tes yang
digunakan, (2) relevan bagi penyusunan tes informal seperti tes yang
disiapkan guru untuk siswa di kelas, (3) mendukung penulisan butir soal yang
efektif, (4) secara materi dapat memperbaiki tes di kelas, (5) meningkatkan
validitas soal dan reliabilitas (Anastasi&Urbina, 1997:172). Nitko (1996:308-
309) juga menguraikan manfaat kegiatan analisis butir soal, di antaranya
untuk: (1)

menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan,
(2) memberi masukan kepada siswa tentang kemampuan dan sebagai dasar
untuk bahan diskusi di kelas, (3) memberi masukan kepada guru tentang
kesulitan siswa, (4) memberi masukan pada aspek tertentu untuk
pengembangan kurikulum, (5) merevisi materi yang diukur, (6) meningkatkan
keterampilan penulisan soal.
Dari uraian di atas menunjukkan analisis butir soal memberikan manfaat:

(1) menentukan soal-soal yang cacat atau tidak berfungsi dengan baik; (2)
meningkatkan butir soal melalui tiga komponen analisis yaitu tingkat
kesukaran, daya pembeda, dan pengecoh soal; (3) meningkatkan validitas
soal dan reliabilitas; (4) merevisi soal yang tidak relevan dengan materi
yang diajarkan, ditandai dengan banyaknya anak yang tidak dapat
menjawab butir soal tertentu.
BAB III
PENUTUP

A. Kesimpulan
1. Analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah
penulisan soal (tes tertulis, perbuatan, dan sikap). Ada beberapa teknik
yang dapat digunakan untuk menganalisis butir soal secara kualitatif,
diantaranya adalah teknik moderator dan teknik panel.

1) Teknik moderator merupakan teknik berdiskusi yang di dalamnya


terdapat satu orang sebagai penengah.

2) Teknik Panel yakni suatu teknik menelaah butir soal berdasarkan


kaidah penulisan butir soal.
2. Analisis butir soal secara kuantitatif adalah analisis butir soal didasarkan
pada data empirik. Data empirik ini diperoleh dari soal yang telah
diujikan. Ada dua pendekatan dalam analisis secara kuantitatif, yaitu:

1) Analisis butir soal secara klasik adalah proses penelaahan butir


soal melalui informasi dari jawaban peserta didik tes guna
meningkatkan mutu butir soal yang bersangkutan dengan
menggunakan teori tes klasik.

Aspek yang perlu diperhatikan dalam analisis butir soal secara


klasik adalah setiap butir soal ditelaah dari segi: tingkat kesukaran
butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk
soal bentuk obyektif) atau fungsi pengecoh pada setiap pilihan
jawaban, reliabilitas dan validitas soal.

2) Analisis butir secara modern yaitu penelaahan butir soal dengan


menggunakan Item Response Theory (IRT) atau teori jawaban
butir soal. Teori ini merupakan suatu teori yang menggunakan
fungsi matematika untuk menghubungkan antara peluang
menjawab benar suatu scal dengan kemampuan siswa. Nama lain
IRT adalah latent trait theory (LTT), atau characteristics curve
theory (ICC).
3) Manfaat menganalisis butir soal, yaitu:

1. Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik,

2. Meningkatkan butir soal melalui tiga komponen analisis yaitu


tingkat kesukaran, daya pembeda, dan pengecoh soal,
3. Meningkatkan validitas soal dan reliabilitas, dan

4. Merevisi soal yang tidak relevan dengan materi yang diajarkan,


ditandai dengan banyaknya anak yang tidak dapat menjawab butir
soal tertentu.

2. Saran

Ketika kita menjadi pengajar dan pendidik, sebaiknya dalam penyusunan


instrument tes, seperti soal tes hendaknya disesuaikan dengan kriteria
penyusunan soal yang baik dan benar. Dimana, tingkat kesukarannya
diperhatikan, daya pembeda disesuaikan, pengecoh soal berfungsi dengan
baik. Dan juga ketika diuji dengan validitas maupun realibilitas sesuai dengan
kualitas dan metode pembelajaran yang menjunjung tinggi cita-cita guru
Indonesia untuk mencerdaskan kehidupan bangsa.
DAFTAR PUSTAKA

Arifin, Zaenal. 2009. EVALUASI PEMBELAJARAN. Bandung; PT.REMAJA

ROSDAKARYA

Arikunto, Suharsimi. 2003. DASAR-DASAR EVALUASI PENDIDIKAN. Jakarta;

Bumi Aksara

Kusaeri dan Suprananto. 2012. Pengukuran dan Penilaian Pendidikan. Jakarta;


GRAHA ILMU

Sudaryono. 2012. Dasar-dasar Evaluasi Pembelajaran. Jakarta; GRAHA ILMU

Anda mungkin juga menyukai