Anda di halaman 1dari 30

MAKALAH EVALUASI PEMBELAJARAN MATEMATIKA

‘’ANALISIS BUTIR BUTIR SOAL’’

Dosen Pengampu : Poni Saltifa, M.Pd

Disusun Oleh:

Kelompok 7

1. Vika Patrichia 2011280005


2. Dhea Salwa Fadhylah 2011280008

Fakultas Tarbyah dan Tadris

Prodi Tadris Matematika

UNIVERSITAS ISLAM NEGERI FATMAWATI SUKARNO

2022/2023
Kata Pengantar

Assalamualaikum warahmatullahi wabarakatuh

Puji syukur marilah kita panjatkan kehadirat allah SWT. Yang telah
memberikan kesehatan jasmani dan rohani sehingga kita masih tetap bisa
menikmati keindahan alam ciptaan-nya. Solawat dan salam tetaplah kita
cuarahkan kepada baginda Habibillah Muhammad SAW yang telah menunjukkan
kepada kita jalan yang lurus berupa ajran agama yang sempurna dengan bahasa
yang sangat indah.

Dalam makalah ini kami mencoba menjelaskan tentang ‘’Analisis Butir Butir
Soal’’ Kami menyadari bahwa masih banyak kekurangan yang mendasar pada
makalah ini. Oleh karena itu kami membutuhkan pembaca untuk memberikan
saran serta kritik yang dapat membangun kami. Kritik konstruktif dari pembaca
sangat kami harapkan untuk penyempurnaan makalah selanjutnya. Apabila
terdapat banyak kesalahan pada makalah ini, kami memohon maaf.

Demikian yang dapat kami sampaikan. Akhir kata semoga makalah ini
dapat memberikan manfaat bagi kita semua.
Wassalamualaikum warahmatullahi wabarakatuh

Bengkulu, Maret 2022

Kelompok 7
DAFTAR ISI
Halaman
COVER .……………………………………………………….........…………………………………... i
KATA PENGANTAR …..…….………………………………….…………………………………….. ii
DAFTAR ISI ………….....………………………………………………………………..……............ iii
BAB I PENDAHULUAN …….………………………………………………………………………… 1
1.1 Latar Belakang …..……………………………………………….………………….……… 1
1.2 Perumusan Masalah …………….………………………….……………………………. 1
1.3 Tujuan …………………………………………………………………………………………… 2
BAB II PEMBAHASAN ……...………………………………………..……………………………… 3
2.1 Analisis Butir Soal …………………………..…………………………………………….. 3
2.2 Daya Pembeda …………………………………………..………………………............ 3
2.3 Indeks Kesukaran ………………..…….………………………………....……………… 14
2.4 Efektifitas Opsi ……………………………….…………………………………………….. 17
BAB III PENUTUP ………………..………………………………………………………….…………. 23
3.1 Kesimpulan ……………………………………………………............................. 23
3.2 Saran ………………………………………………………………………………..………. 24
DAFTAR PUSTAKA ……………………………………………………………………………..……… 25
BAB I

PEMBAHASAN

1.1 Latar Belakang

Dalam dunia pendidikan, penilaian merupakan bagian yang tidak


terpisahkan dari proses belajar mengajar. Sistem penilaian yang baik akan
mendorong guru menggunakan strategi mengajar yang lebih baik dan
memotivasi anak untuk belajar lebih giat. Penilaian biasanya dimulai dengan
kegiatan pengukuran. Pengukuran (measurement) merupakan cabang ilmu
statistika terapan yang bertujuan untuk membangun dasar-dasar pengembangan
tes yang lebih baik sehingga menghasilkan tes yang berfungsi secara optimal,
valid, dan reliabel.

Proses belajar mengajar dilaksanakan tidak hanya untuk kesenangan atau


bersifat mekanis saja tetapi mempunyai misi atau tujuan bersama. Dalam usaha
untuk mencapai misi dan tujuan itu perlu diketahui apakah usaha yang dilakukan
sudah sesuai dengan tujuan? Untuk mengetahui apakah tujuan pendidikan sudah
tercapai perlu diadakan tes. Sebuah tes yang dapat baik sebagai alat pengukur
harus dianalisis terlebih dahulu. Dalam menganalisis butir soal dalam tes harus
memperhatikan daya serap, tingkat kesukaran, daya beda, fungsi pengecoh,
validitas dan reabilitas. Hal tersebut dilakukan agar tes. yang diberikan kepada
siswa sesuai dengan daya serap siswa, tingkat kesukarannya, dan soal yang
diberikan pun harus valid. Sehingga, tujuan dari pembelajaran dapat tercapai .

1.2 Perumusan Masalah


1. Analisis Butir Soal
2. Daya Pembeda
3. Indeks Kesukaran
4. Efektivitas Opsi
1.3 Tujuan
1. Dapat Menganalisis Butir Soal
2. Mengetahui Apa Itu Daya Pembeda
3. Dapat Memahami Indeks Kesukaran
4. Mengerti Apa Efektivitas Opsi
BAB II

PEMBAHASAN

2.1 Analisis Butir Soal


Analisis soal antara lain bertujuan untuk mengadakan identifikasi soal-
soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis soal dapat
diperoleh informasi tentang kejelekan sebuah soal dan "petunjuk" untuk
mengadakan perbaikan.
Oleh Karena Itu, Analisis butir soal merupakan suatu kegiatan dalam
menentukan tingkat kebaikan butir-butir soal suatu tes. Informasi yang
diperoleh dari kegiatan analisis butir soal dapat digunakan untuk
memperbaiki butir soal yang sudah dibuat.
Analisis butir soal dapat dilakukan secara kualitatif dan kuantitatif.
Analisis secara kualitatif berkaitan dengan isi dan bentuk soal (validitas isi dan
validitas konstruk).
Sedangkan analisis kuantitatif berhubungan dengan ciri-ciri statistiknya,
dianataranya pengukuran validitas, reliabilitas, daya beda, dan tingkat
kesukaran butir soal.

2.2 Daya Pembeda


Daya pembeda soal, adalah kemampuan sesuatu soal untuk membeda
kan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang
bodoh (berkemampuan rendah).
Angka yang menunjukkan besarnya daya pembeda disebut indeks
diskriminasi, disingkat D (d besar). Seperti halnya indeks kesukaran, indeks
diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya
bedanya, indeks kesukaran tidak mengenal tanda negatif (-). tetapi pada
indeks diskriminasi ada tanda negatif. Tanda negatif pada indeks diskriminasi
digunakan jika sesuatu soal "terbalik" menunjukkan kualitas testee. Yaitu
anak pandai disebut bodoh dan anak bodoh disebut pandai.
Dengan demikian, ada tiga titik pada daya pembena, yaitu:

-1,00 0,00 1,00

Daya pembeda daya pembeda daya pembeda

Negative rendah tinggi(positif)

Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa
bodoh maka soal itu tidak baik karena tidak mempunyai daya pembeda.
Demikian pula jika semua siswa baik pandai maupun bodoh tidak dapat
menjawab dengan benar. Soal tersebut tidak baik juga karena tidak mempunyai
daya pembeda. Soal yang baik adalah soal yang dapat dijawab benar oleh siswa-
siswa yang pandai saja.

Pengikut tes dikelompokkan menjadi 2 (dua) kelompok, yaitu kelompok pandai


atau kelompok atas (upper group) dan kelompok bodoh atau kelompok bawah
(lower group).

Jika seluruh kelompok atas dapat menjawab soal tersebut dengan benar, sedang
seluruh kelompok bawah menjawab salah maka soal tersebut mempunyai D
paling besar, yaitu 1,00. Sebaliknya, jika semua kelompok atas menjawab salah,
tetapi semua kelompok bawah menjawab betul maka nilai D-nya -1,00. Akan
tetapi, jika siswa kelompok atas dan siswa kelompok bawah sama-sama
menjawab benar atau sama-sama menjawab salah maka soal tersebut
mempunyai nilai D 0,00. Karena tidak mempunyai daya pembeda sama sekali.

a. Cara Menentukan Daya Pembeda (Nilai D)


Untuk ini perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok
besar (100 orang ke atas).

1) Untuk kelompok kecil


Seluruh kelompok testee dibagi dua sama besar, 50% kelompok atas dan
50% kelompok bawah.
Ex.
Siswa Skor
A 9
Kelompok atas ( J A )
B 8
C 7
D 7
E 6
F 5
G 5
H 4
Kelompok bawah ( )
I 4
JB
J 3

Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai ter bawah, lalu
dibagi 2(dua)

2) Untuk Kelompok Besar


Mengingat biaya dan waktu untuk menganalisis maka untuk kelom pok
besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas
sebagai kelompok atas (₁) dan 27% skor terbawah sebagai kelompok
bawah (₂).
J A : Jumlah kelompok atas
J B : Jumlah kelompok bawah

Ex.
9 -
9 .
8 .
8 .
8 27% sebagai J A 2 27% sebagai J B
. 1
. 1
. 1
- 0

b. Rumus Mencari D

Rumus untuk menentukan indeks diskriminasi adalah:

BA BB
D= - = P A - PB
J A JB

Di mana:

J = jumlah peserta tes

J A = banyaknya peserta kelompok atas

J B = banyaknya peserta kelompok bawah

B A = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar

BB = banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar

P A = proporsi peserta kelompok atas yang menjawab benar (ingat, P sebagai


Indeks Kesukaran)
PB = Proporsi peserta kelompok bawah yang menjawab benar

Contoh Perhitungan

Dari hasil analisis tes yang terdiri dari 10 butir soal yang dikerjakan oleh 20 orang
siswa, terdapat dalam tabel sbb:

TABEL ANALISIS BUTIR SOAL, 20 SISWA

Siswa Kelompok nilai soal Skor


1 2 3 4 5 6 7 8 9 10 siswa
A B 1 0 1 0 0 0 1 1 1 0 5
B A 0 1 1 1 1 1 0 0 1 1 7
C A 1 0 1 0 1 1 1 1 1 1 8
D B 0 0 1 0 0 1 1 1 1 0 5
E A 1 1 1 1 1 1 1 1 1 1 10
F B 1 1 0 0 0 1 1 1 1 0 6
G B 0 1 0 0 0 1 1 1 1 1 6
H B 0 1 1 0 0 1 0 1 1 1 6
I A 1 1 1 0 0 1 1 1 1 1 8
J A 1 1 1 1 0 0 1 0 1 1 7
K A 1 1 1 0 0 1 1 1 1 0 7
L B 0 1 0 1 1 0 0 1 1 0 5
M B 0 1 0 0 0 0 0 1 1 0 3
N A 0 0 1 0 1 1 1 1 1 1 7
O A 1 1 0 1 1 1 1 1 1 1 9
P B 0 1 0 0 0 1 0 0 1 0 3
Q A 1 1 0 1 0 1 1 1 1 1 8
R A 1 1 1 1 0 1 1 1 1 0 8
S B 1 0 1 0 0 1 1 1 1 0 6
T B 0 1 0 1 0 1 1 1 1 0 6
Jumlah 11 15 12 8 6 16 15 17 20 10

Berdasarkan nama-nama siswa dapat diperoleh skor-skor sbb:

A=5 F=7 K=7 P=3

B=7 G=5 L=5 Q=8

C=8 H=3 M=3 R=8

D=5 I=7 N=7 S=6

E = 10 J=9 O=9 T=6

Dari angka-angka yang belum teratur kemudian di buar array(urutan


penyebaran), dari skor yang paling tinggi ke skor yang paling rendah.

Kelompok atas Kelompok bawah

10 8 6 5

9 7 6 5

8 7 6 5

8 7 6 3

8 7 6 3

10 orang 10 orang

Array ini sekaligus menunjukkan adanya kelompok atas ( J A ) dan kelompok


bawah ( J B ) dengan pemiliknya sbb:

kelompok atas ( J A ) kelompok bawah ( J B )

B=7 K=7 A=5 L=5

C=8 N=7 D=5 M=3


E = 10 O=9 F=6 P=3

I=8 Q=8 G=6 S=6

J=7 R=8 H=6 T=6

10 orang 10 orang

Perhatikan pada tabel analisis 10 butir soal 20 siswa. Di belakang nama siswa
dituliskan huruf A atau B sebagai tanda kelompok. Hal ini untuk mempermudah
menentukan B A dan BB

B A = Banyaknya siswa yang menjawab benar pada kelompok atas (A)

BB = Banyaknya siswa yang menjawab benar pada kelompok bawah (B)

Sudah disebutkan bahwa soal yang baik adalah soal yang dapat mem bedakan
antara anak pandai dengan anak bodoh, dilihat dari dapat dan tidaknya
mengerjakan soal itu.

Marilah kita perhatikan tabel analisis lagi, khusus untuk butir soal nomor 1.

1) Dari kelompok atas yang menjawab betul 8 orang.

2) Dan kelompok bawah yang menjawab betul 3 orang.

Kita terapkan dalam rumus indeks diskriminasi.

J A = 10 J B = 10

P A = 0,8 PB = 0,3

BA = 8 BB = 3

Maka, D = P A - PB = 0,8 – 0,3 = 0,5

Dengan demikian, Indeks Diskriminasi untuk soal no 1 adalah 0,5.

Sekarang kita perhatikan butir soal no 8.


J A = 10 J B = 00

P A = 0,8 PB = 0,9

BA = 8 BB = 9

Maka, D = P A - PB = 0,8 – 0,9 = -0,1

Butir soal ini jelek karena lebih banyak dijawab benar oleh kelompok bawah
dibandingkan dengan jawaban benar dari kelompok atas. Ini berarti bahwa untuk
menjawab soal dengan benar, dapat dilakukan dengan menebak.

Butir-butir soal yang baik adalah butir-butir soal yang mem punyai indeks
diskriminasi 0,4 sampai dengan 0.7.

Klasifikasi daya pembeda dibagi menjadi beberapa seperti berikut ini.

 D : 0,00 - 0, 20 jelek (poor)


 D : 0,21 - 0,40 cukup (satistifactory)
 D : 0,41 - 0,70 baik (good)
 D : 0,71 - 1,00 baik sekali (excellent)
 D : negatif, semuanya tidak baik. Jadi semua butir soal yang mempunyai
nilai D negatif sebaiknya dibuang saja.

c. Hubungan antara P dan D

Untuk melihat hubungan antara P dengan D, perlu kita telaah kembali

rumus-rumus untuk menentukannya.

BA BB
D= - ( P - P ) ……………………………………..(1)
J A JB A B

B A B B B A +B A
P= - =
J A JB 2J A

1 BA
= ( )
2 JA
P A + PB
P= …………………………………………………….(2)
2

Dari indeks kesukaran (P) dan indeks diskriminatif (D) dapat di peroleh hubungan
Sebagai berikut:

D max = 2P ……………………………………………..(3)

Sebagai contoh :

Soal dengan P = 0,20

akan memberikan Dmax yang sama.

Dari grafik terlihat bahwa soal-soal dengan nilai P = 0,50 memungkinkan untuk
mendapat daya pembeda yang paling tinggi.

Nilai-nilai P yang dianjurkan oleh penulis-penulis soal adalah antara 0,30 dan
0,70, namun harus diingat bahwa soal-soal itu tidak berarti mempunyai daya
pembela yang tinggi.

 Adapun contoh lainnya yaitu:

Tes pilihan ganda dengan option 4 dibrtikan kepada 30 orang siswa. Jumlah soal
15. Setelah di periksa, datanya adalah sebagai berikut:

Menggunakan rumus SR-ST


No soal Jumlah siswa Jumlah siswa SR - ST Ket
yg menjawab yg menjawab
Salah kel. Salah kel.
Bawah (SR) Atas (ST)
1 6 1 5
2 6 1 5
3 5 2 3
4 6 1 5
5 2 1 1
6 5 1 4
7 2 1 1
8 7 1 6
9 7 1 6
10 4 2 2
11 3 1 2
12 6 1 5
13 2 1 1
14 6 1 5
15 5 2 3
N = 30 orang N = 27% dari 30 = 8

Kriteria yang digunakan dari tabel Ross dan Stanley adalah sbb:

Jumlah N option
Testi (N) (27 % N) 2 3 4 5
28 - 31 8 4 5 5 5
32 - 35 9 5 5 5 5
36 - 38 10 5 5 5 5
Dst.
Kriteria pengujian daya pembeda adalah sbb: Bila SR – ST sama - atau lebih besar
dari nilai tabel, artinya butir soal itu mempunyai daya pembeda.

Dari data di atas, batas pengujian adalah 5, yakni yang pertama dalam tabel di
atas dengan jumlah N (28 - 31), n = 8 pada option 4.

Dengan demikian dapat disimpulakn sbb:

No. item SR - ST Batas Nilai Tabel Keterangan


1 5 5 Diterima
2 5 5 Diterima
3 3 5 Ditolak
4 5 5 Diterima
5 1 5 Ditolak
6 4 5 Ditolak
7 1 5 Ditolak
8 6 5 Diterima
9 6 5 Diterima
10 5 5 Ditolak
11 2 5 Ditolak
12 5 5 Diterima
13 1 5 Ditolak
14 5 5 Diterima
15 3 5 Ditolak
Dari kesimpulan diatas hanya soal nomor 1, 2, 4, 8, 12, dan 14 yang memenuhi
daya pembeda, sedangkan soal nomor lainya tidak memiliki daya pembeda.

Dari contoh di atas dapat disimpulakan bahwa cara meng hitung daya pembeda
adalah dengan menempuh langkah sbb:

a) Memeriksa jawaban soal semua siswa peserta tes.


b) Membuat daftar peringkat hasil tes berdasarkan skor yang dicapainya.
c) Menentukan jumlah sampel, kelompok pandai 27% dan siswa kurang 27%
d) Melakukan analisis butir soal: menghitung jumlah siswa yang menjawab
salah dari semua nomor soal, baik kelomp. pandai maupun kurang.
e) Menghitung selisih jumlah siswa yang salah menjawab pad kelompok
kurang dengan kolompok pandai (SR - ST)
f) Membandingkan nilai selisih yang diperoleh dg nilai tabel Ross & Stanley

Menentukan ada tidaknya daya pembeda pada setiap nomor soal dengan kriteria
"memiliki daya pembeda" bila nilai selisih jumlah siswa yang menjawab salah
antara kelompok kurang dengan kelompok pandaim (SR - ST) sama /lebih besar
dari nilai tabel.

2.3 Indeks Kesukaran

Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal
yang terlalu mudah tidak merangsang siswa untuk mem pertinggi usaha
memecahkannya. Sebaliknya, soal yang terlalu sukar akan menyebabkan siswa
menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di
luar jangkauannya.

Seorang siswa akan menjadi hafal akan kebiasaan guru-gurunya dalam hal
pembuatan soal ini. Misalnya saja guru A dalam memberikan ulangan soalnya
mudah-mudah, sebaliknya guru B kalau memberikan ulangan soalnya sukar-
sukar. Dengan pengetahuannya tentang kebiasaan ini, maka siswa akan belajar
giat jika menghadapi ulangan dari guru B dan sebaliknya jika akan mendapat
ulangan dari guru A, tidak mau belajar giat atau bahkan mungkin tidak mau
belajar sama sekali.

Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks
kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 sampai
dengan 1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan
indeks kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar. Sebaliknya,
indeks 1,0 menunjukkan bahwa soalnya terlalu mudah.

Di dalam istilah evaluasi, indeks kesukaran ini diberi simbol P (p besar), singkatan
dari kata "proporsi". Dengan demikian, soal dengan P = 0,70 lebih mudah jika
dibandingkan dengan P = 0, 20 Sebaliknya, soal dengan P = 0, 30 lebih sukar
daripada soal dengan P = 0, 80

Melihat besarnya bilangan indeks ini, maka lebih cocok jika bukan disebut
sebagai indeks kesukaran, tetapi indeks kemudahan atau indeks fasilitas, karena
semakin mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi,
telah disepakati bahwa walaupun semakin tinggi indeksnya menunjukkan soal
yang semakin mudah, tetapi tetap disebut indeks kesukaran.

B
Rumus mencari P adalah: p=
JS

Di mana:

P = indeks kesukaran

B = banyaknya siswa yang menjawab soal itu dengan betul

JS = jumlah seluruh siswa peserta tes

Ex.

Guru SKI memberikan 10 pertanyaan pilihan berganda dengan komposisi 3 soal


mudah 4 soal sedang dan 3 soal sukar/sulit. Jika dilukiskan susunan soalnya
adalah sbeagai berikut:

No soal Abilitas yang diukur Tingkat Kesukaran


1 pengetahuan mudah
2 aplikasi sedang
3 pemahaman mudah
4 analisisi sedang
5 evaluasi sukar
6 sitetis sukar
7 pemahaman mudah
8 aplikasi Sedang
9 analisis sedang
10 sitetis sukar
Kemudian soal tersebut diberikan kepada 20 orang siswa, dan tidak seorang pun
yang tidak mengisi seluruh pertanyaan tersebut. Setelah di periksa, hasilnya
adalah sebagai berikut:

N B B Indeks K
o a a B a
JS
n n t
s y y e
o a a g
a k k p
l si si ri
s s s
w w o
a a a
y y l
g g
m m
e e
nj nj
a a
w w
a a
b b
(J (
S) B
)
1 2 1 0,9 m
0 8 u
d
a
h
2 2 1 0,6 s
0 2 e
d
a
n
g
3 2 1 0,5 s
0 0 e
d
a
n
g
4 2 2 1,0 m
0 0 u
d
a
h
5 2 6 0,3 s
0 u
k
a
r
6 2 4 0,2 s
0 u
k
a
r
7 2 1 0,8 m
0 6 u
d
a
h
8 2 1 0,55 s
0 1 e
d
a
n
g
9 2 1 0,85 m
0 7 u
d
a
h
1 2 5 0,25 s
0 0 u
k
a
r
Dari sebaran di atas ternyata ada 3 soal yang melset, yakni soal no 3 yang semula
di proyeksikan kedalam kategori mudah, setelah di coba ternyata masuk ke
dalam kategori sedang.
Demikian juga soaln no 4 yang semula di proyeksikan sedang ternyata masuk ke
dalam kategori mudah. Soal no 9 semula di proyeksikan sedang ternyata masuk
kedalam kategori mudah. Sedangkan 7 soal lainnya sesuai dengan proyeksi
semula. Atas dasar tersebut ketiga soal di atas harus di perbaiki kembali.

Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan


sebagai berikut.

 Soal dengan P 0,00 sampai 0,30 adalah soal sukar


 Soal dengan P 0,31 sampai 0,70 adalah soal sedang
 Soal dengan P 0,71 sampai 1,00 adalah soal mudah

Walaupun demikian, ada yang berpendapat bahwa soal-soal yang dianggap baik,
yaitu soal-soal sedang, adalah soal-soal yang mempunyai indeks kesukaran 0,30
sampai dengan 0,70.

Perlu diketahui bahwa soal-soal yang terlalu mudah atau terlalu sukar, lalu tidak
berarti tidak boleh digunakan. Hal ini tergantung dan penggunaannya. Jika dari
pengikut yang banyak, kita menghendaki yang lulus hanya sedikit, kita ambil
siswa yang paling top. Untuk ini maka lebih baik diambilkan butir-butir tes yang
sukar.

Sebaliknya, jika kekurangan pengikut ujian, kita pilihkan soal-soal yang mudah.
Selain itu, soal yang sukar akan menambah gairah belajar bagi siswa yang pandai,
sedangkan soal-soal yang terlalu mudah, akan membangkitkan semangat kepada
siswa yang lemah.

2.4 Efektifitas Opsi

Yang dimaksud efektifitas opsi di sini adalah distribusi testee dalam hal
menentukan pilihan jawaban pada soal bentuk pilihan ganda. Efektifitas opsi
pada soal diperoleh dengan menghitung banyaknya testee yang memilih pilihan
jawaban a, b, c, atau d atau yang tidak memilih pilihan manapun (blangko).
Dalam istilah evaluasi disebut omit, disingkat 0.
Dan efektifitas opsi pada soal dapat ditentukan apakah pengecoh (distractor)
berfungsi sebagai pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih
sama sekali oleh testee berarti bahwa pengecoh itu jelek, terlalu menyolok
menyesatkan. Sebaliknya, sebuah distraktor (pengecoh) dapat dikatakan
berfungsi dengan baik apabila distraktor tersebut mempunyai daya tarik yang
besar bagi pengikut-pengikut tes yang kurang memahami konsep atau kurang
menguasai bahan.

Dengan melihat pola jawaban soal, dapat diketahui:

a. taraf kesukaran soal;


b. daya pembeda soal; dan
a. C. baik dan tidaknya distraktor.

Sesuatu distraktor dapat diperlakukan dengan 3 (tiga) cara:

a. diterima, karena sudah baik;


b. ditolak, karena tidak baik; dan
c. ditulis kembali, karena kurang baik.

Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga


hanya perlu ditulis kembali, dengan perubahan seperlunya. Menulis soal adalah
suatu pekerjaan yang sulit sehingga apabila masih dapat diperbaiki, sebaiknya
diperbaiki saja, tidak dibuang. Suatu distraktor dapat dikatakan berfungsi baik
jika paling sedikit dipilih oleh 5% pengikut tes.

Dalam tabel yang memuat analisis jawaban 30 orang siswa, dengan pilihan
jawaban a, b, c, dan d. Sebetulnya, banyaknya soal yang dikerjakan ada 50 butir,
tetapi yang dikutip hanya 15 butir. Di atas tabel tersebut terdapat keterangan
bahwa subjek nomor 1 betul semua, artinya semua pilihan jawaban mendapat
skor 1, dan dia mendapat jumlah skor 50. Siswa yang pilihan jawabannya sama
dengan siswa nomor 1, berarti skornya 1. Cara menganalisis tabel tersebut
adalah sebagai berikut.
a. Bubuhkan skor 1 untuk semua butir pada semua siswa yang pilihannya sama
dengan siswa nomor 1. Sebaiknya, pemberian skor dilakukan butir demi butir,
jadi mulai dari butir 1. Siswa yang memilih a, diberi skor 1, yang bukan a diberi
skor 0. Untuk siswa yang tidak memilih, yaitu dengan tanda - diberi skor 0.
Setelah penskoran butir 1 selesai, dijumlahkan ke bawah, ada berapa siswa yang
mendapat skor 1. Jumlahan skor itulah nanti yang menunjukkan taraf kesukaran,
sesudah dibagi dengan 30 dan dikalikan 100. Daya pembeda untuk tiap-tiap butir
juga langsung dapat dicari, menggunakan rumus yang sudah dijelaskan untuk
menentukan daya pembeda.

b. Lanjutkan memberi skor butir 2. Untuk skor butir 2, karena siswa nomor 1
memilih c maka semua siswa yang memilih c diberi skor 1, yang lainnya 0.
Demikian juga untuk butir nomor 3, karena siswa nomor 1 memilih c dan betul
maka semua siswa yang memilih c diberi skor 1, yang bukan pilihan c diberi skor
0.

c. Setelah selesai memberikan skor sampai dengan nomor 15 maka sudah dapat
diketahui jumlah skor 1 pada setiap butir. Selanjutnya, dapat diketahui taraf
kesukaran dan daya pembeda dari masing masing butir, menggunakan rumus
yang sudah dipraktikkan dalam perhitungan terdahulu.

d. Untuk mengetahui penyebaran pilihan siswa, yaitu menentukan pola jawaban


siswa, digunakan tabel kontingensi sebagai 2 × 5, ditambah baris judul dan kolom
judul. Sebagai contoh, kita akan menganalisis dan membuat pola jawaban untuk
butir 1. Banyaknya jari-jari untuk pilihan jawaban, dimasukkan dalam kolom
sesuai pilihan jawaban. Dalam hal ini kita mempunyai 5 kolom pilihan jawaban,
yaitu kolom jawaban a, b, c, dan d, kemudian kita tambahkan kolom lagi untuk
yang tidak memilih. Tidak menentukan pilihan jawaban ini disebut omit artinya
tidak menjawab. Marilah kita masukkan banyaknya pilihan tiap jawaban sebagai
berikut.
1) Kunci jawaban yang betul adalah pilihan maka kita beri tanda
bintang.
2) Untuk menentukan Kelompok Atas (KA) dan Kelompok Bawah
(KB), kita ambil dari skor total, kita urutkan skor dari paling atas
sampai paling bawah lalu kita beri tanda di kolom "Subjek"
sebelah kanannya dengan At dan Bw.
3) Dari hasil mengurutkan skor dari paling atas sampai paling bawah
diketahui bahwa siswa yang masuk kelompok atas (At) adalah skor
35 atau lebih, dan kelompok bawah (Bw) adalah siswa yang
mendapat skor 32 atau kurang.

Kelompok/pilihan a* b c d om Jumlah
Kelompok atas 2 1 9 2 1 15
Kelompok bawah 1 4 5 4 1 15
Jumlah 3 5 14 6 2 30

 Setelah dimasukkan ke dalam tabel kontingensi 2 × 5 dapat diketahui


bahwa sebaran pilihan jawaban adalah sebagai berikut.
1) Yang memilih a ada 3 orang, 2 orang kelompok atas (At) dan 1
orang dari kelompok bawah (Bw).
2) Yang memilih b ada 5 orang, yaitu 1 orang dari kelompok atas (At)
dan 4 orang dari kelompok bawah (Bw).
3) Yang memilih c ada 14 orang, yaitu dari kelompok atas (At) 9
orang dan dari kelompok bawah (Bw) 14 orang.
4) Yang memilih d ada 6 orang, yaitu dari kelompok atas (At) 2 orang
dan dari kelompok bawah (Bw) 4 orang.
5) Yang tidak memilih (omit) ada 2 orang, masing-masing 1 orang
dari kelompok atas dan kelompok bawah.
 Apakah tidak lanjut dari guru setelah diketahui pola jawaban seperti ini?
Inilah gunanya mengetahui pola jawaban, yaitu untuk mengetahui
kualitas butir soal yang dibuat oleh guru, yaitu sebagai berikut.

1) Pilihan a, adalah kunci jawaban, yaitu jawaban yang betul, dan diharapkan
semua siswa dapat menjawab dengan betul, yaitu memilih a. Ternyata yang
memilih a hanya 3 orang, berarti butir soal tersebut terlalu sukar. Anak pandai
saja yang dapat menjawab hanya 2 orang, dan kebetulan anak bodoh (kelompok
bawah) ada yang beruntung satu orang.

2) Pilihan b adalah pengecoh. Dari 30 orang siswa yang terkecoh ada 5 orang,
yaitu dari At 1 orang dan dari Bw 4 orang. Pilihan salah seperti ini adalah wajar.
Yang terkecoh adalah siswa-siswa yang belum menguasai materi.

3) Pilihan c adalah pengecoh yang oleh guru dipandang hanya me rupakan


alternatif jawaban yang salah. Akan tetapi, mengapa justru hampir separuh dari
siswa memilih jawaban itu? Dalam hal seperti ini guru harus berpikir keras,
mengapa pemahaman siswa seperti itu?

4) Pilihan biasa, ada siswa yang terkecoh, yaitu 6 orang, dari kelompok atas (At) 2
orang dan dari kelompok bawah (Bw) 4 orang.

5) Omit ada 2 orang, masing-masing dari kelompok atas dan kelompok bawah.
Keadaan seperti ini pun wajar.

 Jika guru menjumpai hasil pemaparan pola jawaban seperti ini, harus
dapat mengambil kesimpulan bahwa ada kemungkinan dua penye bab
sebagai berikut.

1) Butir soal yang dibuat tidak baik, karena dapat menyesatkan hampir separo
dari jumlah siswa memilih c. Kesimpulan semen tara yang dapat diambil adalah
bahwa pilihan c mempunyai daya tarik yang besar sehingga seolah-olah pilihan
jawab itulah yang benar, mungkin rumusan kalimatnya, atau mungkin isi soalnya
menunjukkan kalau benar.
2) Yang menarik siswa bukan butir soalnya, tetapi materi yang dikuasai siswa
memang seperti yang tertera dalam pilihan c itu. Kalau memang maksud yang
dikehendaki oleh guru adalah materi seperti butir a, maka mungkin ketika guru
mengajar, yang diterima oleh siswa seperti materi dalam c. Jika seperti ini yang
terjadi, maka guru harus mengulang mengajar agar penguasaan materi yang
dimiliki oleh siswa adalah seperti yang tertera dalam opsi a.

 Jadi, kini marilah kita berlatih lagi dengan pola jawaban, yaitu butir nomer
4, dan 6. Butir soal 4 kunci jawabannya adalah c, dan kunci jawaban butir
soal 6 adalah d. Sesudah itu lanjutkan membaca contoh perhitungan yang
ada di buku.

Contoh perhitungan:

Dari analisis sebuah item, polanya diketahui sebagai berikut.

Pilihan a b C* d 0 jumlah
Jawaban
Kelompok 5 7 15 3 0 30
atas
Kelompok 8 8 6 5 3 30
bawah
jumlah 13 15 21 9 3 60
*)adalah kunci jawaban

21
1) P = = 0,35
60

15 6 9
2) D = P A - PB = - = = 0,30
30 30 30

3) Distraktor: semua distraktornya sudah berfungsi dengan baik karena sudah


dipilih oleh lebih dari 5% pengikut tes.
4) Dilihat dari segi omit (kolom pilihan paling kanan) adalah baik. Sebuah item
dikatakan baik jika omitnya tidak lebih dari 10% pengikut tes.

(5% dari pengikut tes = 5% x 60 orang = 3 orang)

Sebenamya ketentuan ini hanya berlaku untuk tes pilihan ganda dengan 5
alternatif dan P = 0, 80 . Tetapi demi praktisnya diberlakukan untuk semua.

BAB III
PENUTUP

3.1 Kesimpulan
Berdasarkan uraian pembahasan tersebut di atas, maka dapat
disimpulkan bahwa Indeks kesukaran adalah bilangan yang menunjukkan
sukar atau mudahnya suatu soal. Soal yang baik dan bermutu adalah soal
yang memiliki taraf kesukaran seimbang antara mudah, sedang, sulit.
Untuk menafsirkan Indeks kesukaran soal dapat digunakan kriteria yaitu,
jika jumlah peserta didik yang gagal mencapai 27% termasuk mudah, jika
jumlah peserta didik yang gagal antara 28% sampai dengan 72% termasuk
sedang, dan jika jumlah peserta didik yang gagal 73% ke atas termasuk
sukar.
Daya pembeda soal adalah kemampuan sesuatu soal untuk
membedakan antara siswa yang pandai (berkemampuan tinggi) dengan
siswa yang kurang pintar (berkemampuan rendah). Angka yang
menunjukkan besarnya daya pembeda disebut indeks diskriminasi,
disingkat D. Indeks diskriminasi berkisar antara 0,00 sampai 1,00. Angka
yang menunjukkan besarnya daya beda disebut Indeks Diskriminasi
berkisar antara 0,00 sampai 1,00, Akan tetapi pada indeks diskriminasi ini
mengenal ada tanda negatif (-) yakni -1,0 ---------------- 0,0 ---------------- 1,0
(semakin ke kanan soal semakin baik, semakin ke kiri maka soal semakin
jelek, sebab semakin ke kanan siswa yang pandai semakin sulit tidak bisa
menjawab dan sebaliknya siswa yang kurang pintar (kiri) bisa menjawab
dengan asal-asalan). Butir soal tes yang baik juga harus dapat
menunjukan daya pembedanya. Manfaat daya pembeda butir soal
diantaranya adalah untuk meningkatkan mutu setiap butir soal melalui
data empiriknya, dan untuk mengetahui seberapa jauh setiap butir soal
dapat mendeteksi atau membedakan kemampuan siswa.
Efektivitas opsi yaitu suatu pola yang dapat menggambarkan
bagaimana testee menentukan pilihan jawabannya terhadap
kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap
butir item. Butir soal yang baik, pengecohnya akan dipilih secara merata
oleh peserta didik yang menjawab salah. Sebaliknya, butir soal yang yang
kurang baik, pengecohnya akan dipilih secara tidak merata.
Pengecoh dianggap bila jumlah peserta didik yang memilih pengecoh itu
sama atau mendekati jumlah ideal.
3.2 Saran

Ketika kita menjadi pengajar dan pendidik, sebaiknya dalam penyusunan


instrument tes, seperti soal tes hendaknya disesuaikan dengan kriteria
penyusunan soal yang baik dan benar Dimana, indeks kesukarannya
diperhatikan, daya pembeda disesuaikan, efektifitas opsi berfungsi dengan
baik. Dan juga ketika diuji dengan validitas maupun realibilitas sesuai dengan
kualitas dan metode pembelajaran yang menjunjung tinggi cita-cita guru
Indonesia untuk mencerdaskan kehidupan bangsa.
DAFTAR PUSTAKA

Arikunto, Suharsimi. 2018. Dasar-dasar Evaluasi Pendidikan. Jakarta: PT Bumi


Aksara

Purwnto. 2009. Evaluasi Hasil Belajar. Yogyakarta: Pustaka Pelajar

Jihad, Asep. Haris, Abdul. 2013. Evaluasi Pembelajaran. Yogyakarta: Multi


Pressindo

Rohmad. 2017. PengembanganInstrumen Evaluasi Dan Penelitian. Yogyakarta:


Kalimedia

Sulistyorini. 2009. Evaluasi Pendidikan Dalam Meningkatkan Mutu Pendidikan.


Yogyakarta: Teras

Arifin, Zainal. 2009. Evaluasi Pembelajaran. Bandung: PT Remaja Rosdakarya

Anda mungkin juga menyukai