Anda di halaman 1dari 21

MAKALAH

ANALISIS BUTIR TES

DOSENPENGAMPU : SUSILAWATI AMDAYANI,S.Si,M.Pd


: Dr. AYI DARMANA, M.Si.

KELOMPOK 2 :
DINA ASIMA OCTAVIA HUTABARAT (4203131009)
RAHMA FAUZIAH HERLANDA (4203131003)

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM


PROGRAM STUDI PENDIDIKAN KIMIA
UNIVERSITAS NEGERI MEDAN
APRIL 2021

i
KATA PENGANTAR

Puji syukur kehadirat Tuhan Yang Maha Esa yang telah memberikan rahmat dan
hidayah-Nya sehingga penulis dapat menyelesaikan tugas makalah yang berjudul “Analisis
Butir Tes” ini tepat pada waktunya.Adapun tujuan dari penulisan dari makalah ini adalah
untuk memenuhi tugas Dosen pengampu pada mata kuliah “Evaluasi Penilaian Hasil Belajar
Kimia”.Selain itu,makalah ini juga bertujuan untuk menambah wawasan tentang“Evaluasi
Penilaian Hasil Belajar Kimia” bagi para pembaca dan juga bagi penulis.
Penulis mengucapkan terima kasih kepada Ibu Susilawati Amdayani,S,Si,M.Pd dan
Bapak Dr.Ayi Darmana,M.Si selaku Dosen pengampu mata kuliah “Evaluasi Penilaian Hasil
Belajar Kimia” yang telah memberikan tugas ini serta memberikan pengarahan,sehingga
dapat menambah pengetahuan dan wawasan sesuai dengan bidang studi yang penulis tekuni.
Penulis menyadari bahwa makalah yang ditulis ini masih jauh dari kata sempurna.Oleh
karena itu,kritik dan saran yang membangun akan penulis nantikan demi kesempurnaan
makalah ini. Akhir kata penulis mengucapkan terimakasih.

Medan, 18 April 2021

Penulis

ii
DAFTAR ISI

BAB I PENDAHULUAN ......................................................................................................... 4

1.1 LATAR BELAKANG…………………………………………………………………..1

1.2 RUMUSAN MASALAH……………………………………………………………….2

1.3 TUJUAN PENULISAN………………………………………………………………...2


BAB II PEMBAHASAN .......................................................................................................... 6

2.1 PENGERTIAN ANALISIS BUTIR TES ........................................................................ 6

2.2 TUJUAN ANALISIS BUTIR TES ................................................................................. 7

2.3 MANFAAT ANALISIS BUTIR TES ............................................................................. 7

2.4 KELOMPOK PESERTA TES ........................................................................................ 9

2.5 KARAKTERISTIK BUTIR SOAL................................................................................. 9

2.6 KLASIFIKASI KUALITAS BUTIR SOAL …………………………………………12

2.7 EFEKTIVITAS PENGECOH…………………………………………………………13

2.8 ANALISIS BUTIR SOAL SECARA KUALITATIF………………………………...15

2.9 ANALISIS BUTIR SOAL SECARA DAN KUANTITATIF………………………..16

BAB III PENUTUP .................................................................................................................. 1

3.1 KESIMPULAN ................................................................................................................ 1

3.2 SARAN………………………………………………………………………………..15
DAFTAR PUSTAKA……………………………………………………………………….16

iii
BAB I
PENDAHULUAN
1.1 LATAR BELAKANG
Kedudukan evaluasi dalam proses belajar mengajar sangat penting dan tidak dapat
dipisahkan.Demikian juga,agar proses evaluasi itu berfungsi dengan semestinya dan sesuai
tujuan, maka alat evaluasi itu sendiri harus baik.Hal ini seringkali dilupakan oleh para
praktisi pendidikan di lapangan, mereka hanya berhenti pada pelaporan hasil evaluasi tanpa
merasa perlu untuk mengetahui seberapa baik alat evaluasi yang telah mereka gunakan. Alat
evaluasi yang dimaksud adalah tes hasil belajar yang berisi butir-butir soal (item soal).
Analisis butir soal atau analisis item adalah pengkajian pertanyaanpertanyaan tes agar
diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai (Sudjana,2006).
Menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk
meningkatkan mutu soal yang dibuat.Kegiatan ini merupakan proses pengumpulan,
peringkasan,dan penggunaan informasi dari jawaban siswa untuk membuat keputusan tentang
setiap penilaian.Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-
tepatnya sesuai dengan tujuannya di antaranya dapat menentukan peserta didik mana yang
sudah atau belum menguasai materi yang diajarkan guru (Sartika, 2013).
Dalam analisis butir soal terdapat dua istilah yang digunakan yaitu karakteristik dan
spesifikasi butir soal.Analisis soal secara kuantitatif menekankan pada karakteristik internal
tes melalui data yang diperoleh secara empiris (Supriadi,2007).Dalam menentukan
karakteristik butir soal,pada umumnya dipertimbangkan tiga hal,yaitu:
1. Tingkat kesukaran
2. Daya beda
3. Berfungsi tidaknya pilihan jawaban atau pengecoh (Ratnaningsih,2011).Karakter-
karakter butir soal tersebut sangat menentukan kualitas butir soal.
Mengukur tingkat kesukaran,daya pembeda,dan pengecoh diharapkan akan mampu
memberikan informasi yang akurat tentang kemapuan siswa yang sebenarnya.Pengukuran
tingkat pengecoh soal dipergunakan pada analisis soal pilihan ganda yang memiliki alternatif
jawaban lebih dari satu, sedangkan pada soal uraian tidak memiliki pengecoh soal.
2.2 RUMUSAN MASALAH
1. Apa pengertian analisis butir soal?
2. Apa Tujuannya?
3. Bagaimana penganalisisan terhadap butir soal?

4
2.3 TUJUAN PENULISAN
1. Mengetahui pengertian analisis butir soal.
2. Mengetahui tujuan penganalisisan.
3. Mengetahui bagaimana penganalisisan terhadap butir soal.

5
BAB II
PEMBAHASAN
2.1 Pengertian Analisis Butir Tes

Analisis butir tes adalah suatu prosedur yang sistematis,yang akan memberikan informasi-
informasi yang sangat khusus terhadap butir tes yang kita susun.Item analisis merupakan
bagian integral dari validitas dan reliabilitas sebuah tes,dan item analisis ini dilakukan oleh
seorang evaluator,biasanya sesudah semua item yang telah diberikan pada siswa di
kembalikan,dan skornya sudah ditentukan.Disamping itu,ketika seorang guru hendak
melakukan analisis item suatu tes,sebaiknya ia memerhatikan apakah tes yang hendak
dianalisis mengacu pada bentuk tes normatif atau pada bentuk kriterion (criterion referenced
mastery test).Perhatian (referenced test) atau pada bentuk kriterion (criterion referenced
mastery test ).Perhatian terhadap acuan dengan melihat apakah mengacu pada acuan normatif
atau acuan kriterion,karena analisis item yang digunakan dalam normatif pada prinsipnya
tidak secara langsung dapat dipakai pada tes yang berbentuk kriterion (criterion referenced
mastery test ).Hal dapat dipakai pada tes yang berbentuk kriterion (criterion referenced
mastery test ). Hal ini dikarenakan pada tes kriterion ini direncanakan untuk mendeskripsikan
kemampuan siswa sebagai konsekuensi hasil belajar bisa ditampilkan.Pada tes yang
berbentuk siswa sebagai konsekuensi hasil belajar bisa ditampilkan.Pada tes yang berbentuk
kriterion, indeks kesulitan dan indeks pembeda tidak terlalu bermanfaat.Hal ini berbeda
kriterion, indeks kesulitan dan indeks pembeda tidak terlalu bermanfaat.Hal ini juga berbeda
dengan tes normatif yang berusaha menentukan posisi atau rangking siswa dengan siswa
lainnya dalam satu grup kelas yang sama.
Item analisis merupakan suatu hal yang diperlukan kehadirannya.Menurut Thorndike dan
Hagen (1977),analisis tehadap soal-soal (items) tes yang telah dijawab oleh murid-murid
mempunyai dua tujuan penting.Pertama,jawaban-jawaban soal itu merupakan informasi
diagnostik untuk meneliti pelajaran dari kelas itu dan kegagalan-kegagalan belajarnya,serta
selanjutnya untuk membimbing ke arah cara belajar belajar yang yang lebih baik.Kedua,
jawaban-jawaban terhadap soal-soal yang terpisah dan perbaikan (review) soal-soal yang
didasarkan atas jawaban-jawaban itu merupakan basis pakan bagi penyiapan tes bagi
penyiapan tes-tes yang lebih baik untuk ditahun berikutnya
Jadi tujuan khusus dari item analysis ialah mencari soal tes mana yang baik dan mana
yang tidak baik.Dengan item analysis itu selanjutnya kita dapat mencari kemungkinan
6
mengetahui soal-soal yang tidak baik itu selanjutnya kita dapat mencari kemungkinan sebab-
sebab mengapa item itu tidak baik.Dengan membuat analisis soal,sedikitnya dapat
mengetahui tiga hal penting yang dapat diperoleh dari tiap soal, yaitu :
a. Sampai dimana tingkat atau taraf kesukaran soal itu (difficulty level of an item)
b. Apakah soal itu mempunyai daya pembeda (discriminating power) sehingga dapat
membedakan kelompok siswa yang pandai dengan kelompok siswa yang bodoh
c. Apakah semua alternatif jawaban (options) menarik jawaban-jawaban, ataukah ada
yang demikian tidak menarik sehingga tidak perlu dimasukkan kedalam soal
2.2 Tujuan Analisis Butir Tes

Analisis butir tes dilakukan dengan tujuan mencari butir tes yang berkualitas untuk
diguankan sebagai perangkat ukur hasil belajar atau instrumen penelitian dalam bidang
kognitif.Disamping itu analisis butir juga digunakan untuk menemukan butir mana yang
menyebabkan reliabilitas pengukuran menjadi rendah.Melakukan uji coba,analisis butir
menyebabkan reliabilitas pengukuran menjadi rendah.Uji coba analisis butir dapat digunakan
untuk melakukan pembuangan,perbaikan,atau penggantian sehingga alat ukur menjadi
berkualitas.
Faedah mengadakan analisis soal yaitu :
a. Membantu kita dalam mengidentifikasi butir-butir soal yang jelek.
b. Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal
untuk kepentingan lebih lanjut
c. Memperoleh gambaran secara selintas tentang keadaan
2.3 Manfaat Analisis Butir Tes
• Sangat relevan bagi penyusunan tes informal dan lokal seperti tes yang disiapkan guru
untuk siswa di kelas
• Mendukung penulisan butir soal yang efektif
• Secara materi dapat memperbaiki tes di kelas
• Meningkatkan validitas soal dan reliabilitas
• Menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan
• Memberi masukan kepada siswa tentang kemampuan dan sebagai dasar untuk bahan
diskusi di kelas
• Memberi masukan kepada guru tentang kesulitan siswa
• Memberi masukan pada aspek tertentu untuk pengembangan kurikulum
• Merevisi materi uang dinilai atau diukur
7
• Meningkatkan keterampilan penulisan soal Sehingga dapat disimpulkan bahwa
kegunaan analisis butir soal adalah :
a. Untuk menentukan soal-soal yang cacat atau tidak berfungsi penggunaannya
b. Untuk meningkatkan butir soal melalui tiga komponen analisis yaitu tingkat
kesukaran,daya pembeda,dan pengecoh soal,serta meningkatkan pembelajaran melalui
ambiguitas soal dan keterampilan tertentu yang menyebabkan siswa sulit.
Analisis butir soal yang dibahas adalah penelaahan soal secara kuantitatif maksudnya
adalah penelaahan butir soal didasarkan pada data empiric dari butir soal yang
bersangkutan.Data empiric ini diperoleh dari soal yang telah diujikan.Ada dua pendekatan
dalam analisis secara kuantitatif, yaitu pendekatan secara klasik dan modern.
1. Klasik Proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna
meningkatkan mutu butir soal yang bersangkutan dengan menggunakan tes klasik.
Kelebihan analisis butir soal secara klasik adalah murah,dapat dilaksanakan sehari-hari
dengan cepat mengunakan computer,murah, sederhana,familiar dan dapat menggunakan data
dari beberapa peserta didik atau sampel kecil.
Proses analisisnya sudah banyak dilaksanakan oleh para guru di sekolah seperti contoh
beriut ini:
A. Langkah pertama yang dilakukan adalah menabulasi jawaban yang telah dibuat pada
setiap soal yang meliputi berapa peserta didik yang
• Menjawab benar pada setiap soal
• Menjawab option pengecoh
• Tidak menawab soal.
Berdasarkan tabulasi ini,dapat diketahui tingkat kesukaran tiap butir soal,daya pembeda
soal, alternative jawaban yang dipilih peserta didik.Misalnya analisis untuk 32 siswa maka
langkah-langkahnya:
1. Urutkan skor dari yang tertinggi sampai yang terendah
2. Pilih 10 lembar jawaban pada kelompok atas dan 10 lembar jawaban pada kelompok
bawah.
3. Ambil kelompok tengah 12 lembar jawaban dan tidak disertakan dalam analisis
4. Untuk masing-masing soal,susun jumlah siswa kelompok atas dan bawah pada setiap
pilihan jawaban.
5. Hitung tingkat kesukaran pada setiap butir soal.
6. Hitung daya pembeda soal

8
7. Analisis efektivitas pengecoh soal.Aspek yang diperhatikan dalam analisis butir soal
secara klasik adalah tiap butir soal ditelaah dari segi: tingkat kesukaran butir, daya
pembeda butir,dan penyebaran pilihan jawaban untuk soal bentuk obyektif atau
frekuensi jawaban pada setiap pilihan jawaban.Tingkat Kesukaran TK Adalah
peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang
biasanya dinyatakan dalam bentuk indeks.Indeks tingkat kesukaran ini pada umumnya
dunyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 – 1,00
2.4 Kelompok Peserta Tes

Kemampuan peserta tes (M) dapat dikelompokkan menjadi kelompok tinggi, Kemampuan
peserta tes ( M ) dapat dikelompokkan menjadi kelompok tinggi,sedang,dan kelompok
rendah.Dalam analisis butir, pengelompokkan ini diperlukan.Pembagian kelompok
berdasarkan skor kemampuan peserta tes dan ada beberapa cara yang dapat digunakan,yaitu
1. Kelompok tinggi ( Mt ) 50% dan kelompok rendah ( Mr ) 50%.
2. Kelompok tinggi ( Mt ) 33% dan kelompok rendah ( Mr ) 33% sisanya kelompok
sedang ( Ms ) 34%.
3. Kelompok tinggi ( Mt ) 27% dan kelompok rendah ( Mr ) 27% ssisanya kelompok
sedang (Ms ) 46%.
4. Kelompok tinggi ( Mt ) 20 % dan kelompok rendah ( Mr ) 20%
2.5 Karakteristik Butir Soal
a. Tingkat Kesukaran (Difficulty level)

Menurut Asmawi Zainul, dkk (1997) tingkat kesukaran butir soal adalah proporsi peserta
tes menjawab benar terhadap butir soal tersebut.Tingkat kesukaran butir soal biasanya
dilambangkan dengan p.Makin besar nilai p yang berarti makin besar proporsi yang
menjawab benar terhadap butir soal tersebut,makin rendah tingkat kesukaran butir soal itu.
Hal ini mengandung arti bahwa soalitumakinmudah,demikianpula sebaliknya.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar.Soal yang
terlalu mudah tidak merangsang mahasiswa untuk mempertinggi usaha memecahkannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan mahasiswa menjadi putus asa dan
tidak mempunyai semangat untuk mencoba lagi karena diluar jangkauannya (Suharsimi
Arikunto: 2001).
Tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal itu baikatau tidak.
Tingkat kesukaran butir hanya menunjukkan bahwa butir soal itu sukaratau mudah untuk
kelompok peserta tes tertentu. Butir soal hasil belajar yangterlalu sukar atau terlalu mudah
9
tidak banyak memberi informasi tentang butir soalataupesertates (Asmawi Zainul, dkk
:1997).
Pada analisis butir soal secara klasikal, seperti yang dijelaskan oleh Depdikbud (1997)
tingkat kesukaran dapat diperoleh dengan beberapa cara antara lain :
a. Skala kesukaran linier
b. Skala bivariat
c. Indeks davis
d. Proporsimenjawab benar.
Besarnya tingkat kesukaran berkisar antara 0,00 sampai 1,00.Untuk sederhananya,
tingkat kesukaran butir dan perangkat soal dapat dibagi menjadi tiga kelompok, yaitu
mudah,sedang dan sukar.Sebagai patokan menurut(Asmawi Zainul, dkk: 1997) dapat
digunakan tabel sebagaiberikut:

Tingkat Kesukaran Nilai p


Sukar 0,00 – 0,25
Sedang 0,26 – 0,75
Mudah 0,76 – 1,00

Untuk menyusun suatu naskah ujian sebaiknya digunakan butir soal yangmempunyai
tingkat kesukaran berimbang,yaitu :soal berkategori sukar sebanyak 25%, kategori sedang
50% dan kategori mudah 25%.
Dalam penggunaan butir soal dengan komposisi seperti di atas,maka dapat diterapkan
penilaian berdasar acuan norma atau acuan patokan.Bila komposisi butir soal dalam suatu
naskah ujian tidak berimbang,maka penggunaan penilaian acuan norma tidaklah tepat,
karena informasi kemampuan yang dihasilkan tidaklah akan berdistribusi normal.
Walaupun demikian ada yang berpendapat bahwa soal-soal yang dianggap baik
adalah soal-soal yang sedang,yaitu soal-soal yang mempunyai indeks kesukaran berkisar
antara 0,26–0,75.Berbagai kriteria tersebut mempunyai kecenderungan bahwa butir soal
yang memiliki indeks kesukaran kurang dari 0,25 dan lebih dari 0,75 sebaiknya dihindari
atau tidak digunakan,karena butir soalyang demikian terlalu sukar atau terlalu mudah,
sehingga kurang mencerminkanalatukur yang baik.

b. Beda Butir Soal

Daya beda butir soal ialah indeks yang menunjukkan tingkat kemampuan butir soal
10
membedakan kelompok yang berprestasi tinggi (kelompok atas) darikelompok yang
berprstasi rendah (kelompok bawah) diantara para peserta tes (Asmawi Zainul, dkk : 1997).
Suryabrata (1999) menyatakan tujuan pokok mencari daya beda adalah untuk menentukan
apakah butir soal tersebut memiliki kemampuan membedakan kelompok dalam aspek yang
diukur, sesuai dengan perbedaan yang ada pada kelompokitu.
Daya beda butir soal yang sering digunakan dalam tes hasil belajar adalah dengan
menggunakan indeks korelasi antara skor butir dengan skor totalnya.Daya beda dengan cara
ini sering disebut validitas internal,karena nilai korelasi diperoleh dari dalam tes itu sendiri.
Daya beda dapat dilihat dari besarnya koefisien korelasi biserial maupun koefesien korelasi
point biserial.
Dalam analisis ini digunakan nilai koefisien korelasi biserial untuk menentukan daya
beda butir soal.Koefisien korelasi biserial menunjukkan hubungan antara dua skor,yaitu skor
butir soal dan skor keseluruhan dari peserta tes yang sama.
Koefisien daya beda berkisar antara –1,00 sampai dengan +1,00.Daya beda +1,00 berarti
bahwa semua anggota kelompok atas menjawab benar terhadap butir soal itu,sedangkan
kelompok bawah seluruhnya menjawab salah terhadapbutirsoalitu.Sebaliknyadayabeda–
1,00berartibahwasemuaanggotakelompokatasmenjawabsalahbutirsoalitu,sedangkankelompok
bawahseluruhnyamenjawab benar terhadap soalitu.

Daya beda yang dianggap masih memadahi untuk sebutir soal ialah apabila sama atau
lebih besar dari +0,30.Bila lebih kecil dari itu,maka butir soal tersebut dianggap kurang
mampu membedakan peserta tes yang mempersiapkan diri dalam menghadapi tes dari
peserta yang tidak mempersiapkan diri.Bahkan bila daya beda itu menjadi negatif, maka
butir soal itu sama sekali tidak dapat dipakai sebagai alat ukur prestasi belajar. Oleh karena
itu butir soal tersebut harus dikeluarkan dari perangkat soal.Makin tinggi daya beda suatu
butir soal, maka makin baik butir soal tersebut, dan sebaliknya makin rendah daya bedanya,
maka butir soal itu dianggap tidak baik (AsmawiZainul, dkk:1997) Menurut Dali S Naga
(1992) kriteria besarnya koefesien daya beda diklasifikasikan menjadi empat kategori.
Secara lebih rinci dijelaskan dalam tabel dibawah ini.
KategoriDayaBeda KoefisienKorelasi
Baik 0,40–1,00
Sedang 0,30–0,39

(tidakperlurevisi)

11
Perludirevisi 0,20–0,29
Tidakbaik -1,00– 0,19

c. Distribusi Jawaban (Distraktor)

Dilihat dari konstruksi butir soal terdiri dari dua bagian,yaitu pokok soal dan alternatif
jawaban.Alternatif jawaban jawaban juga terdiri dari dua bagian,yaitu kunci jawaban dan
pengecoh.Pengecoh dikatakan berfungsi apabila semakin rendah tingkat kemampuan peserta
tes semakin banyak memilih pengecoh, atau makin tinggi tingkat kemampuan peserta tes
akan semakin sedikit memilih pengecoh.Hal demikian dapat ditunjukkan dengan adanya
korelasi yang tinggi,rendah atau negatifpada hasil analisis.Apabila proporsi peserta tes yang
menjawab dengan salah atau memilih pengecoh kurang dari 0,025 maka pengecoh tersebut
harus direvisi.Dan untuk pengecoh yang ditolak apabila tidak ada yang memilih atau
proporsinya 0,00 (Depdikbud :1997).

Selain memperhatikan fungsi daya tarik untuk dipilih oleh peserta tes,pengecoh soal
juga perlu memperhatikan daya beda (koefisien korelasi) yang ditunjukkan oleh masing-
masing alternatif jawaban.Setiap pengecoh diharapkan memiliki daya beda negatif, artinya
suatu pengecoh diharapkan lebih sedikit dipilih oleh kelompok tinggi dibandingkan dengan
kelompok bawah. Atau daya beda pengecoh tidak lebih besar dari daya beda kunci jawaban
setiap butir soal.

Menurut Depdikbud (1997) untuk menilaipengecoh (distraktor) dari masing-


masingbutirsoaldapat dikategorikan sebagaiberikut:
KategoriDistraktor NilaiProportionEndorsing
Baik ≥ 0,025
Revisi <0,025
TidakBaik/Tolak 0,000

2.6 Klasifikasi Kualitas Butir Soal

Kategori KriteriaPenilaian
Baik Apabila(1).Tingkatkesukaran0,25≤p≤0,75,(2).Korelasibiserialbutirsoal≥
0,40dan(3).Korelasibiserialalternatif
jawaban(distraktor)bernialainegatif.

12
Revisi Apabila (1). Tingkat kesukaran p < 0,25 atau p > 0,75
tetapikorelasibiserialbutir≥0,40dankorelasibiserialdistraktorbernilaineg
atif,(2).Tingkatkesukaran0,25≤p≤0,75dankorelasi biserial butir soal ≥
0,40 tetapi ada korelasi biserial padadistraktor yang bernilai positif, (3).
Tingkat kesukaran 0,25 ≤ p ≤0,75 dan korelasi biserial butir soal antara
0,20sampai
0,30tetapikorelasidistraktorbernilainegatifselainkunciatautidak
adayanglebihbesarnilainyadarikuncijawaban.
Tidakbaik Apabila (1). Tingkat kesukaran p < 0,25 atau p > 0,75 dan
adakorelasibiserialpadadistraktorbernilaipositif,(2).Korelasibiserialbutir
soal<0,20,(3).Korelasibiserialbutirsoal<0,30
dankorelasibiserialdistraktorbernilaipositif.

2.7 Efektifitas Pengecoh


Distraktor disebut juga dengan pengecoh, pada soal pilihan ganda kemungkinan jawaban
terbagi dua yaitu kunci jawaban dan distraktor. Dari sekian banyak alternatif jawaban hanya
satu yang benar yaitu kunci jawaban dan kemungkinan jawaban yang tidak benar disebut
dengan pengecoh. Pengecoh berfungsi untuk mengidentifikasi peserta tes yang mempunyai
kemapuan tinggi.
Tujuan analisis distraktor adalah untuk mengetahui seberapa banyak siswa menjawab
benar sesuai dengan kunci jawaban dan seberapa banyak yang memilih distraktor atau
pengecoh. Efektifitas distraktor perlu diperhatikan untuk mengetahui banyaknya mahasiswa
menjawab benar sesuai dengan kunci jawaban dan berapa banyak mahasiswa yang memilih
distraktor atau pengecoh. Pengecoh berfungsi untuk mengidentifikasi peserta tes yang
berkemampuan tinggi.
Pengecoh dikatakan efektif jika dipilh oleh peserta tes yang berasal dari kelompok bawah
yaitu mahasiswa yang mempunyai kemampuan rendah.Dan jika dipilih oleh mahasiswa yang
berkemampuan tinggi maka pengecoh tersebut tidak berfungsi dengan baik.Dari hasil analisis
data menggunakan program anates diperoleh hasil dikatakan distraktor yang baik apabila
dipilih paling sedikit 5% dari peserta tes.Dari butir soal terdapat beberapa pengecoh dengan
kriteria sangat baik, Baik, Buruk dan sangat buruk. Butir soal yang mempunyai pengecoh
yang baik adalah pada butir soal 3, 4, 10, 11, 16, 22, 23 dan 25. Menurut Sumarna suatu
pengecoh dikatakan berfungsi dengan baik apabila dipilih oleh 5% peserta tes. Jika pengecoh

13
dipilih secara merata, maka pengecoh tersebut termasuk sangat baik.Membuat pengecoh yang
baik pada tes pilihan ganda sulit, karena pengecoh yang kurang baik akan mengakibatkan
rendahnya daya pembeda, dan apabila satu atau dua pengecoh tidak berfungsi baik maka
mengakibatkan tingkat kesukaran juga rendah.
2.8 Analisi Butir Soal Secara Kualitatif
Analisis kualitas butir soal secara kualitatif pada prinsipnya dilaksanakan berdasarkan
kaidah penulisan soal (tes tertulis, perbuatan dan sikap).Aspek yang diperhatikan di dalam
penelaahan secara kualitatif ini adalah setiap soal ditelaah dari segi materi, konstruksi,
bahasa/budaya, dan kunci jawaban/pedoman penskorannya.
Kaidah penulisan butir soal yang menjadi pedoman dalam menganalisis kualitas butir soal
secara kualitatif adalah sebagai berikut:
1) Materi
a) Soal harus sesuai dengan indikator, artinya soal harus menyatakan perilaku dan materi
yang hendak diukur sesuai dengan rumusan indikator dalam kisi-kisi. Indikator dalam
kisi-kisi merupakan pedoman dalam merumuskan soal yang dikehendaki. Kegiatan
perumusan indikator soal merupakan bagian dari penyusunan kisi- kisi. Untuk
merumuskan indikator dengan tepat, pendidik harus memperhatikan materi yang akan
diujikan, indikator pembelajaran, kompetensi dasar, dan standar kompetensi.
b) Pengecoh harus berfungsi
c) Setiap soal harus mempunyai satu kunci jawaban yang benar. Artinya, satu soal hanya
mempunyai satu kunci jawaban.
2) Konstruksi
a) Pokok soal harus dirumuskan secara jelas dan tegas. Kemampuan/materi yang hendak
diukur/ditanyakan harus jelas,tidak menimbulkan pengertian atau penafsiran yang
berbeda dari yang dimaksud penulis.Setiap butir soal hanya mengandung satu
persoalan/gagasan.
b) Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang
diperlukan saja.Apabila terdapat rumusan atau pernyataan yang sebetulnya tidak
diperlukan, maka rumusan atau pernyataan itu dihilangkan saja.
c) Pokok soal jangan memberi petunjuk kearah jawaban yang benar. Pada pokok soal
jangan sampai terdapat kata, kelompok kata, atau ungkapan yang dapat memberikan
petunjuk kearah jawaban yang benar.
d) Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda. Pada pokok

14
soal jangan sampai terdapat dua kata atau lebih yang mengandung arti negative. Hal
ini untuk mencegah terjadinya kesalahan penafsiran peserta didik terhadap arti
pernyataan yang dimaksud.
e) Pilihan jawaban harus homogen dan logis ditinjau dari segi materi. Semua pilihan
jawaban harus berasal dari materi yang sama seperti yang ditanyakan oleh pokok soal,
penulisannya harus setara, dan semua pilihan jawaban harus berfungsi.
f) Panjang rumusan pilihan jawaban harus relatif sama. Kaidah ini diperlukan karena
adanya kecenderungan peserta dididk memilih jawaban yang paling panjang karena
seringkali jawaban yang paling panjang itu lebih lengkap dan merupakan kunci
jawaban.
g) Pilihan jawaban jangan mengandung pernyataan “semua pilihan jawaban di atas
salah” atau “semua pilihan jawaban di atas benar”. Dengan adanya pilihan jawaban
seperti ini, maka secara materi pilihan jawaban berkurang satu karena pernyataan itu
bukan berupa materi yang ditanyakan dan pernyataan itu menjadi tidak homogen.
h) Pilihan jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan
besar kecilnya nilai angka atau kronologis. Pilihan jawaban yang berbentuk angka
harus disusun dari nilai angka yang paling kecil berurutan sampai nilai angka yang
paling besar, dan sebaliknya. Demikian juga pilihan jawaban yang menunjukkan
waktu harus disusun secara kronoligis. Penyusunan secara unit dimaksudkan untuk
memudahkan peserta didik melihat pilihan jawaban.
i) Gambar, grafik, tabel, diagram, wacana, dan sejenisnya yang terdapat pada soal harus
jelas dan berfungsi.
j) Rumusan pokok soal tidak menggunakan ungkapan atau kata yang bermakna tidak
pasti seperti, sebaiknya, umumnya, kadang- kadang.
k) Butir soal jangan bergantung pada jawaban soal sebelumnya. Ketergantungan pada
soal sebelumnya menyebabkan peserta didik yang tidak dapat menjawab benar soal
pertama tidak akan dapat menjawab benar soal berikutnya.
3) Bahasa/budaya
a) Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia.
Kaidah bahasa Indonesia dalam penulisan soal diantaranya meliputi, pemakaian
kalimat, unsur subjek, unsur predikat, anak kalimat, pemakaian kata, pilihan kata,
penulisan kata, pemakaian ejaan, penulisan hurus dan penggunaan tanda baca.
b) Bahasa yang digunakan harus komunikatif, sehingga pernyataan mudah dimengerti

15
oleh peserta didik.
c) Pilihan jawaban jangan yang mengulang kata/frase yang bukan merupakan satu
kesatuan pengertian. Letakkan kata/frase pada pokok soal.
Menurut Djemari, dalam menelaah kualitas butir soal dapat dilakukan oleh teman sejawat
yang sebidang dan memiliki pengetahuan tentang pembuatan tes yang baik.Caranya adalah
beberapa penelaah diberikan butir soal yang akan ditelaah, format penelaahan, dan pedoman
penilaian/penelaahan.Para penelaah dipersilahkan memperbaiki langsung pada teks soal dan
memberikan komentarnya serta memberikan nilai pada setiap butir soalnya yang kriterianya
adalah baik, diperbaiki, atau diganti.Bahan-bahan penunjang analisis butir soal secara
kualitatif adalah kisi-kisi pembuatan soal, kurikulum acuan yang digunakan, buku sumber,
kamus bahasa Indonesia, dan pedoman analisis kualitas butir soal objektif maupun subjektif.
2.9 Analisis Kualitas Butir Soal secara Kuantitatif
Teknik analisis kualitas butir soal secara kuantitatif dikenal juga dengan istilah
analisis empirik. Analisis ini dilaksanakan dengan mengukur beberapa kriteria kualitas soal,
diantaranya adalah validitas, reliabilitas, tingkat kesukaran, daya beda dan efektifitas
pengecoh/fungsi distraktor.
1) Validitas
Validitas atau keshahihan berasal dari kata validity yang berarti sejauh mana ketetapan
dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.Dengan kata lain,validitas
adalah suatu konsep yang berkaitan dengan sejauhmana tes telah mengukur apa yang
seharusnya diukur.Validitas berhubungan dengan kemampuan untuk mengukur secara tepat
sesuatu yang diinginkan diukur.
Zainal Arifin menyebutkan ada dua unsur penting dalam validitas yaituvaliditas
menunjukkan suatu derajat dan validitas selalu dihubungkan dengan suatu putusan atau
tujuan yang spesifik.Validitas suatu tes selalu dibedakan menjadi dua macam yaitu validitas
logis dan validitas empiris. logis sama dengan analisis kualitatif terhadap sebuah soal, yaitu
untuk menentukan berfungsi tidaknya suatu soal berdasarkan kriteria yang telah ditentukan,
yang dalam hal ini adalah kriteria materi, konstruksi, dan bahasa.
Penganalisisan terhadap tes hasil belajar dapat dilakukan dengan dua cara. Pertama,
penganalisisan yang dilakukan dengan jalan berpikir secara rasional atau penganalisisan
dengan menggunakan logika (logical analysis).Ada dua macam validitas logis yang dapat
dicapai oleh sebuah instrument yaitu validitas isi dan validitas konstruk.Kedua,
penganalisisan yang dilakukan dengan mendasarkan diri pada kenyataan empiris, dimana

16
penganalisisan dilaksanakan dengan menggunakan empirical analysis. Ada dua macam
validitas empiris yaitu validitas prediksi dan validitas konkuren.
Ada 4 jenis validitas yaitu:
a) Validitas Isi (Content Validity), yaitu validitas yang ditilik dari segi isi tes itu sendiri
sebagai alat pengukur hasil belajar yaitu sejauh mana tes hasl belajar sebagai alat
pengukur hasil belajar peserta didik, isinya telah dapat mewakili secara representatif
terhadap keseluruhan materi atau bahan pelajaran yang seharusnya diujikan.
b) Validitas Konstruksi (Construct Validity), adalah validitas yang ditilik dari segi
susunan, kerangka atau rekaannya.
c) Validitas Ramalan (Predictive Validity), adalah suatu kondisi yang menunjukkan
seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukkan
kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang.
d) Validitas Bandingan (Concurrent Validity), adalah kemampuan sebuah tes dalam
kurun waktu yang sama dengan secara tepat telah mampu menunjukkan adanya
hubungan searah antara tes pertama dengan tes berikutnya. Validitas bandingan juga
dikenal dengan istilah validitas sama saat, validitas pengalaman atau validitas ada
sekarang
2)Reliabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu pengukuran dapat
dipercaya.Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subjek yang sama, diperoleh hasil pengukuran
yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah.
Reliabilitas dibedakan atas dua macam yaitu: reliabilitas konsistensi tanggapan dan
reliabilitas gangguan item.
Cronbach menyatakan ada tiga mekanisme untuk memeriksa reliabilitas tanggapan
responden terhadap tes yaitu:
a) Teknik test retest adalah pengetesan dua kali dengan menggunakan suatu tes yang
sama pada waktu yang berbeda.
b) Teknik belah dua, pada teknik ini pengukuran dilakukan dengan dua kelompok item
yang setara pada saat yang sama
c) Bentuk ekivalen,disini pengukuran dilakukan dengan menggunakan dua tes yang
dibuat setara kemudian diberikan kepada responden atau obyek ukur tes dalam waktu
yang bersamaan.Skor kedua kelompok item tersebut dikorelasikan untukmendapatkan

17
reliabilitas tes.

18
BAB III
PENUTUP
3.1 KESIMPULAN
Analisis butir tes adalah suatu prosedur yang sistematis, yang akan memberikan
informasi-informasi yang sangat khusus terhadap butir tes yang kita susun. Teori tes klasik
adalah teori mengenai analisis butir tes dimana analisis dilakukan dengan adalah
memperhitungkan kedudukan butir dalam suatu kelas atau kelompok,Analisis butir
digunakan untuk menentukan kualitas butir pada suatu perangkat tes.Butir tes berkualitas
rendah akan menurunkan kualitas ujian.Analisis butir pada teori ujian klasik terdiri atas
tingkat kesukaran,daya beda,dan distraktor. tingkat kesukaran,daya beda,dan distraktor.
Tingkat kesukaran butir tes merupakan perbandingan antara peserta tes yang menjawab
benar dan jumlah seluruh responden yang menjawab butir tes.Tingkat kesukaran butir tes
dapat dihitung berbagai rumus. dengan berbagai rumus.
• Daya beda (D) butir tes adalah kemampuan butir tes untuk mengetahui seberapa
untuk mengetahui seberapa besar suatu besar suatu butir tes butir tes dapat
membedakan (diskriminas dapat membedakan (diskriminasi) antara i) antara peserta
peserta tes yang tes yangberkemampuan berkemampuan tinggi tinggi dengan
dengan peserta peserta tes tes yang yang berkemampuan berkemampuan rendah.
rendah.
• Analisis pengecoh atau distraktor tujuannya adalah mengetahui kemampuan Analisis
pengecoh atau distraktor tujuannya adalah mengetahui kemampuan responden yang
sebenarnya dengan jalan memberikan pilihan alternatif .
3.2 SARAN
Dengan dibuat makalah ini semoga pembaca lebih memahami tentang butir tes dalam
pembelajaran kimia khususnya mampu mendeskripsikan pengertian tes dalam pembelajaran
matematika.Penulis menyadari bahwasanya makalah ini masih jauh dari kesempurnaan.Oleh
karenaitu, penulis meminta saran yang membangun demi tercapainya kesempurnaan dalam
makalah singkat ini

1
DAFTAR PUSTAKA

Elviana, E. (2020). ANALISIS BUTIR SOAL EVALUASI PEMBELAJARAN PAI


MENGGUNAKAN PROGRAM ANATES. Jurnal MUDARRISUNA: Media Kajian
Pendidikan Agama Islam, 10(2), 58-74.
http://staffnew.uny.ac.id/upload/132231727/pendidikan/22.+Materi+Kuliah+Evaluasi+Pembe
lajaran.pdf. Diakses pada tanggal 20 April 2021.
Kartowagiran, B. (2012). Penulisan butir soal. Yogyakarta: Universitas Negeri Yogyakarta,
1-33

2
3

Anda mungkin juga menyukai