Anda di halaman 1dari 30

MAKALAH

ANALISIS BUTIR SOAL

Laporan ini disusun untuk Memenuhi Tugas Ujian Tengah Semester

Mata Kuliah Asesmen Pembelajaran Biologi

Dosen : Ipin Arifin, M. Pd.

Disusun oleh :

Neila Adzkia Iftihana

1908106082

PROGRAM STUDI TADRIS BIOLOGI

FAKULTAS ILMU TARBIYAH DAN KEGURUAN

INSTITUT AGAMA ISLAM NEGERI SYEKH NURJATI

CIREBON

2022
KATA PENGANTAR

Alhamdulillah, segala puji hanya bagi Allâh ‫ ﷻ‬karena telah memberikan


kesempatan pada penulis untuk menyelesaikan makalah ini. Atas pertolongan-Nya,
penulis dapat menyelesaikan makalah yang berjudul "Analisis Butir Soal pada Mata
Pelajaran Biologi" tepat waktu.

Makalah ini disusun guna memenuhi tugas dari Bapak Ipin Arifin, M. Pd., pada
mata kuliah Asesmen Pembelajaran Biologi. Penulis menyadari bahwa makalah ini
memiliki banyak kekurangan. Kritik dan saran yang membangun sangat diperlukan
penulis agar lebih baik lagi. Selain itu, penulis juga berharap agar makalah ini dapat
menambah wawasan bagi pembaca mengenai analisis butir soal.

Penulis

i
DAFTAR ISI

KATA PENGANTAR……………………………………….………………………….i

DAFTAR ISI………………………………………...………………………………….ii

BAB I PENDAHULUAN

A. Latar Belakang……………………………..…………………………….1
B. Rumusan Masalah…………………………………..……………………1
C. Tujuan ……………………...……………………………………………1

BAB II PEMBAHASAN

A. Pengertian Analisis Butir Soal………………………...…………………2


B. Tujuan Analisis Butir Soal………………………………….……………
2
C. Teknik Analisis Butir Soal………………….……………………………
3
D. Manfaat Analisis Butir Soal ……………………………………………
23

BAB III PENUTUP

A. Kesimpulan……………………………………………………………..24
B. Saran ……………………………………...………...………………….24

DAFTAR PUSTAKA…………………………………...
……………………………..25

ii
iii
BAB I

PENDAHULUAN

A. Latar Belakang

Dalam dunia pendidikan, penilaian merupakan bagian yang tidak terpisahkan dari
proses belajar mengajar. Sistem penilaian yang baik akan mendorong guru
menggunakan strategi mengajar yang lebih baik dan memotivasi anak untuk belajar
lebih giat. Penilaian biasanya dimulai dengan kegiatan pengukuran. Pengukuran
(measurement) merupakan cabang ilmu statistika terapan yang bertujuan untuk
membangun dasar-dasar pengembangan tes yang lebih baik sehingga menghasilkan tes
yang berfungsi secara optimal, valid, dan reliabel.

Proses belajar mengajar dilaksanakan tidak hanya untuk kesenangan atau bersifat
mekanis saja tetapi mempunyai misi atau tujuan bersama. Dalam usaha untuk mencapai
misi dan tujuan itu perlu diketahui apakah usaha yang dilakukan sudah sesuai dengan
tujuan? Untuk mengetahui apakah tujuan pendidikan sudah tercapai perlu diadakan tes.
Sebuah tes yang dapat baik sebagai alat pengukur harus dianalisis terlebih dahulu.
Dalam menganalisis butir soal suatu tes, maka harus memperhatikan daya serap, tingkat
kesukaran, daya beda, fungsi pengecoh, validitas dan reabilitas. Hal tersebut dilakukan
agar tes yang diberikan kepada siswa sesuai dengan daya serap siswa, tingkat
kesukarannya, dan soal yang diberikan pun harus valid. Sehingga, tujuan dari
pembelajaran dapat tercapai.

B. Rumusan Masalah
1. Apa yang dimaksud dengan analisis butir soal?
2. Bagaimana teknik analisis butir soal?
3. Apa saja manfaat dari pelaksanaan analisis butir soal?
C. Tujuan
1. Untuk mengetahui deskripsi analisis butir soal
2. Untuk mengetahui teknik analisis butir soal
3. Untuk mengetahui manfaat dari pelaksanaan analisis butir soal

1
BAB II

PEMBAHASAN

A. Pengertian Analisis Soal dan Butir Soal

Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan
oleh guru untuk menjaga dan meningkatkan mutu soal yang dibuat. Tugas melakukan
evaluasi terhadap alat pengukuran yang telah digunakan untuk mengukur keberhasilan
belajar peserta didik inilah yangseringkali diabaikan oleh evaluator.

Kegiatan analisis merupakan penyelidikan terhadap suatu peristiwa untuk


mengetahui keadaan yang sebenarnya. Soal merupakan pertanyaan atau pernyataan
yang menimbulkan situasi masalah yang harus dipecahkan oleh siswa. Adapun satuan
untuk soal adalah butir sehingga tiap item pertanyaan pernyataan dikenal sebagai butir
soal.
atauAnalisis soal adalah suatu prosedur sistematis yang akan memberikan informasi-
informasi mengenai kualitas tes yang kita susun. (Daryanto, 2007). Sementara itu,
Analisis butir soal atau analisis item adalah pengkajian pertanyaan-pertanyaan tes agar
diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai”. (Sudjana,
2006).

B. Tujuan Analisis Butir Soal

Kegiatan menganalisis butir soal merupakan kegiatan yang wajib yang dilakukan
guru untuk mengetahui tingkat hasil belajar peserta didik dan untuk meningkatkan mutu
soal yang telah disusun. Kegiatan ini merupakan proses pengumpulan, peringkasan, dan
penggunaan informasi dari jawaban peserta didik untuk membuat keputusan tentang
setiap penilaian (Nitko, 1996).

Tujuan penelaahan adalah untuk mengkaji dan menelaah setiap butir soal agar
diperoleh soal yang bermutu sebelum soal digunakan. Di samping itu, tujuan analisis
butir soal juga untuk membantu meningkatkan tes melalui revisi atau membuang soal
yang tidak efektif, serta untuk mengetahui informasi diagnostik pada peserta didik
apakah mereka sudah/belum memahami materi yang telah diajarkan (Aiken, 1994). Soal

2
yang bermutu adalah soal yang dapat memberikan informasi yag sesuai dengan
tujuannya di antaranya dapat menentukan peserta didik mana yang telah atau belum
menguasai materi yang diajarkan guru.

C. Teknik Analisis Butir Soal

Hasil belajar kognitif dinilai dengan teknik tes dengan butir-butir soal sebagai
instrumennya. Cara menganalisis butir-butir tes tersebut dapat ditempuh melalui dua
cara, yaitu : (1) analisis soal secara teoretik atau kualitatif dan (2) analisis soal secara
empiris atau kuantitatif.

1. Analisis Tes Secara Kualitatif (Teoritik)

Analisis kualitatif merupakan penyelidikan terhadap soal untuk mengetahui


keadaan yang sebenarnya. Analisis secara teoretis atau analisis kualitatif dapat
dilakukan sebelum maupun sesudah dilaksanakan uji coba. Cara analisisnya adalah
dengan mencermati butir-butir soal yang telah disusun dari pemenuhan persyaratan
aspek isi (materi), konstruksi, maupun bahasa. (Sukiman, 2012).

Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara
kualitatif, diantaranya adalah teknik moderator dan teknik panel. Teknik moderator
merupakan teknik berdiskusi yang di dalamnya terdapat satu orang sebagai penengah.
Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama dengan
beberapa ahli seperti guru yang mengajarkan materi, ahli materi, penyusun atau
pengembang kurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi.

Teknik ini sangat baik karena setiap butir soal dilihat secara bersama-sama
berdasarkan kaidah penulisannya. Di samping itu, para penelaah dipersilakan
mengomentari berdasarkan kompetensinya masing-masing. Setiap komentar atau
masukan dari peserta diskusi dicatat. Setiap butir soal dapat dituntaskan secara bersama-
sama, perbaikannya seperti apa. Namun, kelemahan teknik ini memiliki kelemahan
karena memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal.
Teknik berikutnya adalah Teknik Panel yakni suatu teknik menelaah butir soal
berdasarkan kaidah penulisan butir soal. Kaidah itu diantaranya materi, konstruksi,
bahasa atau budaya, kebenaran kunci jawaban atau pedoman penskoran. Caranya
beberapa penelaah diberikan butir-butir soal yang akan ditelaah, format penelaahan, dan

3
pedoman penilaian atau penelaahan. Pada tahap awal, semua orang yang terlibat dalam
kegiatan penelaahan disamakan persepsinya, kemudian mereka berkerja sendiri-sendiri
di tempat berbeda. Para penelaah dipersilakan memperbaiki langsung pada teks soal dan
memberikan komentarnya serta memberikan nilai pada setiap butir soal dengan kriteria:
soal baik, perlu diperbaiki, atau diganti.

Dalam menganalisis butir soal secara kualitatif, penggunaan format penelaahan soal
akan sangat membantu dan mempermudah prosedur pelaksanaannya. Format
penelaahan soal digunakan sebagai dasar untuk menganalisis setiap butir soal. Format
penelaahan soal yang dimaksud adalah format penelaahan butir soal: uraian, pilihan
ganda, tes perbuatan dan instrumen non-tes. Berikut disajikan keempat format
penelaahan butir soal.

a. Contoh Format Penelaahan Butir Soal Bentuk Uraian


Mata pelajaran :
Kelas/semester :
Penelaah :

No. Aspek yang ditelaah Nomor Soal


1 2 3 4 5 ….
A Materi
1 Soal sesuai dengan indikator (menuntut tes
tertulis untuk bentuk Uraian)
2 Batasan pertanyaan dan jawaban yang
diharapkan sudah sesuai
3 Materi yang ditanyakan sesuai dengan
kompetensi (urgensi, relevansi, kontinuitas,
keterpakaian sehari-hari tinggi)
4 Isi materi yang ditanyakan sesuai dengan
jenjang jenis sekolah atau tingkat kelas
B Konstruksi
1 Menggunakan kata tanya atau perintah yang
menuntut jawaban uraian
2 Ada petunjuk yang jelas tentang cara

4
mengerjakan soal
3 Ada pedoman penskorannya
4 Tabel, gambar, grafik, peta, atau yang
sejenisnya disajikan dengan jelas dan
terbaca
C Bahasa/Budaya
1 Rumusan kalimat komunikatif
2 Butir soal menggunakan bahasa Indonesia
yang baku
3 Tidak menggunakan kata/ungkapan yang
menimbulkan penafsiran ganda atau salah
pengertian
4 Tidak menggunakan bahasa yang berlaku
setempat/tabu

Keterangan: Berilah tanda () bila tidak sesuai dengan aspek yang ditelaah!

b. Contoh Format Penelaahan Butir Soal Bentuk Uraian


Mata pelajaran :
Kelas/semester :
Penelaah :

No. Aspek yang ditelaah Nomor soal


1 2 3 4 5 ….
A Materi
1 Soal sesuai dengan indikator (menuntut tes
tertulis untuk bentuk pilihan ganda)
2 Materi yang ditanyakan sesuai dengan
kompetensi (urgensi, relevansi, kontinuitas,
keterpakaian sehari-hari tinggi)
3 Pilihan jawaban homogen dan logis
4 Hanya ada satu jawaban

5
B Konstruksi
1 Pokok soal dirumuskan dengan singkat,
jelas, dan tegas
2 Rumusan pokok soal dan pilihan jawaban
merupakan pernyataan yang diperlukan saja
3 Pokok soal tidak memberi petunjuk kunci
jawaban
4 Pokok soal bebas dan pernyataan yang
bersifat negatif ganda
5 Pilihan jawaban homogen dan logis ditinjau
dari segi materi
6 Gambar, grafik, tabel, diagram, atau
sejenisnya jelas dan berfungsi
7 Panjang pilihan jawaban relatif sama
8 Pilihan jawaban tidak menggunakan
pernyataan "semua jawaban di atas
salah/benar" dan sejenisnya
9 Pilihan jawaban yang berbentuk
angka/waktu disusun berdasarkan urutan
besar kecilnya angka atau kronologisnya
10 Butir soal tidak bergantung pada jawaban
soal sebelumnya
C Bahasa/budaya
1 Menggunakan bahasa yang sesuai dengan
kaidah bahasa Indonesia
2 Menggunakan bahasa yang komunikatif
3 Tidak menggunakan bahasa yang berlaku
setempat/tabu
4 Pilihan jawaban tidak mengulang
kata/kelompok kata yang sama, kecuali
merupakan satu kesatuan pengertian

6
Keterangan: Berilah tanda ( ) bila tidak sesuai dengan aspek yang ditelaah!

2. Analisis Tes Secara Kuantitatif (Empirik)

Analisis tes secara kuantitatif merupakan penyelidikan terhadap suatu soal untuk
mengetahui keadaan yang sebenarnya berdasarkan kenyataan (Mujiyanto, 2007).
Analisis tes secara kuantitatif diarahkan untuk menelaah tingkat validitas soal,
reliabilitas, daya pembeda, tingkat kesukaran dan khusus untuk model soal pilihan
ganda perlu juga ditelaah efektivitas fungsi distraktor. (Sukiman, 2012).

a. Validitas

Validitas (validity, kesahihan) berkaitan dengan permasalahan apakah tes yang


dimaksudkan dapat mengukur secara tepat sesuatu yang akan diukur tersebut. Analisis
tes dapat dilakukan dari dua segi, yaitu dari segi tes sebagai suatu totalitas dan dari segi
itemnya sebagai bagian tak terpisahkan dari tes secara totalitas. Menurut Sudijono
(2007), terdapat dua macam Validitas, yakni validitas tes dan validitas item.

1) Validitas Tes
Penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan
dengan dua cara yaitu penganalisisan dengan jalan berpikir secara rasional (logical
analysis) dan penganalisisan yang dilakukan dengan mendasarkan diri pada
kenyataan empiris (empirical analysis). Validitas sebuah tes dapat diketahui dari
hasil pemikiran (validitas logis) dan dari hasil pengalaman (validitas empiris).
Validitas logis atau rasional adalah validitas yang pertimbangannya lewat analisis
rasional. Jenis validitas yang termasuk dalam kategori ini adalah validitas isi (content
validity) dan validitas konstruk (construct validity). (Sudijono, 2011).
Sebuah tes disebut memiliki validitas isi apabila tes tersebut mengukur tujuan
khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. validitas
isi merujuk pada kesesuaian antara butir-butir soal dengan tujuan dan bahan
pengajaran. Secara sederhana dapat dikatakan bahwa tes yang disusun tidak boleh
keluar dari isi mata pelajaran yang ada di dalam kurikulum. Sementara itu, sebuah tes
disebut memiliki validitas konstrak apabila butir-butir soal yang membangun tes

7
tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan
Instruksional Khusus. (Sudijono, 2011).
2) Validitas Item atau Validitas Butir Soal
Selain validitas soal secara keseluruhan tes, juga perlu diperhatikan validitas
item atau validitas butir soal., “validitas item dari suatu tes adalah ketepatan
mengukur yang dimiliki oleh sebutir item (yang merupakan bagian tak terpisahkan
dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat
butir item tersebut”. Eratnya hubungan antara butir item dengan tes hasil belajar
sebagai suatu totalitas adalah bahwa semakin banyak butir-butir item yang dapat
dijawab oleh peserta didik, maka skor total hasil tes tersebut akan semakin tinggi.
(Sudijono, 2011).
Rumus yang bisa digunakan untuk menghitung validitas item dalam bentuk
pilihan ganda dapat menggunakan rumus korelasi point biserial sebagai berikut.

Y pbi =
SD √
M p −M t p
q

Keterangan:

Ypbi : korelasi point biserial

Mp : rerata skor dari subjek yang menjawab benar bagi item yang

mencari validitasnya

Mt : rerata skor soal

St : standar deviasi dari skor total

p : proposi siswa yang menjawab benar

total siswa yang benar


p=( ¿
total seluruh siswa

q : proposi siswa yang jawab salah

(q = 1- p)

(Arikunto, 2009)

8
Ypbi yang diperoleh dari perhitungan rumus di atas selanjutnya dikonsultasikan
dengan r tabel pada taraf signifikansi 5%, apabila Ypbi > rt maka butir soal tersebut
valid.

Validitas suatu alat evaluasi, bukanlah merupakan ciri yang absolut atau mutlak.
Suatu tes dapat memiliki validitas yang tinggi, sedang, rendah, tergantung kepada
tujuannya. Secara metodologis, validitas suatu tes dapat dibedakan menjadi empat
macam, yaitu validitas isi (content validity), validitas konstruk (construct validity),
validitas konkuren (concurrent validity), dan validitas prediksi (predictive validity).

1) Validitas Isi
Validitas isi artinya ketepatan daripada suatu tes dilihat dari segi isi tersebut.
Suatu tes hasil belajar dikatakan valid, apabila materi tes tersebut benar-benar
merupakan bahan-bahan yang representatif terhadap bahan-bahan pelajaran yang
diberikan. Untuk mendapatkan validitas isi memerlukan dua aspek penting, yaitu
valid isi dam valid teknik sampling. Valid isi mencakup khususnya, hal-hal yang
berkaitan dengan apakah item-item evaluasi menggambarkan pengukuran dalam
cakupan yang ingin diukur. Sedangkan valid teknik sampling pada umumnya
berkaitan dengan bagaimanakah baiknya suatu sample item tes mempresentasikan
total cakupan isi.
2) Validitas Konstruk
Validasi konstruk merupakan derajat yang menunjukkan suatu tes mengukur
sebuah konstruk sementara. Untuk menentukan adanya validitas konstruk suatu tes
dikorelasikan dengan suatu konsepsi atau teori, item-item dalam tes itu harus sesuai
dengan ciri-ciri yang disebutkan dalam konsepsi tadi, yaitu konsepsi tentang obyek
yang akan dites.
3) Validitas Konkuren
Jika hasil suatu tes mempunyai korelasi yang tinggi dengan hasil dari suatu alat
pengukur lain terhadap bidang yang sama pada waktu yang sama pula, maka tes itu
dikatakan memiliki konkuren validity. Validitas ini lebih umum dikenal dengan
validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya
sesuai dengan pengalaman. Pengalaman selalu mengenai hal yang telah lampau
sehingga data pengalaman tersebut sekarang sudah ada.

9
Cara-cara membuat tes dengan validitas konkruen dapat dilakukan dengan
beberapa langkah seperti berikut.
1. Administrasi tes yang baru yang dilakukan terhadap grup atau anggota
kelompok
2. Catat tes baku yang ada termasuk berapa koefisien validitasnya jika ada
3. Hubungkan atau korelasikan dua tes skor tersebut
Hasil yang dicapai atau koefisien validitas yang muncul menunjukkan derajat
hubungan validitas tes yang baru. Jika koefisien tinggi, berarti tes yang baru tersebut
mempunyai validitas konkruen yang baik. Sebaliknya, tes yang baru dikatakan
mempunyai validitas konkruen yang jelek, apabila koefisien yang dihasilkan rendah.
Tes mental merupakan contoh nyata terapan suatu tes pembeda (validitas
konkruen yang melibatkan penentuan tes ) yang sering ditemui dalam kasus
psikologi. Jika hasil skor suatu tes dapat digunakan degan cara benar untu
mengklarifikasi orang
yang satu dengan orang lainnya, maka validitas konkruen tes tersebut memiliki daya
pembeda yang baik.
4) Validitas Prediksi
Memprediksi artinya meramal, dan meramal selalu mengenai hal yang akan
datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi
apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa
yang akan mendatang.
Instrumen validitas prediksi mungkin bervariasi bentuknya tergantung
beberapa faktor misalnya kurikulum yang digunakan, buku pegangan yang dipakai,
intensitas mengajar dan letak geografis atau daerah sekolah. Yang perlu diperhatikan
saat melakukan tes validasi ini yaitu perlu memperhatikan proses dan cara
membandingkan instrumen yang divalidasi dengan tes yang dibakukan. Perlu
disadari bahwa skor tes yang dihasilkan juga memiliki sifat ketidak sempurnaan.
Ketika kriteria telah diidentifikasi dan ditentukan, prosedur selanjutnya adalah
menentukan validitas prediksi suatu tes dengan cara seperti berikut.
1. Buat item tes sesuai dengan tujuan yang hendak dicapai
2. Tentukan kelompok yang dijadikan subyek dalam pilot Study
3. Identifikasi kriterion prediksi yang hendak dicapai

10
4. Tunggu sampai tingkah laku yang diprediksi atau variabel kriteria muncul dan
terpenuhi dalam kelompok yang telah ditentukan
5. Capai ukuran-ukuran kriteria tertentu
6. Korelasikan dua set skor yang dihasilkan
Jenis validitas ini menunjukkan kenyataan jika ujian yang dimaksud
dihubungkan dengan kriteria-kriteria tentang hasil karya atau kesuksesan di masa
depan. Untuk menguji validitas empiris dapat digunakan jenis statistika korelasi
product-moment, korelasi perbedaan peringkat, atau korelasi diagram pencar. Berikut
ini akan dikemukakan beberapa contoh perhitungan korelasi.

Analisis butir secara modern yaitu penelaahan butir soal dengan menggunakan
Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu
teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang
menjawab benar suatu scal dengan kemampuan siswa. Nama lain IRT adalah latent
trait theory (LTT), atau characteristics curve theory (ICC). Asal mula IRT adalah
kombinasi suatu versi hukum phi-gamma dengan suatu analisis faktor butir soal (item
factor analisis) kemudian bernama Teori Trait Latent (Latent Trait Theory), kemudian
sekarang secara umum dikenal menjadi teori jawaban butir soal (Item Response
Theory). (McDonald, 1999).

b. Reliabilitas

Salah satu syarat tes sebagai instrumen evaluasi adalah memiliki reliabilitas yang
tinggi. Reliabilitas tes atau keajekan berhubungan dengan masalah kepercayaan. Suatu
tes akan menghasilkan kepercayaan yang tinggi apabila tes tersebut dapat memberikan
hasil yang tetap. Atau seandainya hasilnya berubah, perubahan yang terjadi dapat
dikatakan tidak berarti. (Sukiman, 2012).

Reliabilitas alat penilaian adalah ketetapan atau keajegan alat tersebut dalam
menilai apa yang dinilainya. Artinya, kapan pun alat penilaian tersebut digunakan akan
memberikan hasil yang relatif sama. Reliabilitas sebuah soal perlu karena sebagai
penyokong terbentuknya validitas butir soal sehingga sebuah soal yang valid biasanya
reliabel. (Sudijono, 2011).

11
Menurut Gronlun (1985), terdapat empat faktor yang dapat mempengaruhi reliabilitas,
yaitu :

1) Panjang tes, yaitu banyaknya soal tes.


2) Sebaran skor, besarnya sebaran skor akan membuat tingkat reliabilitas menjadi lebih
tinggi, Karena koefesien reliabilitas yang lebih besar diperoleh ketika peserta didik
tetap pada posisi yang relative sama dalam satu kelompok pengujian ke pengujian
berikutnya.
3) Tingkat kesukaran, dalam penilaian yang menggunakan pendekatan penilaian acuan
norma, baik untuk soal yang mudah maupun sukar, cenderung menghasilkan tingkat
reliabilitas yang rendah.
4) Objektivitas, menunjukkan skor tes kemampuan yang sama antara peserta didik yang
satu dengan peserta didik lainnya.

Reliabilitas merupakan sama dengan konsistensi atau keajegan. Suatu tes bisa
dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok
yang sama pada waktu atau kesempatan yag berbeda (Arifin, 2017; Sukardi, 2015).
Menurut Sudijono (2007), teknik pengujian reliabilitas tes hasil belajar dalam bentuk
obyektif memiliki tiga macam pendekatan, yakni pendekatan Single Test-Single Trial,
pendekatan Test-Retest, dan pendektan Alternatif Form.

1) Pendekatan Single Test-Single Trial, metode tes dilakukan pengukuran terhadap


satu kelompok subyek dengan menggunakan satu jenis alat ukur dan pelaksanaan
pengukuran hanya dilakukan sebanyak satu kali.
2) Pendekatan Test-Retest, Metode tes ulang dilakukan dengan menguji-cobakan
sebuah tes kepada sekelompok peserta didik sebanyak dua kali pada waktu yang
berbeda. Skor hasil uji coba pertama dikorelasikan dengan skor hasil uji coba kedua
dengan menggunakan teknik korelasi Product Moment. Besar angka korelasi
menunjukkan tingkat reliabilitas instrument
3) Pendektan Alternatif Form, metode ini di pergunakan dua buah tes yang diberikan
kepada kelompok subyek yang dilakukan secara serentak dengan ketentuan bahwa
kedua tes tersebut harus sejenis. Kemudian skor-skor kedua buah tes tersebut
dikorelasikan dengan teknik korelasi Product Moment. Apabila terdapat korelasi
positif yang signifikan maka dapat dikatakan bahwa tes tersebut reliabel.

12
Pendekatan jenis ketiga ini dipandang lebih baik dengan alasan bahwa: 1). Butir-
butir item dibuat sejenis tetapi tidak sama, jadi tes hasil belajar yang diuji reliabilitasnya
dapat terhindar dari kemungkinan timbulnya pengaruh yang datang dari testee, yaitu
pengaruh berupa latihan atau menghafal. 2). Kedua tes itu dilakukan secara serentak
sehingga dapat dihindarkan timbulnya perbedaan-perbedaan situasi dan kondisi yang
diperkirakan akan mempengaharuhi proses tersebut, baik yang bersifat soasial maupun
yang bersifat alami.

Menurut Arikunto (2009) secara garis besar ada tiga hal yang mempengaruhi hasil
tes sebagai berikut.

1) Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-
butir soalnya. Tes yang dengan jumlah yang banyak butirnya tentu saja lebih valid
dibandingkan dengan tes yang hanya terdiri dari beberapa tes. Tinggi rendahnya
validitas menujukan tinggi rendahnya reliabilitas itu sendiri.
2) Hal yang berhubungan dengan testee, suatu tes yang diujikan kepada peserta didik
yang jumlah yang banyak akan mencerminkan keragaman hasil yang
menggambarkan besar kecilnya reliabilitas tes.
3) Hal yang berhubungan dengan penyelenggaraan tes, penyelenggaraan tes yang
bersifat adminstasif sangat menentukan hasil tes, hasil tes tersebut akan
mempengaruhi reliabilitas soal tes.

Menurut Sudijono (2007) & Sukardi (2015) Untuk mencari reliabilitas tes pada
pilihan ganda dengan alternatif empat jawaban, tiga jawaban dan sebagainya dapat
menggunakan rumus K-R sebagai berikut.

n M t ( n−M t )
r11 = ( n−1 ) (1− ( n ) (S2t )
)

Keterangan:

r11 : Koefisien reliabilitas tes

n : Banyaknya butir item

13
Mt : Mean total

2
St : Varian total

Interpretasi terhadap hasil perhitungan koefisien reliabilitas tes (r 11) pada


umumnya digunakan seperti berikut:

1) Jika r11 sama dengan atau lebih besar dari pada 0,70 , berarti tes tersebut yang sedang
diuji reliabiltasnya telah memiliki reliailtas yang tinggi (reliable)
2) Jika r11 lebih kecil dari 0,70, berarti tes hasil belajar yang sedang diuji reliabilitasnya
belum memiliki relibiltas yang tinggi (un-reliable).

Konsep reliabilitas mendasari kesalahan pengukuran dapat terjadi pada suatu


proses pengukuran atau pada nilai tunggal tertentu, sehingga menimbulkan perubahan
pada susunan kelompoknya. Misalnya, guru mengetes peserta didik dengan instrumen
tertentu dan mendapat nilai 70. Kemudian pada kesempatan yang berbeda dengan
instrumen yang sama, guru melakukan tes kembali, ternyata peserta didik tersebut
mendapat nilai 75. Artinya, tes tersebut tidak reliabel, karena terjadi kesalahan
pengukuran. Tesyang reliabel adalah apabila koefesien reliabilitasnya tinggi dan
kesalahan baku pengukurannya rendah.

c. Daya Pembeda

Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk
dapat membedakan antara testee yang berkemampuan tinggi dengan testee yang
berkemampuan rendah. Mengetahui daya pembeda item sangat penting, sebab salah satu
dasar pegangan untuk menyusun butir tes hasil belajar adalah adanya bahwa
kemampuan antara testee yang satu dengan testee yang lain berbeda-beda. Selain itu,
butir tes hasil belajar harus mampu memberikan hasil tes yang mencerminkan adanya
perbedaan kemampuan yang terdapat di kalangan testee tersebut. (Sudijono, 2011).

Daya pembeda soal dapat diketahui dengan melihat besar kecilnya angka indeks
daya pembeda (IDP). Indeks daya pembeda biasanya juga dinyatakan dalam bentuk
proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang
bersangkutan membedakan siswa yang pandai dengan siswa yang kurang pandai. Indeks
daya pembeda berkisar antara -1,00 sampai dengan 1,00. (Sukiman, 2012).

14
Perhitungan daya beda dibedakan antara kelompok kecil dan kelompok besar.
Kelompok kecil merupakan kelompok yang terdiri kurang dari dan kelompok besar
lebih dari orang.

1) Untuk kelompok kecil


Seluruh kelompok peserta tes (testee) dibagi dua sama besar, kelompok atas (JA) dan
kelompok bawah (JB). seluruh pengikut tes, dideretkan mulai dari skor teratas
sampai terbawah lalu dibagi dua
2) Untuk kelompok besar
Mengingat biaya dan waktu menganalis, maka untuk kelompok besar bisaanya hanya
diambil kedua kutubnya saja, yaitu skor teratas sebagai kelompok atas (JA) dan skor
terbawah (JB).

Rumus untuk menentukan daya pembeda (indeks diskriminasi) adalah:

PA BB
D= JB
- JB
= P A −PB

Keterangan :

D : angka indeks diskriminasi

J : jumlah peserta tes

JA : banyaknya peserta kelompok atas

JB : banyaknya peserta kelompok bawah

BA : banyaknya peserta kelompok atas yang menjawab soal itu dengan benar

BB : banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar
PA : proporsi peserta kelompok atas yang menjawab benar

(ingat, P sebagai indeks kesukaran)

PB : proporsi peserta kelompok bawah yang menjawab benar

(Arikunto, 2009)

15
Hasil perhitungan dengan menggunakan rumus di atas dapat menggambarkan
tingkat kemampuan soal dalam membedakan antar peserta tes yang sudah memahami
materi yang diujikan dengan peserta tes yang belum atau tidak memahami materi yang
diujikan.
Adapun klasifikasinya adalah seperti berikut:

Daya Pembeda (D) Kategori


0,00 – 0,20 Lemah/jelek
0,20 – 0,40 Sedang
0,40 – 0,70 Baik
0,70 – 1,00 Baik sekali
Tanda negative (-) Tidak ada daya beda

Saran yang dapat dilakukan guru setelah dilakukan analisis pada tingkat daya beda
butir soal yakni daya beda yang memiliki kualitas butir soal yang baik memiliki
katagori cukup, baik, dan baik sekali sebaiknya butir soal tersebut di simpan di bank
soal agar soal tersebut bisa digunakan kembali pada tes selanjutnya sedangkan tingkat
daya beda dalam katagori jelek masih bisa di perbaiki agar butir soal tersebut bisa
kembali dipakai pada tes selanjutnya dan butir soal yang tidak ada daya beda atau
negative butir soal tersebut sebaiknya dibuang dan tidak digunakan Kembali. (Rahayu
& Djazari, 2016).

d. Tingkat Kesukaran

Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks
kesukaran (difficulty index). Indeks kesukaran butir adalah bilangan yang menunjukkan
sukar dan mudahnya soal. Semakin tinggi indeks kesukaran butir maka soal semakin
mudah. Soal yang baik adalah soal tidak terlalu mudah atau tidak terlalu sukar. Analisis
tingkat kesukaran soal adalah mengkaji soal-soal dari segi kesulitannya sehingga dapat
diperoleh soal-soal mana yang termasuk mudah, sedang, dan sukar.Butir-butir item tes
hasil belajar dapat dikatakan sebagai butir item yang baik apabila butir-butir tes tersebut
tidak terlalu sukar dan tidak pula terlalu mudah. Dengan kata lain derajat kesukaran tes
tersebut adalah sedang atau cukup. (Arikunto, 2009).

16
Angka indeks kesukaran butir itu besarnya berkisar antara 0,00 sampai dengan
1,00. Semakin besar angka indeks kesukaran maka soal semakin mudah. Jika seluruh
peserta ujian menjawab dengan salah butir tersebut maka soal tersebut sangat sukar
dengan angka kesukaran 0,00 dan jika angka kesukaran 1,00 maka soal sangat mudah
karena dijawab dengan benar oleh seluruh peserta tes. (Arikunto, 2009).

Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada
prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang
bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan
untuk soal selected response item. (Nitko, 1996).

Tingkat Kesukaran :

J umlah siswa yang menjawab benar butir butir soal


J umlah siswa yang mengikuti tes

Atau dengan menggunakan rumus :

B
P= N

P = proporsi (indeks kesukaran)

B = jumlah siswa yang menjawab benar

N = jumlah peserta tes

Tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya
untuk keperluan ujian semester digunakan butir soal yang memiliki tingkat kesukaran
sedang, untuk keperluan seleksi digunakan butir soal yang memiliki tingkat kesukaran
tinggi atau sukar, dan untuk keperluan diagnostik biasanya digunakan butir soal yang
memiliki tingkat kesukaran rendah atau mudah.

Tabel indeks kesukaran sebagai berikut

Indeks Kesukaran (P) Kategori


¿0,30 Sukar

17
0,31 – 0, 70 Sedang
¿0,71 Mudah
(Arikunto, 2009)

Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan
kegunaan bagi pengujian dan pengajaran (Nitko, 1996). Kegunaannya bagi guru adalah:
(1) sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan
kepada siswa tentang hasil belajar mereka, (2) memperoleh informasi tentang
penekanan kurikulum atau mencurigai terhadap butir soal yang bias. Adapun
kegunaannya bagi pengujian dan pengajaran adalah: (a) pengenalan konsep yang
diperlukan untuk diajarkan ulang, (b) tanda-tanda terhadap kelebihan dan kelemahan
pada kurikulum sekolah, (c) memberi masukan kepada siswa, (d) tanda-tanda
kemungkinan adanya butir soal yang bias, (e) merakit tes yang memiliki ketepatan data
soal.

Contoh :

Tes formatif IPA, 10 soal bentuk pilihan ganda, option 4, dengan proporsi 2 soal
mudah, 6 soal sedang dan 2 soal sukar, jumlah siswa = 20 orang.

Dalam mencari indeks kesukaran menggunakan rumus yang telah ditulis di atas:

P = B/N = 18/20

P = 0,90

18
Dari contoh di atas diperoleh hasil, yaitu : soal nomor 1, 3, 4, 5, 8 dan 9, terdapat
kesesuaian antara judgement dengan hasil analisa, soal nomor 2 yang di judgement
mudah ternyata termasuk soal sedang, soal nomor 6 yang di judgement sedang ternyata
termasuk soal mudah, soal nomor 7 yang dijudgement sedang, ternyata termasuk sukar
dan soal nomor 10 yang dijudgement sukar, ternyata termasuk soal sedang.
Atas dasar hasil di atas, soal yang harus diperbaiki adalah:

Soal nomor 2, diturunkan ke dalam kategori mudah,


Soal nomor 6, dinaikkan ke dalam kategori sedang,
Soal nomor 7 diturunkan ke dalam kategori sedang, dan
Soal nomor 10, dinaikkan ke dalam kategori sukar.

e. Pengecoh/Distractor

Analisis fungsi distractor dilakukan khusus untuk soal bentuk objektif model
pilihan ganda (multiple choice item). Di dalam soal model pilihan ganda, dilengkapi
dengan beberapa alternatif jawaban yang disebut dengan option (opsi). (Sukiman,
2012)..

Distractor dapat dikatakan telah berfungsi dengan baik apabila distractor tersebut
telah memiliki daya rangsang atau daya tarik yang baik. Distractor telah dapat
menjalankan fungsinya dengan baik apabila distractor tersebut telah dipilih sekurang-
kurangnya 5% dari seluruh peserta tes. Distractor yang telah menjalankan fungsinya
dengan baik dapat digunakan kembali pada tes yang akan datang. Dengan demikian,
efektivitas distractor adalah seberapa baik pilihan yang salah tersebut dapat mengecoh
peserta tes yang memang tidak mengetahui kunci jawaban yang tersedia. Semakin
banyak peserta tes yang memilih distractor tersebut, maka distractor itu dapat
menjalankan fungsinya dengan baik. Jika peserta tes mengabaikan semua option (tidak
memilih) disebut omit. Dilihat dari segi omit, sebuah item dikatakan baik jika omitnya
tidak lebih dari 10 % pengikut tes. (Sudijono, 2011).

Fungsi pengecoh dimaksudkan untuk mengetahui seberapa besar peserta yang


tidak memiliki kunci jawaban (option) pada bentuk soal pilihan ganda. Untuk soal
pilihan ganda, alternatif jawaban menurut kaidah harus homogen dan logis sehingga
setiap pilihan jawaban (opition) dapat berfungsi atau ada yang memilih. Setiap

19
pengecoh dapat dikatakan berfungsi apabila ada yang memilih. Setiap pengecoh dapat
dikatakan berfungsi apabila terpilih minimal sebanyak 5% dari jumlah peserta. Untuk
menghitungnya dapat digunakan rumus sebagai berikut:

Jumlah siswa yang memiliki option yang salah


x 100 %
Jumlah seluruh peserta tes

Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu :


menganalisis pola penyebaran jawaban item. Adapun yang dimaksud dengan pola
penyebaran jawaban item adalah suatu pola yang dapat menggambarkan bagaimana
testee menentukan pilihan jawabnya terhadap kemungkinan-kemungkinan jawab yang
telah dipasangkan pada setiap butir item. Suatu kemungkinan dapat terjadi, yaitu bahwa
dari keseluruhan alternatif yang dipasang pada butir item tertentu, sama sekali tidak
dipilih oleh testee. Dengan kata lain, testee menyatakan ―blangko. Pernyataan blangko
ini sering dikenal dengan istilah omit dan biasa diberi lambang dengan huruf O. Sebagai
tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka distraktor
yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai lagi pada tes-tes
yang akan datang, sedangkan distraktor yang belum dapat berfungsi dengan baik
sebaiknya diperbaiki atau diganti dengan distraktor yang lain. (Sudijono, 2011).

Distraktor dinyatakan telah dapat menjalankan fungsi dengan baik apabila


distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta tes.
Misalnya pengecoh A dipilih oleh 4 orang, berarti 4/50 x 100 = 80%. Dimana 50
merupakan jumlah siswa yang mengikuti tes. Jadi pengecoh A sudah dapat dikatakan
menjalankan fungsinya dengan baik, Karena angka persentasenya sudah melebihi .
(Sudijono, 2007).

Contoh perhitungan:
Dari analisis sebuah item, polanya diketahui sebagai berikut:

Pilihan Jawaban A B C* D O Jumlah


Kelompok atas 5 7 15 3 0 30
Kelompok bawah 8 8 6 5 3 30
Jumlah 13 15 21 8 3 60
C diberi tanda (*) adalah kunci jawaban.

20
Dari pola jawaban soal ini dapat dicari:

1) P = 21/60 = 0,35
2) D = PA – PB = 15/30 - 6/30 = 9/30 = 0,30
3) Distraktor : semua distraktornya sudah berfungsi dengan baik karena sudah dipilih
oleh lebih dari 5% pengikut tes.
4) Dilihat dari segi omit (kolom paling kanan) adalah baik. Sebuah item dikatakan baik
jika omitnya tidak lebih dari 10% pengikut tes.

(5% dari pengikut tes = 5% x 60 orang = 3 orang)


(10% dari pengikut tes = 10% x 60 orang = 6 orang)

Sebenarnya ketentuan ini hanya berlaku untuk tes pilihan ganda dengan 5 alternatif dan
P = 0,80. Tetapi demi praktisnya diberlakukan semua.

Tindak lanjut atas hasil penganalisaan terhadap fungsi distractor tersebut maka
distractor yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai lagi pada
tes‐tes yang akan datang, sedangkan distractor yang belum dapat berfungsi dengan baik
sebaiknya diperbaiki atau diganti dengan distractor yang lain.

Menurut Sudijono (2007) tujuan utama pada distraktor (pengecoh) agar dari
sekian banyak testee yang mengkuti tes hasil belajar ada yang tertarik atau terangsang
untuk memilihnya, sebab menyangka bahwa distraktor yang dipilih itu merupakan
jawaban betul. Sehingga mereka terkecoh, menganggap bahwa distraktor yang
terpasang pada item itu sebagai kunci jawaban item, padahal bukan.

Fungsi distraktor dapat dikatakan baik, apabila distraktor tersebut telah memiliki
daya ransang atau daya tarik sedemikian rupa sehingga peserta tes merasa bimbang dan
ragu-ragu sehingga meraka terkecoh untuk memilih distraktor sebagai jawaban betul,
sebab mereka mengira bahwa distraktor yang mereka pilih itu adalah kunci jawaban
item padahal bukan. Distraktor dinyatakan telah dapat menjalankan fungsi dengan baik
apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh dari seluruh peserta
tes. (Sudijono, 2007).

Misalnya tes hasil belajar bidang studi Biologi diikuti oleh orang siswa MTs.
Bentuk soalnya adalah pilihan ganda dengan item sebanyak butir, dimana butir item di

21
lengkapi dengan lima pilihan, yaitu A, B, C, D, dan E. di peroleh pola penyebaran
jawaban item sebagai berikut

Nomor butir Alternatif (option) Keterangan


soal A B C D E D : Kunci
1. 4 6 5 (30) 5 jawaban

Dengan pola penyebaran jawaban item sebagaimana tergambar pada tabel analisis
diatas, maka dengan mudah bisa ketahui beberapa tes yang telah terkecoh untuk
memilih distraktor yang telah dipasang pada item soal berikut. Pada soal tersebut
memiliki kunci jawaban D, sedangkan distraktornya A, B, C, dan E.

1) Pengecoh A dipilih oleh 4 orang, berarti 4/50 x 100% = 8%. Dimana 50 merupakan
jumlah siswa yang mengikuti tes. Jadi pengecoh A sudah dapat dikatakan
menjalankan fungsinya dengan baik, Karena angka persentasenya sudah melebihi.
2) Pengecoh B dipilih oleh 6 orang testee, berarti 6/50 x 100% = 12% (sudah
berfungsi dengan baik)
3) Pengecoh C dipilih oleh 5 orang testee, berarti 5/50 x 100% = (sudah berfungsi
dengan baik)
4) Pengecoh E dipilih oleh 5 orang testee, berarti 5 x 50 = 10% (sudah berfungsi
dengan baik). (Sudijono, 2007).

f. Kualitas butir soal

Analisis butir soal yang baik berdasarkan Classical Test Theory (CTT) apabila
mempunyai tingkat kesukaran 0,31 sampai 0,70 (sedang), daya beda minimal 0,40
(sedang), dan pengecoh untuk tiap respons minimal 5 %. Item tidak baik, apabila salah
satu parameter tersebut tidak terpenuhi. Menentukan kriteria butir soal yang baik dalam
penelitian dengan yang lebih detail. (Huda & Wahyuni, 2020).

Tabel kualitas butir soal

Validitas Reliabilitas Tingkat Daya Beda Efektifitas Keterangan


Kesukaran Pengecoh
Valid Minimal Sedang Sedang Tanpa revisi Baik

22
Tinggi
Valid Minimal Jika ada satu kriteria soal baik tidak Cukup baik
Tinggi terpenuhi
Valid Minimal Jika ada dua kriteria soal baik tidak Kurang baik
Tinggi terpenuhi
Valid Minimal Jika ada tiga kriteria soal baik tidak Tidak baik
Tinggi terpenuhi
(Huda & Wahyuni, 2019)

Ketentuan : Pada kriteria Validitas butir soal wajib valid dan pada reliabilitas butir soal
harus memiliki reliabilitas minimal tinggi

D. Manfaat Analisis Butir Soal

Menurut Anastasi dan Urbina (1997), kegiatan analisis butir soal memiliki banyak
manfaat sebagai berikut :

1. Dapat membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan
2. Relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk
siswa di kelas
3. Mendukung penulisan butir soal yang efektif
4. Secara materi dapat memperbaiki tes di kelas
5. Dapat meningkatkan validitas soal dan reliabilitas

Nitko (1996) juga menguraikan manfaat kegiatan analisis butir soal, di antaranya
untuk :

1. Menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan
2. Memberi masukan kepada siswa tentang kemampuan dan sebagai dasar untuk
bahan diskusi di kelas
3. Memberi masukan kepada guru tentang kesulitan siswa
4. Memberi masukan pada aspek tertentu untuk pengembangan kurikulum
5. Merevisi materi yang diukur
6. Meningkatkan keterampilan penulisan soal.

Dari uraian di atas menunjukkan analisis butir soal memberikan manfaat:

23
1. Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik
2. Meningkatkan butir soal melalui tiga komponen analisis yaitu tingkat kesukaran,
daya pembeda, dan pengecoh soal
3. Meningkatkan validitas soal dan reliabilitas
4. Merevisi soal yang tidak relevan dengan materi yang diajarkan, ditandai dengan
banyaknya anak yang tidak dapat menjawab butir soal tertentu.

BAB III

PENUTUP

A. Kesimpulan
Analisis butir soal merupakan penilaian pada soal yang dievaluasi guna
mengukur mutu soal. Analisis butir soal dapat dilakukan dengan dua cara yakni
secara kualitatif dan kuantitatif. Analisis secara kualitatif dilaksanakan
berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap).
Sedangkan, analisis butir soal secara kuantitatif didasarkan pada data empirik.
Analisis secara kuantitatif diarahkan untuk menelaah tingkat validitas,
reliabilitas, daya pembeda, dan efektivitas fungsi distraktor. Analisis butir soal
penting dilakukan untuk mengetahui sejauh mana butir soal tersebut dapat
digunakan dalam pengujian tes dan sebagai kontrol hasil prestasi belajar peserta
didik.

B. Kritik dan Saran


Penulis menyadari bahwa dalam penyusunan makalah ini masih banyak
kekurangan, sehingga kritik dan saran yang membangun sangat diharapkan oleh
penulis untuk perbaikan di masa yang akan datang.

24
DAFTAR PUSTAKA

Aiken, Lewis R. 1994. Psychological Testing and Assessment. Eight Edition. Boston:
Allyn and Bacon.

Anastasi & Urbina. (1997). Tes psikologi. Jakarta: Prenhalindo.

Arifin, Z. 2017. Evaluasi Pembelajaran. Bandung : PT Remaja Rosdakarya.

Arikunto, Suharsimi. 2009. Dasar-dasar Evaluasi Pendidikan Edisi Revisi. Jakarta:


Bumi Aksara.

Arikunto, Suharsimi. 2013. Dasar-Dasar Evaluasi Pendidikan. Jakarta : Bumi Aksara.

Daryanto. 2007. Evaluasi Pendidikan. Jakarta : Rinekacita.

Gronlund, N.E. 1985. Measurement and evaluation in teaching. Fifth Edition. New
York: Mc Millan Publishing Co.,Inc.

Huda, N., & Wahyuni, T. S. 2020. Penggunaan Aplikasi Itemn And Test Analysis
(ITEMAN) Pada Soal Try Out UN IPA Tahun . Jurnal Pembelajaran Sains, 4(1).

McDonald R.P., 1999. Test Theory: A Unified Treatment. New Jersey : Larvrence
Erbaum Associates Publishers.

25
Nitko, Anthony J. 1996. Educational Assessment of Students Second Edition. Ohio:
Merrill an imprint of Prentice Hall Englewood Cliffs.

Rahayu, R., & Djazari, M. 2016. Analisis Kualitas Soal Pra Ujian Nasional Mata
Pelajaran Ekonomi Akutansi. Jurnal Pendidikan Akutansi Indonesia, 14(1).

Sudijono, Anas. 2007. Pengantar Evaluasi Pedidikan. Jakarta : Raja Grafindo Persada.

Sudijono, Anas. 2011. Evaluasi Pedidikan. Jakarta : Raja Grafindo Persada.

Sudjana, Nana. 2006. Penilaian hasil belajar proses belajar mengajar. Bandung :
Remaja Rosdakarya.

Sukardi. 2015. Evaluasi Pendidikan Prinsip dan Operasionalnya. Jakarta : PT Bumi


Aksara.

Sukiman. 2012. Pengembangan Sistem Evaluasi. Yogyakarta: Insan Madani.

26

Anda mungkin juga menyukai