Anda di halaman 1dari 40

MAKALAH

ANALISIS POKOK UJI INSTRUMEN RANAH AFEKTIF, KOGNITIF, DAN


PSIKOMOTORIK (RANCANGAN INSTRUMEN, PELAKSANAAN ANALISIS POKOK
UJI DI LAPANGAN, DAN INTERPRETASI HASIL ANALISIS POKOK UJI)

Disusun Untuk Memenuhi Tugas Mata kuliah Evaluasi Pembelajaran


Biologi Dosen Pengampu: Nukhbatul Bidayati Haka, M.Pd.

Disusun Oleh:
Kelompok 6
1. Alfiyani Leoninda (2011060269)
2. Devi Cahyani Pitaloka Sari (2011060436)
3. Gelar Rista (2011060070)
4. Witri Ulandari (2011060184)

PENDIDIKAN BIOLOGI
FAKULTAS TARBIYAH DAN KEGURUAN
UNIVERSITAS ISLAM NEGERI RADEN INTAN
LAMPUNG 2023
KATA PENGANTAR

Assalamu’alaikum Warahmatullahi Wabarakatuh


Segala Puji dan syukur atas kehadirat Allah SWT yang telah melimpahkan rahmat serta hidayah-
Nya sehingga kami mampu menyelesaikan tugas makalah yang berjudul “Mengujikan Dan
Menginterpretasikan Hasil Analisis Pokok Uji Instrumen Afektif, Kognitif, Dan Psikomotorik.” ini tepat
pada waktunya. Shalawat serta salam tak lupa kami curahkan kepada junjungan Nabi besar Muhammad
SAW semoga kita semua mendapatkan syafaat beliau di yaumul akhir nanti Aamiin.
Adapun tujuan dari pembuatan makalah ini adalah untuk memenuhi tugas pada mata kuliah
Evaluasi Pembelajaran Biologi yang telah diberikan dosen pengampu dan juga bertujuan untuk
menambah wawasan serta pengetahuan mengenai Hasil Analisis Pokok Uji Instrumen Afektif, Kognitif,
Dan Psikomotorik bagi para pembaca dan juga bagi penulis. Kemudian dari pada itu, kami sadar bahwa
dalam menyusun makalah ini tidak mungkin terwujud tanpa bantuan dari beberapa pihak yang telah
bersedia meluangkan waktunya untuk membantu. Untuk itu kami mengucapkan terima kasih kepada
semua pihak yang telah membantu sehingga makalah ini dapat diselesaikan sesuai dengan waktunya.
mengingat hal itu dengan segala hormat kami sampaikan rasa terima kasih yang sedalam-dalamnya
kepada dosen mata kuliah Ibu Nukhbatul Bidayati Haka, M.Pd. yang telah memberi arahan untuk dapat
menyelesaikan makalah ini.
Sebelumnya kami menyadari bahwa di dalam makalah ini terdapat banyak kesalahan dan
kekurangan, untuk itu kami meminta maaf. Akhirnya, kami mengucapkan terima kasih dan
mengharapkan kritik dan saran yang dapat membangun laporan kami demi penyempurnaan dan
perbaikan makalah ini selanjutnya. Semoga makalah ini bermanfaat bagi seluruh pembaca.
Wassalamu’alaikumWarahmatullahi Wabarakatuh

Bandar Lampung, 22 Mei 2023

Kelompok 6
BAB I
PENDAHULUAN

A. Latar Belakang

Dalam dunia pendidikan, penilaian merupakan bagian yang tidak terpisahkan dari
proses belajar mengajar. Sistem penilaian yang baik akan mendorong guru menggunakan
strategi mengajar yang lebih baik dan memotivasi anak untuk belajar lebih giat. Penilaian
biasanya dimulai dengan kegiatan pengukuran. Pengukuran (measurment) merupakan cabang
ilmu statistika terapan yang bertujun untuk membangun dasar-dasar pengembangan tes yang
berfungsi secara optimal, valid, dan reliabel.
Proses belajar mengajar dilaksanakan tidak hanya untuk kesenangan atau bersifat
mekanis sajaakan tetapi mempunyai misi dan tujuan yang sama. Dalam usaha untuk
mencapai misi dan tujuan itu perlu diketahui apakah usaha yang dilakukan sudah sesuai
dengan tujuan? Untuk mengetahui apakah tujuan pendidikan sudah tercapai perlu
diadakannya tes. Sebuah tes yang baik dalam pengukuran harus dianalisis terlebih dahulu.
Dalam menganalisis butir soal dalam tes harus memperhatikan daya serap, tingkat kesukaran,
daya beda, fungsi pengecoh, serta validitas dan reliabilita. Hal tersebut dilakukan agar tes
yang diberikan kepada siswa sesuai dengan daya serap siswa, tingkat kesukarannya, dan soal
yang diberikan pun hrus valid. Sehingga tujuan dari pembelajaran dapat tercapai.

B. Rumusan Masalah
Rumusan masalah dalam makalah ini adalah sebagai berikut.

1. Apa yang dimaksud dengan asesmen literasi?

2. Apa yang dimaksud dengan analisis uji pokok?

3. Apa yang dimaksud dengan validitas, reliabilitas, daya beda, tingkat sukar, dan tingkat
pengecoh?
4. Adakah program untuk membantu menghitung analisis pokok uji?
C. Tujuan
Tujuan dari penyusunan makalah ini yaitu:

1. Untuk mengetahui tentang asesmen literasi.

2. Untuk mengetahui analisis uji pokok.

3. Untuk mengetahhui validitas, reliabilitas, daya beda, tingkat sukar, dan tingkat pengecoh.

4. Untuk mengetahui program yang dapat membantu menghitung analisis pokok uji.
BAB II
PEMBAHASAN

A. Asesmen Literasi
Literasi asesmen (penilaian) didefinisikan sebagai suatu pemahaman terhadap prinsip-prinsip
asesmen. Guru yang memiliki literasi asesmen yang mantap akan berada pada posisi baik untuk
mengintegrasikan asesmen kedalam pembelajara, karena mereka menggunakan bentuk-bentuk yang
tepat sesuai dengan pembelajaran. Jadi, literasi asesmen merupanan kemampuan dalam memahami
prinsip-prinsip dasar asesmen yang berkualitas, dan bertindak sesuai tujuan pembelajarn yang
dirancang dengan mengupayakan penggunaan yang seimbang berbagai asesmen alternatif.
Selanjutnya semua asesmen tersebut digunakan sebagai pemandu dalam mengambil
keputusan dan sebagai alat bantu mengajar (teaching tools) untuk memanusiakan peserta didik.
Prang yang mampu melakukan penilaian dan memahami prinsip dasar penilaian disebut dengan
assesment literates. Literasi asesmen juga mencakup pengetahuan tentang seberapa sering asesmen
dilakukan, apa yang harus dinilai, dan bagaimana siswa untuk dinilai.

B. Analisis Pokok Uji


Analisis sesungguhnya bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang
baik, dan soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang kejelekan sebuah
soal dan “petunjuk” untuk mengadakan perbaikan. Analisis pokok uji atau yang biasa disebut
analisis butir soal merupakan suatu prosedur yang sistematis untuk menyelidiki informasi-informasi
khusus terhadap alat evaluasi yang disusun. Analisis pokok uji lebih banyak digunakan pada alat
evaluasi bersifat objektif sepeti tes pilihan ganda (multiple choice).1
Tujuan dari analisis pokok uji adalah sebagai berikut.2

a. Sebagai upaya untuk memperbaiki atau meningkatkan kualitas alat evaluasi.

b. Mengidentifikasi soal yang kurang baik dan jelek.

c. Mendignostik kemampuan siswa.

d. Mengevaluasi pelaksanaan pembelajarann agar lebih baik lagi.

1
Vika Asriningtyas, ‘Pengembangan Instrumen Penilaian Aspek Afektif Dan Psikomotorik Pada Model
Pembelajaran Kooperatif’, Jurnal Pendidikan Fisika, 99.3 (2020), 284–93.
2
Asriningtyas.
Dalam analisis soal terdapat aspek yang saling berkaitan, yaitu penyusunan instrumen,
menentukan tingkat validitas soal, menentukan tingkat reliabilitas soal, menentukan tingkat
kesulitan soal, menentukan daya pembeda, dan menentukan pengecoh.

C. Validitas
Validitas merupakan ketepatan suatu alat ukur dalam menjalankan fungsi ukurannya.
Menurut Azwar, validitas berasal dari kata validity yang mempunyai arti sejauh mana akurasi suatu
tes atau skala dalam menjalankan fungsi pengukurannya. Validasi soal adalah tingkat ketetapan soal.
Valid atau tidaknya suatu soal cukup dianalisis dengan validasi isi. Sebuah tes disebut valid atau
memiliki validitas apabila tes itu dapat tepat mengukur apa yang hendak diukur. Validitas butir
perlu dicari untuk mengetahui butir-butir tes manakah yang menyebabkan soal secara keseluruhan
jelek karena memiliki validitas rendah. Dapat dikatakan bahwa butir soal memiliki validitas yang
tinggi jika skor pada butir soal memiliki kesejajaran dengan skor total. Kesejajaran ini diartikan
dengan korelasi, dilakukan analisis validitas butir soal dengan menggunakan rumus korelasi
product moment angka kasar.3
Istilah validitas dipakai dalam tiga hal: (1) validitas penelitian, (2) validitas soal, dan (3)
validitas alat ukur. Validitas penelitian adalah derajat kesesuaian hasil penelitian dengan keadaan
sebenarnya, atau sejauh mana hasil penelitian menggambarkan keadaan yang sebenarnya.
Sedangkan validitas internal penelitian adalah kesesuaian data hasil penelitian dengan keadaan
sebenarnya. Untuk mencapai validitas internal penelitian maka instrumen penelitian harus
memenuhi syarat tertentu. Adapun validitas eksternal suatu penelitian adalah derajat kesesuaian
antara generalisasi hasil penelitian dengan keadaan yang sebenarnya, atau sejauh mana generalisasi
hasil penelitian sesuai dengan keadaan yang sebenarnya. Untuk menjamin validitas eksternal,
permasalahan sampling harus menjadi perhatian serius peneliti.4
Detail istilah validitas bisa dijelaskan sebagaimana berikut:5

1. Validitas item. Validitas item adalah derajat kesesuaian antara suatu item dengan
perangkat item-item yang lain dari alat ukur yang sama. Ukuran validitas item adalah
korelasi antara skor dari suatu item dengan skor pada perangkat item (item total
correlation) yang biasanya dihitung dengan korelasi point-biserial atau korelasi product
3
Azwar Saifudin, Reliabilitas Dan Validitas, Pustaka Pelajar, 2012.
4
Salma Hayati, ‘Validitas Dan Reliabilitas Instrumen Pengetahuan Pembelajaran Aktif, Kreatif Dan Menyenangkan
(PAKEM) Menggunakan Model RASCH’, Jurnal Ilmiah DIDAKTIKA, 16.2 (2019), 169–79.
5
Ardisti, ‘Validitas Dan Reliabilitas Skala Self-Efficiacy’, Jurnal Ilmu Psikologi Terapan, 02.01 (2022), 144–51.
moment. Isi validitas soal adalah daya pembeda soal (item discriminating power) dan
bukan validitas tes/alat ukur. Apabila masing-masing soal atau item semuanya
berkorelasi tinggi dengan perangkat soal atau perangkat item berarti perangkat soal dalam
suatu tes bersama-sama mengukur sesuatu yang sama.
2. Validitas tes atau alat ukur. Secara umum tes atau alat ukur dipandang valid apabila ia
mampu mengukur apa yang hendak diukurnya, atau sejauh mana tes itu mengukur apa
yang dimaksudkan untuk diukur. Secara konvensional orang mengkaji validitas alat ukur
berdasar tiga arah, yaitu (1) dari arah isi yang diukur, (2) dari arah rekaan teoritis atribut
yang diukur, dan (3) dari arah kriterium yang diukur.
Oleh karenanya macam-macam validitas didasarkan pada tiga arah tersebut, yaitu (1)
content validity, construct validity, dan (3) criterion related validity.6
1. Content validity adalah validitas yang diestimasi melalui pengujian terhadap isi tes
dengan analisis rasional. Valid-tidaknya suatu tes adalah sampai sejauh mana item-
itemnya dapat mencakup seluruh kawasan variabel yang hendak diukur. Estimasi
terhadap validitas isi ini tidak perlu menggunakan perhitungan-perhitungan statistik
apapun, tapi hanya melalui analisis rasional. Ada dua macam content validity, yaitu face
validity dan logical validity. Pertama, Face validity (validitas tampang) adalah suatu tes
dipandang valid apabila item-item tes telah tampak sesuai dengan variabel yang hendak
diukur. Dipilihnya validitas tampang ini biasanya karena alasan praktis seperti halnya
membuat soal ujian. Kedua, logical validity (validitas logik) atau validitas sampling.
Valid-tidaknya suatu tes atau alat ukur tergantung pada sejauhmana item-item tes
mencerminkan (merepresentasikan) aspek-aspek yang akan diukur. Dengan
demikiandiharapkan item-item yang dibuat tidak menyimpang dari aspek-aspek variabel
yang hendak diukur. Validitas logik mempunyai peranan penting dalam tes prestasi,
dengan memberikan kisi-kisi (blue-print) yang mencakup isi dan kompetensi yang
hendak diukur.
2. Construct validity adalah jenis validitas yang menunjukkan sampai sejauh mana suatu tes
mampu mengukur suatu trait atau konstruk teoritis (biasa juga disebut sebagai latent
variable) yang hendak diukur. Atau: validitas konstruk adalah sejauh mana skor-skor
hasil pengukuran dari suatu instrumen merefleksikan konstruksi teoritis yang mendasari
penyusunan instrumen tersebut. Validitas konstruk diestimasi melalui indikator-
6
Hayati.
indikatornya (biasa juga disebut sebagai observed-variable) dengan analisis statistik
yang cukup rumit (analisis faktor (gunakan SPSS atau structure equation modeling) atau
validitas konvergen dan diskriminan). Ada dua metode untuk menguji validitas konstruk
yaitu: (a) dengan metode statistik analisis faktor (confirmatory); (b) dasar fikiran validasi
konvergen dan diskriminan adalah: suatu tes harus berkorelasi tinggi dengan variabel-
variabel yang secara teori memang harus berkorelasi tinggi (validasi konvergen) dan
sekaligus tes itu tidak berkorelasidengan variabel-variabel lain yang secara teori memang
tak berkorelasi (validasi diskriminan).
3. Criterion related validity. Suatu tes dipandang valid apabila skor tes tersebut memiliki
korelasi dengan skor dari suatu kriterium (tes lain yang mengungkap hal yang sama)
yang berada di luar tes. Untuk mengetahui apakah antara skor tes dengan skor kriterium
memiliki korelasi digunakan analisis statistik. Berdasar atas kapan skor kriterianya
diperoleh, maka criterion related validity ini ada dua macam, yaitu predictive validity
dan concurrent validity.7
Pertama, predictive validity adalah jenis validitas yang menggunakan kriterium
berupa skor performansi subyek diwaktu mendatang. Oleh sebab itu validitas ini sangat
penting artinya apabila suatu tes dimaksudkan sebagai prediktor (untuk memprediksi
atau meramalkan) performansi subyek diwaktu mendatang. Misalnya skor tes masuk
yang diperoleh calon mahasiswa digunakan untuk memprediksi Indeks Prestasi
Kumulatif (IPK) mahasiswa tersebut setelah ia menempuh kuliah. Jadi tes masuk suatu
Perguruan Tinggi baru bisa diuji validitasnya setelah diperoleh IPK mahasiswa. Cara
pengujiannya atau proses validasinya adalah dengan mengkorelasikan skor tes masuk
dengan skor IPK yang diperoleh dengan menggunakan teknik korelasi product moment.
Kedua, concurrent validity adalah jenis validitas yang skor kriteriumnya diperoleh
dalam waktu yang sama dengan skor suatu tes/alat ukur lain. Dengan sendirinya alat
ukur yang dipakai sebagai kriterium haruslah mengungkap hal yang sama dengan alat
ukur yang akan diestimasi validitasnya. Suatu alat ukur secara konkuren dipandang valid
apabila antara skor alat ukur tersebut berkorelasi dengan skor kriteriumnya.
Dari 3 (tiga) jenis validitas di atas yang proses validasinya dengan menggunakan
teknik statistic korelasi adalah Criterion Related Validity. Caranya adalah dengan
mengkorelasikan antara skor tes dengan skor kriterium sekelompok subyek dengan
7
Saifudin.
menggunakan teknik korelasi product moment. Koefisien korelasi antara dua perangkat
skor (tes) itu disebut koefisien validitas. Karena koefisien validitas diperoleh dengan cara
korelasi maka orang melakukan uji signifikansi untuk menafsirkan koefisien validitas
tersebut. Ini tidak benar. Koefisien validitas harus ditafsirkan dari koefisien determinasi,
yaitu angka yang menunjukkan proporsi (persentase) varians suatu variabel yang dapat
dijelaskan dari variabel lainnya. Makin tinggi angka ini berarti kecermatan prediksinya
makin tinggi pula. Cara meningkatkan koefisien determinasi adalah dengan menambah
prediktornya.
Mengukur tingkat validitas dapat dilakukan dengan cara:
a. Uji signifikansi dilakukan dengan membandingkan nilai r hitung (hasil uji validitas)
dengan nilai r tabel (nilai tabel) dengan nilai signifikansi 0,05. Hasil uji validitas (nilai r
hitung) yang merupakan hasil dari item-total corelation.
b. Menggunakan rumus pearson product moment betikut:
NƩXY −ƩX . ƩY
r xy =
√¿¿ ¿

Keterangan:

Rxy = koefisien korelasi tiap item

N = banyaknya subjek uji coba

∑X = jumlah skor item

∑Y = jumlah skor total

∑X2 = jumlah kuadrat skor item

∑Y2 = jumlah kuadrat skor total

∑XY= jumlah perkalian skor total dan skor item


Kemudian menghitung nilai uji T dengan rumus:
r √ n−2
T hit =
√1−r
Keterangan:

R = koefisien korelasi

N = jumlah responden (n-2 = dk, derajat kebebasan)

c. Menggunakan rumus Ypbi

Y pbi =
Mp−Mt
St √ p
q
Ypbi = koefisien korelasi biseral
Mp = rerata skor item betul yang dicari validitasnya
Mt = rerata skor total
banyaknya siswa yang benar
St = standar direvisi dari skor total ( p= ¿
jumlah seluruh siswa
q = proporsi siswa yang menjawab salah (q = 1 – p)
Kriteria pemaknaan hasil validitas adalah sebagai berikut.
0,00 < rxy ≤ 0,20 = sangat rendah
0,20 < rxy ≤ 0,40 = rendah
0,40 < rxy ≤ 0,60 = cukup
0,60 < rxy ≤ 0,80 = tinggi
0,80< rxy ≤ 1,00 = sangat tinggiReliabilitas

D. Reliabilitas

Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu pengukuran
dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran
yang relatif sama, selama aspek yang diukur dalam diri subyek memang belum berubah.
Reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu, atau skor-z, relatif
konsisten apabila dilakukan pengulangan pengadministrasian dengan tes yang sama atau tes
yang ekivalen.8
8
Mujianto Solichin, ‘Analisis Daya Beda Soal, Taraf Kesukaran, Validitas, Butir Tes, Interpretasi Hasil Tes Dan
Reliabilitas merupakan salah-satu ciri atau karakter utama instrumen pengukuran yang
baik. Suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada
kelompok yang sama pada waktu atau kesempatan yang berbeda. Konsep reliabilitas dalam arti
reliabilitas alat ukur berkaitan erat dengan masalah kekeliruan pengukuran. Kekeliruan
pengukuran sendiri menunjukkan sejauh mana inkonsistensi hasil pengukuran terjadi apabila
dilakukan pengukuran ulang terhadap kelompok subyek yang sama. Sedangkan konsep
reliabilitas dalam arti reliabilitas hasil ukur berkaitan erat dengan kekeliruan dalam
pengambilan sampel yang mengacu pada inkonsistensi hasil ukur apabila pengukuran
dilakukan ulang pada kelompok yang berbeda. Sudjana menyatakan bahwa reliabilitas alat
penilaian adalah ketepatan atau keajegan alat tersebut dalam menilai apa yang dinilainya.
Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan hasil yang relatif sama.9
Reliabilitas dibedakan atas dua macam, yaitu reliabilitas konsistensi tanggapan, dan
reliabilitas konsistensi gabungan butir. Reliabilitas konsistensi tanggapan responden
mempersoalkan apakah tanggapan responden atau obyek ukur terhadap tes atau instrumen
tersebut sudah baik atau konsisten. Dalam hal ini apabila suatu tes atau instrumen digunakan
untuk melakukan pengukuran terhadap obyek ukur kemudian dilakukan pengukuran kembali
terhadap obyek ukur yang sama, apakah hasilnya masih tetap sama dengan pengukuran
sebelumnya. Jika hasil pengukuran kedua menunjukkan ketidakkonsistenan maka jelas hasil
pengukuran itu tidak mencerminkan keadaan obyek ukur yang sesungguhnya.10
Untuk mengetahui apakah tanggapan terhadap tes atau instrumen itu mantap, konsisten
atau tidak plin-plan, dapat dilakukan dengan cara memberikan tes yang sama secara
berulang kali (dua kali) kepada obyek ukur atau responden yang sama. Pengetesan dua kali
merupakan syarat minimal untuk mengetahui apakah tanggapan obyek ukur terhadap tes
tersebut konsisten atau tidak.11
Dalam pelaksanaan pengetesan dua kali ini dapat ditempupuh berbagai cara yaitu kita
melakukan pengetesan dua kali dengan tes sama terhadap obyek ukur yang sama, atau dengan
melakukan pengetesan sekali dengan menggunakan dua tes yang butir-butirnya setara. Jika
kita menggunakan pengetesan sekali maka kesamaan atau kesetaraan tes yang digunakan
merupakan syarat mutlak yang harus dipenuhi, karena kemantapan atau konsistensi tanggapan
Validitas Ramalan Dalam Evaluasi Pendidikan’, Dirasat, 2.2 (2022), 192–213.
9
Saifudin.
10
Asriningtyas.
11
Liza Yulia Sari, ‘Analisis Soal Ulangan Harian Pada Materu Virus Kelas X SMAN 5 Solok Selatan’, Jurnal
Pelita Pendidikan, 8.1 (2020), 89–93.
terhadap butir-butir yang akan diperiksa.12
Pada teknik belah dua ini pengukuran dilakukan dengan dua kelompok butir yang
setara pada saat yang sama. Karena setiap kelompok butir merupakan separuh dari seluruh tes,
maka biasanya kelompok butir pertama diambil dari butir-butir tes yang bernomor ganjil,
sedangkan kelompok butir yang kedua diambil dari butir-butir tes yang bernomor genap. Perlu
diketahui bahwa reliabilitas dengan teknik ini sangat relatif, karena reliabilitas akan tergantung
pada cara penomoran dan pengelompokan butir yang diambil. Di sini pengukuran dilakukan
dengan menggunakan dua tes yang dibuat setara kemudian diberikan kepada responden atau
obyek tes dalam waktu yang bersamaan. Skor dari kedua kelompok butir tes tersebut
dikorelasikan untuk mendapatkan reliabilitas tes. Djaali menyatakan bahwa reliabilitas
konsistensi gabungan butir berkaitan dengan kemantapan antara butir suatu tes. Hal ini dapat
diungkapkan dengan pertanyaan, apakah terhadap obyek ukur yang sama, butir yang satu
menunjukkan hasil ukur yang sama dengan butir yang lainnya? Dengan kata lain bahwa
terhadap bagian obyek ukur yang sama, apakah hasil ukur butir yang satu tidak kontradiksi
dengan hasil ukur butir yang lain.13
Jika terhadap bagian obyek ukur yang sama, hasil ukur melalui butir yang satu
kontradiksi atau tidak konsisten dengan hasil ukur melalui butir yang lain maka pengukuran
dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya. Dengan kata lain tidak
reliabel dan tidak dapat digunakan untuk mengungkap ciri atau keadaan yang sesungguhnya
dari obyek ukur. Kalau hasil pengukuran pada bagian obyek ukur yang sama antara butir yang
satu dengan butir yang lain saling kontradiksi atau tidak konsisten maka kita jangan
menyalahkan obyek ukur, melainkan alat ukur (tes) yang dipersalah- kan dengan mengatakan
bahwa tes tersebut tidak reliabel terhadap obyek yang diukur. 14

12
Arabiatin, E., & Mulabbiyah, M. (2020). Analisis Kelayakan Butir Soal Tes Penilaian Akhir Semester Mata
Pelajatan Matematika Kelas VI Di SDN 19 Ampenan Tahun Pelajaran 2019/2020. EL Midad. 12(2):146-171
13
Saifudin.
14
Solichin.
Koefisien reliabilitas konsistensi gabungan butir untuk skor butir dikotomi dapat
dihitung dengan menggunakan rumus berikut.
a. Rumus K-R 20 dan K-R 21

[ ][ ]
2
n S −Ʃpq
r 11 = 2
n−1 5

( n−1
r 11 =
n
)(1− M −(n−m)
nS ) 2
t

keterangan

r11 = reliabilitas tas secara keseluruhan

p = proporsi siswa yang menjwab secara keseluruhan


q = proporsi siswa yang menjawab salah
∑pq = jumlah perkalian antar p dan q (q= 1 - p)
S = standar deviasi dari tes
M = rata-rata

[ ][ ]
t
n s −Ʃpq
b. Rumus Spearman-Brown r 11 = t
n−1 S

Keterangan :

c. Rumus Flagnan

(
r 11 = 1
V 1. V 2
Vt )
Keterangan:

r11 = reliabilitas instrumen

vt = varians total atau varians skor total

d. Rumus Rulon
vd
r 11 =1−
vt

Keterangan:

r11 = reliabilitas instrumen

Vt = varians total atau varians skor total

Vd = varians (varians difference)

)( )
2

(n Σσ
e. Rumus alpha r 11 = 1− 2a
( n−1 ) σ1

Keterangan:

r11 = reliabilitas yang dicari

k = banyaknya butir pertanyaan atau banyaknya soal

Berikut adalah kriteria pemaknaan hasil reliabilitas.

a. Indeks reliabilitas

0,00 ≤ r11 ≤ 0,20 = sangat rendah


0,20 < r11 ≤ 0,40 = rendah
0,40 < r11 ≤ 0,60 = cukup

0,60 < r11 ≤ 0,80 = tinggi

0,80 < r11 ≤ 1,00 = sangat tinggi

b. Data dikatakan reliabel apabila nilai r11 dikorelasikan denga rtabel jika r11 > rtabel.

E. Daya Beda

Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa
yang pandai (berkemampuan tinggi) dengan siswa yang kurang pintar (berkemampuan
rendah). Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi,
disingkat (d besar). Indeks diskriminasi berkisar antara 0,00 sampai 1,00. Hanya bedanya,
indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada tanda
negatif. Tanda negatif pada indeks diskriminasi digunakan jika sesuatu soal “terbalik”
menunjukkan kualitas testee.15 Angka yang menunjukkan besarnya daya beda disebut Indeks
Diskriminasi berkisar antara 0,00 sampai 1,00. Akan tetapi pada indeks diskriminasi ini
mengenal/ ada tanda negatif (-) yakni -1,- 0, 0 - 1,0 (semakin ke kanan soal semakin baik,
semakin ke kiri maka soal semakin jelek, sebab semakin ke kanan siswa yang pandai semakin
sulit/tidak bisa menjawab dan sebaliknya siswa yang kurang pintar (kiri) bisa menjawab
dengan asal-asalan).16

Berikut adalah rumus yang digunakan untuk menghitung daya beda :


BA BB
D= − = p A − pB
JA JB
Keterangan

D = Indek diskriminasi (daya beda)

JA = Banyaknya peserta kelompok atas


JB = Banyaknya peserta kelompok bawah
BA = Banyaknya peserta kelompok atas yang menjawab soal dengan benar
BB = Banyaknya peserta kelompok bawah yang menjawab soal dengan benar
PA = Proporsi peserta kelompok atas yang menjawab benar
PB = Proporsi peserta kelompok bawah yang menjawab benar .
Berikut adalah kriteria pemaknaan hasil dari daya pembeda.
D = 0,00 ≤ DP ≤ 0,20 → Jelek (poor)

D = 0,21 < DP ≤ 0,40 → Cukup (satisfactory)


D = 0,41 < DP < 0,70 → Baik (good)
D = 0,71 < DP < 1,00 → Baik Sekali (exellent)

D = Negatif, semuanya → tidak baik, jadi semua butir soal yang mempunyai nilai D
negatif sebaiknya dibuang saja. Sedangkan butir soal yang baik mempunyai indeks
diskriminasi 0,4 – 0,7.17
Berdasarkan Karjono Natar, manfaat dari daya pembeda butir soal adalah sebagai
berikut.

15
Arikunto, Dasar-Dasar Evaluasi Pendidikan, 211.
16
Ibid., 211.
17
Ibid., 213-217.
1) Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan
indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik,
direvisi, atau ditolak.
2) Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan
kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi
yang diajarkan guru.Apabila suatu butir soal tidak dapat membedakan kedua
kemampuan siswa itu, maka butir soal itu dapat dicurigai “kemungkinannya” seperti
berikut ini: (a) kunci jawaban butir soal itu tidak tepat; (b) butir soal itu memiliki 2
(dua) atau lebih kunci jawaban yang benar; (c) kompetensi yang diukur tidak jelas; (d)
pengecoh tidak berfungsi; (e) materi yang ditanyakan terlalu sulit, sehingga banyak
siswa yang menebak; (f) sebagian besar siswa yang memahami materi yang ditanyakan
berpikir ada yang salah informasi dalam butir soalnya.18
Butir soal tes yang baik juga harus dapat menunjukan daya pembedanya.
Sebagaimana penuturan Arikunto di atas, “daya beda adalah kemampuan suatu soal untuk
membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang
(berkemampuan rendah).” Daya beda berhubungan dengan derajad kemampuan butir
membedakan dengan baik prilaku pengambil tes dalam tes yang dikembangkan. Soal dapat
dikatakan mempunyai daya pembeda jika soal tersebut dapat dijawab oleh siswa
berkemampuan tinggi dan tidak dapat dijawab oleh siswa berkemampuan rendah. Jika
suatu soal dapat dijawab oleh siswa pintar maupun kurang, berarti soal tersebut tidak
mempunyai daya beda, demikian juga jika soal tersebut tidak dapat dijawab oleh siswa
pintar dan siswa kurang, berarti soal tersebut tidak baik sebab tidak mempunyai daya
pembeda.19

F. Tingkat Sukar
Tingkat kesukaran butir soal adalah proporsi antara banyaknya peserta tes yang menjawab
butir soal dengan benar dengan banyaknya peserta tes. Hal ini berarti makin banyak peserta tes yang
menjawab butir soal dengan benar maka makin besar indeks tingkat kesukaran, yang berarti makin
mudah butir soal itu. Sebaliknya makin sedikit peserta tes yang menjawab butir soal dengan
benar maka soal tersebut makin sukar. Tingkat kesukaran butir soal diukur oleh persentase siswa

18
Karjono Natar, Panduan Analisis Butir Soal (Lampung: UNILA Press, 2011), 12.
19
Purwanto, Evaluasi Hasil Belajar (Yogyakarta: Pustaka Pelajar, 2011), 102.
yang menjawab soal dengan benar. Jika soal mudah maka indeks kesukaran lebih tinggi. Soal
dengan nilai p yang mendekati 0 adalah soal yang sangat sulit, sedangkan soal dengan nilai p
mendekati 1 adalah soal yang sangat mudah. Indeks tingkat kesukaran yang sangat baik adalah 0,4
sampai 0,7.
Tinggi rendahnya tingkat kesukaran suatu butir soal dapat disebabkan oleh kerumitan
(kompleksitas) pokok soal dan kondisi pilihan jawaban yang disediakan. Dalam arti keluasan
pertanyaan soal sering membingungkan peserta tes dan alternatif jawaban yang homogen atau
kalimat soal sulit dipahami atau mempunyai pengertian ganda bagi peserta tes. Tingkat kesukaran
soal berkaitan dengan persentase peserta yang menjawab soal dengan benar. Semakin mudah butir
soal, makin besarlah persentasenya. Jika tingkat kesukaran 70 % (p = 0,70), soal tersebut dianggap
lebih mudah dibandingkan jika tingkat kesukaran soalnya 15 % (p = 0,15).yang paling baik adalah
soal yang mempunyai tingkat kesukaran 0,50.20
Tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal itu baik atau tidak.
Tingkat kesukaran butir hanya menunjukkan bahwa butir soal itu sukar atau mudah untuk kelompok
peserta tes tertentu. Butir soal hasil belajar yang terlalu sukar atau terlalu mudah tidak banyak
memberi informasi tentang butir soal atau peserta tes. Pada analisis butir soal secara klasikal, tingkat
kesukaran dapat diperoleh dengan beberapa cara antara lain : a). skala kesukaran linier; b). skala
bivariat; c). indeks davis; d). proporsi menjawab benar. Cara yang paling umum digunakan adalah
proporsi menjawab benar atau proportion correct, yaitu jumlah peserta tes yang menjawab benar
pada soal yang dianalisis dibandingkan dengan peserta tes seluruhnya. Besarnya tingkat kesukaran
berkisar antara 0,00 sampai 1,00. Untuk sederhananya, tingkat kesukaran butir dan perangkat soal
dapat dibagi menjadi tiga kelompok, yaitu mudah, sedang dan sukar. Sebagai patokan dapat
digunakan tabel sebagai berikut:21
Tingkat Kesukaran Nilai p

Sukar 0,00 - 0,3

Sedang 0,3 - 0,7

Mudah 0,7 - 1,00

20
Melinda Yustiva Sumarra, Ana Ratna Wulan, and Eni Nuraeni, ‘Analisis Penggunaan Tes Tertulis Tentang
Keterampilan Mengevaluasi Dan Merancang Penyelidikan Ilmiah Pada Matapelajaran IPA-Biologi SMP’, Jurnal Penelitian
Pendidikan, 20.1 (2020), 279–93.
21
Solichin.
Adapun rumus tingkat kesukaran (p) adalah sebagai berikut:

ƩB
P=
N

Keterangan:

p = tingkat kesukaran

∑B = jumlah peserta didik yang menjawab benar


N = jumlah peserta didik

G. Tingkat Pengecoh
Pada soal bentuk pilihan-ganda ada alternatif jawaban (opsi) yang merupakan pengecoh.
Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab
salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata.
Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau mendekati
jumlah ideal.22 Indeks pengecoh dihitung dengan rumus:
P
Ip=
( N −lim p ) (n−1)

Keterangan:

IP : indeks pengecoh

P : Jumlah peserta didik yang memilih pengecoh

N : Jumlah peserta didik yang ikut tes


B : Jumlah peserta didik yang menjawab benar pada setiap soal
n : jumlah alternatif jawaban (opsi)
1 : bilangan tetap

Kriteria untuk menilai penggunaan pengecoh yaitu sebagi berikut:

Sangat Baik IP = 76% - 125%

Baik IP = 51% - 75% atau 126% - 150%

22
Solichin.
Kurang Baik IP = 26% - 50% atau 151% - 175%

Jelek IP = 0% - 25% atau 176% - 200%

Sangat jelek IP = lebih dari 200%

Adapun kualitas pengecoh berdasarkan indeks pengecoh adalah:

Jawaban yang Berfungsi Kriteria


4 opsi jawaban Sangat baik
3 opsi jawaban Baik
2 opsi jawaban Kurang baik
1 opsi jawaban Jelek
Tidak ada opsi jawaban Sangat jelek

yang berfungsi

H. Program Anates Versi 4


Anates atau singkatan dari analisis hasil tes adalah program aplikasi komputer yang khusus
digunakan untuk menganalisa tes. Program ini dikembangkan oleh Bapak Drs. Karno To, M.Pd.
seorang dosen Psikologi di Universitas Pendidikan Indonesia (UPI) dan Bapak Yudi Wibisono, S.T
seorang konsultan komputer, mereka mencoba membantu mahasiswa dan pendidik dalam
menghitung analisis butir soal dan berkaitan dengan evaluasi. Anates versi 4 diluncurkan berbasis
operating sistem Windows. Karena keterbatasan dan belum mantapnya teori tentang analisis bentuk
uraian, pengembang membuat program aplikasi Anates versi 4 hanya dapat digunakan untuk
menganalisis bentuk soal pilihan ganda saja. Baru pada Anates versi 4.0. yang diluncurkan pada
tanggal 22 Februari 2004 pengembang berhasil membuat Anates yang lebih sempurna yaitu dapat
menganalisis bentuk soal uraian.23
Anates versi 4 memiliki kemampuan untuk menganalisa soal tes seperti:24

1. Menghitung skor (asli maupun dibobot).

23
Ani Interdiana Candra Sari and Mirna Herawati, ‘Apliksasi Anates Versi 4 Dalam Menganalisis Butir Soal’,
Faktor Jurnal Ilmiah Kependidikan, I.2 (2019), 203–14.
24
Mahmud Alpusari, ‘Analisis Butir Soal Konsep Dasar IPA 1 Melalui Peggunaan Program Komputer Anates Versi
4.0 For Windows’, Jurnal Primary, 3.2 (2019), 106–15.
2. Menghitung reliabilitas tes.

3. Mengelompokan subjek kedalam kelompok atas atau bawah.

4. Menghitung daya pembeda.

5. Menghitung tingkat kesukaran soal.

6. Menghitung korelasi skor butir dengan skor total.

7. Menentukan kualitas pengecoh (disktaktor)

Keunggulan dari Anates versi 4 sebagai program analisis butir adalah dapat digunakan
untuk analisis butir soal bentuk uraian, disamping untuk analisis soal bentuk pilihan ganda.
Penggunaan bahasa Indonesia dalam program ini, juga merupakan salah satu sisi kemudahan
dalam pengunaannya daripada program lain yang menggunakan bahasa inggris. Hasil analisis
tentang skor yang dapat diperoleh setiap test juga dapat ditransfer ke Ms Excel untuk dihitung
nilainya. Selain itu dengan menggunakan aplikasi Anates proses analisis tes akan menjadi lebih
mudah, cepat, dan akurat.25

Pada dasarnya kegunaan anates sama dengan item pengolah data lainnya namun secara
pengoperasian lebih mudah. Fungsi dan manfaat anates ini sudah pastinya untuk menganalisis
data soal-soal pilihan ganda (multiple choice), yang diujikan. Dengan anates versi 4 ini kita
bisa memeriksa jawaban soal yang benar dan jawaban soal yang salah dengan praktis dan
cepat. Setelah soal diperiksa, dengan anates ini kita bisa melakukan penyekoran dan
pemberian bobot untuk jawaban soal yang salah. Selain itu, data soal akan langsung
diolah sehingga kita bisa langsung mengetahui:26

a. Untuk soal pilihan ganda

1. Uji reliabilitas

2. Pengelompokan Unggulan dan Asor

3. Analisis daya beda- Analisis tingkat kesukaran

4. Korelasi skor tiap butir soal dengan skor total

25
Winda Ayu Fietri, Zulyusari, and Violita, ‘Analisis Butir Soal Biologi Kelas XI Madrasah Aliyah Sakinah Kerinci
Menggunakan Program Komputer Anates 4.0 for Windows’, Natural Science: Jurnal Penelitian Bidang IPA Dan
Pendidikan IPA, 7.1 (2021), 28–35.
26
Alpusari.
5. Kualitas pengecoh

6. Rekap Analisis butir

b. Untuk soal uraian

1. Uji reliabilitas

2. Pengelompokan unggulan dasar dan asor

3. Analisis daya beda- Analisis tingkat kesukaran

4. Korelasi skor tiap butir dengan skor total

5. Rekap analisis butir


Berikut adalah langkah-langkah menggunakan program anates versi 4.

Langkah 1. Siapkan tabel Ms. Excel hasil sebaran angket yang diisi oleh siswa
Langkah 2. Buka software anates kemudian buat file baru

Langkah 3. Masukan jumlah soal dan siswa yang menjadi responden angket
Langkah 4. Input ulang data dari Ms. Excel kedalam tabel yang ada di Anates

Langkah 5. Tampilan setelah selesai penginputan


Langkah 6. Kembali ke halaman awal dan pilih olah data atau olah semua otomatis.

Langkah 7. Hasil dari pengolahan data reliabilitas menunjukkan angka 0,87


Langkah 8. Hasil dari pengolahan data daya pembeda

Langkah 9. Hasil dari pengolahan data tingkat kesukaran


Langkah 10. Hasil dari pengolahan data validitas.

Hasil (-) tidak disarankan untuk dipakai.

Langkah 11. Rekap hasil kesuluruhan analisis pengolahan data


I. Interpretasi Hasil Analisis Pokok Uji
Berikut ini merupakan tabulasi data hasil hitung soal multiple choice.

Diketahui :

n = 25

k = 24

ƩXt = 401

ƩX t2 = 6877

Ditanya:
1. Validitas
2. Reliabilitas
3. Daya beda
4. Derajat kesukaran
Jawab:
1. Validitas
2. Reliabilitas
a. Varian total
2
s t =Ʃ X t ¿ ¿ ¿
¿ 6877 ¿ ¿ ¿
160.801
6877
25
¿
25
6877−6.432, 22
¿
25
444 , 96
¿
25
¿ 17,7982

b. Mencari reliabilitas instrumen menggunakan rumus K–R 20

( )
2
k S t −Ʃp. q
r 11 =
( k−1 ) S 2t

¿
24
( 24−1 ) (
17,7984−5,1808
17,7984 )
¿ (
24 12, 61 , 76
23 17,7984 )
¿ 0,7397

c. Mencari relibilitas instrumen menggunakan rumus KR-21


𝑡

r 11 =
k
k−1
1−
(
M t ( k −M t )
K . S 23 )
Menghitung mean total

∑ x t 401
Mt= = =16 ,04
n 25

Masukkan kedalam rumus

r 11 =
k
k−1
1−
(
M t ( k −M t )
K . S 23 )
¿
24
24−1
1− (
16 ,04 ( 24−16 , 04 )
24 .17,7984 )
¿
24
23
1−(16 , 04 . 7 , 96
427,1616 )
¿
24
23
1−(127,6784
427,1616 )
24
¿ (1−0,288 )
23

¿ 0,7315

d. Berdasarkan perhitungan menggunakan rumus K-R 20 dan K-R 21 instrumen tes yang
telah diberikan kepada 25 siswa bersifat reliabel. Hal tersebut berdasarkan batas kritis r tabel
≥ 0,700 dimana rhitung ≥ 0,700. Kedua rumus tersebut bisa digunakan untuk mencari
validitas instrumen. Akan tetapi, KR-21 menghasilkan nilai indeks yang lebih kecil.

3. Daya beda
BA BB
D= −
JA JB
7 6
¿ −
12 12
¿ 0 , 08
Berikut adalah tabel hasil perhitungan daya beda seluruh butir item.

Butir Soal Hasil hitung Kriteria

D1 0,08 Jelek

D2 0,25 Cukup

D3 0,58 Baik

D4 0,28 Cukup

D5 0,08 Jelek

D6 0,33 Cukup
D7 0,25 Cukup

D8 0,33 Cukup

D9 0,25 Cukup

D10 0,33 Cukup

D11 0,16 Jelek

D12 0,25 Cukup

D13 0,06 Jelek

D14 0,08 Jelek

D15 0,16 Jelek

D16 0,33 Cukup

D17 0,00 Jelek

D18 0,33 Cukup

D19 0,25 Cukup

D20 0,00 Jelek

D21 0,25 Cukup

D22 0,25 Cukup

D23 0,33 Cukup

D24 0,16 Jelek

B
4. Derajat Kesukaran P=
N
13
P 1= =0 , 25 ( Sukar )
25

16
P 2= =0 , 64 (Sedang )
25

Berikut adalah tabel hasil perhitungan derajat kesukaran.

Butir Soal Hasil hitung Kriteria

P1 0,25 Sukar

P2 0,64 Sedang

P3 0,68 Sedang

P4 0,72 Mudah

P5 0,64 Sedang

P6 0,68 Sedang

P7 0,60 Sedang

P8 0,72 Mudah

P9 0,48 Sedang

P10 0,64 Sedang

P11 0,72 Mudah

P12 0,76 Mudah

P13 0,64 Sedang

P14 0,76 Mudah

P15 0,56 Sedang


0,80
P16 Mudah
P17 0,72 Mudah

P18 0,72 Mudah

P19 0,60 Sedang

P20 0,72 Mudah

P21 0,64 Sedang

P22 0,72 Mudah

P23 0,64 Sedang

P24 0,72 Mudah

Kesimpulan yang didapatkan dari hasil derajat kesukaran diatas adalah butir soal sukar
terdapat 1 item, mudah 11 item, dan dan sedang 12 item.
BAB III
PENUTUP

A. Kesimpulan
Berikut adalah kesimpulan dari makalah yang telah kelompok kami buat.

a. Analisis sesungguhnya bertujuan untuk mengadakan identifikasi soal-soal yang baik,


kurang baik, dan soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang
kejelekan sebuah soal dan “petunjuk” untuk mengadakan perbaikan. Dalam analisis soal
terdapat tiga komponen yang saling berkaitan, yaitu taraf kesukaran, daya pembeda, dan
pola jawaban soal.
b. Validitas merupakan ketepatan suatu alat ukur dalam menjalankan fungsi ukurannya.
Validitas berasal dari kata validity yang mempunyai arti sejauh mana akurasi suatu tes atau
skala dalam menjalankan fungsi pengukurannya.
c. Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan masalah
kekeliruan pengukuran. Kekeliruan pengukuran sendiri menunjukkan sejauh mana
inkonsistensi hasil pengukuran terjadi apabila dilakukan pengukuran ulang terhadap
kelompok subyek yang sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil
ukur berkaitan erat dengan kekeliruan dalam pengambilan sampel yang mengacu pada
inkonsistensi hasil ukur apabila pengukuran dilakukan ulang pada kelompok yang berbeda.
d. Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang
pandai (berkemampuan tinggi) dengan siswa yang kurang pintar (berkemampuan rendah).
Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, disingkat
(d besar). Indeks diskriminasi berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks
kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi ada tanda
negatif.
e. Tingkat kesukaran butir soal adalah proporsi antara banyaknya peserta tes yang menjawab
butir soal dengan benar dengan banyaknya peserta tes. Hal ini berarti makin banyak peserta
tes yang menjawab butir soal dengan benar maka makin besar indeks tingkat kesukaran,
yang berarti makin mudah butir soal itu.
f. Pada soal bentuk pilihan-ganda ada alternatif jawaban (opsi) yang merupakan pengecoh.
Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik yang
menjawab salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara
tidak merata.

B. Saran
Kami sangat berharap pembaca dapat memahami materi tentang Analisis Pokok Uji
Instrumen Ranah Afektif, Kognitif, Dan Psikomotorik (Rancangan Instrumen, Pelaksanaan Analisis
Pokok Uji Di Lapangan, Dan Interpretasi Hasil Analisis Pokok Uji). Untuk itu sebaiknya pembaca
dapat mencari buku referensi yang lain yang juga berkaitan dengan materi ini agar dapat menambah
pengetahuan pembaca lebih baik lagi.
DAFTAR PUSATAKA

Alpusari, Mahmud, ‘Analisis Butir Soal Konsep Dasar IPA 1 Melalui Peggunaan Program Komputer
Anates Versi 4.0 For Windows’, Jurnal Primary, 3.2 (2019), 106–15

Ardisti, ‘Validitas Dan Reliabilitas Skala Self-Efficiacy’, Jurnal Ilmu Psikologi Terapan, 02.01 (2022),
144–51

Arabiatin, E., & Mulabbiyah, M. (2020). Analisis Kelayakan Butir Soal Tes Penilaian Akhir Semester
Mata Pelajatan Matematika Kelas VI Di SDN 19 Ampenan Tahun Pelajaran 2019/2020. EL Midad.
12(2):146-171

Asriningtyas, Vika, ‘Pengembangan Instrumen Penilaian Aspek Afektif Dan Psikomotorik Pada Model
Pembelajaran Kooperatif’, Jurnal Pendidikan Fisika, 99.3 (2020), 284–93

Elviana. (2020). Analisis Butir Soal Evaluasi Pembelajaran Pendidikan Agama Islam
Menggunakan Program Anates. Jurnal MUDARRISUNA. 10(2):58-74

Fietri, Winda Ayu, Zulyusari, and Violita, ‘Analisis Butir Soal Biologi Kelas XI Madrasah Aliyah
Sakinah Kerinci Menggunakan Program Komputer Anates 4.0 for Windows’, Natural Science:
Jurnal Penelitian Bidang IPA Dan Pendidikan IPA, 7.1 (2021), 28–35

Hayati, Salma, ‘Validitas Dan Reliabilitas Instrumen Pengetahuan Pembelajaran Aktif, Kreatif Dan
Menyenangkan (PAKEM) Menggunakan Model RASCH’, Jurnal Ilmiah DIDAKTIKA, 16.2
(2019), 169–79

Hidayatul, M., Sukarno & Syefrinando, B. (2022). Analisis Kualitas Instrumen Tes Fisika Kelas X
Menggunakan Software Anates. Physics and Science Education Jurnal (PSEJ). (2021)

Khofifah, U., Ratnasari. (2020). Analisis Butir Soal Kemampuan Tree Thinking Pada Instrumen Uji
Coba Materi Spermathophyta. Biodik. 6(3): 328-335.

Saifudin, Azwar, Reliabilitas Dan Validitas, Pustaka Pelajar, 2012

Sari, Ani Interdiana Candra, and Mirna Herawati, ‘Apliksasi Anates Versi 4 Dalam Menganalisis Butir
Soal’, Faktor Jurnal Ilmiah Kependidikan, I.2 (2019), 203–14

Sari, Liza Yulia, ‘Analisis Soal Ulangan Harian Pada Materu Virus Kelas X SMAN 5 Solok Selatan’,
Jurnal Pelita Pendidikan, 8.1 (2020), 89–93

Solichin, Mujianto, ‘Analisis Daya Beda Soal, Taraf Kesukaran, Validitas, Butir Tes, Interpretasi Hasil
Tes Dan Validitas Ramalan Dalam Evaluasi Pendidikan’, Dirasat, 2.2 (2022), 192–213

Sumarra, Melinda Yustiva, Ana Ratna Wulan, and Eni Nuraeni, ‘Analisis Penggunaan Tes Tertulis
Tentang Keterampilan Mengevaluasi Dan Merancang Penyelidikan Ilmiah Pada Matapelajaran
IPA-Biologi SMP’, Jurnal Penelitian Pendidikan, 20.1 (2020), 279–93

Anda mungkin juga menyukai