Makalah ini Disusun Untuk Memenuhi Salah Satu Tugas Mata Kuliah Evaluasi
Pembelajaran Kimia
Oleh :
RETNO HARDILLAH
22176014
Puji dan syukur penulis ucapkan kehadirat Allah SWT, karena atas berkat
rahmat, nikmat dan karunia-Nya, sehingga penulis dapat menyelesaikan makalah
evaluasi pembelajaran ini dengan baik. Adapun makalah ini membahas mengenai
Analisis Soal . Shalawat beserta salam senantiasa tercurah untuk Rasulullah SAW.
Adapun tujuan dari pembuatan makalah ini adalah sebagai salah satu syarat
untuk melengkapi tugas mata kuliah evaluasi pembelajaran Semester Genap
Program Studi Pendidikan Kimia Program Pascasarjana Universitas Negeri Padang.
Pada kesempatan ini penulis ingin mengucapkan terima kasih banyak kepada dosen
pembimbing Dr. Andromeda, M.Si., serta rekan-rekan mahasiswa Program Studi
Pendidikan Kimia Program Pascasarjana Universitas Negeri Padang yang telah
memberikan bantuan serta dukungan sehingga penulis dapat menyelesaikan makalah
ini.
Akhirnya, tak ada gading yang tak retak. Penulis menyadari bahwa dalam
penulisan makalah ini masih terdapat kesalahan dan kekurangan. Oleh karena itu,
saran dan kritik yang bersifat konstruktif sangat penulis harapkan. Semoga makalah
ini dapat bermanfaat hendaknya. Atas kritik dan saran yang diberikan, penulis
ucapkan terima kasih.
Penulis
DAFTAR ISI
Judul ...........................................................................................................................
Kata pengantar............................................................................................................
BAB I PENDAHULUAN
1.1 Latar Belakang .....................................................................................................1
1.2 Rumusan Masalah ................................................................................................2
1.3 Tujuan ..................................................................................................................3
BAB II PEMBAHASAN
2.1 Validitas ..............................................................................................................4
2.2 Realibilitas............................................................................................................7
2.3 Daya Beda ............................................................................................................10
2.4 Indeks Kesukaran ................................................................................................15
2.5 fungsi Distaktor.....................................................................................................16
BAB III PENUTUP
3.1 Kesimpulan...........................................................................................................19
DAFTAR PUSTAKA
BAB I
PENDAHULUAN
1
dapat memberikan informasi setepatnya, sehingga dapat dieketahui siswa yang telah
menguasai materi dan yang belum.
Proses evaluasi merupakan salah satu sarana penting dalam meraih tujuan
pembelajaran. Salah satu metode yang dapat digunakan untuk melakukan proses
evaluasi pembelajaran adalah dengan melakukan ujian atau tes. Menurut thoha
(2001:43), tes adalah alat pengukuran berupa pertanyaan, perintah, dan petunjuk yang
ditunjukkan kepada teste untuk mendapatkan respon sesuai dengan petunjuk itu.
Alat penilaian atau tes merupakan salah satu komponen penting dalam
kegiatan pemebelajaran, yang tujuannya untuk mengetahui sejauh mana pembelajran
telah dicapai peserta didik. Oleh karena itu seorang pendidik atau guru dituntut
memiliki kemampuan dala merencanakan, menyusun dan membuat alat penilaian.
Namun, setelah membuat dan memberikan tes kepada peserta didik, jarang ada guru
yang melakukan evaluasi terhadap alat penilaian atau butir - butir tes tersebut.
Kebanyakkan guru hanya terfokus untuk mengevaluasi peserta didiknya tanpa
mengidentifikasi tingkat kesukaran, daya pembeda dan fungsi distraktor soal - soal
itu. Padahal, menurut sudijono (2009:369-370) identifikasi terhadap setiap butir item
tes hasil belajar itu dilakukan dengan harapan akan menghasilkan berbagai informasi
berharga, yang pada dasarnya akan merupakan umpan balik guna melakukan
perbaikan, pembenahan dan penyempurnaan kembali terhadap butir butir item yang
telah dikeluarkan dalam tes hasil belajar, sehingga pada massa- massa yang akan
datang tes hasil belajar yang disusun atau dirancang oleh tester (guru,dosen, dan lain
lain) itu betul - betul dapat menjalankan fungsinya sebagai alat pengukur hasil belajar
yang memiliki fungsi sebagai alat pengukur hasil belajar yang memiliki kualitas yang
tinggi.
2
1.3 Tujuan
Adapun tujuan pada makalah ini ialah:
1. Mengetahui analisis soal validitas
2. Mengetahui analisis soal reliabilitas
3. Mengetahui daya beda
4. Mengetahui indeks kesukaran
5. Mengetahui Fungsi distraktor
3
BAB II
PEMBAHASAN
2.1 Validitas
Uji validaitas adalah uji ketetapan atau ketelitian suatu alat ukur dalam mengukur
apa yang sedang ingin di ukur. Dalam pengertian yang mudah dipahamai, uji validitas adalah
uji yang bertujuan untuk menilai apakah seperangkat alat ukur sudah tepat.
Validitas merupakan produk dari validasi. Validasi adalah suatu proses yang
dilakukan oleh penyusun atau pengguna instrumen untuk mengumpulkan data secara empiris
guna mendukung kesimpulan yang dihasilkan oleh skor instrumen. Sedangkan validitas
adalah kemampuan suatu alat ukur untuk mengukur sasaran ukurnya. Contoh: mengukur
panas badan menggunakan termometer. Validitas adalah salah satu ciri yang menandai tes
hasil belajar yang baik. Validitas merupakan salah satu alat ukur yang digunakan untuk
mengukur kecermatan, ketepatan suatu produk.
Validitas digunakan untuk mengukur sah atau valid tidaknya suatu butir pertanyaan.
Skala butir pertanyaan disebut valid, jika sesuai dengan tujuan yang dimaksud dan mengukur
yang harus diukur. Jika skala tidak valid maka tidak bermanfaat bagi peneliti, sebab
tidak mencapai tujuan yang seharusnya. Untuk dapat menentukan apakah suatu tes hasil
belajar telah memiliki validitas atau daya ketepatan mengukur, dapat dilakukan dari dua segi,
yaitu dari segi tes itu sendiri sebagai suatu totalitas, dan dari segi itemnya, sebagai bagian
yang tidak terpisahkan dari tes tersebut (Sudijono, 2012).
Validitas sebuah tes dibedakan menjadi dua jenis, yaitu validitas logis dan validitas
empiris (Sudaryono, 2016). Validitas logis sama dengan analisis kualitatif terhadap sebuah
soal, yaitu menentukan berfungsi tidaknya suatu soal berdasarkan kriteria tertentu. Kriteria
yang diperhatikan dalam soal yaitu kriteria materi, kontruksi, dan bahasa. Validitas empiris
diartikan validitas yang ditentukan oleh kriteria internal dan kriteria eksternal. Kriteria
internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedangkan kriteria
eksternal adalah hasil ukur instrumen atau tes lain diluar instrumen yang menjadi kriteria.
1) Validitas Logis
3
a. Pengujian Validitas Konstruk
Validitas konstruk adalah suatu alat ukur dikatakan valid apabila telah cocok dengan
konstruksi teoritik dimana tes tersebut dibuat. Instrumen yang mempunyai validitas konstruk
jika instrumen tersebut dapat digunakan untuk mengukur gejala sesuai dengan dengan yang
4
didefinisikan. Misalnya akan mengukur efektivitas kerja, maka perlu didefinisikan
terlebih dahulu apa itu efektivitas kerja. Setelah itu disiapkan instrumen yang
digunakan untuk mengukur efektivitas kerja sesuai dengan definisi.
Validitas konstruk biasa digunakan untuk instrumen 3 instrumen yang dimaksudkan
mengukur variabel konsep sikap, minat, konsep diri, lokus kontrol, gaya
kepemimpinan, motivasi berprestasi, dan lain 3lain. Sebuah tes memilki validitas
konstruk apabila soal pertanyaan mengukur aspek berpikir.
Untuk menguji validitas konstruk, maka dapat digunakan pendapat ahli. Setelah
instrumen dikonstruksikan tentang aspek-aspek yang akan diukur, dengan berlandaskan teori
tertentu, maka selanjutnya dikonsultasikan dengan ahli. Para ahli diminta pendapatnya
tentang instrumen yang telah disusun itu. Jumlah tenaga ahli yang digunakan minimal
tiga orang, dan umumnya mereka telah bergelar doktor sesuai dengan lingkup yang diteliti.
Setelah pengujian konstruk dengan ahli, maka diteruskan dengan uji coba instrumen. Setelah
data ditabulasi, maka pengujian validitas konstruk dilakukan dengan analisis faktor, yaitu
dengan mengkorelasikan antar skor item instrument.
b. Pengujian Validitas Isi (Content)
Validitas isi adalah tes yang mencerminkan keseluruhan konten atau materi yang
diujikan atau yang seharusnya dikuasai secara proporsional (Sudaryono, 2016). Validitas isi
sering digunakan dalam penilaian hasil belajar. Tujuan utamanya yaitu untuk
mengetahui sejauh mana peserta didik menguasai materi apa yang telah disampaikan,
dan perubahan psikologis apa yang dialami peserta didik setelah mendapatkan
pengalaman belajar (Sary, 2018).
Instrumen yang harus memiliki validitas isi adalah instrumen yang digunakan untuk
mengukur prestasi belajar dan mengukur efektivitas pelaksanaan program dan tujuan. Untuk
menyusun instrumen prestasi belajar yang mempunyai validitas isi, maka instrumen
harus disusun berdasarkan materi pelajaran yang telah diajarkan. Sedangkan instrumen
yang digunakan untuk mengetahui pelaksanaan program, maka instrumen disusun
berdasarkan program yang telah direncanakan.
Untuk instrumen yang berbentuk tes, maka pengujian validitas isi dapat dilakukan
dengan membandingkan antara isi instrumen dengan materi pelajaran yang telah
diajarkan. Jika dosen memberikan ujian di luar pelajaran yang telah ditetapkan, berarti
5
instrumen ujian tersebut tidak mempunyai validitas isi. Validitas isi suatu tes tidak
mempunyai besaran tertentu yang dihitung secara statistika, tetapi dipahami bahwa tes itu
sudah valid berdasarkan telaah kisi-kisi tes.
Secara teknis, pengujian validitas konstruksi dan validitas isi dapat dibantu dengan
menggunakan kisi-kisi instrumen. Dalam kisi-kisi itu terdapat variabel yang diteliti, indikator
sebagai tolok ukur, dan nomor butir (item) pertanyaan atau pernyataan yang telah dijabarkan
dari indikator. Dengan kisi-kisi instrumen itu, maka pengujian validitas dapat
dilakukan dengan mudah dan sistematis.
2) Validitas Empiris
Disebut juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan
validitas empiris. Sebuah instrument dikatakan memiliki validitas empiris jika
hasilnya sesuai dengan pengalaman. Jika ada istilah :sesuai” tentu ada dua hal yang
dipasangkan, dimana dalam hal ini hasil tes dipasangkan dengan hasil pengalaman.
Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman
tersebut sekarang sudah ada.
Dalam membandingkan hasil sebuah tes maka diperlukan suatu alat pembanding.
Maka hasil tes merupakan sesuatu yang dibandingkan. Contoh : seorang guru ingin
mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini perlu
sebuah kreteria masa lalu yang datanya sekarang dimiliki. Misalnya nilai ulangan
harian atau nilai semester yang lalu.
b. Validitas prediksi
2.2 Reliabilitas
Reliabilitas berasal dari terjemahan dari kata reliability yang mempunyai asal kata
rely dan ability. Bila digabungkan, kedua kata tersebut akan mengerucut kepada pemahaman
tentang kemampuan alat ukur untuk dapat dipercaya dan menjadi sandaran pengambilan
keputusan (Purwanto, 2018). Reliabilitas adalah suatu nilai yang menunjukkan konsistensi
suatu alat pengukur di dalam mengukur gejala yang sama. Suatu instrumen dikatakan reliabel
jika instrumen tersebut dapat menghasilkan data penelitian yang konsisten, karena dengan
konsisten sebuah data dapat dipercaya kebenarannya. Jadi sebuah instrumen dapat dikatakan
reliabel jika menghasilkan data yang sama dalam waktu yang berbeda asalkan karakteristik dari
subjek adalah sama.
Reliabilitas berhubungan dengan kemampuan alat ukur untuk melakukan pengukuran
secara cermat. Reliabilitas merupakan akurasi dan presisi yang dihasilkan oleh alat ukur
dalam melakukan pengukuran (sitoyo dan sodik, 2015).
Dua konsep penting dalam uji reliabilitas data yaitu reliabilitas alat ukur dan
reliabilitas hasil ukur. Reliabilitas alat ukur berkaitan dengan masalah eror pengukuran, eror
pengukuran merujuk pada ketidak konsistenan hasil pengukuran jika instrumen penelitian
digunakan untuk mengukur pada kolompok subjek yang sama. Sementara itu reliabilitas hasil
ukur merujuk pada eror dalam pengambilan sampel subjek, ketidak konsistenan hasil ukur
yang dilakukan secara berulang pada sampel subjek yang berbeda dari populasi yang sama
(Azwar, 2012).
7
Data yang reliabel merupakan kunci dalam sebuah penelitian, karena dari data lah
analisis dan kesimpulan dibuat. Jika data yang digunakan adalah data yang handal maka hasil
dari sebuah penelitian akan memuaskan, begitu sebaliknya. Menurut Azwar (2012)
Reliabilitas berhubungan dengan akurasi instrumen dalam mengukur apa yang diukur,
kecermatan hasil ukur dan seberapa akurat seandainya dilakukan pengukuran ulang.
Realibilitas sebagai konsistensi pengamatan yang diperoleh dari pencatatan berulang baik
pada satu subjek maupun sejumlah subjek.
Kerlinger memberikan batasan tentang reliabilitas yaitu :
1. Reliabilitas dicapai apabila kita mengukur himpunan objek yang sama berulang kali
dengan instrumen yang sama atau serupa akan memberikan hasil yang sama atau
serupa.
2. Reliabilitas dicapai apabila ukuran yang diperoleh dari suatu instrumen pengukur
adalah ukuran yang sebenarnya untuk sifat yang diukur.
3. Reliabilitas dicapai dengan meminimalkan galag pengukuran yang terdapat pada
suatu instrumen pengukuran yang terdapat pada suatu instrumen pengukur.
Reliabilitas instrumen dinyatakan dengan koefisien reliabilitas. Instrumen yang reliable
adalah instrumen yang memiliki koefisien reliabilitas minimal 0,70. Sebaiknya koefisien
reliabilitas instrumen 0,80 atau lebih. Koefisien reliabilitas instrumen dihitung dengan
menggunakan rumus tertentu.
Pada tes belajar bentuk objektif, ada tiga macam metode yang dapat digunakan untuk
menentukan taraf reliabilitas.
a) Metode atau teknik ulangan (test-retest method) atau single test-double trial method.
8
X = skor test pertama
Y = skor test kedua
N = jumlah peserta tes
Cara lain yang dapat digunakan dengan teknik tes retes ini adalah tekinik korelasi rank- order
dari Spearmen menggunakan rumus :
ρ = koefisien korelasi
D = difference (beda antara rank skor hasil tes I dengan rank skor hasil tes II)
N = banyaknya peserta tes.
b) Metode Belah Dua (split-half method) atau Single Test Single Trial Method
9
Cara lain yang juga dapat digunakan pada metode singel-test-singel-trial adalah formula
Rulon, Flanagan, Kuder-Richardson, Hoyt.
c) Metode Bentuk Paralel atau Metode Double Test Double Trial
Pada metode ini dipergunakan dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran, dan susunan, tetapi butir-butir soal berbeda. Pengujian reliabilitas
dengan cara ini cukup dilakukan sekali, tetapi instrumennya dua, pada responden yang
sama, waktu yang sama, instrumen berbeda. Reliabiltas instrumen dihitung dengan cara
mengkorelasikan antara data instrumen yang satu dengan data instrumen yang dijadikan
equivalen. Bila koefisien korelasi positif dan signifikan maka instrumen tersebut reliable.
Kelemahan dari metode ini adalah kesukaran dalam penyusunan item yang parallel
dengan item pada tes pertama, selain itu juga membutuhkan biaya yang lebih mahal dan
memakan waktu yang lebih lama.
Rumus yang dapat digunakan untuk menentukan reliabilitas dengan metode parallel
ini adalah Product Moment Correlation dan Rank Order Correlation.
Pengujian reliabilitas tes bentuk uraian tidak dapat dilakukan seperti contoh di atas. Butir
soal uraian menghendaki gradualisasi penilaian. Barangkali butir soal nomor 1 penilaian
terendah adalah 0 dan penilaian tertinggi adlah 10, tetapi soal nomor 2 mungkin diberi nilai
tertinggi hanya 5 dan butir soal nomor 3 penilaian tertinggi misalnya 5 dan sebagainya.
Keterangan:
Dalam hubungan ini, jika sebuah butir soal memiliki angka indeks diskriminasi butir soal
dengan tanda positif, hal ini merupakan petunjuk bahwa butir soal tersebut telah memiliki
daya pembeda, dalam arti bahwa peserta yang termasuk kategori pandai lebih banyak
yang dapat menjawab dengan benar terhadap butir soal yang bersangkutan, sedangkan
peserta yang termasuk kategori tidak pandai lebih banyak yang menjawab salah. Klasifikasi daya
pembeda ditentukan berdasarkan angka indeks diskriminasi (D) butir soal.
11
Angka 0,3 merupakan angka kriteria minimal suatu butir soal yang baik (Mardapi
dalam Rasyid dan Mansur 2007). Untuk menghitung indeks diskriminasi, maka langkah
pertama yang harus dilakukan adalah membagi peserta ke dalam 2 kelompok, yaitu kelompok
Atas, yakni kelompok peserta yang memperoleh skor tinggi, dan kelompok Bawah, yaitu
kelompok peserta yang memperoleh skor rendah. Langkah pertama yang dilakukan untuk
menghitung indeks kesukaran adalah mengoreksi lembar jawaban peserta dan untuk jawaban
yang benar diberi skor 1, sedangkan untuk jawaban yang salah diberi skor 0
12
Seluruh pengikut tes dideretkan mulai dari skor teratas sampai kepada skor terendah, lalu di bagi
dua. Rumus Mencari Daya Pembeda menurut Daryanto ( 2005, 186) yaitu :
13
Dari angka yang belum teratur tersebut kemudian dibuat urutan penyebaran, dari
skor yang paling tinggi ke skor yang paling rendah.
Uraian ini menunjukkan adanya kelompok atas ( JA) dan kelompok bawah ( JB). Pada
uraian di atas dapat ditunjukkan kelompok A dan B. Dan hal ini mempermudah menentukan BA
dan BB.
Dimana :
Bila diperhatikan tabel diatas, dilihat khusus untuk butir soal no satu, dari kelompok atas
yang menjawab benar adalah 8 orang, dari kelompok bawah yang menjawab betul adalah 3
orang. Dan diterapkan rumus daya pembeda maka :
Dengan demikian maka daya pembeda untuk soal no 1 adalah 0,1 dan ini berarti butir soal no
Tingkat kesulitan item atau disebut juga indeks kesulitan item menurut (2011:136) adalah
angka yang menunjukkan proporsi siswa yang menjawab betul dalam satu soal yang dilakukan
dengan menggunakan tes objectife. Menurut Daryanto (2010:179), soal yang baik adalah soal yang
tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha
memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa
dan tidak mempunyai semangat untuk mencoba lagi karena diluar jangkauannya. Dari beberapa
pendapat di atas dapat disimpulkan bahwa tingkat kesukaran soal adalah angka yang menunjukkan
bahwa apakah soal yang diujikan termasuk mudah, sedang atau sukar.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal
yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha pemecahannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak
mempunyai semangat untuk mencoba lagi karena diluar jangkauannya.
Seorang akan menjadi hafal akan kebiasaan gurunya dalam pembuatan soal. Dengan
kebiasaaan ini maka siswa akan belajar giat untuk menghadapi ulangan dengan guru yang
terbiasa memberikan soal sukar, sedangkan siswa akan malas belajar bila akan ujian dengan guru
yang terbiasa dengan soal ulangan yang mudah-mudah.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut dengan indeks
kesukaran. Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran ini
menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,00 menunjukkan kalau soal
itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya terlalu mudah. Indeks
kesukaran butir yang baik berkisar antara 0,3-0,7 paling baik pada 0,5.
Dalam istilah evaluasi, indeks kesukaran ini diberi simbol P singkatan ari proporsi.
Dengan demikian maka soal dengan P = 0,70 lebih mudah jika dibandingkan dengan P = 0,20.
sebaliknya soal dengan P = 0,30 lebih sukar daripada soal dengan P = 0,80.
Rumusan mencari indeks kesukaran menurut Daryanto (2005,180) adalah :
15
Dimana :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS = jumlah seluruh siswa peserta tes.
Misalkan :
Jumlah siswa peserta tes dalam suatu kelas ada 40 orang.dari 40 orang siswa tersebut 12
orang dapat mengerjakan soal no 1 dengan betul. Maka indeks kesukarannya adalah:
Kriteria yang digunakan untuk mengklasifikasikan butir soal tersebut adalah makin
kecil indeks yang diperoleh maka makin sulit soal tersebut. Sebaliknya, makin besar indeks
yang diperoleh makin mudah soal tersebut.
16
menghitung banyaknya siswa yang memilih pilihan jawaban a, b, c, d dan e yang tidak memiliki
pilihan manapun. Dalam istilah evaluasi disebut omit disingkat O.
Dari pola jawaban soal dapat ditentukan apakah pengecoh berfungsi sebagai pengecoh
dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh siswa berarti pengecoh itu
jelek, dan terlalu menyolok menyesatkan. Sebaliknya sebuah distraktor dapat dikatakan
berfungsi dengan baik apabila distraktor tersebut mempunyai daya tarik yang besar bagi
pengikut-pengikut tes yang kurang memahami konsep atau kurang menguasai bahan. Dengan
melihat pola jawaban soal, dapat diketahui :
Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu
ditulis kembali, dengan perubahan seperlunya. Menulis soal adalah suatu kesukaran yang sulit,
sehingga apabila masih dapat distraktor dapat dikatakan berfungsi baik jika paling sedikit dipilih
oleh 5 % pengikut tes.
3. distraktor : semua distraktornya sudah berfungsi dengan baik karena sudah dipilih oleh lebih
dari 5% pengikut tes.
4. dilihat dari segi omit 9 kolom pilihan paling kanan) adalah baik. Sebuah item dikatakan
baik jika omitnya tidak lebih dari 10% pengikut tes.
( 5% dari pengikut tes = 5% x 60 orang = 3 orang). Sebenarnya ketentuan ini hanya berlaku
untuk tes pilihan ganda dengan 5 alternatif dan p = 0,80. tetapi demi kepraktisan diberlakukan
untuk semua.
18
BAB III
PENUTUP
3.1 Kesimpulan
1. Validitas mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur
mampu melakukan sebagai fungsi ukurnya.
2. Reliabilitas berasal dari kata reliable yang diartikan sebagai dapat dipercaya.
3. Daya beda soal diartikan sebagai kemampuan suatu butir soal dalam membedakan
antara peserta didik yang berkemampuan tinggi dengan peserta didik yang
berkemampuan rendah.
4. Taraf kesukaran merupakan proporsi antara peserta didik yang menjawab benar
suatu butir soal dengan jumlah seluruh peserta tes.
5. Analisis pengecoh (distraktor) pada setiap butir soal, untuk mengetahui efektif dan
tidaknya pengecoh pada tes pilihan ganda. Jika terjadi penyimpangan, dalam arti
tidak seorang peserta didik pun yang terkecoh atau kelompok atas justru lebih
banyak yang terkecoh, berarti pengecoh yang disediakan tidak efektif.
19
DAFTAR PUSTAKA
20