Anda di halaman 1dari 15

UTS Asesment dan Evaluasi Pembelajaran

Disusun untuk memenuhi UTS Asesment dan Evaluasi Pembelajaran


Mata Kuliah : Asesment dan Evaluasi Pembelajaran
Dosen Pengampu : Dra.Ni Wayan Suniasih, S.Pd.,M.Pd.

Oleh:

Nama :Ni Nyoman Ayu Dhyana Radha Patni


NIM :2111031294
No :28

JURUSAN PENDIDIKAN DASAR


FAKULTAS ILMU PENDIDIKAN
UNIVERSITAS PENDIDIKAN GANESHA
2022
1. Buatlah kajian teoritik dan empirik tentang :
A. Validitas
Validitas berasal dari bahasa Inggris dari kata validity yang berarti keabsahan
atau kebenaran. Dalam konteks alat ukur atau instrumen asesmen, validitas berarti
sejauh mana kecermatan atau ketepatan alat ukur dalam melakukan fungsi ukurnya.
Sebuah instrumen yang valid akan menghasilkan data yang tepat seperti yang
diinginkan.
Menurut Donal Ary dalam Fitrah dan Luthfiyah (2017:87) menyatakan bahwa
Validitas menunjuk kepada sejauh mana suatu alat mampu mengukur apa yang harus
diukur.
Menurut Sugiyono dalam Fitrah dan Luthfiyah (2017:87) menyatakan bahwa
Validitas merupakan derajat ketepatan antara data yang terjadi pada objek penelitian
dengan daya yang dapat dilaporkan oleh peneliti.
Menurut Azwar dalam Fitrah dan Luthfiyah (2017:87) menyatakan bahwa
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu instrumen pengukur dalam melakukan fungsi ukurnya.
Jadi kesimpulannya Validitas terkait erat dengan derajat ketepatan, antara data
objek sebenarnya dengan data yang ada di lapangan. Selain itu konsep validitas
menunjuk kepada kesesuaian, kebermaknaan, dan kebergunaan kesimpulan-
kesimpulan yang dibuat berdasarkan skor instrument.
➢ Uji Teoritik
Adapun macam-macam uji teoritik yakni sebagai berikut :
1. Validitas isi
Menurut Coaley (2010) Validitas isi adalah validitas yang fokus kepada
elemen-elemen apa yang ada dalam ukur. Menurut Haynes,dkk (1995)
menyatakan Validitas isi adalah sejauhmana elemenelemen instrumen
asesmen relevan dan mewakili konstruk alat ukur yang ditergetkan untuk
tujuan tertentu Validitas isi atau content validity tersebut dapat memastikan
bahwa pengukurannya dapat memasukkan sekumpulan item yang memadai
dan mewakili konsep.
Jadi kesimpulannya Validasi isi adalah langkah yang digunakan
untuk mengetahui apakah pertanyaan, tugas ataupun butir dalam suatu
instrumen dapat dikatakan valid dan mewakili secara keseluruhan serta
keproporsionalan perilaku suatu sampel.
Cara yang praktis untuk melakukan analisis validitas isi adalah
dengan melihat apakah butir-butir tes telah disusun sesuai dengan blue-print
(kisi-kisi) yang sudah dirancang sebelumnya. Blue print menjadi acuan
dalam menuangkan domain atau ranah dan indikator yang akan diukur
dalam tes.
2. Validitas Konstrak (Construct Validity)
Validitas konstrak adalah validitas yang menyangkut bangunan
yang sama. Validitas konvergen ditunjukkan oleh tingginya korelasi skor
tes-tes yang mengukur trait yang sama dengan menggunakan metode yang
berbeda. Menurut Allen & Yen, (1979)Validitas konstruksi
menggambarkan sejauhmana instrument khususnya tes mengukur suatu
konstruk teoritik yang akan diukurnya.
➢ Uji empirik
Adapun macam-macam uji empiric yaitu sebagai berikut:
1. Validitas Butir (Item Validity)
Menurut Suharsimi Arikunto (2002: 156) validitas butir soal merupakan
perkiraan kualitas butir-butir soal sebuah alat tes atau yang dimaksudkan untuk
menguji efektifitas butir-butir soal.
Validitas butir digunakan pada analisis butir dalam rangka uji coba
pengukuran untuk memperbaiki alat ukur. Dalam validitas butir, tetunya
terdapat butir yang dapat dipertahankan di dalam alat ukur serta ada butir yang
perlu dibuang, diperbaiki, atau diganti.
Perhitungan dalam validitas butir dapat dilakukan dengan rumus dari
Karl Pearson, yaitu Korelasi Product Moment dengan rumus sebagai berikut:
𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
𝑟𝑥𝑦 =
√{𝑁 ∑ 𝑋 2 − (∑ 𝑋 2 )} − {𝑁 ∑ 𝑌 2 − (∑ 𝑌 2 )}
Keterangan :
rxy = koefisien korelasi
N = jumlah sampel
ΣX = jumlah skor butir
ΣY = jumlah skor total
ΣXY = jumlah perkalian X dan Y
2. Validitas Konkuren (concurrent validity)
Pengertian concurrent validity adalah validitas yang berkaitan dengan
hubungan (korelasi) antara skor dalam item instrumen dengan kinerja, atau
obyek penelitian yang lain.
Validitas konkuren diperoleh dengan mencari korelasi antara skor
pengukuran dan kriteria ukuran yang telah ada pada waktu yang sama/yang
disiapkan dalam waktu yang hampir bersamaan. Untuk mengukur dan
menentukan validitas yang terjadi bersamaan, digunakan metode hubungan
atau metode perbedaan.
3. Validitas Prediksi (Predictive Validity)
Validitas prediksi adalah validitas dimana suatu alat pengukur dapat
memprediksi kemampuan satu individu yang bekerja dalam situasi
mendatang. Validitas ini sangat penting untuk memilih atau mengklasifikasi
individu-individu.
Validitas prediksi diperoleh dengan cara mencari korelasi antara
skor pengukuran dan kriteria pengukuran yang telah ada pada waktu yang
lalu. Untuk mengetahui validitas prediksi digunakan perhitungan hubungan
antara skor alat pegukur yang disusun dengan alat pengukur lain yang telah
berhasil digunakan dalam situasi sebelumnya. Proses menghitung variabel
prediksi terdiri dari beberapa langkah yaitu:
a. Mengidentifikasi dan mendefinisi kriteria sehingga menjadi
ukuran yang valid
b. Menjalankan alat ukur atau variabel prediksi dan menanti
sampai tingkah laku yang diprediksi muncul
c. Gunakan ukuran kriteria dan korelasi dua himpunan skor
tersebut
B. Reliabilitas

Kata reliabilitas dalam bahasa Indonesia yang digunakan saat ini, sebenarnya
diambil dari kata reliability dalam bahasa Inggris dan berasal dari kata reliable yang
artinya dapat dipercaya, keajegan, konsisten, keandalan, kestabilan. Suatu tes dapat
dikatakan reliabel jika tes tersebut menunjukkan hasil yang dapat dipercaya dan tidak
bertentangan.
Menurut Nursalam (2003) Reliabilitas adalah kesamaan hasil pengukuran atau
pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali–kali dalam
waktu yang berlainan. Alat dan cara mengukur atau mengamati sama–sama memegang
peranan penting dalam waktu yang bersamaan.
1. Jenis- Jenis Reliabilitas
Salah satu syarat agar hasil suatu tes dapat dipercaya adalah tes tersebut
harus mempunyai reliabilitas yang memadai. Oleh karena itu Jaali dan Pudji
(2008) membedakan reliabilitas menjadi 2 macam, yaitu:
a. Reliabilitas Konsistensi Tanggapan
Reliabilitas ini selalu mempersoalkan mengenai tanggapa responden
atau objek terhadap tes tersebut apakah sudah baik atau konsisten. Dalam
artian apabila tes yang telah di cobakan tersebut dilakukan pengukuran
kembali terhadap obyek yang sama, apakah hasilnya masih tetap sama
dengan pengukuran sebelumnya. Jika hasil pengukuran kedua menunjukkan
ketidakonsistenan, maka hasil pengukuran tersebut tidak mengambarkan
keadaan obyek yang sesungguhnya.
Ada tiga mekanisme untuk memeriksa reliabilitas tanggapan responden
terhadap tes (Jaali; 2008) yaitu:
1. Metode Bentuk Pararel (equivalent)

Dalam Bentuk Pararel ini diperlukannya dua instrument yang


dikatakan pararel untuk memperkirakan koefisien reliabilitas, yakni dua
buah tes dikatakan pararel atau equivalen yaitu duah buah instrument yang
memiliki kesamaan tujuan dalam pengukuran, tingkat kesukaran, memiliki
susunan yang sama, tetapi butir-butir soalnya yang berbeda. Misalnya
instrumen paket A yang akan diestimasi reliabilitasnya dan instrumen paket
B merupakan instrumen yang paralel dengan paket A, keduanya diberikan
kepada sekelompok responden yang sama, kemudian kedua skor tersebut
dikorelasikan. Koefisien korelasi dari kedua skor respon responden terhadap
instrumen inilah yang menunjukkan koefisien reliabilitas skor instrumen
paket A.

2. Metode tes ulang (test-retest method)

Tes ulang ini dilakukan dengan mengujicobakan sebuah tes kepada


sekelompok peserta didik sebanyak dua kali pada waktu yang berbeda.
Kestabilan skor setiap individu dalam jarak waktu yang tepat antara periode
pertama dan periode retes yang kedua berlangsung sekitar satu bulan, diberi
jarak waktu sebulan bertujuan untuk menghindari terjadinya pelafalan
jawaban.

3. Metode belah dua (split-half method)


Dalam melaksanakan penilain dengan metode belah dua
penilaian hanya melakukan ujian satu kali terhadap sejumlah peserta,
sehingga tidak ada pengaruh/bias dari instrumen terdahulu. Dalam
menggunakan metode belah dua Jumlah butir soal yang diberikan harus
genap karena akan dibagi dua dan tiap kelompok mempunyai jumlah
butir yang sama. Di samping itu, perlu diingat dan diperhatikan bahwa
kedua subkelompok instrument sebaiknya mendapatkan tingkat
kesukaran butir (item) dan isi (content) yang setara dan seimbang.
(Yusuf, 2015).
Dengan metode belah dua ini, koefisien reliabilitas akan
menunjukkan internal konsistensi butir soal dalam keseluruhan
instrumen.Membelah/membagi dua instrumen tersebut dapat dilakukan
dengan cara:

1. Membagi soal berdasarkan nomor ganjil dan genap


2. Membelah atau membagi berdasarkan setengah nomor awal dan
setengah nomor akhir.
a) Spaerman Brown
Rumus spearman brown ini digunakan untuk mencari reliabilitas
keseluruhan instrumen.
2 𝑥 𝑟 1⁄2 1⁄2
𝑟𝑡𝑡 =
1 + 𝑟 1⁄2 1⁄2 ∗)
Keterangan :
𝑟𝑡𝑡 = koefisien reliabilitas
𝑟 1⁄2 1⁄2 = korelasi antara bagian instrument
∗) = harga mutlak
b) Rulon`s Formula
Rulon merupakan penemu rumus ini. Ia mengembangkan model
sederhana dalam menentukan reliabilitas suatu instrumen; dengan
suatu asumsi bahwa reliabilitas itu merupakan proporsi dari variance
yan sebenarnya dalam suatu instrumen. Dengan rumusnya sebagai
berikut :
𝑑𝑑2
𝑟𝑛 = 1 −
𝑑𝑡2
Keterangan:
d = perbedaan antara skor belahan awal dan akhir untuk tiap yang diuji.
dd = SD berbeda
dt = SD total skor
𝑑𝑡2 = varian total
𝑑𝑑2 = varian beda
c) Flanagan Formula
Kesalahan variance merupakan jumlah variance dari kedua belahan
(genap dan ganjil). Dengan dasar tersebut dikemukakannya rumus
sebagai berikut:
𝑑12 + 𝑑22
𝑟𝑛 = 2 (1 − )
𝑑𝑡2
Keterangan:
𝑑12 = variance belahan 1 (awal)
𝑑22 = variance belahan 2 (akhir)
𝑑𝑡2 = variance total
d) Kuder Richadson 20 (KR20)
Yang ditekankan pada rumus ini adalah inter-korelasi antar item dan
instrument itu sendiri dan korelasi item-item itu dengan isntrumen
secara keseluruhan (Yusuf, 2015). Rumus ini dapat digunakan dalam
menentukan penilaian objektif, Adapun rumusnya yakni sebagai berikut
:
(𝑛) (𝑆𝑡2 − ∑ 𝑝𝑞)
𝑟𝑡𝑡 =
𝑛−1 𝑆𝑡2
Keterangan:
rtt = reliabilitas instrumen secara keseluruhan
n = jumlah butir soal dalam satu instrument
p = proporsi subjek yang menjawab butir soal dengan benar
q = proporsi subjek yang menjawab butir soal dengan salah (q = 1p)
St2 = varian dari instrumen (kuadrat St)
St = standar deviasi dari skor total
e) Kuder richadson 21 (KR21)
Apabila tingkat kesukaran butir soal hampirsama, maka lebih baik
menggunakan KR21 daipada KR20. Rumus yang digunakan untuk
KR21 adalah:
𝑘 𝑀𝑡 (𝑘 − 𝑀𝑡 )
𝑟𝑡𝑡 = [1 − ]
𝑘−1 𝑘 𝑆𝑡2
Keterangan:
𝑀𝑡 = mean skor total
𝑆𝑡 = standar deviasi skor total
𝑘 = jumlah soal
f) Metode Hoyt
Membelah/membagi item menjadi dua kelompok, Hyot menggunakan
pendekatan Anava (analysis of variance)dalam menentukan reliabilitas
instrumen.
𝑉𝑟 𝑉𝑒 − 𝑉𝑟
𝑟𝑡𝑡 = 1 𝑎𝑡𝑎𝑢
𝑉𝑒 𝑉𝑒
Keterangan:
𝑟𝑡𝑡 = reliabilitas seluruh soal
𝑉𝑟 = varians sisa (reminder)
𝑉𝑒 = varians responden (examinee)
g) Koefisien Alpha

Rumus ini dikembangkan oleh Cronbach dan dapat digunakan untuk


menentukan reliabilitas melalui konsistensi internal (internal
consistency) suatu instrumen yang digunakan dalam instrument
penilaian angket (uraian).
𝑘 ∑ 𝜎12
𝑟𝑡𝑡 = {1 − }
𝑘−1 𝜎𝑡2
Keterangan:
𝑟𝑡𝑡 = reliabilitas instrument
𝑘 = jumlah butir soal bagian
𝜎12 = jumlah variance butir soal
𝜎𝑡2 = variance skor soal
b. Reliabilitas Konsistensi Gabungan Item
Reabilitas ini terkait dengan konsistensi antara item-item suatu tes atau
instrument. Apabila terhadap bagian obyek ukur yang sama, hasil pengukuran
melalui item yang satu kontradiksi atau tidak konsisten dengan hasil ukur
melalui item yang lain maka pengukuran dengan tes (alat ukur) sebagai suatu
kesatuan itu tidak dapat dipercaya. Untuk itu jika terjadi hal demikian maka
kita tidak bisa menyalahkan obyek ukur, melainkan alat ukur (tes) yang
dipersalahkan, dengan mengatakan bahwa tes tersebut tidak reliable atau
memiliki reliabilitas yang rendah.Dalam menentukan reliabilitas sebuah alat
evaluasi dalam hal ini instrumen tes, dapat dikelompokkan berdasarkan jenis
instrumen tersebut, yaitu:
• Tes Objektif
• Tes Uraian
• Tes Afektif.
Faktor yang Mempengaruhi Reliabilitas
Jumlah Butir Soal, banyaknya soal pada suatu instrumen ikut mempengaruhi
derajat reliabilitasnya. Semakin banyaknya soal-soalmaka tes yang bersangkutan
cenderung semakin menjadi reliabel.
1. Homogenitas Soal Tes, soal yang memiliki homogenitas tinggi
cenderung mengarah pada tingginya tingkat realibilitas. Dua buah tes
yang sama jumlah butir-butirnya akan tetapi berbeda isinya, misalnya
yang satu mengukur tentang pengetahuan kebahasaan dan yang satunya
tentang kemampuan matematika akan menghasilkan tingkat reliabilitas
yang berbeda. Tes matematika cenderung menghasilkan tingkat
reliabilitas syang lebih tinggi daripada tes kebahasaan karena dari segi
isi kemampuan menyelesaikan soal matematika lebih homogen
daripada pengetahuan kebahasaan.
2. Waktu yang Diperlukan untuk Menyelesaikan Tes, semakinterbatasnya
waktu dalam pengerjaan tes maka akan mendorong tes untuk memiliki
reliabilitas yang tinggi.
3. Keseragaman Kondisi pada Saat Tes Diberikan, kondisi pelaksanaantes
yang semakin seragam akan memunculkan reliabilitas yang makin
tinggi.
4. Kecocokan Tingkat Kesukaran Terhadap Peserta Tes, bahwa soal- soal
dengan tingkat kesukaran sedang cenderung lebih reliabel dibandingkan
dengan soal-soal yang sangat sukar atau sangat mudah.
Karakteristik Reliabilitas
Sebuah tes dianggap memiliki reliabilitas yang baik apabila memiliki
karakteristik di antaranya
1. Reliabilitas merupakan milik dari satu set nilai tes bukan milik tes itu
sendiri, artinya suatu tes dikatakan baik apabila dapat menghasilkan skor
yang cukup akurat, apabila tes tersebut diberikan pada kelas tertentu,
maka bisa juga menghasilkan skor yang cukup konsisten biladiberikan
pada kelas yang berbeda atau ketika diberikan pada kelas yang sama pada
waktu yang berbeda. Suatu tes dikatakan reliable jika dua buah tes
dilakukan pada jarak waktu yang berbeda dan menunjukkan skor yang
tidak jauh berbeda.
2. Reliabilitas dapat dinyatakan untuk dua atau lebih pengukuran
independen yang diperoleh dari tes yang sama untuk setiap anggota
kelompok.
C. Tingkat Kesukaran
Pengertian tingkat kesukaran menurut para ahli : Tingkat kesulitan item atau
disebut juga indeks kesulitan item menurut Sukardi (2011:136) adalah angka yang
menunjukkan proporsi siswa yang menjawab betul dalam satu soal yang dilakukan
dengan menggunakan tes objektif. Menurut (Arikunto,2006:207) Tingkat kesukaran
adalah persentase jumlah siswa yang menjawab soal dengan benar atau
salah (Arikunto,2006:207).
Dari beberapa pendapat di atas dapat disimpulkan bahwa tingkat kesukaran soal
adalah angka yang menunjukkan bahwa apakah soal yang diujikan termasuk mudah,
sedang atau sukar.

Taraf kesukaran tes adalah kesulitan tes dipandang dari kemampuan peserta
didik untuk menjawab soal tersebut, artimya tes tersebut akan lebih banyak dapat
dijawab benar oleh peserta didik yang pandai dan lebih banyak dijawab salah oleh
peserta didik yang kurang pandai. Soal yang baik adalah soal yang tidak terlalu mudah
atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan
menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba
lagi karena di luar jangakauannya. Taraf kesukaran tes yang baik adalah antara 20%-
80% atau 30%- 70%. Tingkat kesukaran soal dipandang dari kesanggupan atau
kemampuan siswa dalam menjawabnya, bukan dilihat dari segi guru dalam melakukan
analisis pembuat soal.
Adapun cara menentukan tingkat kesukaran suatu butir tes
𝐵
𝑃 = 𝐽𝑆

Keterangan:
P = Indeks kesukaran
B = Banyaknya siswa yang menjawab soal dengan benar
JS = Jumlah seluruh siswa peserta tes
Klasifikasi indeks kesukaran soal menurut Suherman (2003:170) dapat
dilihat dalam table berikut :
Klasifikasi IK Interpretasi
IK = 0,00 Soal terlalu sukar
0,00 < IK ≤ 0,30 Soal sukar
0,30 < IK ≤ 0,70 Soal sedang
0,70 < IK ≤ 1,00 Soal mudah
IK = 1,00 Soal sangat mudah

Soal atau tes yang dikatakan baik apabila memiliki taraf tes yaitu antara 31-70%.
D. Daya Beda
Daya beda (diskriminasi) suatu butir tes adalah kemampuan suatu butir untuk
membedakan antara peserta tes yang berkemampuan tinggi dan berkemampuan rendah.
Daya beda butir dapat diketahui dengan melihat besar kecilnya indeks diskriminasi atau
angka yang menunjukkan besar kecilnya daya beda. Adapun fungsi dari daya pembeda
tersebut adalah mendeteksi perbedaan individual yang sekecil-kecilnya diantara para
peserta tes. Daya Beda soal adalah suatu ukuran yang menunjukan tingkat-tingkat
pembedaan suatu instrument.
Terdapat beberapa hal pada daya pembeda yaitu bagi suatu soal yang dapat
dijawab benar oleh siswa kemampuan tinggi dan siswa kemampuan rendah, maka soal
itu tidak baik karena tidak punya daya pembeda. Demikian juga jika semua kelompok
bawah menjawab salah dan siswa berkemampuan tinggi juga sama-sama menjawab
salah, maka soal itu tidak mempunyai daya beda sama sekali.
Daya Pembeda butir soal pilihan ganda dapat dihitung dengan
menggunakan rumus berikut:
𝐵𝐴 𝐵𝐵
D= - = PA-PB
𝐽𝐴 𝐽𝐵

Keterangan :

J = jumlah peserta tes


JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab soal
itu dengan benar
BB = banyaknya peserta kelompok bawah yang menjawab
soal itu benar
𝐵𝐴
PA = = proporsi peserta kelompok atas yang menjawab
𝐽𝐴
benar (ingat, P sebagai Indeks kesukaran).
𝐵𝐵
PB = = proporsi peserta kelompok bawah yang
𝐽𝐵
menjawab benar.
Kriteria untuk daya pembeda tiap butir soal dalam (Suherman, 2003:161)
dinyatakan sebagai berikut:
Daya Pembeda Interpretasi atau Penafsiran
DP ≤ 0,00 Sangat Jelek
0,00 < DP ≤ 0,20 Jelek
0,20 < DP ≤ 0,40 cukup
0,40 < DP ≤ 0,70 Baik
0,70 < DP ≤ 1,00 Sangat Baik

2. Seperangkat tes terdiri dari 5 item pilihan ganda, 5 item benar salah, 5 item
menjodohkan dan 5 item melengkapi, Dicobakan kepada 20 orang siswa yang hasilnya
sbb.

Nomor Butir Benar kelompok atas Benar kelompok bawah


2 15 10
5 14 21
8 20 15
12 16 19
13 19 8
14 13 20
15 18 17
19 17 11
Berdasarkan data di atas buatlah 5 kesimpulan penting tentang perangkat tes tersebut !

1. Daya beda
Rumus
𝐵𝐴 𝐵𝐵
D= - = PA-PB
𝐽𝐴 𝐽𝐵

Keterangan :

J = jumlah peserta tes


JA = banyaknya peserta kelompok atas
JB = banyaknya peserta kelompok bawah
BA = banyaknya peserta kelompok atas yang menjawab soal
itu dengan benar
BB = banyaknya peserta kelompok bawah yang menjawab
soal itu benar
𝐵𝐴
PA = = proporsi peserta kelompok atas yang menjawab
𝐽𝐴
benar (ingat, P sebagai Indeks kesukaran).
𝐵𝐵
PB = = proporsi peserta kelompok bawah yang
𝐽𝐵
menjawab benar.
No soal Banyak Banyak Jumlah siswa Daya Keterangan
kelas atas kelas bawah beda
Atas Bawah

2 15 10 20 20 0,25 Cukup
5 14 21 20 20 -0,35 Cukup
8 20 15 20 20 0,25 Cukup
12 16 19 20 20 -0,17 Jelek
13 19 8 20 20 0,55 Baik
14 13 20 20 20 -0,35 Cukup
15 18 17 20 20 0,05 Jelek
19 17 11 20 20 0,30 Cukup

No. Daya Pembeda Butir Soal Jumlah


1 Negatif (≤ 0,00) 5, 12, 14 3
2 Jelek (0,00 < DP ≤ 0,20) 15 1
3 Cukup (0,20 < DP ≤ 0,40) 2, 8, 19 3
4 Baik (0,40 < DP ≤ 0,70) - 0
5 Sangat Baik (0,70 < DP ≤ - 0
1,00)

Pada daya beda setidaknya soal dikategorikan baik, berdasakan


analisis kebanyak negatif dan cukup.Sehingga dapat disimpulkan bahwa
secara keseluruhan terdapat 3 soal dengan varians negatif yaitu item 5, 12
dan 14. Artinya soal-soal pada butir soal tersebut “terbalik”, menunjukkan
kualitas mata pelajaran.
2. Derajat kesukaran
Rumus :
𝐵
𝑃=
𝐽𝑆
Keterangan:
P = Indeks kesukaran
B = Banyaknya siswa yang menjawab soal dengan benar
JS = Jumlah seluruh siswa peserta tes
No soal Banyak siswa Derajat Keterangan
betul kesukaran
2 25 0,625 Sedang
5 35 0,875 Mudah
8 35 0,875 Mudah
12 35 0,8750 Mudah
13 27 0,675 Mudah
14 33 0,825 Mudah
15 35 0,875 Mudah
19 28 0,7 Mudah

No. Indeks Kesukaran Butir Soal Jumlah


1 Sukar (0,00 < IK ≤ 0,30) - 0
2 Sedang (0,30 < IK ≤ 2, 13, 19 3
0,70)
3 Mudah (0,70 < IK ≤ 5, 8, 12, 14, 15 5
1,00)
Pada uji tingkat kesukaran, kategori soal harusnya ada sukar,
sedang, dan mudah. Itu berdasrkan data yg dianalisis kebanyak mudah dan
sedang
3. Pada reliabilitas soal harus diujikan terlebih dahulu untuk melihat soal
termasuk ke dalam kategori apa, seharusnya reliabilitas yang baik terdapat
pada kategori baik dan sangat baik.
4. Validitas isi biasanya diujikan kepada 2 ahli pakar dalam pembuatan
instrumen soal, pada tabel belum terlihat dari soal sebelum diuji jumlahnya
dan sesudah diujikan jumlahnya.
5. Validitas butir, belum bisa dujikan karena data keseluruhan belum ada
hanya beberapa data saja disajikan dlm bentuk tabel, harus perlu
mengetahui data secara keseluruhan agar bisa menentukan berapa soal yg
valid yang valid yg dpt diujikan kepada siswa sesuai dengan konstanta
junlah siswa tersebut

Anda mungkin juga menyukai