Anda di halaman 1dari 18

EVALUASI

PEMBELAJARAN KELOMPOK 7
Sri Dewi Nengsi Manurung
(7192442007)
Elsadai Manurung
(7193142013)
Susi Aprianti Br Tarigan
(7192442010)
Judika Nurhayani Situmorang
Dosen Pengampu :
(7192442011
Dra. Effi Aswita Lubis,M.Pd,M.Si
Rini Herliani, SE,M,.Si
Analisis Tingkat Kesukaran
◦  
Tingkat kesulitan (difficulty index, difficulty level) butir tes adalah proporsi peserta tes
menjawab dengan benar terhadap suatu butir tes. Sedangkan angka yang menunjukkan sulit
atau mudahnya suatu butir tes dinamakan dengan indeks kesulitan yang dilambangkan dengan
p (proportion correct). Makin besar nilai p berarti makin besar proporsi peserta tes yang
menjawab benar terhadap suatu butir tes, makin rendah tingkat kesulitan butir tes itu, yang
berarti butir tes itu makin mudah. Sebaliknya semakin kecil nilai p berarti semakin kecil
proporsi peserta tes menjawab dengan benar suatu butir tes, makin tinggi tingkat kesulitan
butir tes itu, yang berarti butir tes itu makin sulit.

Rumus untuk menghitung tingkat kesulitan adalah adalah:


Ps
Keterangan:
Ps = tingkat kesulitan naskah tes
= Jumlah tingkat kesulitan butir tes
N = jumlah butir tes
Nomor Butir Soal Jumlah Benar Tingkat Kesukaran Kesimpulan

1 12 0.54 Sedang
2 16 0.72 Mudah
3 16 0.72 Mudah
4 13 0.59 Sedang
5 7 0.31 Sedang
6 17 0.77 Mudah
7 13 0.59 Sedang
8 18 0.81 Mudah
9 13 0.59 Sedang
10 16 0.72 Mudah
11 13 0.59 Sedang
12 11 0.5 Sedang
13 14 0.63 Sedang
14 8 0.36 Sedang
15 20 0.90 Mudah
16 10 0.45 Sedang
17 13 0.59 Sedang
18 12 0.54 Sedang
19 16 0.72 Mudah
20 22 1 Mudah
21 12 0.54 Sedang
22 14 0.63 Sedang
23 18 0.81 Mudah
24 11 0.5 Sedang
25 17 0.77 Mudah
26 19 0.86 Mudah
27 18 0.81 Mudah
28 13 0.59 Sedang
29 7 0.1 Sedang
30 21 0.95 Mudah
 ✘ “Daya beda (discriminating power) butir tes adalah indeks
yang menunjukkan tingkat kemampuan butir tes
membedakan antara peserta tes yang pandai (kelompok atas)
dengan peserta tes yang kurang pandai (kelompok bawah) di
Hubungan antara Daya Beda
antara peserta tes.” Tujuan mencari daya beda adalah untuk
DAYA
menentukan apakah butir testersebut memiliki kemampuan
dengan Kualitas Butir Soal
PEMBEDA membedakan kelompok dari aspek yang diukur, sesuai
perbedaan yang ada pada kelompok tersebut. Karena daya
beda dihitung dari hasil tes kelompok peserta ujian tertentu,
maka penafsiran daya bedapun haruslah selalu dikaitkan
dengan kelompok peserta tertentu tersebut
D=
Keterangan :
D = daya beda
Ba = jumlah jawaban benar kelompok atas
Bb = jumlah jawaban benar kelompok bawah
N = jumlah peserta tes dalam kelompok atas dan bawah
Kelas Atas
Nama Skor
Christina 25
Jesika 25
Renta 24
binhot 22
putri 21
boy 21
putra 21
rahman 21
dolly 20
clara 20
brandi 20
Kelas Bawah
Nama Skor
Dewi 20
gebbin 19
evriani 19
Dicky 19
Ahmad 18
Nelly 17
David 17
Eprilia 16
Pardi 16
Aspian 15
Kristina 14
Nomor Butir Soal PA PB Daya Pembeda Kesimpulan
1 0.81 0.27 0.54 Baik
2 0.90 0.54 0.36 Baik
3 0.90 0.54 0.36 Baik
4 0.81 0.36 0.45 Baik
5 0.36 0.27 0.09 Tidak Baik
6 0.72 0.81 -0.09 Tidak Baik
7 0.63 0.54 0.09 Tidak Baik
8 1 0.63 0.36 Baik
9 0.72 0.45 0.27 Tidak Baik
10 0.81 0.63 0.18 Tidak Baik
11 0.72 0.45 0.27 Tidak Baik
12 0.63 0.36 0.27 Tidak Baik
13 0.72 0.54 0.18 Tidak Baik
14 0.36 0.36 0 Tidak Baik
15 1 0.81 0.18 Tidak Baik
16 0.54 0.36 0.18 Tidak Baik
17 0.63 0.54 0.09 Tidak Baik
18 0.72 0.36 0.36 Baik
19 0.81 0.63 0.18 Tidak Baik
20 1 1 0 Tidak Baik
21 0.54 0.54 0 Tidak Baik
22 0.81 0.45 0,36 Baik
23 0.81 0.81 0 Tidak Baik
24 0.45 0.54 -0.09 Tidak Baik
25 0.72 0.81 -0.09 Tidak Baik
26 0.81 0.90 -0.09 Tidak Baik
27 0.90 0.72 0.18 Tidak Baik
28 0.45 0.72 -0.27 Tidak Baik
29 0.36 0.27 0.09 Tidak Baik
30 1 0.90 0.09 Tidak Baik
VALIDITAS

Menghitung harga korelasi setiap butir dengan rumus Pearson Product


Moment, sebagai berikut:
Menghitung harga t hitung dengan
rumus sebagai berikut:

Keterangan : Keterangan :
rxy = koefisien korelasi t = Nilai t hitung
n = jumlah responden uji coba
X = skor tiap item n = jumlah responden uji coba
Y = skor seluruh item responden uji coba r = koefisien korelasi hasil r
hitung
Nomor Butir Soal R hitung R table Kesimpulan
0.41324703
1 0,67 Valid
2 0,46 0.41324703 Valid
3 0,46 0.41324703 Valid
4 0.37 0.41324703 Tidak Valid
5 0,13 0.41324703 Tidak Valid
6 0,17 0.41324703 Tidak Valid
7 -0.06 0.41324703 Tidak Valid
8 0,33 0.41324703 Tidak Valid
9 0,56 0.41324703 Valid
10 0,18 0.41324703 Tidak Valid
11 0,34 0.41324703 Tidak Valid
12 0,21 0.41324703 Tidak Valid
13 0.43 0.41324703 Valid
14 0,05 0.41324703 Tidak Valid
15 0.49 0.41324703 Valid
16 0,42 0.41324703 Valid
17 -0.16 0.41324703 Tidak Valid
18 0,45 0.41324703 Valid
19 0.32 0.41324703 Tidak Valid
20 Eror 0.41324703 Eror
21 -0.07 0.41324703 Tidak Valid
22 0.49 0.41324703 Valid
23 -0.15 0.41324703 Tidak Valid
24 -0.15 0.41324703 Tidak Valid
25 0.02 0.41324703 Tidak Valid
26 -0.10 0.41324703 Tidak Valid
27 0.37 0.41324703 Tidak Valid
28 -0.19 0.41324703 Tidak Valid
29 0,30 0.41324703 Tidak Valid
30 0,04 0.41324703 Tidak Valid
Realibitas

 
Analisis reliabilitas dalam penelitian ini menggunakan reliabilitas internal dengan
rumus sebagai berikut:
r11 =

Keterangan:
r11 = reliabilitas tes secara keseluruhan
Σpq = jumlah hasil perkalian antara p dan q
P = proporsi subjek yang menjawab item dengan benar
Q = proporsi subjek yang menjawab item dengan salah (q=1-p)
N = banyaknya item
S = standar deviasi dari tes

Apabila r hitung lebih besar dari r tabel (rh>rt) maka butir instrumen tersebut valid,
tetapi sebaliknya bila r hitung lebih kecil dari r tabel (rh< rt) maka instrumen tersebut
tidak valid dan tidak dipergunakan dalam penelitian.
Realibitas Soal
 r 11 =

◦ r11 =
Jadi, kesimpulannya adalah realibilitas rendah
◦ r11 =
karena berada pada koefisien 0.20-0,40
◦ r11 = 0.208 (r hitung)
Kategori koefisien reliabilitas (Guilford, 1956:145)
Nilai r tabel adalah 0.41324703
adalah sebagai berikut:
Karena r tabel lebih besar dari r hitung yaitu 0,208 lebih besar dari 0.41324703
: Soal tersebut tidak realibel  0,80-1,00 : reliabilitas sangat tinggi
◦ Dimana :  0,60-0,80 : reliabilitas tinggi
◦ r11 = Nilai reliabilitas  0,40-0,60 : reliabilitas sedang
◦ ∑Si = Jumlah varians skor tiap-tiap item  0.20-0,40 : reliabilitas rendah
◦ St = Varians total
◦ k = Jumlah item
Distraktor
Efektivitas pengecoh (distractor effectivity) berlaku Efektivitas
  pengecoh dapat diukur
pada tes pilihan ganda. Di antara pilihan jawaban yang menggunakan rumus :
ada, hanya satu yang benar. IP =
Selain jawaban yang benar tersebut,ada jawaban Keterangan :
yang salah. Jawaban yang salah itulah yang dikenal
dengan distractor (pengecoh). Butir tes yang baik, IP = indeks pengecoh
pengecohnya akan dipilih secara merata oleh peserta
P = jumlah peserta tes yang memilih
didik yang menjawab salah. Sebaliknya, butir tes yang
pengecoh
kurang baik, pengecohnya akan dipilih ecara tidak
merata oleh peserta didik. N= jumlah peserta tes
B= jumlah peserta tes yang menjawab benar
n = jumlah alternatif jawaban
1 = bilangan tetap
Aspek yang menentukan kualitas butir
tes selain tingkat kesulitan, daya beda dan
efektivitas pengecoh adalah validitas butir.
NO PILIHAN JAWABAN KETERANGAN KUALITAS PENGECOH PILIHAN JAWABAN

SOAL A B C D E A B C D E

1 80% 0%   320% 0% sangat baik jelek   sangat jelek jelek

2 0% 0%   400% 0% jelek jelek   sangat jelek jelek

3 67% 67% 200%   67% kurang baik kurang baik jelek   kurang baik

4   134% 178% 45% 45%   baik jelek kurang baik kurang baik

5 80% 27% 134% 160%   sangat baik kurang baik baik kurang baik  

6   80% 320% 0% 0%   sangat baik sangat jelek jelek jelek

7 320%   40% 40% 0% sangat jelek   kurang baik kurang baik jelek

8 80%   0% 320% 0% sangat baik   jelek sangat jelek jelek

9 89% 134%   88% 88% sangat baik baik   sangat baik sangat baik

10 267% 134%   0% 0% sangat jelek baik   jelek jelek

11 89% 312% 0% 0%   sangat baik sangat jelek jelek jelek  

12 250% 100% 0%   50% sangat jelek sangat baik jelek   kurang baik
NO PILIHAN KETERANGAN KUALITAS PENGECOH PILIHAN JAWABAN

SOAL A B C D E A B C D E

13   134% 89% 0% 178%   baik sangat baik jelek jelek

14   80% 280% 0% 40%   sangat baik sangat jelek jelek kurang baik

15 200% 200%   0% 0% jelek jelek   jelek jelek

16 360% 0%   0% 40% sangat jelek jelek   jelek kurang baik

17   320% 0% 0% 45%   sangat jelek jelek jelek kurang baik

18   89% 89% 134% 89%   sangat baik sangat baik baik sangat baik

19 0%   0% 400% 0% jelek   jelek sangat jelek jelek

20 0% 0%   0% 0% jelek jelek   jelek jelek

21 0%   40% 320% 40% jelek   kurang baik sangat jelek kurang baik

22 45%   134% 223% 0% kurang baik   baik sangat jelek jelek

23 132% 200%   67% 0% baik jelek   baik jelek

24 109% 218% 73%   0% sangat baik sangat jelek baik   jelek


NO PILIHAN KETERANGAN KUALITAS PENGECOH PILIHAN JAWABAN

SOAL A B C D E A B C D E

25 200% 40% 160%   0% jelek kurang baik kurang baik   jelek

26   267% 134% 0% 0%   sangat jelek baik jelek jelek

300%
27   0% 0% 100%   jelek jelek sangat jelek sangat baik
 

28 89% 178%   134% 0% sangat baik jelek   baik jelek

29 86%   86% 143% 86% sangat baik   sangat baik baik sangat baik

30 0% 0%   0% 0% jelek jelek   jelek jelek

KETERANGAN IP
SANGAT BAIK 76%-125%
BAIK 51% - 75% atau 126% - 150%
KURANG BAIK 26% - 50% atau 151% - 175%
JELEK 0% - 25% atau 176% - 200%
SANGAT JELEK lebih dari 200%
Kesimpulan

a. Tingkat Kesulitan
Berdasarkan hasil analisis tersebut maka :
Soal no 1,4,5,7,9,11,12,13,14,16,17,18 ,21,22,24,28,29: Sedang
Soal no 2,3,6,8,10,15,19,20,23,25,26,27,30: mudah
b. Daya beda
Soal no : 5,6,7,8,9,10,11,12,13,14,15,16,17,19,20,21,23,24,25,26,27,28,29,30
: merupakan soal yang memiliki daya beda tidak baik
Soal no : 1,2,3,4,8,18,22 : merupakan soal yang memiliki daya beda baik

c. Validitas
Soal no 1,2,3,9,13,15,22: merupakan soal yang valid
Soal no 20 : Eror
Sedangkan selebihnya merupakan soal yang tidak valid

d. Realibilitas
Soal tersebut merupakan soal yang tidak realibel

e. Distraktor
Soal no 1,2,3,4,9,12,18,23,27,29 : distraktor pada soal dapat diterima
Sedangkan soal selebihnya : distraktor pada soal ditolak
Berdasarkan hasil keseluruhan soal yang dapat diterima ada 10 soal sementara yang
harus diperbaiki ada 20 soal
Terimakasih

Anda mungkin juga menyukai