BAB I
PENDAHULUAN
A. Latar Belakang
B. Rumusan Masalah
Dari latar belakang di atas dapat penulis merumuskan masalah yaitu :
1. Apa yang dimaksud dengan analisis dan interpretasi hasil belajar ?
2. Apa tujuan dari analisis dan interpretasi hasil belajar ?
3. Jelaskan teknik analisis hasil belajar dan interpretasinya ?
2
C. Tujuan
Tujuan dari pembuatan makalah ini yaitu :
1. Memahami apa itu analisis dan interpretasi hasil belajar
2. Memahami tujuan dari analisis dan interpretasi hasil belajar
3. Memahami teknik analisis hasil belajar dan interpretasinya
3
BAB II
PEMBAHASAN
Tujuan analisis hasil belajar ini tidak lain yaitu untuk menganalisa hasil belajar
dari siswa hingga guru dapat memahami kekurang-kekurangan yang ada saat
pembelajaran yang telah berlansung. Interpretasi atau penafsiran hasil tes bertujuan
untuk menerjemahkan dan memberi makna terhadap skor yang diperoleh testee (orang
yang diuji). Interpretasi skor hasil belajar siswa merupakan hal yang sangat penting
dilakukan oleh guru. Interpretasi ini menyediakan informasi untuk pengambilan
keputusan dan landasan untuk perbaikan pembelajaran selanjutnya. Pengambilan
keputusan dan landasan perbaikan ini sebaiknya didasarkan pada acuan tertentu
4
seluruh testee dapat menjawab dengan betul butir item yang bersangkutan (yang dapat
menjawab dengan butir =`100%=100:100=1,00).
P:
0.0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
Terlalu sukar Terlalu mudah
Angka indek kesukaran item itu dapat dperoleh dengan menggunakan rumus
yang dikemukakan oleh Du Bois, yaitu :
𝑁𝑝
P= 𝑁
Dimana :
P = Proportion=proporsi=difficulty index = angka indek kesukaran item.
Np = Banyaknya testee yang dpat menjawab dengan beul terhadap item yang
bersangkutan.
N = Jumlah testee yang mengikuti tes hasil belajar.
Dimana :
P = Proportion=proporsi=proporsa=difficulty index=angka indek kesukaran item
B = Banyaknya testee yang dapat menjawab dengan betul terhadap butir hasil item
yang bersangkutan.
JS = Jumlah testee yang mengikuti tes hasil belajar.
Besarnya P Interpretasi
Kurang dari 0,30 Terlalu Sukar
0,30 - 0,70 Cukup (sedang)
Lebih dari 0,70 Terlalu Mudah
Table 8.1. Penyebaran skor jawaban 10 orang testee terhadap 10 butir item yang
diajukan dalam tes hasil belajar tahap akhir bidang studi Aqidah-Akhlak
Skor yang dicapai oleh testee untuk butir item nomor:
Testee
1 2 3 4 5 6 7 8 9 10
A 0 1 1 0 1 0 1 1 1 0
B 1 0 1 1 1 1 0 0 0 1
C 1 0 0 0 0 0 1 1 1 0
D 0 0 1 1 1 0 1 0 1 1
E 1 0 1 0 1 1 1 0 1 0
F 0 0 1 1 0 0 1 1 1 1
G 1 0 1 0 0 0 0 0 0 1
H 0 0 1 1 0 0 1 0 1 1
I 1 0 0 0 1 0 1 0 1 1
J 1 1 1 1 1 0 1 0 1 1
10=N=JS 6 2 8 5 6 2 8 3 8 7
N=pB N= B N= B N= B N= B N= B N= B N=pB
p p p p p p
N=pB N=pB
Untuk butir item nomor 2 dan 3 dengan Np atau B masing-masing sebesar 2 dan
8,dengan mudah dapat kita perleh angka indek kesukaran item untuk kedua butir item
tersebut masing-masing sebesar 2/10 = 0,20 (untuk item nomor 2) dan 8/10 = 0,80
(untuk butir item nomor 3). Sehingga interpretasi yang dapat kita berikan terhadap butir
item nomor 2 adalah bahwa butir item nomor 2 itu termasuk dalam kategori item yang
terlalu sukar ; sedangkan butir item nomor 3 adalah termasuk dalam kategori item yang
terlalu mudah.
Guna meringkas pembicaraan perhatikanlah table 8.2. yang menyajikan hasil-
hasil perhitungan angka indek kesukaran nomor 1 sampai dengan nomor 10.
𝑁𝑝 𝐵 6
5. P= = 𝐽𝑆 = 10 = 0,60 Cukup (Sedang)
𝑁
𝑁𝑝 𝐵 2
6. P= = 𝐽𝑆 = 10 = 0,20 Terlalu Sukar
𝑁
𝑁𝑝 𝐵 8
7. P= = 𝐽𝑆 = 10 = 0,80 Terlalu Mudah
𝑁
𝑁𝑝 𝐵 3
8. P= = 𝐽𝑆 = 10 = 0,30 Cukup (Sedang)
𝑁
𝑁𝑝 𝐵 8
9. P= = 𝐽𝑆 = 10 = 0,80 Terlalu Mudah
𝑁
𝑁𝑝 𝐵 7
10. P= = 𝐽𝑆 = 10 = 0,70 Cukup (Sedang)
𝑁
Dari hasil analisis yang dlakukan terhadap 10 butir item tes hasil belajar tersebut
pada akhirnya dapat diketahui bahwa sejak sebanyak lima butir item termasuk dalam
kategori item yang kualitasnya baik, dalam arti : derajat kesukaran itemnya cukup atau
sedang (= tidak terlalu sukar dan tidak terlalu mudah), yaitu butir nomor 1,4,5,8, dan 10.
Butir-butir item yang termasuk kategori terlalu sukar adalah butir item nomor 2 dan 6.
Adapun butir item yang termasuk kategori terlalu mudah yakni butir item nomor
3,7,dan 9. Berarti separuh (50%) selebihnya adalah termasuk kategori yang jelek, baik
karena terlalu sukar maupun karena terlalu mudah.
Setelah berhasil dilakukan identifikasi butir-butir item mana yang derajat
kesukarannya termasuk dalam kategori cukup, terlalu sukar dan terlalu mudah maka
yang menjadi pokok permasalahan sekarang adalah, bagaimana menindaklanjuti hasil
analisis item tersebut? seperti telah dikemukakan pada pembicaraan, setiap kegiatan
evaluasi sudah seharusnya dikuti dengan tindak lanjut atau follow up nya, jika evaluasi
ini tidak dtindaklanjuti maka pekerjaan itu akan menjadi mubadzir atau sia-sia belaka.
Dalam kaitannya dengan hasil analisis item dari segi derajat kesukarannya
seperti telah dikemukakan diatas maka tindak lanjut yang perlu dilakukan oleh tester
adalah sebagai berikut :
Pertama, untuk butir-butir item yang berdasarkan hasil analisis termasuk dalam
kategori baik (dalam arti derajat kesukaran itemnya cukup atau sedang), sayangnya butir
item tersebut segera dicatat dalam buku bank soal. Selanjutnya butir-butir soal tersebut
dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang akan datang.
9
Kedua, untuk butir-butir item yang termasuk dalam kategori terlalu sukar, ada
tiga kemungkinan tindak lanjut, yaitu: (1) butir item tersebut dbuang atau didrop dan
tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang datang. (2) diteliti ulang,
dilacak dan ditelusuri sehingga besangkutan sulit dijawab oleh testee; apakah kalimat
soalnya yang kurang jelas, apakah petunjuk cara mengerjakan (menjawab) soalnya sulit
dipahami, ataukah dalam soal tersebut terdapat istilah-istilah yang tidak jelas dan
sebagainya. Setelah dilakukan perbaikan kembali,butir-butir item tersebut dkeluarkan
lagi dalam tes hasil belajar yang akan datang. (3) haruslah dipahami bahwa tidak setiap
butir item yang termasuk dalam kategori terlalu sukar itu sama sekali tidak memiliki
kegunaan. Butir-butir item yang terlalu sukar itu sewaktu-waktu masih dapat diambil
manfaatnya, yaitu dapat digunakan dalam tes-tes (terutama tes seleksi) yang sifatnya
sangat ketat, dalam arti; sebagian terbesar dari testee tidak akan diluluskan dalam tes
seleksi tersebut. Dalam kondisi seperti itu sangat tepat apabila butir-butir item yang
dikeluarkan adalah butir-butir item yang termasuk kategori terlalu sukar dengan asumsi
bahwa testee dengan kemampuan yang rendah dengan mudah akan tersisihkan dari
seeleksi,sedangkan testee yang memiliki kemampuan tinggi tidak akan terlalu sukar
untuk lolos dalam seleksi tersebut.
Ketiga,untuk butir-butir item yang termasuk dalam kategori terlalu mudah, juga
ada tiga kemungkinan tindak lanjutnya,yaitu : (1) butir item tersebut dibuang atau
didrop dan tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang. (2)
diteliti ulang, dilacak dan ditelusuri secara cermat guna mengetahui faktor yang
menyebabkan butir item tersebut dapat dijawab betul oleh hampir seluruh testee;
kemungkinan option atau alternantif yang dipasangkan pada butir-butir item yang
bersangkutan “terlalu kentara” atau “terlalu mudah diketahui” oleh testee, mana option
yang merupakan kunci jawaban item dan mana option yang berfungsi sebagai pengecoh
atau distaktor. Disini tester harus berusaha memperbaiki atau menggantinya dengan
option yang lain sedemikian rupa sehingga antara kunci jawaban dengan pengecoh sulit
untuk dibedakan oleh testee. Setelah dilakukan perbaikan, item yang bersangkutan
dicoba untuk dikeuarkan lagi pada tes hasil belajar berikutnya,guna mengetahui apakah
derajat kesukaran item itu menjai lebih baik dari pada sebelumnya ataukah tidak. (3)
seperti halnya butir-butir item yang terlalu sukar,butir-butir item yang terlalu mudah
10
juga masih mengandung manfaat, yaitu bahwa butir-butir item yang termasuk dalam
kategori ini dapat dimanfaatkan pada tes (terutama tes seleksi) yang sifatnya longgar,
dalam arti bahwa sebagian terbesar dari testee akan dinyatakan lulus dalam tes seleksi
tersebut. Dalam kondisi seperti ini adalah sangat bijaksana apabila butir-butir item yang
dikeluarkan dalam tes seleksi itu adalah butir-butir item yang termasuk dalam kategori
terlalu mudah,sehingga tes seleksi itu boleh dikatakan hanya sebagai formalitas saja.
Dari uraian diatas maka tidak ada jeleknya untuk memasukkan butir-butir item
yang termasuk kategori terlalu sukar dan terlalu mudah didalam buku bank soal,sebab
sewaktu-waktu butir-butir item semacam itu diperlukan,tester tidak perlu membuat atau
menyusun butir-butir ite dengan derajat kesukaran dan derajat kemudahan yang sangat
tinggi.
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk
dapat membedakan (= mendiskriminasi) antara testee berkemampuan tinggi (=pandai),
dengan testee berkemampuan rendah (= bodoh) demikian rupa sehingga sebagian besar
testee yang memiliki kemampuan tinggi untuk memjawab butir item tersebut lebih
banyak yang menjawab betul, sementara testee yang berkemampuannya rendah untuk
menjawab butir item tersebut sebagian besar tidak dapat menjawab item dengan betul.
Mengetahui daya pembeda item itu penting sekali, sebab salah satu dasar yang
dipegangi untuk menyusun butir-butir item tes hasil belajar adalah adanya anggapan,
bahwa kemampuan antara testee yang satu denga testee yang lain itu berbeda-beda, dan
bahwa butir-butir item tes hasil belajar itu haruslah mampu memberikan hasil tes yang
mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat dikalangan
testee tersebut.
Sejalan dengan pernyataan diatas maka kegiatan analisis terhadap daya pembeda
item itu ditunjukkan untuk menjawab pertanyaan : “Apakah testee yang kita anggap
pandai jawabannya pada umumnya betul, dan apakah testee yang kita anggap bodoh itu
11
pada umumnya jawabannya salah?” Jika jawab atas pertanyaan itu adalah “Ya”, maka
butir item yang bersangkutan dapat kita anggap sebagai butir item yang baik, dalam arti
bahwa butir item tersebut telah menunjukkan kemampuannya di dalam membedakan
antara testee yang termasuk dalam kategori pandai dengan testee yang termasuk dalam
kategori bodoh. Sebaliknya, jika jawab atas pertanyaan itu adalah “tidak” (yaitu
diperoleh kenyataan bahwa ternyata testee yang kita anggap memiliki kemampuan yang
tinggi justru lebih banyak yang menjawab salah terhadap butir item yang bersangkutan,
sedangkan testee yang kita anggap sebagai testee yang kemampuannya rendah justru
lebih banyak dapat menjawab butir item dengan betul)- maka butir item yang
bersangkutan dapat kita nyatakan sebagai butir item jelek, sebab hasil yang dicapai
dalam tes itu justru bertentangan atau berlawanan arah dengan tujuan tes itu sendiri.
Daya pembeda item tersebut dapat diketahui melalui atau dengan melihat besar
kecilnya angka indeks diskriminasi item. Angka diskriminasi item adalah sebuah angka
atau bilangan yang menunjukkan besar kecilnya pembeda (discriminatory power) yang
dimiliki oleh sebutir item.
di mana :
PA atau PH = Proporsi testee kelompok atas yang dapat menjawab dengan betul butir
item yang bersangkutan. (PH adalah singkatan dari Proportion of the
Higher Group).
𝐵𝑎
PA = P h = 𝐽𝑎
di mana:
PB atau PL = Proposi testee kelompok bawah yang dapat menjawab dengan betul
yang bersangkutan (PL adalah singkatan dari proportion of the
Lower Group).
𝐵𝑏
PB = PL = 𝐽𝑏
di mana :
Rumusan kedua :
Dengan rumus kedua ini maka angka indeks diskriminasi item diperoleh dengan
menggunakan teknik korelasi Phi (Ø) dengan rumus sebagai berikut :
𝑃𝐻−𝑃𝐿
Ø=
2√(𝑝)(𝑞)
di mana :
Ø = Angka Indeks Korelasi Phi, yang dalam hal ini dianggap sebgai angka indeks
diskriminasi item.
2 = Bilangan konstan
Contoh 1:
Mencari angka indeks diskriminasi item dengan menggunakan rumus pertama (rumus
D).
Misalkan 10 orang testee mengikuti tes hasil belajar dalam bidang Studi Bahasa
Arab yang tertuang dalam bentuk multiple choice item. Dalam tes tersebut dikeluarkan
10 butir item dengan catatan bahwa untuk setiap butir item yang dijawab betul di beri
bobot 1 sedangkan untuk setiap butir item yang dijawab salah diberi bobot 0.
Setelah tes hasil belajar tersebut berakhir dan dilakukan pengoreksian serta
diberikan skor, maka dari tes tersebut diperoleh pola penyebaran skor jawaban item
sebagaimana tertera pada Tabel 8.4.
TABEL 8.4 Distribusi skor-skor hasil tes hasil belajar bidang Studi Bahasa Arab yang diikuti
oleh 10 orang testee, dengan menyajikan 10 butir item.
E 0 1 1 1 1 1 0 1 1 0 7
F 0 1 0 1 1 0 1 0 0 0 4
G 0 1 0 1 0 1 1 1 1 1 7
H 1 1 0 1 1 1 1 1 1 1 9
I 0 1 0 0 1 1 0 0 1 0 4
J 1 0 0 1 1 1 0 0 0 1 5
10=N 5 9 2 8 6 8 5 6 6 6 61
Untuk keperluan tersebut kita urutkan dari atas ke bawah, mulai dari skor tertinggi
sampai dengan skor yang terendah. Seperti dapat kita lihat pada Tabel 8.4, skor tertinggi
dimiliki oleh B), di bawahnya berturut-turut adalah skor 9 (dimiliki oleh H), skor 7
(dimiliki oleh C,E dan G), skor 5 (dimiliki oleh A dan J), skor 4 (dimiliki oleh F dan I),
dan Skor 3 (dimiliki oleh D).
Jika urutan skor-skor hasil tes itu kita urutkan dari atas ke bawah dan kita lakukan
pembagian testee atas dua kelompok – yaitu kelompok atas dan bawah- maka
keadaannya adalah sebagai berikut :
Langkah ketiga : Mencari (menghitung) BA, BB, PA, PB dan D untuk 10 butir item
tes hasil belajar tersebut diatas. Untuk ini perhatikanlah dengan cermat skor-skor
jawaban betul yang dimiliki oleh testee kelompok atas (berada diantara dua tanda
kurung) dan skor-skor jawaban betul yang dimiliki oleh testee kelompok bawah (tanpa
tanda kurung) yang disajikan pada Tabel 8.5. Adapun hasilnya dapat dilihat pada Tabel
8.6.
Tabel 8.5. I Skor-skor Jawaban betul; yang dicapai oleh 5 orang testee kelompok
atas dan 5 orang testee kelompok bawah
Nomor BA BB JA JB 𝐵𝐴 𝐵𝐵 D=PA-PB
PA= 𝐽𝐴 PB= 𝐽𝐵
Butir
1. 3 2 5 5 0,60 0,40 0,20
2. 5 4 5 5 1,00 0,80 0,20
16
Bertitik tolak dari hasil penganalisisan tersebut diatas maka dapat disimpulkan
bahwa 60 % (6 butir) dari 10 butir iten yang diajukan dalam tes hasil belajar bidang
studi Bahasa Arab dimaksud diatas termasuk sudah memiliki daya pembeda item yang
memadai, sedangkan sisanya yaitu 40 % (4 butir item) tergolong dalam kelompok item
yang tidak /belum memiliki daya pembeda seperti yang diharapkan.
17
dipasang pada item tersebut dapat dinyatakan berfungsi apabila minimal 5 orang dari
100 orang testee itu sudah “terkecoh” untuk memilih distraktor tersebut.
Berikut ini dikemukakan sebuah contoh bagaimana cara menganisis fungsi
distraktor. Misalkan tes hasil belajar bidang studi geografi diikuti oleh 50 orang siswa.
Bentuk soalnya multiple choice item dengan item sebanyak 40 butir, dimana setiap butir
item dilengkapi dengan lima alternatif, yaitu A, B, C, D, dan E. Dari 40 butir item
tersebut di atas, khusus untuk butir item nomor 1, 2, dan 3 diperoleh pola penyebaran
jawaban item sebagai berikut :
No Alternative (=option)
Item A B C D E
1. 4 6 5 (30) 5
2. 1 (44) 2 1 2
3. 1 1 (10) 1 37
*tanda ( ) : Kunci Jawaban
Dengan pola penyebaran jawaban item sebagaimana tergambar pada tabel
analisis di atas, maka dengan mudah dapat kita ketahui, berapa persen testee yang telah
“terkecoh” untuk memilih distraktor yang dipasangkan pada item 1, 2, dan 3, yaitu:
1. Untuk item nomor 1, kunci jawabannya adalah D, sedangkan pengecohnya atau
distraktornya adalah A, B, C, dan E
Pengecoh A dipilih oleh 4 orang testee; berarti 4/50 x 100% =8%. Jadi pengecoh A
sudah dapat menjalankan fungsinya dengan baik, sebab persentasenya sudah melebihi
5%.
Pengecoh B dipilih oleh 6 orang testee; berarti 6/50 x 100% =12% (telah berfungsi
dengan baik).
Pengecoh C dan E dipilih oleh 5 orang testee; berarti 5/50 x 100% =10% (telah
berfungsi dengan baik).
Jadi keempat pengecoh yang dipasangkan pada item nomor 1 itu sudah dapat
menjalankan fungsinya dengan sebaik-baiknya.
2. Untuk item nomor 2, kunci jawabannya adalah B, sedangkan pengecohnya adalah A,
C, D dan E.
Pengecoh A dan D dipilih oleh 1 orang testee; berarti 1/50 x 100% = 2% (belum
berfungsi)
19
Pengecoh C dan E dipilih oleh 2 orang testee; berarti 2/50 x 100% = 4% ( belum
berfungsi)
Jadi keempat pengecoh yang dipasangkan pada item nomor 2 itu belum dapat
menjalankan fungsinya seperti yang diharapkan.
3. Untuk item nomor 3, kunci jawabannya adalah C, sedangkan pengecohnya A, B, D,
dan E.
Pengecoh A, B, dan D masing-masing dipilih oleh 1 orang teste (=2%). Berarti tiga
buah pengecoh itu belum berfungsi.
Adapun pengecoh E dipilih oleh 37 orang, berarti 37/50 x 100% = 74% (telah berfungsi
dengan baik).
Jadi pada butir item nomor 3 itu hanya 1 buah pengecoh saja yang sudah dapat
menjalankan fungsinya dengan baik.
Perlu ditambahkan, bahwa dengan menggunakan tabel analisis tersebut,
disamping dapat diketahui berfungsi/tidaknya distraktor, dapat pula diketahui derajat
kesukaran item dan daya pembeda itemnya.
20
BAB III
PENUTUP
A. Kesimpulan
Analisis dan interpretasi hasil belajar adalah suatu kegiatan atau tindakan guna
meneliti atau mencari hasil belajar apa yang dirancang oleh pengajar dapat berjalan
sesuai fungsinya pada anak didik.
Tujuan analisis hasil belajar ini tidak lain yaitu untuk menganalisa hasil belajar
dari siswa hingga guru dapat memahami kekurang-kekurangan yang ada saat
pembelajaran yang telah berlansung. Interpretasi atau penafsiran hasil tes bertujuan
untuk menerjemahkan dan memberi makna terhadap skor yang diperoleh testee (orang
yang diuji). Interpretasi skor hasil belajar siswa merupakan hal yang sangat penting
dilakukan oleh guru. Interpretasi ini menyediakan informasi untuk pengambilan
keputusan dan landasan untuk perbaikan pembelajaran selanjutnya. Pengambilan
keputusan dan landasan perbaikan ini sebaiknya didasarkan pada acuan tertentu.
Teknik analisis hasil belajar dan interpretasinya dibagi menjadi 3, yaitu :
B. Saran
Daftar Pusataka
http://puputpurnama11.blogspot.co.id/2015/01/analisis-pembelajaran.html
http://khairuddinhsb.blogspot.co.id/2010/03/interpretasi-penilaian-evaluasi.html