Evaluasi Pil 2
Evaluasi Pil 2
Disusun Oleh :
Cucu Mustarsiddin (1132070012)
Dea Hasna Fachriah (1132070013)
Devi Yulianti Wafiah (1132070014)
Dian Hidayani (1132070015)
Dian Nurdiansah (1132070016)
KATA PENGANTAR
i
Daftar isi
KATA PENGANTAR...................................................................................................... i
Daftar isi .................................................................................................................... ii
BAB I .......................................................................................................................... 1
PENDAHULUAN ......................................................................................................... 1
A. Latar Belakang Masalah ................................................................................ 1
B. Rumusan Masalah ......................................................................................... 1
C. Tujuan ........................................................................................................... 2
BAB III ...................................................................................................................... 12
PENUTUP ................................................................................................................. 12
A. Kesimpulan .................................................................................................. 12
B. Saran ........................................................................................................... 12
ii
ii
1
BAB I
PENDAHULUAN
A. Latar Belakang Masalah
Salah satu tugas penting yang seringkali dilupakan oleh staf pe-
ngajar adalah tugas melakukan evaluasi terhadap alat pengukur yang telah
digunakan untuk mengukur keberhasilan belajar dari para peserta didiknya.
Alat pengukur dimaksud adalah tes hasil belajar, yang batang tubuhnya
terdiri dari kumpulan butir-butir soal.
Alat pengukur itu bisa dilakukan dengan jalan melakukan penga-
nalisisan terhadap tes hasil belajar yang telah dijadikan alat pengukur dalam
rangka mengukur keberhasilan belajar dari para peeserta tes tersebut. Disini
tester perlu melakukan penelusuran dan pelacakan dengan secara cermat,
terhadap butir-butir soal yang meruakan bagian tak terpisahkan dari tes hasil
belajar sebagai suatu totalitas. penelusuran dan pelacakan dilaksanakan oleh
tester dengan tujuan untuk mengetahui, apakah butir-butir item yang mem-
bangun tes hasil belajar itu sudah dapat menjalankan fungsinya sebagai alat
pengukur hasil belajar yang memadai atau belum. Identifikasi terhadap
setiap butir soal tes hasil belajar itu dilakukan dengan harapan akan meng-
hasilkan berbagai informasi berharga, yang pada dasarnya akan merupakan
umpan balik guna melakukan perbaikan, pembenahan, dan penyempurnaan
kembali terhadap butir-butir item yang telah dikeluarkan dalam tes hasil
belajar, sehingga pada masa-masa yang akan datang tes hasil belajar yang
disusun atau dirancang oleh tester itu betul-betul dapat menjalankan
fungsinya sebagai alat pengukur hasil belajar yang memilki kualitas yang
tinggi.
B. Rumusan Masalah
1. Jeleskan apakah yang dimaksud tingkat kesukaran?
2. Bagaimana menganalisi tingkat kesukaran soal?
3. Jelaskan apakah yang di maksuddaya pembeda?
4. Bagaimana menganalisis daya pembeda butir soal?
C. Tujuan
1. Mengetahui apakah yang dimaksud tingkat kesukaran
2. Mengetahui menganalisi tingkat kesukaran soal
3. Mengetahui apakah yang di maksuddaya pembeda
4. Mengetahui menganalisis daya pembeda butir soal
2
BAB II
PEMBAHASAN
3
termasuk sukar dan sebaliknya semakin banyak siswa yang dapat menjawab
soal itu dengan benar, berarti itu mengindikasikan soal itu tidak sukar atau
soal itu mudah.”4
Dalam hal ini sudah atau belum memadainya tingkat kesukaran item
tes hasil belajar dapat dilihat dan diketahui dari besar kecilnya angka yang
melambangkan tingkat kesulitan dari item tes tersebut yang sering dikenal
dengan istilah difficulty index (angka indek kesukaran item), yang dalam
dunia evaluasi pembelajaran umumnya dilambangkan dengan huruf P, yaitu
singkatan dari kata Proportion (proporsi=proporsa). 5
Angka indek kesukaran item tersebut besarnya berkisar amtara 0,00
sampai dengan 1,00. Yang berarti bahwa angka terrendah dari indek
kesukaran item tes adalah 0,00 dan angka tertinggi dari indek kesukaran tes
adalah 1,00.6
Jika angka indeks 0,00 (P = 0,00) berarti butir soal sangat sukar
karena tidak seorangpun dapat menjawab dengan benar butir tes tersebut.
Sebaliknya jika indeksnya 1,00 berarti butir soal tersebut sangat mudah
karena semua siswa dapat menjawabnya dengan benar.
Tabel 1. Klasifikasi Tingkat Kesukaran Butir Soal
Tingkat Kesukaran Nilai p
Sukar 0,00 – 0,25
Sedang 0,26 – 0,75
Mudah 0,76 – 1,00
4 Dimyati, Mudjiono.1996 : 64
5 Witherington, Psychological Education hlm. 87
6 Suryobroto, 1983 :173
7 Dimyati, Mudjiono.1996 : 67
4
penggunaan penilaian acuan norma tidaklah tepat, karena informasi kemam-
puan yang dihasilkan tidaklah akan berdistribusi normal. Walaupun demi-
kian ada yang berpendapat bahwa soal-soal yang dianggap baik adalah soal-
soal yang sedang, yaitu soal-soal yang mem-punyai indeks kesukaran
berkisar antara 0,26 – 0,75. Berbagai kriteria ter-sebut mempunyai ke-
cenderungan bahwa butir soal yang memiliki indeks kesukaran kurang dari
0,25 dan lebih dari 0,75 sebaiknya dihindari atau tidak digunakan, karena
butir soal yang demikian terlalu sukar atau terlalu mudah, sehingga kurang
mencerminkan alat ukur yang baik. 8
Namun demikian soal-soal yang terlalu mudah atau terlalu sukar
tidak berarti tidak boleh digunakan. Hal ini tergantung dari tujuan peng-
gunaannya. Jika dari peserta tes banyak, padahal yang dikehendaki lulus
hanya sedikit maka diambil peserta yang terbaik, untuk itu diambilkan butir
soal tes yang sukar.9 Demikian sebaliknya jika kekurangan peserta tes, maka
dipilihkan soal-soal yang mudah. Selain itu, soal-soal yang sukar akan
menambah motivasi belajar bagi siswa-siswa yang pandai, sedangkan soal-
soal yang mudah akan membangkitkan semangat kepada siswa yang lemah.
Setelah di identifikasi tentang tingkat kesukaran butir soal tes telah
dilakukan, perlu adanya penindak lanjutan terhadap soal-soal tersebut.
Tindak lanjut tersebut diantaranya adalah: 10
1. untuk butir soal yang telah memenuhi kategori yang baik (tingkat
kesukarannya sedang atau cukup), hendaknya disimpan ke dalam
bank soal agar peserta didik dapat mempergunakanya kembali
untuk waktu yang akan datang.
2. untuk item soal yang tergolong terlalu sulit ada 3 kemungkinan
tindak lanjut, yaitu:
Dibuang dan tidak akan digunakan lagi,
Diperbaiki, diteliti ulang dan dicari tahu apa faktor penyebabdari
sulitnya soal tersebut dijawab oleh testee,
5
Disimpan dan digunakan untuk tujuan khusus, seperti tes
penyeleksian siswa yang bersifat lebih ketat yang hanya
sebagian kecil yang akan diterima.
3. Untuk item soal yang tergolong terlalu mudah juga ada 3 ke-
mungkinan tindak lanjut, ini hampir sama dengan tindak lanjut
untuk butir-butir soal yang tergolong sulit, yaitu:
Dibuang dan tidak akan digunakan lagi,
Diperbaiki, diteliti ulang dan dicari tahu apa faktor penyebab
dari mudahnya soal tersebut untuk dijawab oleh testee,
Disimpan dan digunakan untuk tujuan khusus, seperti tes
penyeleksian siswa yang bersifat lebih longgar, yang sebagian
besar yang akan diterima yang bisa dikatakan sebagai tes
formalitas.
Cara yang lain yang dapat digunakan untuk mencari atau menghitung
angka indek kesukaran item adalah dengan menggunakan skala kesukaran
linear. Skala linear ini digunakan untuk mencari P bersih, karena se-
sungguhnya P yang kita hitung sebelumnya tidak memperhatikan atau mem-
perhitungkan option atau alternative jawaban yang dipasang disetiap butir
soal tes.
6
bawah (kurang mampu).Ini dianggap sangat penting karena ada anggapan
bahwa kemampuan setiap testee akan berbeda dengan testee yang lainnya.
Daya pembeda (discriminatory power) item itu dapat diketahui mela-
lui atau dengan melihat besar kecilnya angka indeks diskriminasi item. Pada
dasarnya, daya pembeda ini dihitung atas dasar pembagian testee ke dalam
dua kelompok, yaitu kelompok atas (the higher group) – kelompok yang
tergolong pandai – dan kelompok bawah (the lower group) – kelompok
yang tergolong kurang pandai. Ada beberapa cara untuk mengelompok-kan
testee, dapat menggunakan median, dapat juga menggunakan hanya 20%
dari testee yang temasuk kelompok atas dan 20% yang termasuk kelompok
bawah. Namun pada umumnya, para pakar di bidang evaluasi menggunakan
persentase 27% dari testee yang termasuk kelompok atas dan 27% dari
testee yang termasuk kelompok bawah karena dianggap cukup mampu
diandalkan.
Indeks dikriminasi item umumnya diberi lambang D (singkatan dari
Discriminatory Power) yang besarnya berkisar antara 0 sampai dengan 1,00.
Akan tetapi indeks diskriminasi ini dapat bertanda minus (-). Jika sebutir
item angka indeks diskriminasinya = 0,00, maka item tersebut tidak
memiliki daya pembeda sama sekali. Jika indeks diiskriminasi itemnya
bertanda negative (minus) maka butir item tersebut lebih banyak dijawab
benar oleh testee dari kelompok bawah daripada testee kelompok atas atau
testee yang sebenarnya termasuk dalam kelompok atas lebih banyak yang
menjawab salah sedangkan testee yang termasuk kelompok bawah lebih
banyak yang menjawab benar.
Dalam hubungan ini pada umumnya besaran indeks diskriminasi yang
dapat diinterpretasikan adalah sebagai berikut:
7
Butir item yang bersangkutan
Satisfactor
0,20 – 0,40 telah memiliki daya pembeda
y
yang cukup (sedang).
Butir item yang bersangkutan
0,40 – 0,70 Good telah memiliki daya pembeda
yang baik.
Butir item yang bersangkutan
0,70 – 1,00 Excellent telah memiliki daya pembeda
yang baik sekali.
Butir item yang bersangkutan
Bertanda negative - daya penbedanya negative (jelek
sekali).
Untuk menghitung besar kecilnya angka indeks diskriminasi item
dapat dipergunakan dua rumus.
Rumus pertama:
D = PA - pB atau D = PH – p L
di mana:
D = Discriminatory power (angka indeks diskriminasi item)
PA atau PH = Proporsi testee kelompok atas yang dapat menjawab
dengan benar butir item yang bersangkutan.
(PH adalah singkatan dari Proportion of Higher Group)
Contoh: 12
Misalkan 10 orang mengikuti tes hasil belajar bidang studi
Matematika yang berbentuk pilihan ganda.Ada 10 butir item soal dalam tes
tersebut dengan catatan yang menjawab benar diberi bobot 1 dan yang
menjawab salah 0, sebagaimana tertera pada Tabel 2.3.
Ada beberapa langkah yang harus dilakukan untuk mencari besarnya
angka indeks diskriminasi item (D), yaitu:
Langkah pertama: Mengelompokkan (membagi) testee menjadi 2 kelompok,
yaitu kelompok atas (yang mendapatkan skor tinggi) dan
kelompok bawah (yang mendapatkan skor rendah).
8
Tabel 2.3.Distribusi skor hasil tes Matematika
Tota
Skor yang dicapai oleh testee untuk setiap butir item nomor
Testee l
1 2 3 4 5 6 7 8 9 10
A 0 (1) (1) 0 (1) 0 (1) (1) (1) (1) 7
B (1) 0 (1) (1) (1) (1) 0 0 (1) (1) 7
C 1 0 0 0 0 0 1 1 1 0 4
D (1) 0 (1) (1) (1) 0 (1) (1) (1) (1) 8
E (1) 0 (1) 0 (1) (1) (1) 0 (1) (1) 7
F 0 0 1 1 0 0 1 1 1 0 5
G 1 0 1 0 0 0 0 0 0 1 3
H 0 0 1 1 0 0 1 0 1 0 4
I 1 0 1 0 1 0 1 0 1 1 6
J (1) (1) (1) (1) (1) (1) (1) 0 (1) (1) 9
N=10 7 2 9 5 6 3 8 4 9 7 60
9
Tabel 2.4.Hasil perhitungan BA, BB, PA, PB dan D
Nomor
D=PA-
Butir BA BB JA JB PA PB
PB
Item
1 4 3 5 5 0,80 0,60 0,20
2 2 0 5 5 0,40 0,00 0,40
3 5 4 5 5 1,00 0,80 0,20
4 3 2 5 5 0,60 0,40 0,20
5 5 1 5 5 1,00 0,20 0,80
6 3 0 5 5 0,60 0,00 0,60
7 4 4 5 5 0,80 0,80 0,00
8 2 2 5 5 0,40 0,40 0,00
9 5 4 5 5 1,00 0,80 0,20
10 5 2 5 5 1,00 0,40 0,60
10
Dengan demikian, jelas terlihat bahwa 4 dari 10 item soal diatas sudah
termasuk memiliki daya pembeda yang memadai dan sisanya, yaitu 6 masih
tergolong kelompok item soal yang tidak/belum memiliki daya pembeda
yang diharapkan.
11
BAB III
PENUTUP
A. Kesimpulan
Evaluasi hasil belajar siswa merupakan salah satu kegiatan yang
merupakan kewajiban bagi setiap guru.Penganalisisan terhadap butir soal tes
hasil belajar dilakukan guna memperoleh dan mengetahui apakah item tes
sudah mampu menjalankan fungsinya sebagai alat ukur hasil belajar.
Penganalisisan terhadap butir soal tes hasil belajar dapat dilakukan
dengan beberapa cara, yaitu: dengan analisis tingkat kesukaran butir soal
tesnya, dan dengan menganalisis daya pembeda butir soalnya.Analisis
tingkat kesukaran butir item tes dimaksudkan untuk mengetahui seberapa
mudah dan seberapa sulit tingkat kesukaran sebuah item soal tes bagi testee
atau siswa yang terkait.
Analisis daya beda butir item tes dimaksudkan untuk mengungkapkan
seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi
dengan siswa kelompok rendah.Salah satu ciri butir yang baik adalah yang
mampu membedakan antara kelompok atas (yang mampu) dan kelompok
bawah (kurang mampu).
Daya pembeda (discriminatory power) item itu dapat diketahui mela-
lui atau dengan melihat besar kecilnya angka indeks diskriminasi item. Pada
dasarnya, daya pembeda ini dihitung atas dasar pembagian testee ke dalam
dua kelompok, yaitu kelompok atas (the higher group) – kelompok yang
tergolong pandai – dan kelompok bawah (the lower group) – kelom-pok
yang tergolong kurang pandai.
B. Saran
Tidak sedikit dari para staf pengajar yang hanya membuat soal tes,
lalu memberikannya, setelah itu maka selesailah proses evaluasi belajar.
Mereka cenderung tidak memperhatikan bagaimana setiap butir soal tes
mampu menjalankan tugasnya sebagai alat ukur kemampuan testee.
Dalam proses evaluasi hasil belajar, hendaknya kita memperhatikan
setiap butir soal yang akan diberikan dalam rangka mengukur kemampuan
seorang testee atau seorang siswa. Soal yang akan diberikan harus mampu
12
menjalankan tugasnya sebagai alat ukur atas sejauh mana seorang testee
atau siswa menguasai atau memehami hasil pembelajarannya.
Oleh karena itu, analisis terhadap tingkat kesukaran setiap item tes
dan daya pembeda item perlu dilakukan untuk menunjang fungsi dan tujuan
pemberian tes hasil belajar tadi yang telah disebutkan agar mendapatkan tes
hasil belajar yang berkualitas.
13
DAFTAR PUSTAKA
14