Anda di halaman 1dari 14

MAKALAH EVALUASI PENDIDIKAN

ANALISIS INSTRUMEN PENILAIAN HASIL BELAJAR

DI SUSUN OLEH:
KELOMPOK VII PGMI 5G
Selly Marselina (19591205)
Selvi Ardita (19591206)
Sekar Ayu A (19591202)
Dosen Pengampuh: Wiwin Arbaini Wahyuningsi, M.Pd

INSTITUT AGAMA ISLAM NEGERI (IAIN) CURUP


JURUSAN TARBIYAH
PRODI PENDIDIKAN GURU MADRASAH IBTIDAIYAH
(PGMI)
TAHUN AJARAN 2021/2022

i
KATA PENGANTAR
Alhamdulillah, segala puji dan syukur kami panjatkan kehadirat Allah SWT
yang telah melimpahkan rahmat, hidayah serta inayahn-Nya, sehingga kami dapat
menyelesaikan makalah “Evaluasi Pembelajaran”. Sholawat serta salam semoga
senantiasa Allah limpahkan kepada junjungan Nabi Muhammad Saw,
keluarganya, sahabatnya, serta pengikutnya sampai akhir zaman.
Makalah ini diajukan untuk memenuhi tugas terstruktur pada mata
kuliah Evaluasi Pembelajaran, dengan harapan berguna bagi penyusun dan bagi
pembaca pada umumnya.
Dalam Penulisan makalah ini kami merasa masih banyak kekurangan-
kekurangan baik pada teknis penulisan maupun materi, mengingat akan
kemampuan yang kami miliki. Untuk itu kritik dan saran yang positif dari semua
pihak sangat kami harapkan demi penyempurnaan pembuatan makalah ini dan
pembuatan makala berikutnya.
Dalam penulisan makalah ini saya ucapkan terima kasih kepada pihak-pihak
yang membantu dalam menyelesaikan pembuatan makalah ini, khususnya kepada
Ibu Wiwin Arbaini Wahyuningsi, M.Pd selaku Dosen pembimbing mata kuliah
Evaluasi Pembelajaran yang telah meluangkan waktu, tenaga dan pikiran dalam
pelaksanaan bimbingan, pengarahan, dorongan dalam rangka penyelesaian
penyusunan makalah ini. Semoga makalah ini dapat bermanfaat. Terima kasih.

Curup,20November 2021

penyusun

ii
DAFTAR ISI
KATA PENGANTA.....................................................................................ii
DAFTAR ISI................................................................................................iii
BAB I PENDAHULUAN
A. Latar Belakang....................................................................................2
B. Rumusan Masalah...............................................................................3
C. Tujuan.................................................................................................3
BAB II PEMBAHASAN
A. Indeks Kesukaran................................................................................4
B. Daya Beda...........................................................................................5
C. Keberfungsian Distraktor....................................................................7
D. Pengenalan Rasch...............................................................................8
BAB III PENUTUP
A. Kesimpulan.......................................................................................11
DAFTAR PUSTAKA...................................................................................12

iii
BAB I
PENDAHULUAN
A. Latar Belakang
Menurut Peraturan Pemerintah No. 23 tahun 2016, instrumen penilaian
adalah alat yang digunakan oleh pendidik dapat berupa tes, pengamatan,
penugasan perseorangan atau kelompok, dan bentuk lain yang sesuai dengan
karakteristik kompetensi dan tingkat perkembangan peserta didik. Pengertian
instrumen dalam lingkup evaluasi didefinisikan sebagai perangkat untuk
mengukur hasil belajar siswa yang mencakup hasil belajar dalam ranah
kognitif, afektif, dan psikomotor. Instrumen penilaian yang digunakan harus
memenuhi beberapa persyaratan standar yang sudah ditetapkan oleh
pemerintah. Permendikbud nomor 23 tahun 2016 Pasal 14 menyatakan bahwa
instrumen penilaian yang digunakan oleh satuan pendidikan dalam bentuk
penilaian akhir dan/atau ujian sekolah/madrasah memenuhi persyaratan
substansi, konstruksi, dan bahasa, serta memiliki bukti validitas empirik.
Instrumen penilaian dapat dibagi menjadi tiga kelompok, yaitu instrumen
evaluasi hasil belajar kognitif, instrumen evaluasi hasil belajar afektif,
instrumen evaluasi hasil belajar psikomotor. Instrumen evaluasi untuk ketiga
hasil belajar tersebut perlu dianalisis sebelum dan sesudah digunakan yang
tujuannya agar dapat dihasilkan instrumen evaluasi yang memiliki kualitas
tinggi.
Hasil belajar merupakan salah satu acuan keberhasilan dari proses
pembelajaran, sehingga hasil belajar sering dianggap sebagai hal yang sangat
penting meskipun di kurikulum 2013, hasil belajar bukanlah hal yang paling
penting, karena kurikulum 2013 lebih mengedepankan pada proses belajar itu
sendiri (Sudijono, 2012: 32). Sudjana (2009: 22) menyatakan hasil belajar
adalah kemampuan-kemampuan yang dimiliki siswa setelah ia menerima
pengalaman belajar. Menurut Muhibbin (2006: 92), secara umum bahwa
belajardapat dipahami sebagai tahapan perubahan seluruh tingkah laku
individu yang relatif menetap sebagai hasil pengalaman dan interaksi dengan
lingkungan yang melibatkan proses kognitif. Hal ini juga tertuang dalam

iv
peraturan menteri pendidikan dan kebudayaan (Permendikbud) nomor 23
tahun 2016 telah ditentukan lingkup penilaian hasil belajar oleh pendidik.
Lingkup tersebut meliputi ranah sikap (afektif), pengetahuan (kognitif), dan
keterampilan (Psikomotorik). Ketiga aspek penilaian tersebut harus
dilaksanakan oleh guru dalam pembelajaran yang ada di sekolah. Di dalam
makalah ini, kita akan membahas tentang “Analisis Instrumen Penilaian Hasil
Belajar”
B. Rumusan Masalah
Adapun rumusan masalah dalam makalah ini adalah sebagai berikut:
1. Apakah itu indeks Kesukaran?
2. Apa daya beda dalam instrumen penilaian?
3. Apakah itu keberfungsian distraktor/pengecoh dalam penilaian?
4. Apakah itu pengenalan rasch?

C. Tujuan
Adapun tujuan dalam pembuatan makalah ini adalah untuk memecahkan
atau mendapat jawaban dari rumusan masalah di atas. Dan tujuan dari
pembuatan makalah ini adalah untuk memecahkan rumusan masalah sehingga
penyusun dan pembaca akan mendaptkan jawaban dari judul makalah ini
sendiri yaitu " Analisis Instrumen Penilaian Hasil Belajar”

v
BAB II
PEMBAHASAN
A. Indeks Kesukaran
Indeks kesukaran butir soal adalah persentase atau proporsi dari peserta tes
untuk menjawab benar suatu butir soal. Besarnya tingkat kesukaran berkisar
0,00 - 1,00. Semakin besar tingkat kesukaran yang diperoleh dari hasil
hitungan, berarti semakin mudah soal itu dan soal itu harus direvisi. Suatu soal
memiliki p = 0,00 artinya bahwa tidak ada siswa yang menjawab benar dan
bila memiliki p = 1,00 artinya bahwa semua siswa menjawab benar.
keberagaman peserta tes terjadi ketika level optimum kesukaran adalah 0,50,
yang mengindikasikan bahwa sebanyak 50% peserta tes menjawab benar, dan
sebanyak 50% peserta tes menjawab salah. Akan tetapi, tidak setiap butir soal
harus memiliki tingkat kesukaran 0,50. Boleh satu soal memiliki nilai kurang
dari 0,50, ataupun lebih besar dari 0,50, akan tetapi rata-rata dari keseluruhan
dari butir soal tetap 0,50.Tingkat kesukaran butir soal memiliki 2 kegunaan,
yaitu kegunaan bagi guru dan kegunaan bagi pengujian dan pengajaran (Nitko,
2011: 303-305). Kegunaannya bagi guru adalah:
a. Sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi
masukan kepada siswa tentang hasil belajar mereka,
b. Memperoleh informasi tentang penekanan kurikulum atau mengecek
terhadap butir soal yang bias.
Adapun kegunaannya bagi pengujian dan pengajaran adalah:
1. Pengenalan konsep yang diperlukan untuk diajarkan ulang,
2. Mengecek terhadap kelebihan dankelemahan pada kurikulum sekolah,
3. Memberi masukan kepada siswa,
4. Mengecek kemungkinan adanyabutir soal yang bias.

Tingkat Kesukaran Butir Soal


Teknik analisis data untuk tingkat kesukaran butir soal berupa pilihan
ganda dapat dihitung dengan rumus:

vi
jumlah siswa yang menjawabbenar
p=
jumlah siswa yang mengikuti testes
(Nitko, 2011: 301)

Tingkat kesukaran dalam bentuk soal uraian dapat dihitung dengan rumus:
rata 2 skor−skor minimum
p=
skor maksimum−skor minimum
(Nitko,2011: 303)

Setelah dilakukan perhitungan, maka butir soal dapat dikategorikan


menjadi butir soal yang sukar, sedang, dan mudah. Hal itu bergantung
koefisien tingkat kesukarannya. Perhatikan Tabel berikut.
Tabel2. Kategori Tingkat Kesukaran
Koefisien Kategori
p< 0,3 Sukar
0,3≤p≤ 0,7 Sedang
p> 0,7 Mudah
(Surapranata,
2009: 21)

B. Daya Pembeda
Daya pembeda soal adalahkemampuan suatu butir soal dapatmembedakan
siswa yang telahmenguasai materi yang ditanyakan dansiswa yang
tidak/kurang/belummenguasai materi yang ditanyakan. Manfaat daya pembeda
butir soaladalah seperti berikut ini:
a. Untuk meningkatkan mutu setiapbutir soal melalui data
empiriknya.Berdasarkan indeks daya pembeda,setiap butir soal dapat
diketahuiapakah butir soal itu baik, direvisi,atau ditolak.
b. Untuk mengetahui seberapa jauhsetiap butir soal
dapatmendeteksi/membedakankemampuan siswa, yaitu siswayang telah
memahami atau belummemahami materi yang diajarkanguru. Apabila

vii
suatu butir soaltidak dapat membedakan keduakemampuan siswa itu,
maka butirsoal itu dimungkinkan sepertiberikut ini:
1) Kunci jawaban butir soal itutidak tepat.
2) Butir soal itu memiliki 2 ataulebih kunci jawaban yangbenar
3) Kompetensi yang diukur tidakjelas
4) Pengecoh tidak berfungsi
5) Materi yang ditanyakan terlalusulit, sehingga banyak siswayang
menebak
6) Sebagian besar siswa yangmemahami materi yangditanyakan berpikir
ada yangsalah informasi dalam butirsoalnya
Indeks daya pembeda setiap butirsoal biasanya juga dinyatakan
dalambentuk proporsi. Semakin tinggi indeksdaya pembeda soal berarti
semakinmampu soal yang bersangkutanmembedakan siswa yang
telahmemahami materi dengan siswa yangbelum memahami materi.
Indeks dayapembeda berkisar antara – 1,00 sampaidengan +1,00. Semakin
tinggi dayapembeda suatu soal, maka semakinkuat/baik soal itu. Jika daya
pembedanegatif (<0) berarti lebih banyakkelompok bawah (peserta didik
yangtidak memahami materi) menjawabbenar soal dibanding dengan
kelompokatas (peserta didik yang memahamimateri yang diajarkan guru).
Proses perhitungan daya pembedadilakukan jika sudah dibedakan
antaraproses perhitungan daya pembedakelompok kecil dengan
kelompokbesar. Terlebih dahulu kita menetapkansampel yang mewakili
kelompokpandai dan sampel yang mewakilikelompok kurang pandai,
tetapisebelumnya data telah diurutkan daripeserta didik yang memperoleh
hasil yang tinggi ke peserta didik yangmemproleh hasil yang
buruk.Kemudian sampel kelompok kecildapat diambil 50% dari populasi
untukkelompok pandai dan kelompokkurang pandai, sedangkan untuk
kelompok besar masing-masingkelompok pandai dan kelompokkurang
pandai diambil 27% daripopulasi sehingga kelompok sedangsebanyak
54% dari populasi.
Daya Pembeda Butir Soal

viii
Teknik analisis data untuk daya pembeda berupa pilihan ganda dapat
dihitung dengan rumus:
JB α −JB b
DP¿
n
Dengan:
DP = Indeks Pembeda soal
JBA = Jumlah peserta didik kelompok atas yang menjawab soal itu
benar
JBB = Jumlah peserta didik kelompok bawah yang menjawab soal itu
benar
n = Persentase perbandingan ukuran kelompok.
(Nitko, 2011:304)
Daya pembeda untuk soal uraian dapat dihitung denganrumus;
x kelompok atas−x kelompok bawah
DP=
skor maksimum soal
Nitko, 2011:304)
Setelah dilakukan perhitungan, maka butir soal dikategorikan
menjadi butir soal yang diterima, direvisi, dan ditolak. Hal itu bergantung
koefisien daya pembedanya. Jika ada soal yang ditolak, maka dapat
dibuang atau diganti dengan butir soal yang baru. Perhatikan Tabel
berikut:
Kriteria Koefisian Keputusan
Daya pembeda ¿ 0,30 Diterima
0,10s . d 0,29 Direvisi
¿ 0,10 Ditolak

C. Keberfungsian Distraktor/pengecoh
Tes bentuk pilihan ganda terstruktur atas item permasalahan yang
ditanyakan (atau pokok soal) dan option (atau sejumlah kemungkinan
jawaban). Option sendiri dibagi menjadi dua, yaitu kunci jawaban dan
pengecoh. Ini berarti, dari sekian jawaban yang disediakan hanya terdapat
satu jawaban yang tepat yang disebut kunci jawaban, sedangkan
kemungkinan jawaban yang lain (jawaban yang tidak benar) disebut

ix
pengecoh/distraktor. Seseorang yang membuat soal pilihan ganda, terkadang
ia tidak mudah untuk membuat pengecohnya. Kecilnya angka daya pembeda
seringkali muncul karena pengecoh yang kurang berfungsi (Surapranata,
2009: 47).
Salah satu tujuan analisis distraktor adalah untuk memeriksa berapa
banyak siswa pada kelompok atas dan kelompok bawah yang memilih tiap-
tiap jawaban pada tes pilihan ganda. Oleh karena itu, dalam hal ini memuat
dua pertanyaan. Pertama, apakah distraktor mengalihkan perhatian dari
beberapa peserta tes? Jika tidak ada peserta tes memilih distraktor, ini berarti
distraktor tidak berfungsi. Jika distraktor begitu jelas menyatakan sebagai
jawaban tidak benar pada suatu tes namun tidak ada peserta tes yang memilih
distraktor tersebut, berarti bahwa distraktor tersebut perlu direvisi atau
diganti. Pertanyaan kedua, apakah distraktor yang dibuat menarik lebih
banyak dipilih oleh peserta tes kelompok bawah dari pada pada kelompok
atas? Jika ya, berarti distraktornya baik. Distraktor atau pengecoh berfungsi
sebagai pengidentifikasi peserta tes yang berkemampuan tinggi. Pengecoh
dikatakan berfungsi efektif jika banyak dipilih oleh peserta tes dari kelompok
bawah, sebaliknya jika banyak dipilih oleh kelompok atas, maka
distraktor/pengecoh tersebut tidak berfungsi sebagaimana mestinya.

D. Pengenalan Rasch

Georg Rasch mengembangkan satu model analisis dari teori respon


butir (atau Item Response Theory, IRT) pada tahun 1960-an biasa disebut
1PL (satu parameter logistic) (Olsen, 2003). Model matematika ini kemudian
dipopulerkan oleh Ben Wright (Linacre, 2011). Dengan data mentah berupa
data dikotomi (berbentuk benar dan salah) yang mengindikasikan
kemampuan siswa, Rasch memformulasikan hal ini menjadi satu model yang
menghubungan antara siswa dan aitem (Sumintono & Widhiarso, 2013).
Sebagai ilustrasi, seorang siswa yang mampu mengerjakan 80% soal dengan
benar tentu mempunyai abilitas yang lebih baik dari siswa lain yang hanya

x
bisa mengerjakan 65% soal. Data tersebut (persentase) menunjukkan bahwa
data mentah yang diperoleh tidak lain adalah jenis data ordinal yang
menunjukkan peringkat dan tidak linier (Linacre, 1999; Mohd Saidfudin
Masodi, tanpa tahun).
Oleh karena data ordinal tidak mempunyai interval yang sama, maka
data tersebut perlu diubah menjadi data rasio untuk keperluan analisis
statistik. Sehingga bila seseorang mendapat skor 80%, maka nilai odds ratio-
nya adalah 80:20, yang tidak lain adalah data rasio yang lebih tepat untuk
tujuan pengukuran. Melalui data rasio ini Rasch mengembangkan model
pengukuran yang menentukan hubungan antara tingkat kemampuan siswa
(person ability) dan tingkat kesulitan aitem (item difficulty) dengan
menggunakan fungsi logaritma untuk menghasilkan pengukuran dengan
interval yang sama. Hasilnya adalah satuan baru yang disebut logit (log odds
unit) yang menunjukkan abilitas siswa dan kesulitan aitem; sehingga nantinya
dari nilai logit yg didapat, disimpulkan bahwa tingkat kesuksesan siswa
dalam Model Rasch Georg Rasch mengembangkan satu model analisis dari
teori respon butir (atau Item Response Theory, IRT) pada tahun 1960-an
biasa disebut 1PL (satu parameter logistic) (Olsen, 2003). Model matematika
ini kemudian dipopulerkan oleh Ben Wright (Linacre, 2011). Dengan data
mentah berupa data dikotomi (berbentuk benar dan salah) yang
mengindikasikan kemampuan siswa, Rasch memformulasikan hal ini menjadi
satu model yang menghubungan antara siswa dan aitem (Sumintono &
Widhiarso, 2013). Sebagai ilustrasi, seorang siswa yang mampu mengerjakan
80% soal dengan benar tentu mempunyai abilitas yang lebih baik dari siswa
lain yang hanya bisa mengerjakan 65% soal. Data tersebut (persentase)
menunjukkan bahwa data mentah yang diperoleh tidak lain adalah jenis data
ordinal yang menunjukkan peringkat dan tidak linier (Linacre, 1999; Mohd
Saidfudin Masodi, tanpa tahun).
Oleh karena data ordinal tidak mempunyai interval yang sama, maka
data tersebut perlu diubah menjadi data rasio untuk keperluan analisis
statistik. Sehingga bila seseorang mendapat skor 80%, maka nilai odds ratio-

xi
nya adalah 80:20, yang tidak lain adalah data rasio yang lebih tepat untuk
tujuan pengukuran. Melalui data rasio ini Rasch mengembangkan model
pengukuran yang menentukan hubungan antara tingkat kemampuan siswa
(person ability) dan tingkat kesulitan aitem (item difficulty) dengan
menggunakan fungsi logaritma untuk menghasilkan pengukuran dengan
interval yang sama. Hasilnya adalah satuan baru yang disebut logit (log odds
unit) yang menunjukkan abilitas siswa dan kesulitan aitem;sehingga nantinya
dari nilai logit yg didapat, disimpulkan bahwa tingkat kesuksesan siswa
dalam mengerjakan soal sangat tergantung dari tingkat abilitasnya dan tingkat
kesulitan soal (Olsen, 2003). Untuk data yang berbentuk dikotomi,
pemodelan Rasch menggabungkan suatu algoritma yang menyatakan hasil
ekspektasi probabilistik dari aitem ‘i’ dan responden ‘n’, yang secara
matematis dinyatakan sebagai (Bond dan Fox, 2007)dimana: Pni(xni=1 /βn ,
δi ) adalah probilitas dari responden n dalam aitem i untuk menghasilkan
jawaban betul (x = 1); dengan kemampuan responden, βn, dan tingkat
kesulitan aitem δi. Persamaan di atas dapat lebih disederhanakan dengan
memasukkan fungsi logaritma danmenjadikannya:
log (Pni (Xni = 1 / βn, δi)) = βn – δi

BAB III
PENUTUP
A. Kesimpulan

xii
Indeks kesukaran, daya pembeda dan pengecoh (distraktor) merupakan
hal yang penting yang harus diperhatikan oleh peneliti agar instrumen yang
dibuat menjadi baik, sehingga bisa digunakan dalam dan menghasilkan data
yang baik pula.1) Validitas terbagi menjadi validitas isi dan konstruk.
Validitas isi ditentukan oleh nilai V, sedangkan validitas konstruk ditentukan
oleh nilai KMO. 2) Reliabilitas instrumen ditentukan oleh nilai cronbach’s
alfa. 3) Tingkat kesukaran butir soal ditentukan oleh nilai koefisienp. 4) Daya
pembeda butir soal ditentukan oleh koefisien DB. 5) Distraktor/pengecoh
ditentukan oleh persentase pemlilihan dari peserta tes. Jika nilai atau
persentase dari kelima hal ini berada pada kategori baik, maka instrumen
yang dibuat peneliti memiliki kriteria yang baik

DAFTAR PUSTAKA
Basuki, I., & Hariyanto. (2014). Asesemen pembelajaran. Bandung: PT.
Remaja Rosdakarya.

xiii
Cohen, L., Manion, L., & Morrison, K. (2007). Research methods in
education. New York: Routledge.
Depdiknas. (2008). Panduan penulisan butir soal. Jakarta: Direktoral Jenderal
Manajemen Pendidikan Dasar dan Menengah. Direktoral Pembinaan Sekolah
Menengah Atas.
Setyosari, P. (2013). Metode penelitian pendidikan & pengembangan.
Jakarta: Prenadamedia group.
Surapranata, S. (2009). Analisis, validitas, reliabilitas, dan interpretasihasil
tes implementasi kurikulum 2004. Bandung: PT. Remaja Rosdakarya.

xiv

Anda mungkin juga menyukai