Dosen Pengampu :
Drs. I Ketut Widiada, M.Pd., dan Hasnawati, M.Pd.
KELOMPOK 3:
1. Maria Ulfa (E1E019201)
2. Maul Hayati (E1E019203)
3. Mutmainnah (E1E019216)
4. Nawafila Imami (E1E019221)
5. Nila Ulfiani Saputri (E1E019226)
6. Nini Fitriani (E1E019229)
KELAS 4F
PROGRAM STUDI S1 PENDIDIKAN GURU SEKOLAH DASAR
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS MATARAM
2021
KATA PENGANTAR
Puji syukur kehadirat Allah SWT yang telah memberikan rahmat dan hidayah-
Nya sehingga kami dapat menyelesaikan tugas makalah ini tepat pada waktunya.
Adapun tujuan dari penulisan dari makalah ini adalah untuk memenuhi
tugas pada mata kuliah Evaluasi Hasil Pembelajaran. Selain itu, makalah ini juga
bertujuan untuk menambah wawasan tentang analisis dan interpretasi hasil tes bagi para
pembaca dan juga bagi penulis.
Kami menyadari, makalah yang kami tulis ini masih jauh dari kata sempurna.
Oleh karena itu, kritik dan saran yang membangun akan kami nantikan demi
kesempurnaan makalah ini.
Kelompok 3
i
DAFTAR ISI
COVER
KATA PENGANTAR.......................................................................................................i
DAFTAR ISI......................................................................................................................ii
BAB 1 : PENDAHULUAN................................................................................................1
A. Latar Belakang.......................................................................................................1
B. Rumusan Masalah.................................................................................................2
C. Tujuan.....................................................................................................................2
BAB II : PEMBAHASAN.................................................................................................3
A. Kesimpulan.............................................................................................................13
B. Saran ......................................................................................................................13
DAFTAR PUSTAKA........................................................................................................14
C.
ii
BAB I
PENDAHULUAN
A. Latar Belakang
Penilaian dilakukan oleh guru terhadap hasil pembelajaran untuk mengukur
tingkat pencapaian kompetensi peserta didik. Hasil penilaian digunakan memperbaiki
proses pembelajaran dan sebagai bahan penyusunan laporan kemajuan hasil belajar.
Penilaian hasil pembelajaran menggunakan Standar Penilaian Pendidikan. penilaian
dilakukan secara konsisten, sistematik, dan terprogram dengan menggunakan tes dan
nontes dalam bentuk tertulis atau lisan, pengamatan kerja, pengukuran sikap, penilaian
hasil karya berupa tugas, proyek atau produk, portofolio, dan penilaian diri.
Setelah tes dilaksanakan da diperoleh hasilnya, sangat bermanfaat jika tes tersebut
dinilai keefektivannya. Menilai keefektivan dapat dilakukan dengan menganalisis
jawaban (analisis soal). Analisis soal dapat memberikan informasi tentang keefektivan
fungsi masing-masing soal.
Prosedur analisis soal untuk tes yang beracuan norma dapat memberikan
informasi tentang 1) tingkat kesukaran soal, 2) daya diskriminasi soal, 3) keefektivan
setiap alternatif jawaban. Disamping itu analisis soal juga dapat memberikan petunjuk
adanya kesalahan rumusan soal yang bermanfaat untuk memperbaikinya.
Adapun Salah satu tujuan dilakukannya Analisis adalah untuk meningkatkan
kualitas soal yaitu apakah suatu soal (1) Dapat diterima karena telah didukung oleh data
statistik yang memadai, (2) Diperbaiki, karena terbukti terdapat beberapa kelemahan atau
bahkan (3) Tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi
sama sekali. Oleh sebab itu dalam hal ini diperlukannya suatu analisis soal yang nantinya
akan menjadi acuan sebagaimana kita harus mengetahui bagaimana langkah-langkah
yang diharapkan untuk menganalisis suatu butir soal.
Meskipun soal-soal tidak akan digunakan lagi, analisis soal juga bermanfaat untuk
bahan diskusi hasil tes, misalnya soal-soal yang mudah tidak didiskusikan, soal yang
sukar diberi porsi waktu yang lebih banyak. Hasil analisis soal juga dapat digunakan
untuk memperbaiki proses belajar mengajar. Seringnya seorang siswa memilih jawaban
yang salah, menunjukkan adanya kesalahan konsep atau kesalahan umum yang dapat
dipergunakan sebagai dasar pengembangan program remedial. Hasil analisis dapat
1
memberikan gambaran tentang keterampilan guru merumuskan soal dan dapat digunakan
sebagai pegangan untuk dapat merumuskan soal secara lebih baik.
B. Rumusan Masalah
1. Bagaimana cara menentukan daya beda dan tingkat kesukaran tes?
2. Bagaimana interpretasi hasil tes?
C. Tujuan Penulisan
1. Untuk mengetahui cara menentukan daya beda dan tingkat kesukaran tes
2. Untuk mengetahui interpretasi hasil tes
2
BAB II
PEMBAHASAN
A. Menentukan Daya Beda dan Tingkat Kesukaran Tes
1. Daya Beda
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa
yang pandai (berkemampuan tinggi) dengan siswa yang kurang pintar
(berkemampuan rendah). Angka yang menunjukkan besarnya daya pembeda disebut
indeks diskriminasi, disingkat (d besar). Angka yang menunjukkan besarnya daya
beda disebut Indeks Diskriminasi berkisar antara 0,00 sampai 1,00. Akan tetapi pada
indeks diskriminasi ini mengenal/ ada tanda negatif (-) yakni -1,0 ------------0,0----
------1,0 (semakin ke kanan soal semakin baik, semakin ke kiri maka soal semakin
jelek, sebab semakin ke kanan siswa yang pandai semakin sulit/tidak bisa menjawab
dan sebaliknya siswa yang kurang pintar (kiri) bisa menjawab dengan asal-asalan).
Rumus:
Dalam kegiatan analisis kualitas tes dan butir soal terdapat manfaat daya pembeda
butir soal sebagaimana kami kutip berdasarkan pendapat Karjono Natar berikut ini.
3
1. Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan
indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik,
direvisi, atau ditolak.
2. Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan
kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami
materi yang diajarkan guru. Apabila suatu butir soal tidak dapat membedakan
kedua kemampuan siswa itu, maka butir soal itu dapat dicurigai
“kemungkinannya” seperti berikut ini: (a) kunci jawaban butir soal itu tidak tepat;
(b) butir soal itu memiliki 2 (dua) atau lebih kunci jawaban yang benar; (c)
kompetensi yang diukur tidak jelas; (d) pengecoh tidak berfungsi; (e) materi yang
ditanyakan terlalu sulit, sehingga banyak siswa yang menebak; (f) sebagian besar
siswa yang memahami materi yang ditanyakan berpikir ada yang salah informasi
dalam butir soalnya.
Butir soal tes yang baik juga harus dapat menunjukan daya pembedanya.
Sebagaimana penuturan Arikunto di atas, “daya beda adalah kemampuan suatu soal
untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa
yang kurang (berkemampuan rendah).” Menurut Anastasi dan Urbina dalam
Purwanto, daya beda berhubungan dengan derajad kemampuan butir membedakan
dengan baik prilaku pengambil tes dalam tes yang dikembangkan. Soal dapat
dikatakan mempunyai daya pembeda jika soal tersebut dapat dijawab oleh siswa
berkemampuan tinggi dan tidak dapat dijawab oleh siswa berkemampuan rendah. Jika
suatu soal dapat dijawab oleh siswa pintar maupun kurang, berarti soal tersebut tidak
mempunyai daya beda, demikian juga jika soal tersebut tidak dapat dijawab oleh
siswa pintar dan siswa kurang, berarti soal tersebut tidak baik sebab tidak mempunyai
daya pembeda.
2. Tingkat Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal
yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha
memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa
menjadi putus asa dan tidak mempuyai semangat untuk mencoba lagi karena di luar
jangkauannya. Adapun bilangan yang menunjukkan sukar dan mudahnya sesuatu soal
4
disebut indeks kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00
sampai dengan 1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal
dengan indeks kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, sebaliknya
indeks 1,0 menunjukkan bahwa soalnya terlalu mudah. Dalam istilah evaluasi, indeks
kesukaran ini diberi simbol (p besar), singkatan dari kata “proporsi”. Dengan
demikian maka soal dengan = 0,70 lebih mudah jika dibandingkan dengan = 0,20.
Sebaliknya soal dengan = 0,30 lebih sukar daripada soal dengan P = 0,80. Menurut
ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai
berikut:
1) soal dengan P = kurang dari 0,30 adalah soal terlalu sukar;
2) soal dengan ~ = 0,30 s/d 0,70 adalah soal cukup (sedang);
3) soal dengan P = lebih dari 0,70 adalah soal terlalu mudah.
6
2. Jenis Interpretasi Tes
Ada dua jenis interpretasi tes yaitu :
a. Interpretasi Kelompok
Interpretasi kelompok adalah penafsiran yang dilakukan untuk mengetahui karakteristik
kelompok berdasarkan data hasil evaluasi, antara lain prestasi kelompok, rata-rata
kelompok, sikap kelompok terhadap guru dan mata pelajaran yang diberikan, dan
distribusi nilai kelompok. Tujuannya adalah sebagai berikut :
- Sebagai persiapan untuk melakukan penafsiran kelompok.
- Untuk mengetahui sifat-sifat tertentu pada suatu kelompok.
- Untuk mengadakan perbandingan antarkelompok.
b. Interpretasi Individual
Interpretasi individual adalah penafsiran yang hanya tertuju kepada individu saja.
Tujuannya adalah sebagai berikut :
- Untuk melihat tingkat kesiapan siswa (readiness).
- Pertumbuhan dan kemajuan siswa.
- Kesulitan-kesulitan yang dihadapinya.
1. Penafsiran secara individual
Penafsiran ini meliputi, antara lain:
a. Penafsiran tentang kelemahan
Yang dimaksud penafsiran kelemahan di sini adalah penafsiran tentang, pada sub-
sub tes mana dari suatu mata pelajaran seorang siswa menunjukkan kelemahan.
Apakah dalam menguraikan (pemahaman), penerapan (aplikasi) rumus atau konsep,
analisis, sintesis. Atau, pada mata pelajaran apa, seorang siswa menunjukkan
kelemahan, dari sekian banyak mata pelajaran yang diteskan. Jika dalam mata
pelajaran Matematika dan Bahasa Ingris misalnya, seorang siswa mendapat nilai
rendah maka dapat ditafsirkan bahwa dalam kedua bidang studi tersebut seorang
siswa mempunyai kelemahan.
b. Penafsiran tentang pertumbuhan
Penafsiran pertumbuhan maksudnya adalah penafsiran tentang kemajuan yang telah
dicapai oleh siswa dalam suatu periode pendidikan. Untuk mengetahui ada tidaknya
7
pertumbuhan (kemajuan) atau seberapa jauh kemajuan yang dicapai oleh seorang
siswa, dapat dilakukan dengan jalan membandingkan prestasi yang dicapai oleh
siswa tersebut dengan prestasi sebelumnya. Jika prestasi yang dimiliki -berdasarkan
nilai yang diperoleh- saat ini lebih baik dibanding dengan prestasi sebelumnya maka
siswa tersebut dapat dikatakan mengalami kemajuan. Sebaliknya, jika prestasi yang
dimiliki saat ini lebih jelek dibanding dengan prestasi sebelumnya maka siswa
tersebut dapat dikatakan mengalami kemunduran dalam belajar.
c. Penafsiran tentang kesiapan
Berbeda dengan dua penafsiran sebelumnya yang dapat dilakukan terhadap setiap
tes, penafsiran kesiapan ini hanya bagi hasil tes akhir (tes sumatif) saja, yaitu setelah
dilakukan penjumlahan terhadap hasil tes-tes formatif atau sub sumatif sebelumnya.
Dari nilai akhir inilah, kita dapat menafsirkan apakah seorang siswa sudah layak
(siap) untuk dinaikkan ke kelas yang lebih tinggi (atau dilepas) atau belum. Langkah
yang harus dilakukan dalam hal itu adalah dengan membandingkan nilai akhir
tersebut dengan norma tertentu yang telah ditetapkan. Yaitu batas minimal yang
harus dicapai untuk dapat mengikuti taraf pendidikan yang lebih tinggi atau untuk
dilepas.
2. Penafsiran Klaksikal
Penafsiran klasikal ini meliputi 4 jenis:
a. Penafsiran tentang kelemahan-kelemahan kelas
Sebagaimana dalam penafsiran individual, yang dimaksud penafsiran kelemahan di
sini adalah penafsiran terhadap, pada bagian mana dari suatu mata pelajaran atau
pada mata pelajaran apa dari seluruh mata pelajaran, suatu kelas menunjukkan
kelemahan.
b. Penafsiran tentang prestasi kelas
Penafsiran tentang prestasi kelas adalah penafsiran tentang, bagaimana prestasi anak
secara klasikal terhadap bahan evaluasi yang kita berikan.
c. Penafsiran tentang perbandingan kelas
Penafsiran tentang perbandingan antar kelas adalah penafsiran yang digunakan untuk
membandingkan antara kelas yang satu dengan kelas yang lain (yang paralel) tentang
prestasi yang diperoleh.
8
d. Penafsiran tentang susunan kelas
Penafsiran tentang susunan kelas adalah penafsiran yang digunakan untuk
mengetahui kondisi kelas. Apakah kelas yang kita kelola merupakan kelas yang
hiterogen, normal atau homogen.
Pedoman yang digunakan untuk mengetahui kondisi kelas adalah:
1) jika kelas terdiri dari siswa-siswa yang taraf kepandaiannya menunjukkan
perbedaan yang besar maka kelas tersebut dikatakan heterogen.
2) jika kelas terdiri dari siswa-siswa yang taraf kepandaiannya memberikan
gambaran seperti kurva normal, maka kelas tersebut merupakan kelas yang normal.
3) jika kelas terdiri dari siswa-siswa yang taraf kepandaiannya tidak terlalu beda
maka kelas tersebut dikatakan homogen.
9
1. Penilaian Acuan Normatif digunakan untuk menentukan status setiap peserta
didik terhadap kemampuan peserta didik lainnya. Artinya, Penilaian Acuan
Normatif digunakan apabila kita ingin mengetahui kemampuan peserta didik di
dalam komunitasnya seperti di kelas, sekolah, dan lain sebagainya.
2. Penilaian Acuan Normatif menggunakan kriteria yang bersifat “relative”. Artinya,
selalu berubah-ubah disesuaikan dengan kondisi dan atau kebutuhan pada waktu
tersebut.
3. Nilai hasil dari Penilaian Acuan Normatif tidak mencerminkan tingkat
kemampuan dan penguasaan siswa tentang materi pengajaran yang diteskan,
tetapi hanya menunjuk kedudukan peserta didik (peringkatnya) dalam
komunitasnya (kelompoknya).
4. Penilaian Acuan Normatif memiliki kecendrungan untuk menggunakan rentangan
tingkat penguasaan seseorang terhadap kelompoknya, mulai dari yang sangat
istimewa sampai dengan yang mengalami kesulitan yang serius.
5. Penilaian Acuan Normatif memberikan skor yang menggambarkan penguasaan
kelompok.
10
dikuasainya dapat dikembangkan. Guru dan setiap peserta didik (siswa) mendapat
manfaat dari adanya PAP.
Hasil PAP merupakan umpan balik yang dapat digunakan guru sebagai
introspeksi tentang program pembelajaran yang telah dilaksanakan. Hasil PAP dapat
membantu guru dalam pengambilan keputusan tentang perlu atau tidaknya penyajian
ulang topik/materi tertentu. Hasil PAP dapat pula membantu guru merancang
pelaksanaan program remidi.
Melalui PAP berkembang upaya untuk meningkatkan kualitas pembelajaran
dengan melaksanakan tes awal (pre test) dan tes akhir (post test). Perbedaan hasil tes
akhir dengan test awal merupakan petunjuk tentang kualitas proses pembelajaran.
Pembelajaran yang menuntut pencapaian kompetensi tertentu sebagaimana
diharapkan dan termuat pada kurikulum saat ini, PAP merupakan cara pandang yang
harus diterapkan.
PAP juga dapat digunakan untuk menghindari hal-hal yang tidak diinginkan,
misalnya kurang terkontrolnya penguasaan materi, terdapat siswa yang diuntungkan
atau dirugikan, dan tidak dipenuhinya nilai-nilai kelompok berdistribusi normal. PAP
ini menggunakan prinsip belajar tuntas (mastery learning).
1. Penilaian acuan norma dan acuan patokan memerlukan adanya tujuan evaluasi
spesifik sebagai penentuan fokus item yang diperlukan. Tujuan tersebut termasuk
tujuan intruksional umum dan tujuan intruksional khusus
2. Kedua pengukuran memerlukan sample yang relevan, digunakan sebagai subjek
yang hendak dijadikan sasaran evaluasi. Sample yang diukur mempresentasikan
populasi siwa yang hendak menjadi target akhir pengambilan keputusan.
11
3. Untuk mandapatkan informasi yang diinginkan tenyang siswa, kedua pengukuran
sama-sama nenerlukan item-item yang disusun dalam satu tes dengan
menggunakan aturan dasar penulisan instrument.
4. Keduanya mempersyaratkan perumusan secara spesifik perilaku yang akan
diukur.
5. Keduanya menggunakan macam tes yang sama seperti tes subjektif, tes karangan,
tes penampilan atau keterampilan.
6. Keduanya dinilai kualitasnya dari segi validitas dan reliabilitasnya.
7. Keduanya digunakan ke dalam pendidikan walaupun untuk maksud yang berbeda.
12
BAB III
PENUTUP
A. Kesimpulan
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara
siswa yang pandai (berkemampuan tinggi) dengan siswa yang kurang pintar
(berkemampuan rendah). Angka yang menunjukkan besarnya daya pembeda disebut
indeks diskriminasi, disingkat (d besar).
Pada dasarnya interpretasi terdiri dari kegiatan memberikan suatu kerangka
referensi yang lain atau mengemukakan suatu bahasa lain bagi sejumlah observasi
atau tingkah laku.
Untuk menginterpretasikan hasil tes, dapat dilakukan melalui dua cara, yaitu
penilaian acuan norma (PAN) dan Penilaian acuan patokan (PAP)
B. Saran
Penulis menyadari dalam penulisan makalah mengenai analisis dan interpretasi
hasil tes masih jauh dari kata sempurna sehingga penulis mengharapkan kritik dan
saran yang bersifat membangun agar penulis bisa memperbaiki makalah menjadi
lebih baik.
13
DAFTAR PUSTAKA
Solichin, Mujianto. 2017. Analisis Daya Beda Soal, Taraf Kesukaran, Validitas Butir Tes,
Interpretasi Hasil Tes Dan Validitas Ramalan Dalam Evaluasi Pendidikan. DIRĀSĀT:
Jurnal Manajemen & Pendidikan Islam. 2(2). Hal 192-213
Syahputra, Abil Thoriq, dkk. Pemberian Skor Dan Sistem Penilaian Dalam Pembelajaran.
Akses online
https://files.osf.io/v1/resources/e49yg/providers/osfstorage/60160eeac5784b0410d02db5?
format=pdf&action=download&direct&version=1. Pada hari Selasa, 4 Mei 2021.
Buana, Wira. 2011. Penilaian Acuan Norma (PAN) Dan Penilaian Acuan Patokan (PAP). Akses online
PENILAIAN ACUAN NORMA (PAN) DAN PENILAIAN ACUAN PATOKAN (PAP)
« lentera wira buana (wordpress.com). Pada hari Selasa, 4 Mei 2021
14