Buku Evaluasi Pembelajaran Matematika
Buku Evaluasi Pembelajaran Matematika
BUKU AJAR
EVALUASI PEMBELAJARAN MATEMATIKA
i
BUKU AJAR
EVALUASI PEMBELAJARAN MATEMATIKA
ISBN: 978-623-7004-07-3
iii
s BerpikirKausalitas…
PRAKATA
iv
s BerpikirKausalitas…
DAFTAR ISI
Halaman
HALAMAN JUDUL ...................................................................................... i
HALAMAN BALIK JUDUL ........................................................................ ii
UCAPAN TERIMA KASIH ......................................................................... iii
PRAKATA ...................................................................................................... iv
DAFTAR ISI ................................................................................................... v
BAB 1 PENDAHULUAN .......................................................................... 1
A. Pengertian Evaluasi ................................................................... 1
B. Tujuan Evaluasi Pembelajaran .................................................. 3
C. Fungsi Evaluasi Pembelajaran................................................... 4
D. Manfaat Evaluasi Pembelajaran dalam Pendidikan .................. 7
BAB 2 PENGUKURAN, PENILAIAN, DAN EVALUASI .................. 11
A. Pengukuran ................................................................................ 11
B. Penilaian .................................................................................... 12
C. Evaluasi ..................................................................................... 12
D. Hubungan antara Evaluasi, Pengukuran dan Penilaian ............. 13
E. Prinsip Evaluasi Pembelajaran ................................................. 14
BAB 3 RUANG LINGKUP EVALUASI PEMBELAJARAN .............. 18
A. Kerangka Dasar Evaluasi Pembelajaran.................................... 18
B. Ruang Lingkup Evaluasi Pembelajaran dalam Perseptif
Domain Hasil Belajar ................................................................ 19
C. Keterampilan Berpikir Tingkat Tinggi dan Rendah .................. 26
BAB 4 JENIS DAN TEKNIK PENILAIAN ............................................ 28
A. Jenis Evaluasi Pembelajaran...................................................... 28
B. Teknik Penilaian ........................................................................ 30
C. Teknik Penilaian Melalui Tes.................................................... 31
D. Teknik Penilaian Melalui Non Tes ............................................ 40
v
s BerpikirKausalitas…
vi
BAB PENDAHULUAN
1
Kemampuan Akhir
Setelah mempelajari bab ini, mahasiswa dapat menjelaskan
pengertian, tujuan, fungsi, dan manfaat evaluasi dalam pembelajaran
A. Pengertian Evaluasi
Istilah evaluasi berasal dari bahasa Inggris yaitu
Evaluation.Evaluasi berarti penilaian (Kamus Besar Bahasa Indonesia,
1996).Pengertian evaluasi menurut beberapa ahli dapat disarikan
sebagai berikut.
1. Evaluation refer to the act or process to determining the value of
something (Wandt& Brown, 1977). Artinya evaluasi mengandung
pengertian suatu tindakan atau suatu proses untuk menentukan
nilai dari sesuatu.
2. Evaluation is a handbook on formative and summative evaluation of
student learning (Benyamin S. Bloom). Artinya evaluasi adalah
Rencana
Pembelajaran
Pelaksanaan
Umpan Balik
Pembelajaran
Penilaian
Go to Chapter 2
Kemampuan Akhir
Setelah mempelajari bab ini, mahasiswa dapat membedakan
pengertian pengukuran, penilaian, dan evaluasi dalam pembelajaran
A. Pengukuran
Pengukuran adalah proses untuk menghasilkan deskripsi
kuantitatif. Pengukuran dapat dipandang sebagai kegiatan
membandingkan sesuatu dengan ukuran tertentu dan bersifat
kuantitatif (dalam bentuk angka). Menurut Cangelosi (1995)
pengukuran atau measurement merupakan suatu proses atau kegiatan
untuk menentukan kuantitas sesuatu yang bersifat numerik.
Pengukuran lebih bersifat kuantitatif, bahkan merupakan instrumen
EVALUASI PEMBELAJARAN MATEMATIKA 11
untuk melakukan penilaian. Khususnya dalam dunia pendidikan,
yang dimaksud pengukuran adalah proses pengumpulan data
melalui pengamatan empiris.
Contoh hasil pengukuran meliputi: (1) skor tes kemampuan
menyelesaikan soal-soal matematika pokok bahasan himpunan
adalah 85, (2) skor tes kemampuan pemahaman hubungan antar
konsep segiempat adalah 78, (3) skor persepsi siswa terhadap
pembelajaran matematika menggunakan alat peraga adalah 130, dan
lain-lain.
B. Penilaian
Penilaian adalah proses untuk menghasilkan deskripsi
kualitatif (dalam bentuk kategori atau kata-kata). Penilaian dapat
dipandang sebagai kegiatan mengambil keputusan untuk
menentukan sesuatu berdasarkan kriteria baik atau buruk dan
bersifat kualitatif.
Contoh hasil penilaian meliputi: (1) nilai matematika seseorang
adalah A, (2) kemampuan pemahaman konsep geometri seseorang
dalam kategori baik, (3) nilai akreditasi program studi pendidikan
matematika adalah B, dan lain-lain.
C. Evaluasi
Evaluasi merupakan proses sistematis untuk untuk
menentukan tingkat pencapaian suatu kegiatan berdasarkan kriteria
tertentu. Hasil evaluasi sangat terkait dengan hasil pengukuran dan
penilaian yang dilakukan oleh pihak lain. Stufflebeam et al. (1971)
mendefinisikan evaluasi sebagai “the process of delineating, obtaining,
Go to Chapter 3
Kemampuan Akhir
Setelah mempelajari bab ini, mahasiswa dapat menguraikan ruang
lingkup evaluasi pembelajaran
2. Ranah Afektif
Ranah afektif adalah ranah yang berkaitan dengan sikap dan
nilai. Ranah afektif merupakan internalisasi sikap yang menuju kea
rah pertumbuhan batiniah, dimana peserta didik sadar untuk
menerima suatu nilai atau norma, kemudian mengambil sikap
3. Ranah Psikomotor
Ranah psikomotor merupakan kemampuan peserta didik yang
berkaitan dengan gerakan tubuh atau bagian-bagiannya, mulai dari
gerakan sederhana sampai kompleks. Ranah psikomotor dapat
dikelompokkan menjadi tiga, yaitu
1) Keterampilan motorik, dengan kata kerja operasional meliputi:
mempertontonkan gerakan, menunjukkan hasil, melompat,
menggerakkan, dan menampilkan.
2) Keterampilan memanipulasi objek atau material, dengan kata
kerja operasional meliputi: mereparasi, menyusun,
membersihkan, menggeser, memindahkan, dan membentuk.
3) Keterampilan koodinasi otak, dengan kata kerja operasional
meliputi: mengamati, menerapkan, menghubungkan,
menggandeng, memadukan, memasang, memotong, menarik,
dan menggunakan.
Go to Chapter 4
Kemampuan Akhir
Setelah mempelajari bab ini, mahasiswa dapat menjelaskan macam-
macam jenis dan teknik penilaian.
B. Teknik Penilaian
Teknik dan alat penilaian digunakan oleh pendidik untuk
mendapatkan informasi tentang keadaan belajar dan hasil belajar
peserta didik. Penggunaan teknik dan alat penilaian perlu
memperhatikan beberapa hal, yaitu (1) tujuan penilaian, (2) waktu
yang tersedia, (3) sifat tugas yang dikerjakan peserta didik, dan (4)
b. Tes subjektif
Tes subjektif adalah tes pemeriksaan hasil tesnya tidak
hanya ditentukan oleh pekerjaan peserta didik, tetapi juga
dipengaruhi oleh subjektivitas (sudut pandang atau
pemikiran) pemeriksa.Soal tes tipe subjektif adalah bentuk
uraian, yaitu soal yang menuntut peserta didik untuk
menuliskan jawaban secara terurai, rinci, terorganisasi,
Go to Chapter 5
Kemampuan Akhir
Setelah mempelajari bab ini, mahasiswa dapat menilai kualitas suatu
instrumen menggunakan validitas dan reliabilitas.
A. Validitas
Validitas (validity, kesahihan) adalah ketepatan suatu tes
terhadap apa yang diukur. Validitas berkaitan dengan permasalahan
tes yang dimaksudkan untuk mengukur secara tepat sesuatu yang
akan diukur (Nurgiyantoro, 2005). Misalnya suatu tes ditujukan
untuk mengukur kemampuan siswa dalam menyelesaikan persamaan
linier, secara tepat tes tersebut dapat mengukur kemampuan itu,
bukan kemampuan lain, misalkan menyelesaikan pertidaksamaan
linier atau bahkan persamaan kuadrat. Jika suatu tes dimaksudkan
untuk mengukur kemampuan pemecahan masalah, maka tes tersebut
harus dapat mengungkapkan kemampuan tersebut, bukan
EVALUASI PEMBELAJARAN MATEMATIKA 51
kemampuan lain yang menyebabkan bias. Secara singkat dapat
dikatakan bahwa suatu tes dikatakan valid atau sahih apabila tes itu
dapat dengan tepat mengukur apa yang hendak diukur.
Validitas tes dapat dilakukan dari dua segi, yaitu (1) validitas
total dan (2) validitas butir (item).
1. Validitas Total
Validitas total merupakan validitas secara keseluruhan butir
tes atau seperangkat tes. Secara umum, validitas dibedakan menjadi
dua, yaitu validitas teoritis dan validitas empiris.Jenis-jenis validitas
total dapat disajikan dalam Gambar 5.1.
a. Validitas teoritis (rasional)
Validitas teoritis atau rasional adalah validitas yang dilakukan
menggunakan pertimbangan teori dengan analisis rasional atau
menggunakan penalaran logis.Validitas teoritis yang memerlukan
kemampuan teori dan penalaran biasanya dilakukan oleh ahli atau
pakar di bidang yang bersesuaian, hal ini sering disebut dengan
validitas ahli atau expert judgment. Validitas teoritis terbagi dalam
cara, yaitu validitas isi dan validitas konstruk.
Keterangan:
X dan Y : variabel dikotomi yang dikorelasikan
rXY : korelasi antara variabel X dan Y
N : banyak peserta tes
Dalam contoh di atas, X merupakan hasil tes masuk perguruan
tinggi negeri, Y merupakan skor kriteria yang telah ditetapkan
oleh tiap-tiap perguruan tinggi negeri.
2) Melakukan interprestasi terhadap harga koefisien korelasi
product moment yang diperoleh. Ada dua cara dalam
interprestasi ini, yaitu
a) Konsultasikan harga r yang diperoleh dengan untuk
mendapatkan makna menggunakan patokan sebagai berikut.
𝑀𝑝 − 𝑀𝑡 𝑝
𝑟𝑝𝑏𝑖𝑠 =
𝑆𝑡 𝑞
Keterangan:
rpbis : korelasi point biserial
Mp : rata-rata skor dari subjek-subjek yang menjawab benar
butir yang diuji validitasnya
Mt : rata-rata skor total
St : standar deviasi skor total
p : proporsi subjek yang menjawab benar pada butir yang
diuji validitasnya
q : proporsi subjek yang menjawab salah pada butir yang
diuji validitasnya
𝑥𝑖 − 𝑥
𝑆=
𝑁−1
Keterangan:
S = St : standar deviasi atau simpangan baku
N : banyak subjek
xi : nilai dari tiap-tiap subjek ke-i, untuk i = 1, 2, 3, …, N.
𝑥 : rata-rataskor subjek
B. Reliabilitas
Reliabilitas adalah ketetapan suatu tes apabila diteskan pada
subjek yang sama (Arikunto, 2008: 90). Reliabilitas berhubungan
dengan keajegan, ketetapan, atau masalah kepercayaan. Suatu tes
akan menghasilkan kepercayaan yang tinggi apabila tes tersebut
dapat memberikan hasil yang tetap. Jika hasilnya berubah-uabh,
maka perubahan yang terjadi dapat dikatakan tidak signifikan.Hal-
hal yang mempengaruhi reliabilitas adalah (1) panjang tes dan
58 EVALUASI PEMBELAJARAN MATEMATIKA
kualitas butir-butir tes, dan (2) keacakan peserta tes. Semakin panjang
tes dengan kualitas baik akan semakin tinggi reliabilitas. Semakin
acak peserta tes maka akan semakin tinggi reliabilitasnya.
1. Analisis reliabilitas tes bentuk uraian (essay)
Penyekoran tes bentuk uraian tidak menggunakan model
dikotomi (benar diberi skor 1, salah diberi skor 0), namun
penyekorannya lebih bersifat kontinu (rentangan angka, misalnya 0 –
10, atau 0 – 100, atau lainnya). Oleh karenanya analisis reliabilitas tes
bentuk uraian pada umumnya menggunakan rumus Alpha Cronbach
(Arikunto, 2006), yaitu
𝑘 𝜎𝑏2
𝑟11 = 1− 2
𝑘−1 𝜎𝑡
Keterangan
𝑟11 : koefisien reliabilitas
k : banyak butir soal/pertanyaan
𝜎𝑏2 : jumlah varians skor butir i, untuk i = 1, 2, 3, …, k
𝜎𝑡2 : varians total
Go to Chapter 6
Kemampuan Akhir
Setelah mempelajari bab ini, mahasiswa dapat menilai kualitas butir
soal melalui pengukuran daya pembeda, tingkat kesukaran, dan
efektifitas pengecoh.
Angka indeks
Klasifikasi Interpretasi
daya pembeda (D)
Butir item yang bersangkutan
daya pembedanya lemah
Kurang dari 0,20 Poor (jelek) sekali, dianggap tidak
memiliki daya pembeda yang
baik
Butir item yang bersangkutan
Satisfactory
0,20 – 0.40 telah memiliki daya pembeda
(cukup)
yang cukup (sedang)
Butir item yang bersangkutan
0,40 – 0,70 Good (baik) telah memiliki daya pembeda
yang baik
Butir item yang bersangkutan
Excellent (sangat
0,70 – 1,00 telah memiliki daya pembeda
baik)
yang baik sekali
Butir item yang bersangkutan
Bertanda negatif - daya pembedanya negatif
(jelek sekali)
C. Tingkat Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak
terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha pemecahannya. Sebaliknya soal yang terlalu
sukar akan menyebabkan siswa menjadi putus asa dan tidak
mempunyai semangat untuk mencoba lagi karena
diluarjangkauannya. Perhitungan tingkat kesukaran soal adalah
pengukuran seberapa besar derajat kesukaran suatu soal.
Angka yang dapat memberikan petunjuk mengenai tingkat
kesukaran butir soal dikenal dengan istilah difficulty index (indeks
kesukaran). Indeks kesukaran dapat dihitung dengan rumus sebagai
berikut (Arikunto, 2013).
𝐵
P=
𝐽𝑆
Keterangan :
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan
betul
JS = jumlah seluruh siswa peserta tes
Contoh:
Dalam suatu tes matematika, jumlah siswa peserta tes adalah 40
orang.Banyaknya siswa yang menjawab dengan benar tiap-tiap soal adalah
sebagai berikut.
Soal nomor 1 dijawab benar oleh 25 orang
Soal nomor 2 dijawab benar oleh 10 orang
Soal nomor 3 dijawab benar oleh 38 orang
Soal nomor 4 dijawab benar oleh 20 orang
Soal nomor 5 tidak ada yang menjawab dengan benar.
Berdasarkan informasi tersebut dapat dihitung indeks kesukaran (P)
dn kategorinya dari tiap-tiap soal sebagai berikut.
25
P (soal nomor 1) = 40 = 0,625; tingkat kesukarannya sedang,
10
P (soal nomor 2) = 40 = 0,25; tingkat kesukarannya sukar,
38
P (soal nomor 3) = 40 = 0,95; tingkat kesukarannya mudah,
20
P (soal nomor 4) = 40 = 0,5; tingkat kesukarannya sedang,
0
P (soal nomor 5) = 40 = 0; tingkat kesukarannya sukar.
D. Fungsi Pengecoh
Fungsi pengecoh (distractor) atau pola penyebaran jawaban
adalah distribusi peserta didik dalam menentukan pilihan jawaban
pada soal bentuk pilihan ganda. Fungsi distraktor ini diperoleh
dengan menghitung banyaknya peserta didik yang memilih pilihan
jawaban a, b, c, d, dan o, dimana o (singkatan dari omit) adalah
banyaknya peserta didik yang tidak memilih pilihan jawaban
manapun. Dalam soal pilihan ganda, salah satu pilihan jawaban
adalah kunci jawaban, sedangkan pilihan (opsi) yang lainnya adalah
pengecoh.
Tujuan utama dari pemasangan distraktor pada setiap butir
soal adalah untuk menarik perhatian peserta didik memilihnya, meski
bukan kunci jawaban namun peserta didik yang memilihnya
menyangka bahwa distraktor yang mereka pilih itu merupakan
jawaban benar.Jadi mereka terkecoh, menganggap bahwa distraktor
yang terpasang pada item itu sebagai kunci jawaban item, padahal
bukan.Semakin banyak peserta tes yang terkecoh, maka dapat
dikatakan bahwa distraktor yang dipasang itu telah menjalankan
fungsinya. Suatu distraktor pada suatu butir soalmungkin saja “tidak
laku”(maksudnya: semuapeserta testidak tertarik untuk memilih
distraktor tersebut), maka dalam hal ini distraktor tersebut tidak
menjalankan fungsinya dengan baik.Suatu distraktor yang “sangat
laku” (maksudnya dipilih oleh semua peserta), maka distraktor ini
juga tidak baik, sering dikatakan distractor yang “menyesatkan”.
Pilihan
A b* c d o Jumlah
Jawaban
Kelompok 3 15 7 5 0 30
Atas
Kelompok 5 4 8 11 2 30
Bawah
Jumlah 8 19 15 16 2 60
EP 13,3% 31,7% 25% 26,7% 3,3%
Go to Chapter 7
Kemampuan Akhir
Setelah mempelajari bab ini, mahasiswa dapat mengolah hasil belajar
berdasarkan tes buatan sendiri.
A. Teknik Penyekoran
Dalam mengolah hasil evaluasi belajar diawali dengan
melakukan pemeriksaan kelengkapan jawaban peserta didik dan
penyekoran. Penyekoran adalah kegiatan memberikan skor mentah
dari hasil evaluasi dengan menggunakan rumus tertentu berdasarkan
bentuk soalnya. Dalam kegiatan menyekor diperlukan tiga alat bantu,
yaitu kunci jawaban, kunci skoring, dan pedoman konversi.
= ( ( 20 + 16 + 24 + 15 + 30 ) : 15 ) x 10
= ( 105 : 15 ) x 10
= 7 x 10
= 70
= ( ( 18 + 20 + 18 + 24 + 35 ) : 15 ) x 10
= ( 115 : 15 ) x 10
= 7,7 x 10
= 77
= ( ( 20 + 20 + 30 + 30 + 50 ) : 15 ) 10
= ( 150 : 15 ) 10
= 10 x 10
= 100
Rumus : Skor = 𝐵− 𝑆
Keterangan :
D. Konversi skor
Sebelum melakukan konversi skor, terlebih dahulu diolah skor
total adalah jumlah skor yang diperoleh dari seluruh bentuk soal
setelah diolah dengan rumus tebakan (guessing formula)maupun tanpa
rumus tebakan (non guessing formula). Skor ini sering dikenal dengan
skor mentah (raw score). Setelah dihitung skor mentah dari setiap
peserta didik, berikutnya adalah mengolah skor mentah tersebut
menjadi nilai. Pengolahan skor dimaksudkan untuk menetapkan
batas lulus (passing grade) dan untuk mengubah skor mentah menjadi
skor standar. Untuk menentukan batas lulus, terlebih dahulu dihitung
rata-rata (mean) dan simpangan baku(standard deviation), kemudian
mengubah skor mentah menjadi skor standar berdasarkan kriteria
atau norma tertentu.
Konversi skor adalah proses transformasi skor mentah yang
dicapai peserta didik ke dalam skor standar untuk menetapkan nilai
hasil belajar yang diperoleh. Secara konvensional, dalam menentukan