BAB I
Konsep Evaluasi Pendidikan
evaluasi adalah suatu proses yang mencakup pengukuran dan mungkin juga
testing, yang juga berisi pengambilan keputusan tentang nilai. Pendapat ini sejalan
dengan pendapat Arikunto yang menyatakan bahwa evaluasi merupakan kegiatan
mengukur dan menilai. Kedua pendapat di atas secara implisit menyatakan bahwa
evaluasi memiliki cakupan yang lebih luas daripada pengukuran dan testing.
Ralph W. Tyler, yang dikutif oleh Brinkerhoff dkk. Mendefinisikan evaluasi
sedikit berbeda. Ia menyatakan bahwa evaluation as the process of determining to
what extent the educational objectives are actually being realized. Sementara Daniel
Stufflebeam (1971) yang dikutip oleh Nana Syaodih S., menyatakan bahwa
evaluation is the process of delinating, obtaining and providing useful information
for judging decision alternatif. Demikian juga dengan Michael Scriven (1969)
menyatakan evaluation is an observed value compared to some standard.
Sementara itu Asmawi Zainul dan Noehi Nasution mengartikan pengukuran
sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang
dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas,
sedangkan penilaian adalah suatu proses untuk mengambil keputusan dengan
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang
menggunakan tes maupun nontes. Pendapat ini sejalan dengan pendapat Suharsimi
Arikunto yang membedakan antara pengukuran, penilaian, dan evaluasi. Arikunto
menyatakan bahwa mengukur adalah membandingkan sesuatu dengan satu ukuran.
Pengukuran bersifat kuantitatif. Sedangkan menilai adalah mengambil suatu
keputusan terhadap sesuatu dengan ukuran baik buruk. Penilaian bersifat kualitatif.
Hasil pengukuran yang bersifat kuantitatif juga dikemukakan oleh Norman E.
Gronlund (1971) yang menyatakan “Measurement is limited to quantitative
descriptions of pupil behavior”.
2
BAB II
Tujuan Dan Kegunaan Evaluasi Pendidikan
a. Tujuan Evaluasi
Sebagaimana diuraikan pada bagian terdahulu bahwa evaluasi dilaksanakan
dengan berbagai tujuan. Khusus terkait dengan pembelajaran, evaluasi dilaksanakan
dengan tujuan:
1. Mendeskripsikan kemampuan belajar siswa.
2. mengetahui tingkat keberhasilan PBM
3. menentukan tindak lanjut hasil penilaian
4. memberikan pertanggung jawaban (accountability)
b. Fungsi Evaluasi
Sejalan dengan tujuan evaluasi di atas, evaluasi yang dilakukan juga memiliki
banyak fungsi, diantaranya adalah fungsi:
1. Selektif
2. Diagnostik
3. Penempatan
4. Pengukur keberhasilan
Selain keempat fungsi di atas Asmawi Zainul dan Noehi Nasution
menyatakan masih ada fungsi-fungsi lain dari evaluasi pembelajaran, yaitu fungsi:
1. Remedial
2. Umpan balik
3. Memotivasi dan membimbing anak
4. Perbaikan kurikulum dan program pendidikan
5. Pengembangan ilmu
c. Manfaat Evaluasi
Secara umum manfaat yang dapat diambil dari kegiatan evaluasi dalam
pembelajaran, yaitu:
3
BAB III
apabila cara pandang kita seagai siswa sebagai probadi yang utuh, dapat
ditinjau dari beberapa segi yang menghasilkan bermacam-macam bentuk tes yang
digunakan sebagai alat untuk mengukur. Aspek yang bersifat rohani setidaknya
mencangkup 4 hal:
1. Kemampuan
Seorang siswa harus memiliki kemampuan yang sepadan bila ingin
mengikuti program dalam suatu lembaga/sekolah/institusi. Sebagai alat ukur
kemampuan ini adalah attitude test.
2. Kepribadian
Kepribadian adalah sesuatu yang terdapat pada setiap diri manusia dan
dapat dilihat dari tingkah laku. Alat untuk mengetahui kepribadian seseorang
dinamakan personality test.
3. Sikap-sikap
Sikap merupakan bagian dari tingkah laku manusia sebagai gejala atau
gambaran kepribadian yang memancar keluar. Alat untuk mengetahui sikap
seseorang seseorang dinamakan attitude test. Test ini berupa skala yang
disebut attitude scale.
4. Inteligensi
Untuk mengetahui tingkat inteligensi seseorang dapat dilakukan dengan
beberapa tes berupa tes Binet-Simon, SPM, Titum, dan sebagainya. Dari tes
tersebut maka akan diketahui IQ (Intelligence Quotient).
5
Transformasi
Unsur-unsur dalam transformasi yang menjadi objek penilaian
antara lain:
1. Kurikulum/materi,
2. Metode dan cara penilaian,
3. Sarana pendidikan/media,
4. Sistem administrasi,
5. Guru dan personal lainnya.
6
BAB IV
Prosedur Evaluasi
Pendidikan
Secara garis besar desain evaluasi pembelajaran berisi hal – hal yang sama
dengan yang tertera dalam desain penelitian, yakni meliputi latar belakang,
problematika, tujuan evaluasi, populasi dan sampel, instrumen dan sumber data, serta
teknik analisis data (Arikunto, 1988 : 44). Untuk memperjelas penyusunan rancangan
evaluasi pembelajaran, akan diuraikan secara singkat tiap – tiap langkah kegiatannya:
4. Populasi dan sampel, yakni sejumlah komponen pembelajaran yang dikenai
evaluasi pembelajaran dan/atau yang dimintai informasi dalam kegiatan
evaluasi pembelajaran.
5. Instrumen adalah sejumlah jenis alat pengumpulan informasi yang diperlukan
sesuai dengan teknik pengumpulan data yang diterapkan dalam evaluasi
pembelajaran.
Sumber data adalah dokumen, kegiatan, atau orang yang dapat memberikan
informasi atau data yang diperlukan.
6. Teknik analisis data, yakni cara/teknik yang digunakan untuk menganalisis
data yang disesuaikan dengan bentuk problematik dan jenis data. (Arikunto,
1988 : 44 – 47).
i. merumuskan tujuan yang akan dicapai dengan instrumen yang akan disusun,
ii. membuat kisi – kisi yang mencanangkan tentang perincian variable dan jenis
instrumen yang akan digunakan untuk mengukur bagian variabel yang
bersangkutan,
iii. membuat butir – butir instrumen evaluasi pembelajaran yang dibuat
berdasarkan kisi – kisi, dan
iv. menyunting instrumen evaluasi pembelajaran yang meliputi: mengurutkan
butir menurut sistematika yang dikehendaki evaluator untuk mempermudah
8
BAB V
Pendekatan Evaluasi
Pendekatan Evaluasi
Ada dua jenis pendekatan penilaian yang dapat digunakan untuk menafsirkan
sekor menjadi nilai. Kedua pendekatan ini memiliki tujuan, proses, standar dan juga
akan menghasilkan nilai yang berbeda. Karena itulah pemilihan dengan tepat
pendekatan yang akan digunakan menjadi penting. Kedua pendekatan itu adalah
Pendekatan Acuan Norma (PAN) dan Pendekatan Acuan Patokan (PAP).
Sejalan dengan uraian di atas, Glaser (1963) yang dikutip oleh W. James
Popham menyatakan bahwa terdapat dua strategi pengukuran yang mengarah pada
dua perbedaan tujuan substansial, yaitu pengukuran acuan norma (NRM) yang
berusaha menetapkan status relatif, dan pengukuran acuan kriteria (CRM) yang
berusaha menetapkan status absolut. Sejalan dengan pendapat Glaser, Wiersma
menyatakan norm-referenced interpretation is a relative interpretation based on an
individual’s position with respect to some group.
Glaser menggunakan konsep pengukuran acuan norma (Norm Reference
Measurement / NRM) untuk menggambarkan tes prestasi siswa dengan menekankan
pada tingkat ketajaman suatu pemahaman relatif siswa. Sedangkan untuk mengukur
tes yang mengidentifikasi ketuntasan / ketidaktuntasan absolut siswa atas perilaku
spesifik, menggunakan konsep pengukuran acuan kriteria (Criterion Reference
Measurement).
1. Penilaian Acuan Patokan (PAP), Criterion Reference Test (CRT)
Tujuan penggunaan tes acuan patokan berfokus pada kelompok perilaku siswa
yang khusus. Joesmani menyebutnya dengan didasarkan pada kriteria atau standard
khusus. Dimaksudkan untuk mendapat gambaran yang jelas tentang performan
peserta tes dengan tanpa memperhatikan bagaimana performan tersebut dibandingkan
dengan performan yang lain. Dengan kata lain tes acuan kriteria digunakan untuk
10
pengukuran yang digunakan ialah norma kelompok. Salah satu keuntungan dari
standar relatif ini adalah penempatan sekor (performan) siswa dilakukan tanpa
memandang kesulitan suatu tes secara teliti.
Kekurangan dari penggunaan standar relatif diantaranya adalah :
1) dianggap tidak adil, karena bagi mereka yang berada di kelas yang memiliki
sekor yang tinggi, harus berusaha mendapatkan sekor yang lebih tinggi untuk
mendapatkan nilai A atau B. Situasi seperti ini menjadi baik bagi motivasi
beberapa siswa.
2) Standar relatif membuat terjadinya persaingan yang kurang sehat diantara para
siswa, karena pada saat seorang atau sekelompok siswa mendapat nilai A akan
mengurangi kesempatan pada yang lain untuk mendapatkannya.
12
BAB VI
Bentuk dan Alat Evaluasi Pembelajaran
Dari sekian banyak alat evaluasi, secara umum dapat dikelompokkan
menjadi dua, yakni alat tes dan nontes. Khusus untuk evaluasi hasil pembelajaran alat
evaluasi yang paling banyak digunakan adalah tes.
Alat evaluasi
Dalam pengertian umum alat adalah sesuatu yang dapat digunakan untuk
mempermudah seseorang untuk melaksanakan tugas. Dengan demikian maka alat
evaluasi juga dikenal dengan instrument evaluasi.
Dalam menggunakan alat tersebut evaluator menggunakan cara atau teknik,
dan oleh karena itudikenal dengan teknik evalusi. Ada dua teknik evaluasi, yaitu
teknik non tes dan teknik tes.
a. teknik nontes
yang tergolong teknik non tes adalah:
skala bertingkat (rating scale);
kuesioner (questionair);
daftar cocok (check list);
wawancara (interview);
pengamatan (observation);
riwayat hidup.
1) skala bertingkat (rating scale);
skala menggambarkan suatu nilai yang berbentuk angka terhadap sesuatu hasil
pertimbangan. Seperti Oppenheim mengatakan Rating gives a numerical value to
some kind of judgement, maka suatu skala selalu disajikan dalam bentuk angka.
4 5 6 7 8
13
Biasanya angka- angka yang digunakan diterakan pada skala dengan jarak
yang sama. Meletakannya secara bertingkat dari yang rendah ke yang tinggi. Dengan
demikian maka skala ini dinamakan skala bertingkat.
2) kuesioner (questionair)
juga sering dikenal angket.pada dasarnya koesioner adalah sebuah dafter
pertanyaan yang harus diisi oleholeh orang yang akan ditukar (responden).
Macam-macam kuesioner dapat ditinjau dari beberapa segi:
a) ditinjau dari segi siapa yang menjawab
(1) kuesioner langsung
jika kuesioner tersebut dikirimkan dan diisi langsung oleh orang yang
akan dimintai jawaban tentang dirinya.
(2) Kuesioner tidak langsung
Adalah kuesioner yang dikirimkan dan di isi oleh bukan orang yang
diminta keterangannya.
b. teknik tes
Tes merupakan suatu alat pengumpul informasi tetapi jika
dibandingkan dengan alat-alat yang lain. Tes ini bersifat lebih resmi karena
penuh dengan batasan-batasan.
Apabila rumusan tersebut dikaitkan dengan evaluasi yang dilakukan di
sekolah, khususnya di suatu kelas, maka tes mempunyaifungsi ganda yaitu: untuk
mengukur siswa dan untuk mengukur keberhasilan program pengajaran.
Ditinjau dari segi kegunaan untuk mengukur siswa, maka dibedakan
atas adanya 3 macam tes, yaitu:
tes diagnostic,
tes formatif,
tes sumatif.
1) Tes diagnostic
Tes diagnostic adalah tes yang digunakan untuk mengetahui
kelemahan-kelemahan siswa sehingga berdasarkan kelemahan-kelemahan
tersebut dapat dilakukan pemberian perlakuan yang tepat.
Tes diagnostic ke – 1 dilakukan terhadap calon siswa sebagai input,
untuk mengetahui apakah calon tersebut sudah menguasai pengetahuan
yang merupakan dasar untuk menerima pengetahuan di sekolah yang
dimaksudkan.
16
2) Tes formatif
Evaluasi formatip dimaksudkan untuk mengetahui sejauh mana siswa
telah terbentuk setelah mengikuti suatu program tertentu.
Manfaat bagi siswa
a) Digunakan untuk mengetahui apakah siswa sudah menguasai
bahan program secara menyeluruh
b) Sebagai usaha perbaikan dan sebagai diagnosis.
Manfaat bagi guru
a) Mengetahui sejauh mana bahan yang diajarkan sudah diterima
oleh siswa
b) Mengetahui bagian mana dari bahan pelajaran yang belum
menjadi milik siswa.
c) Dapat meramalkan sukses dan tidaknya seluruh program yang
akan diberikan.
3) tes sumatif
Tes sumatif dilaksanakan setelah berakhirnya pemberian sekelompok
program atau sebuah program yang lebih besar.
Manfaat tes sumatif
a)Untuk menentukan nilai.
17
BAB VII
1 2 3 4 5 6 7 8 9 10
Ada satu cara yang digunakan untuk mengambil rata-rata dari hurup yaitu
dengan mentransfer nilai hurup tersebut menjadi nilai angka dahulu. Yang sering
digunakan adalah satu nilai huruf itu mewakili satu rentangan nilai angka.
Sebagai contoh adalah nilai huruf yang terdapat pada tabel konversi skor. Nilai
angka dan huruf yang terdapat dalam buku petunjuk kegiatan akademik IKIP
Yogyakarta sebagai berikut :
1 10 1 10
Kurva juling negatif karena ekornya Kurva juling positif karena
Ke kiri Ekornya ke kiri
b. Distribusi nilai berdasarkan standar nilai
dalam menggunakan standar ataunorm-reference, kedudukan seseorang selalu
dibandingkan dengan kawan-kawannya dalam kelompok. Dalam hal ini tanpa
menghiraukan apakah distribusi skor terletak dalam kurva juling positif atau juling
negative tetapi dalam norm- referenced selalu tergambar dalam kurva normal. Hal ini
didasarkan atas asumsi bahwa apabila distribusi tergambar dalam kurva juling positif,
yang kurang sempurna adalah soal-soal testnya, yaitu terlalu sukar. Dengan demikian
nilai siswa lalu direntangken sedimikian rupa sehingga tersebar dari nilai tertinggi ke
nilai rendah, dengan sebagian terbesar terletak pada nilai sedang. Demikian pula
sebaliknya apabila skor siswa tergambar dalam kurva juling negative. Dalam ubahan
menjadi nilai, disebarkan sedemikian rupa sehingga menjadi kurva normal, dengan
nilai sedang adalah nilai yang paling banyak.
Ubahan nilai dari skor-skor yang mengumpul dibawah atau diatas dapat
dilihat dalam gambar-gambar berikut ini.
3. Standar nilai
Dari distribusi nilai, kita dapat mambicarakan masalah standar nilai. Skor-skor
siswa direntangkan menjadi9 nilai (disebut juga standar nines atau stanines) seperti
berikut ini:
Stanines Interprestasi
9. (4%) Tinggi (4%)
8. (7%) Diatas
7 (12) Rata-rata (19%)
6 (17%) Rata-rata (54%)
5 (20%)
4 (17%)
3 (12%) Di bawah
2 (7%) Rata-rata (19%)
1 (4%) Rendah (4%)
Dengan adanya persentase yang ditentukan inilah maka semua situasi skor
siswa dapat direntangkan menjadi nilai 1 – 9.
Selain dengan standar sembilan (stanines), ada pula yang menggunakan
standar enam. Dalam hal ini, hanya berkisar antara 4 – 9, yaitu nilai-nilai 4,5,6,7,8,
dan 9. persentase penyebaran nilai dengan standar 6 adalah sebagai berikut:
Dasar pikiran untuk stanel ini adalah bahwa jarak praktis daklam kurva
normal adalah 6 SD yang terbagi atas 11 skala.
Standar sepuluh
Untuk mengolah hasil te, digunakan standar relative, dengan nilai berskala 1 –
10. untuk mengubah skor menjadi nilai, diperlukan dahulu:
1. mean (rata-rata skor)
2. deviasi standar (simpangan baku).
3. table konversi angka kedalam nilai berskala 1 – 10.
Tahap-tahap yang dilalui dalam mengubah skor mentah menjadi nilai berskala 1 – 10
adalah sebagai berikut:
1) menyusun distribusi frekuensi dari angka-angka atau skor-skor mentah.
2) Menghitung rata-rata skor (mean).
3) Menghitung deviasi standar atau standar deviasi.
4) Mentrnsformasi (mengubah) angka-angka mentah ke dalam nilai berskala 1 –
10.
Menghitung mean
Langkah-langkahnya ialah:
26
a) Menentukan mean duga (atau mean terkaan), yang biasanya diambil pada
kelas interval yang mempunyai frekuensi terbesar.
Besarnya MT (mean terkaan) adalah jumlah batas-batas kelas interval dibagi 2.
b) Menentukan deviasi duga (menberi symbol d) dimana pada kelas interval
yang mengandung MT diberi symbol 0, dan naik satu-satusetiap kelas interval
di atasnya, dan turun satu-satu setiap interval di bawahnya.
c) Menghitung mean yang sebenarnya dengan rumus.
Menghitung nilai berskala 1 – 10
Table koversi yang digunakan dalam mengubah angka menjadi nilai berskala
1-10 adalah sebagai berikut:
TABEL KONVERSI ANGKA KE DALAM NILAI BERSKALA
Skala sigma Skala 1-10 Skala angka
+2,5 SD 10 Mean + (2,25) SD
+1,75 SD 9 Mean + (1,75) SD
+1,25 SD 8 Mean + (1,25) SD
+0,75 SD 7 Mean + (0,75) SD
+0,25 SD 6 Mean + (0,25) SD
-0,25 SD 5 Mean - (0,25) SD
-0,75 SD 4 Mean - (0,75) SD
-1,25 SD 3 Mean - (1,25) SD
-1,75 SD 2 Mean - (1,75) SD
-2,25 SD 1 Mean - (2,25) SD
Dengan table ini jika diterapkan pada data yang kita peroleh dari perhitungan
mean dan deviasi standar di depan, akan terdapat table konversi sebagai berikut:
Dalam contoh perhitungan ini siswa yang mendapat skor + 63,73 diubah menjadi
nilai 10. Selanjutnya siswa yang mendapat skor ≤ 8,83 di ubah menjadi nilai 0. untuk
nilai-nilai 1 sampai dengan 9 adalah ubahan dari skor diantara batas-batas skor yang
sudah ditentukan dalam tabel.
Dengan berdasarkan atas skala angka ini, maka dengan mudah dapat di
transformasikan skor-skor siswa yang ada, menjadi nilai berskala 1-10.
Standar lima
Menurut Gronlund ia mengemukakan penyebaran nilai dengan angka, juga
mengemukan penyebaran nilai dengan huruf yang digambarkan dengan kurva normal
sebagai berikut:
28
E D C B A
7% 24% 38% 24% 7%
Catatan:
1. gronlund tidak menggunakan huruf E tetapi huruf F singkatan dari Fail
(gagal).
2. gronlund: rentangan ini hanya berlaku bagi populasi yang sangat heterogen.
Apabila populasi telah terseleksi akibat kenaikan kelasatau pindah ke tingkat
sekolah yang lebih tinggi, maka golongan F yang ada di ekor kiri akan
berkurang sehingga distribusi terse4but menjadi:
BAB VIII
dengan penggunaan bahasa Indonesia yang baik dan benar menurut Ejaan Yang
Disempurnakan (EYD).
Telaah secara kualitatif dilakukan oleh tiga orang yang memiliki kompetensi sesuai
dengan aspek materi konstruksi dan bahasa. Setiap penelaah melakukan analisis terhadap
setiap butir soal berdasarkan kriteria yang telah ditetapkan sebelumnya dengan menuliskan
huruf “Y” jika butir sesuai dengan kriteria dan huruf “T” jika butir tidak sesuai dengan
kriteria yang telah ditetapkan.
Hasil telaah kemudian dirangkum untuk selanjutnya ditentukan kualitas butir secara
teoretis dengan menggunakan kriteria sebagai berikut:
Butir tes yang baik yaitu butir yang memenuhi semua kriteria yang telah
ditentukan.
Butir tes yang kurang baik yaitu butir yang hanya memenuhi sebanyak-banyaknya
3 kriteria aspek konstruksi serta 1 kriteria aspek materi dan bahasa.
Butir tes yang tidak baik yaitu butir yang tidak memenuhi semua kriteria yang
telah ditetapkan pada aspek materi 1 dan 3, atau lebih dari 3 untuk aspek
konstruksi serta lebih dari 1 kriteria pada aspek bahasa.
Dari rangkuman hasil telaah kualitatif selanjutnya dapat ditentukan butir mana yang
sudah atau belum memenuhi kriteria pada aspek materi kontruksi yang sudah atau belum
memenuhi kriteria pada aspek materi tentang butir yang baik dan tidak baik.
Daftar Pustaka
http://aderusliana.wordpress.com/2007/11/05/konsep-dasar-evaluasi-hasil-belajar/