Anda di halaman 1dari 30

1

BAB I
Konsep Evaluasi Pendidikan

evaluasi adalah suatu proses yang mencakup pengukuran dan mungkin juga
testing, yang juga berisi pengambilan keputusan tentang nilai. Pendapat ini sejalan
dengan pendapat Arikunto yang menyatakan bahwa evaluasi merupakan kegiatan
mengukur dan menilai. Kedua pendapat di atas secara implisit menyatakan bahwa
evaluasi memiliki cakupan yang lebih luas daripada pengukuran dan testing.
Ralph W. Tyler, yang dikutif oleh Brinkerhoff dkk. Mendefinisikan evaluasi
sedikit berbeda. Ia menyatakan bahwa evaluation as the process of determining to
what extent the educational objectives are actually being realized. Sementara Daniel
Stufflebeam (1971) yang dikutip oleh Nana Syaodih S., menyatakan bahwa
evaluation is the process of delinating, obtaining and providing useful information
for judging decision alternatif. Demikian juga dengan Michael Scriven (1969)
menyatakan evaluation is an observed value compared to some standard.
Sementara itu Asmawi Zainul dan Noehi Nasution mengartikan pengukuran
sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang
dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas,
sedangkan penilaian adalah suatu proses untuk mengambil keputusan dengan
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang
menggunakan tes maupun nontes. Pendapat ini sejalan dengan pendapat Suharsimi
Arikunto yang membedakan antara pengukuran, penilaian, dan evaluasi. Arikunto
menyatakan bahwa mengukur adalah membandingkan sesuatu dengan satu ukuran.
Pengukuran bersifat kuantitatif. Sedangkan menilai adalah mengambil suatu
keputusan terhadap sesuatu dengan ukuran baik buruk. Penilaian bersifat kualitatif.
Hasil pengukuran yang bersifat kuantitatif juga dikemukakan oleh Norman E.
Gronlund (1971) yang menyatakan “Measurement is limited to quantitative
descriptions of pupil behavior”.
2

BAB II
Tujuan Dan Kegunaan Evaluasi Pendidikan

a. Tujuan Evaluasi
Sebagaimana diuraikan pada bagian terdahulu bahwa evaluasi dilaksanakan
dengan berbagai tujuan. Khusus terkait dengan pembelajaran, evaluasi dilaksanakan
dengan tujuan:
1. Mendeskripsikan kemampuan belajar siswa.
2. mengetahui tingkat keberhasilan PBM
3. menentukan tindak lanjut hasil penilaian
4. memberikan pertanggung jawaban (accountability)
b. Fungsi Evaluasi
Sejalan dengan tujuan evaluasi di atas, evaluasi yang dilakukan juga memiliki
banyak fungsi, diantaranya adalah fungsi:
1. Selektif
2. Diagnostik
3. Penempatan
4. Pengukur keberhasilan
Selain keempat fungsi di atas Asmawi Zainul dan Noehi Nasution
menyatakan masih ada fungsi-fungsi lain dari evaluasi pembelajaran, yaitu fungsi:
1. Remedial
2. Umpan balik
3. Memotivasi dan membimbing anak
4. Perbaikan kurikulum dan program pendidikan
5. Pengembangan ilmu
c. Manfaat Evaluasi
Secara umum manfaat yang dapat diambil dari kegiatan evaluasi dalam
pembelajaran, yaitu:
3

1. Memahami sesuatu : mahasiswa (entry behavior, motivasi, dll), sarana dan


prasarana, dan kondisi dosen
2. Membuat keputusan : kelanjutan program, penanganan masalah, dll
3. Meningkatkan kualitas PBM : komponen-komponen PBM
Sementara secara lebih khusus evaluasi akan memberi manfaat bagi pihak-pihak
yang terkait dengan pembelajaran, seperti siswa, guru, dan kepala sekolah.
Bagi  Siswa
Mengetahui tingkat pencapaian tujuan pembelajaran, Memuaskan atau tidak
memuaskan.
Bagi Guru:
1. mendeteksi siswa yang telah dan belum menguasai tujuan : melanjutkan,
remedial atau pengayaan
2. ketepatan materi yang diberikan : jenis, lingkup, tingkat kesulitan, dll.
3. ketepatan metode yang digunakan
Bagi Sekolah:
1. hasil belajar cermin kualitas sekolah
2. membuat program sekolah
3. pemenuhan standar.
4

BAB III

Sasaran Pokok Evaluasi Pembelajaran

apabila cara pandang kita seagai siswa sebagai probadi yang utuh, dapat
ditinjau dari beberapa segi yang menghasilkan bermacam-macam bentuk tes yang
digunakan sebagai alat untuk mengukur. Aspek yang bersifat rohani setidaknya
mencangkup 4 hal:

1. Kemampuan
Seorang siswa harus memiliki kemampuan yang sepadan bila ingin
mengikuti program dalam suatu lembaga/sekolah/institusi. Sebagai alat ukur
kemampuan ini adalah attitude test.

2. Kepribadian
Kepribadian adalah sesuatu yang terdapat pada setiap diri manusia dan
dapat dilihat dari tingkah laku. Alat untuk mengetahui kepribadian seseorang
dinamakan personality test.

3. Sikap-sikap
Sikap merupakan bagian dari tingkah laku manusia sebagai gejala atau
gambaran kepribadian yang memancar keluar. Alat untuk mengetahui sikap
seseorang seseorang dinamakan attitude test. Test ini berupa skala yang
disebut attitude scale.

4. Inteligensi
Untuk mengetahui tingkat inteligensi seseorang dapat dilakukan dengan
beberapa tes berupa tes Binet-Simon, SPM, Titum, dan sebagainya. Dari tes
tersebut maka akan diketahui IQ (Intelligence Quotient).
5

 Transformasi
Unsur-unsur dalam transformasi yang menjadi objek penilaian
antara lain:

1. Kurikulum/materi,
2. Metode dan cara penilaian,
3. Sarana pendidikan/media,
4. Sistem administrasi,
5. Guru dan personal lainnya.
6

BAB  IV

Prosedur Evaluasi
Pendidikan

Prosedur Evaluasi Pembelajaran

Evaluator dalam evaluasi pembelajaran adalah suatu tim yang mempunyai


peran penting dalam memberikan informasi mengenai keberhasilan pembelajaran
(dimodifikasikan dari Arikunto, 1988 : 7). Yang berhak menjadi tim evaluator adalah
orang – orang yang telah memenuhi berbagai persyaratan yang ditentukan. Prosedur
evaluasi pembelajaran terdiri dari lima tahapan, yakni :

a.   Penyusunan Rancangan

Secara garis besar desain evaluasi pembelajaran berisi hal – hal yang sama
dengan yang tertera dalam desain penelitian, yakni meliputi latar belakang,
problematika, tujuan evaluasi, populasi dan sampel, instrumen dan sumber data, serta
teknik analisis data (Arikunto, 1988 : 44). Untuk memperjelas penyusunan rancangan
evaluasi pembelajaran, akan diuraikan secara singkat tiap – tiap langkah kegiatannya:

1.  Menyusun latar belakang yang berisikan dasar pemikiran dan/atau rasional


penyelenggaraan evaluasi.

2.  Problematika berisikan rumusan permasalahan/problematika yang akan dicari


jawabannya baik secara umum maupun terinci.

3.  Tujuan evaluasi merupakan rumusan yang sesuai dengan problematika evaluasi


pembelajaran, yakni perumusan tujuan umum dan tujuan khusus.
7

4.  Populasi dan sampel, yakni sejumlah komponen pembelajaran yang dikenai
evaluasi pembelajaran dan/atau yang dimintai informasi dalam kegiatan
evaluasi pembelajaran.

5.  Instrumen adalah sejumlah jenis alat pengumpulan informasi yang diperlukan
sesuai dengan teknik pengumpulan data yang diterapkan dalam evaluasi
pembelajaran.

Sumber data adalah dokumen, kegiatan, atau orang yang dapat memberikan
informasi atau data yang diperlukan.

6.   Teknik analisis data, yakni cara/teknik yang digunakan untuk menganalisis
data yang disesuaikan dengan bentuk problematik dan jenis data. (Arikunto,
1988 : 44 – 47).

b.   Penyusunan Instrumen

Setelah seorang evaluator menusun rancangan evaluasi pembelajarannya


yakni peta kegiatan yang akan dilakukan selama kegiatan evaluasi pembelajaran,
maka tahapan berikutnya adalah penyusunan instrumen evaluasi pembelajaran.
Menurut Arikunto  (1988 : 48 – 49) langkah –langkah penyusunan instrumen adalah:

i. merumuskan tujuan yang akan dicapai dengan instrumen yang akan disusun,
ii. membuat kisi – kisi yang mencanangkan tentang perincian variable dan jenis
instrumen yang akan digunakan untuk mengukur bagian variabel yang
bersangkutan,
iii. membuat butir – butir instrumen evaluasi pembelajaran yang dibuat
berdasarkan kisi – kisi, dan
iv. menyunting instrumen evaluasi pembelajaran yang meliputi: mengurutkan
butir menurut sistematika yang dikehendaki evaluator untuk mempermudah
8

pengelohan data, menuliskan petunjuk pengisian dan identitas serta yang


lain, dan membuat pengantar pengisian instrumen.

Semua langkah yang dilaksanakan dalam penyusunan instrumen di atas berisikan


kegiatan seperti yang telah direncanakan dalam rancangan evaluasi pembelajaran.

c.   Pengumpulan Data

Setelah instrumen evaluasi pembelajaran siap pakai, maka langkah berikutnya


adalah datang kepada sumber data untuk mengumpulkan data/informasi yang
diperlukan. Dalam pengumpulan data dapat diterapkan berbagai teknik pengumpulan
data diantaranya adalah kuesioner, wawancara, pengamatan, dan studi kasus.
9

BAB V
Pendekatan Evaluasi
Pendekatan Evaluasi

Ada dua jenis pendekatan penilaian yang dapat digunakan untuk menafsirkan
sekor menjadi nilai. Kedua pendekatan ini memiliki tujuan, proses, standar dan juga
akan menghasilkan nilai yang berbeda. Karena itulah pemilihan dengan tepat
pendekatan yang akan digunakan menjadi penting. Kedua pendekatan itu adalah
Pendekatan Acuan Norma (PAN) dan Pendekatan Acuan Patokan (PAP).
Sejalan dengan uraian di atas, Glaser (1963) yang dikutip oleh W. James
Popham menyatakan bahwa terdapat dua strategi pengukuran yang mengarah pada
dua perbedaan tujuan substansial, yaitu pengukuran acuan norma (NRM) yang
berusaha menetapkan status relatif, dan pengukuran acuan kriteria (CRM) yang
berusaha menetapkan status absolut. Sejalan dengan pendapat Glaser, Wiersma
menyatakan norm-referenced interpretation is a relative interpretation based on an
individual’s position with respect to some group.
Glaser menggunakan konsep pengukuran acuan norma (Norm Reference
Measurement / NRM) untuk menggambarkan tes prestasi siswa dengan menekankan
pada tingkat ketajaman suatu pemahaman relatif siswa. Sedangkan untuk mengukur
tes yang mengidentifikasi ketuntasan / ketidaktuntasan absolut siswa atas perilaku
spesifik, menggunakan konsep pengukuran acuan kriteria (Criterion Reference
Measurement).
1. Penilaian Acuan Patokan (PAP), Criterion Reference Test (CRT)
Tujuan penggunaan tes acuan patokan berfokus pada kelompok perilaku siswa
yang khusus. Joesmani menyebutnya dengan didasarkan pada kriteria atau standard
khusus. Dimaksudkan untuk mendapat gambaran yang jelas tentang performan
peserta tes dengan tanpa memperhatikan bagaimana performan tersebut dibandingkan
dengan performan yang lain. Dengan kata lain tes acuan kriteria digunakan untuk
10

menyeleksi (secara pasti) status individual berkenaan dengan (mengenai) domain


perilaku yang ditetapkan / dirumuskan dengan baik.
Pada pendekatan acuan patokan, standar performan yang digunakan adalah
standar absolut. Semiawan menyebutnya sebagai standar mutu yang mutlak.
Criterion-referenced interpretation is an absolut rather than relative interpetation,
referenced to a defined body of learner behaviors. Dalam standar ini penentuan
tingkatan (grade) didasarkan pada sekor-sekor yang telah ditetapkan sebelumnya
dalam bentuk persentase. Untuk mendapatkan nilai A atau B, seorang siswa harus
mendapatkan sekor tertentu sesuai dengan batas yang telah ditetapkan tanpa
terpengaruh oleh performan (sekor) yang diperoleh siswa lain dalam kelasnya.
Salah satu kelemahan dalam menggunakan standar absolut adalah sekor siswa
bergantung pada tingkat kesulitan tes yang mereka terima. Artinya apabila tes yang
diterima siswa mudah akan sangat mungkin para siswa mendapatkan nilai A atau B,
dan sebaliknya apabila tes tersebut terlalu sulit untuk diselesaikan, maka
kemungkinan untuk mendapat nilai A atau B menjadi sangat kecil. Namun kelemahan
ini dapat diatasi dengan memperhatikan secara ketat tujuan yang akan diukur tingkat
pencapaiannya.

2. Penilaian Acuan Norma (PAN), Norm Reference Test (NRT)


Tujuan penggunaan tes acuan norma biasanya lebih umum dan komprehensif
dan meliputi suatu bidang isi dan tugas belajar yang besar. Tes acuan norma
dimaksudkan untuk mengetahui status peserta tes dalam hubungannya dengan
performans kelompok peserta yang lain yang telah mengikuti tes. Tes acuan kriteria
Perbedaan lain yang mendasar antara pendekatan acuan norma dan pendekatan acuan
patokan adalah pada standar performan yang digunakan.
Pada pendekatan acuan norma standar performan yang digunakan bersifat
relatif. Artinya tingkat performan seorang siswa ditetapkan berdasarkan pada posisi
relatif dalam kelompoknya; Tinggi rendahnya performan seorang siswa sangat
bergantung pada kondisi performan kelompoknya. Dengan kata lain standar
11

pengukuran yang digunakan ialah norma kelompok. Salah satu keuntungan dari
standar relatif ini adalah penempatan sekor (performan) siswa dilakukan tanpa
memandang kesulitan suatu tes secara teliti.
Kekurangan dari penggunaan standar relatif diantaranya adalah :
1) dianggap tidak adil, karena bagi mereka yang berada di kelas yang memiliki
sekor yang tinggi, harus berusaha mendapatkan sekor yang lebih tinggi untuk
mendapatkan nilai A atau B. Situasi seperti ini menjadi baik bagi motivasi
beberapa siswa.
2) Standar relatif membuat terjadinya persaingan yang kurang sehat diantara para
siswa, karena pada saat seorang atau sekelompok siswa mendapat nilai A akan
mengurangi kesempatan pada yang lain untuk mendapatkannya.
12

BAB VI
Bentuk dan Alat Evaluasi Pembelajaran
Dari sekian banyak alat evaluasi, secara umum dapat dikelompokkan
menjadi dua, yakni alat tes dan nontes. Khusus untuk evaluasi hasil pembelajaran alat
evaluasi yang paling banyak digunakan adalah tes.
Alat evaluasi
Dalam pengertian umum alat adalah sesuatu yang dapat digunakan untuk
mempermudah seseorang untuk melaksanakan tugas. Dengan demikian maka alat
evaluasi juga dikenal dengan instrument evaluasi.
Dalam menggunakan alat tersebut evaluator menggunakan cara atau teknik,
dan oleh karena itudikenal dengan teknik evalusi. Ada dua teknik evaluasi, yaitu
teknik non tes dan teknik tes.
a. teknik nontes
yang tergolong teknik non tes adalah:
 skala bertingkat (rating scale);
 kuesioner (questionair);
 daftar cocok (check list);
 wawancara (interview);
 pengamatan (observation);
 riwayat hidup.
1) skala bertingkat (rating scale);
skala menggambarkan suatu nilai yang berbentuk angka terhadap sesuatu hasil
pertimbangan. Seperti Oppenheim mengatakan Rating gives a numerical value to
some kind of judgement, maka suatu skala selalu disajikan dalam bentuk angka.

4 5 6 7 8
13

Biasanya angka- angka yang digunakan diterakan pada skala dengan jarak
yang sama. Meletakannya secara bertingkat dari yang rendah ke yang tinggi. Dengan
demikian maka skala ini dinamakan skala bertingkat.

2) kuesioner (questionair)
juga sering dikenal angket.pada dasarnya koesioner adalah sebuah dafter
pertanyaan yang harus diisi oleholeh orang yang akan ditukar (responden).
Macam-macam kuesioner dapat ditinjau dari beberapa segi:
a) ditinjau dari segi siapa yang menjawab
(1) kuesioner langsung
jika kuesioner tersebut dikirimkan dan diisi langsung oleh orang yang
akan dimintai jawaban tentang dirinya.
(2) Kuesioner tidak langsung
Adalah kuesioner yang dikirimkan dan di isi oleh bukan orang yang
diminta keterangannya.

b) ditinjau dari segi cara menjawab


(1) Kuesioner tertutup
Adalah kuesioner yang disusun dengan menyediakan pilihan
jawabanlengkap sehingga pengisi hanya tinggal memberi tanda pada jawaban
yang dipilih.
(2) Kuesioner terbuka
Adalah kuesioner yang disusun sedimikian rupa sehingga para pengusi
bebas mengemukakan pendapatnya.
(3) Daftar cocok check list)
Adalah deretan pernyataan dimana responden yang di evaluasi tinggal
membubuhkan tanda check list di tempat yang sudah disediakan.
(4) Wawancara (interview)
14

Adalah suatu metode atau cara yang digunakan untuk mendpatkan


jawaban dari responden dengan jalan Tanya-jawab sepihak.

Wawancara dapat dilakukan dengan 2 cara, yaitu:


a) Interviu bebas, dimana responden mempunyai kebasan untuk
mengutarakan pendapatnya, tanpa dibatasi oleh patokan-patokan
yang telah dibuat oleh subjek evaluasi.
b) Interviu terpimpin, yaitu interviu yang dilakukan oleh subjek evaluasi
dengan cara mengajukan pertanyaan-pertanyaan yang sudah disusun
terlebih dahulu.
(5) Pengamatan (observation)
Adalah suatu teknik yang dilakukan dengan cara mengadakan
pengamatan secara teliti serta pencatatan secara sistematis.

Ada 2 macam observasi:


(a) Observasi partisipan, yaitu observasi yang dilakukan oleh pengamat,
tetapi dalam pada itu pengamat memasuki dan mengikuti kegiatan
kelompok yang sedang diamati.observasi partisipan dilaksanakan
sepenuhnya jika pengamat betul-betul mengikuti kegiatan
kelomppok, bukan hanya pura-pura. Dengan demikian, ia dapat
menghayati dan merasakan seperti apa yang dirasakan orang-orang
dalam kelompok yang diamati.
(b) Observasi sistematik, yaitu observasi dimana factor-faktor yang
diamati sudah didaftar secara sistematis dan sudah diatur menurut
kategorinya.
(c) Observasi eksperimental terjadi jika pengamat tidak berpartisipasi
dalam kelompok.dalam hal ini ia dapat menentukan unsure-unsur
pnting dalam situasi sedemikian rupa sehingga situasi ini dapat
diatur sesuai denan tujuan evaluasi.
15

(6) Riwayat hidup


Adalah gambaran tentang keadaan seseorang selama dalam masa
kehidupannya. Dengan mempelajari riwayat hidup, maka subjek evaluasi
akan dapat menarik suatu kesimpulan tentang kepribadian, kebiasaan, dan
sikap dari objek yang dinilai.

b. teknik tes
Tes merupakan suatu alat pengumpul informasi tetapi jika
dibandingkan dengan alat-alat yang lain. Tes ini bersifat lebih resmi karena
penuh dengan batasan-batasan.
Apabila rumusan tersebut dikaitkan dengan evaluasi yang dilakukan di
sekolah, khususnya di suatu kelas, maka tes mempunyaifungsi ganda yaitu: untuk
mengukur siswa dan untuk mengukur keberhasilan program pengajaran.
Ditinjau dari segi kegunaan untuk mengukur siswa, maka dibedakan
atas adanya 3 macam tes, yaitu:
 tes diagnostic,
 tes formatif,
 tes sumatif.

1) Tes diagnostic
Tes diagnostic adalah tes yang digunakan untuk mengetahui
kelemahan-kelemahan siswa sehingga berdasarkan kelemahan-kelemahan
tersebut dapat dilakukan pemberian perlakuan yang tepat.
Tes diagnostic ke – 1 dilakukan terhadap calon siswa sebagai input,
untuk mengetahui apakah calon tersebut sudah menguasai pengetahuan
yang merupakan dasar untuk menerima pengetahuan di sekolah yang
dimaksudkan.
16

Tes diagnostic ke – 2 dilakukan terhdap calon siswa yang sudah akan


mulai mengikuti program. Apabila cukup banyak calon siswa yang di
terima sehingga yang diterima sehingga yang diperlukan lebih dari satu
kelas, maka untuk pembagian kelas diperlukan suatu pertimbangan
khusus.
Tes diagnostic ke – 3 dilakukan terhadap siswa yang sedang belajar.
Tidak semua siswa dapat menerima pelajaran yang diberikan oleh guru
dengan lancar.

2) Tes formatif
Evaluasi formatip dimaksudkan untuk mengetahui sejauh mana siswa
telah terbentuk setelah mengikuti suatu program tertentu.
Manfaat bagi siswa
a) Digunakan untuk mengetahui apakah siswa sudah menguasai
bahan program secara menyeluruh
b) Sebagai usaha perbaikan dan sebagai diagnosis.
Manfaat bagi guru
a) Mengetahui sejauh mana bahan yang diajarkan sudah diterima
oleh siswa
b) Mengetahui bagian mana dari bahan pelajaran yang belum
menjadi milik siswa.
c) Dapat meramalkan sukses dan tidaknya seluruh program yang
akan diberikan.
3) tes sumatif
Tes sumatif dilaksanakan setelah berakhirnya pemberian sekelompok
program atau sebuah program yang lebih besar.
Manfaat tes sumatif
a)Untuk menentukan nilai.
17

b)Untuk menentukan seorang anak dapat atau tidaknya mengikuti


kelompok dalam menerima program.
c)Untuk mengisi catatan kemajuan belajar siswa.
4) tes formatif dan sumatif dalam praktek
Dalam pelaksanaannya disekolah tes formatif ini merupakan ulangan
harian, sedangkan tes sumatif biasa kita kenal sebagai ulangan umum yang
diadakan pada akhir semester.
Dalam pelaksanaannya tes sumatif disekolah-sekolah ada yang
disamakan antara satu daerah atau wilayah administrative, dan dikenal
sebagai THB (tes Hasil Belajar), TPB (Tes Prestasi Belajar) atau istilah
lainnya.
Seperti adanya efek positif dan negative atau dihapuskannyta ujian
Negara menjadi ujian sekolah, maka tes sumatif bersama )THB atau TPB)
ini mempunyai kebaikan dan kelebihan.
Kebaikan THB bersama
a) Pihak atasan atau pengelola sekolah-sekolah dapat
membandingkan kemajuan sekolah-sekolah yang ada di
wilayahnnya.
b) Karena dibendingkan antara sekolah satu dengan yang lainnya
maka akan timbul persaingan sehat.
c) Standar pelajaran akan terpelihara dengan sebaik-baiknya.
Keburukan THB bersama
a) Ada kemungkinanj akan terjadi pemberian pelajaran yang
hanya berorientasi pada “ujian” dengan cara memberikan
latihan mengerjakan soal yang sebanyak-banyaknya.
b) Tidak menghiraukan jika terjadi beberapa bentuk kecurangan
karena ada sekolah yang ingin mendapat nama baik.
5) perbandingan antara tes diagnostic, tes formatif, dan tes sumatif
a) Ditinjau dari isinya
18

(1) Tes diagnostik


 Menentukan apakah bahan persyaratan telah dikuasai atau
belum
 Menentukan tingkat penguasaan siswa terhadap bahan yang
dipelajari.
 Mengelompokan siswa berdasarkan kemampuan siswa
dalam menerima pelajaran
 Menentukan kesulitan-kesulitan belajar yang dialami.
(2) Tes formatif
Sebagai umpan balik bagi siswa, guru, maupun
program untuk menilai pelaksanaan satu unit program.
(3) Tes sumatif
Untuk memberikan tanda kepada siswa bahwa telah
mengikuti program.
b) ditinjau dari waktu
1) tes diagnostik
 pada waktu penyaringan calon siswa.
 Pada waktu membagi kelas
 Selama pelajaran berlangsung bila guru akan memberikan
bantuan kepada siswa.
2) tes formatif
Selama pelajaran berlangsung untuk mengetahui kekurangan
agar pelajaran dapat berlangsung dengan baik
3) Tes sumatif
Pada akhir unit caturwulan, semester akhir tahun, atau akhir
tahun.
c) ditinjau dari titik berat penilaian
1) tes diagnostic
 Tingkah laku kognitif, afektif, dan psikomotor.
19

 Fktor-faktor fisik, psikologis, dan lingkungan.


2) tes formatif
Menekankan pada tingkh laku kognitif.
3) tes sumatif
Pada umumnya menekankan pada tingkah laku kognitif, tetapi
ada kalanya pada tingkah laku psikomotor dan kadang-kadang
lebih efektif.
d) ditinjau dari alat evaluasi
1) tes diagnostik
 Tes prestasi belajar yang sudah di standarisasikan
 Tes diagnostic yang sudah distandarisasikan.
 Tes buatan guru
 Pengamatan dan daftar cocok (check list)
2) Tes formatif
tes prestasi belajar yang tersusun secara baik
3) tes sumatif
Tes ujian akhir
e) ditinjau dari cara memilih tujuan yang dievaluasi
1) tes diagnostic
 Memilih tiap-tiap keterampilan prasyarat
 Memilih tujuan setiap program pelajaran secara berimbang
 Memilih yang berhubungan dengan tingkah laku fisik,
mental, dan perasaan.
2) Tes formatif
Mengukur semua tujuan intruksional khusus.
3) tes sumatif
Mengukur tujuan intruksional umum.
f) Ditinjau dari tingkat kesulitan tes
1) tes diagnostic
20

Mengukur keterampilan dasar, diambil soal tes yang mudah,


yang tingkat kesulitannya (indeks kesukaran) 0,65 atau lebih.
2) Tes formatif
Belum dapat ditentukan
3) Tes sumatif
Rata-rata mempunyai tingkat kesulitan antar 0,35 sampai 0,70.
ditambah beberapa soal yang sangat mudah dan beberapa lagi
yang sangat sukar.
g) ditinjau dari scoring (cara menyekor)
1) tes diagnostic
Manggunakan standar mutlak dan standar relative.
2) Tes formatif
Menggunakan standar mutlak
3) Tes sumatif
Menggunakan standar relative dan dapat pula dipakai standar
mutlak.
h) Ditinjau dari tingkat pencapaian
Tingkat pencapaian adalah skor yang harus dicapai siswa
dalam setiap tes. Tinggi rendahnya tuntutan terhadap tingkat
pencapaian tergantung dari fungsi dan tujuan masing-masing tes.
i) ditinjau dari cara pencatatan hasil
1) Tes diagnostic
Dicatat dan dilaporkan dalam bentuk profil.
2) Tes formatif
Prestasi tiap siswa dilaporkan dalam bentuk catatan berhasil
atau gagal menguasai sesuatu tugas.
3) Tes sumatif
Keseluruhan skor atau sebagian skor dari tujuan-tujuan yang
dicapai.
21

BAB VII

Pengolahan Skor Tes Hasil Belajar

1. Beberapa skala penilaian


a. skala bebas
Skala bebas yaitu skala yang tidak tetap. Adakalanya skor tertinggi 20, lain
kali 25, dan lain kali lagi 50. ini semua tergantung dari banyak dan bentuk soal.
Jadi angka tertinggi dan skala yang digunakan tidak selalu sama.
b. skala 1 – 10
Dalam skala 1 – 10, guru jarang memberikan angka pecahan, misalnya 5,5.
Angka 5,5 tersebut kemudian dibulatkan menjadi 6. Padahal angka 6,4 pun akan
dibulatkan menjadi 6. Dengan demikian maka rentangan angka 5,5 sampai 6,4
(selisih hampir 1) akan keluar di raport dalam satu wajah, yaitu 6.
c. skala 1 – 100
Dengan menggunakan skala 1 – 10 maka bilangn bulat yang ada masih
menunjukan penilaian yang agak kasar. Untuk itulah maka dengan menggunakan
skala 1 – 100, dimungkinkan melakukan penilain yang lebih halus karena terdapat
100 bilanga bulat. Nilai 5,5 dan 6,4 dalam skala 1 – 10 yang biasanya dibulatkan
menjadi 6, dalam skala 1 1 – 100 ini boleh dituliskan.
d. skala hurup
Selain mengunakan angka, pemberian nilai dapat dilakukan dengan hurup
A,B,C,D dan E. jarak antara hurup A dan B tidak dapat digambarkan sama
dengan jarak antara B dan C, atau antara C dan D.
Dalam menggunakan angka dapat dibuktikan dengan garis bilangan bahwa
jarak antara 1 dan 2 sama dengan jarak antara 2 dan 3. demikian pula jarak antara
3 dan 4, serta 4 dan 5.
22

1 2 3 4 5 6 7 8 9 10
Ada satu cara yang digunakan untuk mengambil rata-rata dari hurup yaitu
dengan mentransfer nilai hurup tersebut menjadi nilai angka dahulu. Yang sering
digunakan adalah satu nilai huruf itu mewakili satu rentangan nilai angka.
Sebagai contoh adalah nilai huruf yang terdapat pada tabel konversi skor. Nilai
angka dan huruf yang terdapat dalam buku petunjuk kegiatan akademik IKIP
Yogyakarta sebagai berikut :

Angka 100 Angka 10 IKIP Huruf Keterangan


80 -100 8,0 – 10,0 8,1 – 10 A Baik sekali
66 - 79 6,6 – 7,9 6,6 – 8,0 B Baik
56 - 65 5,6 – 6,5 5,6 – 6,5 C Cukup
40 - 45 4,0 – 5,5 4,1 – 5,5 D Kurang
30 - 39 3,0 – 3,9 0 – 4,0 E Gagal
Dengan mengembalikan nilai huruf itu ke nilai angka, maka dengan mudah dapat
dicari rata-ratanya.
2. Distribusi nilai
Distribusi nilai yang dimiliki siswa-siswanya dalam suatu kelas didasarkan
pada dua macam standar, yaitu:
a. Standar mutlak.
b. Standar relatif.
a. Distribusi nilai berdasarkan standar mutlak
dengan dasar bahwa hasil belajar siswa dibandingkan dengan sebuah standar
mutlak atau dalam hal ini skor tinggi skor tertinggi yang diharapkan, maka tingkat
penguasaan siswa akan terlihat dalam berbagai bentuk kurva. Apabila soal-soal
ulangan yang dibuat oleh guru sangat mudah, sebagian siswa akan dapat berhasil
mengerjakan soal-soal itu, dan tingkat pencapaiannya tinggi.
23

Dibawah ini adalah gambaran tentang kemungkinan prestasi siswa


berdasarkan standar mutlak.

1 10 1 10
Kurva juling negatif karena ekornya Kurva juling positif karena
Ke kiri Ekornya ke kiri
b. Distribusi nilai berdasarkan standar nilai
dalam menggunakan standar ataunorm-reference, kedudukan seseorang selalu
dibandingkan dengan kawan-kawannya dalam kelompok. Dalam hal ini tanpa
menghiraukan apakah distribusi skor terletak dalam kurva juling positif atau juling
negative tetapi dalam norm- referenced selalu tergambar dalam kurva normal. Hal ini
didasarkan atas asumsi bahwa apabila distribusi tergambar dalam kurva juling positif,
yang kurang sempurna adalah soal-soal testnya, yaitu terlalu sukar. Dengan demikian
nilai siswa lalu direntangken sedimikian rupa sehingga tersebar dari nilai tertinggi ke
nilai rendah, dengan sebagian terbesar terletak pada nilai sedang. Demikian pula
sebaliknya apabila skor siswa tergambar dalam kurva juling negative. Dalam ubahan
menjadi nilai, disebarkan sedemikian rupa sehingga menjadi kurva normal, dengan
nilai sedang adalah nilai yang paling banyak.
Ubahan nilai dari skor-skor yang mengumpul dibawah atau diatas dapat
dilihat dalam gambar-gambar berikut ini.

__ = nilai berdasarkan standar mutlak


24

--- = nilai berdasakan standar relative

3. Standar nilai
Dari distribusi nilai, kita dapat mambicarakan masalah standar nilai. Skor-skor
siswa direntangkan menjadi9 nilai (disebut juga standar nines atau stanines) seperti
berikut ini:
Stanines Interprestasi
9. (4%) Tinggi (4%)
8. (7%) Diatas
7 (12) Rata-rata (19%)
6 (17%) Rata-rata (54%)
5 (20%)
4 (17%)
3 (12%) Di bawah
2 (7%) Rata-rata (19%)
1 (4%) Rendah (4%)

Dengan adanya persentase yang ditentukan inilah maka semua situasi skor
siswa dapat direntangkan menjadi nilai 1 – 9.
Selain dengan standar sembilan (stanines), ada pula yang menggunakan
standar enam. Dalam hal ini, hanya berkisar antara 4 – 9, yaitu nilai-nilai 4,5,6,7,8,
dan 9. persentase penyebaran nilai dengan standar 6 adalah sebagai berikut:

Standar enam Interpresentasi


9 (5%) Baik sekali
8 (10%) Baik
7 (20%) Lebih dari cukup
6 (40%) Cukup
5 (20%) Kurang
4 (5%) Kurang sekali
25

Standar eleven (stanel)

Dengan stanel ini, system penilaian membagi skala menjadi 11 golongan,


yaitu angka-angka 0,1,2,3,4,5,6,7,8,9,10, yang satu sama lainnya berjarak sama. Tiap-
tiap angka menempati interval sebesar 0,55 SD, bertitik tolak dari mean = 5 yang
menempati jarak antara -0,275 SD sampai +0,275 SD. Seluruh jarak yang digunakan
adalah dari -3,025 SD sampai ++3,025 SD.

Dasar pikiran untuk stanel ini adalah bahwa jarak praktis daklam kurva
normal adalah 6 SD yang terbagi atas 11 skala.

Standar sepuluh
Untuk mengolah hasil te, digunakan standar relative, dengan nilai berskala 1 –
10. untuk mengubah skor menjadi nilai, diperlukan dahulu:
1. mean (rata-rata skor)
2. deviasi standar (simpangan baku).
3. table konversi angka kedalam nilai berskala 1 – 10.
Tahap-tahap yang dilalui dalam mengubah skor mentah menjadi nilai berskala 1 – 10
adalah sebagai berikut:
1) menyusun distribusi frekuensi dari angka-angka atau skor-skor mentah.
2) Menghitung rata-rata skor (mean).
3) Menghitung deviasi standar atau standar deviasi.
4) Mentrnsformasi (mengubah) angka-angka mentah ke dalam nilai berskala 1 –
10.
Menghitung mean
Langkah-langkahnya ialah:
26

a) Menentukan mean duga (atau mean terkaan), yang biasanya diambil pada
kelas interval yang mempunyai frekuensi terbesar.
Besarnya MT (mean terkaan) adalah jumlah batas-batas kelas interval dibagi 2.
b) Menentukan deviasi duga (menberi symbol d) dimana pada kelas interval
yang mengandung MT diberi symbol 0, dan naik satu-satusetiap kelas interval
di atasnya, dan turun satu-satu setiap interval di bawahnya.
c) Menghitung mean yang sebenarnya dengan rumus.
Menghitung nilai berskala 1 – 10
Table koversi yang digunakan dalam mengubah angka menjadi nilai berskala
1-10 adalah sebagai berikut:
TABEL KONVERSI ANGKA KE DALAM NILAI BERSKALA
Skala sigma Skala 1-10 Skala angka
+2,5 SD 10 Mean + (2,25) SD
+1,75 SD 9 Mean + (1,75) SD
+1,25 SD 8 Mean + (1,25) SD
+0,75 SD 7 Mean + (0,75) SD
+0,25 SD 6 Mean + (0,25) SD
-0,25 SD 5 Mean - (0,25) SD
-0,75 SD 4 Mean - (0,75) SD
-1,25 SD 3 Mean - (1,25) SD
-1,75 SD 2 Mean - (1,75) SD
-2,25 SD 1 Mean - (2,25) SD

Dengan table ini jika diterapkan pada data yang kita peroleh dari perhitungan
mean dan deviasi standar di depan, akan terdapat table konversi sebagai berikut:

TABEL KONVERSI ANGKA KE DALAM NILAI BERSKALA 0-100


Skala sigma Skala 0-10 Skala angka
+2,25 SD 10 36,25 +(2,25) (12,2) = 63,73
27

+1,75 SD 9 36,25 +(1,75) (12,2) = 57,63


+1,25 SD 8 36,25 +(1,25) (12,2) = 51,53
+0,75 SD 7 36,25 +(0,75) (12,2) = 45,63
+0,25 SD 6 36,25 +(0,25) (12,2) = 39,33
-0,25 SD 5 36,25 –(0,25) (12,2) = 33,23
-0,75 SD 4 36,25 –(0,75) (12,2) = 27,73
-1,25 SD 3 36,25 –(1,25) (12,2) = 21,03
-1,75 SD 2 36,25 –(1,75) (12,2) = 14,93
-2,25 SD 1 36,25 –(2,25) (12,2) = 8,83
0

Dalam contoh perhitungan ini siswa yang mendapat skor + 63,73 diubah menjadi
nilai 10. Selanjutnya siswa yang mendapat skor ≤ 8,83 di ubah menjadi nilai 0. untuk
nilai-nilai 1 sampai dengan 9 adalah ubahan dari skor diantara batas-batas skor yang
sudah ditentukan dalam tabel.
Dengan berdasarkan atas skala angka ini, maka dengan mudah dapat di
transformasikan skor-skor siswa yang ada, menjadi nilai berskala 1-10.

Standar lima
Menurut Gronlund ia mengemukakan penyebaran nilai dengan angka, juga
mengemukan penyebaran nilai dengan huruf yang digambarkan dengan kurva normal
sebagai berikut:
28

-1,5 -0,5 0,5


1,5

E D C B A
7% 24% 38% 24% 7%

Catatan:
1. gronlund tidak menggunakan huruf E tetapi huruf F singkatan dari Fail
(gagal).
2. gronlund: rentangan ini hanya berlaku bagi populasi yang sangat heterogen.
Apabila populasi telah terseleksi akibat kenaikan kelasatau pindah ke tingkat
sekolah yang lebih tinggi, maka golongan F yang ada di ekor kiri akan
berkurang sehingga distribusi terse4but menjadi:

A --- 10 sampai 20%


B --- 20 sampai 30 %
C --- 40 sampai 50%
D --- 10 sampai 20%
F --- 0 sampai 10%

BAB VIII

Menilai Kualitas Alat Evaluasi

Analisis secara kualitatif dilakukan dengan melakukan penelaahan terhadap setiap


butir soal dari aspek materi, konstruksi dan bahasa. Aspek materi yang ditelaah berkaitan
dengan substansi keilmuan yang ditanyakan dalam butir tes serta tingkat kemampuan yang
sesuai dengan tes. Analisis konstruksi dimaksudkan untuk melihat hal-hal yang berkaitan
dengan kaidah penulisan tes. Analisis bahasa dimaksudkan untuk menelaah tes berkaitan
29

dengan penggunaan bahasa Indonesia yang baik dan benar menurut Ejaan Yang
Disempurnakan (EYD). 

Telaah secara kualitatif dilakukan oleh tiga orang yang memiliki kompetensi sesuai
dengan aspek materi konstruksi dan bahasa. Setiap penelaah melakukan analisis terhadap
setiap butir soal berdasarkan kriteria yang telah ditetapkan sebelumnya dengan menuliskan
huruf “Y” jika butir sesuai dengan kriteria dan huruf “T” jika butir tidak sesuai dengan
kriteria yang telah ditetapkan.

Hasil telaah kemudian dirangkum untuk selanjutnya ditentukan kualitas butir secara
teoretis dengan menggunakan kriteria sebagai berikut: 

 Butir tes yang baik yaitu butir yang memenuhi semua kriteria yang telah
ditentukan.
 Butir tes yang kurang baik yaitu butir yang hanya memenuhi sebanyak-banyaknya
3 kriteria aspek konstruksi serta 1 kriteria aspek materi dan bahasa.
 Butir tes yang tidak baik yaitu butir yang tidak memenuhi semua kriteria yang
telah ditetapkan pada aspek materi 1 dan 3, atau lebih dari 3 untuk aspek
konstruksi serta lebih dari 1 kriteria pada aspek bahasa.

Dari rangkuman hasil telaah kualitatif selanjutnya dapat ditentukan butir mana yang
sudah atau belum memenuhi kriteria pada aspek materi kontruksi yang sudah atau belum
memenuhi kriteria pada aspek materi tentang butir yang baik dan tidak baik.

Daftar Pustaka

Arikunto, S. (1999) Dasar-dasar Evaluasi Pendidikan, Jakarta: Bumi Aksara

http://aderusliana.wordpress.com/2007/11/05/konsep-dasar-evaluasi-hasil-belajar/

pengertian-fungsi-dan-prosedur-evaluasi-pembelajaran.html | anton blog


http://gurupkn.wordpress.com/2008/01/17/evaluasi-pembelajaran/
evaluasipendidikan@yahoo.co.id
30

Anda mungkin juga menyukai