Anda di halaman 1dari 96

Dasar-dasar Evaluasi Pendidikan

BAB I
PENDAHULUAN

1.1 Pengertian Pengukuran, Penilaian dan Evaluasi


Pada umumnya sementara orang lebih cenderung ketiga kata
tersebut suatu pengertian yang sama sehingga dalam memakainya hanya
tergantung dari kata mana yang akan siap untuk di ucapkannya.Akan
tetapi sementara orang yang lain,membedakan kata tersebut.Dan untuk
memahami apa persamaan, peresaan,ataupun hubungan antara
ketiganya,dapat di pahami melalui contoh-contoh di bawah ini.
a. Apabilah ada seorang ynag memberikan sebatang pensil kepada
kita,dan kita di suruh memilih antara dua pensil yang tidak sama
panjang nya,maka kita akan tentunya memilih yang”panjang”.Kita
tidak akan memilih yang “pendek” kecuali ada alas an yang sangat
khusus.
b. Pasar,adalah suatu tempat bertemunya orang-orang yang akn
menjual dan membeli.Sebelumnya akan menentukan barang yng
jan di belinya,seorang pembelih akan menentukan barang yang
“baik” menurut ukurannya.Apabilah ia ingin membeli
jeruk,dipilihnya jeruk yang besar;kuning,dan kulitnya
halus.semuanya itu di pertimbangkan menurut pengalaman
sebelunya,jenis jeruk-jeruk yang demikian ini rasanyaakan
manis.Sedangkan jenis jruk yang masih kecil ”hijau”dan kulitnya
agak kasar,biasanya masam rasanya.
Dari contoh-contoh di atas dapat kita simpulkan bahwa sebelum
menentukan pilihan,kita mengadakan penilaian terhadap benda-benda
yang akan kita pilih.Dalam contohpertama kita memilih mana pensil
yang lebih panjang,sedangkan dalam contoh yang kedua kita
menentukan dengan perkiraan kita atas jeruk yang baik,yaitu yang
rasanya manis.
Untuk dapat mngadakan penilaian, kita mengadakan pengukuran
terlebih dahulu.Jika ada penggaris,maka menentukan mana pensil yang
lebih panjang,kita ukur lebih dahulu kedua pensil tersebut.Dan setelah
1
Dasar-dasar Evaluasi Pendidikan

mengetaui mana berapa panjang amsing-masing pensil itu,kita


mengadakan penilaian dengan melihat bandingan panjang antara kedua
pensil tersebut.Dapatlah kita menyatakan “ini pensil panjang,dan ini
pensil pendek” Mana pensil yang panjang ,itulah yang kita ambil.
Untuk menentukan mana jeruk yang manis,kita tidak menggunakan
“ukuran manis”<tetapi menggunakan ukuran besar,kuning, dan halus
kulitnya.Ukuran ini tidak memiliki wujud seperti kayu penggaris yang
sudah di tera,tetapi di peroleh berdasarkan pengalaman.
Sebenarnya juga kita mengukur,yakni membandingkan jeruk –jeruk
yang adadengan ukuran tertentu.Setelah itu kita menilai, menentukan
mana jeruk yang paling memenuhi ukuran itulah yang kita ambil.
Dengan demikian kita mengenal dua macam ukuran,yaitu dengan
ukuran yang terstandar (meter,kilogram,takaran dan sebagainya) dan
ukuran perkiraan berdasarkan hasil pengalaman (jeruk manis adalah
yang kuning,besar dan halus kulitnya).
Duah langkah yang di lalui sebelum mengambil barang untuk
kita,itulah yang di sebut mengadakan evaluasi,yakni menguku dan
menilai.Kita tidak dapat mengadakan penilaian sebelum kita
mengadakan pengukuran.
- Mengukur adalah membandingkan sesuatu dengan satu
ukuran.Pengukuran bersifat kuantitatif.
- Menilai mengambil suatu keputusan terhadap sesuatu dengan
ukuran baik buruk.penilaian bersifat kualitatif.
- Mengadakan evaluasi meliputih kedua langkah di atas ,yakni
mengukur dan menilai.
Di dalam istilah asingnya.pengukuran adalah measurement, sedang
penilaian adalah evaluasi.dari kataevaluation di peroleh kata Indonesia
evaluasi yang berarti menilai (tetapi dilakukan dengan mengukur
terlebih dahulu).Dibuku ini ketiga istilah tersebut di gunakan bergantian
tanpa mengubah makna.

2
Dasar-dasar Evaluasi Pendidikan

1.2 Penilaian Pendidikan


Meskipun kini memiliki makna yang lebih luas,namun pada
awalnya pengertian evaluasi pendidikan selalu di kaitkan dengan prestasi
belajar siswa.Definisi pertama di kembangkan oleh Ralph Tyler (1990).Ali
ini mengatakan bahwa evaluasi merupakan sebuah proses pengumpulan
data untuk menentukan sejauh mana,dalam hal apa, dan bagaimana
tujuan pendidikan yang sudah tercapai.Jika belum,bagaimana yang belum
dan apa sebabnya.Definisi yang lebih luas di kemukakan oleh dua ahli
yang lain yakni cronbach dan Stufflebeam. Tambahan definisi tersebut
adalah bahwa proses evaluasi bukan sekedar mengukur sejauh mana
tujuan tercapai. Tetapi di gunakan untuk membuat keputusan.
Dalam pembelajaran yang terjadi di sekolah atau khususnya di
kelas,guru adalah pihak yang paling bertanggung jawab atas
hasilnya.Dengan demikian,guru patut di bekali dengan evaluasi sebagai
ilmu yang mendukung tugasnya,yakni mengevalusi hasil belajar
siswa.Dalam hal ini guru bertugas mengukur apakah siswa sudah
menguasai ilmu yang dipelajari siswa dengan bimbingan guru sesuai
dengan tujuan yang di rumuskan.
Apabilah sekolah di umpamakan sebagai tempat mengolah sesuatu
dan calon siswa di umpamakan sebagai bahan mentah makah lulusan dari
sekolah itu dapat di samakan dengan hasil olahan yang sudah siap di
gunakan.Dalam istilah inovasi yang menggunakan teknologi maka tempat
pengolah ini di sebut transformasi.
Jika di gambarkan dalam bentuk diagram akan terlihat sebagai
brikut:

Input Transforma output


si

Umpan
balik 3
Dasar-dasar Evaluasi Pendidikan

- Input
Adalah bahan mentah yang akan dimasukan kedalam
transformasi.Dalam dunia sekolah maka yang dimaksud dengan
bahan mentah adalah calon siswa yang akan memasuki
sekolah.Sebelum memasuki suatu tingkat sekolah (institusi),calon
siswa itu di nilai dahulu kemampuannya. Dengan penilaian itu
ingin diketahui apakah kelak ia akan mampu mengkuti pelajaran
dan melaksanakan tugas-tugas yang akan di berikan kepadanya.
- output
Yang dimaksud dengan output atau keluaran atau bahan jadi
yang di hasilkan oleh transformasi.
- Transformasi
Yang dimaksud dengan transformasi adalah mesin yang
bertugas mengubah bahan mentah menjadi bahan jadi.
- umpan balik (feetback)
Yang dimaksud dengan umpan balik atau balikan adalah
segalah informasi baik yang menyangkut output maupun
transformasi.

1.3 Mengapa Menilai


Jika sebelum membeli jeruk tidak memilih terlebih dahulu mana
jeruk yang baik di bandingkan dengan yang kurang baik,maka kita akan
memperoleh jeruk yang seadanya.
Mungkin baik,tetapi ada kemungkinan juga tidak baik.Yang jelas kita
belum memperoleh jeruk yang berkualitas jika tidak di dahului dengan
kegiatan menilai.
a. Makna bagi siswa
Hasil yang di peroleh oleh siswa dari pekerjaan menilai ada dua
kemungkinan.
1). Memuaskan
Jika siswa memperoleh hasil memuaskan dan hal itu menyenangkan
tentu, kepuasan itu akan diperolehnya lagi pada lain kesempatan
waktu.
4
Dasar-dasar Evaluasi Pendidikan

2). Tidak memuaskan


Jika siswa tidak puas dengan hasil yang di peroleh,dia akan
berusaha agar lain kali keadaan itu tidak terulang lagi,Maka ia lalu
belajar giat.Namun demikian,keadaan dapat saja bisa terjadi.
b. Makna bagi guru
1) Dengan hasil penilaian yang di peroleh guru akan dapat
mengetahui siswa-siswa mana yang berhak melanjutkan
pelajarannya karena sudah berhasil menguasai bahan,maupun
mengetahui siswa-siswa yang belum mengetahui bahan..
2) Guru akan mengetahui apakah materi yang diajarkan suda tepat
bagi siswa sehingga untuk memberikan pengajaran di waktu yang
akan datang tidak perlu diadakan perubahan.
3) Guru akan mengetahui apakah metode yang digunakan suda tepat
atau belum.
c. makna bagi sekolah
1) Apabila guru-guru mengadakan penilaian dan diketahui bagaimna
hasil belajar siswa-siswanya, dapat diketahui pula apakah kondisi
belajar yang diciptakan oleh sekolah sudah sesuai dengan
harapan atau belum. Hasil belajar merupakan cermin kualitas
suatu sekolah
2) Informasi dari guru tentang tepat tidaknya kurikulum untuk
sekolah itu dapat merupakan bahan pertimbangan bagi
perencanaan sekolah untuk masa-masa yang akan datang.
3) Informasi hasil penilaian yang diperoleh dari tahun ke tahun,
dapat di gunakan sebagai pedoman bagi sekolah, yang dilakukan
oleh sekolah sudah memenuhi standar atau belum. Pemenuhan
standar atau belum.
Secara rinci dan sesuai urusan kejadiannya, dalam proses
transformasi ini penilaian dibedakan atas tiga jenis ; yakni sebelum,
selama dansesuadah proses dalam kegiatan sekolah.

5
Dasar-dasar Evaluasi Pendidikan

1.4 Tujuan atau Fungsi Penilaian


Dengan mengetahui makna penilaian ditinjau dari berbagai segi
dalam system pendidikan, maka dengan cara lain dapat dikatakan
bahwa tujuan atau fungsi penilaian ada beberapa hal
a. Penilaian berfungsi selektif
b. Penilaian berfungsi diagnostik
c. Penilaian berfungsi sebagai penempatan
d. Penilaian befungsi sebagai pengukur keberhasilan

1.5 Ciri-ciri Penilaian Dalam Pendidikan


Ciri-ciri penilaian dalam pendidikan, antara lain adalah sebagai
berikut
a. Ciri penilaian dari penlaian dalam pendidikan, yaitu bahwa
penilaian di lakukan secara tidak lansung. Dalam contoh ini, akan
mengukur kepandaian melalui ukuran kemampuan
menyelesaikan soal-soal
b. Ciri kedua dari penilaian pendidikan yaitu penggunaan ukuran
kuantitatif artinya menggunakan simbol bilangan sebagai hasil
pertama pengukuran. Setelah itu lalu diinterpretasikan ke bentuk
kualitatif.
c. Ciri ketiga dari penilaian pendidikan, yaitu bahwa penilaian
pendidikan mengunakan, unit-unit satuan-satuan yang tetap
Karenna IQ 105 termasuk anak normal. Anak lain yang hasil
pengukuran IQ nya 80, menurut unit ukurannya termasuk anak
dungu
d. Ciri keempat dari penilaian adalah bersifat relative artinya tidak
sama atau tidak selalu tetap dari satu waktu yang lain
e. Ciri kelima dalam penelitian pendidikan adalah bahwa penilaian
pendidikan itu sering terjadi kesalahan-kesalahan. Adapun
sumber kesalahan ditinjau dari berbagai factor yaitu:
1) Terletak pada alat ukur
2) Terletak pada orang yang melakukan penilaian
3) Terletak pada anank yang di nilai
6
Dasar-dasar Evaluasi Pendidikan

4) Terletak pada situasi di mana penelitian berlansung

a. Input
1) Kemampuan
2) Kepribadian
3) Sikap-sikap
4) Inteligensi
b. Transformasi
Unsur unsur dalam transformasi yang menjadi objek penilaian
antara lain:
1) kurikulum/materi,
2) metode dan cara penilaian,
3) system administrasi,
4) guru dan personal lainya.

7
Dasar-dasar Evaluasi Pendidikan

BAB II
SUBJEK DAN SASARAN EVALUASI

2.1 Subjek Evaluasi


Yang dimaksud dengan subjek evaluasi adalah orang yang
melakukan pekerjaan evaluasi. Siapa yang dapat disebut dengan subjek
evaluasi untuk setiap test, di tentukan oleh suatu aturan pembagian
tugas atau ketentuan yang berlaku.
Dalam keterangan ini, penulis mengatagorikan pelaksana evaluasi
sebagai subjek evaluasi.ada pandangan lain yang disebut subjek evaluasi
asalah siswa, yakni orang yang di evaluasi.pandangan lain
mengklasifikasikan siswa sebagai objek evaluasi dan guru sebagai
subjeknya.

2.2 Sasaran Evaluasi


Apabila kita kembali kepada diagram di bab 1, kita akan ingat
kembali apa yang menjadi sasaran dari penilaian. Objek atau sasaran
penilaian adalah segala sesuatu yang menjadi titik pusat pengamatan
karena penilaian menginginkan informasi tentang sesuatu tersebut.
Dengan masih menggunakan diagram tentang transformasi maka
sasaran penilaian untuk unsure-unsurnya meliputi: input, transformasi
dan output.
a. Input
1). Kemampuan
2). kepribadianI

3). Sikap-sikap

4). Inteligensi

b. transformasi

Unsur-unsur dalam transformasi yang menjadi objek penilaian


antara lain:

8
Dasar-dasar Evaluasi Pendidikan

1). Kurikulum/materi,

2). Metode dan cara penilaan,

3). Sarana pendidikan/media,

4). System administrasi

5). Guru dan personal lainnya

c. Output
Penilaian terhadap lulusan suatu sekolah dilakukan untuk
mengetahui seberapa jauh tingkat pencapaian/prestasi belajar
mereka selama mengikuti program alat yang digunakan untuk
mengukur pencapaian ini disebut tes pencapaian atau
achievement test

9
Dasar-dasar Evaluasi Pendidikan

BAB III
PRINSIP DAN ALAT EVALUASI

3.1 Prinsip Evaluasi


Ada satu prinsip umum dan penting dalam kegiatan evaluasi, yaitu
adanya triangulasi—atau hubungan erat tiga komponen--,yaitu antara
(a). Tujuan pembelajaran,
(b). Kegiatan pembelajaran atau KBM, dan
(c). Evaluasi.
Triangulasi tersebut dapat di gambarkan dalam bagan sebagai
berikut.

Tujuan

KBM Evaluasi

3.2 Alat Evaluasi


Dalam pengertian umum,alat adalah sesuatu yang dapat di
gunakan untuk mempermudah seseorang untuk melaksanakan tugas
atau mencapai tujuan secara lebih aktif dan efisien.Kata “alat” biasa juga
di sebut dengan istilah”instrument”.Dengan demikian maka dengan alat
evaluasi juga di kenal dengan instrument evaluasi.

10
Dasar-dasar Evaluasi Pendidikan

Dengan pengertian tersebut maka alat evaluasidikatakan baik


apabila mampu mengevaluasi sesuatu yang di evaluasi dengan hasil
seperti keadaan yang di evaluasi.Dalam menggunakanalat tersebut
evaluator menggunakan cara atau teknik evaluasi,yaitu teknik
nontes,dan teknik tes.
a. Teknik nontes
Yang tergolong teknik nontes adalah:
- Skala bertingkat (rating scale)
- Kuesioner (questionair)
- Daftar cocok (chek list)
- Wawancara (interview)
- Pengamatan(observation)
- Riwayat hidup.
b. Teknik tes
Apakah sbenarnya teknik tesnitu? Adabermacam-macam teknik
rmusan tentang tes.Di dalam bukunya yang berjudul Evaluasi
pendidikan,Drs. Amir Daien indrakusuma mengatakan demikian:
“Tes adalah suatu alat atau prosedur sistematis dan ojektif
untuk memperoleh data-data atau keterangan-keterangan yang di
inginkan oleh seseorang,dengan cara yang boleh dikatakan tepat
dan cepat”
Definisi yang terakhir ditemukan disini adalah definisi yang
dikutipkan dari webster’s Colegiate.
Tes adalah serentetan pertanyaan atau latihan atau alat lain
yang digunakan untuk mengukur
ketrampilan,pengetahuan,inteligensi,kemampuan atau bakat yang
dimiliki oleh individu atau kelompok.
Dari beberapa kutipan dan uraian di atas dapat di simpulkan
bahwa tes mrupakan suatu alat pengumpul informasi tetapi jika di
bandingkan dengan alat-alat tes ini bersifat lebih resmi karena
penuh dengan batasa-batasan.
Ditinjau dari segi kegunaan untuk mengukur siswa,maka
dibedakan atas adanya 3 maam tes,yaitu:
11
Dasar-dasar Evaluasi Pendidikan

- Tes diagnostic
- Tes formatif,
- Tes sumatif.

BAB IV
MASALAH TES
4.1 Pengertian
Istilah tes di ambil dari kata testum suatu pengertian dalam bahasa
prancis kunoyang brarti piring untuk menyisikan logam-logam
mulia.Adapulah yang mengartikan sebagai sebuah piring yang di buat
dari tanah.
Seorang ahli bernama James Ms.Cattel, pada 1890 telah
memperkenalkan pengertian tes ini kepada masyarakat melalui bukunya
yang berjudul Mental tes and Measurement. Selanjutnya di amerika
Serikat tes nini berkembang dengan cepat sehingga dalam tempo yang
tidak begitu lama masyarakat mulai menggunakannya.
- Tes
(Sebelum adanya Ejaan Yang di sempurnakan dalam bahasa
Indonesia di tulis dengan test),adalah merupakan alat atau prosedur
yang digunakan utuk mengetahui atau mengukur atau sesuatu dalam
suasana,dengan cara dengan aturan-aturan yang sudah di
tentukan.Untuk mengerjakan tes ini tergantung pada tes yang
diberikan misalnya:mencoret jawaban yang salah,melakukan tugas
atau suruhan,menjawab svara lisan,dan sebagainya.
- Testing
Testing merupakan saat pada waktu tes itu di laksanakan.Dapat
juga di katakan testing adalah saat pengambilan tes.
- Testee

12
Dasar-dasar Evaluasi Pendidikan

(Dalam istilah Indonesia tercoba), adalah responden yang sedang


mengerjakan tes.
Orang-orang inilah yang akan di nilai atau di ukur,baik dalam
kemampuan,minat,bakat,pencapaian,dan sebagainya.
- Tester
(Dalam istilah indonesia pencoba),adalah orang yang diserahi untuk
melaksanakan pengambilan tes terhadap parah responden.dengan
kata lain tester,adalah subjek evaluasi (tetapi adakalanya hanya orang
yang di tunjuk oleh subjekevaluasiuntuk melaksanakan tugasnya.
4.2 Persyaratan Tes
Dari contoh dan keterangan ini semua dengan singkat dapat di
katakana bahwa sumber persyaratan tes didasarkan atas dua hal:
Pertama : menyangkut mutu tes.
Kedua : menyangkut pengaministrasian dalam pelaksanaan.
Walaupun dalam melaksanakan tes sudah di usahakan mengikuti
aturan tentang suasana,cara,dan prosedur yang telah di tentukan namun
tes itu sendiri mengandung kelemahan-kelemahan. Gilbert Sax (1980,31-
42)menyebutkan beberapa kelemahan sebagai berikut:
1). Adakalanya tes (secara psikologis terpaksa) menyinggung pribadi
seseorang.
2). Tes menimbulkan kecemasan sehingga mempengaruhi hasil belajar
yang murni.
3). Tes tidak mengategorikan secara tetap.
4). Tes mendukung kecemerlangan dan daya kreasi siswa
5). Tes hanya mengukur aspek tingkah laku yang sangat terbatas.

4.3 Ciri-ciri tes yang baik


Sebuah tes yang dapat dikatakan baik sebagai alat pengukur,harus
memenuhi persyaratan tes yaitu memiliki:
- Validitas
- Reabilitas.
- Objektifitas
- Praktikabilitas
13
Dasar-dasar Evaluasi Pendidikan

- Ekonomis.

BAB V
VALIDITAS

Mengevaluasi dapat diumpamakan sebagai pekerjaan memotret.


Gambar potret atau foto dikatakan baik apabila sesuai dengan aslinya.
Gambar pemotretan hasil evaluasi tersebut di dalam kegiatan evaluasi
dikenal dikenal dengan data evaluasi. Data evaluasi yang baik sesuai
dengan kenyataan disebut data valid. Agar dapat diperoleh data yang
valid, instrument atau alat untuk mengevaluasinya harus valid. Dengan
kata lain, instrument evaluasi dipersyaratkan valid agar hasil yang
diperoleh dari evaluasi valid.

5.1 Macam-macam Validitas


A test is valid if it measures what it purpose to measure yang dapat
diartikan: sebuah tes dikatakan valid apabila tes tersebut mengukur apa
yang hendak diukur. Dalam bahasa Indonesia ”valid” sama dengan
“sahih”.
Sebenarnya, pembicaraan validitas bukan ditekankan pada tes itu
sendiri tetapi pada hasil pengetesan atau skornya. Secara garis besar ada
dua macam validitas, yaitu validitas logis dan validitas empiris.
a. Validitas logis
Istilah validitas logis mengandung kata logis berasal dari kata
logika yang berarti penalaran.dengan makna demikian maka validitas
logis untuk sebuah instrument evaluasi menunjuk pada kondisi bagi
sebuah instrument yang memenuhi persyaratan valid berdasarkan hasil
penalaran.
14
Dasar-dasar Evaluasi Pendidikan

Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrument, yaitu: validitas isi yang menunjukan suatu kondisi sebuah
instrument yang disusun berdasarkan isi materi pelajaran yang
dievaluasi, dan validitas konstrak yang menunjukan suatu kondisi
sebuah instrument yang disusun berdasarkan konstrak atau aspek-aspek
kejiwaan yang seharusnya dievaluasi.

b. Validitas empiris
Kata empiris yang artinya pengalaman jadi, sebuah instrument
dapat dikatakan memiliki validitas empiris apabila sudah diuji dari
pengalaman.
Ada dua macam validitas empiris yaitu instrument yang kondisinya
sesuai dengan kriterium yang sudah tersedia yang disebut dengan
validitas “ada sekarang”. Yang kedua yaitu instrument yang kondisinya
sesuai dengan kriterium yang diramalakan akan terjadi yang disebut
dengan validitas ramalan/validitas prediksi.
Jadi secara keseluruhan validitas terbagi atas empat:
1. Validitas isi
2. Validitas konstrak
3. Validitas “ada sekarang”
4. Validitas prediksi

5.2 Cara Mengetahui Validitas Alat Ukur


Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan
kriterium dalam artian memiliki keejajaran antara hasil tes dengan
kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah
teknik korelasi product moment yang dikemukakan oleh Pearson.
Rumus korelasi product moment ada dua macam yaitu simpangan
dan angka kasar.
Rumus product moment dengan simpangan:

15
Dasar-dasar Evaluasi Pendidikan

Dimana:
rxy = koefisien korelasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan

∑xy = jumlah perkalian x dengan y


x2 = kuadrat dari x
y2 = kuadrat dari y
Contoh perhitungan:
Misalnya akan menghitung validitas tes prestasi belajar matematika.
Sebagian kriterium diambil dari rata-rata ulangan yang akan dicari
validitasnya diberi kode X dan rata-rata nilai harian diberi kode Y.
kemudian dibuat table persiapan sebagai berikut.

Tabel Persiapan Untuk Mencari Validitas Tes Prestasi Matematika

No. Nama X Y X y x2 y2 Xy
1. el 6,5 6,3 0 -0,1 0,0 0,01 0,0
2. Citra 7 6,8 + 0,5 +0,4 0,25 0,16 +0,2
3. ellha 7,5 7,2 +1,0 +0,8 1,0 0,64 +0,8
4. Tatox 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
5. Itho 6 7 -0,5 +0,6 0,25 0,36 -0,3
6. Itha 6 6,2 -0,5 -0,2 0,25 0,04 +0,1
7. Eki 5,5 5,1 -1,0 -1,3 1,0 1,69 +1,3
8. Echi 6,5 6 0 -0,4 0,0 0,16 0,0
9. Anyl 7 6,5 +0,5 +0,1 0,25 0,01 +0,05
10. ikha 6 5,9 -0,5 -0,6 0,25 0,36 +0,3

Jumlah 65,0 63,8 3,5 3,59 2,65

16
Dasar-dasar Evaluasi Pendidikan

x=X-

y=Y-

dimasukkan ke rumus

Indeks korelasi antara X dan Y inilah indeks validitas soal yang


dicari.
Rumus korelasi product momen dengan angka kasar

Dimana :
rXY = koefisien korelasi variabel X dan Y.

No. Nama X Y X2 Y2 xy
1. el 6,5 6,3 42,25 39,69 40,95
2. Citra 7 6,8 49 46,24 47,6
3. ellha 7,5 7,2 56,25 51,84 54,0
4. Tatox 7 6,8 49 46,24 47,6
5. Itho 6 7 36 49 42
6. Itha 6 6,2 36 38,44 37,2
7. Eki 5,5 5,1 30,25 26,01 28,05
8. Echi 6,5 6 42,25 45,5 39
9. Anyl 7 6,5 49 36 45,5
10. ikha 6 5,9 36 34,81 35,4

Jumlah 65,0 63,8 426 410,52 417,3

Dimasukkan dalam rumus :

17
Dasar-dasar Evaluasi Pendidikan

Jika dibandingkan dengan validitas soal yang dihitung dengan


rumus simpangan, ternyata terdapat perbedaan sebesar 0,003, lebih
besar yang dhitung dengan rumus simpangan. Hal ini wajar karena dalam
mengerjakan perkalian atau penjumlahan jika diperoleh tiga atau angka
di belakang koma dilakukan pembulatan ke atas. Perbedaan ini sangat
kecil sehingga dapat diabaikan.
Koefisien korelasi selalu terdapat antara -1,00 sampai +1,00.
Namun karena dalam menghitung sering dilakukan pembulatan angka-
angka, sangat mungkin diperoleh koefisien lebih dari 1,00. Koefisien
negative menunjukan hubungan kebalikan sedangkan koefisien positif
menunjukkan adanya kesejajaran untuk mengadakan interpretasi
mengenai besarnya koefisien korelasi adalah sebagai berikut:
- antara 0,800 sampai dengan 1,00 : sangat tinggi
- antara 0,600 sampai dengan 0,800 : tinggi
- antara 0,400 sampai dengan 0,600 : cukup
- antara 0,200 sampai dengan 0,400 : rendah
- antara 0,000 sampai dengan 0,200 : sangat rendah
Penafsiran harga koefisien korelasi ada dua cara yaitu:
1. Dengan melihat harga r dan diinterpretasikan misalnya korelasi
tinggi, cukup, dan sebagainya.
2. Dengan berkonsultasi ke table
harga titik r product moment sehingga dapat diketahui signifikan
tidaknya korelasi tersebut. Jika harga r lebih kecil dari harga kritik
dalam table, maka korelasi tersebut tidak signifikan. Begitu juga
arti sebaliknya.

5.3 Validitas Butir Soal Atau Validitas Item


18
Dasar-dasar Evaluasi Pendidikan

Secara umum validitas item dari sebuah item dapat dikatakan valid
apabila mempunyai dukungan yang besar terhadap skor total. Skor pada
item menyebabkan skor total menjadi tinggi atau rendah.
Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1
(bagi item yang dijawab benar) dan 0 (item yang dijawab salah).
Sedangkan skor total selanjutnya merupakan jumlah dari skor untuk
semua item yang membangun soal tersebut.

Tabel Analisis Item Untuk Perhitungan Validitas Item

No. Nama Butir soal/item Skor


1 2 3 4 5 6 7 8 9 10 total
1. ikha 1 0 1 0 1 1 1 1 1 1 8
2. anyl 0 0 1 0 1 0 0 1 1 1 5
3. Tatox 0 1 0 0 0 1 0 1 0 1 4
4. Itho 1 1 0 0 1 1 0 0 1 0 5
5. Itha 1 1 1 1 1 1 0 0 0 0 6
6. Eki 1 0 1 0 1 0 1 0 0 0 4
7. Echi 1 1 1 1 1 1 1 0 0 0 7
8. riry 0 1 0 1 1 1 1 1 1 1 8

Contoh perhitungan mencari validitas item


Untuk mencari validitas item,dibuat terlebih dahulu table berikut:
Tabel persiapan untuk menghitu validitas item nomor 6
No. Nama X y
1. ikha 1 8
2. anyl 0 5
3. Tatox 1 4
4. Itho 1 5

19
Dasar-dasar Evaluasi Pendidikan

5. Itha 1 6
6. Eki 0 4
7. Echi 1 7
8. Riry 1 8

Keterangan :
X = skor item nomor 6
Y = skor total
Dari perhitungan kalkulator diperoleh data sebagai berikut ;
∑X = 6 ∑x2 = 6
∑Y = 46 ∑Y2 = 288
∑XY = 37

1
= 5,57

p
= 6,17

Jadi koefisien item nomor 6 adalah 0,421.


Cara lain untuk menghitung validitas item :

Keterangan :
= koefisien korelasi biserial

Mp = rerata skor (dari yang menjawab betul)


Mt = rerata skor
St = standar deviasi dari skor total

20
Dasar-dasar Evaluasi Pendidikan

P = proporsi siswa dari skor total


Q = proporsi siswa yang menjawab salah

5.4 Tes Terstandar Sebagai Kriterium Dalam Menentukan Validitas


Tes terstandar adalah tes yang telah dicobakan berkali-kali
sehingga dapat dijamin kebaikannya. Dinegara-negara berkembang biasa
tersedia tes smacam ini. Sebuah tes berstandar biasanya memiliki
identitas antara lain : sudah dicobakn beberapa kali, berapa koefisien
validitas, reliabilitas, taraf kesukaran, daya pembeda dan keterangan
yang dianggap perlu.
Contoh ;

Table Persiapan Perhitungan Validitas Tes Matematika Dengan


Kriterium Tes Terstandar

No. Nama X Y X2 Y2 XY Keterangan


1. Aristo 5 7 25 49 35 X = hasil tes
2. Plato 6 6 36 36 36 matematika yang
3. Rene 5 6 25 36 30 dicari validiatsnya
4. Kant 6 7 36 49 42
5. Aquinas 7 7 49 49 49 Y = hasil tes
6. Sartre 6 5 36 25 30 terstandar
Jumlah 35 38 207 244 222

Jadi validitasnya ; 0,89 x 0,108 = 0,96 (jika tes terstandanya 0.89).

21
Dasar-dasar Evaluasi Pendidikan

5.5 Validitas Factor


Validitas factor dikatakan valid apabila mempunyai dukungan yang
besar terhadap soal-soal secara keseluruhan materi.

22
Dasar-dasar Evaluasi Pendidikan

Contoh :
Butir 1 2 3 4 5 6 7 8 Skor 9 10 11 12 13 14 15 16 17 18 19 20 Skor 21 22 23 24 25 26 27 28 29 30 Skor Skor
factor factor factor total
Subjek 1 2 3
Aristo 1 0 1 1 1 1 0 1 6 1 0 1 0 1 0 1 0 1 0 1 0 6 1 0 1 1 1 0 1 1 1 0 7 19
Plato 1 1 1 1 1 1 1 0 7 1 1 1 1 0 1 1 1 1 0 0 1 9 1 1 1 1 1 1 1 1 1 0 9 25
Rene 1 0 1 0 1 0 1 0 4 1 1 0 0 0 0 1 1 0 1 1 0 6 1 0 1 1 0 1 1 0 1 1 7 17
Curie 0 1 1 0 0 0 0 1 3 0 0 0 1 1 0 1 0 1 0 0 0 4 1 0 0 0 1 0 0 1 1 1 5 12
Kant 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 0 1 1 11 1 1 1 1 1 1 1 1 1 1 10 29
Aquinas 1 1 0 1 1 0 1 1 6 1 0 1 1 1 1 1 1 0 1 1 0 9 1 1 1 1 1 0 0 1 1 1 8 23
Anaxi 1 0 1 0 1 1 0 1 5 1 0 0 0 1 1 1 0 1 1 1 0 7 1 1 1 1 0 0 0 1 1 1 7 19
Zeno 1 1 1 1 1 0 1 1 7 1 1 1 1 1 0 1 1 1 1 0 1 10 1 1 1 1 1 1 1 1 1 0 9 26
Hobbes 1 1 1 0 0 0 1 1 5 1 0 1 1 0 0 0 0 1 1 1 0 6 1 1 0 1 1 0 0 1 0 0 5 16
Sartre 1 0 1 0 1 0 1 0 4 1 0 0 0 0 0 0 1 1 1 0 1 5 1 1 0 1 1 0 0 0 1 1 6 15
Paul 1 1 1 1 1 1 1 0 7 1 1 1 1 1 1 1 1 1 1 0 0 10 1 1 1 1 1 1 1 0 1 1 9 26
Newton 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 1 1 1 12 1 1 1 1 1 1 1 1 1 1 10 30
Galileo 1 0 0 0 1 1 1 1 5 1 1 0 1 1 0 1 1 0 1 1 0 8 1 1 0 0 0 1 1 1 1 1 7 20

Table analisis butir untuk menghitung validitas butir dan validitas factor

23
Dasar-dasar Evaluasi Pendidikan

Cara mengetahui kesejajaran digunakan juga rumus korelasii product


moment. Misalnya kita kita akan mengtahui valliditas vaktor 1, yakni
soal-soal untuk materi bunyi, kita membuat daftar untuk menyejajarkan
sebagai berikut.

TABEL UNTUK MENGHITUNG KESEJAJARAN SKOR FAKTOR 1 DENGAN


SKOR TOTAL
Nama Subjek Skor Faktor 1 Skor Total X2 Y2 XY
(X) (Y)
Aristo 6 19 36 361 114
Plato 7 25 49 625 175
Rene 4 17 16 289 68
Curie 3 12 9 144 36
Kant 8 29 64 841 232
Aquinas 6 23 36 529 138
Anaxi 5 19 25 361 95
Zeno 7 26 49 676 182
Hobbes 5 16 25 256 80
Sartre 4 15 16 225 60
Paul 7 26 49 676 182
Newton 8 30 64 900 240
Galileo 5 20 25 400 100
Jumlah

Data yang tertera di dalam table tersebut digunakan untuk menentukan


besarnya validitas factor 1. Langkah selanjutnya adalah menjumlahkan
setiap kolom, kemudian dimasukkan ke dalam rumus korelasi product
moment. Harga r yang diperoleh menunjukkan indeks validitas factor 1.
Untuk factor 2 dan factor 3 caranya sama,hanya skor faktornya saja yang
diganti.

24
Dasar-dasar Evaluasi Pendidikan

BAB VI
RELIABILITAS

6.1 Arti Reliabilitas Bagi Sebuah Tes


Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes
dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes
tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas
berkaitan dengan masalah ketetapan hasil tes. Seandainya hasil berubah-
ubah, perubahan yang terjadi dikatakan tidak berarti.
Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dkk
menyatakan bahwa persyaratan bagi tes yaitu validitas dan reliabilitas ini
penting. Dalam hal ini validitas lebih penting dan reliabilitas ini perlu
karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable
tapi tidak valid. Sebaliknya, sebuah tes yang valid biasanya reliable.
Beberapahal yang mempengaruhi hasil tes banyak sekali. Namun secara
garis besar dikelompokkan menjadi 3 hal:
a. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan
kualitas butir-butir soalnya.
Dalam menghitung besarnya reliabilitas berhubungan dengan
penambahan banyaknya butir soal dalam tes ini ada sebuah rumus
yang diberikan oleh Spearman dan Borwn sehingga dikenal rumus
Spearman – Brown.
Rumusnya adalah:

Dimana:
rnn = besarnya koefisien reliabilitas sesudah tes tersebut ditambag
butir soal baru
n = berapa kali butir-butir soal itu ditambah
r = besarnya koefisien reliabilitas sebelum butir-butir soalnya
ditambah

25
Dasar-dasar Evaluasi Pendidikan

b. Hal yang berhubungan dengan tercoba (testee)


Suatu tes yang dicobakan pada kelompok yang terdiri dari banyak
siswa akan mencerminkan keragaman hasil yang menggambarkan
besar-kecilnya relabilitas tes. Tes yang dicobakan kepada kelompok
yang bukan terpilih, akan menunjukkan reliabilitas yang lebih besar
daripada yang dicobakan pada kelompok tertentu yang diambil
secara dipilih.
c. Hal yang berhubungan dengan penyelenggaraan tes
Sudah disebutkan bahwa factor penyelenggaraan tes yang bersifat
administratif. Sangat menentukkan hasil tes.

6.2 Cara-cara mencari besarnya reliabilitas


Kriterium yang digunakan untuk ketetapan ada ang berada di luar
tes dan pada tes itu sendiri.
a. Metode bentuk paralel (equivalent)
Tes paralel adalah dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran dan susunan tetapi butir-butir soalnya berbeda.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya
berat karena harus menyusun dua seri tes. Lagi pula harus tersedia
waktu yang lama untuk mncobakan dua kali tes.
b. Metode tes ulang (test-retest method).
Metode ini dilakukan orang untuk menghindari penyusuan dua seri
tes. Dalam menggunakan metode ini pengetes hanya memiliki satu
seri tes tetapi dicobakan dua kali. Oleh karena tesnya hanya satu
dan dicobakan dua kali maka metode ini disebut single-test-double-
trial method. Kemudian hasil dari kedua kali tes tersebut dihitung
korelasinya.
c. Metode belah dua atau split-half method
Dalam menggunakan metode ini pengetes hanya menggunakan
sebuah tes dan dicobakan satu kali. Olehnya disebut juga single-
test-single-trial method.

26
Dasar-dasar Evaluasi Pendidikan

Contoh perhitungan reliabilitas dengan metode belah dua


Langkah pertama yaitu dengan mengadakan anlisis butir soal yang
lebih terkenal dengan analisis item. Item yang dapat dujawab dengan
benar diberi skor dan bagi yang salah diberi skor 0.
1. Pembelahan ganjil-genap
Contoh:
Misalnya setelah dihitung dengan rumus korelasi product moment
dengan angka kasar diketahui bahwa rxy = -0,3786. Harga tersebut
menunjukkan teliabilitas separoh tes. Oleh karena itu rxy untuk belah
ini dsebut dengan istliah r½½ atau rgg singkatan dari rgenap-ganjil. Untuk
mencari reliabilitas seluruh tes digunakan rumus Spearman-Brown.
Jika koefisien reiabilitas separo tes ini dimasukkan ke dalam rumus
hitungganya:

2. Pembelahan awal-akhir
Tabel Jumlah Skor Belahan Awal-Akhir
No. Nama Item ganjil Item genap
(1,3. 5.7.9) (2,4,6,8,10)
(X) (Y)
1. Hartati 3 5
2. Yoyok 2 3
3. Oktaf 1 3
4. Wendi 3 2
5. Diana 5 1
6. Paul 3 1
7. Susana 5 2
8. Helen 3 5

Kelanjutan dari table ini adalah menghitung rumus korelasi product


moment. Dengan menggunakan kalkulator diketahui:
27
Dasar-dasar Evaluasi Pendidikan

∑X = 25 ∑X2 = 91
∑Y = 22 ∑Y2 = 78
∑XY = 63

3. Penggunaan rumus Flanagan


Rumus Flanagan :

Dimana:
r11 = reliabilitas tes
= varians belahan pertama (skor item ganjil)

= varians belahan kedua (skor item genap)

= Varians total (skor total)

Secara sederhana dapat dipahami bahwa varians adalah standar


deviasi kuadrat.

Rumus varians :

4. Penggunaan rumus Rulon


Rumus Rulon :

Dimana :
= varians beda

d = difference perbedaan skor awal dengan skor akhir


5. Penggunaan rumus K-R 20
Rumusnya :

6. Penggunaan rumus K-R. 21

28
Dasar-dasar Evaluasi Pendidikan

Rumusnya :

Keterangan:
M = Mean atau rerata skor total

7. Penggunaan rumus Hoyt


Rumusnya :
atau

Keterangan:
r11 = Reliabilitas seluruh soal
Vr = Varians responden
Vs = Varian sisa

Lankah 1. Mencari kuadrat responden dengan rumus:

Keterangan:
Jk(r) = jumlah kuadrat responden
Xt = skor total tiap responden
k = banyaknya item
N = banyaknya responden atau subjek

Langkah 2. Mencari jumlah kuadrat item dengan rumus:

Keterangan:
Jk(i) = jumlah kuadrat item
∑B2 = jumlah kuadrat jawab benar seluruh item
29
Dasar-dasar Evaluasi Pendidikan

(∑X1)2 = kuadrat dari jumlah skor total

Langkah 3. Mencari jumlah kuadrat total dengan rumus

Keterangan:
Jk(t) = jumlah kuadrat total
∑B = jumlah jawab benar seluruh item
∑S = jumlah jawab salah seluruh item

Langkah 4. Mencari jumlah kuadrat sisa dengan rumus:

Langkah 5. Mencari Varians responden dan varians sisa dengan table F.

d.b. = banyaknya N setiap sumber variansi dikurangi 1

jadi Variansi =

langkah 6. Masuk ke rumus r11

30
Dasar-dasar Evaluasi Pendidikan

BAB VII
TAKSONOMI

7.1 Arti dan Letak Taksonomi Dalam Pendidkan


Tujuan pendidkan dapat dirumuskan pada tiga tingkatan
pertama,tujuan umum pendidikan.Tujuan ini menentukan perlu dan
tidaknya sesuatu program di adakan. Didalam praktek sehari-hari di
sekolah,tujuan ini dikekenal dengan TIU (tujuan instruksional
umu).Kedua, tujuan yang didasrkan terhadap tingkah laku.Dalam periode
20 tahun terakhir ini,banyak usaha yang telah dilakukan untuk mencari
metode yang di gunakan untuk menganalisis atau mengklasifikasikan
sebuah pandangan yang berhubungan dengan kegiatan sehari-hari.Yang
dimaksud adalah berhasilnya pendidikan dalam bentuk tingkah
laku.Inilah yang dimaksud dengan taksonomi (taxonomi). Ada tiga macam
tingkah laku yang di kenal umum,yaitu kognotif,efektif,dan
psikomotor(yang dalam hal ini penulis gunakan istilah
ketrampilan),berpendapat bahwa taksonomi yang dikemukakan oleh
Bloom dan kawan-kawan, adalah sangat bersifat mental.Mereka tidak
menjelaskan kepada pendidik secara kongkret dan dapat di amati.
Beberapa ahli telah memberikan cara bagaiman cara menyebut tiga
tingkata tujuan ini,yang akhirnya oleh VivianeDe Lansheere disimpulkan
bahwa ada 3 tinkat tujuan (termasuk taksonomi),yaitu:
a. Tujuan akhir atau tujuan umum pendidikan.
b. Taksonomi.
c. Tujuan yang operasional.

7.2 Taksonomi Bloom


Bloom dan Krathwholtelah banyak memberikan inspirasi kepada
banyak orang yang melahirkan taksonomi lain.Prinsip-prinsi yang
digunakan oleh orang lain ini ada 4 buah,yaitu:

31
Dasar-dasar Evaluasi Pendidikan

a. Prinsip metodologis
Perbedaan-perbedaan yang esar telah merefleksi kepada cara-cara
guru dalam mengajar
b. Prinsip psikologis
Taksonomi hendaknya konsisten dengan fenomena kejiwaan yang
ada sekarang.
c. Prinsip logis
Taksonomi hendaknya dikembangakan secara logis dan konsisten
d. Prinsip tujuan
Tingakatan-tingkatan tujuan tidak selaras dengan tingkatan-
tingkatan nilai-nilai.Tiap jenis tujuan hendaknya menggambarkan
corak yang netral.
Sudah banyak diketahui bahwa mula-mula taksonomi Bloom terdiri
dari dua bagian yaitu kognotif domain dan efektif domain pencipta dari
kedua taksonomi ini merasa tidak tertarik pada psikomotor domain
karena mereka melihat hanya ada sedikit kegunaannya di Sekolah
Menengah atau Universitas (BLOOM 1956)Akhirnya Simpson melengkapi
dua domain yang ada dengan psikodomain (1966) Namun sebenarnya
pemisahan antara ketiga domain ini merupakan pemisahan yang di buat-
buat,karena Manusia merupakan suatu kebulatan yang tidak dapat di
pecah-pecah sehingga segala tindakannya juga merupakan suatu
kebulatan.
Sebagai taksonomi Bloom (1956) sebenarnya merupakan hasil
kelompok penilai dari Universitas terdiri dari B.S.Bloom
editorM.D.Engelhart,E.Furst,W.H.Hill,dan D.R.Krathwhol,yang kemudian
didukung pulah oleh Ralp W.Tiyler*)

Secara garis besar,Bloom bersama kawan-kawan merumuskan


tujuan-tujuan pendidikan pada tigatingkatan:

1) Katgori tingkatan yang masih verbal.

32
Dasar-dasar Evaluasi Pendidikan

2) Peluasan kategori menjadi sederetan tujuan.

3) Tingkah laku kongkrit yang terdiri dari tugas-tugas (taks) dalam


Pertanyaan-pertanyaan ebagai ujian dan utir-butir soal.

Ada tiga macam ranah atau domain taksonomi yaitu:

- Ranah kognotif (cognitive domain)

- Ranah efektif (Affectif domain)

- Ranah psikomotor (psychomotor domain)

a. Ranah kognotif

1). Mengenal (recognition

2). Pemahaman(coprehension)

3). Penerapan atau aplikasi (application

4). Analisis (analysis)

5)sintesis (Analysis)

6)Evaluasi (Evaluasy)

b. Ranah efektif

- Pandangan atau pendapat (opinion)


- Sikap atau nilai (attitude,value)
c. Psikomotor
Taksonomi utuk ranah psikomotorik antara alain di kemukakan
oleh Anita harrow (1972)
Taksonomi yang di kemukakan oleh Anita Harrow adalah;
1). Gerakan reflex
2). Dasar gerakan-gerakan.
3). Peceptual abilities.
4). Psycal abilities.
33
Dasar-dasar Evaluasi Pendidikan

5). Skilled mofemenst


6). Nondiscoursive communication
Lain-lain taksonomi
Banyak telah dilemparkan kepada bloom cs,tentang pembagian
taksonomi ini,sehingga timbul teori-teori sebagai adaptasi,modifikasi
atau kategori baru.
a. Mc.guire (1963),Klicmann (1963) telah menyusun taksonomi
tentang biologi,wood (968) untuk matematika,Leuis (1965) untuk
ilmu pengetahuan alam. Sebagai contoh,di hasilkan oleh the
national longitudinal study of mathe-matical abilities (NLSMA)*)
Alasannya adalah:
1). Computation (komputasi, perhitungan) merupakan suatu
ketrampilan khusus yang tidakmempunyai tempat dalam
taksonomi Bloom.Padahal asspek ini prlu di nilai juga.
2). Synthesis and evaluation (sintesis dan evaluasi) hanya sedikit
mempunyai peranan di dalam kurikulum mete-metika.
b. Guilford telah menciptakan pola yang menggambarkan
strukturintelek dalam bentuk khusus.
--------------------- Operation/process
(bidang datar)

------------------- Product
(Bidang (Bidang belakng)

------------------------ Content
(Bidang tegak)
Selanjutnya Guilford telah berbicara lebih luas tentang
implikasi ini di bidang pendidikan.Dikatakanya bahwa untuk
melatih kemampuan intlektual tertentu dibutuhkan latihan tertentu
pula.
c. Gagne dan Merill juga mengemukakan taksomini lain. Di dalam
bukunya TheCondition of Learning (1965).Gagne adanya 8 buah
kategori,yang oleh merill (1971) d tambah 2 kategori lagi.
34
Dasar-dasar Evaluasi Pendidikan

Delapan hierarki tingkah laku menurut Gagne adalah:


1. Siganal learning
2. Stimulus,response learning
3. Chaining
4. Verbal association
5. Desiremination learning
6. Concept learning
7. Rule learning
8. Problem solving.*)
Garlach dan Sulivan beranggapan bahwa taksomini bloom
mempunyai kegunaan yang terbatas sebagai alat untuk
perencanaan dan pengembangan kurikulum.mereka mencoba
mengganti gambaran tentang proses dalam rumusan yang umu
menjadi tingkahlaku siswa yang dapat di amati.

Kategori yang di ajukan adalah :


1. Identify
2. Name
3. describe
4. construct
5. order
6. demonstrate

e. De block mengatakan taksomini bloom di ilhami oleh masalah


evaluasi. Jika Gagne dan merill bertitik tolak pada kondisi belajar
maka De Block (1972) mengemukakan model tujuan didasarkan
pada tujuan-tujuan mengajar.
Ia mengajukan 3 arah dalam kegiatan mengajar
1.from partial to more integral learning
2.from limited to fundamental learning
3.from special general learning
Gagasan De Block ini juga di gambarkan dalam bentuk kubus.

35
Dasar-dasar Evaluasi Pendidikan

BAB VIII
TUJUAN INSTRUKSIONAL
8.1 Bermacam-macam Tujuan Pendidikan
Setiap Negara tentunya mempunyai citia-cita tentang warga
negaranya akn di arahkan.cita-cita tersebut dimanifestasikan dalam
bentuk tujuan pendidikanya.
Semua aparatur pemerintah termasuk petugas-petugas pendidikan,
harus terlebih dahulu memahami makna dari rumusan tersebut dan
menerjemahkannya dalam bentuk rumusan tujuan yang sesuai dengan
tingkat dan jenis pendidikan yang diselenggarakan pada lembaga
tersebut.Inilah yang di sebut sebagai tujuan instruksional. Tujuan ini
sudah diperuntukan khusus untuk bagi pnyelenggaraan
sekolah/institusi ini.Semua tujuan pendirian sekolah harus berkiblat
pada tujuan umum atau tujuan pendidikan nasional yang telah di sebut.
Dengan demikian maka tujuan pendidikan nasional memiliki fungsi
sebagai frame of reference untuk selanjutnya di jabarkan menjadi tujuan
instruksional. Sebagai pendalaman berikut ini adalah kutipan rumusan.

Tujuan Umum

Pendidikan Nasional

36
Dasar-dasar Evaluasi Pendidikan

Pend. Pend. Pend. Baha- Mate- Ilmu- Ilmu- Baha-


Aga- Mo- Olara- Sa in- Ma- Peng. Peng. Sa
T1 ma Ra ga Done- tika alam So- Ing- Dst
Ma Pan- Sia sial gris
casila

Pend. Pend. Pend. Baha- Mate- Ilmu- Ilmu- Baha-


Aga- Mo- Olara- Sa in- Ma- Peng. Peng. Sa
T1
Ma Ra ga Done- tika alam So- Ing- Dst
Pan- Sia sial gris
casila

Pend. Pend. Pend. Baha- Mate- Ilmu- Ilmu- Baha-


Aga- Mo- Olara- Sa in- Ma- Peng. Peng. Sa
T1
Ma Ra ga Done- tika alam So- Ing- Dst
Pan- Sia sial gris
casila

Pend. Pend. Pend. Baha- Mate- Ilmu- Ilmu- Baha-


Aga- Mo- Olara- Sa in- Ma- Peng. Peng. Sa
T1
Ma Ra ga Done- tika alam So- Ing- Dst
Pan- Sia sial gris
casila
TKur. TKur. TKur. TKur. TKur. TKur. TKur. TKur.
T1 = Tujuan Institusional
Tkur = Tujuan kurikuler
Dalam skema tersebut akan mudah di pahami bahwa:
(1).Tujuan Institusional dari masing-masing institusi atau lembaga.
37
Dasar-dasar Evaluasi Pendidikan

(2).Tujuan kurikuler adalah tujuan dari masing-masing bidang studi.


(3).Tiap-tiap tujuan,baik institusional maupun tujuan kurikuler selalu
merupakan sumbangan bagi tercapainya tujuan umum,yakni tujuan
pendidikan nasional.

8.2 Tujuan Instruksionalaik


Materi ssuatu bidang studi tidak mungkin menjadi milik kita,tanpa
dipelajari terlebih dahulu,baik di pelajari sendiri maupun di ajarkan oleh
guru.Proses atau kegiatan mempelajari materi ini terjadi pada saat
terjadinya situasi belajar mengajar atau pengajaran (instruksional). Dari
perkataan pengajaran atau instruksional inilah maka timbul istilah
tujuan instruksional, yaitu tujuan yang menggambarkan
pengetahuan,kemampuan,ketrampilan dan sikap yang harus dimiliki
oleh siswa sebagai akibat dari hasilpengajaran yang dinyatakan dalam
bentuk tingkah laku (behavior).*)
Ada dua macam tujuan instruksional yaitu:
1). Tujuan instruksional umum (TIU)
2). Tujuan instruksional khusus (TIK)

8.3 Merumuskan Tujuan Instruksional


Telah disebutkan bahwa tujuan instruksional adalah tujuan yang
menyatakan adanya sesuatu yang dapat dikerjakan atau dilakukan oleh
siswa setelah pengajaran.Jadi sebelum adanya pengajaran,siswa tida
punya kemampuan untuk mengerjakan atau melakukannya
Jadi dalam diri siswa terjadi perubahan tingkah laku selama
mengikuti program pengajaran,atau dengan lain perkataan,perubahan
tingkah laku itu merupakan hasil dari proses belajar mengajar.Oleh
karena baik guru maupun siswa perlu mengetahui perubahan apakah
yang telah terjadi pada waktu pengajaran,maka perlu adanya perumusan
yang jelas bagi tujuan instruksional itu.

8.4 Langkah-langkah Yang Dilakukan Dalam Merumuskan Tujuan


Instruksional Khusus
38
Dasar-dasar Evaluasi Pendidikan

Contoh-contoh rumusan untuk TIU


- Memahami teori evaluasi
- Mengetahui perbedaan antara skor atau nilai
- Mengerti cara mencari validita.
- Menghayati perlunya penilaian yang tepat
- Menyadari pentingnya mengikuti kuliah yang teratur
- Menghargai kejujuran mahasiswa dalam mengerjakan tes
Rumusan TIK lengkap memuat tiga komponen yaitu:
1.Tingkah laku akhir
2.Kondisi demonstrasi
3.Standar keberhasilan
8.5 Tingkah Laku Akhir
Tingkah laku akhir adalah tingkah laku yang di harapkan setelah
seseornang mengalami proses belajar.disini tingkahlaku ini harus
menampakan diri dalamsuatu perbuatan yang dapat diamati dan
diukur.(observable and measurable)
Contoh:
- menuliskan kalimat perintah
- mengalihkan pecahan persepuluhan,
- menggambarkan kurva normal,
- Menemukan batas-batas daerah jojakarta,
- Menerjemahkan bacaan bahasa inggris ke dalam bahasa inonesia
- Menceritakan kembali uraian guru,
- Mendemonstrasikan cara mengukur suhu
- Mengutarakan pendapatnya mengenai sesuatu yang di kemukakan
guru,
- Menjelaskan hasil bacaan dengan kalimat sendiri
Dan lain-lain lagi yang berujud kata kerja perbuatan/oprasional
(action verb) yang dapat diamati dan diukur.

8.5 Kata-kata Operasional


a. Cognitive domain;levels and corresponding action verb*)
1) Pengetahuan
39
Dasar-dasar Evaluasi Pendidikan

- Mendefinisikan,Mendekskripsikan,mengidentifikasikan,mend
aftarkan,menjodohkan,menyebutkan,menyatakan,(states),me
mproduksi.
2) Pemahaman
- Mempertahankan,membedakan,menduga
(estimates),menerangkan,memperluas,menyimpulkan,mengge
neralisasikan,memberikan contoh,menuliskan
kembali,memperkirakan.

3) Aplikasi
- Mengubah,menghitung,mendemonstrasikan,menemukan,mem
anipulasikan,memodifikasikan,mengoprasikan,meramalkan,m
enyiapkan,menghasilkan,menghubungkan,menunjukan,meme
cahkan,menggunakan.
4) Analisis
- Memerinci,menyusundiagram,membedakan,mengidentifikasik
an,mengilustrasikan,menyimpulkan,menunjukan,menghubun
gkan,memilih,memisahkan,membagi.
5) Sintesis
- Mengategorikan,mengkombinasikan,mengarang,menciptakan,
mendesain,mengorganisasikan,memodifikasikan,menyusun,m
embuat rencana, mengatur kembali, merekonstruksikan,
menghubungkan, merevisi, menuliskan kembali, menuliskan,
menceritakan.
6) Evaluasi
- Menilai, membandingkan, menyimpulkan,
mempertimbangkan, mengkritik, mengdeskripsikan,
mebedakan,menerangkan, memutuskan, menafsirkan,
menghubungkan, membantu (supports)

b. Affectif domain; learning levels and corresponding action verb*)


1) Reesiving
40
Dasar-dasar Evaluasi Pendidikan

- Menanyakan,memilih,mendeskripsikan,mengikuti,memberika
n,mengidentifikasikan,menyebutkan,menunjukan,memilih,me
njawab.
1) Responding
- Menjawab, membantu, mendiskusikan, menghormat, berbuat,
melakukan, membaca, memberikan, menghafal, melaporkan,
me ilh, menulis, menceritakan.
2) Valuing
- Melengkapi,menggambarkan,membedakan,menerangkan,men
gikuti,membentuk,mengundang,menggabung,mengusulkan,
membaca,memilih,melaporkan,memilih,bekerja,mengambil
bagian,mempelajari.
3) Organization
- Mengubah,mengatur,menggambungkan,membandingkan,mele
ngkapi,mempertahankan,menerangkan,menggeneralisasikan,
mengindentifikasikan,mengintegrasikan,memodifikasikan,m
engorganisirkan,menyiapkan,menghubungkan,mensintesiska
n.
4) Characterization by value or value complex
- Membedakan,menerapkan,mengusulkan,memperagakan,mem
pengaruhi,mendengarkan,memodifikasikan,mempertunjuka,
menanyakan,merevisi,melayani,memecahkan,menggunakan.
c. Psykomotor domain
Kata-kata oprasional untuk aspek psikomotor harus menunjuk pada
aktualitas yang dapat di amati meliputi:
1). Muscular or motor skill
- Mempertontonkan gerak, Menunjukan hasil(pekerjaan
tangan),melompat, menggerakan,menampilkan.
2). Manipulation of materials or objects
- Mereparasi,menyusun,membersihkan,menggeser,memindahk
an,membentuk.
3). Neuromuscular coordination

41
Dasar-dasar Evaluasi Pendidikan

- Mengamati,menerapkan,menghubungkan,menggandeng,mem
adukan,memasang,menarik,memotong,menggunakan.

8.7 Kondisi Demonstrasi


Kondisi demonstrasi adalah komponen TIK yang menyatakan suatu
kondisi atau situasi yang dikenakan kepada siswa pada saat ia
mendemonstrasikan tingkah laku akhir misalnya:
- Dengan penulisan yang betul
- Urut dariyang palig tinggi
- Dengan bahasanya sendiri
-
Diagram Perumusan TIK dan TIU

1. Siswa Untuk Tingka


PKP h isi
Mampu laku

2. Siswa Tingka
h Isi(pokok
Dapat laku bahasa melalui PKP
n
Gabungan PKP Isi (pokok
3) siswa
dan Bahasan)
mampu Tingkah laku

42
Dasar-dasar Evaluasi Pendidikan

BAB IX
TES STANDAR DAN TES BUATAN GURU

9.1 Pengertian Tes Standar


Telah dibicarakan didepan bahwa tes kamampuan pada dasarnya
terbagi menjdi 2 macam yaitu:
1) Aptitude test (tes bakat)
2) Achievement (tes prestasi)
Perbedaan antara kedua tes ini sebenarnya tidak tegas soal-soal
mengenai kedua tes tersebut seringkali saling melingkupi (overlap)

9.2 Tes Prestasi Standar


Diantara tes prestasi yang digunakan disekolah ada yang dinamakn
tes prstasi standar.dalam sala satu kamus arti kata “standar” adalah:
Standar untuk siswa dapat dimaksudkan sebagai suatu tingkat yang
harus dimiliki bagi suatu program tertentu.mungkin standar bagi suatu
kursus A berbeda dengan kursus B jadi,standar ini dapat di buat “keras”
maupun “lunak’ tergantung yang mempunyai kebijaksanaan.suatu tes
standar dengan demikian berbeda dengan tes prestasi biasa.
Istilah “standar” tidak mengandung bahwa tes itu mengukur apa
yang harus dan dapat di ajarkan pada suatu tingkat tertentu atau bahwa
tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat
43
Dasar-dasar Evaluasi Pendidikan

mencapai suatu tingkat tertentu.Sekali lagi,tes standar dipolahkan untuk


penampilan prestasi sekarang (yang ada) yang dilaksanakan secara
seragam diusahakan dalam kondisi yang seragam,baik itu diberikan
kepada siswa dalam pelaksanaan perseorangan maupun siswa sebagai
anggota dari suatu kelompok.

9.3 Perbandingan Antara Tes Standard Dengan Tes Buatan Guru


Dengan tujuan apa tes standar ini disusun?
Pertama,marilah kita tinjau antara tes standard an tes buatan guru
ini.Perbedaannya adalah sebagai berikut:

Tes Standar Tes Buatan Guru


1) Didasarkan atas bahan dan tuju- 1)Didasarkan atas bahan dan tujua-
an umum dari sekolah-sekolah n khusus yang di rumuskan oleh-
dari semua Negara-negara. guru untuk kelasnya sendiri.
2) Mencakup aspek yang luas dan- 2)Dapat terjadi hanya mencakup
Pengetahuan atau ketrampilan pengetahuan atau ketrmpilan
Dengan hanya sedikit butir tes yang sempit.
Untuk setiap ketrampilan atau
topic
3) Disusun dengan kelengkapan 3)Biasanya disusun sendiri oleh
stafprofessor,pembahas,editor,bu dengan sedikit atau dengan tanpa
tir tes bantuan orang lain/tenaga ahli
4) Menggunakan butir-butir tes yang 4)Jarang-jarang menggunakan butir
sudah di uji cobakan (try tes yang sudah
out),dianalisis dan di revisi diujicobakan,dianalisis,dan di
sebelum menjadi sebuah tes. revisi
5) Mempunyai reabilitas yang tinggi 5)mempunyai reliabitas sedang
atau rendah
6) Dimungkinkan menggunakan 6)Norma kelompok terbatas norma
norma untuk semua Negara tertentu.

44
Dasar-dasar Evaluasi Pendidikan

Kedua,untuk menyusun tes standar,dibutuhkan waktu yang


lama.seperti disebutkan bahwa untuk memperoleh sebuah tes standar
melalui prosedur:
- Penyusunan,
- Uji coba,
- Analisis,
- Revisi,
- Edit
Kelima kegiatan ini membutuhkan waktu yang lama.

9.4 Kegunaan Tes Standar


Secara singkat dapat dikemukakan bahwa kegunaan tes standar
adalah:
a. jika ingin membuat perbandingan.
b. Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak
tersedia data tentang calon ini.
Walaupun sangat luas, namun secara garis besar kegunaan tes standar
adalah:
1) Membandingkan tes belajar dengan pembawaan indifidu atau
kelompok
2) Membandingkan tingkat prestasi siswa dalam ketrampilan di
berbagai bidang studi untuk individu atau kelompok.
3) Membandingkan prestasi siswa antar sekolah atau kelas.
4) Mempelajari perkembangan siswa dalam suatu periode waktu

9.5 Kegunaan Tes Buatan Guru


Kegunaan tes buatan guru adalah:
a) Untuk menentukan seberapa baik siswa menguasai bahan
pembelajaran yang di berikan dalam waktu tertentu.
b) Untuk menentukan apakah suatu tujuan tercapai
c) Untuk memperoleh suatu nilai.

45
Dasar-dasar Evaluasi Pendidikan

9.6 Kelengkapan Tes Standar


Sebuah tes sudah di standarnisasikan dan sudah dapat disebut
sebagi tes standar,biasanya dilengkapi dengan sebuah manual.
Secara garis besar tes manual ini memuat:
1) Ciri-ciri mengenai tes, misalnya menyebutkn tingkat validitas,
tingkat reliabilitas dan sebagainya.
2) Tujuan serta keuntungan-keuntungan dari tes.
3) Proses standarnisasi.

Misalnya mengenai hal-hal yang berhubungan dengan sampel:


4) Petunjuk-petunjuk tentang melaksanakan tes
5) Petunjuk-petunjuk bagaimana cara menskors
6) Petunjuk-petunjuk untuk menginterpretasikan hasil
7) Saran-saran lain.

46
Dasar-dasar Evaluasi Pendidikan

BAB X
PENYUSUNAN TES

10.1 Fungsi Tes


Sehubungan dengan hal-hal yang harus di igat pada waktu
penyusunan tes maka fungsi tes dapat di tinjau dalam 3 hal:
1) Fungsi untuk kelas
2) Fungsi untuk bimbngan,
3) Fungsi untuk administrasi.
Selain fungsi-fungsi tes ini,hal lain ynag haru di ingat adalah:
1) Hubungan dengan penggunaan
2) Konfrehensif
3) Kontinu
Perbandingan Fungsi Tes
Fungsi Untuk Fungsi Untuk Fungsi Untuk
Kelas Bimbingan Administrasi
a) Mengadakan a) menentukan arah a) Menentukan
diagnosis terhdap pembicaraan dengan petunjuk
kesulitan siswa orang tua tentang dalampengelompoka
anak-anak mereka n siswa.
b) Mengevaluasi celah b) membantu siswa b) Penempatan siswa

47
Dasar-dasar Evaluasi Pendidikan

antara bakat dan dalam menentukan baru.


pencapaian pilihan
c) Menaikan tingkat c) membantu siswa c) Membantu siswa
prestasi mencapai tujuan memilih kelompok
pendidikan dan
jurusan
d) Mengelompokan d) member kesempatan d) Menilai kurikulum
siswa dalam kelas kepada
pada waktu metode pembimbing,guru
kelompok dan orang tua dalam
memahami kesulitan
anak-anak.
e) Merencanakan e) Memperluas
kegiatan proses hubungan
belajar mengajar masyarakat (public
untuk siswa secara relation).
perseorangan
f) Menentukan mana f) Menyediakan
siswa yang informasi lain untuk
memerlukan badan-badan di luar
bimbingan khusus sekolah.
g) Menentukan tingkat
pencapain setiap
anak

10.2 Langkah-langkah Dalam Penyusunan Tes


Urutan langkah yang dilakukan:
a. Menentukan tujuan mengadakan tes
b. Mengadakan pembatasan terhadap bahan yang diteskan
c. Merumuskan tujuan instruksional khusus tiapbagian bahan.
d. Menderetkan semua TIK dalam table persiapan yang memuat pulah
aspektingkah laku yang terkandung dalam TIK itu.Tabel ini

48
Dasar-dasar Evaluasi Pendidikan

digunakan untuk mengadakan identifikasi terhadap tingkah laku


yang dikehendaki ,agar tidak terlewati.
e. Menyusun table spesifikasi yang memuat poko materi,aspek
berpikir yang di ukur beserta imbangan antara kedua hal
tersebut.Uraian secara terinci tentang table spesifikasi.akan
disajikan pada bab berikutnya.
f. Menuliskan butir-butir soal,didsarkan ats TIK_TIK yang sudah di
tuliskan dalam table TIK dan aspek tingkah laku yang di cakup.
Kecenderungan yang ada pada guru-guru beberapa waktu yang lalu
pengukuran ranah kognotif hanya ditekankan pada 3 aspek yang
pertama.
Untuk aspek-aspek yang lainnya,walaupun dikehendaki dan
diusahakan masuk kedalamkategori pemahaman dan aplikasi,setelah
diperiksa kemungkinan besar juga masih bersifat ingatan,iulah sebabnya
dalam tulisan ini akan dikemukakan cara-cara item mengenai setiap
aspek beserta cotoh-contohnya.
a. Soalingatan
b. Soal pemahaman
c. Soal aplikasi
d. Soal analisis
e. Soal sintesis
f. Soalevaluasi

10.3 Komponen-komponen Tes


Komponen atau kelengkapan sebuah tes terdiri atas:
a. Buku tes
b. Lembar jawaban tes
c. Kunci jawaban tes
d. Pedoman penilaian

49
Dasar-dasar Evaluasi Pendidikan

BAB XI
TES TERTULIS UNTUK PRESTASI BELAJAR

11.1 Bentuk-bentuk Tes


a. Tes Subjektif yang pada umumnya berbentuk esai (uraian).
1. Kebaikan-kebakaikannya:
- Mudah disiapkan dan disusun
- Tidak memeri banyak kesempatan untuk berspekulasi
- Mendorong siswa untuk berani mengemukakan pendapat serta
menyusun dalam bentuk kalimat yang bagus
- Member kesempatan kepada siswa untuk mengutarakan maksudnya
dengan gaya bahasa dan caranya sendiri.
- Dapat diketahui sejauh mana siswa mendalami sesuatu masalah
yang diteskan.
2. Keburukan-keburukannya:
- Kadar validitas dan reliabilitas rendah karena sukar diketahui segi-segi
mana dari pengetahuan siswa yang betul-betul telah dikuasai
- Kurang representative dalam hal mewakili seluruh scope bahan
pelajaran yang akan dites karena soalnya hanya beberapa saja
(terbatas)
- Cara memeriksanya banyak dipengaruhi oleh unsure-unsur subjektif.

50
Dasar-dasar Evaluasi Pendidikan

- Pemeriksaanya lebih sulit sebab membutuhkan pertimbangan


individual lebih banyak dari nilai.
- Waktu untuk koreksinya lama dan tidak dapat diwakilkan kepada
orang lain.
3. Petunjuk Penyusunan
- Hendaknya soal-soal tes dapat meliputi ide-ide pokok dari bahan yang
diteskan, dan kalau mungkin disusun soal yang sifatnya
komprehensif.
- Hendaknya soal tidak mengambil kalimat-kalimat yang disalin
langsung dari buku atau catatan.
- Pada waktu menyusun, soal-soal itu sudah dilengkapi dengan kunci
jawaban serta pedoman penilaiannya.
- Hendaknya pertanyaannya bervariasi
- Hendaknya rumus soal dibuat sedemikian rupa sehingga mudah
dipahami oleh tercoba.
- Hendaknya ditegskan model jawaban apa yang dikehendaki oleh
penyusun tes.
b. Tes objektif adalah tes yang dalam pemerksaannya dapat dilakukan
secara objektif.
1. Kebaikan-kebaikanya:
- Mengandung lebih banyak segi-segi yang positif
- Lebih mudah dan cepat cara memeriksanyakarena dapat
menggunakan kunci tes bahkan alat-alat hasil kemajuan teknologi
- Pemeriksaanya dapat diserahkan pada orang lain.
- Dalam pemeriksaan,tidak ada unsure subjektif yang
mempengaruhi.
2. Kelemahan-kelemahanya:
- Persiapan untuk menyusunnya jauh lebih sulit dari pada tes esai
Karena soalnya banyak dan harus teliti untuk menghindari
kelemahan-kelemahan yang lain
- Soal-soalnya cenderung untuk mengungkapkan ingatan dan daya
pengenalan kembali saja,dan sukar untuk mengukur proses mental
yang tinggi
51
Dasar-dasar Evaluasi Pendidikan

- Banyak kesempatan untuk main untung-untungan


- Kerja sama antarsiswa pada waktu mengerjakan soal tes lebih
terbuka
3. Cara mengatasi kelemahan:
- Kesuliatan menyusun tes objektif dapat diatasi dengan jalan
banyak beralatih
- Mengunakan table spesifikasi untuk mengatasi kelemahan
- Menggunakan standar penilaian yang memperhitungkan factor
tebakan yang bersifat spekulatif.

11.2 Macam-macam Tes Objektif


a. Tes benar-salah (true-false)
Soal-soalnya berupa pernyataan-pernyataan (statement). Statement
tersebut ada yang benar dan ada yang salah. Orang yang ditanyai
bertugan ntuk menandai masing-masing pertanyaan itu dengan
melingkari huruf B jika pertanyaan itu betul menurut pendapatnya dan
melingkari huruf S jika pernyataanya salah.
1. Kebaikan tes benar-salah:
- Dapat mencakup bahan yang luas dan tidak banyak memakan
tempat karena biasanya pernyataanya singkat-singkat saja
- Mudah menyusunya
- Dapat digunakan berkali-kali
- Dapat dilihat secara cepat dan objektif
- Petunjuk cara mengerjakannya mudah dimengerti
2. Keburukannya:
- Sering membingungkan
- Mudah ditebak/diduga
- Banyak masalah yang tidak dapatdinyatakan hanya dengan dua
kemungkinan benar salah
- Hanya dapat mengungkap daya ingatan dan pengenalan kembali.

52
Dasar-dasar Evaluasi Pendidikan

Rumus untuk mencari skor akhir bentuk benar-salah ada 2 macam


yaitu:
Dengan denda
S=R–W
Dengan pengertian:
S = skor yang diperoleh
R = jawaban yang benar
W = jawaban yang salah
Tanpa denda
S=R
Yang dihitung hanya yang betul (untuk yang tidak dikerjakan nilai 0).

b. Tes pilihan ganda (multiple choice test)


Tes pilihan ganda terdiri atas suatu keterangan atau pemberitahuan
tentang suatu pengertian yang lebih lengkap. Dan untuk melengkapinya
harus memilih satu dari beberpa kemungkinan jawaban yang telah
disediakan.
Tes bentuk pilihan ganda merupakan bentuk tes objektif yang
paling banyak digunakan karena banyak sekali materi yang dapat
dicakup.
Pada dasarnya, soal bentuk pilihan ganda ini adalah soal bentuk
benar-salah juga, tetapi dalam bentuk jamak. Tercoba diminta
membenarkan atau menyalahkan setiap stem dengan tiap pilihan jawab.
Kemungkinan jawaban itu yang biasanya sebanyak tiga atau empat buah,
tetapi adakalanya dapat juga lebih banyak.
Untuk mengelola skor dalam tes bentuk pilihan ganda digunakan 2
macam rumus
Rumus dengan denda

S = skor yang diperoleh


R = jawaban yang betul
53
Dasar-dasar Evaluasi Pendidikan

W = jawaban yang salah


0 = banyaknya option
1 = bilangan tetap
Rumus tanpa denda
S=R
c. Menjodohkan (matching test)
Menjodohkan terdiri atas satu seri pertanyaan dan satu seri
jawaban. Masing-masing pertanyaang mempunyai jawabannya yang
tercantum dalam seri jawaban. Tugas murid ialah : mencari dan
menempatkan jawaban-jawaban sesuai atau cocok dengan
pertanyaannya.
Petunjuk-petunjuk yang perlu diperhatikan dalam menyusun tes
bentuk matching ialah:
a. Seri pertanyaan-pertanyaan dalam menjodohkan hendaknya tidak
lebih dari sepuluh soal
b. Jumlah jawaban yang harus dipilih, harus lebih banyak dari pada
jumlah soalnya.
c. Antara item-item yang tergabung dalam satu seri menjodohkan harus
merupakan pengertian-pengertian yang benar-benar homogen.
d. Tes isian (completion test), Tes isian terdiri atas kalimat-kalimat yang
ada bagian-bagiannya yang dihilangkan. Bagian yang dihilangkan atau
yang harus diisi oleh murud ini adalah merupakan pengertian yang
diminta dari murid.

11.3 Pengukuran Ranah Afektif


Pengukuran ranah afektif tidaklah semudah mengukur ranah
kognitif. Pengukuran ranah ini tidak dapat dilakukan setiap saat karena
perubahan tingkah laku siswa tidak dapat berubah sewaktu-waktu.
Perubahan sikap seseorang memerlukan waktu yang lama. Demikian juga
pengembangan minat dan penghargaan serta nilai-nilai.
Ada beberapa skala yang dapat digunakan untuk mengukur sikap, antara
lain:
1. Skala Likert
54
Dasar-dasar Evaluasi Pendidikan

Sakala ini disusun dalam bentuk suatu pernyataan dan diikuti oleh lima
respons yang menunjukan tingkatan.Misalanya seperti yang telah
dikutip yaitu:
SS = Sangat setuju
S = setuju;
TB = tidak berpendapat
TS = tidak setuju
STS = sangat tida setuju
2. Skala pilihan ganda
Skala ini bentuknya seperti soal pilihan ganda yaitu suatu
pernyataan yang diikuti oleh sejumlah alternative pendapat.

3. Skala thurstone
Skala thurstone merupakan skala mirip skala buatan likert karena
merupakan suatu instrument yang jawabanya menentukan nilai.

1 2 3 4 5 6 7 8 9 10 11

A B C D E F G H I J K

Very neutral very


favourtable unfavourable
4. Skala Guttman
Skala ini sama dengan yang disusun oleh Bogardus,yaitu berupa
tiga atau empat buah pernyataan yang masing-masing harus dijawab
“ya” atau “tidak” .Pernyataan-pernyataan tersebut menunjukan tingkatan
yang berurutan sehingga ila responden setuju pernyataan no
2,diasumsikan setuju no 1.Selanjutnya jika responden setuju dengan
pernyataan no 3,berarti setuju dengan pernyataan no 1 dan 2.
5. Semantic differential
Instrumen yang di susun oleh Osgood dan kawan-kawan ini
mengukur konsep-konsep untuk tiga dimensi.dimensi-dimensi yang ada
55
Dasar-dasar Evaluasi Pendidikan

diukur dalam kategori:baik tida baik,kuat lemah dan cepat lambatatau


aktif pasif,atau dapat juga berguna tida bergun.daalam buku oggod di
kemukakan adanya 3 faktor untuk menganalisis skalanya:
a) Evaluation (baik-buruk)
b) Potency (kuat lemah)
c) Activity (kuat-lemah)
d) Familiarity (tambahan Nunnallly)
Contoh:
Main music
Baik 1 2 3 4 5 6 7 tidak baik
Berguna 1 2 3 4 5 6 7 Tidak berguna
Aktif 1 2 3 4 5 6 7 Pasif

6. Pengukuran minat
Disamping mengunakan skalah seperti di contohkan di atas,minat
juga dapat diukur dengan cara seperti dibawa ini:
A. Mengunjungi Perpustakaan
SS S B AS TS STS

B. Sandiwara SS S B AS TS
STS
Pilhan: Senang,sampai dengan sangat tidak senang dapat di
tentukan sendiri seberapa suka. Boleh juga di teruskan sampai
sebelas skala.

11.4 Pengukuran Ranah Psikomotor


Pengukuran ranah psikomotorik dilakukan terhadap hasil-hasil
belajr yang merupakan penampilan.Namun demikian biasanya
pengukuran ranah ini disatukan atau dimulai dengan pengukururan
ranah kognotif sekaligus.MIsalnya penmpilan didalam menggunakan
thermometer diukukur mulai dari pengetahuan mereka mengenai alat
tersebut,pemahaman tentang alat dan kegunaanya (aplikasi0,kmudian
baru cara terakhi rini harus diperinci antara lain:cara
56
Dasar-dasar Evaluasi Pendidikan

memegang,meletakan,menyelipkan kedalam ketiak atau mulut,cara


memaca angka cara mengembalikan kedalam tempat,dan sebainya.ini
smua terantung dari kehendak kitaasal tujuan pengukuran dapat
tercapai.

BAB XII
TABEL SPESIFIKASI

12.1 Fungsi Tabel Spesifikasi


Tabel spesifikasi dapat di sebut juga dengan grid,kisi-kisi atau Iblue
print. Ujudnya adalah sebuah table yang memuat tentang perperincian
materi tingkah laku beserta imbangan/proporsi yang dikehendaki oleh
penilai.Tiap kotak diisi dengan bilangan yang menunjkan jumlah soal.
Contoh:

Aspek yang Pemaha Aplikasi


di ungkap Ingatan Man (A) Jumlah
Pokok (1) (P)
Materi
Bagian 1 ……….. …………. …………….. …………..

Bagian 11 ……….. …………. …………….. …………..

57
Dasar-dasar Evaluasi Pendidikan

Bagian n
(terakhir) ……….. …………. …………….. ………….

Jumlah ……….. …………. …………….. ………….

Tabel Aplikasih

Tabel spesifikasi mempunyai kolom dan baris,sehingga hubungan


antara materi an aspek yang tergambar dalam TIK sebenarnya penyusun
tes bukan hanya mengingat hubungan antara aspek tersebut tetapi 4
hal,yaitu hubungan antara materi,TIK,kegiatan belajar,dan evaluasi.
12.2 Langkah-langkah Pembuatan
Satu hal yang sama adalah bahwa langkah pertama yang harus di
ambil adalah mendaftar poko-poko materi yang akan diteskankemudian
memberikan imbangan bobot untuk masing-masing pokok.
Dari contoh diatas,maka pokok-pokok materi dapat dipindahkan kedalam
table dan mengubah indeks menjadi persentase.inilah merupakan
langkah kedua dari pembuatan table spesifikasi.
Setelah mencantumkan pokok-poko materi yang akan diteskan
beserta persentasenya,lankah ketigah adalah memerincih banyaknya
butir soal untuk tiap-tiap poko materi,dan angkah ini akan dituliskan
kedalm kolom paling kanan caranya adalah membagi jumlah buti soal
(dinilai 50 buah) menjadi 4 bagian berdasarkan imbangan bobot yang
tertera sebagai persentase.
58
Dasar-dasar Evaluasi Pendidikan

Sampai dengan langkah ketiga cara yang dilalui sama bagi seluruh
bidang stud.Untuk langkah-langkah selanjutnya,terdapat langkah
khusus,tergantung homogenitas atau heterogenitas(keragaman)materi
yang di teskan.
a. Untuk materi yang seragam
Yang dimaksud dengan “seragam”disini adalah bahwa antara pokok
materi yang satu dengan mater yang lain mempunyai ksamaan dalm
aspektingkah laku.
b. Untuk maeri yang tidak seragam
Untuk membuat table spesifikasi pokok-poko materi yang tidak
seragam,tidak perlu mencantumkan angka persentase imbangan tingkah
laku di kepala kolom.Pemberian imbangan dilakukaan tiap pokok materi
didasarkan atas banyaknya soal untuk poko materi itu dan imbangan
yang dikehendaki oleh penilai menurut sifat poko materi yang
bersangkutan.
12.3 Tindak Lanjut Sesudah Penyusunan Tabel Spesifikasi
Dua langkah lai sebelum tindak lanjut sesudah penyusun table
spesifikasi untuk memperoleh perangkat soal tes.duah langkah tesebut
adalah:menetukan bentuk soal dan menuliskan soal-soal tes.
a. Menentukan bentuk soal
Ada dua hal yng harus dipertimbangkan dalam menentukan bentuk
soal yaitu:
a.Waktu yang tersedia
b.Sifat materi yang di tes.

b.Menuliskan soal-soal tes


Langkah trakhir dalam penusunan tes adalah menuliskan soal-soal
tes.walaupun tampaknya tinggal satu langkah,akan tetapi langkah ini
merupakan langkah penting karena kgagalan dalam hal ini dapat
berakibat fatal.Hal-hal yang harus diperhatikan:
a. Bahasanya harus sederhana dan mudah dipahami.
b. Suatu soal tidak boleh mengandung penafsiran

59
Dasar-dasar Evaluasi Pendidikan

c. Cara memenggal kalimat atau meletakan/menata kata-kata perlu


diperhatikan agartidak ditafsirkan salah.
d. Peunjuk mengerjakan.

BAB XII
MENGANALISIS HASIL TES

13.1 Menilai Tes Yang Dibuat Sendiri


Secara teoritis,siswa dalam kelas merupakan populasi atu kelompok
yag keadaannya hetrogen.Dengan demikian maka apa bila,dikenai sebuah
tes akan tercermin hasilnya kedalam suatu kurva normal sebagian besar

60
Dasar-dasar Evaluasi Pendidikan

siswa berada didaerah sedang,sebagian kecil berada dibagian ekor


kiri,dan sebagian yang kecil berad dibagian ekor kanan kurva
Apabila jeadaan setelah hasil tes dianalisis tidak seperti yang
diharapkan dalam kurva normal,maka tentu ada “apa-apa” dengan soal
tesnya.
Apabila hampir seluruh siswa memproleh skor jelek,berarti bahwa
yang disusun mungkin terlalu sukar.sebaliknya jika seluruh siswa
memperoleh skor baik,dapat di artikan bahwa soal tesnya terlalu
mudah.Tentu saja tes interpensi terhadapsoal tes akan lain seandainya
tes itu sudah di susun sebaiknya sehingga memenuhi persyaratan sebagai
tes.
Dengan demikian apabilah kita memperoleh keterangan tentang
hasil tes,akan membantu kita dalam mengadakan penilaian secara
objektif terhadap tes yang kita susn
Ada 4 cara untuk menili tes yaitu:
a. Cara pertama meneliti secara jujur soal-soal yang sudah
disusun,kadang dapt diperolehjawaban tentang ketidakjelsan perintah
atau bahsa,taraf kesukaran,dan lain-lain keadaan soal tersebut.
b. (analisys),analisis soal adalah suatu prosedur yang system matis,yang
akan membrikan informasi-informasi,yang sangat khusus terhdap
butir tes yang kita susun.
c. Cara ketiga adalah mengadakn checking validitas.Validitas yag paling
penting dari tes buatan guru adalah validitas kurikuler.Untuk
mengadakan checking validitas kurikuler kia harus merumuskan tiap
bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat
kita jodohkan dengan setiap tujuan khusustersebut.
d. Cara keempat adalah dengan mengadakan checking reabilita.
Salah satu indicator untuk tes yang mempunyai reabilitas yang
tinggi adalah bahwa kebanyakan dari soal-soal tes ini mempunyai daya
pembeda yang tinggi.Untuk perhitungan reabilitas tes,telah dikemukakan
di Bab 6.

13.2 Analisis Butir Soal


61
Dasar-dasar Evaluasi Pendidikan

Kapan sebuah soal dikatakan baik? Untuk memberikan jawaban


terhadap pertanyaan ini,perlu diterangkan tiga masalah yang
berhubungan dengan analisis soal,yaitu taraf kesukaran,pembeda dan
pola jawaban soal.
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal
disebut indeks soal.Besarnya indeks kesukaran antara 0,00-1,0.Indeks
kesukaran ini menunjukan taraf kesukaran soal.soal dengan indeks
kesukaran 0,0 menu njukan bahwa soalitu terlalu sukar, sebaliknya soal
menunjukan indeks 1,0 bahwa soalnya terlal.
0,0 1,0
Sukar Mudah
Didalam istilah evaluasi,indeks kesukaran ini di beiri symbol P
singkatan ddari kata “proporsi”. Dengan demikian maka soal dengan
P=0,70 lebih mudah jika dibandingkan dengan P=o,20 Sebaliknya soal
dengan P=0,30 lebih sukar dari pada soal dengan P=0,80.
Melihat besarnya bilangan indeks ini maka lebih cocok jika bukan
disebut dengan indeks kesukaran tetapi indeks kemudahan atau indeks
fasilitas,semakin mudah soal itu,semakin besar pulah bilangan
indeksnya.Akan tetapi sudah disepakati bahwa walaupun semakin tingi
indeksnya menu njukan soalsmakin mudah,tetapi disebut indeks
kesukaran
Rumus mencari P adalah: P=

Dimana :
P =indeks kesukaran
B =banyaknya siswa yang menjawab soal itu dengan betul
JS =jumlah seluruhsiswa peserta tes
b. Daya pembeda
Daya pembeda soal,kemamuan suatu soal untuk membedakan
antara siswa yang pandai dengan siswa yang bodoh.
Angkah yang menunjukan besarnya daya pembeda disebut indeks
diskriminasi di singkat D.seperti halnya indeks kesukaran,indeks
diskriminasi(daya pembeda) ini berkisar antara 0,00 sampai 1,00 hanya

62
Dasar-dasar Evaluasi Pendidikan

bedanya .indeks kesukaran tidak mengenal tanda negative(-),tetapi pada


indeks diskriminasi ada tanda negative.tanda negatif pada indeks
diskriminasi digunakan jika soal “terbalik” menunjukan kualitas teestee
yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai.
Dengan demikian ada tiga titik ada tiga daya pembeda yaitu:
-1,00 0,00 1,00
Daya pembeda daya pembeda daya pembeda
Negative rendah tinggi
Cara menentukan daya pembeda (niai D)
Untuk ini perlu ibdakan antara kelompok kecil (kurang dari 100) an
kelompok besar )
a. Untuk klompok kecil
Seluruh kelompok testee dibagi 2 sama besar 50% kelompok atas dan
50% kelompok bawah. Contoh :
Siswa Skor
A 9
B 8
C 7 kelompok atas ( )

D 7
E 6

F 5
G 5
H 4 kelompok bawah ( )

I 4
J 3
Seluruh pengikut tes,diseretkan muali dari skor teratas sampai skor
terbawa,lalu di bagi 2.

b. Untuk kelompok besar


Mengingat biaya dan waktu untuk menganalisis maka kelompok
besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor

63
Dasar-dasar Evaluasi Pendidikan

teratas sebagai kelompok atas (jA) dan 27% skor terbawa sebagai
kelompok bawa (jB).
JA = jumlah kelompok atas
jB =jumlah kelompok bawah
Contoh:
9
9
8
8 27% sebagai jA
8
.
.
.
-
.
.
.
-
.
.
.
2 27% sebagai jB
1
1
1
0

Rumus mencari D
Rumu untuk menentukan indeks diskriminasi adalah:

Dimana:
J = jumlah peserta tes
64
Dasar-dasar Evaluasi Pendidikan

JA = jumlah kelompok atas


jB = jumlah kelompok bawah
BA =banyaknya peserta kelompok atas yang menjawab soal itu
dengan benar
BB = Banyaknya peserta kelompok bawah yang menjawab soal itu

dengan benar
= = Proporsi peserta kelompok bawah yang menjawab benar.

c. Pola Jawaban Soal.


Yang dimaksud pola jawaban disini adalah distibusi testee dalam
hal menentukan pilahan jawaban pada soal bentuk pilhan ganda.Pola
jawaban soal diperoleh dengan menghitung banyaknya testee yang
memilih jawaban a,b,c atau d atau yang tidak memilih pilihan manapun
(blangko).Dalam istilah evaluasi disebut omit,disingkat O.
Dengan melihat pola jawaban soal,dapt diketahui:
1). Taraf kesukaran soal
2). Daya pembeda soal
3). Baik dan tidaknya distraktor
Kekurangannya mungkin hanya terletak pada rumusan kalimatnya
sehingga hanya perlu ditulis kembali, Dengan perubahan seperlunya .
Menulis soal adalah suatu pekerjaan yang, sulit, sehingga apabila
masih dpat di perbaiki,sebaiknya diperbaiki saja,tidak dibuang.suatu
distraktor dapat dikatan baik jika paling sedikit dipilih oleh lima
pengikut tes.

BAB XIV
MENSKOR DAN MENILAI

14.1 Menskor
Sementara orang yang berpendapat bagian yang paling penting
dar8 pekerjaan pengukuran dengan tes adalah penyusunan tes.Jika alt
65
Dasar-dasar Evaluasi Pendidikan

tsnya sudah disusun sebaik-baiknya maka anggapannya sudah tercapai


sebagian besara dari maksudnya.tentu saja anggapan itu tentu tidak
benar sekali.Penyusunantes baru merupakan suatu bagian dari
serentetetan pekerjaan mengetes.
Dalam halpekerjaan menskor atau menentukan angka,dapat
digunakan 3 macam alat bantu yaitu:
1) Pembantu menentukan jawaban yang benar disebut kunci jawaban.
2) Pembantu menyeleksi jawaban yang benar dan yang salah ,disebut
kunci scoring.
3) Pembantu menentukan angka,disebut pedoman penilaian.
Keterangan dan penggunaanya dalam berbagai kunci tes.
a. Kunci jawaban dan kunci pembagian skor untuk bentuk tes benar-
salah
Untuk tes bentuk benar-salah yang dimaksud dengan kunci jawaban
adalah deretan jawaban yang kita persiapkan untuk pertanyaan atau
soal-soal yang kita susun,sedangkan scoring adalah alat yang kita
gunakan untuk mepercepat pekerjaan scoring.
Dalam menentukan angka (skor) untuk tes bnetuk B-S mneggunakan 2
cara seperti telah disinggung didepan yaitu:
a. Tanpa hukuman atau tanpa denda
b. Dengan hukuman atau dengan denda.
Tanpa hukuman adalah apabilah banyaknya anka yang diperoleh
siswa sebanyak jawaban yang cocok dengan kunci.sedangkan dengan
hukuman (karena diragukan adanya unsure tebakan,digunakan 2 macam
rumus,tetapi hasilnya sama.
Pertama,dengan rumus:
S=R–W
Singkatan dari:
S = Skore
R = Righ
W = wrong
Skor yang diperoleh siswa sebanyak jumlah yang benar dikurangi
dengan soal yang salah.
66
Dasar-dasar Evaluasi Pendidikan

b. Kunci jawaban dan kunci pemberian skor untuk bentuk tes pilhan
ganda
Dengan tes bentuk pilihan ganda,testee diminta untuk melingkari
salah satu huruf di depan pilihan jawaban yang disediakan atau
membubuhkan tanda lingkaran atau tanda silang X pada tempat yang
sesuai di lembar jawaban.
Dalam menentukan angka untuk tes bentuk pilihan ganda,dikenal 2
macam pula yakni tanpa hukuman dan hukuman tanpa hitungan apabila
banyaknya angka dihitung dari banyaknya jaaban yang cocok dengan
kunci jawaban.
Dengan hukuman menggunakan rumus:
S=R

Dimana:
S = score
W = wrong
n =Banyaknya jawaban yang pada umunya di Indonesia 3,4,5)

c. Kunci jawaban dn kunci pemberian skor untuk tes bentuk jawab


singkat
Tes bentuk jawaban singkat adalah bentuk tes yang menghendaki
jawaban berbentuk kata atu kalimat pendek. Melihat namanya,maka
untuk jawaban tes tersebut tidak boleh berbentuk kalimat-kalimat
panjang,tetapi harus singakat dan mengandung satu pengertian.Dengan
persyaratan inilah maka bentuk tes ini dapat di golongkan bentuk tes
objektif.
Tes bentuk isian, dianggap setaraf dengan tes jawab singkat ini kunci
jawaban tes bentuk ini merupakan deretan jawaban sesuai dengan
nomornya.
d. Kunci jawaban dan kunci pemberian skor untuk bentuk tes
menjodohkan.
Pada dasarnya tes bentuk menjodohkan adalah tes bentuk pilihan
ganda,dimana jwaban-jawaban di ajdikan satu,maka jawabanya akan

67
Dasar-dasar Evaluasi Pendidikan

lebih banyak.satu kesulitan lagi adalah bahwa jawaban yang dipilh


dibuat sedemikian rupa sehingga jawaban yang satu tidak diperlukan
bagi pertanyaan lain.
Kunci jawban tes bentuk menjodohkan berbentuk sederetan jawaban
yang di kehendaki atau deretan nomor yang diikuti oleh huruf-huruf
yang terdapat didepan alternative jawaban
e. Kunci jawaban dan kunci pemberian skor untuk soal bentuk
uraian.
Sebelum menyusun sebuah tes uraian sebaiknya kita tenukan terlebih
dahulu pokok-pokok jawabanyang kita kehendaki,dengan demikian akan
mempermudah kita dalam pekerjaan mengoreksi tes itu.Tidak ada
jawaban yang pasti terhadap tes bentuk uraian ini,jawaban yang kita
peroleh akan sangat beraneka ragam berada dari siswa yang satu ke
siswa yang lain.Untuk menentukan standar lebih dahulu,tentulah
sukar.Ada sebuah saran langkah-langkah apa yang harus kita lakukan
pada waktu kita mengoreksi dan member angka tes bentukuraian.saran
tersebut adalah sebagai berikut:
1). Membaca soal pertama dari seluruh siswa untukmengetahui situasi
jawaban.
2). Menentukan angka untuk soal pertama tersebut.
3). meberikan anka bagi soal pertama
4). Membaca soal kedua dari seluruh siswa untuk mengetahui situasi
jawaban,dilanjutkan dengan pemberian angka untuk soal kedua.
5). Mengulangi langkah-langkah tersebut bagi soal-soal ketiga, keempat,
dan seterusnya hingga seluruh soal diberi angka.
6). Menjumlahkan angka-anka yang diperoleh oleh masing-masing siswa
untuk tes bentuk uraian.
f. Kunci jawaban dan kunci pemberian skor untuk tugas
Kunci jawaban untuk memeriksa tugas merupakan pokok-pokok yang
harus termuat didalam pekerjaan siswa.Hal ini menyangkut criteria
tentang isi tugas.Namun sbagai kelengkapan pemberian skor,digunakan
suatu tolak ukur tertentu.

68
Dasar-dasar Evaluasi Pendidikan

Tolok ukur yang disarankan dalam buku ini sebagai ukuran


keberhasilan tugas adlah:
1) Ketepaan waktu pemberian tugas
2) Bentuk fisik pengerjaan tugas yang menandakan keseriusan
mahasiswa dalam mengenakamn tugas
3) Sistematika yang menunjukan alur keruntutan pikiran
4) Kelengkapan isi menyangkut penyelesaian dan kepadatan isi
5) Mutu hasil tugas,yaitu kesesuaian hasil dengan garis-garis sesuai
ketentuan yang diberikan dosen.
Dalam memprtimbangkan nilai akhir perlu dipikirkan peranan
masing-masing aspekkriteria tersebut,misalnya demikian:
A1 - Ketepatan waktu bobot 2
A2 - Bentuk fisik,diberibobot 1
A3 - Sistematika,diberi bobot 3
A4 - Kelengkapan isi,diberi bobot 3

A5 - Mutu hasil diberi bobot 3

Maka nilai akhir untuk tugas tersebut diberikan dengan rumus:

NAT =

NAT adalah nilai akhir tugas.

14.2 Perbedaan Antara Skor dan Nilai


Apa yangterjadi selama ini,banyak diantara guru sendiri yang
masih mencampuradukan antara dua pengertian yaitu skor dan nilai.
Skor : Adalah hasil pekerjaan menskor yang diperoleh
menjumlahkan angka-angk bagi setiap soal tes yang di jawab betul oleh
siswa
Nilai : Adalah angka ubahan dari skor dengan menggunakan acuan
tertentu yakni acuan normal atau acuan standar.

69
Dasar-dasar Evaluasi Pendidikan

14.3 Norm-referenced dan Criterion-referenced


Dari sederetan skor yang telah diubah ke standar 100 inilah maka
dapat diperoleh agabungannya,misalnya gabungan antara nilaiulangan
ke 1- ke 2- ke3, dan seterusny.yang merupakan catatan untuk merata-
ratakan dan mengambarkan penguasaan siswa terhadap materi yang di
ajarkan,atau menggambarkan sejauh mana siswa mencapai tujuan
intstruksional umum dari satu unit bahan yang di pelajari dalam satu
ukuran waktu.
Didalam penggunaan criterion referenced,siswa dibandingkan
dengan ketentuan standar tertentu,yang dalam uraian sebelum
ini,dibandingkan dengan standar mutlak,yaitu standar 100 .
Dalam penggunaan norm eferenced,prestasi belajar seorang siswa
dibandingkan dengan siswa lain dalm kelompoknya.kualitas seorang
sangat dipengaruhi oleh kualitas kelompoknya.
Penggunaan penilaian dengan norma kelompok atau norma reltif ini
untuk pertama kali dikemukakan pada tahun 1908(cureton 1971),dengan
landasan dassar bahwa tingkat belajar siswa akan tesebar menurut kurva
norma 1.Dengan demikian penilaian berdasarkan kurva normal
merupakan hal yang tidal ddapat dibantah lagi.
Apabila standdar relatif dan standar mutlak dihubungkan dengan
pengubahan skor menjadi nilai,akan terlihat demikian:
a. Dengan standar mutlak
1) Pemberian skor terhadap siswa,didasasarkan atas pencapaian siswa
terhadap tujuan yang di tentukan.
2) Nilai diperoleh dengan mencari skor rata-rata langsung ddari skor
asal(skor lemah)

b. Dengan standar relative


1) Pemberian skor terhadap siswa juga didasarkan atas pencapaian
siswa terhadap tujuan yang ditentukan.
2) Nilai diperoleh dengan 2 cara:
a) Mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya.
b) Menjumlah skor tiap-tiap ulangan,baru diubah ke nilai.
70
Dasar-dasar Evaluasi Pendidikan

BAB XV
MENGELOLAH NILAI
15.1 Beberapa Skala Penilaian
a.Skala bebas
b.Skala 1-10
c.Skala 1-100
71
Dasar-dasar Evaluasi Pendidikan

d.Skala huruf
contoh untuk skala Penilaian

Angka 100 Angka 10 IKIP Huruf Keterangan


80-100 8,0-10,0 8,1-10 A Baik sekali

66-79 6,6-7.9 6,6-8,0 B Baik

56-65 5,6-6,5 5,6-6,5 C Cukup

40-55 4,1-5,5 4,1-5,5 D Kurang

30-39 0-4,0 0-4,0 E Gagal


Dengan mengembalikan dahulu nilai nilai huruf itu ke nilai
angka,maka dengan mudah dapat di cari rata-ratanya.

15.2 Distribusi Nilai


Distribusi nilai yang dimiliki siswa-siswanya dalam suatu kelas
didasarkan 2 macam standar yaitu:
a. Standar mutlak
Dibawa ini adalah gambaran tentang kemungkinan prestasi siswa
berdasarkan standar mutlak.

1 10 1 10
Gambaran prestasi siswa jika Gambaran prestasi siswa
soal-soalulangan yang jika soal-soal ulangan yang

72
Dasar-dasar Evaluasi Pendidikan

disusun oleh guru sangat disusun oleh guru terlalu


mudah.Di-sebut kurva juling sukar.disebut kurva juling
negatif karena ekornya positif karena ekornya
dikiri. dikanan

Apabila guru dapat menyusun soal dengan tepat,dan keadaan


siswanya bukan keadaan siswa yang terpilih,maka ada sebagian kecil dari
siswa yang memperoleh nilai rendah dan sebagian kecil lagi memperoleh
nilai tinggi,sedangkan sebagian besar mencapai nilai rata-rata.Jika hasil
ulangan digambarkan dalam kurva,akan terlihat sebagai kurva normal
seperti dibawah ini.

2% 14 34 34 14 2%
% % % %
Gambaran prestasi siswa jika soal-soal ulangan
yang disusun ada yang sukar dan ada yang mudah

Untuk melihat penyebaran atau distribusi nilai siswa-siswa dalam


satu kelas, terlebih dahulu skor-skor yang diperoleh dari ulangan disusun
urut dari yang paling tinggi ke yang paling rendah.
b. Standar relative
Dalam hal ini tanpa mengharaukan apakah distribusi skor terletak
dalam kurva juling positif atau juling negatif tetapi dalam norm-
referenced selalu tergambardalam kurva normal. Hal ini didasarkan atas
asumsi bahwa apabila distribusi skor tergambar dalam kurva juling
positif, yang kurang sempurna adalah soal-soal tesnya. Dengan demikian,
nilai siswa lalu direntangkan sedemikian rupa sehingga tersebar dari nilai
tinggi kenilai rendah, dengan sebagian terletak pada nilai sedang.
Demikian pula sebaliknya apabila skor siswa tergambar dalam kurva

73
Dasar-dasar Evaluasi Pendidikan

juling negatif. Dalam ubahan menjadi nilai, disebar sedemikian rupa


sehingga menjadi kurva normal, dengan nilai sedang adalah nilai yang
paling banyak.
Ubahan nilai dari skor-skor yang mengumpul di bawah atau di atas
dapat dilihat dalam gambar-gambar berikut

_ = nilai berdasarkan standar mutlak


--- = nilai berdasarkan standar relative

15.3 Standar Nilai


Dari distribusi nilai kita dapat membicarakan masalah standar nilai
Skor-skor siswa direntangkan menjadi 9 nilai disebut juga (standar
Nenes atau Stanines) seperti berikut.
Stanines Interpretasi
9 (4%) Tinggi (4%)
8 (7%) Di atas
7 (12%) Rata-rata (19%)
6 (17%) Rata-rata (54%)
5 (20%)
4 (17%)
3 (12%) Di bawah
2 (7%) Rata-rata (19%)
1 (4%) Rendah (4%)
Dengan adanya presentase yang ditentukan iniah maka semua situs
skor siswa dapat direntangkan menjadi nilai 1-9 di atas.
Selain dengan standar Sembilan (stanines), ada pula yang
menggunakan standar enam. Dalam hal ini hanya berkisar antara 4
sampai 9, yaitu nilai-nilai 4,5,6,7 J, 8 dan 9. Presentase penyebaran nila
dengan standar enam adalah

74
Dasar-dasar Evaluasi Pendidikan

Standar Enam Interpretasi


9 (5%) Baik sekali
8 (10%) Baik
7 (20%) Lebih dari cukup
6 (40%) Cukup
5 (20%) Kurang
4 (5%) Kurang sekali

Standar eleven (stanel)


Ada lagi standar nilai yang lain, yaitu yang selanjutnya
dikembangkan oleh Fakultas Ilmu Pendidikan UGM disesuaikan dengan
system penilain di Indonesia.
Dasar pemikiran untuk stanel ini adalah bahwa jarak praktis dalam
kurva normal adalah 6 SD yang terbagi atas 11 skala.
11 skala = 6 SD
1 skala = 6/11 SD
= 0,55 SD
Stanel
0 1 2 3 4 5 6 7 8 9 10

Mean

Standar Sepuluh
Didalam buku pedoman penilaian (buku III B seri kurikulum SMA tahun
1975) ditentukan bahwa untuk mengelolah hasil tes, digunakan standar
relative, dengan nilai berskala 1-10. Untuk mengubah skor menjadi nilai,
diperlukan terlebih dahulu :
a) Mean (rata-rata skor)

75
Dasar-dasar Evaluasi Pendidikan

b) Deviasi standar
c) Table konversi angka ke dalam nialai berskala 1-10
Tahap-tahap yang dilalui dalam mengubah skor mentah menjadi nilai
berskala 1-10 adalah sebagai berikut :
1. Menyusun ditribusi frekuensi dari angka atau skor mentah
2. Menghitung mean
3. Menghitung Standar deviasi
4. Mentranformasikan angka-angka mentah ke dalam nilai berskala 1-
10

1. Mengitung Mean
Langkah-langkahnya adalah:
a. Menentukan mean duga (atau mean terkaan), yang biasanya diambil
pada kelas interval yang mempunyai frekuensi terbesar. Besarnya
mean terkaan adalah jumlah batas-batas kelas interval dibagi 2.
Jadi MT =

b. Menentukan devisa duga (symbol d) dimana pada kelas interval


yang mengandung MT diberi symbol 0, dan naik satu-satu setiap
kelas interval di atasnya, dan turun satu-satu setiap kelas interval
di bawahnya.
c. Menghitung mean sebenarnya dengan rumus:

Mean = MT + 1

Menghitung Devisa Standar (DS) atau Standar Devisa (SD)

Menghitung nilai berskala 1-10


Table konversi yang digunakan dalam mengubah angka menjadi
nilai berskala 1-10 adalah

Tabel Konversi Angka Ke Dalam Nilai Berskala 1-10


Skala sigma Skala 1-10 Skala angka

76
Dasar-dasar Evaluasi Pendidikan

+2,25 SD )
10 Mean + (2,25)SD
+1,75 SD )
9 Mean + (1,75)SD
+1,25 SD )
8 Mean + (1,25)SD
+0,75 SD )
7 Mean + (0,75)SD
+0,25 SD )
6 Mean + (0,25)SD
-0,25 SD )
5 Mean – (0, 25)SD
-0,75 SD )
4 Mean – (0,75)SD
-1,25 SD )
3 Mean – (1,25)SD
-1,75 SD ) 2 Mean – (1,75)SD
-2,25 SD ) 1 Mean – (2,25)SD

Standar Lima
Kembali pada Gronlund selain ia mengemukakan penyebaran nilai
dengan angka, juga mengemukakan penyebaran nilai dengan huruf yang
digambarkan dengan kurva normal sebagai berikut:

-1,5 -0,5 0,5 1,5


F D C B A

7% 24% 38% 24% 7%

Dikutip dari : Gronlund Improving Marking and Reporting in Class-room

BAB XVI
KEDUDUKAN SISWA DALAM KELOMPOK

16.1 Pengertian

77
Dasar-dasar Evaluasi Pendidikan

Yang dimaksud dengan kedudukan siswa dalam kelompoknya


adalah letak seseorang siswa didalam urutan tingkatan, atau dalam istilah
umunya taitu ranking.

16.2 Cara-cara Menetukan Kedudukan Siswa


Ada bermacam-macam cara untuk menentukan ranking atau
kedudukan siswa alam kelompoknya.akan tetapi didalam uraian ini hanya
diberikan 4 cara saja,yaitu:
1) Dengan ranking sederhana(simple rank)
2) Dengan ranking persentase (percentile rank)
3) Dengan standar deviasi………..
4) Dengan menggunakan z-score

Simple rank (SR)


Simple rank: Adalah yang emnunjukan letak/kedudukan seseorang dalam
lelompoknya dan dinyatakan dengan noatau angka biasa
Percentile rank
Percentile rank atau ranking persentase adalah kedudukan kedudukan
seorang dalam kelompok,yang menunjukan banyaknya persentase yang
berada di bawahnya.
Jadi dalam hal ini siswa dibandingkan dengan siswa lain yang
mempunyai skor lain atau lebih kecil daripadanya.
Rumus untuk menentukan PR adalah:

PR =
Standar Deviasi
Yang dimaksud penentuan kedudukan siswa dengan standar deviasi
adalah penentuan kedudukan dengan membagi kelas atas kelompok-
kelompok Tiap kelompok dibatasi satu standar deviasi tertentu.
Penentuan kedudukan dengan standar deviasi dapat dilakukan dengan 2
cara,yaitu:
a) Pengelompokan 3 ranking

78
Dasar-dasar Evaluasi Pendidikan

b) Pengelompokan 11 ranking.
Standar skore atau z-score
Angka yang menunjuka perbandingan perbedaan score seseorang dari
Mean,dengan standar deviasinya.
Standar score ini lebih mempunyai arti perbandingan dengan score itu
sendiri karena telah dibandingkan dengan suatu standar yang
sama.Untuk menentukan, z-score,harus diketaui:
- Rata-rata skor dari kelompok
- Standar deviasi dari skor-skor tersebut

Rumus z z = nilai baku

BAB XVII.
MENCARI NILAI AKHIR

79
Dasar-dasar Evaluasi Pendidikan

17.1 Fungsi Nilai Akhir


Bagi seorang siswa,merupakan sesuatu yan sangat pnting karena nilai
cermin dari keberhasilan belajar.namun,bukan hanya siswa sendiri saja
yang memerlukan cermin keberhasilan belajar ini,guru orang
lainpun,memerlukanya.
a. Fungsi instruksional
Pemberian nilai merupakan suatu pekerjaan yang bertujuan untuk
memberikan suatu balikan (feed back umpan balik) yang mencerminkan
seberapa jauh seorang siswa telah mencapai nilai yang di tetapkan
dalampengajaran atau system instruksional.
b. Fungsi informative
Memberikan nilai siswa kepada orang tuanya mempunyai ati bahwa
orang tua siswa tersebut menjadi tahu akan kemajuan dan prestasi
putranya di skolah.Catatan ini akan sangat berguna,terutama bagi orang
tua yang ikut serta menyadari tujuan sekolah dan pekembangan anaknya
dengan catatan nilai untuk orangtuanya adalah:
a) Orang tua menjadi sadar akan keadan puttranya untuk kemudian
lebih baik memberikan bantuan berupa perhatian,dorongan,atau
bimbingan,dan

b) Hubungan antara orang tua dan sekolah menjadi lebih baik


c. Fungsi bimbingan
Pemberian nilai kepada siswa akan mempunyai arti besar bagi
pekerjaan bimbingan.dengan perincian gambaran nilai siswa petugas
bimbingan akan segera tahu bagian-bagian mana usaha dari siswa di
sekolah yang masih memerlukan bantuan. Catatan lengkap yang juga
mencakup tingkat (rating) dalam kepribadian siswa serta sifat-sifat yang
berhungan dengan rasa sosial akan ssangat membantu siswa dalam
pengarahannya sebagai pribadi seutuhnya.

d. Fungsi adminstratif
Yang dimaksud dengan fungsinadminstratif dalam penilaian antara
lain mencakup:
80
Dasar-dasar Evaluasi Pendidikan

1). Menentukan kenaikan dan klulusan siswa


2). Memberikan beasiswa
3). Memindahkan atau menempatkan siswa
4). Memberikan rekomunddasi untuk melanjutkan belajar dan
5). Memberi gambaran tentang prestasi siswa/lulusan kepada calon
pemakai tena.

17.2 Faktor-faktor Yang Turut Diperhitungan Dalam Penilaian


Walaupun hal yang dinilai tidak sama bagi tiapsekolah,namun
secara gais besar dapat ditentukan unsure umum dalam penilaian yang
menyagkut factor-faktor yang harus dipertimbangkan.
Unsur umum tersebut adalah sebagai berikut:
a. Prestasi/pencapaian (achievent)
b. Usaha (effort
c. Aspek prinadi dan sosial (personal and social characteristic)
d. Kebiasan bekerja (working habits)
a. Prestasi pencapaian
Nilai prestasi harus mencerminkan tingkatan-tingkatan siswa sejauh
mana telah mencapai tingkat tujuan yang ditetapkan dalam setiap bidang
studi.
b. Usaha
Terpisah dan prrestasi,guru dapat menyampaikan laporannya kepada
orang tua sisw.laporan atu nilai tidak boleh dicampuri dengan nilai
prestasi sama sekali.yang sering trjadi adalah kecenderungan dari guru
untuk menilai unsure usaha ini lebih rndah bagi anak yang prestasinya
rndah dan sebaliknya.
c. Aspek pribadi dan sosial
Unsur ini juga perlu dilaporkan terutama yang berhungan dengan
berlangsungnya proses belajar mengajar,misalnya,mentaati tata tertib
sekolah.Dalam memberikan nilai pribadi ini harus hati-hati
sekali.Rentangan nilai sebaiknya tidak usah lebar-lebar (lebih baik 6-10).
Lebih baik lagi jika diterangkan khusus dan jelas sehingga mudah
dimengerti oleh guru pembimbing dan siapa saja.
81
Dasar-dasar Evaluasi Pendidikan

d. Kebiasan bekerja
Yang dimaksud disini adalah hal-hal yang berhubungan dengan kebiasan
melakukan tugas.Misalnya,segera mengerjakan PR,keuletan dalam
usaha,bekerja teliti,kerapihan kerja.dan sebagainya.

17.3 Cara Menetukan Nilai Akhir


Tiap guru mempunyai pendapat sendiri tentang cara menentukan
nilai akhir.Hal ini dapat dipengaruhi oleh pandangan mereka terhadap
penting dan tidaknya bagian,kegiatan yang dilakukan siswa.Yang
dimaksudkan dengan kegiatan-kegiatan siswa:menyelessaikan
tugas,mengikuti diskusi,menempuh tes normative,menhadiri
pelajaran/kuliah,dan sebagainya.
a. Untuk memperoleh nilai akhir,perlu diperhitungkan nilai tes formatif
dan sumatif dengan rumus:

NA=
3
Keterangan:
NA = Nilai akhir
F = Nilai tes formatif
S = Nilai tes sumatif
Jadi Inilai akhir diperoleh dari rata-rata nilai tes formatif (diberi bobot 1)
dijumlahkan dengan tes sumatif (diberi bobot 2) kemudian dibagi 3.
b. Niai akhir diperoleh dari niali tugas, nilai ulangan uraian dan nilai
ulangan umum dengan bobot 2, 3 dan 5.Jadi jika dituliskan dalam
rumus menjadi.

82
Dasar-dasar Evaluasi Pendidikan

Keterangan:
T = Nilai uraian
H = Nilai ulangan harian
U = Nilai ulangan umum
c. Nilai akhir untuk STTB diperoleh dari rata-rata nilai ulangan harian
(diberi bobot 1) dan nilai EBTA (diberi bobot 2), kemudian dibagi 3.
Rumusnya adalah:

NA

Dimana:
= Jumlah nilai ulangan harian

E = Nilai EBTA
nH = Frekuensi ulangan harian
Didalam buku pedoman penilaian 111 B Seri kurikulum SMA tahun
1975 disebutkan demikian.
Selanjutnya didalam kurikulum SMA 1948 disebutkan cara
menentukan nilain akhir bukan hanya didassarkan atas hasil kegiatan
kurikuler saja,tetapi juga kokurikuler,
Rumusnya adalah:

Keterangan:
P = Nilai tes sub sumatif
Q = Nilai tes sumatif
R = Nilai kokurikuler
Merata-ratakan hasil penilaian sumatif dengan hasil penilaian
Setelah hasil-hasil penilaian formatif diubah kedalam nilai berskala 1-10,
kemudian untuk setiap siswa dicari rata-rata hasi penilaian formatif
dalam caturwulan/semester yang bersangkutan.
Nilai rata-rataini selanjutnya dijumlahkan dengan tes sumatif dan
kemudian hasil penjumlahan dibagi 2.Hasil yang terakhir inlah yang akan
merupakan nilai akhir bagi setiap siswa yang akan nantinya dijadikan
nilai rapor.
83
Dasar-dasar Evaluasi Pendidikan

Contoh:
Rata-rata normative 7)
) Nilai akhir 7,5
Nilai sumatif 8)
Perlu dikemukakan disini bahwa apabila pada nilai akhir terdapat
pecahan kurang dari setengah,nilai akhir tetap seperti itu.Sedangkan
pecahan lebih dari setengah,maka nilai itu dibulatkan keatas.

BAB XVIII
MEMBUAT LAPORAN

18.1 Pentingnya Laporan


84
Dasar-dasar Evaluasi Pendidikan

Pada waktu mengajar,tentu guru sudah berkali-kali member


kesempatan kepada siswa untuk menanyakan hal yang belum
diketahui.akan tetapi pada umunya mereka itu diam,tidak mau
bertanya.engan demikian,guru beranggapan bahwa siswa-siswa tersebut
sudah tahu,walaupun sebenarnya guru itu terkecoh.Problemnya baru
terbuka setelah guru memeriksa ulangan.Dari hasil tersebut guru
mengetahui bagian-bagian dari tujuan pelajaran yang diberikan di kelas
belum tercapai.
Secara system matis dapat dikemukakan bahwa laporan tentang siswa
bermanfaat bagi beberapa pihak yaitu sebagai berikut:
1) Siswa sendiri
2) Guru yang mengajar
3) Guru lain
4) Petugas lain disekolah
5) Orang tua
6) Pemakai lulusan

18.2 Macam dan Cara Membuat Laporan


Secara garis besar,catatan bagi siswa dapat dibuat dengan dua macam
cara,yakni sebagai berikut:
(1) Catatan lengkap
(2)Catatan tidak lengkap

Catatan tidak lengkap


Catatan lengkap adalah catatan tentang siswa yang berisi baik prestasi
maupun aspek-aspek pribadi yang lain, misalnya kejujuran, kepercayaan
terhadap diri, disiplin, ketelitian, dan sebagainya. Tentang isi catatannya,
ada yang hanya dinyatakan dengan kata singkat seperti “baik”, “sedang”,
”kurang” atau keterangan yang lebih terperinci.
Catatan tidak lengkap
Catatan tidak lengkap adalah catatan tentang siswa yang hanya berisi
gambaran tentang prestasi siswa,dan hanya seikit saja menyinggung
tentang kepribadian.
85
Dasar-dasar Evaluasi Pendidikan

Tentang catatan belajar pribadi siswa itu sendiri dapat dibeakan atas dua
cara:
(1) Dengan pernyataan lulus belumlulus
(2) Dengan nilai siswa.

86
Dasar-dasar Evaluasi Pendidikan

CONTOH TABEL SISWA A PADA BULAN OKTOBER 2011

Unit
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Bidang studi
Fisika x X x x x x x x x x
Pendidikan
x X x x x x x X x x
Agama
Bahasa
x X x x x x x X x x x X x x x x
Indonesia
Biologi x X x x x x x X x x
Kimia x X x x x x x X x x x
Matematika x X x x x x x
Bahasa Inggris x X x x x x x X x

KELAS X SMA 35 GORONTALO

87
Dasar-dasar Evaluasi Pendidikan

88
Dasar-dasar Evaluasi Pendidikan

Tambahan
Dalam melaporkan taraf serap siswa digunakan bentuk profil untuk tiap-
tiap mata pelajaran yang antara lain sebagai berikut :

Mata

Matematika
Pendidikan

indonesia

inggris
pelajaran

Bahasa

Bahasa
agama
PMP

IPA

IPS
Persentasi
penguasaan

100
90
80
70
60
50
40
30
20
10

Catatan : yang dimaksud dengan taraf serap disini adalah rata-rata nilai
siswa seluruh siswa

89
Dasar-dasar Evaluasi Pendidikan

BAB XIX
EVALUASI PROGRAM PENGAJARAN

Semua uraian yang telah di sajikan pada bab-bab sbelum ini


berkenaan dengan evaluasi hasil belajar.Buku ini brjudul “dasar dasar
evaluasipendidikan “Sebetulnya secara garis besar terdapat dua kegiatan
evaluasi,yaitu evaluasi terhadap kegiatan belajar siswa dan juga proses
pengajarannya.Jadi,apabila pembicaraan dalam buku ini hanya mengenai
evaluasi hasil belajar saja,tampaknya kurang komprehentif.Bab ini akan
menjelaskan tentang evaluasi yang kedua,yaitu evaluasi program.

19.1 Apakah Evaluasi Program Itu?


Evaluasi program adalah suatu rangkaian kegiatan yang dilakukan
dengan sengaja untuk melihat tingkat keberhasilan program. Ada
beberapa pengertian tentang program. Didalam kamus tertulis :
a) program adalah rencana
b) program adalah kegiatan yang direncanakan dengan seksama.
Melakukan evaluasi program adalah kegiatan yang dimaksud untuk
mengetahui seberapa tinggi keberhasilan dari kegiatan yang
direncanakan.
Sebetulnya yang menjadi titik awal dalam kegiatan evaluasi program
adalah keingintahuan penyususnan program untuk melihat apakah tujuan
program sudah tercapai atau belum.
a. jika sudah tercapai, bagaimana kualitas pencapaian kegiatanya.
b. Jika belum tercapai, bagian manakah dari rencana kegiatan yang
telah dibuat yang belum tercapai dan apa sebabnya bagian kegiatan
tersebut belum tercapai.
Ada empat macam kebijaksanaan lanjutan yang mungkin diambil
setelah evaluasi program dilakukan, yaitu :
1) kegiatan tersebut dilanjutkan karena dari data yang terkumpul
diketahui bahwa program ini sangat bermanfaat dan dapat
dilaksanakan dengan lancer tanpa hambatan sehingga kualitas
pencapaian tujuannya tinggi
90
Dasar-dasar Evaluasi Pendidikan

2) keinginan tersebut dilanjutkan dengan penyempurnaan karena dari


data yang terkumpul diketahui bahwa hasil program sangat
bermanfaat tetapi pelaksanaannya kurang lancer dan pencapaian
tujuan kurang baik.
3) Kegiatan tersebut dimodifikasi karena kemanfaatan hasil program
kurang tinggi sehingga perlu disusun lagi perencanaan secara lebih
baik.
4) Kegiatan tersebut tidak dapat dilanjutkan karena hasil program
kurang bermanfaat dan ditambah lagi didalam pelaksaannya
banyak hambatan.

19.2 Mengapa Guru Perlu Melakukan Evaluasi Program


Untuk menjawab apa sebabnya guru melakukan evaluasi program,
terlebih dahulu kita tahu tentang siapa saja yang dapat melakukan
kegiatan evaluasi program tersebut.
Yang mrlakukan evaluasi (evaluator) dalam kegiatan program bisa
orang yang ikut terlibat di dalam kegiatan, dan dapat pula orang yang
tidak terlibat langsung. Masing-masing jenis evaluator program
mengandung kelemahan.
a. Evaluator dalam (internal evaluator) sangat memahami seluk-beluk
kegiatan, tetapi ada kemungkinan dapat dipengaruhi oleh keinginan
untuk dapat dikatakan bahwa programnya berhasil.
b. Evaluator luar (external evaluator) mungkin menjumpai kesulitan
dalam memperoleh data yang lengkap karena ada hal-hal yang
“disembunyikan” oleh para pelaksana program.
Berdasarkan atas klasifikasi evaluator tersebut, maka di dalam
kegiatan belajar mengajar guru dapat dikategorikan sebagain evaluator
dalam. Guru adalah pelaksana sehingga mereka mengetahui betul apa
yang terjadi didalam proses belajar-mengejar.

19.3 Objek Atau Sasaran Evaluasi Program


Untuk dapat mengnal sasaran evaluasi secara cermat, kita perlu
memusatkan perhatian kita pada aspek-aspek yang bersangkut paut
91
Dasar-dasar Evaluasi Pendidikan

dengan keseluruhan kegiatan belajar- mengajar. Untuk itu ada baiknya


kita mengenal kembali model transformasi proses pendidikan formal di
sekolah.
Pada gambar berikut ini akan disajikan sebuah bagan yang
menunjukan hubungan antara komponen masukan mentah, sarana
pemroses, dan keluaran yang sudah selesai diproses.

Materi/ Guru Metode Sarana


kurikulum Mengajar (alat/medi
a a)
(Masukkan
instrumental)

Input Output
Proses Transformasi
(masukan) (keluaran)

(Masukkan
lingkungan)
Lingkungan Lingkungan
manusia bukan
manusia
Setelah digambarkan dalam bentuk bagan seperti ini, tampak jelas
dan rinci apa-apa yang mungkin mempengaruhi tingkat hasil belajar
siswa.
Input
Siswa adalah subjek yang menerima pelejaran. Ada siswa
pandai,kurang pandai dan tidak pandai. Setiap siswa mempunyai bakat
intelektual, emosional, sosial dan lain-lain yang sifatnya khusus. Guru
harus mampu mengenal kekhususan siswanya agar mampu memberikan
pelayanan, pendidikan dan administrative secara tepat.
Materi atau kurikulum
Di Indonesia kurikulum berlaku secara nasional karena kita menganut
system sentralisasi. Di Negara lain seperti Amerika serikat, kurikulum
sekolah disusun sendiri oleh dan berlaku untuk sesuatu Negara bagian
yang bersangkutan karena mereka menganut system disentralisasi. Di
Indonesia kurikulum di susun bersama oleh direktorat yang mengelolah

92
Dasar-dasar Evaluasi Pendidikan

jenjang dan jenis sesuatau sekolah bersama dengan pusat pengembangan


kurikulum dan sarana pendidikan.
Sasaran yang perlu dievaluasi dari komponen kurikulum ini, antara
lain, kejelasan pedoman untuk dipahami, kejelasan materi yang
tercantum, ururtan penyajian materi, kesesuaian antara sumber yang
disarankan dengan materi kurikulum, dan sebagainya.
Guru
Guru merupakan komponen penting dalam kegiatan belajar-mengajar.
Kepada guru diserahkan untuk “digarap” suatu masukan “bahan mentah”.
Sebagai alat untuk menggarap masukan adalah materi/kurikulum yang
telah tersusun. Kurikulum inilah yang menjadi pedoman guru.
Guru, seperti juga siswa, guru mempunyai kelemahan yang
bersumber dari fisik dan mental. Oleh karena itu guru juga perlu di
evaluasi.
Metode atau pendekatan dalam mengajar
Berbeda dengan evaluasi terhadap kurikulum, evaluasi terhadap
metode mengajar adalah kegiatan guru untuk meninjau kembali tentang
metode mengajar, pendekatan, atau strategi mengajar yang digunakan
guru di dalam penyampaian materi pada siswa.
Didalam melaksanakan pengajaran, tidak mustahil bahwa guru
menjumpai kesulitan ditengah-tenagh waktu mengajar, disebabkan
karena ketidaktepatan dalam memilih metode atau pendekatan.
Sarana (alat atau media pembelajaran)
Komponen lain yang perlu dievaluasi oleh guru dalam melaksanakan
kegiatan belajar-mengajar adalah sarana pendidikan, yang meliputi alat
pelajaran dan media pendidikan. Sebelum guru memulai kegiatan
mengajar, bahakan sebelum atau sekurang-kurangnya pada waktu
menyusun rencana mengajar, guru telah memilih media yang kira-kira
dapat membantu melancarkan atau memperjelas konsep yang akan
diajarkan.
Sasaran evaluasinya antara lain kelengkapannya, aragamnya, jenis,
model, kemudahan untuk digunakan (dioperasikan), mudah atau sukar

93
Dasar-dasar Evaluasi Pendidikan

diperoleh, kecocokan dengan materi yang diajarkan, jumlah ketersediaan


dengan jumlah siswa yang memerlukanya.
Lingkungan manusia
Yang dapat digolongkan sebagai masukan manusia bukan hanya
kepala sekolah, guru-guru dan pegawai TU disekolah itu, tetapi bisa siapa
saja yang dengan atau tidak sengaja berpengaruh terhdap tingkat hasil
belajar siswa.
Lingkungan bukan manusia
Yang dimaksud dengan lingkungan bukan manusia, segala sesuatu
yang berada dilingkungan siswa yang secara langsung maupun tidak,
berpengaruh terhadap prestasi belajar siswa. Contohnya : suasana
sekolah, halaman sekolah, keadaan gedung sekolah dan sarana lain,
tetangga sekolah dan lain-lain.

19.4 Bagaimana Cara Melaksanakan Evaluasi Program?


Akan memakan waktu yang banyak dan terlalu sulit jika guru masih
dibebani dengan evaluasi program secara sistematis seperti seorang
peneliti. Akan cukup kiranya guru mau membuat acauan singkat dan
sederhana yang disusun dalam bentuk pertanyaan saja. Dari pertanyaan
tersebut grur akan memperolah umpan terhadap apa yang dilakukan.
Deretan pertanyaan yang diajukan berpangkal dari komponen-
komponen transformasi yang sudah kita ketahui dalam uraian diatas.
Berikut ini beberapa contoh pertanyaannya :
1. Pertanyaan tentang siswa
a. Apakah kehadiran siswa sudah baik? Lengkap dan tepat waktu?
b. Apakah siswa tertarik pada pelajaran yang diberikan? Jika tidak
atau kurang, apa penyebabnya?
c. Apakah siswa tidak enggan melibatkan diri dalam kegiatan
belajar-mengajar?
d. Dan sebagainya
2. Pertanyaan tentang guru
a. Apakah sebelum mengajar guru sudah menguasai materi yang
akan diajarkan dengan sebaik-baiknya?
94
Dasar-dasar Evaluasi Pendidikan

b. Apakah guru dapat menjawab pertanyaan yang diajukan siswa


dengan memuaskan?
c. Apakah guru dapat berlaku adil terhadap siswa?
d. Apakah guru sudah memberikan pelayanan yang sebaik-baiknya
kepada siswa?
e. Dan sebagainya.
3. Pertanyaan tentang kurikulum
a. Seberapa jauhkah pemahaman guru tentang isi kurikulum?
b. Bagaimana kesesuaian kurikulum dengan materi yang telah
diajarkan?
c. Dan sebagainya.
4. Pertanyaan tentang sarana/media
a. Apakah pokok bahasan yang memerlukan media sudah dipenuhi
kebutuhanya?
b. Apakah media pembelajaran yang dipilih sudah tepat?
c. Apakah guru sudah terampil dalam menggunakan media?
d. Apakah siswa sudah cukup melibatkan diri dalam penggunaan
media atau alat peraganya?
e. Dan sebagainya.
5. Pertanyaan terhadap metode
a. Apakah dengan metode yang digunakan, hasil belajar siswa sudah
cukup tinggi?
b. Apakah dengan metode yang dipilih siswa mengikuti pelajaran
dengan baik?
c. Dengan mengelompokkan yang diambil, apakah semua siswa
sudah terlibat dengan aktif?
d. Apakah hasil tugas yang diselesaikan oleh siswa tidak terlihat
bahwa satu dua oorang siswa mendominasi kawanya dalam
bekerja?
e. Dan sebagainya.

95
Dasar-dasar Evaluasi Pendidikan

6. Pertanyaan tentang lingkungan manusia


a. Apakah guru sudah memanfaatkan orang-orang yang ada di
lingkungan siswa untuk menunjang pelaksanaan kegiatan belajar-
mengajar?
b. Adakah orang-orang di sekitar siswa yang mempunyai pengaruh
kurang baik terhadap siswa? Andaikan ada, apakah guru telah
mengambil langkah yang tepat?
c. Apakah guru sudah mengarahkan siswa untuk mencoba
memanfaatkan orang-orang yang ada sebagai manusia sumber
untuk menambah pengetahuanya?
d. Dan sebagainya.
7. Pertanyaan tentang lingkungan bukan manusia
a. Apakah guru sudah memanfaatkan dengan baik hal-hal yang ada
dilingkungan siswa untuk menunjang kegiatan belajar-mengajar?
b. Apakah siswa sudah diarahkan untuk memanfaatkan lingkungan
menurut kepentingan mereka sendiri?
c. Dan sebagainya.

96

Anda mungkin juga menyukai