Anda di halaman 1dari 253

You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for

this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
EVALUASI
PENDIDIKAN

Bahandenganh~ ciota
EVALUASI PENDIDIKAN

Edisi Pertama
Copyright @ 2016

ISBN: 978-602-71698-7-6
Cetakan ke-1 . Januari 2016

Penulis
Dr. lbadullah Malawi. M. Pd.
Endang Sri Maruti. M. Pd.

Desain Sampul dan Tata Letak


Edi Riyanto

Penerbit
CV. AE MEDIA GRAFIKA
JI. Raya Solo Maospati. Magetan.
Jawa Timur 63392
Telp. 082336759777
email: aemediagrafika@gmail.com
website: http://aemediagrafika.co. id

Hak cipta dilindungi undang-undang


Oilarang memperbanyak karya tulis ini dalam bentuk dan dengan
cara apapun tanpa ijin tertulis dari penerbit. kecuali dalam hal
pengutipan untuk penulisan artikel atau karangan ilmiah

.
IV

Bahandenganh~ ciota
Bab I
Pendahuluan

A. Pengertian Evaluasi
lstilah evaluasi berasal dari bahasa lnggris "evaluation"
dan diambil dari kata "testum" berasal dari bahasa Perancis
kuno yang berarti piring untuk menyisihkan logam-logam mulia.
Ada pula yang mengartikan sebagai sebuah piring yang dibuat
dari tanah liat.
Banyak di antara kita yang kadang kurang menyadari
bahwa setiap saat kita senantiasa melakukan pekerjaan
evaluasi. Membahas tentang evaluasi sebenarnya akan lebih
lengkap apabila kita bahas pula tentang pengukuran dan
penilaian. Dalam kegiatan sehari-hari ketiga kata, yaitu
evaluasi, pengukuran dan penilaian, sering cenderung
memberikan pengertian yang sama, sehingga dalam
pemakaiannya tergantung dari kata mana yang sedang siap
untuk diucapkannya. Namun terdapat sementara fihak yang
membedakan ketiga istilah tersebut. Contoh berikut ini dapat
digunakan sebagai upaya memahami apa persamaan,
perbedaan atau hubungan antara ketiganya: manakah kain
sutera yang akan anda pilih: kain sutera yang panjang atau
yang pendek, jika disediakan harga dan kualitas yang sama?
Atau sebuah mangga yang manakah yang akan anda pilih
ketika anda akan membelinya?
Dari contoh-contoh di muka itu kesimpulan apa yang
anda dapatkan?. Manakah yang bermakna penilaian,
pengukuran, dan manakah langkah yang menunjukkan
evaluasi?. Untuk dapat mengadakan penilaian kita perlu
mengadakan pengukuran (measurement) terlebih dahulu

EVAL..UASI PENOIOIKAN

Bahan oenqan h~ ciota


(besar,kecil, panjang atau pendek), sehingga ketentuannya
lebih bersifat kuantitatif (how much). Untuk menentukan apakah
mangga yang kita pilih itu baik atau buruk merupakan suatu
keputusan yang bersifat kualitatif (what value). Sedang
mengukur dan menilai itulah yang disebut mengevaluasi.
Bertolak dari diskripsi di muka itu, maka evaluasi
pendidikan dapat diartikan sebagai suatu tindakan atau suatu
proses untuk menentukan nilai dari segala sesuatu dalam dunia
pendidikan atau segala sesuatu yang ada hubungannya
dengan dunia pendidikan.
B. Penilaian
Pendidikan
Penilaian pendidikan merupakan suatu kegiatan menilai
yang terjadi dalam kegiatan pendidikan. Pembahasan tentang
penilaian pendidikan ini akan dibatasi pada masalah penilaian
pendidikan di sekolah. Dengan demikian dalam kegiatan
penilaian yang dilakukan oleh seorang guru atau pengelola
pengajaran ketika mengadakan penilaian tentu dengan maksud
melihat apakah usaha yang dilakukan melalui pengajaran
sudah mencapai tujuan atau belum.
Sekolah adalah wadah (transformasi) yang berfungsi
untuk mengolah atau memproses bahan mentah agar
diperoleh hasil atau lulusan (output) yang sesuai tujuan yang
telah ditetapkan sekolah itu. Jika digambarkan dalarn bentuk
diagram akan terlihat seperti berikut:

Input .. Input
I
I
Transformasi
'

Umpan Balik

INPUT adalah bahan mentah (siswa) yang harus


diproses ke dalam. Sebelum memasuki suatu tingkat sekolah
(institusi}, calon siswa itu dinilai lebih dahulu kemampuannya,
dengan tujuan ingin diketahui apakah siswa memiliki
kemampuan mengikuti pelajaran dan melaksanakan tugas•
tugas yang akan dibebankan kepadanya.

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
OUTPUT adalah bahan jadi setelah diproses ke dalam
tranfmormasi dan direkomendasi-kan apakah seorang siswa
berhak lulus atau tidak, setelah melalui proses penilaian.
TRANSFORMASI adalah mesin pengubah bahan
mentah menjadi bahan jadi. Dalam dunia pendidikan (sekolah)
sendiri terdiri dari beberapa mesin yang menyebabkan berhasil
atau gagalnya sebagai teransformasi. Bahan jadi yang
diaharapkan yaitu lulusan ditentukan oleh beberapa faktor
sebagai akibat bekerjanya unsur-unsur yang ada. Unsur-unsur
itu meliputi: (1) guru dan personal lainnya; (2) Bahan pelajaran;
(3) Metode mengajar dan sistem evaluasi; (4) saran penunjang;
dan (5) sistem administrasi.
UMPAN BALIK (FEED BACK) adalah segala informasi
baik yang menyangkut output maupun transformasi. Umpan
balik ini diperlukan sekali untuk memperbaiki input maupun
transformasi. Output yang kurang atau tidak memenuhi kualitas
akan menggugah semua fihak untuk mengambil keputusan
atau tindakan yang berhubungan dengan akar penyebab
kurang bermutunya lulusan, yang meliputi antara lain: (1)
kualitas input; (2) kualitas guru dan personal lainnya; (3)
ketepatan dan ketersediaan materi ketepatan penerapan
strategi pembelajaran; (4) kesesuaian metode yang digunakan
dalam pembelajaran; (5) minimnya sarana penunjang; (6)
sistem administrasi yang kurang tepat.
C. Fungsi dan Makna Penilaian dalam
Pendidikan
Evaluasi dalam bidang pendidikan dan pengajaran
mempunyai beberapa fungsi sebagai berikut:
a. Untuk mengetahui taraf kesiapan dari siswa untuk
menempuh sesuatu pendidikan tertentu. Artinya apakah
seorang siswa sudah cukup siap untuk diberikan pendidikan
tertentu atau belum.
b. Untuk mengetahui seberapa jauh hasil yang telah dicapai
dalam proses pendidikan yang telah dilaksanakan.
c. Untuk mengetahui apakah suatu mata ajar yang diberikan
kepada siswa dapat dilanjut-kan dengan bahan baru atau
perlu mengulangi kembali bahan ajar yang telah lampau.

EVAL..UASI PENOIOIKAN 1: 3 ~r
Bahanuenganh~ ciota
d. Untuk rnendapatkan bahan-bahan inforrnasi dalarn
rnernberikan birnbingan tentang jenis-jenis pendidikan atau
jenis-jenis jabatan yang cocok untuk seseorang (siswa).
e. Untuk rnendapatkan bahan-bahan inforrnasi guna
rnenetukan apakah seorang siswa dapat rnengikuti jenjang
kelas yang lebih tinggi atau perlu rnengulang kernbali bahan•
bahan yang telah larnpau.
f. Untuk rnernbandingkan prestasi yang dicapai oleh siswa
sudah sesuai dengan kapasitasnya atau belurn.
g. Sebagai prediksi kernatangan siswa untuk dilepas di tengah•
tengah kehidupan rnasyarakat atau belurn.
h. Untuk rnengadakan seleksi bagi calon pada suatu jabatan
atau jenis pendidikan tertentu.
1. Untuk rneneliti rnengenai taraf efisiensi rnetode yang
digunakan dalarn proses pernbelajaran di kelas.
Sedangkan Evaluasi dalarn bidang pendidikan dan
pengajaran rnernpunyai beberapa rnakna sebagai berikut, yaitu
: rnakna bagi siswa, rnakna bagi guru, dan rnakna bagi sekolah.
Berikut akan dicoba untuk rnernberikan penjelasan tentang
rnasing-rnasing rnakna tersebut dalarn kaitannya dengan
proses pendidikan dan pengajaran di sekolah, yang akan
sangat berrnanfat bagi kelancaran proses pernbelajaran.
1. Makna bagi
siswa
Dengan dilakukan suatu penilaian, rnaka siswa dapat
rnengetahui tingkat keberhasilan selarna rnengkuti pelajaran
yang diberikan oleh guru. Hasil yang diperoleh siswa didik dari
pekerjaan rnenilai itu dapat: (1) rnernuaskan; dan (2) tidak
rnernuaskan. Banyak sekali faktor yang rnenyebabkan siswa
rnerasa puas atau tidak puas terhadap hasil penilaian tersebut,
yang secara garis besar dapat dibedakan rnenjadi: faktor
internal dan faktor eksternal siswa didik sebagai subyek belajar.
a. Faktor internal dibedakan rnenjadi: faktor psikis dan faktor
fisik/ kondisi fisik
siswa
1) Faktor psikis, yang dibedakan rnenjadi faktor yang
bersifat intelektual dan faktor yang bersifat non•
intelektual. Faktor yang bersifat intelektual terdiri dari
beberapa sub faktor, yang antara lain rneliputi: (1) taraf
inteligensi; (2) kernarnpuan belajar; dan (3) cara belajar.

EVALUASI Pe:NDIDIKAN
Bahandenganh~ ciota
Faktor yang bersifat non-intelektual terdiri dari beberapa
sub faktor, seperti: (1) motivasi belajar; (2) sikap siswa
dalam belajar; (3) minat siswa dalam belajar; (4)
perasaan siswa; (5) perhatian; (6) kondisi akibat sosial•
kultural; dan kondisi ekonomi keluarga.
2) Faktor fisik, yang lebih mengarah kepada kondisi fisik
siswa, yaitu sehat atau tidaknya aspek jasmani siswa.
b. Faktor eksternal, yaitu faktor yang terdapat di luar diri siswa,
yang terdiri dari faktor faktor sebagai berikut, yaitu: pengatur
proses, faktor sosial, dan faktor situasional.
1) Faktor pengatur proses meliputi: kurikulum, disiplin,
teacher-effectiveness, fasilitas belajar, dan faktor
pengelompokan siswa.
2) Faktor-faktor sosial meliputi antara lain: sistem sosial,
status sosial siswa, dan interaksi antara guru dengan
siswa didik.
3) Faktor-faktor situasional meliputi: keadaan iklim politik•
ekonomi, keadaan waktu, keadaan musim-iklim.
2. Makna bagi guru
Penilaian bagi guru sangat besar sekali bagi guru,
karena dengan hasil penilaian yang diperoleh guru akan dapat
mengetahui: (1) tingkat penguasaan siswa terhadap bahan ajar
(2) guru mengetahui ketepatan materi yang diberikan; (3) guru
mengetahui ketepatan dalam menggunakan metode
pemberlajaran.
3. Makna bagi sekolah
1) Apabila guru-guru mengadakan penilaian dan diketahui
hasil belajar siswa didiknya, dapat diketahui pula apakah
kondisi belajar yang diciptakan oleh sekolah sudah
sesuai dengan harapan atau belum. Hasil belajar
merupakan cermin kualitas sesuatu sekolah.
2) lnformasi dari guru tentang tepat tidaknya kurikulum
untuk sekolah itu dapat merupakan bahan pertimbangan
bagi perencanaan sekolah untuk masa-masa yang akan
datang.
3) lnformasi hasil penilaian yang diperoleh dari tahun ke
tahun, dapat digunakan sebagai pedoman sekolah, yang
dilakukan oleh sekolah sudah memenuhi standar atau

EVAL..UASI PENOIOIKAN 1: 5 ~r
Bahanuenganh~ ciota
belum. Penentuan standar akan terlihat dari bagusnya
prestasi belajar siswa.
Secara rinci dan sesuai dengan urutan kejadiannya,
dalam proses transformasi ini penilaian dibedakan menjadi tiga
jenis: (1) sebelum kegiatan pengajaran; (2) selama kegiatan
pengajaran; dan (3) sesudah kegiatan pengajaran.

D. Ciri-ciri Penilaian dalam Pendidikan


1. Ciri pertama dari penilaian pendidikan, yaitu bahwa
penilaian dilakukan secara tidak langsung. Misalnya menilai
seseorang itu pandai atau inteligen, seorang ahli llmu Jiwa
Carl Witherington menciptakan suatu test inteligensi yang
bertujuan untuk mengukur kepandaian melalui ukuran
kemampuan menyelesaikan soal-soal. Menurut Carl
Whiterington, seseorang yang inteligen adalah yang memiliki
kemampuan untuk: 1) bekerja dengan bilangan; 2)
menggunakan bahasa dengan baik; 3) menangkap sesuatu
yang baru secara adequat; 4) mengingat; 5) memahami
hubungan (termasuk kelucuan); dan 6) berfantasi
Selanjutnya mengenai macam tingkat inteligensi
dibandingkan dengan jumlah umat manusia dapat
dinyatakan sebagai berikut:
a) 1°/o luar biasa mempunyai IQ antara 30 -70
b) 5% dungu, mempunyai IQ antara 70 - 80
c) 14°/o bodoh, mempunyai IQ antara 80 - 90
d) 60°/o normal, mempunyai IQ antara 90 - 110
e) 14°/o pandai, mempunyai IQ antara 110 -120
f) 5% sangat pandai, mempunyai IQ antara 120 - 130
g) 1 % genius, mempunyai IQ lebih dari 130
2. Ciri kedua, dari penilaian pendidikan yaitu penggunaan
ukuran kuantitatif, artinya menggunakan simbol bilangan
sebagai hasil pertama pengukuran, baru diinterpretasikan ke
bentuk kualitatif.
3. Ciri ketiga, dari penilaian pendidikan, yaitu bahwa penilaian
pendidikan menggu-nakan unit-unit atau satuan-satuan yang
tetap.
4. Ciri keempat, dari penilaian pendidikan, yaitu bahwa
penilaian pendidikan bersifat relatif, artinya hasil belajar

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
siswa tidak senantiasa menunjuk kesamaan atau tidak
selalu tetap dari waktu ke waktu yang lain.
5. Ciri kelima, dari penilaian pendidikan , yaitu bahwa dalam
penilaian pendidikan itu sering terjadi kesalahan, yang
kesalahan tersebut dapat bersumber pada:
a) alat ukurnya
b) evaluator atau tester: adanya faktor subyektivitas penilai,
hallo-effect, pengaruh hasil yang telah diperoleh
sebelumnya, dan ketidak akuratan dalam menjumlah
angka.
c) Testee (subyek yang dikenai penilaian).
d) Situasi saat dilaksanakan penilaian.
E. Obyek dan Subyek Evaluasi
Obyek atau sasaran penilaian adalah segala sesuatu yang
menjadi titik pusat pengamatan karena penilai (tester)
menginginkan informasi tentang obyek yang dinilainya. Menurut
A.N Oppen helm melalui Suharsimi Arikunto (1987) obyek
penilaian dalam dunia pendidikan dan pengajaran adalah
meliputi:
1. Input
Obyek penilaiannya meliputi: kemampuan, kepribadian,
sikap, dan inteligensi yang dimiliki oleh siswa sebagai
subyek didik.
2. Transformasi, yang obyek penilaiannya meliputi unsur•
unsur: kurikulum, materi pelajaran, metode dan strategi
penilaian, sarana pendidikan atau media, sistem
administrasi, serta guru dan personal lainnya.
3. Output
Penilaian terhadap lulusan (output) sesuatu sekolah
dilakukan untuk mengetahui seberapa jauh tingkat
pencapaian/prestasi belajar siswa selama mengikuti
program. Alat yang digunakan untuk mengukur pencapaian
ini disebut tes pencapaian atau achievement tes.
Sebagai obyek evaluasi, testee harus memberikan
respon atau jawaban, maka obyek tersebut juga disebut
sebagai responden.

EVAL..UASI PENOIOIKAN

Bahanuenganh~ ciota
Subyek evalauasi atau subyek penilaian adalah individu
yang melakukan pekerjaan evaluasi. Siapa yang dapat disebut
sebagai subyek evaluasi untuk setiap tes, ditentukan oleh suatu
aturan pembagian tugas atau ketentuan yang berlaku. Misalnya
tes prestasi belajar maka subyek evaluasinya adalah guru, tes
kepribadian atau tes psikologi pada umumnya, maka yang
memiliki kompetensi untuk melaksanakan evaluasi dan
menafsirkan hasil tes tersebut seorang adalah psikolog.

F. Ruang Lingkup Evaluasi


Sesuai dengan tujuan pendidikan dan pengajaran di
sekolah, maka ruang lingkup evaluasi dalam pendidikan dan
pengajaran di sekolah meliputi evaluasi: hasil belajar,
inteligensi, bakat dan minat, hubungan sosial, sikap dan
kepribadian. Tekanan utama dalam pembahasan ini adalah
pada evaluasi hasil belajar, sedang ruang lingkup yang lain
hanya akan dibahas secara garis besar.

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
Bab II
Perencanaan
Penilaian Hasil Belajar dan
Alat-Alat Evaluasi

A. Perencanaan Penilaian Hasil Belajar


Perencanaan untuk suatu rangkaian kegiatan penilaian
hasil belajar dalam suatu program pendidikan dapat dibedakan
menjadi dua bagian, yaitu: perencanaan umum dan
perencanaan khusus.
1. Perencanaan Umum
Perencanaan umum yaitu suatu perencanaan yang
menyangkut segenap rencana evaluasi hasil belajar dalam
suatu jenis pendidikan tertentu. Dewasa ini pengaturan tentang
pemberian pelajaran mulai dari Sekolah Dasar (untuk kelas•
kelas tinggi) sampai Sekolah Menengah diberlakukan sistem
guru bidang studi. Dalam sistem ini seorang guru memberi
pelajaran beberapa kelas dengan beberapa bidang studi yang
sejenis, sehingga pencapaian tujuan pendidikan untuk seorang
atau sekelompok siswa bukan hanya tanggung jawab seorang
guru, tetapi lebih merupakan tanggung jawab bersama dari
sejumlah guru.
Sehubungan dengan sistem pengaturan pemberian
pelajaran sebagaimana telah digambarkan di muka itu, rnaka
dua hal yang penting harus diperhatikan setiap guru atau
pengajar di sekolah, yaitu:
a. Guru perlu memahami terlebih dahulu tujuan pendidikan
(TUP dan TPK) yang harus dicapai oleh satu jenis
pendidikan ketika guru itu bertugas.

EVAL..UASI PENOIOIKAN 1: g ~r
Bahanuenganh~ ciota
b. Guru perlu menyadari apa sumbangan yang dapat
diberikannya dalam mencapai tujuan-tujuan pendidikan itu,
melalui bidang studi yang diampunya.
Melalui dua kegiatan tersebut, maka guru dapat
mengetahui gambaran yang lengkap tentang kemajuan belajar
siswa didik setelah guru atau sejumlah guru mengadakan
evaluasi hasil belajar. Hasil evaluasi belajar siswa itu juga
dapat dinyatakan sebagai gambaran tentang kemampuan
belajar siswa, dan kemampuan belajar siswa itu dapat
dikatakan sebagai proyeksi dari kemampuan belajar siswa
tersebut.
Oleh karena evaluasi hasil belajar di suatu sekolah akan
dilakukan oleh sejumlah tenaga pengajar di sekolah itu, maka
supaya tidak terjadi kesimpang-siuran dalam pelaksanaan
antara guru yang satu dengan guru lainnya, perlu diberlakukan
suatu pedoman bersama yang dapat dijadikan pegangan dalam
melaksanakan evaluasi belajar untuk masing-masing guru
bidang studi. Program tersebut dinamakan program evaluasi,
yang disusun dalam suatu program bersama tentang kegiatan
evaluasi yang dilaksanakan di sekolah yang dimaksud.
Program evaluasi itu dapat disusun untuk jangka pendek (satu
tahun) atau untuk jangka panjang (lima tahun).
Mengenai ketentuan-ketentuan yang perlu dicantumkan
dalam program evaluasi tergantung pada berbagai faktor.
Mengenai faktor-faktor yang perlu dipertimbangkan untuk
menentukan pokok-pokok yang perlu dicantumkan dalam
program evaluasi untuk suatu sekolah meliputi:
a. Kecakapan serta pengalaman yang dimiliki oleh para guru
dalam soar evaluasi dan teknik-teknik evaluasi.
b. Jelas tidaknya, rinci tidaknya rumusan tentang tujuan•
tujuan pendidikan, maupun rumusan tentang tujuan-tujuan
pelajaran yang tercantum dalam rencana pelajaran.
c. Tersedia tidaknya alat-alat evaluasi yang akan
dipergunakan. Apabila alat-alat evaluasi yang akan
digunakan telah cukup tersedia maka dalam program
evaluasi cukup disebutkan bahwa pada waktu trertentu,
diadakan evaluasi terhadap aspek tertentu dengan alat
tertentu.

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
Program-program evaluasi harus bersifat singkat dan
cukup jelas bagi setiap orang yang akan menggunakannya.
Program evaluasi sekali-kali tidak boleh menyerupai suatu
texbook tentang evaluasi. Program evaluasi untuk suatu
sekolah hendaknya memuat hal-hal berikut ini:
a. Rincian terhadap tujuan evaluasi dalam lembaga pendidikan
dan tujuan evaluasi setiap bidang studi.
b. Rincian mengenai aspek pertumbuhan yang harus
diperhatikan dalam setiap tindakan evaluasi.
c. Metode evaluasi yang dapat digunakan.
d. Masalah alat yang dapat digunakan.
e. Kriterium dan skala yang digunakan.
f. Jadwal evaluasi.

2. Perencanaan Khusus
Perencanaan khusus yaitu langkah-langkah perencanaan
yang khusus dilakukan oleh setiap guru setiap kali guru itu akan
mengadakan evaluasi hasil belajar. Pelaksanaan perencanaan
khusus ini akan berhasil apabila dibarengi adanya program
evaluasi dan persiapan khusus. Keduanya hal ini merupakan
dua hal yang tidak bisa dipisah-pisahkan karena keduanya
adalah saling melengkapi. Persiapan-persiapan khusus untuk
suatu tindakan evaluasi dapat dibagi menjadi beberapa aspek,
yaitu: merumuskan tujuan, menetapkan aspek-aspek yang
dinilai, dan menetapkan metode, serta menyiapkan alat-alat
yang menunjang dan diperlukan pelaksanaan evaluasi.
a. Merumuskan tujuan
Pertama yang harus dilakukan sebelum melaksanakan
evaluasi adalah merumuskan tujuan evaluasi secara rinci, dan
seberapa dalam proses mental yang ingin diukur dalam
hubungannya dengan pengetahuan tentang materi yang
dievaluasikan. Rincian pengetahuan yang hendak diukur dapat
dilakukan dengan berpedoman pada taksonomi Bloom
(Bloom's Taxonom1), yang menggolongkan jenis ilmu
pengetahuan adalah:
1) Daerah kognitif ( Cognitive domain): meliputi aspek-aspek:
(a) pengetahuan; (b) pengertian; (c) aplikasi; (d) analisis; (e)
sintesis; dan (f) evaluasi.

EVAL.UASI PENOIOIKAN

Bahanuenganh~ ciota
2) Daerah afektif (Affective domain) yang meliputi aspek-aspek:
(a) penerimaan; (b) respon; (c) penilaian; (d) organisasi; (e)
karakterisasi.
3) Daerah psikomotor (Psichomotor domain): meliputi: (a)
peniruan; (b) penggunaan; (c) ketelitian; (d) penyanbungan;
dan (e) naturalisasi. (Wayan Nurkancana: 1986: 21 ).
b. Menetapkan aspek-aspek yang dinilai
Aspek-aspek yang akan dinilai dalam suatu tindakan
evaluasi didasarkan pada tujuan evalusi yang telah
dirumuskan. Apabila tujuan evaluasi bertujuan ingin
mengetahui pengetahuan testee tentang suatu obyek (air)
diklasifikasikan menjadi fakta, pengertian dan aplikasi, maka
aspek-aspek yang akan diungkap dalam tindakan evaluasi
yang dilaksanakan dengan sendirinya adalah manifestasi dari
pengetahuan fakta, pengertian dan aplikasi tersebut.
c. Menetapkan metode
Menentukan metode yang akan digunakan Dalam
tindakan evaluasi dilakukan setelah merumuskan Tujua
n
evaluasi. Metode yang akan digunakan menjadi efektif apabila
kita mengetahui aspek-aspek yang akan kita nilai. Kalau aspek
yang akan kita nilai memiliki bermacam-macam bentuk
manifestasi, maka sedapat mungkin kita pilih manifestasi yang
paling langsung dari aspek tadi. Misalnya tujuan mata
pelajaran fisika dirumuskan sebagai: menanamkan kepada
siswa tentang pengertian udara, maka untuk menilai
pengetahuan siswa tentang pengertian udara itu dapat
menggunakan "metode tes", Sedangkan untuk menilai
pengetahuan siswa tentang makna dari udara bagi kehidupan
maka dapat digunakan "metode eksperimen".
d. Meyiapkan alat-
alat
Alat-alat yang perlu disiapkan dalam tindakan
evaluasi erat berhubungan dengan metode yang digunakan
dalam evaluasi. Apabila dalam tindakan evaluasi berupa tes
tertulis, maka alat-alat berupa soalan tes. Kalau evaluasi yang
dilaksanakan berupa eksperimen, maka alat yang harus
disiapkan dapat merujuk ke ruang laboratorium.

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
B. Alat-AlatEvaluasi
Secara garis besar alat evaluasi dapat diklasifikasikan
menjadi dua macam, yaitu: tes dan non-tes. Mengingat luasnya
dan mendalamnya pembahasan mengenai teknik tes, maka
masalah non-tes akan dibahas terlebih dahulu.
1. Teknik Non Tes
Teknik non-tes terdiri dari: skala bertingkat, kuesioner,
daftar cocok, wawancara, pengamatan, dan riwayat hidup.
a. Skala bertingkat (rating scale)
Teknik ini menggambarkan suatu nilai yang berbentuk
bilangan terhadap suatu pertimbangan. Oppenheim melalui
Suharsimi Arikunto (1987: 23) menyatakan: "Rating gives a
numerical value to some kind of judgment", maka suatu skala
selalu disajikan dalarn bentuk angka atau bilangan.
Contoh 1: skor prestasi belajar matematika siswa SLTP Mundur

4 5 6 7 8
Conteh 2: Kecenderungan siswa terhadap membaca komik

• STS TS Bl SK SS
b. Kuesioner ( Questionaire)
Teknik kuesioner sering dikenal dengan angket, yaitu
daftar pertanyaan yang harus diisi oleh responden. Melalui
teknik angket ini dapat diungkap mengani data diri,
pengalaman, pengetahuan, sikap atau pendapat, dll. Mengenai
macam angel dapat ditinjau dari berbagai segi, yaitu:
1) Ditinjau dari segi testee, dibedakan menjadi angket
langsung dan angket tidak langsung.
2) Ditinjau dari segi cara menjawab, dapat dibedakan menjadi:
angket terbuka dan angket tertutup.
c. Daftar Cocok (Chek list)
Daftar cocok (chek list) yaitu deretan pernyataan
(biasanya singkat-singkat), dimana responden tinggal
membubuhkan tanda cocok (V) di tempat yang telah
disediakan.
Contoh: Berilah tanda " pada kolom yang sesuai dengan
pendapat anda!

EVAL..UASI PENOIOIKAN 1: 13 ~r
Bahanuenganh~ ciota
Pendapat Tidak
Penting Biasa
Pernyataan Penting
1. Membaca koran
2. Membaca Majalah
3. Ke Perpustakaan
4. Tentir
5. Diskusi Kelompok

d. Wawancara (Interview)
Wawancara adalah suatu metode pengumpulan data
dengan mendapatkan jawaban dari interview dengan cara
tanya jawab sepihak (oleh pihak interviewer). Wawancara dapat
dilakukan dengan dua cara, yaitu: interiew bebas dan interview
terpimpin.
e. Pengamatan (Observation)
Observasi adalah suatu teknik yang dilakukan dengan
cara mengadakan pengamatan secara teliti dan dengan
pencatatan secara sistematis. Terdapat tiga macam observasi,
yaitu: observasi partisipan, observasi sistematik, dan obsevasi
eksperimental.
f. Riwayat Hidup
Riwayat hidup adalah gambaran tentang keadaan
seseorang selama dalam masa kehidupannya. Dengan
mempelajari riwayat hidup, maka subyek evaluasi akan dapat
menarik suatu kesimpulan tentang kepribadian, kebiasaan, sikap
dari subyek yang dikenai penilaian.
2. Teknik Tes
a. Pengertian Tes
Rumusan tentang tes ini bermacam-macam. Di dalam
bukunya yang berjudul Evaluasi Pendidikan, Amir Daien
lndrakusuma mengatakan bahwa: "Tes adalah suatu alat atau
prosedur yang sistematis dan obyektif untuk memperoleh data
atau keterangan yang diinginkan tentang seseorang, dengan
cara yang boleh dikatakan tepat dan cepat" (Suharsimi
Arikunto, 1987: 29).
Selanjutnya dalam bukunya: "Teknik-teknik Evaluasi",
Muchtar Buchori menyatakan:

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
"Tes adalah suatu percobaan yang diadakan untuk
mengetahui ada atau tidaknya hasil-hasil pelajaran tertentu
pada seorang murid atau kelompok murid".
Definisi berikut ini dikutib dari Webster'S Colleiate melalui
Suharsimi Arikunto, dalam bukunya yang berjudul "Evaluasi
Pendidikan" (1987: 29).
"Test = any series of questions or exercises or other
means of measuring the skill, knoledge, intelligence,
capasities of aptitudes or an individual or group" (Tes
adalah serentetan pertanyaan atau latihan atau alat lain
yang digunakan untuk mengukur ketrampilan,
pengetahuan, inteligensi, kemampuan dan bakat yang
dimiliki oleh individu atau kelompok).

Dari beberapa pengetian di muka itu dapat ditarik suatu


kesimpulan bahwa tes merupakan suatu alat yang digunakan
untuk mengumpulkan fakta atau informasi, tetapi apabila
dibandingkan dengan alat alat-alat yang lain, tes ini bersifat
resmi karena penuh dengan batasan-batasan.
Apabila rumusan tes sebagaimana dinyatakan di muka itu
dilakukan di sekolah atau di kelas, maka tes memiliki fungsi
ganda, yaitu: mengukur siswa dan mengukur keberhasilan
program pengajaran.
b. Kegunaan Tes
Ditinjau dari segi kegunaan untuk mengukur siswa, maka
dibedakan menjadi: tes diagnostik, tes formatif, dan tes sumatif.
Tes diagnostik bertujuan mengetahui kelemahan-kelemahan
siswa sehingga atas dasar kelemahan-kelemahan tersebut
dapat dilakukan terapi yang adequat. Tes formatif
untuk mengetahui sejauh mana siswa telah terbentuk
setelah mengikuti sesuatu program tertentu. Tes formatif
dapat dilaksanakan pada akhir setiap program pengajaran.
Manfaat tes formatif adalah: (1) untuk mengetahui apakah
siswa sudah mengetahui bahan ajar secara menyeluruh;
(2) sebagai reinforcement bagi siswa; (3) sebagai umpan balik
(feed back); dan (4) sebagai diagnose. Sedangkan
tes sumatif dilaksanakan setelah berakhirnya
pemberian sekelompok program pengajaran atau suatu
program yang lebih besar. Manfaat dari tes sumatif adalah:
(1) mengukur kemampuan

EVAL..UASI PENOIOIKAN 1: 15 ~r
Bahanuenganh~ ciota
belajar siswa; (2) menentukan nilai; (3) mengisi
catatan kemajuan belajar siswa.

c. Pelaksanaan Tes Formatif dan Tes Sumatif


dalam
Praktek
Tes formatif dalam pelaksanaan di sekolah merupakan
ulangan harian, sedangkan tes sumatis biasanya dikenal
sebagai ulangan umum atau ulangan akhir semester, yang kini
lazim disebut ujian akhir sekolah (ulangan umum).
Tes formatif dilaksanakan oleh para guru setiap
mengakhiri satu sub pokok bahasan, sedangkan tes sumatif
dilaksanakan setiap akhir semester atau mengakhiri satu pokok
bahasan (jadi dalam program yang lebih besar).
Dalam pelaksanaannya tes sumatif di sekolah-sekolah,
ada yang diselenggarakan bersama antara sat daerah atau
wilayah administratif, dan dikenal sebagai THB (Tes Hasil
Belajar), TPB (Tes Prestasi Belajar), atau istilah lainnya.
Seperti terdapat efek positif dan negatif atas dihapuskannya
ujian negara menjadi ujian sekolah,maka tes sumatif (THB,
TPB) ini mempunyai kebaikan dan keburukan.
1) Kebaikan THB bersama
(a) Hasil tes belajar tersebut dapat digunakan sebagai data
pembanding mengenai kemajuan sekolah-sekolah yang
terdapat dalarn suatu wilayah;
(b) Dapat menimbulkan suatu persaingan yangf sehat
antara satu sekolah dengan sekolah lainnya;
(c) Standar pelajaran dapat terpelihara dengan sebaik•
baiknya karena soal tes disusun bersama.
2) Kelemahan THB bersama
(a) Terdapat kecenderungan dalam memberi pelajaran
hanya berorientasi kepada "ujian" atau sekedar
mengejar "nilai" dengan cara memberikan latihan•
latihan mengerjakan soal-soal sebanyak-banyaknya,
dan bukan berorientasi kepada pemberian pengetahuan
yang menjadi bekal hidup siswa di waktu yang akan
datang, yang membuat siswa hidup sejahtera.
(b) Tidak menghiraukan jika terjadi beberapa bentuk
kecurangan karena ada sekolah (sekolah-sekolah)
yangingin memdapat nama baik.

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
(c) Hasil evaluasi siswa ditentukan oleh aspek-aspek di luar
diri siswa, tanpa mengindahkan bahwa yang
mengetahui diri siswa itu adalah siswa itu sendiri.
(d) Perbandingan antara Tes Diagnostik, Tes Formatif, dan
Tes Sumatif.

Perbandingan antara ketiga tes tersebut sekurang•


kurangnya dapat ditinjau dari sembilan aspek perbedaan, yaitu:
1) Ditinjau dari fungsinya
a) Tes Diagnostik
( 1) Menentukan apakah bahan prasyarat telah
dikuasai atau belum
(2) Menentukan tingkat penguasaan siswa terhadap
materi yang dipelajari.
(3) Memisah-misahkan, (mengelompokkan) siswa
berdasar kemampuan dalam menerima pelajaran
yang akan dipelajari.
(4) Menentukan kesulitan dan kegagalan belajar siswa
dan menentukan terapinya.
b) Tes Formatif
Sebagai umpan balik bagi siswa, guru maupun program
untuk menilai pelaksanaan satu unit program.
c) Tes sumatif
Untuk memberikan tanda kepada siswa bahwa telah
mengikuti suatu program pengajaran dalam kurun waktu
tertentu, dan menentukan posisi kemampuan siswa
dibandingkan dengan kawannya dalam satu kelompok.
2) Ditinjau dari
waktu
a) Tes Diagnostik
(1) Dilaksanakan pada waktu penyaringan raw
input
(2) Pada waktu membagi kelas atau permulaan
memberikan pelajaran
(3) Selama pelajaran berlangsung apabila guru akan
memberikan bantuan kepadanya
b) Tes Formatif
Selama pelajaran berlangsung untuk mengetahui
kekurangan agar pelajaran dapat berlangsung sefektif dan
seefisien mungkin.

Bahanuenganh~ ciota
EVAL..UASI PENOIOIKAN 1: 17 ~r

Bahanuenganh~ ciota
c) Tes sumatif
Pada akhir catur wulan, semester, akhir tahun, atau
akhir tahun pendidikan.

3) Ditinjau dari titik berat penilaian


a) Tes Diagnostik
( 1) Tingkah laku konitif, afektif dan psikomotor
(2) Faktor-faktor fisik, psikologis dan lingkungan
b) Tes Formatif; lebih menekankan tingkah laku kognitif
c) Tes sumatif; pada umunya menenkankan tingkah laku
kognitif (dengan ukuran yang lebih tinggi, artinya bukan
sekedar hafalan atau ingatan saja), tetapi kadang pada
tingkah laku psikomotor, dan kadang tingkah laku afektif.
4) Ditinjaudari alat evaluasi
a) Tes Diagnostik
(1) Tes prestasi yang telah distandardisasikan
(2) Tes diagnostik yang sudah distandardisasikan
(3) Tes buatan guru
(4) Pengamatan dan daftar cocok (chek list)
b) Tes Fromatif
Tes prestasi yang telah disusun secara baik
c) Tes sumatif
Tes ujian akhir.
5) Ditinjau dari cara memilih tujuan yang dievaluasi
a) Tes Diagnostik
( 1) Memilih setiap ketrampilan prasyarat
(2) Memilih tujuan setiap program pelajaran secara
berimbang
(3) Memilih yang berhubungan dengan tingkah laku fisik,
mental dan perasaan
b) Tes Formatif: mengukur tujuan instruksional khusus
c) Tes sumatif: Mengukur semua tujuan instruksional umum
6) Ditinjau dari tingkat kesulitan tes
a) Tes Diagnostik
Untuk tes diagnostik mengukur ketrampilan dasar,
diambil banyak soal tes yang mudah, yang tingkat
kesulitannya (indeks kesukaran): 0,65 atau lebih.

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
b) Tes Formatif:
Belum dapat ditentukan
c) Tes sumatif
Rata-rata mempunyai tingkat kesulitan (indeks kesukaran
antara 0,35 sampai 0,70. Ditambah beberpa soal yang
sangat mudah danbeberapa soal yang sangat sukar.
7) Ditinjau dari cara menskor ( Skoring)
a) Tes Diagnostik
Menggunakan standar mutlak dan standar relatif (
criterion referenced and norm-referenced).
b) Tes Fromatif
Menggunakan standar mutlak
c) Tes sumatif
Kebanyakan menggunakan standar relatif
8) Ditinjau dari tingkat pencapaian
Yang dimaksud dengan tingkat pencapaian adalah
skor yang harus dicapai oleh siswa dalam setiap tes. Tingkat
pencapaian ini tidak selalu sama. Tinggi rendahnya tuntutan
terhadap tingkat pencapaian tergantung dari fungsi dan
tujuan masing-masing tes.
a) Tes Diagnostik
Tuntutan terhadap tingkat pencapaian tidak harus
sama. Untuk tes diagnostik yang sifatnya memonitor
kemajuan, tingkat pencapaian yang diperoleh siswa
merupakan informasi yang tentang keberhasilannya.
Tindakan guru selanjutnya adalah menyesuaikan dengan
hasil tes tersebut. Tes prasyarat adalah tes diagnostik yang
sifatnya khsus. Fungsinya adalah untuk mengetahui penguasaan
bahan prasyarat yang sangat penting untuk kelanjutan studi
bagi pengetahuan berikutnya. Untuk itu tingkat penguasa-
annya dituntut 100°/o.
b) Tes Formatif
Tingkat penguasaan yang dituntut diam tes formatif
adalah 75% dari TIK!fKP.
c) Tes sumatif
Secara terpisah tidak ditentukan tingkat
pencapaiannya, namun secara keseluruhan akandikenakan
suatu norma tertentu yaitu norma kenaikan kelas atau
norma
kelulusan.

EVAL..UASI PENOIOIKAN 1: 19 ~r
Bahanuenganh~ ciota
9) Ditinjau dari cara pencatatan hasil
a) Tes Diagnostik;
Dicatat dan dilaporkan dalam bentuk profil
b) Tes Formatif
Prestasi belajar siswa dilaporkan dalam bentuk catatan
berhasil atau gagal menguasai sesuatu tugas.
c) Tes Sumatif
Keseluruhan skor atau sebagian skor dari tujuan-tujuan
yang dicapai.
C. Klasifikasi Tes
Tes (dalam hal ini tes psikologis) itu sangat banyak
macam ragamnya dan sangat luas skornya, sehingga untuk
mendapatkan orientasi yang baik mengenai tes tersebut
diperlukan klasifikasi seperti berikut ini:
1. Atas Dasar Banyaknya Testee, tes dapat dibedakan
menjadi:
a. Tes individuil, yaitu tester hanya menghadapi satu
testee.
b. Tes kelompok, yaitu tester menghadapi sekelompok
testee.
2. Atas Dasar Cara menyelesaikan, tes
dibedakan menjadi:
a. Tes verbal, testee dalam menyelesaikan atau
mengerjakan tes dengan menggunakan
kata-kata, misalnya: memberi informasi,
memberikan hasil perhitungan.
b. Tes non-verbal (performance tes~, testee merespon
dengan tindakan.
3. Atas Dasar Cara Menilai, Tes Dibedakan Menjadi:
a. Tes alternatif: hanya disediakan dua atau lebih alternatif.
b. Tes graduil: penilaian bersifat tingakatan: 5, 4, 3, 2, 1.
4. Atas Dasar Fungsi Psikis yang Dijadikan Sasaran
Tes, dibeda kan menjadi:
a. Tes perhatian c. Tes ingatan e. Tes kemauan
b. Tes fantasi d. Tes bakat dan minat

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
5. Atas Dasar Tipe Tes yang Berhubungan dengan lsi
Tes dan Waktu yang Disediakan, tes dibedakan
menjadi:
a. Speed test, mengukur kecepatan dan ketepatan kerja
b. Power Test, mengukur kemampuan dalam mengerjakan
sesuatu.
6. Atas Dasar BentukTes, dibedakan menjadi:
a. Tes benar - salah (true - false test)
b. Tes pilihan ganda (multiple choice test)
c. Tes mencari pasangan (matching test)
d. Tes menyempurnakan (completion test)
e. Tes mengatur obyek (object arrangement test)
f. Tes deret angka (digit span test)
g. Tes rancangan balok (block design test)
h. Tes asosiasi (asociation test)

7. Atas Dasar Penciptanya, tes dibedakan menjadi:


a. Tes Rorschach
b. Tes Binet-Simon
c. Tes Szondi
d. Tes Kraepelin
e. Tes Wechsler
8. Penggolongan Tes Secara Umum, dibedakan menjadi:
a. Tes inteligensi umum (general intelligence test)
b. Tes bakat khusus (special ability test, aptitude test)
c. Tes kepribadian (personality tes~
d. Tes prestasi (scholastic test, achievement tes~

EV A I.. U A 5 I PEN O I O I KAN 1: 21 ~r


Bahanuenganh~ ciota
Bab III
Persyaratan,
Ciri-Ciri dan Kualitas Suatu Tes

A. Ciri-Ciri Tes Yang Baik


Sebuah tes dapat dikatakan baik sebagai alat ukur
apabila memenuhi beberapa persyaratan sebagai berikut:
validitas, reliabilitas, obyektivitas, praktibilitas ekonomis,
standard, diskriminatif, dan comperhensif (Sumadi Suryobroto,
1994: 23).
1. Validitas
Kata validitas sering disamakan artinya dengan ketepatan
atau kesahihan. Soal valid atau tidaknya suatu tes adalah soal
yang terpenting di antara persyaratan lain yang telah
disebutkan di muka itu. Sebuah tes dikatakan valid apabila
tes tersebut mengukur apa yang hendak diukur secara
tepat. Misalnya untuk mengukur besarnya partisipasi siswa
dalam proses pembelajaran, buka diukur melalui nilai yang
diperoleh siswa pada waktu ulangan, tetapi dilihat melalui:
presensi, fokus tidaknya perhatian siswa pada pelajaran, dan
ketepatan siswa dalam menjawab yang diajukan guru.
Nilai yang diperoleh siswa ketika ulangan, bukan
menggambarkan partisipasi siswa, tetapi menggambarkan
prestasi belajar.
Validitas suatu tes dapat ditinjau dari beberapa segi,
seperti akan diuraikan di bawah ini, yaitu: validitas ramalan,
validitas bandingan atau kesejajaran, validitas isi, validitas
susunan, dan validitas logis. Uraian secara rinci mengenai
validitas ini akan debahas pada bab lain.
2. Reliabilitas
Dalam bahasa Indonesia kata reliabilitas diartikan "dapat
dipercaya" atau "keajegan" atau "ketetapan". Sebuah tes

EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
dikatakan reliabel atau dapat dipercaya apabila memberikan
hasil yang tetap atau ajeg jika diteskan berkali-kali. Dengan
perkataan lain, apabila kepada testee diberikan tes yang sama
pada waktu yang berlainan, maka setiap testee akan
memperoleh peringkat yang sama dalam kelompoknya.
3.
Obyektivitas
Kata obyektif berarti tidak terpengaruh oleh unsur pribadi
atau unsur subyektif dari penilai atau dari unsur bentuk tes. Tes
yang berbentuk uraian, akan memberi banyak kemungkinan
kepada fihak penilai dalam memberikan penilaian menurut
caranya sendiri. Oleh karena itu pada saat kini terdapat
kecenderungan penggunaan tes obyektif dalam berbagai
bidang, dengan disediakan pedoman sistem skoring yang jelas
dan rinci.
4.
Praktibiltias
Sebuah tes memiliki praktibilitas yang tinggi apabila tes
tersebut bersifat praktis, mudah dilaksanakan, mudah
pemeriksaannnya, dan mudah pengadministrasiannya, serta
dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat
diberikan atau diawali oleh orang lain.
5.
Ekonomis
Tes harus ekonomis, artinya bahwa pelaksanaan tes
tersebut tidak membutuhkan beaya yang mahal, tenaga yang
banyak dan waktu yang lama.
6. Standar
Secara teori sebenarnya semua hal dalam tes ini perlu
distandardisasikan, namun secara praktis biasanya dipilih hal•
hal tertentu yang dianggap penting, seperti: materi tes,
penyelenggaraan tes, skoring, dan intepretasi hasil testingnya.
Standardisasi seseuatu tes bertujuan supaya setiap testee
yang dites dengan tes tersebut memperoleh perlakuan yang
benar-benar sama.
7. Tes harus
diskriminatif
Dengan tes dimaksud untuk dapat mengungkap gejala
tertentu dan menunjukkan perbedaan-perbedaan (diskriminasi)
gejala tersebut antar individu. Jadi tes yang diskriminatif akan

Bahanuenganh~ ciota
E V A I... U A 5 I P E N O I O I K A N 1: 23 ~r

Bahanuenganh~ ciota
mampu menunjukkan perbendaan-perbedaan yang kecil
mengenai sifa atau faktor tertentu pada individu-individu yang
berbeda-beda. lndeks yang menunjukkan sifat diskriminatif ini
disebut dengan "daya beda" (discriminating power)
8.
Komperhensif
Tes harus komperhensif artinya dapat sekaligus
mengungkap atau menyelidiki banyak aspek. Terutama dalam
tes prestasi belajar hal ini penting sekali untuk mendapat
perhatian bagi guru sebagai penyusun tes. Tujuannya adalah
supaya dengan tes itu mampu mengungkap pengetahuan
testee mengenai segala hal yang harus dipelajari, jadi hal ini
untuk mencegah dorongan untuk berspekulasi.
B. Menilai Kualitas
Tes
Baik atau buruknya suatu tes atau alat evaluasi dapat
juga ditinjau dari beberapa segi, seperti: segi validitas,
reliabilitas, tingkat kesukaran soal dan daya beda.
1. Validitas Suatu
Tes
Di muka telah dinyatakan bahwa validitas suatu alat
pengukur yang valid apabila alat pengukur tersebut mengukur
apa yang seharusnya hendak diukur secara tepat.
Ditinjau dari jenisnya terdapat empat macam validitas,
yaitu validitas logis dan validitas empiris. Validitas logis
dibedakan menjadi validitas isi dan validitas konstruksi.
Validitas empiris dibedakan menjadi validitas prediktif dan
validitas ada sekarang. Berikut ini akan diuraikan secara
singkat mengenai masam-macam validitas tersebut, dan akan
dicoba pula mengenai bagaimana cara mengetahui validitas
alat ukur.
a. Validitas Ramalan (Predictvi e
Validity)
Validitas ramalan artinya ketepatan atau kejituan dari
suatu alat ukur ditinjau dari kemampuan tes tersebut untuk
meramalkan prestasi siswa yang dicapainya kemudian.
Misalnya suatu tes hasil belajar dapat dikatakan mempunyai
validitas ramalan yang tinggi, apabila hasil tes yang dicapai
oleh testee dalam tes tersebut betul-betul dapat meramalkan
sukses tidaknya testee (siswa) dalam pelajaran yang akan
datang. Cara mengetahui tingkat atau rendahnya validitas

Bahandenganh~ ciota
EVALUASI Pe:NDIDIKAN

Bahandenganh~ ciota
ramalan ini adalah dengan mengkorelasikan antara skor atau
nilai-nilai yang dicapai siswa dalam tes tersebut dengan skor
atau nilai-nilai yang dicapai siswa itu kemudian. Validitas
ramalan dinyatakan tinggi, apabila koefisien korelasinya cukup
tinggi, dan validitas ramalan disebut rendah jika koefisisen
korelasinya rendah.

b. Validitas Ada Sekarang atau Validitas


Bandingan
( Concurent validity)
Validitas bandingan artinya kejituan dari suatu tes dilihat
korelasinya terhadap kecakapan yang telah dimiliki saat kini
secara riil. Perbedaan antara validitas ramalan dengan validitas
bandingan ialah dilihat dari segi waktunya. Vali-ditas ramalan
melihat hubungannya dengan masa yang akan datang,
sedangkan vali-ditas bandingan melihat hubungannya dengan
masa sekarang. Pendapat ini dipertegas oleh Wrighstone yang
menyatakan bahwa:
"The difference between concurent validity and predictive
validity is solely a matter of time. Predictive validity requires
correspondence with a future criterion where as concuent
validity requires correspondence with the criterion at the
time of testing". (Wrighstone, 1961, hat.
44).
Tinggi rendahnya validitas bandingan ini dengan jalan
mengkorelasikan hasil-hasil yang dicapai dalam tes tersebut
dengan hasil-hasil yang dicapai dalam tes sejenis yang telah
diketahui mempunyai validitas yang tinggi (misalnya tes
standar). Tinggi rendahnya koefisien korelasi yang diperoleh,
menunjukkan tinggi rendahnya validitas tes yang akan dinilai
kualitasnya.
c. Validitas lsi (Content
Validity)
Validitas isi artinya kejituan dari suatu tes ditinjau dari isi
tes tersebut. Suatu tes hasil belajar dapat dikatakan valid,
apabila materi tes itu betul-betul merupakan bahan-bahan
representatif terhadap bahan-bahan pelajaran yang diberikan.
Jadi dalam validitas isi ini diartikan seberapa jauh tes
mengungkap pengetahuan testee mengenai sesuatu mata
pelajaran tertentu. Dengan perkatan lain bahwa tes prestasi ini

Bahanuenganh~ ciota
EVAL..UASI PENOIOIKAN

Bahanuenganh~ ciota
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.


You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.


You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.


You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
Indek
s
Analytic Rating, 100, 106
Anekdotal, 105, 106
Asesmen, 128
Bloom,11
Checklist, 99, 100, 107, 109, 129
Daya Beda, 22, 23, 36, 37
Derajat Kesukaran, 35, 36
Diagnostik, 14, 17, 1§... 96, 97
Essay,48,49,50
Formatif, 14, 15, .N, 67, 88, 89, 96, 97
Holistik, 97, 100, 106, 108, 109
Koefisien, 23, 2.4. 25, 26, 27, 28, 29, 30, 31, 35, 72
Norma Absolut, 72
Norma Relatif, 75
Pengecoh,52
Pengukuran, V, Vi, 55, 57, 58, 119, 146
Reliabilitas, 21, 23, 28, 29, 30, 31, 32, 33, 35, 42, 93
Skala Deferensiasi Semantik, 120
Skala Likert, 56, 123
Skala Sikap, 119, 121, 123
Spearman Brown, 29
Split-Half, 31
Sumatif, 14, 15, 16, 17, 18, 19, 93, 96, 97
Testee, s, 19, 50, 75
Validitas, 21, za 24, 25, 26, 28, 29, 30, 42, 48, 61, 65, 93

EVALUASI PENOIOIKAN i:151:r


Bahanuenganh~ ciota
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.
You have either reached a page that is unavailable for viewing or reached your viewing Ii mit for
this book.

Anda mungkin juga menyukai