Anda di halaman 1dari 100

KATA PENGANTAR

Puji syukur kami panjatkan ke hadapan Allah SWT / Tuhan YME,


yang telah melimpahkan kekuatan lahir dan batin kepada diri kami, sehingga
setelah memalui proses yang cukup panjang, pada akhirnya buku ini dapat
dicetak. Penyusunan buku ini bertujuan untuk output dari hasil penelitian
yang didanai oleh DIPA-BOPN Unimed dan penulis juga mengucapkan
terimakasi kepada kelengkapan tugas mata kuliah Evaluasi Pendidikan.
Harapan penyusun semoga buku ini dapat memberikan bimbingan sesuai
dengan tugas yang diemban oleh dosen, yakni mengajar, mendidik, dan di
dalamnya termasuk penilaian.
Pada setiap akhir bab, penyusun memberikan beberapa buah
pertanyaan untuk evaluasi. Tujuan penyusun adalah untuk mengarahkan
konsentrasi mahasiswa/i pada beberapa pokok yang penting pada bab itu,
sekaligus menghubungkan dengan praktek.
Disadari bahwa buku ini jauh dari sempurna, maka dari itu kritik dan
saran untuk perbaikan sangat diharapkan. Semoga buku ini memberikan
manfaat bagi pembaca dalam memahami konsep evaluasi, khususnya
evaluasi dalam bidang pendidikan.

Penyusun

1
DAFTAR ISI

Kata Pengantar
BAB I PENDAHULUAN 4
1. Model-Model Evaluasi 5
2. Pendekatan Evaluasi 17
3. Karakter Evaluasi 20
BAB II KONSEP DASAR EVALUASI 26
1. Pengertian Pengukuran, Penilaian, dan Evaluasi 28
2. Subjek dan Objek Evaluasi 44
3. Alat Evaluasi 50
4. Pendekatan Dalam Penilaian Hasil Belajar 56
BAB III JENIS DAN ALAT PENILAIAN 63
1. Teknik Penilaian 64
2. Langkah-Langkah Penyusunan Tes 71
BAB IV MENGOLAH HASIL TES 87
1. Teknik Penskoran 91
2. Pedoman penyekoran Analitik 109
3. Pedoman Penskoran Holoistik 110
BAB V MENENTUKAN KEDUDUKAN SISWA DALAM 118
KELOMPOK TES
1. Rangking Sederhana 119
2. Rengking Presentase 121
3. Standard Deviasi 123
4. Z Skore 130
BAB VI PERSYARATAN DAN KARAKTERISTIK TES YANG 137
BAIK
1. Validitas tes 138
2. Reliabilitas tes 145
3. Objektivitas tes 150
4. Praktibilitas tes 151
5. Tes yang ekonomis 151
BAB VII ANALISIS BUTIR TES 156
1. Indeks kesukaran tes 157
2. Daya beda tes 162
3. Jawaban pengecoh 172
2
BAB VIII MENYUSUN TES TERTULIS 178
1. Tes benar salah 182
2. Tes pilihan ganda 185
3. Tes jawaban singkat 194
BAB IX MENYUSUN NON TES 197
1. Wawancara 198
2. Angket 204
3. Dokumen 206
BAB X PORTOFOLIO 207

3
BAB I
PENDAHULUAN

KOMPETENSI DASAR:
Setelah mengikuti kegiatan perkuliahan dari
matakuliah ini, diharapkan mahasiswa memiliki
kompetensi dasar yaitu akan mampu: Memahami
Model-Model Evaluasi

INDIKATOR KOMPETENSI:

1. Mampu menjelaskan konsep evaluasi program,


2. Mampu menjelaskan model-model evaluasi
3. Mampu menjelaskan evaluasi konteks, evaluasi
input, evaluasi proses, dan evaluasi produk.

4
Pengantar
Dalam proses evaluasi pembelajaran atau penilaian proses dan
hasil belajar, Anda tentu sering menggunakan alat ukur tertentu, baik tes
maupun non- tes. Alat ukur ini mempunyai fungsi dan peran yang sangat
penting dalam rangka mengetahui keefektifan proses pembelajaran di
madrasah. Mengingat begitu pentingnya suatu alat ukur dalam kegiatan
evaluasi pembelajaran, maka suatu alat ukur harus memiliki syarat-syarat
tertentu sekaligus merupakan karakteristik alat ukur yang baik. Dalam praktik
di madrasah, seringkali guru membuat alat ukur tanpa mengikuti aturan-
aturan tertentu. Ada guru yang membuat alat ukur (seperti soal-soal ulangan
atau ujian akhir semester) yang langsung mengambil dari buku sumber.
Padahal kita tahu banyak buku sumber yang tidak sesuai dengan silabus
yang telah ditetapkan. Apa jadinya bila soal yang digunakan tidak sesuai
dengan materi yang disampaikan. Ada juga guru yang menggunakan soal-
soal lama yang belum diketahui kualitasnya. Hal ini semua sebagai akibat
dari kekurangpahaman guru terhadap suatu alat ukur yang baik. Di samping
itu, untuk melengkapi pengetahuan Anda tentang evaluasi, maka akan
dikemukakan juga beberapa model dan pendekatan evaluasi.

1. Model-Model Evaluasi

Pada tahun 1949, Tyler pernah mengemukakan model evaluasi


black box. Model ini banyak digunakan oleh orang-orang yang melakukan
kegiatan evaluasi. Studi tentang evaluasi belum begitu menarik perhatian
orang banyak, karena kurang memiliki nilai praktis. Baru sekitar tahun 1960-
an studi evaluasi mulai berdiri sendiri menjadi salah satu program studi di
perguruan tinggi, tidak hanya di jenjang sarjana (S.1) dan magister (S.2) tetapi
juga pada jenjang doktor (S.3). Sekitar tahun 1972, model evaluasi mulai
5
berkembang. Taylor dan Cowley, misalnya, berhasil mengumpulkan berbagai
pemikiran tentang model evaluasi dan menerbitkannya dalam suatu buku.
Model evaluasi yang dikembangkan lebih banyak menggunakan
pendekatan positivisme yang berakar pada teori psikometrik. Dalam
model tersebut, pengukuran dan tes masih sangat dominan, sekalipun tidak
lagi diidentikkan dengan evaluasi. Penggunaan disain eksperimen seperti
yang dikemukakan Campbell dan Stanley (1963) menjadi ciri utama dari
model evaluasi. Berkembangnya model evaluasi pada tahun 70-an
tersebut diawali dengan adanya pandangan alternatif dari para expert.
Pandangan alternatif yang dilandasi sebuah paradigma fenomenologi banyak
menampilkan model evaluasi.

Dari sekian banyak model-model evaluasi yang dikemukakan, tes dan


pengukuran tidak lagi menempati posisi yang menentukan. Penggunaannya
hanya untuk tujuan-tujuan tertentu saja, bukan lagi menjadi suatu keharusan,
seperti ketika model pertama ditampilkan. Tes dan pengukuran tidak lagi
menjadi parameter kualitas suatu studi evaluasi yang dilakukan.
Perkembangan lain yang menarik dalam model evaluasi ini adalah adanya
suatu upaya untuk bersikap eklektik dalam penggunaan pendekatan
positivisme maupun fenomenologi yang oleh Patton (1980) disebut paradigm
of choice. Walaupun usaha ini tidak melahirkan model dalam pengertian
terbatas tetapi memberikan alternatif baru dalam melakukan evaluasi.

Dalam studi tentang evaluasi, banyak sekali dijumpai model-model


evaluasi dengan format atau sistematika yang berbeda, sekalipun dalam
beberapa model ada juga yang sama. Misalnya saja, Said Hamid Hasan
(2009) mengelompokkan model evaluasi sebagai berikut :

6
1. Model evaluasi kuantitatif, yang meliputi : model Tyler, model teoritik
Taylor dan Maguire, model pendekatan sistem Alkin, model
Countenance Stake, model CIPP, model ekonomi mikro.
2. Model evaluasi kualitatif, yang meliputi : model studi kasus, model
iluminatif, dan model responsif.

Sementara itu, Kaufman dan Thomas dalam Suharsimi Arikunto


dan Cepi Safruddin AJ (2007 : 24) membedakan model evaluasi menjadi
delapan, yaitu:

1. Goal Oriented Evaluation Model, dikembangkan oleh Tyler.


2. Goal Free Evaluation Model, dikembangkan oleh Scriven.
3. Formatif Sumatif Evaluation Model, dikembangkan oleh Michael
Scriven.
4. Countenance Evaluation Model, dikembangkan oleh Stake.
5. Responsive Evaluation Model, dikembangkan oleh Stake.
6. CSE-UCLA Evaluation Model, menekankan pada “kapan” evaluasi
dilakukan.
7. CIPP Evaluation Model, yang dikembangkan oleh Stufflebeam.
8. Discrepancy Model, yang dikembangkan oleh Provus.

Ada juga model evaluasi yang dikelompokkan Nana Sudjana dan


R.Ibrahim (2007 : 234) yang membagi model evaluasi menjadi empat model
utama, yaitu “measurement, congruence, educational system, dan
illumination”. Dari beberapa model evaluasi di atas, beberapa diantaranya
akan dikemukakan secara singkat sebagai berikut :
1. Model Tyler
Nama model ini diambil dari nama pengembangnya yaitu Tyler. Dalam
7
buku Basic Principles of Curriculum and Instruction, Tyler banyak
mengemukakan ide dan gagasannya tentang evaluasi. Salah satu bab
dari buku tersebut diberinya judul how can the the effectiveness of
learning experience be evaluated? Model ini dibangun atas dua dasar
pemikiran. Pertama, evaluasi ditujukan kepada tingkah laku peserta
didik. Kedua, evaluasi harus dilakukan pada tingkah laku awal peserta
didik sebelum melaksanakan kegiatan pembelajaran dan sesudah
melaksanakan kegiatan pembelajaran (hasil). Dasar pemikiran yang
kedua ini menunjukkan bahwa seorang evaluator harus dapat
menentukan perubahan tingkah laku apa yang terjadi setelah peserta
didik mengikuti pengalaman belajar tertentu, dan menegaskan bahwa
perubahan yang terjadi merupakan perubahan yang disebabkan oleh
pembelajaran.
Penggunaan model Tyler memerlukan informasi perubahan tingkah laku
terutama pada saat sebelum dan sesudah terjadinya pembelajaran.
Istilah yang populer dikalangan guru adalah tes awal (pre-test) dan tes
akhir (post- test). Model ini mensyaratkan validitas informasi pada
tes akhir. Untuk menjamin validitas ini maka perlu adanya kontrol
dengan menggunakan disain eksperimen. Model Tyler disebut juga
model black box karena model ini sangat menekankan adanya tes
awal dan tes akhir. Dengan demikian, apa yang terjadi dalam proses
tidak perlu diperhatikan. Dimensi proses ini dianggap sebagai kotak
hitam yang menyimpan segala macam teka-teki.
Menurut Tyler, ada tiga langkah pokok yang harus dilakukan, yaitu :
a. Menentukan tujuan pembelajaran yang akan dievaluasi.
b. Menentukan situasi dimana peserta didik memperoleh kesempatan
untuk menunjukkan tingkah laku yang berhubungan dengan tujuan.

8
c. Menentukan alat evaluasi yang akan dipergunakan untuk
mengukur tingkah laku peserta didik.
2. Model yang Berorientasi pada Tujuan
Sebelum KBK 2004, Anda mungkin pernah mengenal adanya tujuan
pembelajaran umum dan tujuan pembelajaran khusus. Model evaluasi
ini menggunakan kedua tujuan tersebut sebagai kriteria untuk
menentukan keberhasilan. Evaluasi diartikan sebagai proses
pengukuran hinggamana tujuan pembelajaran telah tercapai. Model ini
banyak digunakan oleh guru- guru karena dianggap lebih praktis untuk
menentukan hasil yang diinginkan dengan rumusan yang dapat diukur.
Dengan demikian, terdapat hubungan yang logis antara kegiatan, hasil
dan prosedur pengukuran hasil. Tujuan model ini adalah membantu
Anda merumuskan tujuan dan menjelaskan hubungan antara tujuan
dengan kegiatan. Jika rumusan tujuan pembelajaran dapat diobservasi
(observable) dan dapat diukur (measurable), maka kegiatan evaluasi
pembelajaran akan menjadi lebih praktis dan simpel.
Model ini dapat membantu Anda menjelaskan rencana pelaksanaan
pembelajaran dengan proses pencapaian tujuan. Instrumen yang
digunakan bergantung kepada tujuan yang ingin diukur. Hasil
evaluasi akan menggambarkan tingkat keberhasilan tujuan program
pembelajaran berdasarkan kriteria program khusus. Kelebihan model ini
terletak pada hubungan antara tujuan dengan kegiatan dan
menekankan pada peserta didik sebagai aspek penting dalam program
pembelajaran. Kekurangannya adalah memungkinkan terjadinya proses
evaluasi melebihi konsekuensi yang tidak diharapkan.
3. Model Pengukuran
Model pengukuran (measurement model) banyak mengemukakan

9
pemikiran- pemikiran dari R.Thorndike dan R.L.Ebel. Sesuai dengan
namanya, model ini sangat menitikberatkan pada kegiatan pengukuran.
Pengukuran digunakan untuk menentukan kuantitas suatu sifat (atribute)
tertentu yang dimiliki oleh objek, orang maupun peristiwa, dalam bentuk
unit ukuran tertentu. Anda dapat menggunakan model ini untuk
mengungkap perbedaan-perbedaan individual maupun kelompok dalam
hal kemampuan, minat dan sikap. Hasil evaluasi digunakan untuk
keperluan seleksi peserta didik, bimbingan, dan perencanaan
pendidikan. Objek evaluasi dalam model ini adalah tingkah laku peserta
didik, mencakup hasil belajar (kognitif), pembawaan, sikap, minat,
bakat, dan juga aspek-aspek kepribadian peserta didik. Untuk itu,
instrumen yang digunakan pada umumnya adalah tes tertulis (paper and
pencil test) dalam bentuk tes objektif, yang cenderung dibakukan.
Oleh sebab itu, dalam menganalisis soal sangat memperhatikan
difficulty index dan index of discrimination. Model ini menggunakan
pendekatan Penilaian Acuan Norma (norm-referenced assessment).
4. Model Kesesuain (Ralph W.Tyler, John B.Carrol, and Lee J.Cronbach)
Menurut model ini, evaluasi adalah suatu kegiatan untuk melihat
kesesuaian (congruence) antara tujuan dengan hasil belajar yang telah
dicapai. Hasil evaluasi dapat Anda gunakan untuk menyempurnakan
sistem bimbingan peserta didik dan untuk memberikan informasi
kepada pihak-pihak yang memerlukan. Objek evaluasi adalah tingkah
laku peserta didik, yaitu perubahan tingkah laku yang diinginkan
(intended behaviour) pada akhir kegiatan pendidikan, baik yang
menyangkut aspek kognitif, afektif maupun psikomotor. Teknik evaluasi
yang dapat Anda gunakan tidak hanya tes (tulisan, lisan, dan
perbuatan), tetapi juga non-tes (observasi, wawancara, skala sikap, dan

10
sebagainya). Model evaluasi ini memerlukan informasi perubahan
tingkah laku pada dua tahap, yaitu sebelum dan sesudah kegiatan
pembelajaran. Berdasarkan konsep ini, Anda perlu melakukan pre and
post- test. Adapun langkah-langkah yang harus ditempuh dalam model
evaluasi ini adalah merumuskan tujuan tingkah laku (behavioural
objectives), menentukan situasi dimana peserta didik dapat
memperlihatkan tingkah laku yang akan dievaluasi, menyusun alat
evaluasi, dan menggunakan hasil evaluasi. Oleh sebab itu, model ini
menekankan pada pendekatan penilaian acuan patokan (PAP).
5. Educational System Evaluation Model (Daniel L.Stufflebeam, Michael
Scriven, Robert E.Stake, dan Malcolm M.Provus)
Menurut model ini, evaluasi berarti membandingkan performance dari
berbagai dimensi (tidak hanya dimensi hasil saja) dengan sejumlah
kriteria, baik yang bersifat mutlak/interen maupun relatif/eksteren. Model
yang menekankan sistem sebagai suatu keseluruhan ini sebenarnya
merupakan penggabungan dari beberapa model, sehingga objek
evaluasinyapun diambil dari beberapa model, yaitu (1) model
countenance dari Stake, yang meliputi : keadaan sebelum kegiatan
pembelajaran berlangsung (antecedents), kegiatan yang terjadi dan
saling mempengaruhi (transactions), hasil yang diperoleh (outcomes),
(2) model CIPP dari Stufflebeam, yang meliputi Context, Input, Process,
dan Product, (3) model Scriven yang meliputi instrumental evaluation and
consequential evaluation, (4) model Provus yang meliputi : design,
operation program, interim products, dan terminal products. Dari
keempat model yang tergabung dalam educational system model, akan
dijelaskan secara singkat tentang dua model, yaitu model countenance
dan model CIPP.

11
Model Stake menitikberatkan evaluasi pada dua hal pokok, yaitu
description dan judgement. Setiap hal tersebut terdiri atas tiga dimensi,
seperti telah dijelaskan di atas, yaitu antecedents (context), transaction
(process), dan outcomes (output). Description terdiri atas dua aspek,
yaitu intents (goals) dan observation (effects) atau yang sebenarnya
terjadi. Sedangkan judgement terdiri atas dua aspek, yaitu standard dan
judgement. Dalam model ini, evaluasi dilakukan dengan
membandingkan antara satu program dengan program lain yang
dianggap standar. Stake mengatakan description berbeda dengan
judgement atau menilai. Dalam ketiga dimensi di atas (antecedents,
transaction, outcomes), perbandingan data tidak hanya untuk
menentukan apakah ada perbedaan tujuan dengan keadaan yang
sebenarnya tetapi juga dibandingkan dengan standar yang absolut
untuk menilai manfaat program. Menurut Stake, suatu hasil penelitian
tidak dapat diandalkan jika tidak dilakukan evaluasi.
Model CIPP berorientasi kepada suatu keputusan (a decision oriented
evaluation approach structured). Tujuannya membantu kepala
madrasah dan guru di dalam membuat keputusan. Evaluasi diartikan
sebagai suatu proses menggambarkan, memperoleh dan menyediakan
informasi yang berguna untuk menilai alternatif keputusan. Sesuai
dengan nama modelnya, model ini membagi empat jenis kegiatan
evaluasi, yaitu :
a. Context evaluation to serve planning decision, yaitu konteks evaluasi
untuk membantu merencanakan keputusan, menentukan
kebutuhan yang akan dicapai oleh program pembelajaran, dan
merumuskan tujuan program pembelajaran.
b. Input evaluation, structuring decision. Kegiatan evaluasi bertujuan

12
untuk membantu mengatur keputusan, menentukan sumber-sumber
yang ada, alternatif apa yang akan diambil, apa rencana dan strategi
untuk mencapai tujuan, dan bagaimana prosedur kerja untuk
mencapainya.
c. Process evaluation, to serve implementing decision. Kegiatan
evaluasi ini bertujuan untuk membantu melaksanakan keputusan.
Pertanyaan yang harus Anda jawab adalah hinggamana suatu
rencana telah dilaksanakan, apakah rencana tersebut sesuai
dengan prosedur kerja, dan apa yang harus diperbaiki.
d. Product evaluation, to serve recycling decision. Kegiatan
evaluasi ini bertujuan untuk membantu keputusan selanjutnya.
Pertanyaan yang harus Anda jawab adalah hasil apa yang telah
dicapai dan apa yang dilakukan setelah program berjalan.
Proses evaluasi tidak hanya berakhir dengan suatu deskripsi
mengenai keadaan sistem yang bersangkutan, tetapi harus sampai pada
judgment sebagai simpulan dari hasil evaluasi. Model ini menuntut agar hasil
evaluasi digunakan sebagai input untuk decision making dalam rangka
penyempurnaan sistem secara keseluruhan. Pendekatan yang digunakan
adalah penilaian acuan norma (PAN) dan penilaian acuan patokan (PAP).
6. Illuminative Model (Malcolm Parlett dan Hamilton)
Jika model measurement dan congruence lebih berorientasi pada
evaluasi kuantitatif-terstruktur, maka model ini lebih menekankan pada
evaluasi kualitatif-terbuka (open-ended). Kegiatan evaluasi dihubungkan
dengan learning milieu, dalam konteks madrasah sebagai lingkungan
material dan psiko-sosial, dimana guru dan peserta didik dapat berinteraksi.
Tujuan evaluasi adalah untuk mempelajari secara cermat dan hati-hati
terhadap pelaksanaan sistem pembelajaran, faktor-faktor yang

13
mempengaruhinya, kelebihan dan kekurangan sistem, dan pengaruh sistem
terhadap pengalaman belajar peserta didik. Hasil evaluasi lebih bersifat
deskriptif dan interpretasi, bukan pengukuran dan prediksi. Model ini lebih
banyak menggunakan judgment. Fungsi evaluasi adalah sebagai input untuk
kepentingan pengambilan keputusan dalam rangka penyesuaian dan
penyempurnaan sistem pembelajaran yang sedang dikembangkan.
Objek evaluasi model ini mencakup latar belakang dan
perkembangan sistem pembelajaran, proses pelaksanaan sistem
pembelajaran, hasil belajar peserta didik, kesukaran-kesukaran yang dialami
dari perencanaan sampai dengan pelaksanaan, termasuk efek samping dari
sistem pembelajaran itu sendiri. Pendekatan yang digunakan lebih
menyerupai pendekatan yang diterapkan dalam bidang antropologi sosial,
psikiatri, dan sosiologi. Cara-cara yang digunakan tidak bersifat standard,
melainkan bersifat fleksibel dan selektif. Berdasarkan tujuan dan
pendekatan evaluasi dalam model ini, maka ada tiga fase evaluasi yang
harus Anda tempuh, yaitu : observe, inquiry further, dan seek to explain.
7. Model Responsif
Sebagaimana model illuminatif, model ini juga menekankan pada
pendekatan kualitatif-naturalistik. Evaluasi tidak diartikan sebagai
pengukuran melainkan pemberian makna atau melukiskan sebuah realitas
dari berbagai perspektif orang-orang yang terlibat, berminat dan
berkepentingan dengan program pembelajaran. Tujuan evaluasi adalah
untuk memahami semua komponen program pembelajaran melalui
berbagai sudut pandangan yang berbeda. Sesuai dengan pendekatan yang
digunakan, maka model ini kurang percaya terhadap hal-hal yang bersifat
kuantitatif. Instrumen yang digunakan pada umumnya mengandalkan
observasi langsung maupun tak langsung dengan interpretasi data yang

14
impresionistik. Langkah-langkah kegiatan evaluasi meliputi observasi,
merekam hasil wawancara, mengumpulkan data, mengecek pengetahuan
awal (preliminary understanding) peserta didik dan mengembangkan disain
atau model. Berdasarkan langkah-langkah ini, evaluator mencoba responsif
terhadap orang-orang yang berkepentingan pada hasil evaluasi. Hal yang
penting dalam model responsif adalah pengumpulan dan sintesis data.
Kelebihan model ini adalah peka terhadap berbagai pandangan dan
kemampuannya mengakomodasi pendapat yang ambigius serta tidak
fokus. Sedangkan kekurangannya antara lain (1) pembuat keputusan
sulit menentukan prioritas atau penyederhanaan informasi (2) tidak
mungkin menampung semua sudut pandangan dari berbagai kelompok (3)
membutuhkan waktu dan tenaga. Evaluator harus dapat beradaptasi
dengan lingkungan yang diamati.
Setelah Anda mempelajari berbagai model evaluasi, model mana
yang akan digunakan dalam pembelajaran? Jawabannya tentu sangat
bergantung kepada tujuan evaluasi yang ditetapkan. Namun demikian,
perlu juga Anda pahami bahwa keberhasilan suatu evaluasi pembelajaran
secara keseluruhan bukan hanya dipengaruhi penggunaan yang tepat pada
sebuah model evaluasi melainkan juga dipengaruhi oleh berbagai faktor.
Pertama, tujuan pembelajaran, baik tujuan pembelajaran umum
maupun tujuan pembelajaran khusus (instructional objective). Seringkali
kedua tujuan pembelajaran ini saling bertentangan satu sama lain dilihat
dari kebutuhan madrasah, kurikulum, guru, peserta didik, lingkungan, dan
sebagainya. Bahkan, kadang-kadang guru sendiri mempunyai tujuan
sendiri-sendiri. Semuanya harus dipertimbangkan agar terdapat
keseimbangan dan keserasian.
Kedua, sistem madrasah. Faktor ini perlu dipertimbangkan dengan

15
matang dan hati-hati karena melibatkan berbagai komponen yang saling
berinteraksi dan ketergantungan. Mengingat kompleksnya sistem
madrasah, maka fungsi madrasah juga menjadi ganda. Di satu pihak,
madrasah ingin mewariskan kebudayaan masa lampau dengan sistem
norma, nilai dan adat yang dianggap terbaik untuk generasi muda. Di pihak
lain, madrasah berkewajiban mempersiapkan peserta didik menghadapi
masa depan, memperoleh keterampilan dan kemampuan untuk berinovasi,
bahkan menghasilkan perubahan. Jadi, madrasah sekaligus bersikap
konservatif-radikal serta reaksioner-progresif. Oleh sebab itu, peranan
evaluasi menjadi sangat penting. Tujuannya adalah untuk melihat dan
mempertimbangkan hal-hal apa yang perlu diberikan di madrasah. Begitu
juga bentuk kurikulum dan silabus mata pelajaran sangat bergantung pada
evaluasi yang dilaksanakan oleh guru-guru di madrasah, sehingga timbul
masalah lainnya yaitu teknik evaluasi apa yang akan digunakan untuk
mencapai tujuan itu.
Ketiga, pembinaan guru. Banyak program pembinaan guru yang
belum menyentuh secara langsung tentang evaluasi. Program
pembinaan guru lebih banyak difokuskan kepada pengembangan
kurikulum dan metodologi pembelajaran. Hal ini pula yang menyebabkan
perbaikan sistem evaluasi pembelajaran menjadi kurang efektif. Guru juga
sering dihadapkan dengan beragam kegiatan, seperti membuat persiapan
mengajar, mengikuti kegiatan ekstra kurikuler, penyesuaian diri, dan
kegiatan administratif lainnya. Artinya, bagaimana mungkin kualitas sistem
evaluasi pembelajaran di madrasah dapat ditingkatkan, bila fokus
pembinaan guru hanya menyentuh domain-domain tertentu saja, ditambah
lagi dengan kesibukan-kesibukan guru di luar tugas pokoknya sebagai
pengajar.

16
2. Pendekatan Evaluasi
Pendekatan merupakan sudut pandang seseorang dalam
mempelajari sesuatu. Dengan demikian, pendekatan evaluasi merupakan
sudut pandang seseorang dalam menelaah atau mempelajari evaluasi.
Dilihat dari komponen pembelajaran, pendekatan evaluasi dapat dibagi dua,
yaitu pendekatan tradisional dan pendekatan sistem. Dilihat dari penafsiran
hasil evaluasi, pendekatan evaluasi dibagi menjadi dua, yaitu criterion-
referenced evaluation dan norm-referenced evaluation. Terlihat seperti
gambar di bawah ini

Pendekatan
Tradisonal
Komponen
Pembelajarfan
Pendekatan Sistem
Pendekatan Evaluasi
Pembelajaran
Criterion-Referenced
evaluation
Penafsiaran
Hasil Evaluasi
Norm-Referenced
Evaluation

Gambar: Pendekatan Evaluasi

1. Pendekatan tradisional
Pendekatan ini berorientasi kepada praktik evaluasi yang telah
berjalan selama ini di madrasah yang ditujukan kepada perkembangan
aspek intelektual peserta didik. Aspek-aspek keterampilan dan
pengembangan sikap kurang mendapat perhatian yang serius. Peserta
didik hanya dituntut untuk menguasai mata pelajaran. Kegiatan-kegiatan

17
evaluasi juga lebih difokuskan kepada komponen produk saja, sementara
komponen proses cenderung diabaikan. Hasil kajian Spencer cukup
memberikan gambaran betapa pentingnya evaluasi pembelajaran. Ia
mengemukakan sejumlah isi pendidikan yang dapat dijadikan dasar
pertimbangan untuk merumuskan tujuan pendidikan secara komprehensif
dan pada gilirannya menjadi acuan dalam membuat perencanaan evaluasi.
Namun demikian, tidak sedikit guru mengalami kesulitan untuk
mengembangkan sistem evaluasi di madrasah karena bertentangan dengan
tradisi yang selama ini sudah berjalan. Misalnya, ada tradisi bahwa target
kuantitas kelulusan setiap madrasah harus di atas 95 %, begitu juga untuk
kenaikan kelas. Ada juga tradisi bahwa dalam mata pelajaran tertentu nilai
peserta didik dalam buku rapot harus minimal enam. Seharusnya, kebijakan
evaluasi lebih menekankan kepada target kualitas yaitu kepentingan dan
kebermaknaan pendidikan bagi anak.
2. Pendekatan sistem
Sistem adalah totalitas dari berbagai komponen yang saling
berhubungan dan ketergantungan. Jika pendekatan sistem dikaitkan dengan
evaluasi, maka pembahasan lebih difokuskan kepada komponen evaluasi,
yang meliputi : komponen kebutuhan dan feasibility, komponen input,
komponen proses, dan komponen produk. Dalam bahasa Stufflebeam
disingkat CIPP, yaitu context, input, process dan pruduct. Komponen-
komponen ini harus menjadi landasan pertimbangan dalam evaluasi
pembelajaran secara sistematis. Berbeda dengan pendekatan tradisional
yang hanya menyentuh komponen produk saja, yaitu perubahan perilaku
apa yang terjadi pada peserta didik setelah mengikuti proses pembelajaran.
Pendekatan ini tentu tidak salah, hanya tidak sistematis. Padahal, Anda
juga tahu bahwa hasil belajar tidak akan ada bila tidak melalui proses, dan

18
proses tidak bisa berjalan bila tidak ada masukan dan guru yang
melaksanakan.
Dalam literatur modern tentang evaluasi, terdapat dua pendekatan
yang dapat digunakan untuk menafsirkan hasil evaluasi, yaitu penilaian
acuan patokan (criterion-referenced evaluation) dan penilaian acuan norma
(norm-referenced evaluation). Artinya, setelah Anda memperoleh skor
mentah dari setiap peserta didik, maka langkah selanjutnya adalah
mengubah skor mentah menjadi nilai dengan menggunakan pendekatan
tertentu.
3. Penilaian Acuan Patokan (PAP)
Pendekatan ini sering juga disebut penilaian norma absolut. Jika
Anda ingin menggunakan pendekatan ini, berarti Anda harus
membandingkan hasil yang diperoleh peserta didik dengan sebuah patokan
atau kriteria yang secara absolut atau mutlak telah ditetapkan oleh guru.
Anda juga dapat menggunakan langkah-langkah tertentu untuk
menggunakan PAP, seperti menentukan skor ideal, mencari rata-rata dan
simpangan baku ideal, kemudian menggunakan pedoman konversi skala
nilai. Pendekatan ini cocok digunakan dalam evaluasi atau penilaian formatif
yang berfungsi untuk perbaikan proses pembelajaran. Umumnya, seorang
guru yang menggunakan PAP sudah dapat menyusun pedoman konversi
skor menjadi skor standar sebelum kegiatan evaluasi dimulai. Oleh sebab
itu, hasil pengukuran dari waktu ke waktu dalam kelompok yang sama atau
berbeda dapat dipertahankan keajegannya. PAP dapat menggambarkan
prestasi belajar peserta didik secara objektif apabila alat ukur yang
digunakan adalah alat ukur yang standar.
4. Penilaian Acuan Norma (PAN)
Salah satu perbedaan PAP dengan PAN adalah penggunaan tolak

19
ukur hasil/skor sebagai pembanding. Pendekatan ini membandingkan skor
setiap peserta didik dengan teman satu kelasnya. Makna nilai dalam bentuk
angka maupun kualifikasi memiliki sifat relatif. Artinya, jika Anda sudah
menyusun pedoman konversi skor untuk suatu kelompok, maka pedoman
itu hanya berlaku untuk kelompok itu saja dan tidak berlaku untuk kelompok
yang lain, karena distribusi skor peserta didik sudah berbeda. Untuk
memahami kedua pendekatan evaluasi atau penilaian tersebut di atas,
silahkan Anda membaca bab berikutnya.

3. Karakter Evaluasi
Dalam buku Succesful Teaching karangan J.Mursell yang
diterjemahkan ke dalam bahasa Indonesia oleh J. Mursell dan S.Nasution
(tanpa tahun : 23) dikemukakan bahwa ciri-ciri evaluasi yang baik adalah
“evaluasi dan hasil langsung, evaluasi dan transfer, dan evaluasi langsung
dari proses belajar”.
a. Evaluasi dan hasil Langsung.
Dalam proses pembelajaran, guru sering melakukan kegiatan
evaluasi, baik ketika proses pembelajaran sedang berlangsung maupun
ketika sesudah proses pembelajaran selesai. Jika evaluasi diadakan ketika
proses pembelajaran sedang berlangsung, maka guru ingin mengetahui
keefektifan dan kesesuaian strategi pembelajaran dengan tujuan yang ingin
dicapai. Jika evaluasi dilakukan sesudah proses pembelajaran selesai,
berarti guru ingin mengetahui hasil atau prestasi belajar yang diperoleh
peserta didik.
b. Evaluasi dan transfer.
Hal penting yang berkenaan dengan proses belajar adalah
kemungkinan mentransfer hasil yang dipelajari ke dalam situasi yang
20
fungsional. Dasar pemikiran ini merupakan asas psikologis yang logis dan
rasional. Peserta didik tidak dapat disebut telah menguasai ilmu tajwid
(misalnya), jika ia belum dapat menggunakannya dalam membaca Al-
Qur’an. Apabila suatu hasil belajar tidak dapat ditransfer dan hanya dapat
digunakan dalam satu situasi tertentu saja, maka hasil belajar itu disebut
hasil belajar palsu. Sebaliknya, jika suatu hasil belajar dapat ditransfer
kepada penggunaan yang aktual, maka hasil belajar itu disebut hasil belajar
otentik. Jadi, evaluasi yang baik harus mengukur hasil belajar yang otentik
dan kemungkinan dapat ditransfer.
Dalam penelitian sering ditemui hasil-hasil pembelajaran yang
dicapai tampaknya baik, tetapi sebenarnya hasil itu palsu. Peserta didik
dapat mengucapkan kata-kata yang dihafalkan dari buku pelajarannya,
tetapi mereka tidak dapat menggunakannya dalam situasi baru.
Penguasaan materi pelajaran seperti ini tidak lebih dari “penguasaan
beo”. Evaluasi yang menekankan pada hasil-hasil palsu, baik untuk
informasi bagi peserta didik maupun untuk tujuan lain, berarti evaluasi
itu palsu. Jika peserta didik hanya memiliki pengetahuan yang bersifat
informatif, belum tentu menjamin pemahaman dan pengertiannya. Oleh
karena itu, penekanan pada pengetahuan yang bersifat informatif tidak akan
menghasilkan pola berpikir yang baik. Ada dua sebab mengapa hasil
pembelajaran yang mengakibatkan dan berhubungan dengan proses
transfer menjadi penting artinya dalam proses evaluasi. Pertama, hasil-hasil
itu menyatakan secara khusus dan sejelas-jelasnya kepada guru mengenai
apa yang sebenarnya terjadi ataupun tidak terjadi, dan sampai dimana pula
telah tercapai hasil belajar yang penuh makna serta otentik sifatnya. Kedua,
hasil belajar sangat erat hubungannya dengan tujuan peserta didik belajar,
sehingga mempunyai efek yang sangat kuat terhadap pembentukan pola

21
dan karakter belajar yang dilakukan peserta didik. Oleh karena itu, belajar
hendaknya dilakukan untuk mendapatkan hasil-hasil yang dapat ditransfer
dan setiap waktu dapat digunakan menurut keperluannya.
c. Evaluasi langsung dari proses belajar.
Di samping harus mengetahui hasil belajar, Anda juga harus menilai
proses belajar. Hal ini dimaksudkan agar proses belajar dapat diorganisasi
sedemikian rupa, sehingga dapat mencapai hasil yang optimal. Anda dapat
mengetahui proses apa yang dilalui peserta didik dalam mempelajari
sesuatu. Misalnya, apakah peserta didik dalam mempelajari Al-Qur’an cukup
sekedar membaca beberapa ayat Al-Qur’an ataukah ia membaca seluruh
ayat Al-Qur’an untuk memahami dan memecahkan masalah-masalah
kehidupan. Apakah dalam praktik ibadah, peserta didik cukup hanya melatih
gerakan-gerakan sholat atau menganalisis praktik sholat dan mencari
hubungannya dengan tingkah laku sehari-hari, mendiskusikan manfaat
sholat dengan teman-temannya, dan mencari situasi-situasi yang nyata yang
dapat menggunakan fungsi sholat itu.
Penelitian tentang proses belajar yang diikuti oleh peserta didik
merupakan suatu hal yang sangat penting. Anda akan mengetahui dimana
letak kesulitan peserta didik, kemudian mencari alternatif bagaimana
mengatasi kesulitan tersebut. Di samping itu, penelitian tentang proses
belajar bermanfaat juga bagi peserta didik itu sendiri. Peserta didik akan
melihat kelemahannya, kemudian berusaha memperbaikinya, dan akhirnya
dapat mempertinggi hasil belajarnya. Meneliti proses belajar seorang anak
bukan pekerjaan yang mudah. Hal ini memerlukan waktu, tenaga, pemikiran,
dan pengalaman. Anda dapat menggunakan suatu metode untuk menilai
proses belajar dengan memperhatikan prinsip konteks, vokalisasi,
sosialisasi, individualisasi, dan urutan (squence).
22
Seorang peserta didik tidak dapat belajar dengan baik, karena ia
tidak menggunakan konteks yang baik. Ia tidak menggunakan bermacam-
macam sumber dan tidak menggunakan situasi-situasi yang konkrit. Peserta
didik tidak dapat belajar dengan baik, karena tidak mempunyai fokus
tertentu, misalnya tidak melihat masalah-masalah pokok yang harus
dipecahkannya, atau mungkin pula tidak sesuai dengan bakat dan minatnya
(individualisasi) serta tidak mendiskusikannya dengan orang lain
(sosialisasi). Dalam evaluasi pembelajaran, Anda jangan terfokus kepada
hasil belajar saja, tetapi juga harus memperhatikan transfer hasil belajar dan
proses belajar yang dijalani oleh peserta didik.

Evaluasi
SOAL PILIHAN BERGANDA

1. Dibawah ini yang termasuk model kuantitatif adalah, kecuali ….


a. Model Tyler
b. Model teoritik Taylor dan Maguire
c. Model pendekatan sistem Alkin
d. Model iluminatif
e. Model Countenance Stake
2. Countenance Evaluation Model merupakan model evaluasi yang
dikembangkan oleh ….
a. Stufflebeam
b. Tyler
c. Michael Scriven
d. Stake
e. Provus
3. Salah satu ciri – ciri evaluasi yang baik adalah
a. evaluasi dan hasil langsung
b. Penilaian Acuan Patokan
23
c. Model yang Berorientasi pada Tujuan
d. Menentukan tujuan pembelajaran yang akan
e. Evaluasi system edukasi
4. Berikut ini yang bukan merupakan model utama evaluasi adalah ….
a. Measurement
b. Congruence
c. educational system
d. illumination
e. Countenance Stake
5. Evaluasi berarti membandingkan performance dari berbagai dimensi
(tidak hanya dimensi hasil saja) dengan sejumlah kriteria, baik yang
bersifat mutlak/interen maupun relatif/eksteren, hal ini merupakan
pengertian model evaluasi dari ….
a. Model Tyler
b. Educational System Evaluation Model
c. Illuminative Model
d. Model Kesesuain
e. measurement model
6. Setiap model evaluasi akan menekankan pada pendekatan-
pendekatan tertentu. Model Responsif menekankan pada pendekatan
….
a. kualitatif-naturalistik
b. kuantitatif-terstruktur
c. kualitatif-terstruktur
d. kuantitatif-naturalis
e. Penilaian Acuan Norma

7. Berorientasi kepada praktik evaluasi yang telah berjalan selama ini di


madrasah yang ditujukan kepada perkembangan aspek intelektual
peserta didik merupakan pengertian pendekatan evaluasi ….
a. Pendekatan sistem
b. Penilaian Acuan Patokan

24
c. Penilaian Acuan Norma
d. Pendekatan tradisional
e. Penilaian Acuan Hukum
8. Untuk menilai proses belajar harus memperhatikan prinsip-prinsip,
dibawah ini yang bukan merupakan prinsip-prinsip menilai proses
belajar adalah…
a. Konteks
b. Vokalisasi
c. Sosialisasi
d. Individualisasi
e. liberalisasi
9. Sebagai input untuk kepentingan pengambilan keputusan dalam
rangka penyesuaian dan penyempurnaan sistem pembelajaran yang
sedang dikembangkan merupakan pengertian dari ….
a. Latar belakang evaluasi
b. Fungsi evaluasi
c. Kekurangan evaluasi
d. Tujuan evaluasi
e. Komponen evaluasi
10. CIPP Evaluation Model merupakan model evaluasi yang
dikembangkan oleh …
a. Stufflebeam
b. Tyler
c. Michael Scriven
d. Stake
e. Provus

SOAL ESSAY
1. Ada tiga fase evaluasi yang harus ditempuh dalam model illuminatif,
yaitu : observe, inquiry further, dan seek to explain. Coba Anda
jelaskan ketiga fase tersebut dengan singkat!
25
2. Menurut Anda, apa yang dimaksud dengan “evaluasi dan transfer”?
3. Bandingkan antara pendekatan tradisional dengan pendekatan
sistem dalam evaluasi pembelajaran dilihat dari segi tujuan dan
ruang lingkup evaluasi.
4. Bandingkan antara model evaluasi Tyler dan Model evaluasi
berorientasi pada tujuan, Jelaskan persamaan dan perbadaannya
secara singkat!
5. Menurut Anda, apa yang dimaksud dengan “evaluasi langsung dari
proses belajar”?

26
Tujuan Kegiatan : Mahasiswa diharapkan dapat memahami konsep
evaluasi, penilaian dan pengukuran.
Petunjuk Kegiatan :

1. Bacalah materi berbagai sumber referensi.


2. Selesaikan pertanyaan-pertanyaan di bawah ini dengan benar.
3. Diskusikan di dalam kelompok.
4. Persentasikan hasil kerja anda.
5. Perbaiki hasil kerja anda jika ada kritik dan saran.
6. Buatlah “peta konsep” untuk pokok bahasan ini.

Pertanyaan :

1. Apa arti dari ukur dan nilai?


2. Apa arti pengukuran, penilaian, dan evaluasi?
3. Apa manfaat dari penilaian?
4. Prinsip-prinsip apa yang melandasi suatu penilaian dalam pembelajaran?
5. Jelaskan karakteristik dan teknik penilaian!
6. Apa yang dapat anda jelaskan dari hasil keempat pertanyaan di atas?

SELAMAT MENGERJAKAN
27
BAB II
KONSEP EVALUASI

KOMPETENSI DASAR:
1. Mampu memahami Konsep pengukuran, pengujian,
penilaian, dan evaluasi,
2. Mampu memahami prinsip dan alat evaluasi, serta
pengukuran acuan norma dan acuan patokan

INDIKATOR KOMPETENSI:
1. Menjelaskan pengertian pengukuran, pengujian,
penilaian, dan evaluasi.
2. Menjelaskan subyek dan sasaran evaluasi
3. Menjelaskan prinsip dan alat evaluasi; dan
4. Membedakan pengukuran acuan norma dan acuan
patokan)

Pengantar
Salah satu kompetensi yang harus Anda kuasai adalah evaluasi
pembelajaran. Kompetensi ini sejalan dengan tugas dan tanggung jawab
Anda sebagai guru dalam pembelajaran, yaitu mengevaluasi
pembelajaran termasuk di dalamnya melaksanakan penilaian proses dan
28
hasil belajar. Kompetensi tersebut sejalan pula dengan instrumen penilaian
kemampuan guru, dimana salah satu indikatornya adalah melakukan
evaluasi pembelajaran. Masih banyak lagi model yang menggambarkan
kompetensi dasar yang harus Anda kuasai. Hal ini menunjukkan bahwa
pada semua model kompetensi guru (teacher competency) selalu
menggambarkan dan mensyaratkan adanya kemampuan guru dalam
mengevaluasi pembelajaran, sebab kemampuan melakukan evaluasi
pembelajaran merupakan kemampuan dasar yang mutlak harus dimiliki guru
atau calon guru. Oleh sebab itu pula, pada setiap program studi di lingkungan
Lembaga Pendidikan dan Tenaga Kependidikan (LPTK) seperti, UPI,
UNIMED, FKIP, STKIP, dan Fakultas Tarbiyah, para mahasiswa wajib
menempuh matakuliah evaluasi pembelajaran dengan bobot 3 SKS.
Mengingat begitu pentingnya materi evaluasi pembelajaran, maka
dalam diktat ini akan dibahas tentang pengertian, tujuan, fungsi, prinsip, jenis
dan karakteristik evaluasi pembelajaran. Kompetensi yang harus Anda
kuasai setelah mempelajari diktat ini adalah mengetahui dan memahami
konsep dasar evaluasi. Anda juga harus sering melakukan evaluasi
pembelajaran, sehingga Anda dapat menguasai istilah dan pengertiannya,
tujuan, fungsi dan prinsip-prinsip evaluasi pembelajaran, baik teori maupun
praktik.
Mungkin Anda pernah atau bahkan sering membaca buku-buku
tentang evaluasi pembelajaran yang didalamnya menjelaskan arti dari
beberapa istilah yang hampir sama tetapi berbeda, seperti evaluasi,
penilaian, pengukuran, dan tes. Atau mungkin bisa jadi Anda kebingungan,
apakah perbedaan antara evaluasi pembelajaran dengan penilaian proses
dan hasil belajar ? apakah pengukuran dan tes itu sama? Tentu saja istilah-
istilah tersebut berbeda satu dengan lainnya, baik ruang lingkup maupun

29
fokus/objek yang dinilai. Evaluasi lebih luas ruang lingkupnya dari penilaian,
sedangkan penilaian lebih terfokus kepada komponen atau aspek tertentu
saja yang merupakan bagian dari ruang lingkup evaluasi tersebut. Jika hal
yang Anda dinilai adalah pembelajaran, maka ruang lingkupnya adalah
semua komponen pembelajaran (sistem pembelajaran), dan istilah yang
tepat untuk menilai pembelajaran adalah evaluasi. Jika hal yang ingin Anda
nilai satu atau beberapa bagian/komponen pembelajaran, misalanya proses
dan hasil belajar, maka istilah yang tepat digunakan adalah penilaian. Ada
juga istilah pengukuran. Kalau evaluasi dan penilaian bersifat kualitatif,
maka pengukuran bersifat kuantitatif (skor/angka) dan tentunya
menggunakan suatu alat ukur yang standar (baku). Dalam konteks proses
dan hasil belajar, alat ukur tersebut dapat berbentuk tes atau non-tes.
1. Pengertian Pengukuran, Penilaian, dan Evaluasi

Sebelum kita membahas konsep pengukuran, ada baiknya kita


simak narasi berikut : “suatu hari siswa di tugaskan membawa buah apel oleh
gurunya, karena memang hari itu ada mata pelajaran matematika tentang
pecahan. Siswa pun membawa berbagai jenis bentuk apel ada yang diameter
5 cm, 7 cm atau bahkan 10 cm. Ketika diminta untuk mengeluarkan apel
tersebut oleh guru, maka spontan masing – masing anak akan memberikan
komentar, “wah.. apelmu besar sekali... diameternya 10 cm” ada pula yang
memberikan komentar “...Kok apel kamu kecil ya..? hanya berdiameter 5cm”
di lain pihak ada yang berkomentar “... iih apelnya bagus... warnanya hijau
semua, segar sekali kelihatannya” atau “... ini apel apa?... terlihat agak
kehitam-hitaman jadi terlihat seperti busuk dan kurang bagus...”
Di sadari atau tidak rentetan narasi, dialog dan komentar di atas
merupakan sebuah kegiatan yang ada kaitannya dengan materi yang kita
bahas, yaitu pengukuran, penilaian, dan evaluasi. Mari kita bahas lebih jauh,
30
diameter 5 cm, 7 cm dan 10 cm adalah kegiatan pengukuran, mengapa
demikian? Karena diameter apel dibandingkan oleh sebuah ukuran satuan
yang baku yaitu panjang dengan satuan centimeter (Cm). Adapun hasil yang
diperoleh adalah nilai yang berupa angka yaitu 5cm, 7 cm dan 10 cm.
Apa itu pengukuran ?

Di sadari atau tidak rentetan narasi, dialog dan komentar di atas


merupakan sebuah kegiatan yang ada kaitannya dengan materi yang kita
bahas, yaitu pengukuran, penilaian, dan evaluasi. Mari kita bahas lebih jauh,
diameter 5 cm, 7 cm dan 10 cm adalah kegiatan pengukuran, mengapa
demikian? Karena diameter apel di bandingkan oleh sebuah ukuran satuan
yang baku yaitu panjang dengan satuan centimeter (Cm). Adapun hasil yang
diperoleh adalah nilai yang berupa angka yaitu 5 cm, 7 cm dan 10 cm.
Kegiatan atau proses tersebut di atas adalah sebuah proses pengukuran hal
ini dikarenakan ada 2 ciri khas dari pengukuran, yaitu:
1. Adanya kegiatan membandingkan dengan ukuran tertentu (dapat berupa
ukuran baku atau standar).
2. Adanya hasil kuantitatif (angka) yang diperoleh dari proses tersebut..
Ahmann dan Glock dalam Hasan (1988) menjelaskan ‘in the last
analysis measurement is only a part, although a very substansial part of
evaluation. It provides information upon which an evaluation can be based…
Educational measurement is the process that attempt to obtain a quantified
representation of the degree to which a trait is possessed by a pupil’. (dalam
analisis terakhir, pengukuran hanya merupakan bagian, yaitu bagian yang
sangat substansial dari evaluasi. Pengukuran menyediakan informasi, di
mana evaluasi dapat didasarkan ... Pengukuran pendidikan adalah proses
yang berusaha untuk mendapatkan representasi secara kuantitatif tentang
sejauh mana suatu ciri yang dimiliki oleh peserta didik). Pendapat yang sama
31
dikemukakan oleh Wiersma dan Jurs (1985), bahwa “technically,
measurement is the assignment of numerals to objects or events according
to rules that give numneral quantitative meaning”. (secara teknis, pengukuran
adalah pengalihan dari angka ke objek atau peristiwa sesuai dengan aturan
yang memberikan makna angka secara kuantitatif).

Dengan demikian, dapat dikemukakan bahwa pengukuran adalah


suatu proses atau kegiatan untuk menentukan kuantitas daripada sesuatu.
Kata “sesuatu” bisa berarti peserta didik, guru, gedung sekolah, meja belajar,
white board, dan sebagainya. Dalam proses pengukuran, tentu guru harus
menggunakan alat ukur (tes atau non-tes). Alat ukur tersebut harus standar,
yaitu memiliki derajat validitas dan reliabilitas yang tinggi. Dalam bidang
pendidikan, psikologi, maupun variabel-variabel sosial lainnya, kegiatan
pengukuran biasanya menggunakan tes. Dalam sejarah perkembangannya,
aturan mengenai pemberian angka ini didasarkan pada teori pengukuran
psikologi yang dinamakan psychometric. Namun demikian, boleh saja suatu
kegiatan evaluasi dilakukan tanpa melalui proses pengukuran.

Pengukuran dalam bahasa inggris adalah measurement dan istilah


dalam bahasa inggris ini sering juga digunakan dalam pendidikan. Djaali
(2004) Mengatakan pengukuran merupakan suatu kegiatan yang dilakukan
untuk mengukur dalam arti memberi angka terhadap sesuatu yang disebut
obyek pengukuran atau obyek ukur. Arikunto (2006) mengatakan mengukur
adalah membandingkan sesuatu dengan satu ukuran yang bersifat
kuantitatif. Pendapat ini senada dengan Suryanto (2009) yang menyatakan
bahwa pengukuran adalah suatu upaya penentuan angka untuk
menggambarkan karakteristik suatu obyek. Untuk menghasilkan angka (yang
merupakan hasil pengukuran), maka di perlukan alat ukur. Berdasarkan teori

32
– teori di atas, dapat disimpulkan bahwa mengukur atau pengukuran adalah
sebuah kegiatan/proses membandingkan suatu benda atau keadaan dengan
suatu ukuran tertentu yang hasilnya bersifat kuantitatif (angka). Tentunya
sebelum kita menentukan proses pengukuran akan suatu obyek, terlebih
dahulu ditentukan alat ukurnya yang sesuai.

Apa itu penilaian ?

Kembali pada wacana/dialog terdahulu, pada kegiatan selanjutnya,


siswa memberikan komentar kembali tentang kondisi apel masing–masing
temannya. Ada yang terlihat bagus (hijau segar) dan ada yang terlihat kurang
bagus seperti busuk (kehitam–hitaman). Dari hal tersebut terlihat adanya
perbandingan dari segi penampakan dari sebuah apel dan direspon secara
kualitatif atau maknawi. Kegiatan atau proses tersebut di atas adalah sebuah
proses penilaian, hal ini dikarenakan ada 2 ciri khas dari penilaian, yaitu:
a. Adanya kegiatan membandingkan kondisi secara kualitatif/maknawi
(kata – kata)dan tidak ada ukuran baku.
b. Adanya hasil keputusan yang bersifat kualitatif/maknawi (kata-kata)
yang
diperoleh dari proses tersebut.
Istilah penilaian merupakan alih bahasa dari istilah assessment,
bukan dari istilah evaluation. Dalam proses pembelajaran, penilaian
sering dilakukan guru untuk memberikan berbagai informasi secara
berkesinambungan dan menyeluruh tentang proses dan hasil yang telah
dicapai peserta didik. Artinya, penilaian tidak hanya ditujukan pada
penguasaan salah satu bidang tertentu saja, tetapi bersifat menyeluruh yang
mencakup aspek pengetahuan, keterampilan, sikap dan nilai-nilai.
Sementara itu, Anthony J.Nitko (1996) menjelaskan “assessment is a broad

33
term defined as a process for obtaining information that is used for
making decisions about students, curricula and programs, an educational
policy”. (penilaian adalah suatu proses untuk memperoleh informasi yang
digunakan untuk membuat keputusan tentang peserta didik, kurikulum,
program, dan kebijakan pendidikan). Dalam hubungannya dengan proses dan
hasil belajar, penilaian dapat didefinisikan sebagai suatu proses atau kegiatan
yang sistematis dan berkesinambungan untuk mengumpulkan informasi
tentang proses dan hasil belajar peserta didik dalam rangka membuat
keputusan-keputusan berdasarkan kriteria dan pertimbangan tertentu. Jika
dilihat dalam konteks yang lebih luas, keputusan tersebut dapat menyangkut
keputusan tentang peserta didik, keputusan tentang kurikulum dan program
atau juga keputusan tentang kebijakan pendidikan.
Keputusan tentang peserta didik meliputi pengelolaan
pembelajaran, penempatan peserta didik sesuai dengan jenjang atau jenis
program pendidikan, bimbingan dan konseling, dan menyeleksi peserta
didik untuk pendidikan lebih lanjut. Keputusan tentang kurikulum dan
program meliputi keefektifan (summative evaluation) dan bagaimana cara
memperbaikinya (formative evaluation). Keputusan tentang kebijakan
pendidikan dapat dibuat pada tingkat lokal/daerah (kabupaten/kota), regional
(provinsi), dan tingkat nasional. Keputusan penilaian terhadap suatu hasil
belajar sangat bermanfaat untuk membantu peserta didik merefleksikan apa
yang mereka ketahui, bagaimana mereka belajar, dan mendorong tanggung
jawab dalam belajar. Keputusan penilaian dapat dibuat oleh guru, sesama
peserta didik (peer) atau oleh dirinya sendiri (self-assessment).
Pengambilan keputusan perlu menggunakan pertimbangan yang berbeda-
beda dan membandingkan hasil penilaian. Pengambilan keputusan harus
dapat membimbing peserta didik untuk melakukan perbaikan hasil belajar.

34
Setiap guru pasti pernah memberikan penilaian, dan di setiap
penilaian umumnya diawali dengan sebuah kegiatan pengukuran dengan
instrumen tes maupun skala sikap (non tes). Menurut Suryanto (2009)
Asesmen (penilaian) merupakan kegiatan untuk mengumpulkan informasi
hasil belajar siswa yang diperoleh dari berbagai jenis tagihan dan mengolah
informasi tersebut untuk menilai hasil belajar dan perkembangan belajar
siswa. Sedangkan Djaali (2004) menjelaskan bahwa penilaian merupakan
suatu tindakan atau proses menentukan nilai (makna) suatu obyek. Penilaian
adalah suatu keputusan tentang nilai (pemaknaan). Penilaian dapat
dilakukan berdasarkan hasil pengukuran atau pula dipengaruhi oleh hasil
pengukuran. Senada dengan pendapat-pendapat di atas Arikunto (2005)
menjelaskan bahwa penilaian atau menilai adalah mengambil keputusan
terhadap sesuatu dengan ukuran baik buruk dan penilaian bersifat kualitatif.
Dalam dunia pendidikan, khususnya dunia persekolahan, penilaian
mempunyai makna ditinjau dari berbagai segi.
a. Makna bagi Siswa
Dengan diadakannya penilaian, makasiswa dapat mengetahui sejauh
mana telah berhasil mengikuti pelajaran yang diberikan oleh guru. Hasil yang
diperoleh siswa dari pekerjaan menilai ini ada (dua) kemungkinan:
1) Memuaskan
Jika siswa memperoleh hasil yang memuaskan dan hal itu
menyenangkan, tentu kepuasan itu ingin diperolehnya lagi pada kesmepatan
lain waktu. Akibatnya, siswa akan mempunyai motivasi yang cukup besar
untuk belajar lebih giat, agar lain kali mendapat hasil yang lebih memuaskan
lagi. Keadaan sebaliknya dapat terjadi, yakni siswa sudah merasa puas
dengan hasil yang diperoleh dan usahanya kurang gigih untuk lain kali.
2) Tidak memuaskan

35
Jika siswa tidak puas dengan hasil yang diperoleh, ia akan berusaha agar
lain kali keadaan itu tidak terulang lagi. Maka ia akan belajar lebih giat.
Namun demikian, keadaan sebaliknya dapat terjadi. Ada beberapa siswa
yang lemah kemauannya, akan menjadi putus asa dengan hasilkurang
memuaskan yang telah diterimanya.
b. Makna bagi Guru
1) Dengan hasil penilaian yang diperoleh, guru akan dapat mengetahui
siswa mana yang bisa melanjutkan pelajarannya karena sudah berhasil
menguasai materi, maupun siswa-siswa yang belum berhasil menguasai
materi. Dengan petunjuk ini guru dapat lebih memusatkan perhatiannya
kepada siswa-siswa yang belum berhasil. Apalagi jika guru tau akan
sebab-sebabnya, ia akan memberikan perhatian yang memusat dan
memberikan perlakuan yang lebih teliti sehingga keberhasilan
selanjutnya dapat diharapkan.
2) Guru akan mengetahui apakah materi yang diajarkan sudah tepat bagi
siswa sehingga untuk memberikan pengajaran di waktu yang akan
datang tidak perlu diadakan perubahan.
3) Guru akan mengetahui apakah metode yang digunakan sudah tepat atau
belum. Jika sebagian besar dari siswa memperoleh nilai jelek pada
penilaian yang diadakan, mungkin halini disebabkan oleh pendekatan
atau metode yang kurang tepat. Apabila demikian halnya, maka guru
harus mawas diri dan mencoba mencari metode lain dalam mengajar.
c. Makna bagi Sekolah
1) Apabila guru-guru mengadakan penilaian dan diketahui bagaimana hasil
belajar siswa-siswanya, dapat diketahui pula apakah kondisi belajar yang
diciptakan oleh sekolah sudah sesuai dengan harapan atau belum. Hasil
belajar merupakan cermin kualitas sesuatu sekolah.

36
2) Informasi dari guru tentang tepat tidaknya kurikulum untuk sekolah itu
dapat menjadi bahan pertimbagan bagi perencanaan sekolah untuk
masa-masa yang akan datang.
3) Informasi hasil penilaian yang diperoleh dari tahun ke tahun dapat
digunakan sebagai pedoman bagi sekolah. Apakah yang dilakukan oleh
sekolah sudah memenuhi standar atau belum. Pemenuhan standar akan
terlihat dari bagusnya angka-angka yang diperoleh siswa.
Secara rinci dan sesuai dengan urutan kejadiannya, dalam proses
transformasi ini penilaian dibedakan atas tiga jenis,yakni sebelum, selama,
dan sesudah terjadi proses dalam kegiatan sekolah. Dalam hal ini para
pelaksana pendidikan selalu berorientasi pada tujuan yang akan dicapai dan
tinjauannya selalu diarahkan pada siswa secara perseorangan (indiidual)
maupun secara berkelompok (per kelas atau per angkatan).
Dengan mengetahui makna penilaian ditinjau dari berbagai segi
dalam sistem pendidikan, maka dari itu terdapat beberapa tujuan atau fungsi
penilaian, yaitu:
a. Penilaian Berfungsi Selektif
Dengan cara mengadakan penilaian guru mempunyai cara untuk
mengadakan seleksi atau penilaian terhadap siswanya. Penilaian itu sendiri
mempunyai berbagai tujuan, antara lain:
1) Untuk memilih siswa yang dapat diterima di sekolah tertentu.
2) Untuk memilih siswa yang dapat naik kelas atau tingkat berikutnya.
3) Untuk memilih siswa yang seharusnya mendapat beasiswa.
4) Untuk memilih siswa yang sudah berhak meninggalkan sekolah, dan
sebagainya.
b. Penilaian Berfungsi Diagnostik

37
Apabila alat yang digunakan dalam penilaian cukup memenuhi persyaratan,
maka dengan melihat hasilnya, guru akan mengetahui kelemahan siswa. Di
samping itu, diketahui pula penyebabnya. Jadi dengan mengadakan
penilaian, sebenarnya guru melakukan diagnosis kepada siswa tentang
kebaikan dan kelemahannya. Dengan diketahuinya sebab-sebab kelemahan
ini, akan lebih mudah mencari cara untuk mengatasinya.
c. Penilaian Berfungsi sebagai Penempatan
Sistem baru yang kini banyak dipopulerkan di negara barat, adalah sistem
belajar sendiri. Belajar sendiri dapat dilakukan dengan cara mempelajari
sebuah paket belajar, baik itu berbentuk modul atupun paket belajar yang
lain. Sebagai alasan dari timbulnya sistem ini adalah adanya pengakuan yang
besar terhadap kemampuan individual. Setiap siswa sejak lahirnya telah
membawa bakat sendiri-sendiri sehingga pelajaran akan lebih efektif apabila
disesuaikan dengan pembawaan yang ada. Akan tetapi disebabkan karena
keterbatasan sarana dan tenaga, pendidikan yang bersifat individual kadang-
kadang sukar sekali dilaksanakan. Pendekatan yang lebih bersifat melayani
perbedaan kemampuan, adalah pengajaran secara berkelompok. Untuk
dapat menentukan dengan pasti di kelompok mana seorang siswa harus
ditempatkan, digunakan suatu penelian. Sekelompok siswa yang mempunyai
hasil penelitian yang sama, akan berada dalam kelompok yang sama dalam
belajar.
d. Penilaian Berfungsi sebagai Pengukur Keberhasilan
Fungsi keempat dari penilaian ini dimaksudkan untuk mengetahui sejauh
mana suatu program berhasil diterapkan. Telah disinggung pada bagian
sebelum ini, keberhasilan program ditentukan oleh beberapa fakor, yaitu
faktor guru, metode mengajar, kurikulum, sarana, dan sistem administrasi.

Apa itu Evaluasi ?


38
Evaluasi berasal dari bahasa Inggris evaluation yang berarti
penilaian. Evaluasi diartikan sebagai suatu proses penilaian untuk mengambil
keputusan yang menggunakan seperangkat hasil pengukuran dan
berpatokan kepada tujuan yang telah dirumuskan. Evaluasi selalu dikaitkan
dengan prestasi belajar definisi evaluasi dikembangkan pertama kali oleh
Ralph Tyler yang mengatakan bahwa evaluasi merupakan sebuah proses
pengumpulan data untuk menentukan sejauh mana,dalam hal apa, dan
bagaimana tujuan pendidikan sudah tercapai. Sementara itu Blom et. al
(1971) (dalam Daryanto, 1999) berpendapat bahwa pengumpulan kenyataan
secara sistematis untuk menetapkan apakah dalam kenyataannya terjadi
perubahan dalam diri siswa dan menetapkan mana tingkat perubahan dalam
pribadi siswa. Robert L. Thorndike dan Elizabeth Hagen (1961) (dalam
Iskandar, 2011), menjelaskan evaluasi tersebut dengan mengatakan bahwa
evaluasi itu berhubungan dengan pengukuran. Dalam beberapa hal evaluasi
lebih luas, karena dalam evaluasi juga termasuk penilaian formal dan
penilaian intuitif mengenai kemajuan peserta didik. Evaluasi juga mencakup
penilaian tentang apa yang baik dan apa yang diharapkan. Dengan demikian
hasil pengukuran yang benar merupakan dasar yang kokoh untuk melakukan
evaluasi. Dari beberapa definisi ahli di atas dapat disimpulkan pengertian
evaluasi sebagai kegiatan identifikasi untuk melihat apakah suatu program
yang telah direncanakan telah tercapai atau belum, berharga atau tidak
berharga, dan dapat pula untuk melihat tingkat efisiensi
pelaksanaannya.Djaali (2004) menyatakan evaluasi dapat juga diartikan
sebagai proses menilai sesuatu berdasarkan kriteria atau tujuan yang telah
ditetapkan yang selanjutnya diikuti dengan pengambilan keputusan atas
obyek yang dievaluasi. Pendapat di atas, sesuai dengan pendapat Grolund
(1985) yang mengatakan bahwa evaluasi adalah suatu proses yang

39
sistematis untuk menentukan atau membuat keputusan sejauh mana tujuan
atau program telah tercapai. Berdasarkan teori – teori di atas, dapat
disimpulkan bahwa Evaluasi pembelajaran atau biasa disebut evaluasi hasil
belajar adalah sebuah kegiatan/proses pengambilan keputusan terhadap
sesuatu tujuan pembelajaran yang mengacu kepada kriteria yang telah
ditetapkan sebelumnya (dalam hal ini dapat berupa Kriteria Ketuntasan
Minimal atau KKM. Dalam mendefinisikan konsep evaluasi secara umum,
para ahli memiliki sudutpandang yang berbeda – beda. Sebagai sebuah
konsep, Mardapi (2004) mengatakan Djaali (2004) menyatakan evaluasi
dapat juga diartikan sebagai proses menilai sesuatu berdasarkan kriteria atau
tujuan yang telah ditetapkan yang selanjutnya diikuti dengan pengambilan
keputusan atas obyek yang dievaluasi.

Pendapat di atas, sesuai dengan pendapat Grolund (1985) yang


mengatakan bahwa evaluasi adalah suatu proses yang sistematis untuk
menentukan atau membuat keputusan sejauh mana tujuan atau program
telah tercapai. Berdasarkan teori – teori di atas, dapat disimpulkan bahwa
Evaluasi pembelajaran atau biasa disebut evaluasi hasil belajar adalah
sebuah kegiatan/proses pengambilan keputusan terhadap sesuatu tujuan
pembelajaran yang mengacu kepada kriteria yang telah ditetapkan
sebelumnya (dalam hal ini dapat berupa Kriteria Ketuntasan Minimal atau
KKM.

Dalam kaitannya dengan sebuah objek atau program pembelajaran,


perlu kiranya dilakukan sebuah evaluasi yang biasa disebut dengan evaluasi
pembelajaran. Seluruh kegiatan pembelajaran perlu dievaluasi. Hal tersebut
dikarenakan evaluasi dapat memberi informasi tentang tingkat keberhasilan
program pembelajaran, memberikan motivasi bagi siswa agar lebih giat

40
belajar, dan juga memberikan informasi tentang capaian hasil belajar siswa
secara keseluruhan dalam pembelajaran. Evaluasi pembelajaran
memerlukan berbagai tahapan atau sistematis yang saling berurutan dan
terkait, yaitu, pengukuran, penilaian dan evaluasi. Hendaknya dapat
dibedakan antara evaluasi sebagai tahapan kegiatan dan evaluasi sebagai
sebuah konsep menyeluruh dalam sebuah pembelajaran. Evaluasi dalam
tatarankonsep yang dimaksud adalah evaluasi pembelajaran yang bersifat
menyeluruh sedangkan evaluasi dalam tataran tahapan merupakan
kelanjutan dari tahapan sebelumnya yaitu pengukuran dan penilaian.

1. Evaluasi adalah suatu proses bukan suatu hasil (produk).


Hasil yang diperoleh dari kegiatan evaluasi adalah kualitas daripada
sesuatu, baik yang menyangkut tentang nilai maupun arti. Sedangkan
kegiatan untuk sampai kepada pemberian nilai dan arti itu adalah
evaluasi. Jika Anda melakukan kajian tentang evaluasi, maka yang Anda
lakukan adalah mempelajari bagaimana proses pemberian
pertimbangan mengenai kualitas daripada sesuatu. Gambaran kualitas
yang dimaksud merupakan konsekuensi logis dari proses evaluasi yang
dilakukan. Proses tersebut tentu dilakukan secara sistematis dan
berkelanjutan, dalam arti terencana, sesuai dengan prosedur dan aturan,
dan terus menerus.
2. Tujuan evaluasi adalah untuk menentukan kualitas daripada
sesuatu, terutama yang berkenaan dengan nilai dan arti. S. Hamid
Hasan (1988) secara tegas membedakan kedua istilah tersebut sebagai
berikut : Pemberian nilai dilakukan apabila seorang evaluator
memberikan pertimbangannya mengenai evaluan tanpa
menghubungkannya dengan sesuatu yang bersifat dari luar. Jadi
pertimbangan yang diberikan sepenuhnya berdasarkan apa evaluan itu
41
sendiri. Sedangkan arti, berhubungan dengan posisi dan peranan evaluan
dalam suatu konteks tertentu…. Tentu saja kegiatan evaluasi yang
komprehensif adalah yang meliputi baik proses pemberian keputusan
tentang nilai dan proses keputusan tentang arti, tetapi hal ini tidak berarti
bahwa suatu kegiatan evaluasi harus selalu meliputi keduanya.
Pemberian nilai dan arti ini dalam bahasa yang dipergunakan Scriven
(1967) adalah formatif dan sumatif. Jika formatif dan sumatif merupakan
fungsi evaluasi, maka nilai dan arti adalah hasil kegiatan yang dilakukan
oleh evaluasi.
3. Dalam proses evaluasi harus ada pemberian pertimbangan (judgement).
Pemberian pertimbangan ini pada dasarnya merupakan konsep dasar
evaluasi. Melalui pertimbangan inilah ditentukan nilai dan arti (worth and
merit) dari sesuatu yang sedang dievaluasi. Tanpa pemberian
pertimbangan, suatu kegiatan bukanlah termasuk kategori kegiatan
evaluasi.
4. Pemberian pertimbangan tentang nilai dan arti haruslah berdasarkan
kriteria tertentu. Tanpa kriteria yang jelas, pertimbangan nilai dan arti
yang diberikan bukanlah suatu proses yang dapat diklasifikasikan
sebagai evaluasi. Kriteria yang digunakan dapat saja berasal dari apa
yang dievaluasi itu sendiri (internal), tetapi bisa juga berasal dari luar
apa yang dievaluasi (eksternal), baik yang bersifat kuantitatif maupun
kualitatif. Jika yang dievaluasi itu adalah proses pembelajaran, maka
kriteria yang dimaksud bisa saja dikembangkan dari karakteristik proses
pembelajaran itu sendiri, tetapi dapat pula dikembangkan kriteria umum
tentang proses pembelajaran. Kriteria ini penting dibuat oleh evaluator
dengan pertimbangan (a) hasil evaluasi dapat dipertanggungjawabkan
secara ilmiah (b) evaluator lebih percaya diri (c) menghindari adanya

42
unsur subjektifitas (d) memungkinkan hasil evaluasi akan sama
sekalipun dilakukan pada waktu dan orang yang berbeda, dan (e)
memberikan kemudahan bagi evaluator dalam melakukan penafsiran
hasil evaluasi.

Persamaan dan Perbedaan Evaluasi dengan Penilaian.

Persamaannya adalah keduanya mempunyai pengertian menilai


atau menentukan nilai sesuatu. Di samping itu, alat yang digunakan untuk
mengumpulkan datanya juga sama. Sedangkan perbedaannya terletak pada
ruang lingkup (scope) dan pelaksanaannya. Ruang lingkup penilaian lebih
sempit dan biasanya hanya terbatas pada salah satu komponen atau aspek
saja, seperti prestasi belajar peserta didik. Pelaksanaan penilaian biasanya
dilakukan dalam konteks internal, yakni orang-orang yang menjadi bagian
atau terlibat dalam sistem pembelajaran yang bersangkutan. Misalnya,
guru menilai prestasi belajar peserta didik, supervisor menilai kinerja
guru, dan sebagainya. Ruang lingkup evaluasi lebih luas, mencakup semua
komponen dalam suatu sistem (sistem pendidikan, sistem kurikulum, sistem
pembelajaran) dan dapat dilakukan tidak hanya pihak internal (evaluasi
internal) tetapi juga pihak eksternal (evaluasi eksternal), seperti konsultan
mengevaluasi suatu program.

Evaluasi dan penilaian lebih bersifat komprehensif yang meliputi


pengukuran, sedangkan tes merupakan salah satu alat (instrument)
pengukuran. Pengukuran lebih membatasi kepada gambaran yang bersifat
kuantitatif (angka-angka) tentang kemajuan belajar peserta didik (learning
progress), sedangkan evaluasi dan penilaian lebih bersifat kualitatif. Di
samping itu, evaluasi dan penilaian pada hakikatnya merupakan suatu
proses membuat keputusan tentang nilai suatu objek. Keputusan penilaian
43
(value judgement) tidak hanya didasarkan kepada hasil pengukuran
(quantitative description), tetapi dapat pula didasarkan kepada hasil

Evaluasi
Penilaia
Pengukur
Tes dan Non
Tes
Gambar : Hubungan Evaluasi, Penilaian, Pengukuran

pengamatan dan wawancara (qualitative description). Untuk lebih


jelasnya, Anda dapat memperhatikan gambar berikut ini.

Tabel : Gambaran Pengukuran, Penilaian dan Evaluasi

KKM Penguk Penilaian Evaluasi Ket


Jawaban uran
Nama
No Ben
Siswa
Sala ar
h
1 Lia 75 4 16 16 80(sangat Lulus/tuntas Pengayaan
baik
2 Ade 75 6 14 14 60 (baik) Tidak lulus/tidak Remedial
tuntas
3 Bayu 75 2 18 18 85 Lulus/tuntas Pengayaan
(sangat
baik)
4 Dona 75 3 17 17 75 (baik) Lulus / tuntas Pengayaan
Tidak lulus / tidak
5 Bona 75 7 13 13 55 (baik) Remedial
tuntas
6 Rika 75 1 19 19 95 Lulus /Tuntas Pengayaan
(sangat
baik)
50 Tidak lulus / tidak Remedial
7 Suci 75 10 10 10 (kurang tuntas
baik)
100 Lulus / tuntas Pengayaan
8 Fitra 75 0 20 20 (sangat
baik)
20 Tidak lulus / tidak Remedial
9 Tari 75 16 4 4 (Kurang tuntas
baik)

44
10 Yuni 75 3 17 17 80 Lulus / tuntas Pengayaan
(sangat
baik)
Keterangan:
Di bawah 55 = kurang
Antara 56 – 79 = baik
Di atas 80 = sangat baik

Berdasarkan hasil di atas terlihat terdapat kolom jawab siswa yang


benar dan salah. Kemudian terdapat kolom pengukuran yang berisi angka –
angka dimana angka tersebut sama persis dengan angka yang terdapat
dalam kolom jawaban benar. Artinya, sebuah pengukuran dapat berupa skor
yang di dapat ketika tes berlangsung. Berikutnya coba anda lihat kolom
Penilaian, yang berisikan nilai dengan kategori yang di dalam kurung. Nilai
yang diperoleh dari masing – masing siswa merupakan pengolahan dari skor
pengukuran yang didapat. Karena soal tes 20 maka rumus penilaiannya
!"#$
berbentuk, 𝑁𝑖𝑙𝑎𝑖 = %&
𝑥100.Dalam tahapan penilaian ini, umumnya

dibarengi dengan kategori penilaian atau pemaknaan atau pemberian arti


dari angka – angka yang didapat tersebut. Tanpa adanya pemberian arti,
tahapan penilaian akan mengalami kekosongan makna. Pada kolom evaluasi
dapat dilihat bahwa di sana sudah terjadi sebuah keputusan. Keputusan yang
diambil dalam kolom ini berdasarkan pada nilai KKM yang telah ditetapkan
sebelumnya oleh guru, yaitu 75. Seperti halnya definisi tahapan evaluasi
yang mengisyaratkan bahwa sebuah keputusan yang diambil pada tahapan
ini harus didasarkan pada sebuah kriteria.

2. Subjek dan Objek Evaluasi


A. SUBJEK EVALUASI
Seseorang yang melakukan pekerjaan penilaian disebut dengan
subjek evaluasi. Ada pandangan lain yang disebut dengan subjek evaluasi

45
adalah siswa, yakni orang yang dievaluasi. Pandangan lain mengklafikasikan
siswa sebagai objek evaluasi dan guru sebagai subjeknya. Hal ini terjadi
dalam kegiatan evaluasi pendidikan di mana sasaran evaluasinya adalah
prestasi belajar, maka subyek evaluasinya adalah guru atau dosen yang
mengasuh mata pelajaran tertentu. Jika evaluasi yang dilakukan itu
sasarannya adalah sikap peserta didik, maka subyek evaluasinya adalah
guru atau petugas yang sebelum melaksanakan evaluasi tentang sikap itu,
terlebih dahulu telah memperoleh pendidikan atau latihan megenai cara-cara
menilai sikap seseoarang. Jika sasaran yang dievaluasi kepribadian peserta
didik, di mana pengukuran tentang kepribadian itu dilakukan dengan
menggunakan instrument berupa tes yang sifatnya baku, maka subyek
evaluasinya adalah seorang psikolog, karena psikolog merupakan seseorang
yang memang telah dididik untuk menjadi tenaga ahli yang professional di
bidang psikologi.
1. OBJEK EVALUASI
Objek atau sasaran penilaian adalah segala sesuatu yang menjadi titik pusat
pengamatan karena penilaian menginginkan informasi tentang sesuatu
tersebut.Sasaran penilaian untuk unsure-unsur meliputi:
• Input
Input adalah mentah yang dimasukkan ke dalam transformasi. Dalam
dunia sekolah maka yang dimaksud dengan bahan mentah adalah calon
siswa yang baru akan memasuki sekolah. Sebelum memasuki suatu
tingkat sekolah (institusi), calon siswa itu dinilai dahulu kemampuannya.
Dengan penilaian itu ingin diketahui apakah kelak ia akan mampu
mengikuti peajaran dan melaksanakan tugas-tugas yang akan diberikan
kepadanya.
• Output

46
Yang dimaksud sebagai output atau keluaran adalah bahan jadi yang
dihasilkan oleh transformasi. Yang dimaksud dalam pembicaraan ini
adalah siswa lulusan sekolah yang bersangkutan. Unuk dapat
menentukan apakah seorang siswa berhak lulus atau tidak, perlu
diadakan kegiatan penilaian, sebagai alat penyaring kualitas.

Transformasi
Input Output

Umpan Balik

• Transformasi

Transformasi dapat diibaratkan sebagai sebuah mesin yang


berproses mengubah bahan mentah menjadi sesuatu agar berada dalam
keadaan matang. Menurut kamus Inggris-Indonesia, kata transform terdiri
dari dua kata, trans (terjemahan-perubahan) dan form (bentuk). Jadi
transformasi dalam pembelajaran diartikan sebagai proses pergantian atau
perubahan bentuk. Dengan kata lain, transformasi adalah sebuah proses
pengubahan bentuk atau pengeolahan sesuatu agar berubah menjadi bentuk
lain. Transformasi yang sedang kita bicarakan ini adalah transformasi dalam
arti umum sebagaimana yang dipahami oleh umum, yaitu pergantian bentuk
antar sebelum dan sesudah mengikuti kegiatan di sebuah lembaga
pendidikan. Siswa yang sedang belajar diumpamakan sesuatu yang
dimasukkan ke dalam pemrosesan untuk diubah dari “belum tahu atau belum
dapat” agar menjadi “sudah tahu atau sudah dapat”.

47
Ketika siswa pertama masuk sekolah, keadaannya masih “mentah”,
yang akan diubah atau diproses agar menjadi matang. Dalam istilah
transformasi, bahan mentah yang akan diolah tersebut dikenal sebagai
“masukan”, yang dalambahasa Inggrisnya disebut input. Bahasa Inggrisnya
raw input. Sesudah diolah dan berubah bentuk menjadi matang, lalu
dikeluarkan dari aat transformasi disebut keluaran,dalambahasa Inggris
adalah output. Dalam keseluruhan transformasi, sebetulnya output saja
belum mencerminkan keluaran yang sesungguhnya. Ibarat dalam kelulusan,
nilai siswa baik semua, bahkan mungkin cumlaude (lulus dengan pujian),
tetapi masih diragukan, apakah nilai yang bagus tersebut sudah
mencerminkan kinerja yang bagus di masyarakat atau tidak. Untuk contoh,
nilai siswa lulusan Sekolah Menengah Kejuruan Teknik Otomotif semua 8
bahkan 9, tetapi ketika diserahi sepeda motor rusak,tidak dapat menemukan
apa penyebabnya. Siswa ini outputnya baik, tetapi tidak dapat menunjukkan
kemampuannya dalam praktek. Kemampuan melaksanakan tugas di
lapangan ini disebut keluaran nyata atau outcome. Jadi harapan lembaga
pendidikan, siswa bukan hanya mempunyai nilai output baik, tetapi
outcomenya harus baik.

Dalam proses transformasi, selain siswa sebagai bahan yang


diolah,masih ada 2 (dua) masukan lain. Yang pertama berfungsi membantu
atau memperlancar terjadinya proses, sedangkan yang kedua berupa
lingkungan yang berpengaruh terhadap terjadinya proses. Masukan-
masukan lain tersebut juga disebut input, tetapi berbeda peran. Agar tidak
kacau dalam mengartikan, karena stautusnya berbeda, namanya pun
berbeda.

48
a. Siswa yang akan diubah dalam proses, yang akan diubah dari mentah
menjadi matang, disebut “masukan mentah”, yang daam bahasa Inggris
disebut raw input.
b. Masukan pendukung terjadinya proses ini disebut masukan instrumental.
Faktor-faktor yang termasuk dalam masukan instrumental ada 4 (empat),
yaitu (1) guru, (2) materi, (3) sarana pendidikan, dan (4) pengelolaan,
manajemen, atau pengaturan. Keempat masukan tersebut karena
fungsinya membantu atau sebagai alat, disebut “masukan
instrumental”,atau masukan pembantu. Dalam bahasa Inggris disebut
instrumental input.
c. Masukan lain lagi adalah lingkungan, baik berupa benda, alam, mapun
manusia. Masukan lingkungan ini dalam bahasa Inggris disebut
environmental input.

Program Pemrosesan Pembelajaran

Guru Materi Sarana Pengelolaan

Siswa Proses Hasil

Lingkungan

2. Prinsip-prinsip Dasar Evaluasi Hasil Belajar


Evaluasi hasil belajar dapat dikatakan sudah baik pelaksanaannya
jika sudah terdapat tiga prinsip dasar yaitu, prinsip Keseluruhan
(comprehensive), dimana evalauasi hasil belajar harus dilakukan secara utuh

49
dan menyuluruh, tidak boleh dilakukan secara terpisah dan setengah-
setengah. Dengan demikian maka akan diperoleh suatu informasi mengenai
perkembangan subyek didik yang sedang dinilai. Kemudian yang kedua ada
prinsip Kesinambungan (continuity), disini dijelaskan bahwa evaluasi hasil
belajar yang baik merupakan evaluasi yang dilakukan secara teratur atau
berkesinambungan dari waktu ke waktu dimana evaluator akan bisa
memperoleh informasi mengenai perkembangan peserta didik dari awal
hingga akhir. Sehingga nantinya evaluator akan dapat menentukan langkah-
langkah selanjutnya yang harus diambil agar Indikator pembelajaran dapat
tercapai. Lalu yang ketiga ada prinsip Obyektivitas (obyectivity), dimana
evaluasi hasil belajar dikatakan baik jika sudah terlepas dari faktor subyektif,
karena faktor tersebut dapat
menodai pekerjaan evaluasi atau penilaian tersebut.
Menurut Arikunto (2012) menyebutkan bahwa prinsip umum dan
penting dalam kegiatan evaluasi, yaitu adanya triagulasi atau hubungan erat
tiga komponen, yaitu:
a) Tujuan pembelajaran
b) Kegiatan pembelajaran atau KBM
c) Evaluasi
Triagulasi tersebut dapat digambarkan dalam gambar sebagai berikut.

Tujuan

KBM Evalua

50
Triagulasi ini memiliki hubungan terkait. Penjelasan mengenai hubungan
tersebut sebagai berikut.
a. Hubungan antara Tujuan dengan KBM
Kegiatan belajar mengajar yang direncanakan dalam bentuk
rencana mengajar disusun oleh guru dengan mengacu pada tujuan yang
hendak dicapai. Dengan demikian, anak panah yang menunjukkan antara
keduanya mengarah pada tujuan dengan makna bahwa KBM mengacu pada
tujuan, tetapi juga mengarah dari tujuan ke KBM, menunjukkan langkah dari
tujuan dilanjutkan pemikiran ke KBM.
b. Hubugan antara Tujuan dengan Evaluasi
`Evaluasi adalah kegiatan pengumpulan data untuk mengukur
sejauh mana tujuan sudah dicapai. Dengan makna demikian maka anak
panah berasal dari evaluasi menuju ke tujuan. Di sisis lain, jika dilihat dari
langkah, dalam menyusun alat evaluasi ia mengacu pada tujuan yang sudah
dirumuskan.
c. Hubungan antara KBM dengan Evaluasi
Seperti yang sudah disebutkan dalam nomor (1), KBM dirancang
dan disusun dengan mengacu pada tujuan yang telah dirumuskan. Telah
disebutkan pula dalam nomor (2) bahwa alat evaluasi juga disusun dengan
mengacu pada tujuan. Selanjutnya mengacu pada tujuan, evaluasi juga
harus mengacu atau disesuaikan dengan KBM yang dilaksanakan. Sebagai
hasil, jika kegiatan belajar mengajar dilakukan oleh guru dengan
menitikberatkan pada keterampilan, evaluasinya juga harus mengukur tingkat
keterampilan siswa. Bukannya aspek pengetahuan. Kecenderungan yang
terdapat dalam praktek sekarang ini adalah bahwa evaluasi hasil belajar
hanya dilakukan denga tes tulis, menentukan aspek pengetahuan saja. Hal-
hal yang berkaitan dengan aspekaspek lain, kurang mendapat perhatian

51
dalam evaluasi saat ini. Selanjutnya pada bab berikut akan dijelaskan
beberapa alat evaluasi berupa tes dan bukan tes (nontes).
3. Alat Evaluasi

Dalam pengertian umum, alat adalah sesuatu yang dapat digunakan


untuk mempermudah seseorang untuk melaksanakan tugas atau mencapai
tujuan secara lebih efektif dan efisien. Kata “alat” biasa disebut juga dengan
istilah “instrument”.Dengan demikian alat evaluasi juga dikenal dengan
instrument evaluasi. Dengan pengertian tersebut maka alat evaluasi
dikatakan baik apbila mampu mengevaluasi sesuatu yang dievaluasi
dengan hasil seperti keadaan yang dievaluasi.Dalam menggunakan alat
tersebut evaluator menggunakan cara atau teknik, dan oleh karena itu
dikenal dengan teknik evaluasi. Seperti disebutkan di atas, ada 2 teknik
evaluasi, yaitu teknik nontes dan teknik tes.
a) Teknik nontes
Yang tergolong teknik nontes adalah:
Ø Skala bertingkat merupakan salah satu alat penilaian yang
menggunakan skala yang telah disusun dari ujung yang negatif
sampai kepada ujung yang positif sehingga pada skala tersebut
penilai tinggal membubuhi tanda cek saja (V).
Ø Kuesioner (questionair) dikenal sebagai angket. Pada dasarnya,
kuesioner adalah sebuah daftar pertanyaan yang harus diisi oleh
orang yang akan diukur (responden).
Ø Daftar cocok (check list) adalah deretan pertanyaan (yang biasanya
singkatsingkat), dimana responden yang dievaluasi tinggal
membutuhkan tanda cocok (v) ditempat yang sudah disediakan.
Ø Wawancara (interview) adalah suatu metode atau cara yang
digunakan untuk mendapatkan jawaban dari responden dengan jalan
52
tanya jawab sepihak. Dikatakan sepihak karena dalam wawancara ini
responden tidak diberi kesempatan sama sekali untuk mengajukan
pertanyaan. Pertanyaan hanya diajukan oleh subjek evaluasi.
Ø Pengamatan observasi adalah suatu teknik yang dilakukan dengan
cara mengadakan pengamatan secara teliti serta pencatatan secara
sistematis.
Ø Riwayat hidup adalah gambaran tentang keadaan seseorang selama
dalam masa kehidupannya.
b) Teknik tes
Ada bermacam-macam rumusan tentang tes. Didalam bukunya
yang berjudul evaluasi pendidikan, Drs. Amir Daien Indrakusuma
mengatakan demikian: “Tes adalah suatu alat atau prosedur yang sistematis
dan objektif untuk memperoleh data-data atau keterangan-keterangan yang
diinginkan tentang seseorang, dengan cara yang boleh dikatakan tepat dan
cepat’’ Selanjutnya, di dalam bukunya: Teknik-Teknik Evaluasi, Muchtar
Bukhori mengatakan: “Tes ialah suatu percobaan yang diadakan untuk
mengetahui ada atau tidaknya hasil-hasil pelajaran tertentu pada seorang
murid atau kelompok murid”. Definisi terakhir yang dikemukakan disini
adalah definisi yang dikutip dari webster’s Collegiete. Tes adalah serentetan
pertanyaan atau latihan atau alat lain yang digunakan untuk mengukur
keterampilan, pengetahuan, inteligensi, kemampuan atau bakat yang dimiliki
oelh individu dan kelompok.
Ditinjau dari segi kegunaan untuk mengukur siswa, maka
dibedakan atas adanya 3 macam tes, yaitu;
1. Tes diagnostik

53
Tes diagnostik adalah tes yang digunakan untuk mengetahui kelemahan-
kelemahan siswa sehingga berdasarkan kelemahan-kelemahantersebut
dapat dilakukan pemberian perlakuan yang tepat.
2. Tes formatif
Dari arti kata form yang merupakan dasar dari istilah formatif maka
evaluasi formatif dimaksudkan untuk mengetahui sejauh mana siswa telah
terbentuk setelah mengikuti sesuatu program tertentu. Tes ini merupakan
posttest atau tes akhir proses. Evaluasi formatif mempunyai manfaat, baik
bagi siswa, guru, maupun program itu sendiri.
Manfaat bagi siswa :
a. Digunakan untuk mengetahui apakah siswa sudah menguasai bahan
program secara menyeluruh.
b. Merupakan penguatan bagi siswa.
c. Usaha perbaikan.
d. Sebagai diagnosis.
Manfaat bagi guru :
a. Mengetahui sampai sejauh mana bahan yang diajarkan sudah dapat
diterima oleh siswa. Hal ini akan menetukan pula apakah guru itu
harus mengganti cara menerangkan(strategi mengajar) atau tetap
dapat menggunakan cara(strategi) yang lama.
b. Mengetahui bagian-bagian mana dari bahan pelajaran yang belum
menjadi milik siswa. Apabila bagian yang belum dikuasai kebetulan
merupakan bahan prasyarat bagi bagian pelajaran yang lain, maka
bagian itu harus diterangkan lagi, dan barangkali memerlukan cara
atau media lain untuk memperjelas. Apabila bahan ini tidak diulangi,
makaakan mengganggu kelancaran pemberian bahan pelajaran
selanjutnya, dan siswa akan semakintidak dapat menguasainya.

54
c. Dapat meramalkan sukses dan tidaknyaseluruh program yang akan
diberikan.

Manfaat bagi program:


a. Apakah program yang telah diberikan merupakan program yang
tepat dalam arti sesuai dengan kecakapan anak.
b. Apakah program tersebut membutuhkan pengetahuan-pengetahuan
prasyarat yang belum diperhitungkan,
c. Apakah diperlukan alat, sarana, dan prasarana untuk mempertinggi
hasil yang akan dicapai, dan
d. Apakah metode, pendekatan, dan alat evaluasi yang digunakan
sudah tepat.
Hal – hal yang perlu diperhatikan dalam pemakaian evaluasi formati yaitu:
Ø Penilaian dilakukan pada akhir setiap satuan pelajaran.
Ø Penilaian formatif bertujuan mengetahui sejauh mana tujuan
instruksional khusus (TIK) pada setiap satuan pelajaran yang telah
tercapai.
Ø Penilaian formatif dilakukan dengan mempergunakan tes hasil
belajar, kuesioner, ataupun cara lainnya yang sesuai.
Ø Siswa dinilai berhasil dalam penilaian formatif apabila mencapai taraf
penguasaan sekurang-kurangnya 75% dari tujuan yang ingin dicapai.
3. Tes sumatif
Evaluasi sumatif atau tes sumatif dilaksanakan setelah berakhirnya
pemberian sekelompok program atau sebuah program yang lebih
besar. Dalam pengalaman disekolah, tes formatif dapat disamakan
dengan ulangan harian, sedangkan tes sumatif ini dapat disamakan

55
dengan ulangan umum yang biasanya dilaksanakan pada tiap akhir
caturwulan atau akhir semester.
Manfaat tes sumatif :
a. Untuk menentukan nilai.
b. Untuk menentukan seseorang anak dapat atau tidaknya mengikuti
kelompok dalam menerima program berikutnya.
c. Untuk mengisi catatan kemajuan belajar siswa yang akan berguna
bagi :
Ø Orang tua siswa
Ø Pihak bimbingan dan penyuluhan disekolah
Ø Pihak-pihak lain apabila siswa tersebut akan pindah kesekolah
lain, akan melanjutkan belajar atau akan memasuki lapangan
kerja.

Hal-hal yang perlu diperhatikan dalam pemakaian evaluasi sumatif :


ü Siswa dinilai berhasil dalam mata pelajaran tertentu selama satu
semester apabila nilai rapor mata pelajaran tersebut sekurang-
kurangnya 6 (enam).
ü Penilaian sumatif (subsumatif) dilakukan dengan mempergunakan tes
hasil belajar, kuesioner ataupun cara lainnya yang sesuai dengan
menilai ketiga ranah yakni kognitif, afektif, dan psikomotor.
ü Hasil penilaian sumatif (subsumatif) dinyatakan dalam skala nilai 0 –
10.
4. Tes formatif dan tes sumatif dalam praktek
Dalam pelaksanaannya disekolah tes formatif ini merupakan
ulangan harian, sedangkan tes sumatif biasa kita kenal sebagai ulangan
umum yang diadakan pada akhir catur wulan atau akhir semester. Disekolah-

56
sekolah tes sumatif ada yang disamakan antara satu daerah atau wilayah
administrative, dan dikenal sebagai THB (tes hasil belajar),TPB (tes prestasi
belajar ) atau istilah lain lagi. Seperti adanya efek positif dan negatif atas
dihapuskannya ujian Negara menjadi ujian sekolah, maka tes sumatif
bersama (THB atau TPB) ini mempunyai kebaikan dan keburukan.
Kebaikan THB bersama :
ü Pihak atasan atau pengelola sekolah-sekolah dapat membandingkan
kemajuan sekolah-sekolah yang ada diwilayahnya.
ü Karena dibandingkan antara sekolah yang satu dengan sekolah yang
lain, maka akan timbul persaingan sehat antar sesamanya.
ü Standar pelajaran akan terpelihara dengan sebaik-baiknya karena soal-
soal tes yang diberikan disusun oleh dinas Pendidikan.
Keburukan THB bersama :
ü Ada kemungkinan akan terjadi pemberian pelajaran yang hanya
berorientasi pada “ujian” dengan cara memberikan latihan mengerjakan
soal yang sebanyak-banyaknya.
ü Tidak menghiraukan jika terjadi beberapa bentuk kecurangan karena
ada sekolah yang ingin mendapat nama baik.

4. Pendekatan Dalam Penilaian Hasil Belajar

Di atas telah dikemukakan bahwa hasil pengukuran dapat


diperbandingkan terhadap berbagai jenis patokan (pembanding). Untuk
jelasnya, usaha pembandingan itu, yaitu usaha penilaian, perlu dikaji dan
dimengerti lebih lanjut, terutama sekali yang menyangkut pendekatan yang
paling sering dipakai di lembaga-lembaga pendidikan. Dalam bagian ini
hanya diuraikan pendekatan penilaian yang membandingkan orang-orang
lain dalam kelompoknya, yaitu yang dinamakan penilaian Acuan Norma
57
(Norm-Referenced-Evaluation), dan pendekatan penilaian yang
membandingkan hasil pengukuran seseorang dengan patokan “batas lulus”
yang telah ditetapkan, yaitu yang dinamakan penilaian Acuan patokan
(Criterion Referenced Evaluation).

1. Penilaian Acuan Norma (PAN)

Secara singkat dapat dikatakan bahwa PAN ialah penilaian yang


membandingkan hasil belajar siswa terhadap hasil siswa lain dalam
kekompoknya. Pendekatan penilaian ini dapat dikatakan sebagai
pendekatan “apa adanya”, dalam arti, bahwa patokan pembanding semata-
mata diambil dari kenyataan-kenyataan yang diperoleh pada saat
pengukuran/penilaian itu berlangsung, yaitu hasil belajar siswa yang diukur
itu beserta pengolahannya. Penilaian ini sama sekali tidak dikaitkan dengan
ukuran-ukuran ataupun patokan yang terletak luar hasil-hasil pengukuran
sekelompok siswa. Pan pada dasarnya mempergunakan kurve normal dan
hasil-hasil penghitungannya sebagai dasar penilaian. Kurve ini dibentuk
dengan mengikutsertakan semua angka hasil pengukuran yang diperoleh.
Dua kenyataan yang ada di dalam “kurve normal” yang dipakai untuk
membandingkan atau menafsirkan angka yang diperoleh masing-masing
siswa ialah angka rata-rata (mean) dan angka simpangan baku (standard
deviation). Dapat dimengerti bahwa patokan ini bersifat relatif, bisa bergeser
ke atas atau ke bawah, sesuai dengan besarnya dua kenyataan yang
diperoleh di dalam kurve itu. Dengan kata lain, patokan itu bisa berubah-ubah
dari “kurve normal” yang satu ke “kurve normal” yang lain. Ujian siswa dalam
suatu kelompok pada umumnya naik, yaitu sebagaimana terlihat dari angka-
angka hasil pengukuran yang pada umumnya lebih baik dan yang
menghasilkan angka rata-rata yang lebih tinggi, maka patokan menjadi

58
bergeser ke atas (dinaikkan), sebaliknya, jika hasil ujian kelompok itu pada
umumnya merosot, patokannya bergeser ke bawah (diturunkan). Dengan
demikian, angka yang sama pada dua kurve yang berbeda akan mempunyai
arti yang berbeda. Demikian juga, nilai yang sama yang dihasilkan melalui
bangunan dua kurve yang berbeda akan mempunyai arti umum yang
berbeda pula.

2. Penilaian Acuan Patokan (PAP)

PAP pada dasarnya berarti penilaian yang membandingkan hasil


belajar siswa terhadap suatu patokan yang telah ditetapkan sebelumnya.
Pengertian ini menunjukkan bahwa sebelum usaha penilaian dilakukan
terlebih dahulu harus ditetapkan patokan yang akan dipakai untuk
membandingkan angka-angka hasil pengukuran agar hasil itu mempunyai
arti tertentu. Dengan demikian, patokan ini tidak dicari-cari di tempat lain dan
pula tidak dicari di dalam sekelompok hasil pengukuran sebagaimana
dilakukan pada PAN. Patokan yang telah ditetapkan terlebih dahulu itu
biasanya disebut “batas lulus” atau “tingkat penguasaan minimum”. Siswa
yang dapat mencapai atau bahkan melampaui batas ini dinilai “lulus” dan
yang belum mencapainya dinilai “tidak lulus”. Mereka yang lulus ini
diperkenankan menempuh pelajaran yang lebih tinggi, sedangkan yang
belum lulus diminta memantapkan lagi kegiatan belajarnya sehingga
mencapai “batas lulus” itu.

Dapat dimengerti bahwa patokan yang dipakai di dalam PAP bersifat


tetap. Patokan ini dapat dipakai untuk kelompok siswa yang mana saja yang
memperoleh pengajaran yang sama. Dengan patokan yang sama ini
pengertian yang sama untuk hasil pengukuran yang diperoleh dari waktu ke
waktu oleh kelompok yang sama ataupun berbeda-beda dapat
59
dipertahankan. Suatu hal yang biasa menjadi hambatan dalam penggunaan
PAP adalah sukarnya menetapkan patokan. Hampir tidak pernah dapat
ditetapkan patokan yang benar-benar tuntas.

3. Penggunaan PAN dan PAP


Disebutkan bahwa untuk setiap jenis dan jenjang program pendidikan
di sekolah tersedia berbagai mata pelajaran dalam setiap semester. Dalam
rangka usaha penilaian, pendekatan manakah yang dapat dipakai untuk
suatu mata pelajaran tertentu? Pendekatan PAN dapat dipakai untuk semua
mata pelajaran, dari mata pelajaran yang paling teoritis (penuh dengan materi
kognitif) sampai ke mata pelajaran yang paling praktis (penuh dengan materi
keterampilan). Angkaangka hasil pengukuran yang menyatakan penguasaan
kompetensi-kompetensi kognitif, keterampilan, dan bahkan sikap yang
dimiliki atau dicapai oleh sekelompok siswa sebagai hasil dari suatu
pengajaran, dapat dikurvekan. Dalam pelaksanaannya dapat ditempuh
prosedur yang sederhana. Setelah pengajaran diselenggarakan, kelompok
siswa yang menerima pengajaran tersebut menjawab soal-soal atau
melaksanakan tugas-tugas tertentu yang dimaksudkan sebagai ujian.
Hasil ujian ini diperiksa dan angka hasil pemeriksaan diberikan untuk
masingmasing siswa dan selanjutnya angka tersebut disusun dalam bentuk
kurve. Kurve dan segala hasil perhitungan yang menyertainya (terutama
angka rata-rata dan simpangan baku dapat segera dipakai dalam rangka
PAN). Pendekatan PAP tidak berorientasi pada “apa adanya”. Pertama,
pendekatan ini tidak semata-mata mempergunakan angka rata-rata yang
dihasilkan oleh kelompok yang diuji, melainkan telah terlebih dahulu
menetapkan kriteria keberhasilan, yaitu “batas lulus” penguasaan bahan
pelajaran. Siswa yang telah mencapai batas ini dianggap telah berhasil dalam
belajar dan diperkenankan mempelajari bahan pelajaran yang lebih tinggi,
60
sedangkan yang belum mencapai batas tersebut dianggap belum berhasil
dan diharuskan memantapkan kembali pelajarannya itu. Kedua, dalam
proses pengajaran, tenaga pengajar tidak begitu saja membiarkan siswa
menjalani sendiri proses belajarnya, melainkan terusmenerus secara
langsung ataupun tidak langsung merangsang dan memeriksa kemajuan
belajar siswa serta membantunya melewati tahap-tahap pengajaran secara
berhasil.
Sesuai dengan ciri utama PAP, pendekatan ini menuntut usaha yang
lebih terarah dan terencana sejak sebelum, selama dan seusai
penyelenggaraan pengajaran. Sejak sebelum pengajaran dimulai tenaga
pengajar harus telah menetapkan kriteria keberhasilan yang harus dicapai
oleh siswa jika dia ingin lulus dalam mata pelajaran tertentu. Apabila hal ini
dihubungkan dengan pokok-pokok pikiran tentang belajar untuk penguasaan
kompetensi, dapat dikatakan bahwa kriteria keberhasilan ini harus dikaitkan
pada penguasaan kompetensi tertentu oleh siswa sebagai hasil belajarnya.
Bagaimana mengkaitkan kedua hal ini merupakan usaha yang teramat
penting yang perlu dilakukan oleh tenaga pengajar sebelum memulai
pengajaran jika dia hendak melaksanakan PAP

EVALUASI BAB II

PILIHAN BERGANDA

1. Adanya kegiatan membandingkan dengan ukuran tertentu dapat


berupa ukuran baku atau standar, merupakan salah satu ciri khas
dari.....
a. Penilaian
b. Pengukuran

61
c. Pengkritikan
d. Penyampaian argumen
e. Evaluasi
2. Penilaian tidak hanya ditujukan pada penguasaan salah satu bidang
tertentu saja, tetapi bersifat menyeluruh yang mencakup aspek....
a. Pengetahuan
b. Keterampilan
c. Sikap
d. Nilai-nilai
e. Semua jawaban benar
3. Penilaian adalah suatu proses untuk memperoleh informasi yang
digunakan untuk membuat keputusan tentang peserta didik,
kurikulum, program, dan kebijakan pendidikan. Pernyataan tersebut
dikemukakan oleh....
a. Anthony J.Nitko (1996)
b. Ahmann dan Glock dalam Hasan(1988)
c. Arikunto (2006)
d. Djaali (2004)
e. Suryanto (2009)
4. Dalam hubungannya dengan proses dan hasil belajar, penilaian dapat
didefinisikan sebagai suatu proses atau kegiatan yang sistematis dan
berkesinambungan untuk mengumpulkan informasi tentang proses dan
hasil belajar peserta didik dalam rangka membuat keputusan-
keputusan berdasarkan kriteria dan pertimbangan tertentu. Jika dilihat
dalam konteks yang lebih luas, keputusan tersebut dapat menyangkut
62
keputusan tentang peserta didik. Keputusan tentang peserta didik
meliputi, kecuali....
a. Pengelolaan pembelajaran
b. Penempatan peserta didik sesuai dengan jenjang atau jenis
program pendidikan
c. Tingkat percaya diri dan pemahaman
d. Bimbingan dan konseling
e. Menyeleksi peserta didik untuk pendidikan lebih lanjut
5. kegiatan untuk mengumpulkan informasi hasil belajar siswa yang
diperoleh dari berbagai jenis tagihan dan mengolah informasi tersebut
untuk menilai hasil belajar dan perkembangan belajar siswa yang
dikemukakan oleh Suryanto (2009) disebut....
a. Penilaian
b. Pengukuran
c. Pemahaman
d. Penyampaian argumen
e. Evaluasi
6. Dalam dunia pendidikan, khususnya dunia persekolahan, penilaian
mempunyai makna ditinjau dari berbagai segi, yakni meliputi...
a. Makna bagi orang tua, anak, dan keluarga
b. Makna bagi teman, guru, dan lingkungan sekolah
c. Makna bagi orang tua, siswa, dan sekolah
d. Makna bagi siswa, guru, dan sekolah
e. Makna bagi siswa, guru, dan orang tua

63
7. Dengan mengetahui makna penilaian ditinjau dari berbagai segi dalam
sistem pendidikan, maka dari itu terdapat beberapa tujuan atau fungsi
penilaian, yaitu....
a. Penilaian berfungsi selektif
b. Penilaian berfungsi diagnostik
c. Penilaian berfungsi sebagai penempatan
d. Penilaian berfungsi sebagai pengukur keberhasilan
e. Semua jawaban benar
8. Penilaian itu sendiri mempunyai berbagai tujuan, antara lain :
1) Untuk memilih siswa yang dapat diterima di sekolah tertentu.
2) Untuk memilih siswa yang dapat naik kelas atau tingkat
berikutnya.
3) Untuk memilih siswa yang seharusnya mendapat beasiswa.
4) Untuk memilih siswa yang sudah berhak meninggalkan sekolah

Tujuan penilaian diatas merupakan tujuan dari....

a. Penilaian berfungsi selektif


b. Penilaian berfungsi diagnostik
c. Penilaian berfungsi sebagai penempatan
d. Penilaian berfungsi sebagai pengukur keberhasilan
e. Semua jawaban salah
9. kegiatan/proses pengambilan keputusan terhadap sesuatu tujuan
pembelajaran yang mengacu kepada kriteria yang telah ditetapkan
sebelumnya (dalam hal ini dapat berupa Kriteria Ketuntasan Minimal atau
KKM disebut....

64
a. Penilaian
b. Pengukuran
c. Pemahaman
d. Penyampaian argumen
e. Evaluasi
10. Perhatikan gambar dibawah ini.

Transformasi
Input Output

Umpan Balik

Gambar diatas merupakan....

a. Sasaran Penilaian didalam objek evaluasi


b. Sasaran pengukuran didalam objek evaluasi
c. Sasaran pemahaman didalam objek evaluasi
d. Sasaran penyampaian argumen/pendapat didalam objek evaluasi
e. Semua jawaban salah

ESSAY

1. Coba Anda jelaskan apa yang dimaksud dengan evaluasi. Berikan


contohnya.
2. Bagaimana hubungan antara tes, pengukuran dan penilaian? Coba
Anda buat ilustrasi sendiri
3. Mengapa evaluasi mempunyai kedudukan yang sangat vital dan strategis
dalam pembelajaran ? Jelaskan dengan singkat !
65
4. Jelaskan secara singkat manfaat tes formatif bagi guru dan siswa!
5. Jelaskan dengan bahasamu sendiri apa saja yang diperlukan dalam
pemakaian evuluasi sumatif.
6. Coba Anda jelaskan dengan bahasa anda sendiri kebaikan dan
keburukan THB bersama. Berikan contohnya.
7. Jelasakan secara singkat mengenai prinsip dasar evaluasi hasil belajar.
8. Seorang guru mengadakan ulangan harian kepada siswa-siswanya.
Setelah beberapa kali ulangan diperoleh nilai rapor. Pada waktu
kenaikan kelas, kepada siswa-siswa “pandai” diberi hadiah secara
bertingkat menurut urutan prestasinya sedangkan kepada siswa-siswa
yang “tidak naik”, diberi nasihat.
a) Coba pisahkan, manakah pekerjaan mengukur dan manakah
pekerjaan menilai!
b) Dapatkah kita mengategorikan anak yang “tidak naik” ini sebagai anak
“bodoh”? beri alasan!
9. Apabila masukan siswa yang diterima dalam suatu sekolah tergolong
baik karena dari tes intelegensi diketahui demikian, dapatkah siswa
tersebut pada akhir tahun tidak naik kelas? Coba terangkan!
10. Berdasarkan makna penilaian ditinjau dari segi siswa, guru, dan sekolah,
baikkah kiranya jika guru memberikan ulangan tiap hari? Coba tinjaulah
dari berbagai segi tersebut, apa keuntungan dan kerugiannya!

66
Tujuan Kegiatan : Mahasiswa diharapkan dapat memahami konsep
evaluasi, penilaian dan pengukuran.
Petunjuk Kegiatan :

1. Bacalah materi berbagai sumber referensi.


2. Selesaikan pertanyaan-pertanyaan di bawah ini dengan benar.
3. Diskusikan di dalam kelompok.
4. Persentasikan hasil kerja anda.
5. Perbaiki hasil kerja anda jika ada kritik dan saran.
6. Buatlah “peta konsep” untuk pokok bahasan ini.

Pertanyaan :

1. Apa arti dari ukur dan nilai?


2. Apa arti pengukuran, penilaian, dan evaluasi?
3. Apa manfaat dari penilaian?
4. Prinsip-prinsip apa yang melandasi suatu penilaian dalam
pembelajaran?
5. Jelaskan karakteristik dan teknik penilaian!

67
6. Apa yang dapat anda jelaskan dari hasil keempat pertanyaan di
atas?

SELAMAT MENGERJAKAN

BAB III
JENIS DAN ALAT PENILAIAN

KOMPETENSI DASAR:
Setelah mengikuti kegiatan perkuliahan dari matakuliah
ini, diharapkan mahasiswa memiliki kompetensi dasar
yaitu akan mampu menjelaskan Jenis-jenis alat
penilaian, tahapan pembuatan dan penggunaan tes
tertulis

Setelah mengikuti kegiatan perkuliahan dari matakuliah


ini, diharapkan mahasiswa memiliki kompetensi dasar
INDIKATOR
yaitu akanKOMPETENSI:
mampu menjelaskan Jenis-jenis alat
penilaian, tahapan pembuatan dan penggunaan tes
Menjelaskan jenis alat penilaian;
a.tertulis
b. Menjelaskan tujuan tes
c. Menjelaskan kisi-kisi tes
d. Menjelaskan penulisan soal;
e.Setelah Setelah
Menjelaskan caramengikuti
meriview kegiatan perkuliahan
dan merevisi soal; dari
f. matakuliah
Menjelaskan ini,pengujicobaan
diharapkan soal;
mahasiswa memiliki
kompetensi dasar yaitu
g. Menjelaskan penyajian soal; akan mampu menjelaskan Jenis-
h.jenis alat
Menjelaskan penilaian, tahapan pembuatan dan
penskoran;
penggunaan tes tertulis hasil tes; dan
i. Menjelaskan pelaporan
j. Menjelaskan pemanfaatan hasil tes). 68
mengikuti kegiatan perkuliahan dari matakuliah ini,
diharapkan mahasiswa memiliki kompetensi dasar yaitu
akan mampu menjelaskan Jenis-jenis alat penilaian,
tahapan pembuatan dan penggunaan tes tertulis
Pengantar

Para ahli berpendapat bahwa dalam melakukan evaluasi


pembelajaran, kita dapat menggunakan teknik tes dan nontes, sebab
hasil belajar atau pembelajaran bersifat aneka ragam. Hasil belajar dapat
berupa pengetahuan teoritis, keterampilan dan sikap. Pengetahuan
teoritis dapat diukur dengan menggunakan teknik tes. Keterampilan
dapat diukur dengan menggunakan tes perbuatan. Adapun perubahan
sikap dan petumbuhan anak dalam psikologi hanya dapat diukur dengan
teknik nontes, misalnya observasi, wawancara, skala sikap, dan lain-lain.
Dengan kata lain, banyak proses dan hasil belajar yang hanya dapat diukur
dengan teknik nontes. Untuk itu, jika Anda di madrasah hanya
menggunakan teknik tes, tentu hal ini dapat merugikan peserta didik dan
orang tua. Teknik nontes digunakan sebagai suatu kritikan terhadap
kelemahan teknik tes..
1. Teknik Penilaian
Secara keseluruhan teknik dan bentuk penilain dapat digambar
sebagai berikut:

69
a. Pengertian Tes
Istilah tes diambil dari kata testum (Prancis) yangdiartikan sebagai
piringuntuk menyisihkan logam-logammulia. Ada pula yang menyebutkan
sebagai sebuah piring yang terbuat dari tanah. Sementara itu istilah

70
tespertama kali diperkenalakan oleh seorang ahli bernama James Ms. Cattel
pada tahun 1890 kepada khalayak umum melalui bukunya yang berjudul
”Mental Test and Measurement”. Kemudian berkembang di Amerika yang
selanjutnya secara berkesinambungan berkembang dengan tempo yang
pesat sampai saat ini. Pada buku karya Anas Sudijono, secara garis besar
Anas menyebutkan bahwa tes didefinisikan sebagai alat atau prosedur yang
dipergunakan dalam rangka pengukuran dan penilaian.
Beberapa istilah lain mengenai tes seperti testing, tester, testees
dan sebagainya memiliki definisi sendiri yang berbeda dengankonsep tes itu
sendiri. Kalau dikaitkan dengan evaluasipendidikan, tes adalah cara (yang
dapat dipergunakan) atau prosedur (yang perlu ditempuh) dalam
rangkapengukuran dan penilaian di bidang pendidikan, yangberbentuk
pemberian tugas atau serangkaian tugas(baik berupa pertanyaan-
pertanyaan (yang bisa dijawab), atau perintah-perintah (yang harus
dikerjakan)sehingga dapat dihasilkan nilai yang melambangkan tingkah laku.
Arikunto menyebutkan sebelum sampai kepada uraian yang lebih jauh,
dijelaskan terlebih dahuludijabarkan definisi dari beberapa istilah terkait
dengan tes, yaitu:
a. Tes
Tes merupakan alat atau prosedur yang digunakan untuk
mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan
aturan-aturan yang sudah ditentukan. Untuk mengerjakan tes tergantung dari
petunjuk yang memberikan misalnya: melingkari salah satu hurup di depan
pilihan jawaban, menerangkan, mencorat jawaban yang salah,melakukan
tugas atau suruhan, menjawab secara
lisan, dan sebagainya.
b. Testing

71
Testing merupakan saat pada waktu tes itu disampaikan atau
dilaksanakan. Atau dapat disederhanakan dengan maksud bahwa testing
adalah saat pengambilan tes.
c. Testee
Testee adalah responden yang sedang mengerjakan tes. Orang-orang inilah
yang akan dinilai atau diukur, baik mengenai kemampuan, akat, pencapaian,
dan sebagainya.
d. Tester
Tester merupakan orang yang diserahi untuk melaksanakan pengambilan tes
terhadap para responden. Dengan kata lain tester adalah subjek evaluasi
(tetapi adakalanya anya orang yang ditunjuk oleh subjek evaluasi untuk
melaksanakan tugasnya). Tugas tester antara lain:
1. Mempersiapkan ruangan dan perlengkapan yang diperlukan.
2. Membagikan lembaran tes dan alat-alat lain untuk mengerjakan tes.
3. Menerangkan cara mengerjakan tes.
4. Mengawasi responden mengerjakan tes.
5. Memberikan tanda-tanda waktu.
6. Mengumpulkan pekerjaan responden.
7. Mengisi berita acara atau laporan yang dilakukan (jika ada).
Dari beberapa istilah yang diatas, diharapkan akan mempermudah
pemahaman dalam pelaksanaan bentuk evaluasi dalam kegiatan
pembelajaran. Hal ini juga dapat mempermudah pemahaman pada bab
berikutnya yang akan lebih diperkaya dengan istilah-istilah tersebut. Untuk
itu, penting dipahaminya mengenai beberapaistilah yang dimaksudkan.
Secara umum, tes dapat dikerjakan secara tertulis dan secara lisan dapat
mencermati pembahasan berikut ini.
1. Tes Tertulis

72
Tes tertulis adalah tes yang dilakukan secara tertulis baik dalam hal soal
maupun jawabannya, namun tes yang disampaikan secara lisan dan
dikerjakan secara tertulis masih digolongkan ke dalam jenis tes tertulis.
Sebaliknya, tes yang soalnya diberikan dalam bentuk tulisan sedangkan
jawabannya berbentuk lisan tidak dapat dikategorikan ke dalam bentuk
tes tertulis.

2. Tes Lisan
Pada tes lisan, baik pertanyaan maupun jawaban (response) semuanya
dalam bentuk lisan. Karenanya, tes lisan relatif tidak memiliki rambu-
rambu penyelenggaraan tes yang baku, karena itu, hasil dari tes lisan
biasanya tidak menjadiinformasi pokok tetapi pelengkap dari instrumen
asesmen yang lain.
3. Tes Unjuk Kerja
Pada Tes ini peserta didik diminta untuk melakukan sesuatu sebagai
indikator pencapaian kompetensi yang berupa kemampuan psikomotor.
Jenis Tes Berdasarkan Cara Penyusunan
Berdasarkan kriteria ini, tes dapat dibedakan menjadi dua, yaitu (1) tes
buatan guru dan (2) ter terstandar.
a. Tes Buatan Guru (Teacher-made Test)
Saudara tentu mengetahui tugas-tugas utama yang harus diemban
oleh seorang guru. Untuk melakukan tugas evaluasi itu, seorang guru
harus mengembangkan alat ukur, salah satunya tes. Tes yang
dikembangkan sendiri oleh guru disebut tes buatan guru (teacher-
made test). Jadi tes buatan guru adalah tes yang dirancang dan
dipersiapkan oleh guru, tetap dengan mengacu pada karakteristik tes

73
yang baik dan dilakukan secara cermat, untuk tetap menjamin
validitas maupun reliabilitasnya.
b. Tes Terstandar (Standardized Test)
Dari istilah yang digunakan saja, barangkali Anda sudah bisa
memperkirakan apa yang dimaksud dengan tes terstandar. Benar, tes
terstandar adalah tes yang dikembangkan dengan mengikuti
prosedur serta prinsip pengembangan tes secara ketat. Semua
prosedur pengembangan tes dikuti sehingga ciri-ciri tes sebagai alat
ukur yang baik senantiasa dapat dipenuhi. Dengan demikian, tingkat
validitas, reliabilitas, kepraktisan, maupun daya beda sudah bukan
menjadi masalah lagi. Bagaimana cara mengembangkan tes sebagai
alat ukur yang baik, Saudara bisa membaca bagian lain dari Bahan
Ajar ini.
a. Fungsi Tes
Dalam keseharian seorang guru sering bertanya kepada dirinya
sendiri, ketika dia mengajar atau hendak memberikan tes kepada siswanya “
pertanyaan apakah yang akan saya berikan, Berapa banyak soal yang akan
saya berikan, soal tes seperti apa yang sesuai dengan materi saya dan lain
sebagainya”. Melalui Pertanyaan tersebut, guru harus ingat akan fungsi tes.
Sehubungan dengan hal-hal yang harus diingat pada waktu penyusunan tes,
maka fungsi tes dapat ditinjau dari tiga hal:

1. Fungsi untuk kelas


2. Fungsi untuk bimbingan
3. Fungsi untuk administrasi.
Masalah penyusunan tes perlu diingat fungsi mana yang
dipentingkan oleh si anak didik dan sebuah tes sebaiknya mencakup
kebulatan, yang artinya meliputi berbagai aspek yang menggambarkan
74
keadaan siswa secara keseluruhan baik berupa kecerdasan, sikap, pribadi,
perasaan, sosial dan sebagainya.

1. Fungsi Untuk Kelas


a. Mengadakan diagnosis terhadap kesulitan belajar siswa
b. Mengevaluasi celah antara bakat dengan pencapaian
c. Menaikkan tingkat prestasi
d. Mengelompokkan siswa dalam kelas pada waktu metode
kelompok.
e. Merencanakan kegiatan proses belajar mengajar untuk siswa
secara perseorangan
f. Menentukan siswa mana yang memerlukan bimbingan khusus
g. Menentukan tingkat pencapaian untuk setiap anak.

2. Fungsi Untuk Bimbingan.

a. Menentukan arah pembicaraan dengan orang tua tentang


anak-anak mereka
b. Membantu siswa dalam menentukan pilihan
c. Membantu siswa mencapai tujuan pendidikan dan jurusan
d. Memberi kesempatan kepada pembimbing, guru, dan orang
tua dalam memahami kesulitan anak.

3. Fungsi untuk Administrasi

a. Memberi petunjuk dalam mengelompokkan siswa


b. Penempatan siswa baru
c. Membantu siswa memilih kelompok
d. Menilai kurikulum

75
e. Memperluas hubungan masyarakat
f. Menyediakan informasi untuk badan-badan lain di luar
sekolah.

2. Langkah-Langkah Penyusunan Tes

Tes merupakan alat atau prosedur yang digunakan untuk mengetahui


atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang
sudah ditentukan. Tes hasil belajar adalah sekelompok pertanyaan atau
tugas-tugas yang harus dijawab atau diselesaikan oleh siswa dengan tujuan
untuk mengukur kemajuan belajar siswa, adapun langkah langkah yang
harus di lakukan dalam pembuatan tes yang baik adalah:

1. Menetapkan tujuan tes


Langkah awal dalam mengembangkan instrumen tes adalah
menetapkan tujuannya. Tujuan ini penting ditetapkan sebelum tes
dikembangkan karena seperti apa dan bagaimana tes yang akan
dikembangkan sangat bergantung untuk tujuan apa tes tersebut digunakan.
Ditinjau dari tujuannya, ada empat macam tes yang banyak digunakan di
lembaga pendidikan, yaitu : (a) tes penempatan, (b) tes diagnostik, (c) tes
formatif, dan (d) tes sumatif (Thorndike & Hagen, 1977).
2. Melakukan analisis kurikulum
Analisis kurikulum dilakukan dengan cara melihat dan menelaah
kembali kurikulum yang ada berkaitan dengan tujuan tes yang telah
ditetapkan. Langkah ini dimaksudkan agar dalam proses pengembangan
instrumen tes selalu mengacu pada kurikulum yakni standar kompetensi-
76
kompetensi dasar (SKKD) yang sedang digunakan. Instrumen yang
dikembangkan seharusnya sesuai dengan indikator pencapaian suatu KD
yang terdapat dalam Standar Isi (SI).

3. Membuat kisi-kisi
Kisi-kisi merupakan matriks yang berisi spesifikasi soal -soal
(meliputi SK-KD, materi, indikator, dan bentuk soal) yang akan dibuat. Dalam
membuat kisi-kisi ini, kita juga harus menentukan bentuk tes yang akan kita
berikan. Beberapa bentuk tes yang ada antara lain: pilihan ganda, jawaban
singkat, menjodohkan, tes benar-salah, uraian obyektif, atau tes uraian non
obyektif. Untuk mempermudah dalam membuat kisi-kisi soal

77
4. Menulis soal
Pada kegiatan menuliskan butir soal ini, setiap butir soal yang Anda
tulis harus berdasarkan pada indikator yang telah dituliskan pada kisi-kisi dan
dituangkan dalam spesifikasi butir soal. Bentuk butir soal mengacu pada
deskripsi umum dan deskripsi khusus yang sudah dirancang dalam
spesifikasi butir soal. Adapun untuk soal bentuk uraian perlu dilengkapi
dengan pedoman penyekoran yang lebih rinci .

78
5. Melakukan telaah instrumen secara teoritis
Telaah instrumen tes secara teoritis atau kualitatif dilakukan untuk
melihat kebenaran instrumen dari segi materi, konstruksi, dan bahasa.
Telaah instrumen secara teoritis dapat dilakukan dengan cara meminta
bantuan ahli/pakar, teman sejawat, maupun dapat dilakukan telaah sendiri.
Setelah melakukan telaah ini kemudian dapat diketahui apakah secara
teoritis instrumen layak atau tidak. Telaah teoritis dimaksudkan untuk
menganalisis soal ditinjau dari segi materi,konstruksi, dan bahasa. Analisis
materi dimaksudkan sebagai penelaahan yang berkaitan dengan substansi
keilmuan yang ditanyakan dalam soal serta tingkat kemampuan yang sesuai
dengan soal. Analisis konstruksi dimaksudkan sebagai penelaahan yang
umumnya berkaitan dengan teknik penulisan soal.
Sedangkan, analisis bahasa dimaksudkan sebagai penelaahan
soal yang berkaitan dengan penggunaan bahasa Indonesia yang baik dan
benar menurut Ejaan Yang Disempurnakan (EYD) dan bersifat ringkas dan
jelas. Untuk mempermudah melakukan telaah teoritis, dapat menggunakan
kartu telaah. Anda dapat melakukan telaah dengan cara meminta teman
Anda atau pakar untuk menelaah instrumen yang telah Anda susun dengan
cara memberikan tanda check (v)pada kartu telaah sesuai dengan pendapat
teman/pakar yang Anda tunjuk. Berikut ini contoh lembar instrumen telaah:

79
80
6. Melakukan ujicoba dan analisis hasil ujicoba tes
Sebelum tes digunakan perlu dilakukan terlebih dahulu uji coba tes.
Langkah ini diperlukan untuk memperoleh data empiris terhadap kualitas tes
yang telah disusun. Ujicoba ini dapat dilakukan ke sebagian siswa, sehingga
dari hasil ujicoba ini diperoleh data yang digunakan sebagai dasar analisis
tentang reliabilitas, validitas, tingkat kesukaran, pola jawaban, efektivitas

81
pengecoh, daya beda, dan lain-lain. Jika perangkat tes yang disusun belum
memenuhi kualitas yang diharapkan, berdasarkan hasil ujicoba tersebut
maka kemudian dilakukan revisi instrumen tes.

7. Merevisi soal
Berdasarkan hasil analisis butir soal hasil ujicoba kemudian
dilakukan perbaikan. Berbagai bagian tes yang masih kurang memenuhi
standar kualitas yang diharapkan perlu diperbaiki sehingga diperoleh
perangkat tes yang lebih baik. Untuk soal yang sudah baik tidak perlu lagi
dibenahi, tetapi soal yang masuk kategori tidak bagus harus dibuang karena
tidak memenuhi standar kualitas. Setelah tersusun butir soal yang bagus,
kemudian butir soal tersebut disusun kembali untuk menjadi perangkat
instrumen tes, sehingga instrumen tes siap digunakan. Perangkat tes yang
telah digunakan dapat dimasukkan ke dalam bank soal sehingga suatu saat
nanti bisa digunakan lagi.

3. Komponen-Komponen Tes
Komponen Test terdiri dari:
a. Buku tes, yakni lembaran atau buku yang memuat butir-butir soal
yang mesti dikerjakan oleh siswa
b. Lembar jawaban tes, yaitu lembaran yang disediakan oleh
penilain bagi tes untuk mengerjakan tes, untuk bentuk pilihan ganda
dibuat lembaran nomor dan huruf A, B, C, D, E menurut banyaknya
alternative yang disediakan
c. Kunci jawaban tes, berisi jawaban-jawaban yang dikehendaki.
Kunci jawaban ini dapat berupa huruf atau kalimat. Untuk test bentuk

82
uraian yang dituliskan adalah kata-kata kunci atau kalimat seingkat
untuk memberikan ancar-ancar jawaban. Ide dari kunci jawaban ini
adalah:
1) Pemeriksaan tes dapat dilakukan oleh orang lain
2) Pemeriksaannya betul,
3) Dilakukan dengan mudah,
4) Sedikit mungkin masuknya unsur subjektif
d. Pedoman penilaian, pedoman penilaian atau pedoman skoring,
berisi tentang pedoman perincian tentang skor atau angka yang
diberikan kepada siswa bagi soal-soal yang telah dikerjakan.
Contoh pedoman penilaian:
Untuk penilaian dengan contoh soal diatas, tiap soal diberi skor
5.Jumlah skor : 5x20= 100

4. Ciri – Ciri (karakteristik) Tes Yang Baik


Dalam bidang pendidikan, tes merupakan bagian yang mendasar
dalam proses belajar dan mengajar. Salah satu bentuk evaluasi yang popular
digunakan untuk mengetahui apakah hasil belajar telah sesuai dengan tujuan
pembelajaran adalah dengan memberikan tes. Dengan kata lain, untuk
mengukur keberhasilan dari suatu proses belajar dan mengajar adalah
dengan melalui sebuah tes. Jadi, antara tes dan proses belajar dan mengajar
mempunyai hubungan yang erat dan tidak dapat dipisahkan. Tes mempunyai
banyak fungsi misalnya sebagai alat diagnosa kelemahan siswa dari materi
yang telah diberikan (diagnostic test), sebagai alat untuk mengetahui
pengatahuan/ kemampuan awal (pre-test), sebagai alat untuk mengetahui
pencapaian hasil belajar (post-test/ achievement test), hingga sebagai alat
untuk membuat keputusan misalnya lulus atau tidaknya peserta didik.

83
Mengingat pentingnya sebuah tes tersebut, apalagi apabila
digunakan sebagai alat pengambil keputusan, tentunya diperlukan sebuah
tes yang baik. Tes yang baik harus memenuhi ciri-ciri (karakteristik) tes yang
baik. Sudiyono (2011) dan Arikunto (2009) menyatakan bahwa karakteristik
tes yang baik mencakup validitas, reliabilitas, objektivitas, praktikabilitas, dan
ekonomis.
1. Validitas
Validitas atau kesahihan mengacu kepada bahwa tes benar-benar
mengukur apa yang ingin diukur. Misalkan: andaikan tes ditujukan untuk
mengukur kemampuan berbicara, maka tesnya harus dalam bentuk tes lisan,
bukan menulis. Secara garis besar ada 2 jenis validitas, yakni validitas logis
(logical validity) dan validitas empiris (empirical validity). Validitas logis
merupakan jenis validitas yang dianalisa secara pemahaman logis apakah
tes tersebut valid berdasarkan teori-teori dari para ahli. Sedangkan validitas
empiris merupakan jenis validitas yang dianalisa berdasarkan data-data
empiris. Data empiris merupakan data pengalaman yang berupa skor/ nilai
yang nantinya akan dikorelasikan.
Allen & Yen (1979: 970) membagi validitas kepada tiga bentuk, yaitu
: validitas isi (content validity), validitas kriteria (criterion validity), dan validitas
susunan (construct validity).
a. Validitas Isi (content validity)
Validitas isi artinya kejituan atau ketepatan suatu tes ditinjau dari isi tes
tersebut. Suatu tes dapat dikatakan valid apabila materi tersebut benar-
benar merupakan bahan yang representatif terhadap bahan-bahan
pelajaran yang telah diberikan (Wayan Nurkancana & PPN Sunartana,
1990: 143). Pembuktian hasil validitas dapat diestimasi melalui pengujian

84
terhadap isi tes atau instrument pengukuran dengan analisis rasional
(Azwar, 1997:45).
b. Validitas Susunan (construct validity)
Validitas susunan adalah kejituan atau ketepatan suatu tes ditinjau dari
susunan tes tersebut (Wayan Nurkancana & PPN Sunartana, 1990:
144). Validitas konstruk merujuk pada sejauh mana suatu tes mengukur
suatu konstruk teoretik atau trait yang hendak diukurnya (Allen & Yen,
1979: 108). Konstruk dalam pengertian ini adalah berkaitan dengan
aspek-aspek psikologi seseorang khususnya aspek kognitif, afektif dan
psikomotor.
c. Validitas Kriteria (criterion related validity).
Validitas kriteria merupakan validitas yang menghendaki terjadinya
kriteria eksternal yang dapat dijadikan dasar pengujian skor tes. Kriteria
yang dimaksud adalah variable perilaku yang akan diprediksi oleh skor
tes atau berupa suatu ukuran lain yang relevan (Nurlaila, 2008: 68).
Validitas kriteria disusun berdasarkan kriteria yang telah ada
sebelumnya, dan kesahihan alat ukur dilihat dari sejauhmana hasil
pengukuran tersebut sama dengan hasil pengukuran alat lain yang
dijadikan kriteria. Biasanya, dalam pengukuran psikologis, yang
dijadikan kriteria adalah hasil pengukuran lain yang telah dianggap
sebagai alat ukur yang baik misalnya tes Stanford Binnet atau tes
Weschler.

2. Reliabilitas
Reliabilitas mengacu kepada konsistensi dari hasil tes. Meskipun tes
tersebut diberikan beberapa kali kepada siswa yang sama,hasilnya akan
tetap/ konsisten. Konsisten tidak harus sama, namunsecara keseluruhan

85
apabila hasil tes turun maka hasil semua peserta tesakan turun juga, begitu
juga sebaliknya. Kondisi konsisten ini diibaratkan orang yang berbicara
konsisten, maka pembicaraan tidak akan berubah-ubah, sehingga bisa
dipercaya. Begitupula dengan konsisten dalam hal tes ini. Tes yang reliable
(tetap/konsisten), maka tes tersebut dapat dipercaya sebagai alat ukur.
Misalnya: sebuah soal tes IPS sebanyak 100 soal, diberikan kepada
siswa dan hasilnya siswa tersebut betul 80. Kemudian selang beberapa hari
tes itu (tes yang sama) diberikan lagi pada anak tersebut dan hasilnya
ternyata 81. Dengan demikian dapat dikatakan, bahwa tes tersebut memiliki
reabilitas. Karena menunjukkan hasil yang mantap dan hasil tetap (walaupun
ada perbedaan, tetapi perbedaab itu tidak berarti karena hanya
Tes yang memberikan hasil yang tidak tetap atau unriliabel itu
disebabkab karena harapan beberapa hal, diantaranya :
1. Situasi pada waktu tes berlangsung.
Dalam hal ini melibatkan factor siswa yang mengerjakan tes, yang mencakup
segiu fisik maupun psikis dari yang mengerjakan tes. Misalnya
a. kesehatan anak terganggu pada waktu mengerjakan tes.
b. Perasaan anak yang takut, gugup atau terburu-buru pada waktu
mengerjakan tes.
c. Tidak mengerjakan tes dengan sepenuh hati.
d. Dari faktor-faktor tersebut di atas dapat mengakibatkan hasil tes anak
tidak reliabel. Misalkan pada waktu tes pertama anak merasa gugup dan
takut, dan pada waktu tes yang kedua anak sudah tidak takut dan tidak
gugup karena pernah mengerjakan tes itu. Maka hasil tes pertama dan
tes kedua (dari tes yang sama) hasilnya akan tidak sama (tidak reliabel).
2. Keadaan tes itu sendiri.

86
Hal ini disebabkan karena soal dari tes itu sendiri kurang baik, misalnya
antara lain:
a. Pertanyaan tidak jelas apa yang dimaksud sehingga ada kesulitan bagi
anak untuk menjawab itu.
b. Tidak ada petunjuk yang jelas bagaimana cara mengerjakan soal itu.
c. Pertanyaan soal tes itu membingungkan, sehingga bias terjadi salah
pengertian antara anak dan guru yang membuat soal.
d. Karena itulah agar tes yang kita susun benar-benar dapat reliabel maka
kita harus memperhatikan beberapa hal, antara lain:
e. Ciptakan situasi yang tenang dalam pelaksanaan tes. Seorang guru
harus mengusahakan agar lingkungan sekitar pelaksanaan tes tidak
terjadi kegaduhan.
f. Membuat soal tes yang jelas pertanyaannya sehingga tidak terjadi salah
pengertian antara murid dengan guru yang membuat soal tes. Dalam hal
ini soal tes yang kita susun supaya menggunakan bahasa yang
sederhana, jelas dan mudah dimengerti.
g. Membuat petunjuk yang jelas cara mengerjakan soal tes.
h. Membuat kunci jawaban/pola jawaban sebelum hasil tes dikoreksi.

3. Objectivitas

Objectivitas mengacu kepada ketetapan/ konsistensi pada sistem


penyekoran. Objectivitas menunjukkan tidak adanya unsur pribadi yang
mempengaruhi penyekoran/ hasil. Jadi, hasil tes benar-benar menunjukkan
kemampuan peserta tes dengan apa adanya. 4. Praktikabilitas Praktikabilitas
mengacu kepada kepraktisan dan kemudahan dalam pengadministrasian.
Praktikablitas menunjukkan bahwa tes mudah dilaksanakan, mudah

87
diperiksa dan dilengkapi dengan petunjuk yang jelas. Jadi, tes sifatnya
sederhana dan lengkap.
Contoh: soal tes IPS sebanyak 50 butir soal, setiap soal tes yang
benar diberi angka 2, sehingga apabila benar semua akan memperoleh skor
100. Misalkan Ali mendapat skor 80 karena benar 40 soal tes setelah
diperiksa guru A. apabila ada guru lain yang memeriksa hasil pekerjaan Ali
maka skornya masih tetap 80 juga. Dengan demikian dapat dikatakan bahwa
soal tes IPS tersebut diatas memiliki objektivitas. Tetapi apabila hasil tes Ali
dari guru A dan guru B tersebut tidak sama, amaka tes itu dikatakan tidak
memiliki objektivitas. Di pihak lain, seorang guru dalam mengoreksi hasil tes
anak harus tidak memasukkan factor subjektif agar hasil tes itu merupakan
hasil objektif, sesuai dengan kemampuan anak (nilai yang diperoleh).
Dalam tes yang terbentuk subjektif sulit bagi guru untuk member nilai
yang se-objektif mungki, sebab jawaban dari soal tes subjektif membutuhkan
uraian-uraian, sehingga sulit bagi guru untuk member nilai yang tepat, apalagi
kalau guru tidak membuat pola jawaban sebelumnya. Hal ini bias
mengakibatkan dua anak akan memperoleh nilai yang tidak sama, padahal
jawabannya sama. Dengan demikian hasil tes itu tidak objektif dan berarti
hasil tes itu tidak memiliki objektivitas. Faktor yang mempengaruhi objektifitas
adalah sebagai berikut:
a. Bentuk Tes
Tes yang berbentuk uraian (essay), akan memberikan banyak kemungkinan
kepada si penilai untuk memberikan banyak penilaian (skoring) menurut
caranya sendiri. Hal ini menunjukkan bahwa dengan menggunakan tes
bentuk uraian akan memungkinkan masuknya unsur subjektivitas dari si
penilai dalam melakukan skoring.
b. Penilai

88
Dengan menggunakan tes bentuk uraian, faktor subjektivitas dari seorang
penilai akan dapat masuk secara lebih leluasa dan mempengaruhi pemberian
skor. Faktor-faktor yang dapat mempengaruhi dalam subjektivitas penilaian
tersebut antara lain: kesan penilai terhadap peserta tes (hallo-effect), tulisan,
bahasa, waktu pelaksanaan penilaian, dan sebagainya.
4. Praktikabilitas
Praktikabilitas mengacu kepada kepraktisan dan kemudahan dalam
pengadministrasian. Praktikablitas menunjukkan bahwa tes mudah
dilaksanakan, mudah diperiksa dan dilengkapi dengan petunjuk yang jelas.
Jadi, tes sifatnya sederhana dan lengkap.

Sebuah tes dapat dikatakan memiliki praktikabilitas apabila tes


tersebut bersifat praktis dan mudah pengadministrasiannya. Beberapa hal
yang menyangkut kepraktisan dalam alat penilaian, yaitu:

a. Mudah diadministrasikan, dalam artian tidak memerlukan tenaga yang


banyak, serta tidak memerlukan keahlian yang tinggi sehingga dapat
dikerjakan oleh setiap guru.
b. Mudah dilaksanakan. Misalnya tidak membutuhkan peralatan yang
banyak dan rumit.
c. Lengkap, dalam artian dilengkapi dengan cara penjawaban yang baik
dan benar, kunci jawaban dan pedoman penilaian.

5. Ekonomis
Ekonomis menunjukkan bahwa tes tidak memerlukan biaya yang
mahal, waktu yang lama dan tenaga yang banyak. Yang penting tes dapat
diselenggarakan dengan baik.

89
Dari 5 (lima) ciri-ciri (karakteristik) tes yang baik di atas, setidaknya
ada 2 (dua) karakteristik yang harus menjadi perhatian dan dianggap paling
penting, sehingga sering kali dijadikan dasar dalam menentukan
keterpercayaan suatu tes sebagai alat ukur/ instrument, baik sebagai
instrumen keberhasilan proses belajar mengajar ataupun sebagai instrumen
suatu penelitian khususnya untuk data kuantitatif. Kedua karakteristik
tersebut adalah validitas (kesahihan) dan reliabilitas (keajegan). Jadi,
instrument harus valid (sahih) dan reliable (ajeg) sehingga hasilnya dapat
dipertanggung jawabkan.

Evaluasi Bab III


PILIHAN BERGANDA
1. secara garis besar tes didefinisikan sebagai alat atau prosedur yang
dipergunakan dalam rangka pengukuran dan penilaian. Kalau dikaitkan
dengan evaluasi pendidikan, tes adalah cara (yang dapat dipergunakan) atau
prosedur (yang perlu ditempuh) dalam rangka pengukuran dan penilaian di
bidang pendidikan, yang berbentuk pemberian tugas atau serangkaian tugas
(baik berupa pertanyaan-pertanyaan (yang bisa dijawab), atau perintah-
perintah (yang harus dikerjakan)sehingga dapat dihasilkan nilai yang
melambangkan tingkah laku. Dalam evaluasi pembelajaran terdapat
bebarapa jenis tes yang harus anda ketahui kecuali,
a. Tes
b. Testing
c. Testee
d. Tested
e. Tester
2. Perhatikan informasi berikut
§ observasi
§ wawancara
§ lisan

90
§ daftar cek
§ skala sikap
§ rating scale

Dalam defenisi evaluasi pembelajaran dijelaskan bahwa ada 2 macam instrumen


yang di paparkan yaitu tes dan nontes. melihat informasi diatas, manakah yang
bukan termasuk dalam jenis instrument

a. observasi
b. wawancara
c. lisan
d. daftar cek
e. skala sikap

3. Tester merupakan orang yang diserahi untuk melaksanakan pengambilan tes


terhadap para responden. Dengan kata lain tester adalah subjek evaluasi (tetapi
adakalanya anya orang yang ditunjuk oleh subjek evaluasi untuk melaksanakan
tugasnya). Adapun yang bukan tugas tester antara lain..
a. mempersiapkan ruangan dan perlengkapan yang diperlukan
b. mencari audients yang akan diberi tes
c. membagikan lembaran tes dan alat-alat lain untuk mengerjakan tes
d. menerangkan cara mengerjakan tes
e. memberikan tanda-tanda waktu

4. tes terstandar adalah tes yang dikembangkan dengan mengikuti prosedur serta
prinsip pengembangan tes secara ketat. Semua prosedur pengembangan tes dikuti
sehingga ciri-ciri tes sebagai alat ukur yang baik senantiasa dapat dipenuhi. adpun
cara mengembangkan tes sebagai alat ukur yang baik dengan melihat dari,
kecuali…
a. objektivitas
b. tingkat validitas
c. reliabilitas
d. kepraktisan
e. daya bedah

91
5. Dalam keseharian seorang guru sering bertanya kepada dirinya sendiri, ketika dia
mengajar atau hendak memberikan tes kepada siswanya “ pertanyaan apakah yang
akan saya berikan, Berapa banyak soal yang akan saya berikan, soal tes seperti
apa yang sesuai dengan materi saya dan lain sebagainya”. Melalui Pertanyaan
tersebut, guru harus ingat akan fungsi tes. Sehubungan dengan hal-hal yang harus
diingat pada waktu penyusunan tes, maka fungsi tes dapat ditinjau dari ...
a. fungsi untuk kelas dan bimbingan
b. fungsi untuk kurikulum
c. fungsi untuk sekolah
d. fungsi untuk guru dan siswa
e. fungsi untuk kepala sekolah

6. Masalah penyusunan tes perlu diingat fungsi mana yang dipentingkan oleh si anak
didik dan sebuah tes sebaiknya mencakup kebulatan, yang artinya meliputi
berbagai aspek yang menggambarkan keadaan siswa secara keseluruhan baik
berupa kecerdasan, sikap, pribadi, perasaan, sosial dan sebagainya. Adapun
hakekatnya yang bukan fungsi untuk kelas antara lain..
a. mengadakan diagnosis terhadap kesulitan belajar siswa
b. mengevaluasi celah antara bakat dengan pencapaian
c. menaikan tingkat prestasi
d. mengelompokkan siswa dalam kelas pada saat metode kelompok
e. memberi motivasi terhadap siswa yang kurang semangat

7. Tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau
mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah
ditentukan. Tes hasil belajar adalah sekelompok pertanyaan atau tugas-tugas yang
harus dijawab atau diselesaikan oleh siswa dengan tujuan untuk mengukur
kemajuan belajar siswa, adapun langkah langkah yang harus di lakukan dalam
pembuatan tes yang baik, kecuali..
a. menetapkan tujuan tes
b. melakukan analisis kurikulum
c. membuat kisi-kisi
d. merancang dan menulis soal
e. mencocokan terhadap karakteristik siswa
92
8. Komponen Test terdiri dari:
• Buku tes, yakni lembaran atau buku yang memuat butir-butir soal yang mesti
dikerjakan oleh siswa
• Lembar jawaban tes, yaitu lembaran yang disediakan oleh penilain bagi tes untuk
mengerjakan tes, untuk bentuk pilihan ganda dibuat lembaran nomor dan huruf
A, B, C, D, E menurut banyaknya alternative yang disediakan
• Kunci jawaban tes, berisi jawaban-jawaban yang dikehendaki. Kunci jawaban ini
dapat berupa huruf atau kalimat. Untuk test bentuk uraian yang dituliskan adalah
kata-kata kunci atau kalimat seingkat untuk memberikan ancar-ancar jawaban.
Adapun yang bukan ide dari kunci jawaban ini antara lain..
a. Pemeriksaan tes dapat dilakukan oleh orang lain
b. Pemeriksaannya betul
c. Melihat komponen standarisasi
d. Dilakukan dengan mudah
e. Sedikit mungkin masuknya unsure subjektif

9. Mengingat pentingnya sebuah tes tersebut, apalagi apabila digunakan sebagai alat
pengambil keputusan, tentunya diperlukan sebuah tes yang baik. Tes yang baik
harus memenuhi ciri-ciri (karakteristik) tes yang baik. Sudiyono (2011) dan
Arikunto (2009) menyatakan bahwa karakteristik tes yang baik ialah yang
mencakup
a. Strategi
b. Validitas
c. Reliabilitas
d. Objectivitas
e. Praktikabilitas

10. Dari 5 (lima) ciri – ciri (karateristik) di bawah ini:


• Validitas
• Reliabilitas
• Objectivitas
• Praktikabilitas
• Ekonomis

93
Setidaknya ada 2 (dua) karakteristik yang harus menjadi perhatian dan dianggap
paling penting, sehingga sering kali dijadikan dasar dalam menentukan
keterpercayaan suatu tes sebagai alat ukur/ instrument, baik sebagai instrumen
keberhasilan proses belajar mengajar ataupun sebagai instrumen suatu penelitian
khususnya untuk data kuantitatif. Kedua karakteristik tersebut ialah..

a. Validitas dan objectivitas


b. Validitas dan reliabilitas
c. Validitas dan praktikabilitas
d. Reliabilitas dan praktikabilitas
e. Objectivitas dan praktikabilitas

SOAL ESSAY
1. Buatlah suatu instrumen tes dari salah satu mata kuliah untuk ujian
akhir semester dengan langkah-langkah yang telah dibahas di
diktat ini. Gunakanlah kartu-kartu yang ada untuk membantu Anda
dalam mengembangkan instrumen tes.
2. Presentasikan hasil tugas Anda di depan kelas pada pertemuan
berikutnya!
3. Diskusikan kekurangan dan hal positif dari instrumen yang telah
Anda kembangkan!
4. Jelaskan pembagian jenis tes dilihat dari tujuan
penyelenggaraannya
5. Jelaskan pembagian jenis tes berdasarkan bentuk jawabannya!
6. Jelaskan dan berikan contoh tes yang melandasi pengambilan
keputusan guru diawal proses pembelajaran!

94
Tujuan Kegiatan : Mahasiswa diharapkan dapat menjelaskan kualitas
instrumen dalam evaluasi pembelajaran matematika

Petunjuk Kegiatan :

1. Bacalah materi berbagai sumber referensi.


2. Selesaikan pertanyaan-pertanyaan di bawah ini dengan benar.
3. Diskusikan di dalam kelompok.
4. Persentasikan hasil kerja anda.
5. Perbaiki hasil kerja anda jika ada kritik dan saran.
6. Buatlah “peta konsep” untuk pokok bahasan ini.
Pertanyaan :

1. Jelaskanlah bagaimana yang di sebut dengan teknik penilaian yang


baik
2. Sebukan dan jelaskanlah langkah langkah penyusunan Tes
3. Sebutkan, jelaskan dan berikan contohnya untuk komponen-
komponen tes.
4. Jelaskan Ciri –ciri tes yang valid
5. Jelaskan ciri – ciri tes yang reliabilitas
6. Jelaskan ciri – ciri tes yang objektif
7. Jelaskjan ciri – ciri tes yang praktikabulitas
8. Jelaskan ciri – ciri tes yang ekonomis

SELAMAT MENGERJAKAN

95
BAB IV
MENGOLAH HASIL TES

KOMPETENSI DASAR:
Setelah mengikuti kegiatan perkuliahan Setelah mengikuti
kegiatan perkuliahan dari matakuliah ini, diharapkan
mahasiswa memiliki kompetensi dasar yaitu akan
mampu Pengolahan hasil tes dan kedudukan individu
dalam kelompok tes dari matakuliah ini, diharapkan
mahasiswa memiliki kompetensi dasar yaitu akan
mampu Pengolahan hasil tes dan kedudukan individu
dalam kelompok tes

INDIKATOR KOMPETENSI:
1. Menjelaskan Pengertian Pensekoran
2. Menjelaskan Perbedaan antara skor dan nilai
3. Menjelaskan teknik penskoran
4. Menjelaskan penskoran analitik
5. Menjelaskan penskoran holoistik

96
Pengantar
Setelah semua data dikumpulkan, baik secara langsung maupun
tidak langsung, maka langkah Anda selanjutnya adalah melakukan
pengolahan data. Mengolah data berarti ingin memberikan nilai dan makna
terhadap data yang sudah dikumpulkan. Jika datanya tentang prestasi
belajar, berarti pengolahan data tersebut akan memberikan nilai kepada
peserta didik berdasarkan kualitas hasil pekerjaannya. Hal ini dimaksudkan
agar semua data yang diperoleh dapat memberikan makna tersendiri.
Misalnya, jika seorang peserta didik memperoleh skor 65, Anda belum dapat
memberikan keputusan tentang peserta didik itu, apakah ia termasuk
cerdas, sedang atau kurang, apalagi memberikan keputusan mengenai
keseluruhan aspek kepribadian peserta didik.

1. Pengertian Penskoran
Pemberian skor (scoring) adalah proses pengubahan jawaban instrumen
menjadi angka-angka yang merupakan nilai kuantitatif dari suatu jawaban
terhadap item dalam instrumen. Angka-angka hasil penilaian selanjutnya
diproses menjadi nilai-nilai (grade). Skor adalah hasil pekerjaan menyekor
(memberikan angka) yang diperoleh dari angka-angka dari setiap butir soal
yang telah di jawab dengan benar, dengan mempertimbangkan bobot
jawaban yang benar.
Maka dapat disimpulkan bahwa Penskoran (skoring) adalah suatu
proses pengubahan jawaban-jawaban tes menjadi angka-angka. Skor adalah
hasil pekerjaan menskor yang diperoleh dengan menjumlahkan angka-angka
bagi setiap soal tes yang dijawab dengan benar oleh siswa. Skor maksimum
tidak selalu tetap, karena ditentukan berdasarkan atas banyak serta bobot
soal-soal tesnya.

97
Dalam menskor atau menentukan angka, dapat digunakan 3 macam alat
bantu yaitu :
1. Pembantu menentukan jawaban yang benar, disebut kunci jawaban
2. Pembantu menyeleksi jawaban yang benar dan yang salah, disebut kunci
skoring
3. Pembantu menentukan angka, disebut pedoman penilaian
Adapun pada umumnya, pengolahan data hasil tes menggunakan
bantuan statistik. Menurut Zainal Arifin (2006) dalam pengolahan data hasil
tes menggunakan empat langkah pokok yang harus di tempuh.
1. Menskor, yaitu memperoleh skor mentah daritiga jenis alat bantu, yaitu
kunci jawaban kunci scoring dan pedoman konversi.
2. Mengubah skor mentah menjadi skor standar
3. Menkonversikan skor standar kedalam nilai
4. Melakukan analisis soal (jika diperlukan) untuk mengetahui derajat
validitas dan realibilitas soal, tingkat kesukaran soal (difficulty index) dan
daya pembeda.
2. Perbedaan antara skor dan nilai
Dewasa ini banyak diantara para guru sendiri yang masih rancu
mengenai definisi dari skor dan nilai. Skor adalah hasil pekerjaan menskor
yang diperoleh dengan menjumlahkan angka-angka bagi setiap soal tes yang
dijawab benar oleh siswa. Sedangkan nilai adalah angka ubahan dari skor
dengan menggunakan acuan tertentu, yakni acuan normal atau acuan
standar. Pengubahan skor menjadi nilai dapat dilakukan untuk skor tunggal,
misalnya sesudah memperoleh skor ulangan harian atau unutk skor
gabungan dari beberapa ulangan dalam rangka memperoleh nilai akhir untuk
rapor. Secara rinci skor dapat dibedakan atas 2 (dua) macam, yaitu skor yang
diperoleh (obtained score) dan skor sebenarnya (true score).

98
Skor yang diperoleh (obtained score) adalah sejumlah angka yang
dimiliki oleh testee sebagai hasil mengerjakan tes. Kelemahan-kelemahan
butir tes, situasi yang tidak mendukung, kecemasan, dan lain-lain faktor dapat
berakibat terhadap skor yang diperoleh ini. Apabila faktor-faktor yang
berpengaruh ini muncul, baik sebagian ataupun menyeluruh, penilai tidak
dapat mengira-ngira seberapa cermat skor yang diperoleh siswa ini mampu
mencerminkan pengetahuan dan keterampilan siswa yang sesungguhnya.
Seorang siswa yang memperoleh skor 40 bagi tes yang menghendaki
skor maksimum 40, mempunyai arti bahwa siswa tersebut sudah menguasai
100% dari tujuan instruksional khusus yang dirancangkan oleh guru. Akan
tetapi jika skor tersebut diperoleh dari pengerjaan soal tes yang menghendaki
skor maksimum 100, maka skor 40 mencerminkan 40% peguasaan tujuan
saja.

Dengan demikian maka angka 40 yang diperoleh oleh seorang siswa


setelah ia selesai mengikuti sebuah tes, belum berbicara apa-apa sebelum
diketahui berapa skor maksimum yang diharapkan jika siswa tersebut dapat
mengerjakannya dengan sempurna. Angka 40 ini disebut skor mentah.

Atas dasar itulah maka untuk dapat dicatat sebagai suatu prestasi
belajar, guru diwajibkan untuk mengubah skor mentah yang diperoleh
langsung dari mengerjakan tes, menjadi skor berstandar 100.

Contoh:

Skor maksimum yang diharapkan 40.

99
A memperoleh skor 24. Ini berarti bahwa sebenarnya A tersebut hanya
%'
menguasai: 𝑥100% tujuan instruksional khusus tersebut atau hanya 60%
'&

dari tujuan instruksional khusus tersebut.

Dalam daftar nilai, dituliskan A mendapat nilai 60. Jadi di sini tampak
perbedaannya.

24 adalah skor
60 adalah nilai
B memperoleh skor 36.

()
Ini berarti bahwa B menguasai '&
𝑥100% dari tujuan atau hanya 90% dari

tujuan peajaran. Dalam daftar nilai, B dituiskan mendapat nilai 90.

Skor sebenarnya (true score) seringkali juga disebut dengan istilah


skor univers atau skor alam (universe skor), adalah nilai hipotesis yang
sangat tergantung dari perbedaan individu berkenaan dengan pengetahuan
yang dimiliki secara tetap. Sebagai contoh adalah apabila seseorang
diminta untuk mengerjakan sebuah tes berulang-ulang, maka rata-rata dari
hasil tersebut menggambarkan resultan dari variasi hasil yang tidak ajeg.
Inilah gambaran mengenai skor sebenarnya. Akan tetapi di dalam praktek
tentu tidak mungkin bahwa penilai meminta kepada testee untuk
mengerjakan sebuah tes secara berulang-ulang. Gambaran ini hanya untuk
menunjukkan contoh saja dalam menjelaskan pengertian skor sebenarnya.

3. Teknik Penskoran
Banyak guru yang sudah mengumpulkan data mengenai peserta
didiknya, tetapi tidak atau belum tahu bagaimana mengolahnya, sehingga

100

Anda mungkin juga menyukai