2
3
BAB I
PENDAHULUAN
4
yang disewa untuk mengevaluasi suatu program, baik pada level terbatas maupun
pada level yang luas.
1.3 Tujuan
1. Untuk mengetahui dan memahami tentang pengertian test, jenis-jenis test, fungsi
test, ciri-ciri tes yang baik, dan langkah-langkah pengembangan tes ?
2. Untuk mengetahui dan memahami tentang pengertian tentang pengukuran ?
3. Untuk mengetahui dan memahami tentang definisi asesment menurut beberapa
ahli, tujuan dan fungsi asesment (penilaian), ciri-ciri asesment (penilaian) dalam
pendidikan, dan manfaat asesment dalam pembelajaran ?
4. Untuk mengetahui dan memahami tentang pengertian, tujuan, tipe-tipe, fungsi, dan
aspek sasaran evaluasi ?
5. Untuk mengetahui dan memahami tentang hubungan dan perbedaan antara tes,
measurement (pengukuran), asesment (penilaian) dan evaluasi ?
BAB II
5
PEMBAHASAN
2.1Pembahasan
2.1.1 Test
Istilah ini berasal dari bahasa latin “testum” yang berarti sebuah piringan atau
jambangan dari tanah liat. Istilah ini dipergunakan dalam lapangan psikologi dan
selanjutnya hanya dibatasi sampai metode psikologi, yaitu suatu cara untuk menyelidiki
seseorang. Penyelidikan tersebut dilakukan mulai dari pemberian suatu tugas kepada
seseorang atau untuk menyelesaikan suatu masalah tertentu. Pada hakikatnya tes adalah
suatu alat yang berisi serangkaian tugas yang harus dikerjakan atau soal-soal yang harus
dijawab oleh peserta didik untuk mengukur suatu aspek perilaku tertentu. Beberapa
pengertian tes menurut ahli, antara lain :
a) Tes merupakan suatu alat penilaian dalam bentuk tulisan untuk mencatat atau
mengamati prestasi siswa yang sejalan dengan target penilaian. (Jacobs & Chase,
1992; Alwasilah, 1996).
b) Tes menurut Arkunto dan Jabar (2004) merupakan alat atau prosedur yang
digunakan untuk mengetahui atau mengukur sesuatu dengan menggunakan cara atat
aturan yang telah ditentukan. Dalam hal ini harus dibedakan pengertian antara tes,
testing, testee, dan tester. Testing adalah saat pada waktu tes tersebut dilaksanakan
(saat pengambilan tes).Testee adalah responden yang mengerjakan tes. Mereka inilah
yang akan dinilai atau diukur kemampuannya. Sedangkan Tester adalah seorang
yang diserahi tugas untuk melaksanakan pengambilan tes kepada responden.
c) Menurut Zainul dan Nasution (2001) tes didefinisikan sebagai pertanyaan atau tugas
atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang
suatu atribut pendidikan atau suatu atribut psikologis tertentu.
d) Tes merupakan salah satu upaya pengukuran terencana yang digunakan oleh guru
untuk mencoba menciptakan kesempatan bagi siswa dalam memperlihatkan prestasi
mereka yang berkaitan dengan tujuan yang telah ditentukan (Calongesi, 1995).
Dari beberapa pendapat diatas, dapat diambil pengertian bahwa tes adalah
instrumen atau alat yang digunakan untuk memperoleh informasi tentang individu atau
objek yang direncanakan untuk mengetahui tentang trait/sifat/atribut dimana tiap butir
pertanyaan tersebut memiliki jawaban. Sebagai alat pengumpul informasi atau data, tes
harus dirancang secara khusus. Kekhususan tes terlihat dari bentuk soal tes yang
digunakan, jenis pertanyaan, rumusan pertanyaan yang diberikan, dan pola jawabannya
harus dirancang menurut kriteia yang telah ditetapkan. Demikian juga waktu yang
6
disediakan untuk menjawab pertanyaan serta pengadministrasian tes juga dirancang
secara khusus. Selain itu aspek yang diteskanpun terbatas. Biasanya meliputi ranah
kognitif, afektif, dan psikomotor. Kekhususan-kekhususan tersebut berbeda antara satu
tes dengan tes yang lain. Tes ini dapat berupa pertanyaan tertulis, wawancara,
pengamatan tentang unjuk kerja fisik, checklist, dan lain-lain.
Jenis-Jenis Tes
Tes lisan dilakukan dengan pembicaraan atau wawancara tatap muka antara guru
dan murid.
Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa
menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa
sendiri. Tes essay ini sangat bermanfaat untuk mengembangkan kemampuan dalam
menjelaskan atau mengungkapkan suatu pendapat dalam bahasa sendiri.
b. Tes Objektif
7
Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan alternatif
jawabannya. Tes ini terdiri dariberbagai macam bentuk, antara lain ; Tes Betul-Salah
(TrueFalse), Tes Pilihan Ganda (Multiple Choice), Tes Menjodohkan (Matching), dan
Tes Analisa Hubungan (Relationship Analysis).
8
Untuk mengetahui kondisi awal testi digunakan pre-tes dan kondisi akhir testi digunakan
post-tes.
f. Tes Formatif
Tes formatif adalah penggunaan tes hasil belajar untuk mengetahui sejauh mana
kemajuan belajar yang telah dicapai oleh siswa dalam suatu program pembelajaran
tertentu.
g. Tes Sumatif
Istilah sumatif berasal dari kata “sum” yang berarti jumlah. Dengan demikian tes
sumatif berarti tes yang ditujukan untuk mengetahui penguasaan siswa dalam
sekumpulan materi pelajaran (pokok bahasan) yang telah dipelajari.
Tes beracuan konten (content-referenced test) atau tes beracuan kriteria (criterion-
referenced test) mengukur pencapaian penguasaan suatu standar tingkah laku
(pengetahuan atau keterampilan khusus dalam pelajaran tertentu).
Jenis tes beracuan norma (norm-referenced test) merupakan tes yang berfungsi dalam
hal membandingkan prestasi kelompok dalam pelajaran tertentu, misalnya antara
beberapa daerah atau kota.
9
Jenis tes yang satu ini digunakan untuk melihat kemungkinan keberhasilan seseorang
dalam belajar sesuatu di masa-masa yang akan datang.
e. Tes Minat
Tes minat atau dikenal juga dengan istilah skala minat dapat dipergunakan misalnya
untuk mengetahui jenis pekerjaan atau subjek yang disenangi oleh seseorang.
Fungsi Tes
Secara umum, ada dua macam fungsi yang dimiliki oleh tes, yaitu:
- Sebagai alat pengukur terhadap peserta didik. Dalam hubungan ini tes berfungsi
mengukur tingkat perkembangan atau kemajuan yang telah dicapai oleh peserta
didik setelah mereka menempuh proses belajarmengajar dalam jangka waktu
tertentu.
- Sebagai alat pengukur keberhasilan program pengajaran, sebab melalui tes
tersebut akan dapat diketahui sudah seberapa jauh program pengajaran yang telah
ditentukan, telah dapat dicapai.
Sedangkan menurut Suharsimi Arikunto (2005:152) dalam bukunya Dasar-Dasar
Evaluasi Pendidikan, fungsi tes dapat ditinjau dari tiga hal:
a. Fungsi untuk kelas.
b. Fungsi untuk bimbingan.
c. Fungsi untuk administrasi.
10
perseorangan. kesempatan kepada
f. Menetukan siswa mana
pembimbing, guru, dan
yang memerlukan
orang tua dalam
bimbingan khusus.
memahami kesulitan
g. Menentukan tingkat
anak.
pencapaian untuk setiap
anak.
Namun syarat minimum yang harus dimiliki oleh sebuah tes yang baik adalah valid dan
reliable.
Spesifikasi tes adalah suatu ukuran yang menunjukkan keseluruhan kualitas tes dan ciri-ciri
yang harus dimiliki oleh tes yang akan dikembangkan. Hal yang perlu diperhatikan adalah :
11
Menyusun kisi-kisi soal, penyusunan kisi-kisi soal bertujuan untuk merumuskan setepat
mungkin ruang lingkup, tekanan dan bagian-bagian tes sehingga perumusan tersebut
dapat menjadi petunjuk yang efektif bagi penyusun tes.
Memilih tipe soal, dalam memilih tipe soal perlu diperhatikan kesesuaian antara tipe
soal dengan materi, tujuan evaluasi, skoring, pengelolaan hasil evaluasi,
penyelenggaraan tes, serta ketersediaan dana dan kepraktisan.
Merencanakan tingkat kesukaran soal, untuk soal objektif dapat diketahui melalui uji
coba atau dapat juga diperkirakan berdasarkan berat ringannya beban penyeleaian soal
tersebut
Merencanakan banyak soal.
Merencanakan jadwal penerbitan soal.
2. Penulisan soal
3. Penelaahan soal, yaitu menguji validitas soal yang bertujuan untuk mencermati apakah
butir-butir soal yang disusun sudah tepat untuk mengukur tujuan pembelajaran yang sudah
dirumuskan, ditinjau dari segi isi/materi, kriteria dan psikologis.
4. Pengujian butir-butir soal secara empiris, kegiatan ini sangat penting jika soal yang dibuat
akan dibakukan.
6. Pengadministrasian soal
Pada dasarnya pengukuran merupakan kegiatan penentuan angka bagi suatu objek
secara sistematik. Penentuan angka ini merupakan usaha untuk menggambarkan
karakteristik suatu objek. Kemampuan seseorang dalam bidang tertentu dinyatakan
dengan angka. Dalam menentukan karakteristik individu, pengukuran yang dilakukan
harus sedapat mungkin mengandung kesalahan yang kecil. Kesalahan yang terjadi pada
pengukuran ilmu-ilmu alam lebih sederhana dibandingkan dengan kesalahan
pengukuran pada ilmu-ilmu sosial. Kesalahan pada ilmu-ilmu alam sebagian besar
disebabkan oleh alat ukurnya, sedangkan kesalahan pengukuran dalam ilmu-ilmu sosial
bisa disebabkan oleh alat ukur, cara mengukur, dan keadaan objek yang diukur
(Djemari Mardapi, 2008).
Pengukuran yang bersifat kuantitatif itu dapat dibedakan menjadi tiga macam,
yaitu: (1) Pengukuran yang dilakukan bukan untuk menguji sesuatu, seperti pengukuran
yang dilakukan oleh seorang penjahit mengenai panjang lengan, kaki, lebar bahu,
ukuran pinggang dan lain-lain. (2) Pengukuran yang dilakukan untuk menguji sesuatu,
seperti pengukuran untuk menguji daya tahan mesin sepeda motor, pengukuran untuk
menguji daya tahan lampu pijar, dan lain-lain. (3) Pengukuran untuk menilai yang
dilakukan dengan menguji sesuatu, seperti pengukuran kemajuan belajar peserta didik
dalam rangka mengisi nilai rapor yang dilakukan dengan menguji mereka dalam bentuk
13
tes hasil belajar. Pengukuran jenis ketiga inilah yang dikenal dalam dunia pendidikan
(Anas Sudiyono, 1996).
Hal-hal yang termasuk evaluasi hasil belajar meliputi alat ukur yang digunakan,
cara menggunakan, cara penilaian, dan evaluasinya. Alat ukur yang digunakan bisa
berupa tugas-tugas rumah, kuis, ujian tengah semester (UTS), dan ujian akhir semester
(UAS). Pada prinsipnya, alat ukur yang digunakan harus memiliki bukti kesahihan
(validitas) dan kehandalan (reliabilitas) yang tinggi.
Kesahihan atau validitas alat ukur dapat dilihat dari konstruk alat ukur, yaitu
mengukur sesuatu yang direncanakan akan diukur. Menurut teori pengukuran, substansi
yang diukur harus satu dimensi. Aspek bahasa, kerapian tulisan tidak diskor atau
diperhitungkan bila tujuan pengukuran adalah untuk mengetahui kemampuan peserta
didik dalam mata pelajaran tertentu. Konstruksi alat ukur dapat ditelaah pada aspek
materi, teknik penulisan soal, dan bahasa yang digunakan. Pakar di bidangnya atau
teman sejawat merupakan penelaah yang baik untuk memberikan masukan tentang
kualitas alat ukur yang digunakan termasuk tes.
Kesahihan alat ukur juga bisa dilihat dari kisi-kisi alat ukur. Kisi-kisi ini berisi
materi yang diujikan, bentuk dan jumlah soal, tingkat berpikir yang terlibat, bobot soal,
dan cara penskoran. Kisi-kisi yang baik adalah yang mewakili bahan ajar. Untuk itu
pokok bahasan yang diujikan dipilih berdasarkan kriteria: (1) pokok bahasan yang
esensial, (2) memiliki nilai aplikasi, (3) berkelanjutan, (4) dibutuhkan untuk
mempelajari mata pelajaran yang lain. Hal lain yang penting adalah lamanya waktu
yang disediakan untuk mengerjakan soal ujian. Ada yang berpendapat, kisi-kisi ini
sebaiknya disampaikan kepada peserta didik.
14
Kesalahan yang sistematik disebabkan oleh alat ukurnya, yang diukur, dan yang
mengukur. Ada guru yang cenderung membuat soal tes yang terlalu mudah atau sulit,
sehingga hasil pengukuran bisa underestimate atau overestimate dari kemampuan yang
sebenarnya. Setiap orang yang dites, teramsuk peserta didik, tentu memiliki rasa
kecemasan walau besarnya bervariasi. Apabila ada peserta didik yang selalu memiliki
tingkat kecemasan tinggi ketika dites, hasil pengukurannya cenderung underestimate
dari kemampuan yang sebenarnya.
Ada beberapa kelamahan teori tes klasik, dan yang paling menonjol adalah
ketergantungan statistik butir pada karakteristik kelompok yang diukur. Dengan
demikian, besarnya statistik butir bervariasi dari satu kelompok terhadap kelompok
yang lain. Akibatnya, sulit membandingkan kemampuan kelompok yang satu dengan
kelompok lainnya, apalagi antar individu. Kelemahan ini sudah lama disadari, yaitu
sejak dikembangkannya alat ukur yang digunakan pada bidang ilmu-ilmu alam atau
teknologi. Alat ukur yang digunakan pada bidang ini tidak tergantung pada objek yang
diukur, karena karakteristiknya tidak berubah-ubah selama objek yang diukur sama. Hal
ini mudah difahami karena yang diukur adalah benda atau objek yang mati. Berbeda
dengan objek pada bidang pendidikan, yaitu manusia. Keadaan manusia seperti kondisi
senang dan susah, selalu berubah dari waktu ke waktu, sehingga hasil pengukuran yang
diperoleh belum tentu menunjukkan karakteristik individu yang sebenarnya. Oleh
15
karena itu, dikembangkan teori pengukuran yang dapat mengatasi kelemahan teori
klasik.
Teori klasik yang berkembang pada saat ini –yang disebut dengan teori modern-
menggunakan beberapa asumsi dasar. Asumsi utamanya adalah peluang seseorang
menjawab benar suatu butir tidak ditentuka oleh peluang menjawab butir yang lain,
yang dikenal dengan asumsi independen. Teori modern ini berusaha untuk
mengembangkan suatu analisis yang menghasilkan estimasi kemampuan seseorang
tanpa dipengaruhi oleh alat ukur yang digunakan. Demikian juga statistik butir
diusahakan agar tidak tergantung pada karakteristik individu yang diukur. Berdasarkan
sifat-sifat ini, teori tes modern dikembangkan oleh banyak pakar pengukuran di dunia
ini.
16
Menurut Angelo dan Croos (Abidin, 2014), asesmen atau penilaian merupakan sebuah
proses yang didesain untuk membantu guru menemukan hal-hal yang telah dipelajari
siswa di dalam kelas dan tingkat keberhasilannya dalam pembelajaran.
James A. Mc. Lounghlin & Rena B Lewis mendefinisikan asesmen sebagai proses
sistematika dalam mengumpulkan data seseorang anak yang berfungsi untuk melihat
kemampuan dan kesulitan yang dihadapi seseorang saat itu, sebagai bahan untuk
menentukan apa yang sesungguhnya dibutuhkan. Berdasarkan informasi tersebut guru
akan dapat menyusun program pembelajaran yang bersifat realitas sesuai dengan
kenyataan objektif.
Asesmen menurut Dariyanto (2010:130) adalah suatu proses untuk menyimpulkan
hasil pengukuran melalui analisis yang sistematis dengan menggunakan kriteria
seperti baik, buruk, cocok tidak cocok sesuai dengan penilaian kriteria masing-
masing.
Penilaian menurut Zaenal Arifin (2009:2) merupakan suatu proses atau kegiatan yang
sistematis dan berkesinambungan untuk mengumpulkan informasi tentang proses dan
hasil belajar peserta didik dalam rangka membuat keputusan-keputusan berdasarkan
kriteria dan pertimbanagan tertentu.
Haryati (2009:15) berpendapat lain, ia mengungkapkan bahwa penilaian (assessment)
merupakan istilah yang mencakup semua metode yang biasa dipakai untuk
mengetahui keberhasilan belajar siswa dengan cara menilai unjuk kerja individu
peserta didik atau kelompok.
18
peserta didik itu sendiri, sekolah, orang tua, maupun pihak-pihak lain yang
berkepentingan.
Tujuan penilian dalam bidang pendidikan adalah untuk meningkakan kinerja individu
atau lembaga. Usaha peningkatan kinerja harus didasarkan pada kondisi saat ini yang
diperoleh melalui kegiatan penilaian atau asessmen. Data untuk kepentingan penilaian
diperoleh dengan menggunakan alat ukur. Alat ukur yang banyak digunakan dalam penilaian
pendidikan adalah tes. Agar diperoleh data yang akurat, tes yang digunakan harus memiliki
bukti-bukti tentang kesahihan dan kehandalannya. Dengan demikian, peningkatan kualitas
pendidikan memerlukan alat ukur yang sahih dan handal.
19
c) Penilaian berfungsi sebagai penempatan. Pendekatan yang lebih bersifat
melayani perbedaan kemampuan adalah pengajaran secara kelompok. Untuk
dapat menentukan secara pasti di kelompok mana siswa akan ditempatkan,
digunakan suatu penilaian. Sekelompok siswa yang memiliki hasil penilaian
yang sama akan berada di dalam kelompok yang sama.
d) Penilaian berfungsi sebagai pengukur keberhasilan. Fungsi ini dimaksudkan
untuk mengetahui sejauh mana program berhasil diterapkan. Keberhasilan
program ditentukan oleh beberapa faktor yaitu faktor guru, metode mengajar,
kurikulum, sarana, dan sistem administrasi.
20
4) Untuk keperluan pengembangan dan perbaikan kurikulum sekolah yang
bersangkutan.
21
teknik asesmen yang berbeda, misalnya untuk dapat melakukan asesmen
kemampuan siswa dalam pemecahan masalah dalam matematika tentu akan
sangat berbeda dengan kemampuan membaca atau mendengarkan, dan berbeda
pula untuk pemecahan masalah IPS yang memerlukan diskusi;
3) Memilih teknik asesmen untuk setiap target pembelajaran, pemilihan teknik
asesmen harus didasarkan pada kebutuhan praktis di lapangan dan efisiensi.
Teknik asesmen ini harus dapat mengungkapkan kemampuan khusus serta untuk
mengembangkan kemampuan siswa, sehingga ketika memilih teknik asesmen
harus pula dipertimbangkan manfaatnya untuk umpan balik bagi siswa. Sebab
itu, ketika melakukan interpretasi dari hasil asesmen haruslah dengan cermat,
dengan menghindari berbagai keterbatasan yang bersumber dari subyektifitas
pelaksana asesmen.
Evaluasi menurut Griffin & Nix (1991) adalah judgment terhadap nilai atau
implikasi dari hasil pengukuran. Menurut definisi ini selalu didahului dengan kegiatan
pengukuran dan penilaian. Menurut Tyler (1950), evaluasi adalah proses penentuan
sejauh mana tujuan pendidikan telah tercapai. Masih banyak lagi definisi tentang
evaluasi, namun semuanya selalu memuat masalah informasi dan kebijakan, yaitu
informasi tentang pelaksanaan dan keberhasilan suatu program yang selanjutnya
digunakan untuk menentukan kebijakan berikutnya.
22
mengevaluasi program pembelajaran harus memiliki kesalahan sekecil mungkin.
Evaluasi pada dasarnya adalah melakukan judgment terhadap hasil penilaian, maka
kesalahan pada penilaian dan pengukuran harus sekecil mungkin.
Stark dan Thomas (1994) menyatakan bahwa evaluasi yang hanya melihat
kesesuaian antara unjuk kerja dan tujuan telah dikritik karena menyempitkan fokcus
dalam banyak situasi pendidikan. Hasil yang diperoleh dari suatu program
pembelajaran bisa banyak dan multi dimensi. Ada yang terkait dengan tujuan ada yang
tidak. Yang tidak terkait dengan tujuan bisa bersifat positif dan bisa negatif. Oleh
karena itu, pendekatan goal free dalam melakukan evaluasi layak untuk digunakan.
Walaupun tujuan suatu program adalah untuk meningkatkan prestasi belajar, namun
bisa diperoleh hasil lain yang berupa rasa percaya diri, kreatifitas, kemandirian, dan
lain-lain.
Astin (1993) mengajukan tiga butir yang harus dievaluasi agar hasilnya dapat
meningkatkan kualitas pendidikan. Ketiga butir tersebut adalah masukan, lingkungan
sekolah, dan keluarannya. Selama ini yang dievaluasi adalah prestasi belajar peserta
didik, khususnya pada ranah kognitif saja. Ranah afektif jarang diperhatikan lembaga
pendidikan, walau semua menganggap hal ini penting, tetapi sulit untuk mengukurnya.
23
Hasil evaluasi pendidikan yang bersifat nasional dapat dianalisis untuk
memperoleh informasi yang akurat untuk perbaikan kualitas pendidikan nasional.
Namun hal ini belum banyak dilakukan, sehingga tiap sekolah tidak menerima
kekurangannya secara rinci. Akibatnya, proses pembelajaran yang dilakukan di kelas
dari tahun ke tahun tidak banyak mengalami perubahan. Evaluasi pendidikan yang
bersifat nasional yang diselenggarakan setiap tahun seperti program rutin saja, karena
hasilnya belum memberikan kontribusi yang berarti terhadap peningkatan kualitas
pendidikan.
Ditinjau dari cakupannya, evaluasi ada yang bersifat makro dan ada yang mikro.
Evaluasi makro cenderung menggunakan sampel dalam menelaah suatu program dan
dampaknya. Sasaran evaluasi yang bersifat makro adalah program pendidikan, yaitu
program yang direncanakan untuk memperbaiki program pendidikan. Evaluasi mikro
sering digunakan di tingkat kelas, khususnya untuk mengetahui pencapaian kemajuan
belajar peserta didik. Pencapaian belajar ini bukan hanya yang bersifat kognitif saja,
tetapi juga mencakup semua potensi yang ada pada peserta didik. Jadi. Sasaran evaluasi
mikro adalah program pembelajaran di kelas dan yang menjadi penanggungjawabnya
adalah guru untuk tingkat sekolah, dan dosen untuk tingkat perguruan tinggi.
24
Dampak hasil evaluasi terhadap motivasi belajar peserta didik adalah yang
meningkat, tetap, bahkan ada yang turun. Setiap peserta didik mempunyai harapan
terhadap hasil ujian (ulangan) pelajaran, yaitu besarnya prestasi yang dinyatakan
dengan dalam skor hasil tes. Harapan ini ada yang terpenuhi dan ada yang tidak
terpenuhi. Sesuai dengan karakteristik peserta didik, ada yang motivasi belajarnya naik,
ada yang tetap, dan kemungkinan ada yang turun.
Masalah yang sering timbul dalam melakukan evaluasi terletak pada tujuannya,
pendekatan yang digunakan, manfaatnya dan dampaknya, baik yang berskala makro
maupun mikro. Selain itu evaluasi pendidikan juga harus memberi manfaat kepada
peserta didik, lembaga, dan masyarakat. Oleh karena itu, apabila evaluasi pendidikan
yang digunakan tidak membawa peningkatan kualitas pendidikan pada suatu sekolah
dan tidak memberi manfaat, berarti sistem evaluasi yang digunakan atau yang
dilaksanakan belum berfungsi seperti yang diharapkan.
25
sekolah. Pelaksanaannya tidak harus di akhir tahun pelajaran suatu jenjang pendidikan,
bisa saja di kelas 4 atau 5 SD/MI, di kelas 8 SMP/MTs, atau di kelas 11 SMA/MA.
Sementara itu, sebagian besar negara maju sangat mengembangkan sejumlah tes
baku, termasuk non tes yang digunakan untuk mengukur kemampuan non akademik.
Tes ini sangat dibutuhkan untuk mengetahui perkembangan kualitas pendidikan.
Sekolah di Amerika cenderung memiliki kebebasan dalam menentukan kurikulum yang
digunakan, namun tagihannya sama, yaitu prestasi yang diukur dengan tes baku,
sehingga hasilnya bisa dibandingkan antar tempat dan antar tahun. Di Jepang dan
Inggris, digunakan kurikulum nasional yang diturunkan berdasarkan kompetensi yang
ingin dicapai. Walau ada variasi dalam penggunaan kurikulum, namun sebagian besar
menggunakan tes yang bersifat nasional untuk memantau perkembangan dan
peningkatan kualitas pendidikan. Hal ini perlu dicermati dan dipertimbangkan dalam
upaya memperbaiki pelaksanaan evaluasi pendidikan.
Dari beberapa uraian di atas, dapat ditarik kesimpulan bahwa hubungan antara
pengukuran (measurement), penilaian (assessment), dan evaluasi (evaluation) bersifat
hirarkis. Pengukuran membandingkan hasil pengamatan dengan Kriteria, penilaian
menjelaskan dan menafsirkan hasil pengukuran, sedangkan evaluasi adalah penetapan
nilai atau implikasi suatu perilaku, bisa perilaku individu atau lembaga. Sifat yang
hirarkis ini menunjukkan bahwa setiap kegiatan evaluasi melibatkan penilaian dan
pengukuran. Penilaian berarti menilai sesuatu, sedangkan menilai itu mengandung arti
mengambil keputusan terhadap sesuatu dengan mendasarkan diri pada ukuran atau
criteria tertentu, seperti menilai seseorang sebagai orang yang pandai karena memiliki
skor tes inteligensi lebih dari 120, sedangkan evaluasi menacakup baik kegiatan
pengukuran maupun penilaian.
Pengukuran
Penilaian
Evaluasi
Tujuan Evaluasi
26
Tujuan evaluasi dalam bidang pendidikan dapat dibedakan menjadi dua macam,
yaitu tujuan umum dan tujuan khusus.
Tujuan Umum
Secara umum, tujuan evaluasi adalah:
a. Untuk menghimpun data dan informasi yang akan dijadikan sebagai bukti
mengenai taraf perkembangan atau kemajuan yang dialami peserta didik setelah
mereka mengikuti proses pembelajaran dalam jangka waktu tertentu. Dengan kata
lain, tujuan umum evaluasi adalah untuk memperoleh data pembuktian yang akan
menjadi petunjuk sampai dimana tingkat pencapaian kemajuan peserta didik
terhadap tujuan atau kompetensi yang telah ditetapkan setelah mereka menempuh
proses pembelajaran dalam jangka waktu tertentu.
b. Untuk mengetahui tingkat efektifitas proses pembelajaran yang telah dilakukan
oleh guru dan peserta didik.
Tujuan Khusus
a. Untuk merangsang kegiatan peserta didik dalam menempuh program pendidikan.
Tanpa ada evaluasi maka tidak mungkin timbul kegairahan atau rangsangan pada
diri peserta didik untuk memperbaiki dan meningkatkan prestasinya masing-
masing.
b. Untuk mencari dan menemukan factor-faktor penyebab keberhasilan dan
ketidakberhasilan peserta didik dalam mengikuti program pendidikan, sehingga
dapat dicari dan ditemukan jalan keluar atau cara-cara perbaikannya.
Tipe-tipe Evaluasi
a) Evaluasi Formatif dan Evaluasi Sumatif
Evaluasi formatif bertujuan untuk menyempurnakan program dan memantau
kemajuan siswa. Evaluasi ini dilakukan di sela-sela program yang sedang
berlangsung, dengan tujuan agar hasilnya dapat digunakan untuk menyempurnakan
program. Pelaksanaan tes secara periodik dan dilakukan beberapa kali, seperti tes
mingguan, bulanan.
Evaluasi sumatif adalah evaluasi yang dilaksanakan pada akhir suatu program,
misalnya akhir catur wulan, akhir semester. Nilai yang diperoleh pada evaluasi
sumatif biasanya dilaporkan dalam bentuk rapor, sementara hasilnya dinyatakan
dalam bentuk nilai tertentu atau dalam bentuk laporan secara deskriptif.
27
b) Evaluasi produk dan Evaluasi Proses
Berdasarkan atas tujuan-tujuan khusus program, dapat menekankan perhatian
pada produk yang dihasilkan dari unjuk kerja fisik, proses yang menghasilkan
produk, atau keduanya. Misalnya, dalam evaluasi produk, menentukan urutan
hasil akhir dalam perlombaan lari 10 Km hanya memerlukan catatan waktu
seorang pelari yang diperlukan untuk menempuh jarak perlombaan. Hal ini
disebut evaluasi produk.
Apabila nita menaruh minat untuk memperbaiki gaya lari para pelari, maka
kita perlu menganalisa proses terjadinya gerak lari, termasuk aspek-aspek seperti
penempatan kaki pelari, ayunan lengan, panjang langkah, kecondongan tubuh dan
sebagainya. Hal ini merupakan evaluasi proses. Untuk sebagian besar aktivitas,
harus memperhatikan keduanya baik evaluasi produk maupun proses. Beberapa
aktivitas misalnya senam, lebih banyak memberi kemungkinan untuk evaluasi
proses daripada evaluasi produk.
Fungsi Evaluasi
Secara umum, evaluasi sebagai suatu tindakan atau proses setidak-tidaknya
memiliki tiga macam fungsi pokok yaitu (a) mengukur kemajuan, (b) menunjang
penyusunan rencana, dan (c) memperbaiki atau melakukan penyempurnaan kembali.
Adapun secara khusus, fungsi evaluasi di bidang pendidikan dapat dilihat dari tiga segi,
yaitu (a) segi psikologis, (b) segi pedagogis-didaktik, dan (c) segi administratif.
Secara psikologis, evaluasi dalam bidang pendidikan di sekolah dapat ditilik dari
dua sisi, yaitu dari sisi peserta didik dan dari sisi pendidik. Bagi peserta didik, evaluasi
pendidikan secara psikologis akan memberikan pedoman atau pegangan batin kepada
28
mereka untuk mengenal kapasitas dan status dirinya masing-masing di tengah-tengah
kelompoknya atau kelasnya. Masing-masing mereka akan mengetahui apakan dia
termasuk siswa yang pandai, rata-rata, atau berkemampuan rendah.
Bagi guru atau pendidik, evaluasi pendidikan akan memberikan kepastian atau
ketetapan hati kepada dirinya tentang sejauh manakah usaha pendidikan-pengajaran
yang telah dilakukannya selama ini telah membawa hasil, sehingga dia secara
psikologis memiliki pedoman atau pegangan batin yang berguna untuk menentukan
langkah-langkah apa saja yang dipandang perlu dilakukan selanjutnya. Misalnya,
dengan menggunakan metode-metode mengajar tertentu, hasil belajar para peserta didik
telah menunjukkan adanya peningkatan daya serap terhadap materi yang diajarkan,
maka atas dasar evaluasi, penggunaan metode-metode tersebut perlu dipertahankan.
Sebaliknya, apabila hasil belajar para peserta didik ternyata tidak menggembirakan,
maka guru akan berusaha melakukan perbaikan-perbaikan dan penyempurnaan sgar
hasil belajar peserta didiknya menjadi lebih baik.
Bagi peserta didik, secara didaktik, evaluasi pendidikan akan dapat memberikan
dorongan atau motivasi kepada mereka untuk dapat memperbaiki, meningkatkan, dan
mempertahankan prestasinya. Evaluasi belajar misalnya akan menghasilkan nilai-nilai
hasil belajar untuk masing-masing individu peserta didik. Ada peserta didik yang
nilainya jelek, karena itu dia terdorong untuk memperbaikinya, agar di waktu
mendatang nilai hasil belajarnya tidak sejelek sekarang. Ada peserta didik yang yang
nilainya tidak jelek tetapi belum dikatakan baik atau memuaskan, maka dia akan
memperoleh dorongan untuk meningkatkan prestasi belajarnya di waktu mendatang.
Ada juga peserta didik yang sudah mendapatkan nilai yang baik, dan dia tentu akan
termotivasi untuk dapat mempertahankan prestasinya pada waktu mendatang.
Secara didakti, bagi guru, evaluasi pendidikan setidaknya memiliki lima macam fungsi, yaitu:
a. Fungsi diagnostik: Memberikan landasan untuk menilai hasil usaha atau prestasi yang
telah dicapai oleh peserta didiknya.
b. Fungsi penempatan: Memberikan informasi yang sangat berguna untuk mengetahui
posisi masing-masing peserta didik di tengah-tengah kelompoknya.
c. Fungsi selektif: Memberikan bahan yang sangat penting untuk memilih dan
menetapkan status peserta didik.
29
d. Fungsi bimbingan: Memberikan pedoman untuk mencari dan menemukan jalan keluar
bagi peserta didik yang memang memerlukannya.
e. Fungsi intruksional: Memberikan petunjuk tentang sejauh mana program pengajaran
(kompetensi yang telah ditentukan) bisa tercapai.
Adapun secara administratif, evaluasi pendidikan memiliki tiga macam fungsi, yaitu:
a. Memberikan laporan
Dengan melakukan evaluasi, akan dapat disusun dan disajikan laporan mengenai
kemajuan dan perkembangan peserta didik setelah mereka mengikuti proses
pembelajaran dalam jangka waktu tertentu. Laporan ini pada umumnya tertuang
dalam bentuk rapor (untuk siswa) dan Kartu Hasil Studi (KHS) untuk mahasiswa.
Baik rapor maupun KHS sebaiknya dikirimkan kepada orang tua/wali pada akhir
semester.
b. Memberikan informasi atau data
Setiap keputusan pendidikan harus didasarkan kepada data yang lengkap dan akurat.
Dalam hubungan ini, nilai-niliah hasil belajar para peserta didik yang diperoleh
melalui kegiatan evaluasi merupakan data yang sangat penting untuk keperluan
pengambilan keputusan pendidikan. Keputusan untuk meluluskan atau menaikkan
peserta didik harus dilakukan berdasarkan data dari kegiatan evaluasi.
c. Memberikan gambaran
Gambaran mengenai hasil-hasil yang telah dicapai dalam proses pembelajaran
tercermin antara lain dari hasil-hasil belajar para peserta didik setelah dilakukan
kegiatan evaluasi hasil belajar. Dari kegiatan evaluasi ini akan tergambar dalam
matapelajaran apa saja kemampuan para peserta didik masih memprihatinkan, dan
dalam matapelajaran apa saja prestasi mereka sudah baik.
Agar diperoleh pemahaman yang lebih baik tentang fungsi evaluasi pendidikan ini,
bisa dilihat dalam bagan berikut ini:
30
Mengukur Kemajuan
Secara
Menunjang Penyusunan
Umum
Rencana
Memperbaiki kembali
Memberikan Laporan
Administra Memberikan Data
tif Memberikan Gambaran
Ranah Kognitif
Aspek atau domain kognitif adalah ranah yang mencakup kegiatan mental (otak).
Menurut Bloom, segala upaya yang menyangkut otak adalah termasuk dalam ranah
kognitif. Dalam ranah kognitif terdapat enam jenjang proses berpikir, mulai dari
jenjang terendah sampai dengan jenjang yang paling tinggi. Keenam jenjang dmaksud
adalah (1) pengetahuan, hafalan, ingatan (knowledge), (2) pemahaman
(comprehension), (3) penerapan (application), (4) analisis (analysis), (5) sintesis
(synthesis), dan (6) penilaian (evaluation).
31
lain-lain tanpa mengharapkan kemampuan untuk menggunakannya. Pengetahuan atau
ingatan ini merupakan tingkat berpikir yang paling rendah. Salah satu contoh hasil
belajar kognitif pada jenjang pengetahuan adalah peserta didik dapat menghafal surat
al-'Ashr, menerjemahkan dan menuliskannya kembali secara baik dan benar, sebagai
salah satu materi pelajaran kedisiplinan yang diberikan guru Pendidikan Agama Islam
di sekolah. Contoh lainnya, peserta didik dapat mengingat kembali peristiwa kelahiran
Rasulullah saw.
32
bagian atau unsur-unsur secara logis, sehingga menjelma menjadi suatu pola yang
berstruktur atau berbentuk pola baru. Taraf berpikir sintesis kedudukannya setingkat
lebih tinggi daripada taraf berpikir analisis. Salah satu contoh hasil belajar kognitif pada
taraf sintesis adalah peserta didik mampu menulis karangan tentang pentingnya
kedisiplinan sebagaimana telah diajarkan oleh Islam. Dalam karangannya itu, peserta
didik juga dapat mengemukakan secara jelas gagasan-gagasannya sendiri atau orang
lain, data-data atau informasi lain yang mendukung pentingnya kedisiplinan.
Penilaian atau penghargaan atau evaluasi merupakan jenjang berpikir paling tinggi
dalam ranah kognitif menurut taksonomi Bloom. Penilaian atau evaluasi merupakan
kemampuan seseorang untuk membuat pertimbangan terhadap suatu situasi, nilai, atau
ide. Misalnya, jika seseorang dihadapkan pada beberapa pilihan maka dia akan mampu
memilih satu pilihan yang terbaik sesuai dengan patokan-patokan atau criteria yang
ada. Contoh hasil belajar kognitif taraf evaluasi adalah peserta didik mampu
mengidentifikasi manfaat kedisiplinan dan mudharat kemalasan sehingga pada akhirnya
dia berkesimpulan dan menilai bahwa kedisiplinan di samping merupakan perintah
Allah swt juga merupakan kebutuhan manusia itu sendiri.
Keenam jenjang taraf berpikir kognitif ini bersifat kontinum dan overlap atau
tumpang tindih, di mana taraf berpikir yang lebih tinggi meliputi taraf berpikir yang ada
di bawahnya.
Ranah afektif
Ranah afektif ini oleh Krathwohl dan kawan-kawan dirinci ke dalam beberapa
jenjang atau taraf afektif, yaitu (1) penerimaan (receiving), (2) penanggapan
(responding), (3) menilai (valuing), (4) mengorganisasikan (organization), dan (5)
33
karakterisasi dengan nilai atau kompleks nilai (characterization by a value orang value
complex).
Valuing artinya memberikan nilai atau penghargaan terhadap suatu kegiatan atau
objek, sehingga apabila kegiatan itu tidak dikerjakan dirasakan akan membawa
kerugian atau penyesalan. Valuing merupakan taraf afektif yang setingkat lebih tinggi
daripada responding. Terkait dengan proses pembelajaran, peserta didik tidak hanya
mau menerima nilai yang diajarkan tetapi telah mampu untuk menilai konsep atau
fenomena, yaitu baik-buruk. Apabila peserta didik telah mampu untuk mengatakan
bahwa "itu baik atau itu buruk" maka dia sudah mampu untuk melakukan penilaian.
Nilai itu sudah mulai diinternalisasikan ke dalam dirinya, yang selanjutnya bersifat
stabil dan menetap dalam dirinya. Contoh hasil belajar afektif taraf valuing adalah
tumbuhnya kemauan yang kuat dalam diri peserta didik untuk berlaku disiplin, baik di
rumah, sekolah, maupun di masyarakat karena didasari keyakinan dan penilaian bahwa
hidup disiplin adalah baik.
34
Organization artinya mempertemukan perbedaan nilai sehingga terbentuk nilai
baru yang lebih universal, yang membawa kepada perbaikan umum. Mengatur atau
mengorganisasikan merupakan pengembangan dari nilai ke dalam satu sistem
organisasi, termasuk di dalamnya hubungan satu nilai dengan nilai yang lain,
pemantapan dan prioritas nilai yang telah dimilikinya. Contoh hasil belajar afektif taraf
organization adalah peserta didik mendukung penegakkan disiplin nasional yang
dicanangkan oleh pemerintah. Mengatur atau mengorganisasikan ini merupakan taraf
afektif yang setingkat lebih tinggi daripada valuing.
Ranah Psikomotor
Ranah psikomotor adalah ranah yang berkaitan dengan keterampilan (skill) atau
kemampuan bertindak setelah seseorang menerima pengalaman belajar tertentu. Hasil
belajar ranah psikomotor dikemukakan oleh Simpson (1956) yang menyatakan bahwa
hasil belajar psikomotor ini tampak dalam bentuk keterampilan dan kemampuan
bertindak individu. Hasil belajar kognitif dan afektif akan menjadi hasil belajar
psikomotor apabila peserta didik telah menunjukkan perilaku atau perbuatan tertentu
sesuai dengan makna yang terkandung dalam ranah kognitif dan afektifnya.
Sebagai contoh wujud nyata hasil belajar psikomotor untuk tema kedisiplinan
dapat berupa:
35
Peserta didik bertanya kepada guru PAI tentang contoh-contoh kedisiplinan
yang ditunjukkan oleh Rasulullah saw, para sahabat, dan ulama.
Peserta didik mencari dan membaca buku, majalah, dan sumber informasi lain
yang memuat tentang tema kedisiplinan.
Peserta didik dapat memberikan penjelasan kepada siapapun tentang
pentingnya kedisiplinan dalam kehidupan.
Peserta didik menganjurkan kepada siapapun untuk berperilaku hidup disiplin.
Peserta didik dapat memberikan contoh perilaku kedisiplinan dalam bentuk
mentaati peraturan, beribadah, belajar dan lain-lain di manapun dia berada.
Dan lain-lain
36
pertanyaan dalam kegiatan pengukuran (measurement) tidak selalu memiliki jawaban
atau cara pengerjaan yang benar atau salah karena measurement tidak selalu memiliki
jawaban atau cara pengerjaan yang benar atau salah karena measurement dapat dilakukan
melalui alat ukur non-tes.
Membandingkan
Proses untuk menentukan
hasil tes dengan Angka atau skor
Pengukuran kuantitas sesuatu yang
standar ukuran Bersifat kuantitatif
menghasilkan angka.
tertentu
Mengambil keputusan Pemberian atribut
Deskripsi
Penilaian terhadap sesuatu dengan terhadap hasil
Bersifat kualitatif
ukuran baik atau buruk. pengukuran
Pengambilan
Kegiatan yang meliputi dua
keputusan terhadap Keputusan atau
Evaluasi unsur yaitu pengukuran dan
hasil penilaian Justifikasi
penilaian.
lulus/tidak
37
Gambar 1. Diagram hubungan antara peristilahan dalam asesmen & evaluasi
38
39
BAB III
PENUTUP
3.1 Kesimpulan
Tes merupakan alat ukur untuk mengukur kemampuan seorang individu, kemudian
dilakukan proses untuk mengukur kemampuan individu tersebut yang disebut dengan Testing.
Setelah dilakukan testing maka menghasilkan Hasil tes atau lembar kerja. Kemudian
dilakukan Pengukuran, Pengukuran merupakan proses membandingkan hasil tes dengan
standart ukuran tertentu. Pengukuran bersifat kuantitatif karena hasil dari perbandingan
menghasilkan angka atau skor.
Langkah selanjutnya adalah penilaian, penilaian merupakan proses untuk memberikan
atribut atau deskripsi tinggi atau rendah, baik atau buruk dari hasil pengukuran yang berupa
angka tersebut. Penilaian bersifat kualitatif dikarenakan hasil dari penilaian berupa deskripsi.
Kemudian evaluasi, evaluasi adalah justifikasi atau pengambilan keputusan atas hasil
penilaian, apakah individu tersebut lulus atau tidak, naik atau tidak.
40
DAFTAR PUSTAKA
41