1.1 Evaluasi
Batasan konseptual evaluasi adalah suatu kegiatan atau tindakan
yang sistematik dalam upaya menjaring dan menganalisis informasi atau
data yang relevan dengan teknik tertentu untuk membuat keputusan yang
terkait dengan tingkat efektifitas, efisiensi, dan kemenarikan suatu progam
yang dikembangkan untuk mencapai tujuan. Indikator langkah eksplisit
dalam konteks evaluasi adalah adanya kejelasan peran komponen dan
kejelasan tahapan-tahapan proses yang harus dilakukan dan dapat
direplikasi oleh pihak lain dalam upaya mencapai suatu tujuan (Hicks,
1981), yang wujud upayanya menetapkan konteks dan ranah yang dijadikan
objek suatu evaluasi, menentukan dimensi atau aspek yang akan dievaluasi,
mengidentifikasi berbagai data dan atau informasi yang diperlukan,
mengembangkan alat ukur (instrument) pengumpulan data atau informasi,
menentukan tolak ukur, mencari, mengolah, menganalisis dengan teknik
tertentu (Mukhadis, 2013).
Wujud progam dalam evaluasi berupa progam pembelajaran,
progam pelatihan, progam suatu proyek, progam pendidikan, progam
pengentasan kemiskinan, progam pemberdayaan masyarakat dan
sebagainya. Bila dipandang dari sudut sistem sebagai konteks
pengembangan suatu progam, kegiatan evaluasi dapat dikenakan pada pusat
sistem (tidak harus nasional) sampai tingkat lesson (operasional dari setiap
dimensi sistem). Sedangkan dari sisi komponen-komponen progam yang
dijadikan sasaran evaluasi dapat pada lingkup tahapan perencanaan, tahapan
pelaksanaan, tahapan evaluasi, dan tahapan hasil program dengan
seperangkat dimensi dan indikatornya (Mukhadis, 2013).
1.2 Penelitian
Penelitian merupakan upaya sistematik dan komprehensif untuk
menggali, memperoleh, menganalisis, menginterpretasikan, menghasilkan,
memanfaatkan, dan menyebarluaskan ilmu pengetahuan, teknologi, dan seni
(ipteks) yang benar dan dapat dipertanggung-jawabkan secara metodologis.
Aktifitas penelitian di bidang ipteks ditandai dengan upaya yang bersifat
sistematik, adanya sesuatu hasil temuan, adanya kebermanfaatan, dan
adanya tindak lanjut yang diakhiri dengan penyebarluasan temuan atau
pengurusan dan pemberian atau pengakuan hak atas kekayaan intelektual
(Haki), baik berupa hak cipta maupun hak paten. Penelitian mempunyai tiga
jenis yaitu pendekatan penelitian secara kuantitatif, pendekatan penelitian
secara kualitatif, dan pendekatan penelitian secara kuantilatif (Mukhadis,
2013).
Muara akhir dari upaya kegiatan penelitian ilmiah (apakah
menggunakan pendekatan kuantitatif, kualitatif, atau kuantilatif, mixed
method) berorientasi lebih ke arah pada untuk mengetahui (to know),
menjelaskan (to explain), mengkontruksi proposisi (to construct) sebagai
representasi jawaban atas permasalahan yang dipecahkan berdasarkan data
empirik di lapangan (Mukhadis, 2013).
1.3 Pengembangan
Ditinjau dari substansi masalah dan pertimbangan kemanfaatan dari
aktivitas pengembangan lebih mengarah dan berorientasi pada fenomena
masalah-masalah nyata pada latar tertentu (real problem). Latar masalah
dalam konteks ini dapat berupa pelaksanaan suatu program, suatu institusi,
atau suatu sistem atau nahkan suatu organisasi tertentu. Substansi masalah
yang cocok melalui kegiatan pengembangan adalah masalah-masalah nyata
karena keberadaannya akan berpotensi kurang mendukung terhadap
optimnalisasi proses pelaksanaan dan pencapaian hasil suatu program dari
suatu institusi atau suatu sistem atau suatu organisasi. Indikator dari prioritas
masalah program pengembangan adalah adanya kesenjangan yang nyata
antara sesuatu yang dirancang (proses atau hasil) dalam suatu program dan
keberlangsungan proses dan hasil yang dicapai dalam ukuran interval waktu
tertentu (dapat diawal, ditengah, ataupun di akhir). Aktivitas pengembangan
dalam konteks pemecahan masalah merupakan suatu upaya atau suatu
proses sitematik untuk menghasilkan produk (bisa berwujud sistem, model,
peralatan, atau prosedur operasional) sebagai representasi wahana dalam
pemecahan masalah berdasarkan prinsip-prinsip tertentu pada ranah
masalah yang dipecahkan. Hasil dari suatu aktivitas pengembangan dapat
dipilah menjadi dua yaitu menghasilkan prototipe produk yang teruji dan
atau uji efektivitas prototipe hasil pengembangan. Kerangka pikir dalam
kegiatan pengembangan yaitu kegiatan studi pendahuluan, kegiatan
menentukan dan mengembangkan prototipe model, dan terakhir melakukan
kegiatan uji efektifitas dan efisiensi dari prototipe model hasil dari
pengembangan (Mukhadis, 2013).
1.4 Asesmen
Asesmen merupakan upaya bentuk lain dari evaluasi, penelitian,
atau pengembangan dalam pemecahan masalah yang terkait dengan proses
pelaksanaan dan hasil suatu program (pelatihanan, pembelajaran, atau yang
lain. Bahwa asesmen sebagai salah satu bentuk upaya optimalisasi
keberlangsungan proses dan hasil suatuu program yang dirancang. Orientasi
asesmen dalam suatu program (misalnya program pembelajaran) lebih
berupaya memerikan sesuatu aktivitas atau pencapaian tingkat kemajuan
yang telah dicapai oleh peserta suatu program yang terancang berdasarkan
serangkaian informasi (fakta) untuk menggambarkan beberapa karakteristik
pada ranah pencapaian hasil program (Mukhadis, 2013).
Djamarah & Zain. 2006. Strategi Belajar Mengajar. Jakarta: Rineka Cipta
PENGUKURAN ANGKA
ANGKA
KEJELASAN
PECAHAN
ARAH PENGGUNAAN
HASIL PENGUKURAN
BULAT
MAKNA
KONTINUM
DESKRIT
JENIS SKALA
DATA
Penilaian
Pengukuran
INSTRUMEN
VAKIDITAS
Langkah Ketiga
Langkah yang ketiga yaitu pengumpulan data. Pelaksanaan pengumpulan
data diharapkan dapat memenuhi standar minimal dalam kegiatan evaluasi ini perlu
memperhatikan bebrapa hal, yaitu: (1) karakteristik subjek yang dijadikan sumber
data, (2) jenis instrument yang digunakan, baik tes maupun non tes, (3) strategi
pelaksanaan yang dilaksanakan, baik secara langsung maupun tidak langsung, (4)
waktu pengumpulan data, (5) kiat atau pendekatan yang digunakan dalam
berinteraksi dengan sumber data.
Langkah Keempat
Langkah terahir dari kegiatan evaluasi yaitu analisis informasi dan
penetapan standar untuk acuan dalam membuat interpretasi terhadap hasil evaluasi.
Analisis informasi ini dimulai dari pengecekan kelengkapan data berdasarkan
instrument yang terkumpul, identifikasi dan pengolahan data, penetapan analisis
dan melakukan analisis informasi dengan standar yang telah ditetapkan. Standar
yang digunakan dalam membuat justifikasi dapat berupa absolute, relative, atau
ipsatif yang pemilihannya bergantung pada sifat, tujuan, dan implikasi dari kegiatan
evaluasi yang dilakukan. Kegiatan yang terakhir ini biasanya disebut sebagai
tahapan interpretasi hasil evaluasi. Dengan representasi interpretaasi ini, maka
diugunakan acuan dalam membuat suatu keputusan atas hasil program yang
dijadikan objek evaluasi.
Dalam evaluasi belajar mengajar dikenal dua tes yaitu tes objektif dan tes
subjektif.
Kedua tes ini mempunyai perbedaan yang cukup signifikan.
1. Pengertian tes objektif
Tes objektif adalah tes yang dilakukan dengan menggunakan ukuran-ukuran
yang sudah ditentukan. Contohnya multiple choice (pilihan ganda).
Dalam tes objektif ini siswa tinggal memilih beberapa opsi sesuai dengan
pertanyaan yang disediakan. Dari opsi tersebut ada jawaban breaker, satu
jawaban yang mirip dengan jawaban yang benar.
2. Pengertian tes subjektif
Tes subjektif adalah tes yang dilakukan dengan ukuran-ukuran berdasarkan
kategori. Contohnya tes essay atau uraian.
Tes uraian menuntut siswa untuk menjawab soal dengan kemampuan yang
ia miliki. Tidak masalah apakah ia menjawab panjang atau pendek.
Penilaian tes subjektif dilakukan berdasarkan kategori yang ditentukan oleh
pembuat soal. Walaupun jawabannya panjang tapi tidak sesuai dengan
kategori yang ditentukan pembuat soal, maka skornya belum tentu tinggi.
Ada pula kelebihan dan kekurangan dari tes objektiv dan tes subjektif,
sebagai berikut :
TES OBJEKTIF
Tes objektif adalah tes yang dalam pemeriksaannya dapat dilakukan secara
objektif. Hal ini dimaksudkan untuk mengatasi kelemahan-kelemahan dari tes
bentuk essai. Contohnya multiple choice (pilihan ganda).
a. Kelebihan Test Objektif yaitu:
TES SUBJEKTIF
Pada umumnya test subjektif berbentuk tes esai (uraian). Ciri-ciri pertanyaanya
didahului dengan kata-kata seperti, uraikan, jelaskan, mengapa, bagaimana,
bandingkan, simpulkan dan sebagainya.
a. Kelebihan Test Subjektif yaitu:
1. Mudah dipersiapkan dan disusun.
2. Tidak memberi banyak kesempatan untuk berspekulasi.
3. Mendorong peserta didik untuk berani mengemukakan pendapat serta
menysun dalam bentuk kalimat yang bagus.
4. Memberi kesempatan kepada peserta didik untuk mengutarakan maksudnya
dengan gaya bahasa dan carannya sendiri.
5. Dapat mengetahui sejauhmana peserta didik mendalami suatu masalah yang
diujikan/dites.
b. Kelemahan Test Subjektif yaitu:
1. Terbatasnya lingkup bahan pelajaran yang dinilai dan sulitnya mengoreksi
jawaban dengan objektif.
2. Kadar validitas dan realibilitas rendah karena sukar diketahui segi-mana dai
pengetahuan siswa yang betul-betul telah dikuasai.
3. Kurang representatif dalam hal mewakili seluruh scope bahan pelajaran yang
akan dites karena soalnya hanya beberapa saja (terbatas).
4. Cara pemeriksaannya banyak dipengaruhi oelh unsur-unsur subjektif.
5. Pemeriksaaannya lebih sulit sebab membutuhkan pertimbangan individual
lebih banyak dari penilai.
6. Waktu untuk koreksinya lama dan tidak dapat diwakilkan kepada orang lain.
Soedijarto (1993). Menuju Pendidikan Nasional yang Relevan dan Bermutu. Jakarta
: Balai Pustaka
Subino. (1987). Konstruksi dan Analisis Tes : Suatu Pengantar Kepada Teori Tes
dan Pengukuran. Jakarta : Ditjen Dikti Debdikbud
Pertemuan ke-5: Topik Diskusi Langkah-langkah Perencanaan dan
Pengembangan Alat Evaluasi dan Penilaian Pembelajaran (test non test)
Menurut (Joni, 1984) pengembangan adalah suatu upaya atau suatu proses
sistematik untuk menghasilkan suatu produk (bisa berwujud sistem, model,
peralatan, atau prosedur operasional) sebagai representasi wahana dalam
pemecahan masalah berdasarkan prinsip-prinsip tertentu pada ranah masalah yang
dipecahkan. Keberhasilan suatu kegiatan evaluasi akan dipengaruhi pula oleh
keberhasilan evaluator dalam melaksanakan prosedur evaluasi. Prosedur yang
dimaksud adalah langkah-langkah pokok yang harus ditempuh dalam kegiatan
evaluasi. Prosdur atau langakah pengembangan alat evaluasi dan penilaian
pembelajaran di uaraikan sebagai berikut:
1. Identifikasi Informasi Awal yang Relevan
B B B B B B B B B B B B
P P P P P P P P P P P P
BP = Butir Pertanyaan
B B B B B B B B B B B B
P P P P P P P P P P P P
BP = Butir Pertanyaan
Bellanca,vdkk. 1997; Kufaman dan Thomas, 1980; dan Piere dan Lorber, 1977
Joni.1984.tentang pengembangan.
Mukhadis, A. 2013. Evaluasi Program Pembelajaran Bidang Teknologi
(Terminologi,Prosedur Pengembangan Program dan Instrumen). Malang:
Media Nusa Creative.
Newman ,William H.2004. Administrative Active Techniques of Organization and
Management.
Pertemuan ke-6: Topik Diskusi Evaluasi Kritis Terhadap Alat Evaluasi dan
Penilaian di Latar Pendidikan Saat Ini
Validasi Isi
Validitas isi merupakan indikator karakteristik keefektifan instrumen
evaluasi yang paling penting. Mengapa dikatakan demikian? Sebab secara umum
keberadaan indikator validitas isi ini dapat dijadikan sebagai petunjuk penting yang
terkait dengna aspek keterwakilan (representativeness) setiap atau sekelompok
dimensi atau isi-isi sampel penting dari sosok keterampilan, pengetahuan, atau
sikap yang dijadikan suatu objek sasaran pengukkuran (Marzano, Pickering dan
McTighe, 1994).
Upaya untuk menilai atau mengukur tingkat validitas isi suatu instrumen
evaluasi dalam suatu aktivitas pengembangan instrumen evaluasi dapat ditempuh
dengan beberapa prosedur tertentu. Langkah-langkah atau prosedur dalam
mengembangkan instrumen dan mengukur tingkat validitas isi suatu instrumen
evaluasi minimal dapat diklasifikasikan menjadi enam tahapan.
1. Pertama, mengidentifikasi, memilih dan yang pada akhirny amenetapkan
ranah, dimensi, fenomena, atau konsep yang akan dijadikan sebagai objek
sasaran pengukuran.
2. Kedua, memberikan batasan operasional terhadap ranah, dimensi atau
fenomena yang akan dijadikan sebgai objek sasaran pengukkuran, sehingga
menjadi jelas sosok dari setiap ranah, dimensi, atau fenomena yang
dijadikan objek sasaran pengukuran. Dengan memberikan batasan pada
ranah yang dijadikan objek sasaran evaluasi secara operasional ini,
diharapkan dapat menjadi petunjuk yang tepat dan sesuai dalam upaya
melakukan dapat menjadi petunjuk yang tepat dan sesuai dalam upaya
melakukan penjabaran ranah yang dijadikan objek sasaran evaluasi ke
dalam bentuk dimensi, dan atau indikator.
3. Ketiga, menjabarkan kandungan isi ranah, dimensi, fenomena, atau konsep
berdasarkan batasan operasional yang telah disepakati atas objek yang akan
dijadikan sebagai objek sasaran pengukuran sesuai domain, atau ranah
tertentu.
4. Keempat, melakukan kajian terhadap keberadaan cakupan jabaran isi ranah,
dimensi, fenomena, atau konsep, dan relevansi serta representatif isi yang
telah dijabarkan. Hasil kajian terhadap jabaran isi ranah atau dimensi
kedalam isi-isi sampel esensial dapat dijadikan indikator untuk melakukan
penggolongan ke dalam kategori sangat representatif, cukup representasti
dan kurang representatif, dan tidak representatif.
5. Kelima, melakukan penjabaran ranah atau domain isi yang relevan dan
representatif ke dalam bentuk indikator-indikator atau deskriptor-
deskriptor. Perian indikator atau deskriptor yang representatif ini yang
dijadikan sebagai terkait dengan upaya pengembangan instrumen jenis tes.
6. Terakhir, berdasarkan pada kegiatan yang telah ditempuh yaitu mulai
langkah pertama sampai dengan langkah keenam tersebut, lalu diikuti
dengan aktivitas pengembangan indikator atau deskriptor-deskriptor dari
setiap ranah atau dimensi ke dalam butir-butir pernyataan. Pada hasil uji
coba instrumen (melalui uji ahli atau uj empirik) yaitu Intepresentasi
kemungkina pertama, haasil analisis sesuai dengan tuntutan kriteria yang
telah ditetapkan. Misal, pemenuhan persyartan terhadap hasil analisis butir,
taraf kesukaran, tingkat daya beda, konsistensi internal, validitas atau
rehabilitas dapat terpenuhi. Kemungkinan kedua, yaitu terdapat beberapa
hasil analisis data ujicoba yang belum atau bahkan tidak memenuhi kriteria
minimal yang telah ditetapkan. Misal, dalam hal analisi butir terhadap
validitas atau mengkin juga terhadap konsistensi internal banyak yang tidak
memenuhi persyaratan ari kriteria yang telah ditetapkan.
Validitas Konstruk
Indikator tingkat keefektifan intrumen evaluasi, selain dapat ditentukan
dengan terpenuhinya tuntutan persyaratan minimal dari tingkat validitas isi, juga
dpat dilihat dari terpenuhinya tuntutan persyaratan minimal dari tingkat validitas
konstruknya. Representasi suatu konstruk yang dijadikan objek sasaran pengukuran
ini biasanya merupakan konsep dari suatu variabel yang bersifat abstrak (misalnya
variabel persepsi, variabel sikap atau kapabilitas) terhadap suatu fenomena yang
akan dilakukan pengukuran dengan instrumen evaluasi. Dikarenakan sifat dari
suatu konsep abstrak ini, maka agar dapat diukur dan dikuantifikasikan dengan
sistem dan aturan tertentu perlu dilakukan upaya pembatasan lingkup dan
pendefinisian (pemberian batasan) yang secara jelas dan operasional.
Contoh dari suatu konstruk sebagai objek yang dijadikan sasaran
pengukuran dapat diberikan sebagai berikut. Konstruk tentang persepsi individu
atau kelompok individu tertentu terhadap latar atau lingkungan, atau terhadap
peristiwa tertentu yang dijadikan suatu fenomena stimulus dalam interval waktu
tertentu. Keberadaan persepsi individu atau kelompok individu terhadap
lingkungan tertentu sebagai suatu fenomena adalah bersifat abstrak. Begitu juga,
konstruk tentang sikap individu atau kelompok individu terhadap perilaku atasan,
terhadap perilaku supervisor, terhadap perilaku bawahan, atau terhadap perilaku
kolega dalam suatu fenomena lingkungan sistem atau lembaga tertentu dalam
interval waktu tertentu.
Adapun prosedur atau langkah-langkah yang ditempuh dalam melakukan
kegiatan pengembangan dan penilain terhadap tingkat validitas konstruk suatu
instrumen evaluasi dapat ditempuh dengan hal-hal sebagai berikut.
1. Pertama, memberikan batasan (konseptual dan operasional) terhadap semua
bagian dalam suatu konstruk yang dijadikan objek sasaran pengukuran.
2. Kedua, mengidentifikasi, memilih dan pada akhirnya menetapkan inti dari
dimesi-dimensi suatu konstruk yang dijadikan objek sasaran pengukuran
sesuai dengan batasan operasional yang telah ditetapkan.
3. Ketiga, memilih dan pada akhirnya menetapkan isi-isi sampel esensial dari
setiap dimensi dari hasil pemerian dimensi-dimensi suatu konstruuk yang
dijadikan objek sasaran pengukuran.kualitas dari isi-isi sampel esensial
dimensi ini ditunjukkan dengan beberapa indikator tingkat keterwakilan
(representativeness) sampel dimensi terhadap pemerian dimensi suatu
konstruk yang dijadikan objek sasaran pengukuran.
4. Keempat, melakukan penjabarab sampel esensial dimensi suatu konstruk
yang dijadikan objek sasaran pengukuran ke dalam pemerian-pemerian
beberapa deskriptor dari isi sampel esensial suatu dimensi
5. Kelima, melakukan klasifikasi dari buti pertanyaan atau pernyataan sebagai
representasi dari suatu instrumen evaluasi pada setiap dimensi konstruk atau
pada keseluruhan konstruk sesuai dengna faktor-faktor tertentu.
6. Keenam, berdasarkan klasifikasi faktor-faktor yang ada (berupa butir-butir
pertanyaan dan pernyataan) disinergikan atau disintesiskan ke dalam suatu
bentuk faktor yang bersifat umum sebagai representasi bentuk pengukuran
suatu konstruk tertentu.
Validitas Konkuren
Karakteristik keefektifsn intrumen evaluasi salain dapat dilihat dari tingkat
validitas isi dan validitas konstruk juga dapat dilihat dari validitas konkuren.
Apabila pada penilain validitas isi dan validitas konstruk di atas dilakukan melalui
data atau informasi subjektif atau kualitatif yang diperoleh dari pertimbangan ahli
(expert judgement) pada bidang yang relevan. Target sasaran yang dijadikan ,
dipilih yang memenuhi persyaratan dari aspek karakteristik psikologis.
Tingkat validitas konkuren sebagai salah satu indikator karakteristik
keefektifan suatu instrumen evaluasi adalah sebagai suatu representasi kesesuaian
hasil secara kuantitatif antara dua jenis intrumen yang digunakan untuk mengukur
suatu karakteristik objek sasaran pengukuran tertentu (kognitif, psikomotor, atau
afektif) pada interval waktu tertentu yang relatif sama. Kedua jenis instrumen
evaluasi yang dimaksud adlah satu instrumen sebagai hasil aktivitas pengembangan
instrumen (instrumen baru) yang akan dinilai tingkat validitasnya, sedangkan atu
instrumen lain digunakan sebagai instrumen standart (baku) yang dijadikan sebagai
acuan atau kriteria dalam menguji validitas konkuren (instrumen standar).
Upaya melakukan penelitian tingkat validitas konkuren suatu instrumen
evaluasi dapat dilakukan dengan dua cara. Caraa pertama, dengan menggunakan
dua macam intrumen evaluasi untuk melakukan pengukuran satu fenomena, atau
faktor, atau satu variabel yang dilakukan dalam waktu bersamaan (konkuren).
Kedua instrumen dalam cara pengukuran tingkat validitas konkuren ini adalah satu
instrumen diperankan sebgai instrumen baru (yang dikembangkan dan akan diuji
tingkat validitasnya), dan satu instrumen yang lain berperan sebagai instrumen
kriteria.
Validitas Peramal
Karakteristik keefektifan intrumen evaluasi dengan kriteria eksternal selain
dapat dilakukan dengan cara menilai tingkat validitas secara konkuren juga dapat
dilakukan penilaian dengan validitas peramal (predictive validity) (Cronbach, 1994;
dan Nunnally, 1978). Apabila pada penlaian validitas konkuren suatu instrumen
evaluasi lebih didasarkan pada data empirik yang berasal dari target sasaran yang
akan dikenai alat pengukuran dan lebih berorientasi pada jumlah fenomena, faktor,
atau variabel yang dijadikan objek pengukuran. Kriteria dalam penilaian
keefektifan instrumen dengan vaaliditas peramal dapat dipilah menjadi dua, yaitu
kriteria masa lampau (post predictive validity), dan kriteria masa mendatang (pre-
predictive validity). Untuk melakukan penilaian terhadap tingkat keefektifan suatu
instrumen evaluasi melalui validitas peramal berdasarkan pada data empirik yang
dikumpulkan, diolah dan dianalisis dengan teknik statistik dan rumus tertentu
dengan lebih menekankan pada faktor kriteria yang mengacu baik kriteria pada
masa lalu (post predictive validity) maupun pada masa yang akan datang (pre-
predictive validity).
Tingfkat validitas peramal sebagai salah satu indikator karakteristik
keefektifan suatu instrumen evaluasi adalah merupakan representasi kesesuaian
hasil secara kuantitatif yang diramalkan dalam mengukur suatu kerakteristik
fenomena tertentu (kognitif, psikomotor, dan afektif) pada interval waktu tertentu
sebagai acuan kriteria pada masa lalu atau padaa masa mendatang. Validitas
peramal dengan mengacu kriteria pada masa lalu (post predictive validity) dari
instrumen evaluasi yang dimaksud adalah dengan menempatkan fenomena, faktor
atau variabel sekarang sebagi alat uji atau sebagai alat bukti.
Representasi tingkat validitas instrumen evaluasi dan juga sebagai upaya
untuk menungkatkan tingkat validitas instrumen evaluasi, terutama dalam validitas
empirik disarankan oleh Philips (1991) perlu memperhatikan hal-hal berikut.
Pertama, perlu memperhatikan kejelasan yang terkait dengan ranah (domain),
dimensi dari ranah atau domain, indikator atau deskriptor dari sesuatu yang
dijadikan objek suatu pengukuran. Kedua, dengan memperbanyak jumlah butir
pertanyaan atau deskriptor yang mengacu pada keberadaan sampel esensial dari
setiap dimensi dari ranah yang dijadikan objek pengukuran.
Ketiga, pemilihan diksi, redaksi, baik yang terkait substansi, petunjuk
maupun tampilan instrumen evaluasi diupayakan sekecil mungkin sebgai penyebab
terjadinya suatu respon yang potensial bias. Keempat, pengelolaan dalam
melakukan tahapan persiapan, pelaksaan, dan pengadimistrasian waktu melakukan
uji coba instrumen secara objektif dan sistematik. Kalima, mengenali berbagai
kelemahan kaitan antara sikap dan tingkah laku utamanya dari pihak responden dan
pihak aktor pendukungnya dalam pelksanaan uji coba.
6.2 Reliabilitas Instrumen Evaluasi
Suatu instrumen evaluasi dikatakan memiliki karakteristik reliabilitas yang
memenuhi persyaratan minimal (dalam hal ini efektif), apabila digunakan dalam
kegiatan pengukuran terhadap suatu fenomena, suatu faktor, atau suatu variabel
dalam interval waktu pelaksanaan pengukuran atau pada kelompok yang dijadikan
objek sasaran pengukuran yang relatif sama dan atau relatif berbeda, tetapi
menunjukkan hasil pengukuran yang relatif konsisten (ajeg). Instrumen evaluasi
memiliki karakteristik reliabilitas yang baik (memenuhi persyaratan minimal yang
ditetapkan), apabila memiliki tingkat keajegan hasil pengukuran yang relatif sama
pada waktu pengukuran yang berbeda fenomena, faktor, atau variabel yang sama
atau yang berbeda yang memiliki sifat-sifat yang relatif sama.
2. Pelaksanaan Evaluasi
Pelaksanaan evaluasi artinya bagaimana cara melaksanakan evaluasi
sesuai dengan perencanaan evaluasi. Dalam perencanaan evaluasi telah di
singgung semua hal yang berkaitan dengan evaluasi. Pelaksanaan evaluasi
sangat bergantung pada jenis evaluasi yang digunakan. Dalam pelaksanaan
tes maupun nontes tersebut akan berbeda satu dangan lainnya, sesuai dengan
tujuan dan fungsinya masing-masing. Dalam pelaksanaan tes lisan , misalnya
guru harus memperhatikan tempat tes diadakan. Tempatnya harus tenang,
enak dipandang dan tidak menyeramkan, sehingga peserta didik tidak takut
dan gugup. Guru harus dapat menciptakan suasana yang kondusif dan
komunikatif, tetapi bukan berarti menciptakan suasana tes lisan menjadi
suasana diskusi, debat atau ngobrol santai. Dan informasi keseluruhan aspek
kepribadian dan prestasi belajar peserta didik yang meliputi :
a. Data pribadi (personal) peserta didik, seperti nama, tempat dan tanggal
lahir, jenis kelamin, golongan darah, alamat dan lain-lain.
b. Data tentang kesehatan peseeta didik, seperti pengihatan, pendengaran,
penyakit yang sering diderita dan kondisi fisik.
c. Data tentang prestasi belajar (achievement) peserta didik di sekolah.
d. Data tentang sikap (attitude) peserta didik, seperti sikap terhadap teman
sebaya, sikap terhadap kegiatan pembelajaran, sikap terhadap guru dan
kepala sekolah, serta sikap terhadap lingkungan sosial.
e. Data tentang bakat (aptitude) peserta didik seperti ada tidaknya bakat di
bidang olah raga, keterampilan mekanis, manajemen kesenian dan
keguruan.
f. Persoalan penyesuaian(adjustment), seperti kegiatan anak dalam
organisasi di sekolah, forum ilmiah, olah raga dan kepanduan.
g. Data tentang minat (interest) peserta didik.
h. Data tentang rencana masa depan perserta didik yang dibantu oleh guru
dan orang tua sesuai dengan kesanggupan anak.
i. Data tentang latar belakang keluarga peserta didik, seperti perkerjaan
orang tua, penghasilan tetap tiap bulan, kondisi lingkungan serta
hubungan peserta didik dengan orang tua dan saudara-saudaranya.
Tujuan untuk melaksanakan evaluasi adalah untuk mengumpulkan data.
Ada beberapa hal yang memungkinkan timbulnya kesalahan-kesalahan dalam
pengumpulan data yaitu sebagai berikut :
a. Kesalahan-kesalahan yang mungkin ditimbulkan karena kurang
sempurnanya instrumen evaluasi.
b. Kesalahan-kesalahan yang mungkin ditimbulkan oleh kurang
sempurnanya prosedur pelaksanaan evaluasi yang dilakukan.
c. Kesalahan yang mungkin ditimbulkannya oleh kurang sempurnanya cara
pencatatan hasil evaluasi.
4. Pengolahan Data
Langkah pengolahan data dilakukan untuk memberikan “makna”
terhadap data yang ada pada kita. Macam-macam jenis pengolahan yang
dapat dilihat bahwa ada beberapa macam jenis pengolahan yang dapat
dilakukan terhadap sekumpulan data. Pengolahan yang kita hadapi sekarang
sebagai seorang evaluator adalah menentukan pengolahan mana sajakah yang
harus kita lakukan terhadap sekumpulan data pada sat tertentu. Fungsi
pengolahan data dalam proses evaluasi yang perlu disadari bahwa untuk
memperoleh gambaran yang lengkap tentang diri seorang yang sedang di
evaluasi adalah langkah pengolahan data.
Ada dua jenis penafsiran data, yaitu:
a. Penafsiran kelompok, adalah penafsiran yang dilakukan untuk
mengetahui karakteristik kelompok berdasarkan data hasil evaluasi,
seperti prestasi kelompok, rata-rata kelompok, sikap kelompok terhadap
guru dan materi pelajaran yang di berikan serta distribusi nilai kelompok.
Tujuan utamanya adalah sebagai persiapan utuk melaksanakan
penafsiran kelompok, untuk mengetahui sikap sikap tertentu pada
kelompok dan untuk mengadakan pertandingan antar kelompok.
b. Penafsiran individual adalah penafsiran yang hanya dilakukan secara
perorangan. Misalnya dalam kegiatan bimbingan dan penyuluhan atau
situasi klinis lainnya. Tujuan utamanya adalah untuk melihat tingkat
kesiapan peserta didik (readiness), pertumbuhan fisik, kemajuan belajar,
dan kesulitan-kesulitan yang di hadapinya.
Berdasarkan penafsiran ini dapat diputuskan bahwa peserta didik mencapai
taraf kesiapan yang memadai atau tidak, ada kemajuan yang berarti atau tidak,
ada kesulitan atau tidak.