MAKALAH
Oleh :
Moh. Nanang Rifai (190513731705)
Penulis
BAB I
PENDAHULUAN
A. Latar Belakang
B. Rumusan Masalah
Rumusan masalah dari latar belakang yang telah dibuat sebagai berikut:
1) Apa saja ragam jenis instrumen evaluasi dalam konteks evaluasi pembelejaran di
sekolah ?
2) Apa saja persyaratan instrumen evaluasi dalam konteks evaluasi pembelajaran di
sekolah ?
3) Bagaimana prosedur pengembangan instrumen evaluasi dalam konteks pembelajaran
di sekolah ?
C. Tujuan
1) Agar mahasiswa mampu menjelaskan ragam jenis instrumen evaluasi dalam konteks
evaluasi pembelejaran di sekolah.
2) Mahasiswa mengetahui persyaratan instrumen evaluasi dalam konteks evaluasi
pembelajaran di sekolah.
3) Mahasiswa mengetahui prosedur pengembangan instrumen evaluasi dalam konteks
pembelajaran di sekolah.
BAB II
PEMBAHASAN
Berpijak pada uraian peranan tes dalam pelaksanaan program di atas, dapat
dikatakan bahwa representasi dari fenomena terjadinya peningkatan skor tes secara
kuantitatif ataupun secara kualitatif dapat dimaknai sebagai indikator peningkatan
(perubahan) pada ranah pengetahuan, ketrampilan, atau sikap nilai, cara berpikir dan
bertindak dan unjuk kerja pada diri peserta program. Dalam konteks program
pembelajaran atau pelatihan penerapan instrumen bentuk tes diawal pembelajaran atau
awal pelatihan bertujuan lebih mengarah pada pemetaan kemampuan bekal ajar awal
peserta program. Penetapan instrumen bentuk tes di pertengahan program pembelajaran
tujuannya lebih mengarah pada diagnosis dan pemetaan aspek, komponen, topik program
yang bagi peserta program masih mengalami kesulitan. Implikasi dari hasil pengukuran
program pembelajaran pada tahap ini untuk memilih dan menetapkan subtansi dari topik
yang ada pada kurikulum yang masih dirasakan sulit bagi peserta program dan dijadikan
sebagai dasar mencari dan menetapkan alternatif strategi perbaikannya, sehingga program
dapat berjalan sebagaimana yang telah dirancang. Penerapan instrumen bentuk tes di
akhir program pembelajaraan tujuannya lebih mengarah pada upaya untuk mengukur
pencapaian hasil tujuan program pembelajaran. Implikasi dari hasil pengukuran program
pembelajaran pada tahap ini adalah untuk memilih dan menetapkan peserta program
dikelompokan ke dalam kelompok sudah tuntas atau sudah terampil atau belum tuntas
atau belum terampil.
Bila dilihat dari sisi bentuknya, instrumen jenis wawancara ini dapat dibedakan
menjadi tiga kelempok. Ketiga kelompok tersebut yaitu, instrumen wawancara
terstruktur, wawancara semi terstruktur dan wawancara tidak terstruktur. Bentuk
instrumen wawancara terstruktur dalam hal ini mirip seperti instrumen pengumpulan data
atau informasi jenis koesioner terstruktur. Sedangkan wawancara semi terstruktur, sosok
dan tampilannya lebih mirip seperti instrumen jenis kuesioner semi terstruktur. Terakhir
pada instrumen tipe wawancara tidak terstruktur sosok dan formatnya lebih mirip seperti
instrumen kuesioner yang bersifat open endeed, yaitu memberi peluang kebebasan dan
kesempatan kepada responden untuk mengekspolasi ide atau gagasan sesuai dengan
konteks dimensi dan juga indikator dari berbagai hal yang ditanyakan.
Bentuk instrumen ini akan sangat membantu apabila tujuan utama dari kegiatan
evaluasi yang ingin dicapai adalah bermaksud memperdalam umpan balik (feedback)
yang diperlukan suatu evaluasi program, baik evaluai program pelatihan atau evaluasi
program pembelajaran. Apabila ingin melakukan evaluasi terhadap setiap individu
trainee dirasakan relatif mahal besaran beaya yang harus dikeluarkan, maka dengan
alternatif pilihan pada diskusi kelompok terfokus (Focus Group Discussion-FGD)
menjadi lebih efisien, efektif dan bahkan lebih menarik. Dari kegiatan diskusi ini
diharapkan dapat menggali, mengidentifikasi, mengungkap dan memerikan berbagai hal
yang terkait dengan pertimbangan-pertimbangan yang bersifat kualitatif dan kuantitatif
pada setiap topik atau isu-isu utama yang dijadikan objek sasaran dalam kegiatan diskusi.
1.6 Pengamatan
Menurut mukhadis (2017). Jenis instrumen evaluasi ini biasanya lazim digunakan
untuk mengamati reaksi dan perilaku dari peserta program mulai periode waktu sebelum,
selama dan sesudah suatu program dilaksanakan. Penggunaan instumen jenis ini bagi
para pengumpul data atau informasi dalam pelaksana kegiatan evaluasi program
menuntut beberapa persyratan tertentu. Persyaratan dituntut bagi para pengguna
instrumen jenis ini meliputi antara lain: tingkat kepeawaian, tingkat kecermatan, tingkat
ketelatenan, dan tingkat ketelitian, serta kesabaran bagi pihak pengamat (observer).
Tuntutan tingkat kesabaran ini sangat diperlukan, utamanya pada saat berhadapan dengan
subjek atau objek pengamatan yang terkait dengan perilaku khusus untuk sampai dapat
mengungkap ‘dia sebagai da’ atau ‘mereka sebagai mereka’ yang entuanya akan
membutuhakan interval waktu yang memadai dan tingkat kepekaan yang tinggi
menangkap fenomena objek yang dijadikan sasaran pengamatan yang muncul.
Instrumen jenis rekaman perilaku dan dalam konteks evaluasi program selalu
diperlukan pada setiap organisasi atau lembaga yang membutuhkan kegiatan untuk
mengukur atau memetakan sesuatu (behaviors) dari pihak pelaksana organisasi. Tingkat
efektifitas dan efisiensi dari penggunaan instrumen evaluasi jenis rekaman perilaku ini
dalam kegiatan evaluasi program dapat tentukan dan disyaratkan mingikutai langkah-
langkah tertentu.
Ketujuh jenis instrumen evaluasi program yang telah diuraikan diatas secara
umum dapat dipilah kedalam dua kategori secara umum. Kedua kategori itu meliputi
ketegori instrumen yang termasuk dalam jenis tes dan kategori instrumen yang termasuk
dalam jenis notes. Secara teoritik kedua jenis instrumen dapat dipilah-pilah, namun pada
tataran aplikasinya keberadaan dan peran jenis kedua instrumen ini dalam pelaksanaan
proses pengumpulan data susah untuk dipisah-pisah. Kedua kelompok kategori instrumen
evaluasi ini (jenis tes dan jenis nontes) dalam pelaksanaan pengumpulan data untuk
kepentingan dan tujuan evaluasi suatu program dapat digunakan secara terpisah atau
secara kombinasi diantara keduanya. Dalam kegiatan evaluasi program dapat digunakan
instrumen jenis tes dikombinasi atau dilengkapi dengan instrumen evaluasi jenis nontes.
Atau begitu juga sebaliknya, penggunaan instrumen evaluasi jenis nontes dalam proses
pengumpulan data informasi dapat dikombinasikan dengan jenis instrumen evaluasi jenis
tes. Sifat kombinasi kedua kategori jenis instrumen (tes dan nontes) dalam pelaksanaan
evaluasi program pembelajaran sangat tergantung pada beberapa pertimbangan, baikdari
sisi aspek kecukupan data yang diperlukan.
Gambar 3. Model Garpu Tala Pejabaran Ranah Objek Evaluasi Samapai Butir
Instrumen Jenis Nontes
Begitu juga, dengan cara yang kedua untuk melakukan penentuan validitas
konkuren suatu instrumen dapat dilakukan sebagaimana dengan cara yang pertama,
menggunakan analog dengan cara berpikir yang pertama yaitu dengan menggunakan
dua instrumen evaluasi (instrumen baru dan instrumen kriteria) untuk melakukan
pengukuran dua fenomena, dua faktor atau dua variabel konkuren. Pembeda antara
cara yang pertama dan cara yang kedua dalam melakukan penilaian tingkat validitas
konkuren suatu instrumen adalah pada jumlah fenomena , jumlah faktor atau jumlah
variabel yang dijadikan objek sasaran pengukuran. Prosedur penilaian tingkat
validitas konkuren terhadap suatu instrumen dan juga pembeda dalam kiat
pelaksanaan pengukurannya pada cara tersebut secara skematis dapat
divisualisasikan.
2.1.4 Validitas Peramal
Representasi tingkat validitas instrumen evaluasi dapat juga sebagai upaya untuk
meningkatkan tingkat validitas instrumen evaluasi, terutama pada validitas empirik
disarankan Phillip ( 1991) perlu memperhatikan hal hal berikut. Pertama, perlu
memperhatikan kejelasaan yang terkati dengan ranah (domain), dimensi dari ranah
atau domain, indikator atau diskriptor dari sesuau yang dijadikan objek sasaran
pengukuran.
Kedua, dengan memperbanyak jumlah butir pertanyaan atau butir pernyataan sebagai
represetasi instrumen evaluasi yang dikembangkan dari indikator atau deskriptor
yang mengacu pada keberadaan sampel esensial dari setiap dimensi dari ranah yang
dijadikan objek pengaukuran. Ketiga, pemilihan diksi, redaksi, baik yang terkait
subtansi, petunjuk maupun tampilan instrumen evakuasi diupayakan sekecil mungkin
sebagai penyebab terjadi suatu respon yang potensial bias. Keempat, pengelolaan
dalam melaukan tahapan persiapan, pelaksaan, dan pengadministrasian waktu
melakukan uji coba instrumen secara objektif dan sistematik. Kelima, mengenali
beberapa kelemahan kaitan antar sikap dan tingkah laku utamanya dari pihak
responden dan pihak aktor pendukungnya dalam melaksanakan uji coba.
Ada beberapa hal yang dapat berpengaruh negatif (mengancam) terhadap keberadaan
tingkat reliabilitas suatu instrumen evaluasi. Pertama, adanya fenomena terjadinya
fluktuasi kesiapan mental dari individu atau kelompok individu partisipan yang
dijadikan sebgai responden pada saat pelaksanaan pengukuran. Fluktuasi kesiapan
mental responden ini merupakan representasi kondisi psikologis (internal individu)
yang ada pada saat sebelum, pada saat selama, dan pada saat setelah memberikan
respon terhadap berbagai butir pertanyaan atau pernyataan yang dijadikan sebagai
suatu stimulus dalam prosen pengukuran yang dilakukan. Kedua, adanya variasi
kondisi yang terjadi dalam pelaksanaan pengukuran dengan suatu instrumen evaluasi
tertentu. Yang ternasuk dalam kondisi latar ini dapat diperikan antara variasi waktu
pelaksanaan. Ketiga, adanya perbedaan dalam presepsi dan acuan kegiatan dalam
menginterpretasikan suatau hasil pengukuran sebagai representasi respon dari pihak
responden terhadap butir-butir instrumen evaluasi sebagai bentuk stimulus. Keempat,
adanya pengaruh “random” (acak) yang disebabkan oleh tingkat motivasi partisipan
yang berperan sebagai responden dalam pelaksanaan pengukuran. Mengingat daam
pelaksanaan pengukuran dengan jenis instrumen tertentu (jenis tes atau non tes) yang
dikenakan terhadap sekelompok subjek sasaran terntentu, maka akan menghadapi
adanya variasi suasana psikologis (dalam hal ini motivasi) dai individu atau
kelompok subjek yang menjadi target sasaran. Kelima, adanya instruenn yang
menyajikan terlalu banyak butir pertanyaan atau pernyataan yang diperankan sebagai
stimulus bagi partisipan sebagai responden. Jumlah butir pertanyaan atau pernyataan
dalam intrumen evaluasi harus dirancang sacara proporsional, baik dari sisi
representativeness subtans isi yang dijadikan objek pengukuran, alokasi waktu yang
disediakan bagi partisipan sebagai responden, tujuan dari pelaksanaan pengukuran
suatu fenomena, faktor, atau variabel yang dijadikan sebagai objek pengukuran,
maupun jenis data atau informasi yang diperlukan melalui kegiatan pengukuran.
Ada empat cara yang dapat ditempuh dalam melakukan penilaian terhadap tingkat
rilabiitas instrumen evaluasi, yaitu dengan cara tes ulang, bentuk silang, prosedur
belah dua, dan korelasi interbutir. Pertama, penilaian terhadap tingkat reliabilitas
instrumen evaluasi denga cara tes ulang (test re-test) atau pengukuran ulang. Cara ini
dilakukan dengan mengadakan tes atau pengukuran terhadap kelompok sasaran yang
sama, tetapi pada waktu yang berbeda. Dalam cara ini, partisipan individu atau
kelompok sebagai responden adalah sama, tetapi diikenai proses pengukuran
terhadap sesuatu hal yang sama dalam waktu yang berbeda. Kedua, penilaian
terhadap tingkat reliabilitas instrumen evaluasi dengan cara bentuk berselang. Cara
ini dilakukan dengan dikembangkannya dua macam instrumen yang sama digunakan
untuk melakukan pebgukuran pada individu atau kelompok yang dijadikan target
sasaran tertentu pada waktu atau pengukuran yang sama. Dengan cara ini, partisipan
(individu atau kelompok) sebagai responden yang sama, tetapi dikenai proses
pengukuran dalam waktu yang berbeda dengan instrumen pengukuran yang berbeda
(dalam hal ini ada dua macam instrumen). Ketiga, penilaian terhadap tingkat
reliabilitas instrumen evaluasi dengan cara belah dua. Cara ini dilakukan dengan
melaksanakan tes atau pengukuran terhadap satun kelompok subjek yang dijadikan
responden, dengan satu macam instrumen evaluasi. Dengan metoden ini cukupp
diperukan dengan satu jenis instrumen, satu kelompok partisipan, dan satu kali waktu
pelaksanaan pengukuran, tetapi dilakukan pemilhan pada waktu analisis data hasil
pengukuran. Kedua hasil data dari pelaksanaan pengukuran ini dianalisis dengan
teknik dan rumus statistik tertentu (misalnya dengan korelasi) untuk menetukan
besaran koefisien korelasinya. Keempat, penilaian terhadap tingkat reliabilitas
instrumen evaluasi dengan cara korelasi inter-butir. Cara ini ditempuh dengan
melakukan tes atau pengukuran terhadap satu kelompok subjek yang diposisikan
sebagai responden, dengan satu macam instrumen evaluasi.
PENUTUP
Kesimpulan
Sanjaya, Wina. 2008. Kurikulum dan Pembelajaran. Bandung: Kencana Prenada Media
Group.