Ragam Instrumen Evaluasi

Ragam Instrumen Evaluasi, Persyaratan Instrumen Evaluasi, Dan Prosedur
Pengembangan Dalam Konteks Evaluasi Pembelajaran Di Sekolah
MAKALAH
Untuk Memenuhi Tugas Mata Kuliah Evaluasi Pembelajaran
Yang Dibina Oleh Prof. Dr. A. Mukhadis
Oleh :
Moh. Nanang Rifai (190513731705)
UNIVERSITAS NEGERI MALANG

FAKULTAS TEKNIK
JURUSAN TEKNIK MESIN
PRODI S1 PENDIDIKAN TEKNIK OTOMOTIF
Februari 2020
KATA PENGANTAR
Ragam instrumen evaluasi, persyaratan instrumen evaluasi, dan prosedur pengembangan

dalam konteks evaluasi pembelajaran di sekolah ini merupakan tugas ke dua dari mata kuliah
Evaluasi Pembelajaran. Alhamdulillahirobbil‘alamin, penulis panjatkan puji syukur ke hadirat
Allah SWT atas segala limpahan rahmat-Nya, sehingga makalah ini dapat terselasaikan tepat
pada waktunya. Materi dalam makalah ini kami ambil dari buku Evaluasi Program Pembelajaran
Bidang Teknologi Terminologi, Prosedur Pengembangan Program dan Instrumen. Kami telah
berusaha keras untuk menyelesaikan tugas makalah ini, mengingat waktu yang tidak banyak
sehingga masih banyak kekurangan. Kami mengharap kritikan yang membangun dari penulis
buku tersebut yakni Prof. Dr. A. Mukhadis. Baik itu dari segi penulisan maupun isi dari makalah
ini.
Malang, 23 Februari 2020
Penulis
BAB I
PENDAHULUAN
A. Latar Belakang
Pembelajaran tingkat satuan pendidikan merupakan wujud pelaksanaan kurikulum

tigkat satuan pendidikan yang mengacu pada asumsi bahwa pembelajaran merupakan sistam
yang terdiri dari beberapa unsure yang sistematis yaitu masukan, proses dan keluaran atau
hasil. Evaluasi masukan pembelajaran menekankan pada evaluasi karakterisitik peserta didik,
kelengkapan dan keadaan sarana dan prasarana pembelajaran, karakterisitik dan kesiapan
pendidik, kurikulum dan materi pembelajaran, strategi pembelajaran yang sesuai dengan mata
pelajaran, serta keadaan lingkungan dimana pembelajaran berlangsung.
Evaluasi proses pembelajaran menekankan pada evaluasi pengelolaan pembelajaran

yang dilaksanakan oleh pembelajar meliputi keefektifan stratategi pembelajaran yang
dilaksanakan, keefektifan media pembelajaran, cara mengajar yang dilaksanakan dan minat,
sikap, serta cara belajar peserta didik. Eveluasi pembelajaran atau evaluasi hasil belajar antara
lain menggunakan instrument-instrument evaluasi dapat berupa tes dan nontes untuk
melakukan pengukuran hasil belajar sebagai prestasi belajar, dalam hal ini penguasaan
kompetensi oleh setiap peserta didik.
B. Rumusan Masalah
Rumusan masalah dari latar belakang yang telah dibuat sebagai berikut:
1) Apa saja ragam jenis instrumen evaluasi dalam konteks evaluasi pembelejaran di
sekolah ?
2) Apa saja persyaratan instrumen evaluasi dalam konteks evaluasi pembelajaran di
sekolah ?
3) Bagaimana prosedur pengembangan instrumen evaluasi dalam konteks pembelajaran
di sekolah ?
C. Tujuan
Tujuan Penulisan dari makalah ini ditunjukkan sebagai berikut :
1) Agar mahasiswa mampu menjelaskan ragam jenis instrumen evaluasi dalam konteks
evaluasi pembelejaran di sekolah.
2) Mahasiswa mengetahui persyaratan instrumen evaluasi dalam konteks evaluasi
pembelajaran di sekolah.
3) Mahasiswa mengetahui prosedur pengembangan instrumen evaluasi dalam konteks
pembelajaran di sekolah.
BAB II
PEMBAHASAN
1. Ragam Jenis Instrumen evaluasi

Instrumen evaluasi sebagaiamana dikatakan oleh Philips (1991) merupakan alat ukur
dalam pengumpulan data atau informasi pada setiap tahapan atau pada kesulurahan
tahapan dari suatu program yang dikaji dan dijadikan sasaran objek evaluasi.
Instrumen yang digunakan dalam proses pengumpulan data atau informasi dalam
kegiatan evaluasi dapat berbentuk berbagai macam alternatif. Ragam bentuk alternatif
instrumen yang dipilih dan pada akhirnya ditetapkan untuk digunakan ini sangat
tergantung pada beberapa karakteristik esensial yang terkait dengan aktivitas evaluasi
yang dilakukan. Namun, secara umum ragam bentuk alternatif instrumen evaluasi yang
biasa digunakan di lapangan oleh Phillips (1991) dapat dipilah dan dibagi menjadi
kedalam tujuh kategori. Ketujuh kategori alternatif bentuk instrumen dalam kegiatan
evaluasi tersebut meliputi antara lain bentuk : Kuesioner, survei karakteristik individu,
tes, pedoman wawancara, kelompok terfokus, pedoman pengamatan, dan pencatatan
untuk kkerja. Dari ketujuh kategori alternatif bentuk instrumen tersebut dapat dipilah
menjadi dua, yaitu alternatif bentuk instrumen evaluasi yang termasuk dalam kelompok
jenis tes, dan alternatif bentuk instrumen evaluasi yang termasuk dalam kelompok jenis
nontes (Cronbach, 1984; dan Nunnally, 1978).
Secara umum ciri indikator pembeda antara kedua kelompok alternatif bentuk
instrumen itu dapat diperikan sebagai berikut. Alternatif bentuk instrumen evaluasi yang
digolongkan ke dalam kelompok tes, apabila ditandai oleh sifat dari respon jawaban yang
diberikan responden (testee) mengandung unsur makna Benar atau Salah. Namun,
apabila alternatif bentuk instrumen evaluasi potensial menghasilkan sifat dari respon
jawaban yang diberikan responden tidak menagndung unsur makna Benar atau Salah,
maka alternatif bentuk instrumen evaluasi ini dapat digolongkan ke dalam instrumen
evaluasi nontes.
Batasan dan karakteristik dari ketujuh alternatif bentuk instrumen evaluasi ini, yang
juga dapat dikelompokkan ke dalam dua golongan besar yaitu kelompok benuk tes dan
non tes dipaparkan berikut ini (Mukhadis : 203).
1.1. Kuesioner
Kuesioner merupakan salah satu alternatif bentuk instrumen evaluasi kelompok
bentuk nontes yang paling banyak digunakan, terutama dalam pelaksanaan evaluasi
program. Alternatif bentuk instrumen jenis ini memiliki beberapa kelebihan, khususnya
dalam kegiatan pengumpulan data yang melibatkan jumlah responden yang cukup besar.
Kelebihan jenis instrumen ini dalam kegiatan pengumpulan data yaitu dapat digunakan
mengumpulkan data atau informasi dari jumlah responden yang relatif banyak, responden
yang berasal dari berbagai wilayah, responden yang dapat ditemui langsung atau tidak
langsung, namun dengan waktu yang relatif sangat singkat. Hal ini diperkuat oleh
pendapat Rossett dan Awardy (1985:202) dalam bukunya yang berjudul “Training Needs
Assesment : Techniques and Performance Development Series’ yang mengatakan bahwa
“questionnaires may be used to gather anonymous information in regard to all Training
Need Assessment purpose. They are, how ever, most frequently, used to solicit opinions
on actuals, feelings, and causes”.
Tingkat keefektifan dan efisiensi serta kemenarikan instrumen jenis ini sebagai
alat pengumpulan data atau informasi sangat tergantung pada tingkat kejelian dan
kecermatan dalam pemilihan dan penggunaan kata, pemilihan dan penggunaan frase,
pemilihan dan penggunaan istilah atau kalimat yang sesuai dengan karakteristik dari
responden dan karakteristik dari informasi yang diinginkan.
Bentuk pertanyaan pada instrumen evaluasi bentuk kuesioner ini secara umum
dapat dipilah menjadi lima macam bentuk pertanyaan (Mukhadis:204).
Pertama, pertanyaan terbuka (open-ended question). Bentuk pertanyaan terbuka
ini memiliki kelebihan dan sekaligus kelemahan baik bagi responden maupun bagi
evaluator. Kelebihan bagi responden dengan bentuk instrumen jenis kuesioner dan
pertanyaan yang bersifat terbuka ini dapat memberikan kemungkinan peluang dalam
memberikan alternatif respon sebagai representasi memberikan alternatif jawaban secara
lebih fleksibel, tidak terbatas dan lebih bebas sesuai dengan persepsi yang dikonstruk
oleh responden terhadap fenomena yang ditanyakan. Bagi evaluator, kelebihan alternatif
bentuk instrumen kuesioner dengan pertanyaan terbuka ini adalah terkait dengan upaya
perumusan butir-butir pertanyaan yang dikembangkan berdasarkan perian deskriptor yang
ada akan lebih mudah dan lebih singkat waktunya karena tidak harus dituntut
menyediakan opsi di setiap butir pertanyaan sebagai wujud alternatif jawaban. Sedangkan
kelemahan yang mungkin muncul bagi responden adalah tidak adanya bantuan arah
dalam memberikan alternatif opsi jawaban. Bagi evaluator sendiri kondisi alternatif
jawaban dari kuesioner dengan pertanyaan terbuka ini memungkinkan adanya kesulitan
dalam memilah dan menganalisis alternatif jawaban yang berasal dari responden.
Kedua, Pertanyaan bentuk checklist. Bentuk dari pertanyaan ini dalam suatu
kuesioner adalah sudah dilengkapi dan atau disediakan daftar opsi sebagai alternatif
jawaban. Dalam instrumen bentuk ini respon yang diminta dari responden untuk
membubuhkan tanda chek atau yang lazim disebut dengan menyontreng, sesuai dengan
situasi atau keadaan yang dialami atau sesuai atau keadaan yang sesuai dengan “apa yang
dipersepsikan” terhadap fenomena yang dijadikan sebagai stimulus yang tertulis dalam
instrumen.
Ketiga, Pertanyaan bentuk ya atau tidak (yes or no question). Bentuk kuesioner
dengan model pertanyaan ini meminta responden untuk memilih alternatif jawaban yang
sifatnya terstrukur dengan hanya dua opsi sebagai alternatif pilihan, yaitu memilih pada
opsi YA atau memilih pada opsi TIDAK. Dalam perannya sebagai alat pengumpulan data
atau informasi penggunaan kuesioner bentuk ini kadang-kadang masih dilengkapi dengan
alternatif kemungkinan jawaban lain dari dua jawaban yang tersedia. Alternatif jawaban
lain ini lebih berbentuk jawaban yang sifatnya terbuka (open ended), yang dalam konteks
ini diberikan ruang atau tempat titik titik sebagai tempat untuk menuliskan alternatif
jawaban lain yang mungkin memang diperlukan oleh responden.
Keempat, Pertanyaan pilihan ganda (multiple-choice question) bentuk kuesioner
dengan pertanyaan model ini dalam tampilan formatnya telah menyediakan beberapa
alternatif pilihan jawaban, dan responden diminta untuk memilih satu dari alternatif
pilihan jawaban yang paling sesuai menurut persepsi responden. Alternatif jawaban yang
lazim digunakan dalam kuesioner bentuk ini adalah dapat terdiri atas tiga, empat, atau
lima alternatif pilihan jawaban.
Kelima, Pertanyaan skala ranking (ranking scales). Dalam bentuk pertanyaan ini
responden diminta untuk melakukan ranking terhadap butir-butir alternatif pilihan
jawaban yang tersedia dalam instrumen. Instrumen bentuk ini biasanya digunakan untuk
mengungkap data dari responden yang terkait dengan karakteristik kondisi psikologis.
1.2 Survei Terhadap Sikap Individu (Attitude Surveys)
Bentuk instrumen jenis ini menurut Kirkpatrick (1994) merupakan alat ukur atau
alat pengumpul data atau informasi yang termasuk atau tergolong pada tipe khusus dari
suatu bentuk kuesioner yang sekian banyak telah dikembangkan dan digunakan dalam
kegiatan pengukuran hasil suatu program. Instrumen jenis ini, banyak digunakan pada
evaluasi program yang berorientasi secara spesifik (orientasi khusus) pada program
terkait dengan upaya pengembangan sumberdaya manusia. Cara penerapan alat ukur ini
dalam konteks evaluasi program biasanya digunakan melalui kegiatan pengukuran
terhadap ranah sikap pekerja atau karyawan pada saat sebelum dan sesudah suatu
program berlangsung.
Data atau informasi hasil survei sikap ini dalam konteks pelaksanaan evaluasi
program pengembangan sumberdaya manusia dapat digunakan untuk beberapa
kepentingan. Kepentingan hasil survei sikap dalam evaluasi program pengembangan
sumberdaya manusia dapat diperikan sebagai berikut.
i. Digunakan sebagai wahana dalam upaya menggali dan memberikan
umpan balik (feedback)
ii. Menajadi masukan yang sangat berharga dalam upaya membangun
keberadaan data base yang memadai
iii. Menjadikan energi dalam membantu merancang dan memodifikasi
berbagai kebijakan yang terkait dengan urusan personal, merancang dan
memodifikasi sistem pengelolaan dan manajemen, dan merancang dan
memodifikasi alternatif berbagai proses pengambilan keputusan yang
harus ditempuh
iv. Menjadikan inspirasi bagi semua pelaksana sistem organisasi dalam
rangka memberikan dan atau mengembangkan berbagai alternatif kiat
untuk melakukan evaluasi terhadap tingkat kemajuan
v. Memicu akan tumbuh-berkembangnya kesadaran dari berbagai pihak yang
terkait dengan upaya keberlangsungan program untuk selalu melakukan
evaluasi terhadap iklim internal organisasi dan juga melakukan proyeksi
akan kecenderungan terhadap sesuatu yang akan terjadi dalam suatu
organisasi atau dalam menjalankan suatu program yang terancang di masa
depan.
1.3 Bentuk Tes
Bentuk evaluasi ini (bentuk tes) biasanya paling banyak digunakan pada konteks
evaluasi program pembelajaran atau evaluasi program pelatihan. Penerapan instrumen
jenis ini dalam pelaksanaan evaluasi program pembelajaran atau pelatihan yang paling
umum biasanya pada interval waktu awal, waktu pertengahan dan pada waktu akhir
program pembelajaran atau pelatihan. Pelaksanaan evaluasi program pembelajaran atau
pelatihan pada saat awal dimulainya suatu program biasanya disebut dengan evaluasi
terhadap bekal ajar awal yang telah dimiliki peserta program. Hal ini menjadi penting
dilakukan sebagai upaya untuk memetakan tingkat kemampuan bekal ajar awal setiap
peserta program (pembelajaran atau pelatihan), bila dikaitkan dengan akumulasi
kemampuan yang akan dicapai dalam suatu program yang telah dirancang.
Palaksanaan evaluasi program pembelajaran atau pelatihan di tengah suatu

program yang sedang berlangsung biasanya disebut dengan evaluasi program jenis
evaluasi formatif. Kegiatan evaluasi ini menjadi penting dilakukan sebagai upaya untuk
memetakan topik topik atau bagian materi dari suatu program yang dianggap masih
banyak mengalami kendala dan ketidaktuntasan penguasaan oleh setiap peserta atau
kelompok peserta program (pembelajaran atau pelatihan), bila dikaitkan dengan
akumulasi semua bahan atau sumber belajar yang telah dirancang dan ditetapkan untuk
mencapai tujuan program.
Pelaksaaan evaluasi program pembelajaran atau pelatihan pada interval waktu

atau periode saat akhir suatu program berlangsung biasanya disebut dengan evaluasi
sumatif. Kegiatan evaluasi ini menjadi penting dilakukan sebagai representasi upaya
untuk mengungkap dan memetakan tingkat pencapaian tujuan program yang telah
ditetapkan, baik pencapaian tujuan program secara kuantitatif maupun secara kualitatif,
bila dikaitkan dengan akumulasi pencapaian semua tujuan program yang telah dirancang
dan ditetapkan. Indikator pencapaian tujuan program secara kuantitatif dalam hal ini
dapat berupa besaran persentase peserta program yang telah memenuhi persyaratan
minimal penguasaan atau kompetensi yang telah ditetapkan. Indikator ini, biasanya
banyak digunakan sebagai representasi untuk mengukur tingkat keberhasilan pencapaian
tujuan program dari sudut pandang efektivitas. Disamping itu, juga besaran persentase
rerata jumlah waktu yang diperlukan untuk memenuhi tuntutan kompetensi minimal oleh
peserta program, bila dikaitkan dengan standar alokasi waktu yang telah ditetapkan.
Indikator ini, biasanya banyak digunakan sebagai representasi untuk mengukur tingkat
keberhasilan pencapaian tujuan program dari sudut pandang efesiensi.
Berpijak pada uraian peranan tes dalam pelaksanaan program di atas, dapat
dikatakan bahwa representasi dari fenomena terjadinya peningkatan skor tes secara
kuantitatif ataupun secara kualitatif dapat dimaknai sebagai indikator peningkatan
(perubahan) pada ranah pengetahuan, ketrampilan, atau sikap nilai, cara berpikir dan
bertindak dan unjuk kerja pada diri peserta program. Dalam konteks program
pembelajaran atau pelatihan penerapan instrumen bentuk tes diawal pembelajaran atau
awal pelatihan bertujuan lebih mengarah pada pemetaan kemampuan bekal ajar awal
peserta program. Penetapan instrumen bentuk tes di pertengahan program pembelajaran
tujuannya lebih mengarah pada diagnosis dan pemetaan aspek, komponen, topik program
yang bagi peserta program masih mengalami kesulitan. Implikasi dari hasil pengukuran
program pembelajaran pada tahap ini untuk memilih dan menetapkan subtansi dari topik
yang ada pada kurikulum yang masih dirasakan sulit bagi peserta program dan dijadikan
sebagai dasar mencari dan menetapkan alternatif strategi perbaikannya, sehingga program
dapat berjalan sebagaimana yang telah dirancang. Penerapan instrumen bentuk tes di
akhir program pembelajaraan tujuannya lebih mengarah pada upaya untuk mengukur
pencapaian hasil tujuan program pembelajaran. Implikasi dari hasil pengukuran program
pembelajaran pada tahap ini adalah untuk memilih dan menetapkan peserta program
dikelompokan ke dalam kelompok sudah tuntas atau sudah terampil atau belum tuntas
atau belum terampil.
Dalam program pengembangan sumberdaya manusia, instrumen jenis tes ini

macamnya dapat diklasifiksikan menjadi tiga, pertama klasifikasi tes berdasarkan
pelaksanaan. Kedua, klasifikasi tes berdasarkan tujuan dan subtansi isi. Klasifikasi
berdasarkan tujuan dan subtansi isi dibagi lagi menjadi tes bakat dan tes prestasi. Tes
bakat digunakan untuk mengukur kemampuan dasar atau potensi kapasitas individu yang
diperlukan untuk mempelajarai suatu pengetahuan, ketrampilan dan sikap sikap tertentu.
Sedang tes prestasi biasanya digunakan untuk mengukur kemampuan seseorang dalam
mempelajari, memahami, menguasai suatu ranah (kognitif, psikomotor atau afektif) pada
suatu bidang tertentu dan dalam interval waktu tertentu. Ketiga, klasifikasi tes
berdasarkan rancangan. Klasifikasi tes berdasarkan rancangan ini paling banyak
bentuknya berupa tes lisan, tes esai (dalam program pengembangan SDM), tes objektif
(memiliki jawaban khusus dan tepat), dan tes pengamatan unjuk kerja (malakonkan suatu
unjuk kerja tertentu sesuai ranah yang digunakan objek tes atau pengukuran.
1.4 Bentuk Wawancara

Bentuk instrumen evaluasi dalam rangka pengumpulan data atau informasi
melalui wawancara ini dilapangan penggunaaannya tidak sesering sebagaimana
instrumen evaluasi dalam bentuk tes. Sifat dan karakteristik bentuk instrumen wawancara
dalam kegiatan evaluasi memiliki kelebihan untuk digunakan dalam upaya
mengidentifikasi, menggali, mengungkap dan memerikan data atau informasi yang
keberadaannya akan lebih sulit dan kurang akurat serta banyak kendala bilamana akan
diperoleh melalui respon secara tertulis atau pengamatan dari responden. Kesulitan untuk
memperoleh data atau informasi melalui respon secara tertulis atau pengamatan dari
responden dapat disebabkan oleh beberapa hal. Pertama, dari kondisi real latar belakang
responden yang memang mengalami kendala dalam ketrampilan membaca dan menulis,
termasuk juga pada responden yang dari lokasi geografisnya terpencil, terpencar dan
terluar, sehingga sulit dijangkau dengan pengamatan langsung. Kedua, keterbatasan alat
instrumen untuk mengungkap karakteristik responden sampai pada tingkatan yang
mendalam tentang ‘dia sebagai dia’ atau tentang ‘mereka sebagai mereka’ yang terkait
dengan upaya mendapatkan informasi otentik. Ketiga, keterbatasan evaluator dalam
berusaha mengkap data atau informasi yang bersifat implisit yang hanya didapatkan
dengan berinteraksi langsung dengan responden. Keempat, dengan instrument pedoman
wawancara ini kemungkinan akan terjadinya kesalahan persepsi responden atas tujuan
dan maksud dari kegiatan dan isi instrumen menjadi dapat diperkecil. Kelima, dengan
adanya interaksi langsung antara pengumpul data atau informasi dan responden potensial
untuk terjalin hubungan yang harmonis terkait dengan hak dan kewajiban masing masing
pengumpul data dan responden.
Disamping berbagai kelebihan, wawancara juga berpotensi adanya kelemahan

kelemahan dalam penerapan instrumen wawancara dalam pengumpulan data. Pertama,
instrumen wawancara sebagai alat pengumpulan data dalam kegiatan evaluasi
memerlukan banyak waktu dalam penggunaannya. Kedua, instrumen wawancara sebagai
alat pengumpulan data dalam kegiatan evaluasi memerlukan banyak biaya dalam
penggumpulannya. Ketiga, instrumen wawancara sebagai alat pengumpulan data atau
informasi dalam kegiatan evaluasi memerlukan kegiatan pelatihan yang memadai bagi
seseorang yang akan diberi tugas untuk melakukan wawancara terhadap suatu subjek
yang diajdikan sasaran. Keempat, instrumen wawancara sebagai alat pengumpulan data
atau informasi dalam kegiatan evaluasi memerlukan kesabaran dari petugas pengumpul
data dan juga kemampuan empati terhadap karakteristik responden yang dihadapi.
Kelima, instrumen wawancara ini kurang dapat efisien dan efektif untuk menjangkau
responden yang jumlah cukup banyak, dalam keberadaan waktu dan dana yang terbatas
serta wilayah geografis dan sebaran subyek yang relatif luas.
Bila dilihat dari sisi bentuknya, instrumen jenis wawancara ini dapat dibedakan
menjadi tiga kelempok. Ketiga kelompok tersebut yaitu, instrumen wawancara
terstruktur, wawancara semi terstruktur dan wawancara tidak terstruktur. Bentuk
instrumen wawancara terstruktur dalam hal ini mirip seperti instrumen pengumpulan data
atau informasi jenis koesioner terstruktur. Sedangkan wawancara semi terstruktur, sosok
dan tampilannya lebih mirip seperti instrumen jenis kuesioner semi terstruktur. Terakhir
pada instrumen tipe wawancara tidak terstruktur sosok dan formatnya lebih mirip seperti
instrumen kuesioner yang bersifat open endeed, yaitu memberi peluang kebebasan dan
kesempatan kepada responden untuk mengekspolasi ide atau gagasan sesuai dengan
konteks dimensi dan juga indikator dari berbagai hal yang ditanyakan.
1.5 Diskusi Kelompok Terfokus
Bentuk instrumen ini akan sangat membantu apabila tujuan utama dari kegiatan
evaluasi yang ingin dicapai adalah bermaksud memperdalam umpan balik (feedback)
yang diperlukan suatu evaluasi program, baik evaluai program pelatihan atau evaluasi
program pembelajaran. Apabila ingin melakukan evaluasi terhadap setiap individu
trainee dirasakan relatif mahal besaran beaya yang harus dikeluarkan, maka dengan
alternatif pilihan pada diskusi kelompok terfokus (Focus Group Discussion-FGD)
menjadi lebih efisien, efektif dan bahkan lebih menarik. Dari kegiatan diskusi ini
diharapkan dapat menggali, mengidentifikasi, mengungkap dan memerikan berbagai hal
yang terkait dengan pertimbangan-pertimbangan yang bersifat kualitatif dan kuantitatif
pada setiap topik atau isu-isu utama yang dijadikan objek sasaran dalam kegiatan diskusi.
Penggunaan kelompok fokus dapat diperikan sebagai berikut. Pertama, kelompok

fokus ini dapat lebih efektif dan lebih efisien digunakan, apabila diperlukan data atau
informasi dari hasil evaluasi terhadap rancangan dan proses pelatihan, khususnya dalam
uji coba suatu alternatif progrann perintisan. Dengan mengacu pada hasil kegiatan
kelompok diskusi terfokus ini, akan dapat diungkap berbagai kelemahan pada komponen
program yang telah dirancang dan sedang dalam proses wahana pencapaian tujuan
program, mengacu pada itu maka dilakukan proses atau langkah-langkah perbaikan atau
penyempurnaan dari rancangan dan proses suatu program. Kedua, kelompok fokus ini
dapat lebih efektif dan efisiensi digunakan, apabila diperlukan data atau infromasi dari
hasil evaluasi terhadap reaksi spesifik dari stakeholders, khususnya yang terkait dengan
penggunaan dan pelaksanaan program, baik dalam kegiatan pelatihan, simulasi, atau
komponen program yang lain yang sudah terancang dan diimplementasikan untuk
mencapai tujuan program. Ketiga, kelompok fokus ini dapat lebih efektif dan efisiensi
digunakan, apabila diperlukan data atau informasi dari hasil evaluasi yang terkait dengan
keefektifan, efisiensi, kemenarikan, relevansi, dan produktifitas suatu program
keseluruhan yang dirasakan oleh partisipan yang baru mengikuti program peltihan.
Keempat, kelompok fokus ini dapat lebih efektif dan efisiensi digunakan, apabila
diperlukan data atau informasi dari hasil evaluasi terhadap dampak dari suatu program
yang dikembangkan, dan ditindaklanjuti setelah suatu program dikembangkan secara
lengkap. Data atau informasi yang terkait dengan dampak dari implementasi suatu
program, apakah dampak yang bersifat positif atau negatif menjadi penting untuk segera
diungkap atau diperikan sebagai bahan acuan dalam upaya pengembangan secara
berkelanjutan. Kelima, kelompok fokus ini dapat lebih efektif dan efisiensi digunakan,
apabila diperlukan data atau informasi dari hasil keseluruhan evaluasi terhadap sosok dari
suatu program yang dikembangkan. Dengan pengumpulan data melalui diskusi terfokus
ini, segera dapat diungkap dan diperikan keampuhan suatu program yang dirancang dan
diimplementasikan sabagai bahan acuan memilih dan menetapkan alternatif bentuk
tindak lanjut yang diprioritaskan. Bentuk alternatif tindak lanjut dalam pengembangan
suatu program (program diteruskan, program dimodifikasi, atau mungkin program
dihentikan) ini sebagai representasi upaya meningkatkan efektifitas, efesiensi, dan
kemenarikan suatu program sebagai wahana pencapaian tujuan yang telah ditetapkan dan
juga memiliki sifat dinamis dan berkembang sesuai perjalanan ruang dan waktu.
1.6 Pengamatan
Menurut mukhadis (2017). Jenis instrumen evaluasi ini biasanya lazim digunakan
untuk mengamati reaksi dan perilaku dari peserta program mulai periode waktu sebelum,
selama dan sesudah suatu program dilaksanakan. Penggunaan instumen jenis ini bagi
para pengumpul data atau informasi dalam pelaksana kegiatan evaluasi program
menuntut beberapa persyratan tertentu. Persyaratan dituntut bagi para pengguna
instrumen jenis ini meliputi antara lain: tingkat kepeawaian, tingkat kecermatan, tingkat
ketelatenan, dan tingkat ketelitian, serta kesabaran bagi pihak pengamat (observer).
Tuntutan tingkat kesabaran ini sangat diperlukan, utamanya pada saat berhadapan dengan
subjek atau objek pengamatan yang terkait dengan perilaku khusus untuk sampai dapat
mengungkap ‘dia sebagai da’ atau ‘mereka sebagai mereka’ yang entuanya akan
membutuhakan interval waktu yang memadai dan tingkat kepekaan yang tinggi
menangkap fenomena objek yang dijadikan sasaran pengamatan yang muncul.
Tingkat efektifitas, efisiensi, kecermatan, ketelitian dan kesabaran dalam

penggunaan instrumen jenis ini sebagai alat pengumpul data oleh pengamat dapat
ditingkatkan, bila para pengamat (observer) memahami akan substansi isiinformasi,
format amatan , dan kiat pelaksanaan pengumpulan data atau informasi melalui media
pengamatan. Indikator ari aktifitas perncanaan dan pelaksaan pengupulan data yang
sistematik dapat ditempuh antara lain meliputi penentuaan jenis perilaku yng akan
diamati secara jelas dan operasional, penyipan bentuk pengamatan yang akan digunankan
secara sederhana dn tidan memicu terjanya multi interpretasi, memilih dan menetapkan
pengamat yang handal melalui seleksi yang ketat, menyiapkan jadwal pengamatan
dengan secara emplisit dan runtut. Di samping itu, juga perlu dilakukan upaya untuk
melatih pengamat (apa yang harus diamati dan yang apa yang perlu diabaikan)deangan
semat dan sesama melakukan pengamatan secara cermat, teliti, dan objektif, an
kemampuan membuat ringkasan yang baik, tdak bias dan komunikatif dalam
mengiterprestasikan, dan melaporkan hasil pengamatan dengan mengikuti kaidah yang
benar, dari sisi substansi, dan tata tulis.
1.7 Rekaman Perilaku (Performance Record)
Instrumen jenis rekaman perilaku dan dalam konteks evaluasi program selalu
diperlukan pada setiap organisasi atau lembaga yang membutuhkan kegiatan untuk
mengukur atau memetakan sesuatu (behaviors) dari pihak pelaksana organisasi. Tingkat
efektifitas dan efisiensi dari penggunaan instrumen evaluasi jenis rekaman perilaku ini
dalam kegiatan evaluasi program dapat tentukan dan disyaratkan mingikutai langkah-
langkah tertentu.
Langkah-langkah dalam upaya meningkatkan efektivitas dan efisiensi dalam

penggunaan instrumen jenis rekaman perilaku sebagai berikut. Pertama, diperlakukan
melakukan identifikasi rekaman perilaku yang dibutuhkan sebagai objek sasaran secara
cermat dan objektif. Objek sasaran perlu ditentukan secara cermat dan juga pemberian
definisi atau batasan operasional dari setiap aspek ranah, dimensi dan indikator dari
komponen yang emplisit, sehingga menjadi jelas jabaran dari setiap ranah ke dalam
dimensi dan indikator sasaran evaluasi. Kedua, melakukan aktifitas dalam
mengindentifikasi, memilih, dan pada akhirnya menentukan alternatif perencanaan teknik
sampling yang akan digunakan secara representatif. Representativeness sampling yang
digunakan menjadi penting, terutama yang terkait dengan sampling ranah tingkah laku
yang dijadikan objek sasaran evaluasi, juga yang terkait keterwakilan dari sifat dan
karakterstik responden dalam kegiatan evaluasi. Ketiga, diperlukan kiat dalam
menggunakan rekaman langsung, tetapi dilakukan secara tersembunyi (hidden
performance records) untuk mengupayakan agar diperoleh perilaku yang alami sifatnya.
Hal ini penting untuk dijadikan pertimbangan dalam proses pengumpulan data atau
informasi dengan jenis instrumen ini, mengingat akan realitas kondisi objek sasaran
amatan dalam wujud perilaku merupakan resultante dari sekian banyak faktor
pembentuknya. Keempat, atau sebagai langkah terahir, dalam upaya meningkatkan
efektifitas dan efisiansi teknik pengumpulan data ini diperlukan adanya sifat kecermatan
dan ketelitian dalam aktifitas pengembangan perecanaan berbagai format rekaan perilaku
yan dibutuhkan. Begitu juga akan kiat dalam proses pengolahan data atau informasi,
proses pengolahan data atau informasi, dan proses analisis data atau informasi data atau
informasi, dan proses analisis data atau informasi dengan pilihan alternatif teknik dan
rumus statistik tertentu (bila diperlukan) yang dapat dipertanggungjawabkan dari sisi
metodologis.
Ketujuh jenis instrumen evaluasi program yang telah diuraikan diatas secara
umum dapat dipilah kedalam dua kategori secara umum. Kedua kategori itu meliputi
ketegori instrumen yang termasuk dalam jenis tes dan kategori instrumen yang termasuk
dalam jenis notes. Secara teoritik kedua jenis instrumen dapat dipilah-pilah, namun pada
tataran aplikasinya keberadaan dan peran jenis kedua instrumen ini dalam pelaksanaan
proses pengumpulan data susah untuk dipisah-pisah. Kedua kelompok kategori instrumen
evaluasi ini (jenis tes dan jenis nontes) dalam pelaksanaan pengumpulan data untuk
kepentingan dan tujuan evaluasi suatu program dapat digunakan secara terpisah atau
secara kombinasi diantara keduanya. Dalam kegiatan evaluasi program dapat digunakan
instrumen jenis tes dikombinasi atau dilengkapi dengan instrumen evaluasi jenis nontes.
Atau begitu juga sebaliknya, penggunaan instrumen evaluasi jenis nontes dalam proses
pengumpulan data informasi dapat dikombinasikan dengan jenis instrumen evaluasi jenis
tes. Sifat kombinasi kedua kategori jenis instrumen (tes dan nontes) dalam pelaksanaan
evaluasi program pembelajaran sangat tergantung pada beberapa pertimbangan, baikdari
sisi aspek kecukupan data yang diperlukan.
Pertama pertimbangan akan keluasan ranah, kedalam tagihan ranah, dan

kekomplekan ranah yang dijadikan onjek sasaran evaluasi. Kedua keragaman dari jenis
data atau informasi yang diperlukan dalam upaya mencapai tujuan evaluasi. Ketiga,
ragam karakteristik yang melekat pada sumber data atau pada karakteristik responden,
baik dari sisi geografis, latar belakang pendidikan, latar sosial-ekonomi, latar sosial-
budaya, maupun peran responden yang bertindak sebagai informan, baik yang berperan
sebagai informan kunci atau sebagai informan pendukung. Keempat, alternatif strategi
pengumpulan data atau informasi yang akan ditempuh, baik secara langsung maupun
tidak langsung, baik melalui instrumen jenis tes maupun instrumen jenis nontes. Kelima,
keberadaan sarana pendukung dalam pelaksanaan pengolahan dan analisis data atau
informasi serta penentuan kriteria yang digunakan untuk melakukan interpretasi hasil dan
memformulasikan proposisi simpulan hasil evaluasi.
Hubugan antara jenis, dan pertimbangan melakukann kombinasi dalam

penggunaan instrumen evaluasi dalam konteks pelaksanaan evaluasi program secara
skematis dapat divisualisasikan sebagai tersajikan pada gambar dibawah. Dengan
melakukan kombinasi penggunaan instrumen evaluasi secara arif dan cerdas pada waktu
pengumpulan data atau informasi di lapangan sesuai logika berfikir yang tersaji pada
gambar bawah diharapkan tingkat kesahian, dan tingkat kualitas serta tingkat kebenaran
data yang dihasilkan lebih dapat dijamin keberadaannya dalam kegiatan evaluasi suatu
program yang telah dirancang untuk mencapai suatu tujuan yang telah ditetapkan.
Gambar 1. Kelompok dan Kombinasi Penggunana Instrumen Evaluasi
2. Persyaratan Instrumen Evaluasi

Sebuah instrumen evaluasi hendaknya memenuhi syarat sebelum di gunakan untuk
mengevaluasi atau mengadakan penilaian agar terhindar dari kesalahan dan hasil yang
tidak valid (tidak sesuai kenyataan sebenarnya). Alat evaluasi yang kurang baik dapat
mengakibatkan hasil penilaian menjadi bias atau tidak sesuainya hasil penilaian dengan
kenyataan yang sebenarnya, seperti contoh anak yang pintar dinilai tidak mampu atau
sebaliknya. Jika terjadi demikian perlu ditanyakan apakah persyaratan instrumen yang
digunakan menilai sudah sesuai dengan kaidah-kaidah penyusunan instrumen.
Persyaratan instrumen evaluasi dalam konteks pembelajaran dibagi menjadi dua,
yakni persyaratan validitas dan reliabilitas. Menurut Mukhadis (2017), karakteristik
validitas suatu instrumen ini menjadi tolok ukur atau menjadi jaminan secara metodologis
bahwa instrumen evaluasi yang digunakan dapat mengungkap factor, fenomena, variabel,
atau ranah yang akan dijadikan objek sasaran dalam kegiatan evaluasi. Sedangkan
karakteristik reliabilitas suatu instrument ini menjadi tolok ukur atau menjadi jaminan
secara metodologis bahwa instrumen evaluasi mempunyai tingkat secara reliabilitas atau
keajegan dalam mengungkap terhadap factor, fenomena, variabel, atau ranah yang akan
dijadikan objek sasaran dalam kegiatan evaluasi pada wilayah atau kelompok lain yang
memiliki karakteristik relatif sama.
2.1 Validitas Instrumen Evaluasi
Representasi indikator keefektifan suatu instrumen evaluasi, baik yang ditunjukan
secara kualitatif maupun secara kuantitatif dapat diperoleh dan ditentukan dari aktivitas
yang disebut dengan pelaksanaan validasi instrumen. Aktivitas sebagai upaya dalam
pelaksanaan validasi suatu instrumen evaluasi dapat dilakukan dengan bebarapa
pendekatan yang relevan.
Secara umum terdapat empat alternatif pendekatan yang lazim digunakan dalam
menilai karakteristik keefektifan suatu instrumen evaluasi menurut Nunally, (1978) yaitu
dipilah menjadi validasi isi, validasi konstruks, validasi konkuren, dan validitas
peramalan.
2.1.1 Validitas Isi
Validitas isi merupakan indikator karakteristik keefektifan instrumen evaluasi
yang paling penting. Secara umum keberadaan indikator validitas isi ini dapat dijadikan
sebagai petunjuk penting yang terkait dengan aspek keterwakilan (representativeness)
setiap atau sekelompok dimensi atau isi-isi sampel penting dari sosok ketrampilan,
pengetahuan, atau sikap yang dijadikan suatu objek sasaran pengukuran (Murzano,
Pickering dan McTighe, 1994).
Langkah-langkah atau prosedur dalam mengembangkan instrumen dan mengukur
tingkat validitas isi suatu instrumen evaluasi minimal dapat diklasifikasikan menjadi
enam tahapan. Keenam tahapan prosedur dalam mengembangkan instrumen dan
mengukur tingkat validitas isi suatu instrumen evaluasi dapat diperikan sebagai berikut.
i. Mengidentifikasi, memilih dan yang pada akhirnya menetapkan ranah, dimensi,
fenomena, atau konsep yang akan dijadikan sebagai objek sasaran pengukuran.
ii. Memeberikan batasan operasional terhadap ranah, dimensi atau fenoman yang
akan dijadikan sebagai objek sasaran pengukuran
iii. Menjabarkan kandungan isi ranah, dimensi, fenomena, atau konsep
berdasarkan batasan operasional yang telah disepakati atas objek yang akan
dijadikan sebagai objek sasaran pengukuran sesuai domain atau ranah tertentu.
iv. Melakukan kajian terhadap keberadaan cakupan jabaran isi ranah, dimensi,
fenomena, atau konsep, dan relevansi serta representatif isi yang telah
dijabarkan
v. Melakukan penjabaran ranah atau domain isi yang relevan dan representatif ke
dalam bentuk indikator-indakator atau deskriptor-deskriptor.
vi. Aktivitas pengembangan indikator atau deskriptor ke dalam butir-butir
pertanyaan.
Keselurahan langkah diatas dapat lebih jelas disajikan secara skematis
sebagaimana pada gambar
Gambar 2. Prosedur validasi isi dalam pengembangan Instrumen Evaluasi

Dalam melacak dan menguji apakah tuntutan dari persyaratan minimal tingkat
validitas isi ini telah memenuhi persyaratan atau belum memenuhi
persyaratan,dalam hal ini tidak dapat dilakukan dengan prosedur statistik, tetapi
lebih mengacu kepada keberadaan blue-print instrumen evaluasi dan pertimbangan
para ahli pada bidang yang relevan. Logika pertimbangan yang diberikan oleh para
ahli yang relevan biasanya mengacu pada pola penjabaran bentuk Garpu tala
seperti pada gambar.
Gambar 3. Model Garpu Tala Pejabaran Ranah Objek Evaluasi Samapai Butir
Instrumen Jenis Nontes
Gambar 4. Model Garpu Tala dalam Pengembangan Instrumen Jenis Tes

2.1.2 Validitas Konstruk
Validitas konstruk berkaitan dengan batasan, dimensi, dan deskriptor yang
dikembangkan dalam suatu instrumen telah representatif dengan konstruk yang
dijadikan objek sasaran pengukuran. Adapun prosedur langkah-langkah yang
ditempuh dalam melakukan kegiatan pengembangan dan penilaian terhadap tingkat
validitas konstruk suatu instrumen dapat ditempuh dengan hal-hal berikut (Mukhadis :
239) :
i. Memberikan batasan terhadap semua bagian dari suatu konstruk yang dijadikan
objek sasaran pengukuran.
ii. Mengidentifikasi, memilih dan pada akhirnya menetapkan inti dari dimensi-
dimensi suatu konstruk yang dijadikan objek sasaran pengukuran sesuai
dengan batasan operasional yang telah ditetapkan.
iii. Memilih dan pada akhirnya menetapkan isi-isi sampel esensi dari setiap
dimensi dari hasil pemerian dimensi-dimensi suatu konstruk yang dijadikan
iv. Melakukan penjabaran sampel esensial dimensi suatu konstruk yang dijadikan
objek sasaran pengukuran ke dalam pemerian-pemerian beberapa deskriptor
dari isi sampel esensial suatu dimensi.
v. Melakukan klasifikasi dari butir-butir pertanyaan atau pernyataan sebagai
representasi dari suatu instrumen evaluasi pada setiap dimensi konstruk atau
pada keseluruhan konstruk sesuai dengan faktor-faktor tertentu.
vi. Berdasarkan klasifikasi faktor-faktor yang ada disinergikan atau disintesiskan
ke dalam suatu bentuk faktor yang bersifat umum sebagai representasi bentuk
pengukuran suatu konstruk tertentu
Keseluruhan prosedur pengembangan dan upaya penilaian tingkat validitas
konstruk dapat divisualisasikan seperti gambar
Gambar 5. Prosedur Valiadasi Konstruk dalam pengembangan instrumen evaluasi

2.1.3 Validitas Konkuren
Karakteristik keefektifan instrumen evaluasi selain dapat dilihat dari tingkat

validitas isi dan validitas konstruk juga dapat dilihat dari validitas konkuren.
Penilaian terhadap validitas konkuren suatu instrumen evaluasi lebih didasarkan pada
data empirik yang berasal dari target sasaran yang akan dikenai alat pengukuran.
Data empirik dari target sasaran ini, lazimnya diperoleh dari kegiatan uji coba
lapangan. Target sasaran yang dijadikan respoden dalam melakukan kegiatan uji
coba lapangan, dipilih yang memenuhi persyaratan dari aspek karakteristik
psikologis. Misalnya, tingkatan usia kronologis, tingkat kematangan berpikir dan
perkembangan emosionalnya, serta pengalaman pada bidang yang dikenai
pengukuran. Dengan kata lain, untuk melakukan penilaian terhadap tingkat
keefektifan suatu instrumen evaluasi melalui validitas konkuren berdasarkan pada
data empirik yang dikumpulkan dan dianalisis dengan teknik dan rumus statistik
tertentu.
Tingkat validitas konkuren sebagai salah satu indikator karakteristik keefektifan

suatu instrumen evaluasi adalah sebagai suatu representasi kesesuain hasil secara
kuantitatif antara dua jenis instrumen yang digunakan untuk mengukur suatu
karakteristik objek sasaran pengukuran tertentu (kognitif, psikomotorik, atau afektif)
pada interval waktu tertentu yang relatif sama. Kedua jenis instrumen evaluasi yang
dimaksud adalah satu instrumen sebagai hasil aktivitas pengembangan instrumen
(instrumen baru) yang akan dinilai tingkat validitasnya, sedangkan satu instrumen
yang lain digunakan sebagai instrumen standar (baku) yang diajadikan sebagai acuan
atau kriteria dalam menguji validitas konkuren (instrumen standar).
Upaya melakukan penilaian tingkat validitas konkuren suatu instrumen evaluasi

dapat dilakukan dengan dua cara. Cara pertama, dengan menggunkan dua macam
instrumen evaluasi untuk melakukan pengukuran satu fenomena, satu faktor atau satu
variabel yang dilakukan dalam waktu bersamaan (konkuren). Kedua instrumen dalam
cara pengukuran tingkat validitas konkuren ini adalah satu instrumen diperankan
sebagai instrumen baru (dikembangkan dan akan di uji tingkat validitasnya), dan satu
instrumen yang lain berperan sebagai instrumen kriteria. Kedua instrumen yang
memiliki peranan yang berbeda ini, dalam uji coba digunakan untuk melakukan
pengumpulan data atau informasi pada sasaran responden yang relatif sama
karakteristiknya pada waktu bersamaan atau waktu yang berbeda. Hasil pengukuran
dari kedua instrumen (instrumen baru dan instrumen kriteria) yang bersifat data
kuantitatif dari responden tertentu setelah diolah dan dianalisis dengan menggunakan
teknik dan rumus statistik tertentu yang tepat untuk melakukan pengujian terhadap
signifikansi hubungan antar dua kelompok variabel atau antara dua kelompok rerata
data hasil uji coba. Hasil uji signifikansi hubungan antara kedua instrumen
(instrumen baru dan instrumen kriteria) diperoleh apa yang disebut dengan besaran
koefisien korelasi.
Begitu juga, dengan cara yang kedua untuk melakukan penentuan validitas
konkuren suatu instrumen dapat dilakukan sebagaimana dengan cara yang pertama,
menggunakan analog dengan cara berpikir yang pertama yaitu dengan menggunakan
dua instrumen evaluasi (instrumen baru dan instrumen kriteria) untuk melakukan
pengukuran dua fenomena, dua faktor atau dua variabel konkuren. Pembeda antara
cara yang pertama dan cara yang kedua dalam melakukan penilaian tingkat validitas
konkuren suatu instrumen adalah pada jumlah fenomena , jumlah faktor atau jumlah
variabel yang dijadikan objek sasaran pengukuran. Prosedur penilaian tingkat
validitas konkuren terhadap suatu instrumen dan juga pembeda dalam kiat
pelaksanaan pengukurannya pada cara tersebut secara skematis dapat
divisualisasikan.
2.1.4 Validitas Peramal
Karakteristik keefektifan instrumen evaluasi dengan kriteria eksternal selain dapat

dilakukan dengan cara menilai tingkat validitas secara konkuren juga dapat dilakukan
penilaian dengan validitas peramal (predictive validity). Pelaksanaan penilaian
karakteristik keefektifan suatu instrumen dengan validitas peramal juga
menggunakan analog berpikir dengan penilaian keefektifan instrumen dengan
validitas konkuren, tetapi lebih berorientasi penekanannya pada unsur kriteria yang
digunakan sebagai acuan. Kriteria yang dimaksud dalam penilaian keefektifan
instrumen dengan validitas peramal dapat dipilih menjadi dua, yaitu kriteria masa
lampau (post predictive validity), dan kriteria masa mendatang (pre-predictive
validy). Kriteria masa lampau yang digunakan sebagai acuan dalam hal ini lebih
berdasarkan pada hasil pengukuran yang dilakukan sebelumnya untuk membuat
justifikasi yang terkait tentang tingkat validitas suatu instrumen berdasarkan hasil
pengukuran saat ini. Sedangkan apabila menggunakan kriteria masa mendatang,
untuk membuat justifikasi tentang tingkat vaiditas instrumen lebih berdasarkan pada
hasil pengukuran di masa mendatang. Dengan kata lain untuk melakukan penilaian
terhadap tingkat keefektifan suatu instrumen evaluasi melalui validitas peramal
berdasarkan pada data empirik yang dikumpulkan, diolah dan dianalisis dengan
teknik statistik dan rumus tertentu dengan lebih menekankan pada faktor kriteria
yang mengacu baik kriteria pada masa lalu maupun pada masa yang akan datang.
Tingkat validitas peramal sebagai salah satu indikator karakteristik keefektifan

suatu instrumen evaluasi adalah merupakan representasi kesesuaian hasil secara
kuantitatif yang diramalkan dalam mengukur suatu karakteristik fenomena tertentu
kognitif, psikomotorik dan afektif) pada interval waktu tertentu sebagai acuan
kriteria pada masa lalu atau pada masa mendatang. Validitas peramalan dengan
mengacu kriteria pada masa lalu dari instrumen evaluasi yang dimaksud adalah
dengan menempatkan fenomena, faktor atau variabel masa lalu sebagai kriteria dan
fenomena, faktor atau variabel sekarang sebagai alat uji atau sebagai alat bukti.
Representasi tingkat validitas instrumen evaluasi dapat juga sebagai upaya untuk
meningkatkan tingkat validitas instrumen evaluasi, terutama pada validitas empirik
disarankan Phillip ( 1991) perlu memperhatikan hal hal berikut. Pertama, perlu
memperhatikan kejelasaan yang terkati dengan ranah (domain), dimensi dari ranah
atau domain, indikator atau diskriptor dari sesuau yang dijadikan objek sasaran
pengukuran.
Kedua, dengan memperbanyak jumlah butir pertanyaan atau butir pernyataan sebagai
represetasi instrumen evaluasi yang dikembangkan dari indikator atau deskriptor
yang mengacu pada keberadaan sampel esensial dari setiap dimensi dari ranah yang
dijadikan objek pengaukuran. Ketiga, pemilihan diksi, redaksi, baik yang terkait
subtansi, petunjuk maupun tampilan instrumen evakuasi diupayakan sekecil mungkin
sebagai penyebab terjadi suatu respon yang potensial bias. Keempat, pengelolaan
dalam melaukan tahapan persiapan, pelaksaan, dan pengadministrasian waktu
melakukan uji coba instrumen secara objektif dan sistematik. Kelima, mengenali
beberapa kelemahan kaitan antar sikap dan tingkah laku utamanya dari pihak
responden dan pihak aktor pendukungnya dalam melaksanakan uji coba.
2.2 Reliabilitas Instrumen Evaluasi
Reliabilitas instrumen evaluasi merupakan karakteristik penting sebagai jaminan dan

bentuk pertanggungjawaban terhadap kefektifan suatu instrumen evaluasi yang akan
digunakan dalam proses pengumpulan data atau informasi. Suatu instrumen evaluasi
dikatakan memiliki karakteristik reliabilitas yang memenuhi persyaratan minimal
(dalam hal ini efektif), apabila digunakan dalam kegiatan pengukuran terhadap suatu
fenomena, suatu faktor, atau suatu variabel dalam interval waktu pelaksanaan
pengukuran atau pada kelompok yang dijadikan objek sasaran pengukuran yang
relatif sama dan atau relatif berbeda, tetapi menunjukkan hasil pengukuran yang
relatif konsisten (ajeg). Suatu instrumen evaluasi memiliki karakteristik reliabilitas
yang baik (memenuhi persyaratan minimal yang ditetapkan), apabila memiliki
tingkat keajegan hasil pengukuran yang relatif sama pada waktu pengukuran yang
berbeda pada fenomena, faktor, atau variabel yang sama atau yang berbeda yang
memiliki sifat-sifat yang relatif sama.
2.2.1 Ancaman Reliabilitas Instrumen
Ada beberapa hal yang dapat berpengaruh negatif (mengancam) terhadap keberadaan
tingkat reliabilitas suatu instrumen evaluasi. Pertama, adanya fenomena terjadinya
fluktuasi kesiapan mental dari individu atau kelompok individu partisipan yang
dijadikan sebgai responden pada saat pelaksanaan pengukuran. Fluktuasi kesiapan
mental responden ini merupakan representasi kondisi psikologis (internal individu)
yang ada pada saat sebelum, pada saat selama, dan pada saat setelah memberikan
respon terhadap berbagai butir pertanyaan atau pernyataan yang dijadikan sebagai
suatu stimulus dalam prosen pengukuran yang dilakukan. Kedua, adanya variasi
kondisi yang terjadi dalam pelaksanaan pengukuran dengan suatu instrumen evaluasi
tertentu. Yang ternasuk dalam kondisi latar ini dapat diperikan antara variasi waktu
pelaksanaan. Ketiga, adanya perbedaan dalam presepsi dan acuan kegiatan dalam
menginterpretasikan suatau hasil pengukuran sebagai representasi respon dari pihak
responden terhadap butir-butir instrumen evaluasi sebagai bentuk stimulus. Keempat,
adanya pengaruh “random” (acak) yang disebabkan oleh tingkat motivasi partisipan
yang berperan sebagai responden dalam pelaksanaan pengukuran. Mengingat daam
pelaksanaan pengukuran dengan jenis instrumen tertentu (jenis tes atau non tes) yang
dikenakan terhadap sekelompok subjek sasaran terntentu, maka akan menghadapi
adanya variasi suasana psikologis (dalam hal ini motivasi) dai individu atau
kelompok subjek yang menjadi target sasaran. Kelima, adanya instruenn yang
menyajikan terlalu banyak butir pertanyaan atau pernyataan yang diperankan sebagai
stimulus bagi partisipan sebagai responden. Jumlah butir pertanyaan atau pernyataan
dalam intrumen evaluasi harus dirancang sacara proporsional, baik dari sisi
representativeness subtans isi yang dijadikan objek pengukuran, alokasi waktu yang
disediakan bagi partisipan sebagai responden, tujuan dari pelaksanaan pengukuran
suatu fenomena, faktor, atau variabel yang dijadikan sebagai objek pengukuran,
maupun jenis data atau informasi yang diperlukan melalui kegiatan pengukuran.
2.2.2 Fenomena Kesalahan dalam Pengukuran
Fenomena terjadinya kesalahan interpretasi hasil pengukuran sebagai representasi

respon partisipan ini oleh Nunnally (1978) dapat dipilah menjadi dua kategori.
Potensi terjadinya kesalahan hasil pengukuran yang dikategorikan kedalam kesalahan
sampel dan kesalahan sistematik. Kesalahan interpretasi hasil pengukuran termasuk
dalam kategori kesalahan sampel (sampling) potensial terjadi, apabila kesalahan hasil
pengkuran yang disebabkan oleh adanya variasi respon dari setiap individu atau
kelompok responden sebagai akibat dari ketidakjelasan (adanya multi tafsir) dari
keberadaan butir-butir pertanyaan atau penyataan yang berfungsi sebagai stimulus
yang kemungkinan terjadi pada setiap individu atau kelompok responden. Kesalahan
pengkuran yag masuk dalam kategori kesalahan sampel, potensial akan
menghasilkan data atau informasi yang tidak valid dan reliabel (data bias), sehingga
hal ini akan menyebabkan simpulan akhir dari hasil pengukuran yang bias atau
simpulan akhir dari hasil pengukuran yang “sesat”.
Fenomena terjadinya kesalahan interpretasi hasil pengukuran yang termasuk dalam

kategori kesalahan sistematik potensial akan terjadi, apabila kesalahan hasil
pengukuran yang disebabkan oleh adanya variasi respon dari setiap individu atau
kelompok responden sebagai akibat penafsiran dari butir-butir pertanyaan atau
pernyataan yang berfungsi sebagai stimulus itu, terjadi pada setiap individu atau
kelompok responden yang bersifat konsisten. Kesalahan pengukuran yang termasuk
dalam kategori kesalahan sistematik, potensial akan menghasilkan data atau
informasi yang valid dan reliabel (tidak bias), sehingga hal ini tidak akan
menyebabkan simpulan akhir hasil pengukuran yang bias atau tidak akan
menghasilkan simpulan akhir dari hasil pengukuran yang “sesat”. Kedua jenis
kemungkinan kesalahan dalam pengukuran terhadap suatu fenomena, faktor, atau
variabel yang dijadikan objek pengukuran dan potensial pengaruh yang ditimbulkan
terhadap kualitas simpulan hasil akhir dari kegiatan pengkuran disajikan secara
skematis pada gambar.
2.2.3 Kiat Menetukan Reliabilitas Instrumen
Ada empat cara yang dapat ditempuh dalam melakukan penilaian terhadap tingkat
rilabiitas instrumen evaluasi, yaitu dengan cara tes ulang, bentuk silang, prosedur
belah dua, dan korelasi interbutir. Pertama, penilaian terhadap tingkat reliabilitas
instrumen evaluasi denga cara tes ulang (test re-test) atau pengukuran ulang. Cara ini
dilakukan dengan mengadakan tes atau pengukuran terhadap kelompok sasaran yang
sama, tetapi pada waktu yang berbeda. Dalam cara ini, partisipan individu atau
kelompok sebagai responden adalah sama, tetapi diikenai proses pengukuran
terhadap sesuatu hal yang sama dalam waktu yang berbeda. Kedua, penilaian
terhadap tingkat reliabilitas instrumen evaluasi dengan cara bentuk berselang. Cara
ini dilakukan dengan dikembangkannya dua macam instrumen yang sama digunakan
untuk melakukan pebgukuran pada individu atau kelompok yang dijadikan target
sasaran tertentu pada waktu atau pengukuran yang sama. Dengan cara ini, partisipan
(individu atau kelompok) sebagai responden yang sama, tetapi dikenai proses
pengukuran dalam waktu yang berbeda dengan instrumen pengukuran yang berbeda
(dalam hal ini ada dua macam instrumen). Ketiga, penilaian terhadap tingkat
reliabilitas instrumen evaluasi dengan cara belah dua. Cara ini dilakukan dengan
melaksanakan tes atau pengukuran terhadap satun kelompok subjek yang dijadikan
responden, dengan satu macam instrumen evaluasi. Dengan metoden ini cukupp
diperukan dengan satu jenis instrumen, satu kelompok partisipan, dan satu kali waktu
pelaksanaan pengukuran, tetapi dilakukan pemilhan pada waktu analisis data hasil
pengukuran. Kedua hasil data dari pelaksanaan pengukuran ini dianalisis dengan
teknik dan rumus statistik tertentu (misalnya dengan korelasi) untuk menetukan
besaran koefisien korelasinya. Keempat, penilaian terhadap tingkat reliabilitas
instrumen evaluasi dengan cara korelasi inter-butir. Cara ini ditempuh dengan
melakukan tes atau pengukuran terhadap satu kelompok subjek yang diposisikan
sebagai responden, dengan satu macam instrumen evaluasi.
2.2.4 Upaya Mempertinggi Reliasbilitas Instrumen
Di samping, kedua tolo ukur karakteristik keefektifan instrumen di atas, yaitu

terpenuhinya besaran tingkat validitas dan reliabiiltas, agar peranan instrumen dapat
optimal sebagai alat dalam pelaksanaan pengukuran suatu fenomena, faktor, atau
variabel juga perlu memperhatikan hal-hal berikut. Pertama, instrumen evaluasi
sebagai alat pengukuran diupayakan mudah untuk digunakan. Persyaratan ini
menuntut adanya unsur kepraktisan pelaksanaan, baik bagi responden maupun bagi
pelaksana yang melakukan proses pengukuran. Utamanya, dalam hal piranti, kondisi
yang diperlukan tidak terlau kompleks bagi responden, dan waktu yang
dipersyaratkan dalam pelaksanaan pengukuran tidak terlalu singkat atau terlalu
belebihan. Kedua, instrumen evaluasi itu harus sederhana dan jelas. Sederhana dalam
bentuk tampilan serta tuntutan respon bagi responden utamanya dalam hal ini
petunjuk cara pengerjaannya, tujuan dari dilakukannya pengukuran, rubrik yang
tersedia sebagai acuan pengadministrasian hasil pengukuran, dan standar serta
interpretasi hasil pengukuran. Ketiga, instrumen evaluasi harus memiliki nilai
ekonomis yang tinggi. Persyaratan ini menuntut adanya efisiensi dalam
pelaksanaannya dilapangan, baik bagi responden maupun bagi pelaksana
pengukuran. Utamanya dalam hal besaran beaya dan waktu yang dipersyaratkan
dalam hal pelaksanaan pengukuran tidak terlalu tinggi dan tidak terlalu “bertele-tele”
prosedur dan waktu yang diperlukan (tidak terlalu lama). Keempat, instrumen
evaluasi harus memenuhi unsur kelengakapan dari sisi sarana pendukung yang
diperluakan, baik dalam pelaksanaan maupun pengadministrasian. Wujud saran
oengdukuan yang dimaksud adalah dapat berupa logistik, komputer, dan
keterampilan dalam melakukan pengolahan dan analisi data atau informasi.
3. Langkah-langkah Pengembangan Instrumen Evaluasi

Secara umum instrumen evaluasi program dapat dipilah kedalam dua kategori. Kedua
katergori yang dimaksud adalah kategori instrumen jenis tes dan kategori instrumen jenis
nontes. Pembeda utama diantara kedua kelompok instrumen evaluasi ini adalah dari
karakteristik respon jawaban dari responden yang dijadikan sasaran pengukuran.
Langkah atau prosedur dalam pengembangan instrumen evaluasi, baik dalam kelompok
instrumen jenis nontes maupun kelompok instrumen jenis tes disampaikan dalam paparan
berikut.
3.1 Langkah-Langkah Pengembangan Instrumen Bentuk Tes
Instrumen evaluasi perlu dikembangkan secara umum dan dipilah menjadi
instrumen bentuk tes dan nontes dengan karakteristik masing-masing, utamanya dalam
prosedur pengembangan instrumen evaluasi bentuk tes ini perlu mengikuti rambu-rambu
antara lain instrumen tes harus: mengandung isi essensial yang diukur secara
representatif, dirancang secara cermat, dan memadai, baik cakupan subtansi isi, alokasi
waktu, maupun tampilannya; dilakukan telaah oleh ahli dan sejawat yang sebidang; ada
petunjuk pengerjaan, tagihan akhir, dan rubric yang jelas, operasional dan konsisten;
tidak memberikan informasi yang menyesatkan partisipan (testee).
Langkah yang perlu ditempuh dalam mengembangkan instrument evaluasi

kelompok tes dapat diperikan meliputi hal berikut. Pertama melakukan telaah standar
kompetensi, kompetensi dasar (subkompetensi) yang akan dijadikan objek sasaran
pengukuran dalam konteks program (pendidikan, pembelajaran, pelatihan) biasanya telah
diperikan dalam kurikulum yang telah dirancang, ditetapkan dan digunakan sebagai
acuan pelaksanaan program. Kedua, hasil telaah standar kompetensi dan kompetensi
dasar atau subkompetensi serta batasan operasionalnya, lalu dijabarkan lagi menjadi lebih
rinci ke dalam indikator- indikator penguasaan kompetensi dituangkan ke dalam
rancangan pengembangan tes dalam bentuk kisi-kisi. Pengembangan kisi-kisi instrumen
evaluasi bentuk tes ini setidaknya memuat (a) tujuan diadakan tes; (b) jenis bidang uji
secara spesifik; (c) jumlah butir pertanyaan: (d) alokasi waktu yang dibutuhkan dalam
tes; (e) bentuk butir pertanyaan; (f) jenis kompetensi yang diujikan; (g) lingkup cakupan
material uji; (h) indikator setiap subkompetensi yang diukur; dan (i) nomor butir
instrument setiap indikator. Format kisi-kisi sebagai acuan dalam pengembangan
instrument jenis tes secara lengkap dapat dilihat dalam diagram skematis yang disajikan
pada gambar 2. Ketiga melakukan telaah kisi-kisi secara silang oleh ahli bidang studi
yang relevan bukan sebagai penulis kisi-kisi. Dimaksudkan untuk dapat
mempertimbangan (justification), terutama pada aspek ketepatan memilih dan
menetapkan subtansi isi yang dijadikan objek sasaran, kesesuaian jabaran dari substansi
ke dalam sampel isi penting, dan alternatif strategi pengukuran yang ditetapkan (metode
tes, bentuk instrument, dan perian nomor butir). Untuk mempermudah dalam pelaksanaan
validasi isi oleh para ahli yang ditunjuk, kiranya diperlukan runtutan jabaran mulai dari
standar kompetensi, kompetensi dasar, atau subkompetensi dasar, indikator, dan jabaran
butir pertanyaan disajikan dalam bentuk model diagram “Garpu Tala” Wujud dari
diagram “Garpu Tala” yang menunjukkan koherensi dan representativeness hubungan
antara standar kompetensi, kompetesi dasar, subkompetensi dasar, indikator, dan butir-
butir pertanyaan dari suatu instrument evaluasi jenis tes.
Gambar 2. Format dan isi Kisi-Kisi Pengembangan Tes
Keempat apabila memungkinkan dikembangkan spesifikasi butir pertanyaan yang

dapat memberi gambaran konkret terjemahan dan contoh butir untuk setiap indikator
yang diujikan, maksudnya untuk memudahkan dalam proses pembuatan tes parallel.
Kelima penulisan butir pertanyaan, sebaiknya dalam menentukan butir pertanyaan
sebagai wujud penjabaran indikator essensial terpilih dimulai dengan menuliskan konsep
pokok material uji, agar dapat dikembangkan situasi atau kondisi yang mungkin dijumpai
peserta (testee) dalam kehidupan sehari hari. Keenam melakukan telaah butir pertanyaan
silah oleh para ahli bidang studi yang relevan dan bukan sebagai penulis butir pertanyaan.
Hal ini perlu dilakukan pada langkah ini sebagai bentuk dari proses validasi logis butir
pertanyaan dan juga dapat sebagai upaya dalam menilai kebenaran konsep yang diujikan
serta keakuratan kunci jawaban beserta variasi pengecoh (distractor).
Ketujuh, melakukan kompilasi butir tes (pertanyaan sesuai dengan kelompok

subkompetensi) dan indikator serta dilengkapi dengan petunjuk teknis pengerjaan, kunci
jawaban dan rubric yang diperlukan. Kedelapan, mencermati naskah tes agar terbebas
dari kesalahan terhadap unsur pengetikan, penggunaan Bahasa Indonesia, pemakaian
tanda baca, simbul atau lambang, dan berbagai kesalahan lain yang tidak perlu Pada
langkah ini diperlukan seseorang atau beberapa orang yang berperan sebagai “proof
reading”. Terakhir apabila dipandang perlu hasil pengembangan instrumen tes ini
dilakukan uji coba empiric pada sampel testee yang memiliki karakteristik relatif sama
dengan karakteristik target sasaran. Hasil uji coba dapat dianalisis dan diuji besaran
tingkat validitas, reliabilitas, terpenuhinya syarat dalam analisis butir, daya beda dan taraf
kesukaran dari instrumen telah dikembangkan. Keseluruhan langkah pengembangan
instrumen evaluasi jenis tes ini, akan lebih jelas, apabila mencermati diagram skematis
yang divisualisasikan pada gambar sebagai pedoman prinsip umum dalam prosedur
pengembangan instrumen bentuk tes.
Gambar 3. Prinsip Umum Pengembangan Instrumen Tes
Jenis instrumen bentuk tes dalam kegiatan evaluasi dapat direpresentasikan

menjadi beberapa macam yaitu, instrumen tes dalam bentuk tertulis, tertulis dalam bentuk
wawancara, dan instrumen tes dalam performansi atau kinerja (pengamatan). Bila dilihat
dari sisi variasi sajiannya instrumen jenis tes dapat dipilah menjadi bermacam-macam
bentuknya. Misalnya, pada tes tulis dapat berbentuk pilihan ganda, menjodohkan,
melengkapi jawaban, jawaban singkat, atau tes subjektif yang menuntut jawaban terbuka
dari testee. Bentuk tes yang dipilih oleh pengembangan ini tentunya disesuaikan dengan
jenis data atau informasi yang diperlukan dalam upaya mencapai tujuan kegiatan
evaluasi, karakteristik sasaran yang dijadikan objek evaluasi, karakteristik tim evaluator,
sarana pendukung pelaksanaan evaluasi yang tersedia, dan faktor kendala yang tak dapat
diletakkan dalam pelaksanaan kegiatan evaluasi.Ini dilakukan agar diperoleh jenis
instrumen evaluasi jenis tes yang memenuhi tuntutan persyaratan validitas dan reliabilitas
instrumen. Baik validitas isi, validitas empiric maupun validitas preditif, sehingga
berpotensi menghasilkan data atau informasi yang dibutuhkan dalam kegiatan penelitian
yang benar.
3.2 Langkah-Langkah Pengembangan Instrumen Bentuk Non-Tes

Langkah-langkah atau prosedur dalam upaya mengembangkan instrumen evauasi
yang termasuk kelompok nontes dapat diperikan sebagai berikut. Pertama, melakukan
identifikasi, memilih dan pada akhirnya menetapkan ranah, fenomena, faktor, atau
variabelyang dapat berup kosep atau konstruk yang akan dijadiakn sebagai objek sasaran
pengukuran. Dalam melakukan langkah penetapan ranah sebagai objek sasaran evaluasi
ini berdasarkan pada skala prioritastertentu yang dihasilkan dari aktivitas needs
assessnment. Baik pada keseluruhan atau pada bagian-bagian komponen (konteks, input,
proses, produk, output, atau outcome) dari suatu program yang dievaluasi. Kedua,
memberikan batasan konseptual dan atau batasan operasional terhadap ranah, fenomena,
faktor, aatau variabel yang akan dijadikan sebagai objek sasaran pengukuran. Upaya
pemberian batasan konseptual atau batasan operasional dalam hal ini dimaksudkan agar
menjadi jelas sosok dari setiap ranah, fenomena, faktor, atau variabel beserta dimensi-
dimensi dan deskriptor dari objek yang akan dijadikan objek sasaran pengukuran.
Ketiga, mengkaji akan keberadaan dan representativeness cakupan jabaran isi

dimmensi dari setiap ranah, fenomena, faktor, atau variabel yang dijadikan objek sasaran
pengukuran. Dalam tahapan ini perlu dilakukan telaah yang membantu untuk
mendapatkan jawaban atas pertanyaan “apakah dimensi-dimensi dari setiap ranah,
fenomena, faktor atau variabel yang akan diukur telah dijabarkan secara runtut dan
memadai?” dengan demikian keberadaan jabaran sampling isi esensial dari setiap dimensi
memang telash mewakili sosok dari setiap ranah, fenomena, faktor, atau variabel yang
dijadikan objek sasaran pengukuran. Keempat, melakukan penjabaran sampling isi
esensial dari setiap dimensi ranah isi yang relevan dan representatif ke dalam bentuk
deskriptor-deskriptor. Penyebutan hasil penjabaran setiap dimensi dari ranah yang
dijadikan objek sasaran pengukuran dalam pengembangan instrumen jenis nontes ini
lebih lazim disebu sebagai deskriptor. Pada uraian selanjutnya ini nanti yang akan
membedakan dengan hasil jabaran setiap dimensi dari ranah yang dijadikan objek sasaran
pengukuran dalam pengembangan instrumen jenis tes yang lebih lazim disebut sebagai
indikator. Dalam tahapan ini, perlu dilakukan telaah untuk mendapatkan jawaban atas
pertanyaan “Apakah keberaaan jabaran deskriptor-deskriptor dari setiap dimensi yang
akan diukur telah memenuhi persyaratan mewakili, runtut, dan memadai?” dengan
demikian keberadaan jabaran sampling isi esensial dari sejumlah deskriptor memang
telah mewakili setiap dimensi dari ranah, fenomena, faktor atau variabel yang dijadikan
Kelima, mengkaji keberadaan dan representtiveness cakupan jabaran isi

deskriptor setiap dimensi dari setiap ranah, fenomena, faktor atau variabel yang dijadikan
objek sasaran pengukuran. Hal ini penting dilakukan dikarenakan keberadaan dari setiap
deskriptor akan digunakan sebagai acuan dalam melakukan penjabaran butir-butir
pertanyaan atau pernyataan. Keenam, melakukan penjabaran isi deskriptor-deskriptor dari
setiap dimensi yang relevan dan representatif ke dalam bentuk pertanyaaan atau
pernyataan sebagai representatif butir instrumen. Ketujuh, mengkaji keberadaan dan
representativeness cakupan jabaran isi butir-butir pertanyaan setiap deskriptor. Dalam
langkah penjabaran deskriptor ke dalam butir pertanyaan atau pernyataan ini mengikuti
pedoman yang menyatakan bahwa dari setiap deskriptor minimal perlu dijabarkan
menjadi dua butir pertanyaan atau pernyataan. Hal ini dimaksudkan agar lebih fleksibel,
dan efisien pada kegiatan lebih lanjut nantinya, utamanya dalam melakukan kegiatan uji
coba di lapangan yang bertujuan untuk menilai besaran tingkat validitas dari suatu
instrumen yang dikembangkan.
Gambar 4. Prinsip Umum Pengembangan Instrumen Nontes
BAB III
PENUTUP
Kesimpulan
Pengertian instrumen dalam lingkup evaluasi didefinisikan sebagai perangkat untuk

mengukur hasil belajar siswa yang mencakup hasil belajar dalam ranah kognitif, afektif, dan
psikomotor. Bentuk instrumen dapat berupa tes dan non-tes. Instrumen bentuk tes mencakup: tes
uraian (uraian objektif dan uraian bebas), tes pilihan ganda, jawaban singkat, menjodohkan,
benar salah, unjuk kerja (performance test), dan portofolio. Instrumen bentuk non-tes mencakup:
wawancara, angket, dan pengamatan (observasi).
Instrument evaluasi hasil belajar digunakan untuk memperoleh informasi deskriftif dan
informasi judgemental yang dapat berwujud tes maupun nontes. Tes dapat berwujud objektif
atau uraian. Sedangkan nontes dapat berbentuk lembar pengamatan atau questioner. Penyusunan
instrument evaluasi baik tes maupun nontes hendaknya memenuhi syarat Instrument yang baik
yaitu valid dan realiabel.
Penggunaan instrument evaluasi harus dilaksanakan secara objektif dan terbuka agar
diperoleh informasi yang sahih, dapat dipercaya sehinnga dapat bermanfaat bagi peningkatan
mutu pembelajaran.
DAFTAR PUSTAKA
Mukhadis, A. 2017. Evaluasi Program Pembelajaran Bidang Teknologi.

Malang: Penerbit Media Nusa Creative.
Daryanto. 1997. Evaluasi Pendidikan. Solo: Rineka Cipta.
Sanjaya, Wina. 2008. Kurikulum dan Pembelajaran. Bandung: Kencana Prenada Media
Group.
Sukardi. (2008). Evaluasi Pendidikan. Jakarta: Bumi Aksara

Ragam Instrumen Evaluasi

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Ragam Instrumen Evaluasi

Diunggah oleh

Hak Cipta:

Format Tersedia

Ragam Instrumen Evaluasi, Persyaratan Instrumen Evaluasi, Dan Prosedur

Pengembangan Dalam Konteks Evaluasi Pembelajaran Di Sekolah

Untuk Memenuhi Tugas Mata Kuliah Evaluasi Pembelajaran

Yang Dibina Oleh Prof. Dr. A. Mukhadis

UNIVERSITAS NEGERI MALANG

Ragam instrumen evaluasi, persyaratan instrumen evaluasi, dan prosedur pengembangan

Malang, 23 Februari 2020

Pembelajaran tingkat satuan pendidikan merupakan wujud pelaksanaan kurikulum

Evaluasi proses pembelajaran menekankan pada evaluasi pengelolaan pembelajaran

Tujuan Penulisan dari makalah ini ditunjukkan sebagai berikut :

1. Ragam Jenis Instrumen evaluasi

Palaksanaan evaluasi program pembelajaran atau pelatihan di tengah suatu

Pelaksaaan evaluasi program pembelajaran atau pelatihan pada interval waktu

Dalam program pengembangan sumberdaya manusia, instrumen jenis tes ini

1.4 Bentuk Wawancara

Disamping berbagai kelebihan, wawancara juga berpotensi adanya kelemahan

1.5 Diskusi Kelompok Terfokus

Penggunaan kelompok fokus dapat diperikan sebagai berikut. Pertama, kelompok

Tingkat efektifitas, efisiensi, kecermatan, ketelitian dan kesabaran dalam

1.7 Rekaman Perilaku (Performance Record)

Langkah-langkah dalam upaya meningkatkan efektivitas dan efisiensi dalam

Pertama pertimbangan akan keluasan ranah, kedalam tagihan ranah, dan

Hubugan antara jenis, dan pertimbangan melakukann kombinasi dalam

Gambar 1. Kelompok dan Kombinasi Penggunana Instrumen Evaluasi

2. Persyaratan Instrumen Evaluasi

Gambar 2. Prosedur validasi isi dalam pengembangan Instrumen Evaluasi

Gambar 4. Model Garpu Tala dalam Pengembangan Instrumen Jenis Tes

Gambar 5. Prosedur Valiadasi Konstruk dalam pengembangan instrumen evaluasi

Karakteristik keefektifan instrumen evaluasi selain dapat dilihat dari tingkat

Tingkat validitas konkuren sebagai salah satu indikator karakteristik keefektifan

Upaya melakukan penilaian tingkat validitas konkuren suatu instrumen evaluasi

Karakteristik keefektifan instrumen evaluasi dengan kriteria eksternal selain dapat

Tingkat validitas peramal sebagai salah satu indikator karakteristik keefektifan

2.2 Reliabilitas Instrumen Evaluasi

Reliabilitas instrumen evaluasi merupakan karakteristik penting sebagai jaminan dan

2.2.1 Ancaman Reliabilitas Instrumen

2.2.2 Fenomena Kesalahan dalam Pengukuran

Fenomena terjadinya kesalahan interpretasi hasil pengukuran sebagai representasi

Fenomena terjadinya kesalahan interpretasi hasil pengukuran yang termasuk dalam

2.2.4 Upaya Mempertinggi Reliasbilitas Instrumen

Di samping, kedua tolo ukur karakteristik keefektifan instrumen di atas, yaitu

3. Langkah-langkah Pengembangan Instrumen Evaluasi

Langkah yang perlu ditempuh dalam mengembangkan instrument evaluasi

Gambar 2. Format dan isi Kisi-Kisi Pengembangan Tes

Keempat apabila memungkinkan dikembangkan spesifikasi butir pertanyaan yang

Ketujuh, melakukan kompilasi butir tes (pertanyaan sesuai dengan kelompok

Gambar 3. Prinsip Umum Pengembangan Instrumen Tes

Jenis instrumen bentuk tes dalam kegiatan evaluasi dapat direpresentasikan

3.2 Langkah-Langkah Pengembangan Instrumen Bentuk Non-Tes

Ketiga, mengkaji akan keberadaan dan representativeness cakupan jabaran isi

Kelima, mengkaji keberadaan dan representtiveness cakupan jabaran isi

Pengertian instrumen dalam lingkup evaluasi didefinisikan sebagai perangkat untuk

Mukhadis, A. 2017. Evaluasi Program Pembelajaran Bidang Teknologi.

Daryanto. 1997. Evaluasi Pendidikan. Solo: Rineka Cipta.

Sukardi. (2008). Evaluasi Pendidikan. Jakarta: Bumi Aksara

Anda mungkin juga menyukai