BAHAN AJAR
Oleh :
Ma’mun Sutisna
1
HAND OUT
PENDAHULUAN
PENDAHULUAN
Pada era sekarang ini atau yang lebih dikenal dengan era modernitas, segala sesuatu
telah mengalami perubahan atau yang namanya modernisasi. Salah satu yang terjadi dalam
era modern adalah perubahan tujuan pendidikan. Perubahan tujuan pendidikan tersebut
pastilah melahirkan suatu titik tekan atau kurikulum pembelajaran yang selalu mengiringi
setiap perubahan. Dan suatu kurikulum yang berbeda pasti melahirkan suatu sistem evaluasi
atau penilaian yang berbeda. Penilaian pada kurikulum KBK ini diharapkan dapat menjadi
feetback yang baik dan sepenuhnya dapat digunakan untuk mengetahu kompetensi yang
dicapai oleh peserta didik. Juga penilaian pada kurikulum ini diharapkan akan dapat menjadi
acuan menentukan keberhasilan peserta didik.
2
Namun sistem penilaian yang dipakai oleh guru atau pendidik pada masa ini masih
cenderung monoton dan masih terbawa dengan model penilaian pada kurikulum lama.
Disamping itu model penilaian KBK ini belum banyak dipakai, entah apa alasannya, akan
tetapi fakta berkata demikian. Maka dari itu kami akan mencoba menulis mengenai penilaian
yang berbasis kompetensi yang kami ambil dari berbagai referensi yang ada dan dari
pengetahuan yang kami miliki.
Pada intinya siswa dinilai kemampuannya dengan berbagai cara. Tidak hanya dari hasil
ulangan tulis. Prinsip utama penilaian dalam Kurikulum Berbasis Kompetensi tidak hanya
menilai apa yang diketahui siswa, tetapi juga menilai apa yang dilakukan siswa. Penilaian itu
mengutamakan kualitas hasil kerja siswa dalam menyelesaikan tugas.
URAIAN MATERI
URAIAN MATERI
A. Pengertian Penilaian Berbasis Kompetensi
Penilaian berbasis kompetensi adalah uraian keterangan yang teratur sebagai
penjelasan prosedur dan cara menilai pencapaian kompetensi oleh siswa. Selain itu
penilaian berbasis kompetensi juga dapat dirtikan sebagai teknik evaluasi yang
harus dilakukan guru dalam pembelajaran di sekolah. Instrumen penilaiannya
dikembangkan mengacu pada pada indikator-indikator pencapaian kompetensi yang
di tetapkan. Penilaian mencakup semua kompetensi dasar. Penilaian dilakukan
untuk memperoleh informasi tentang kemajuan yang dicapai dan ketuntasan
penguasaan kompetensi dari siswa. Teknik dan pelaksanaannya diatur dalam
3
1. Undang-undang Republik Indonesia No. 20 tahun 2003 tentang Sistem
Pendidikan Nasional.
2. Peraturan Pemerintah No.19 Tahun 2005 tentang standar Nasional Pendidikan
3. Peraturan Menteri Pendidikan Nasional No.22 Tahun 2006 tentang Standar Isi
4. Peraturan Pemerintah Pendidikan Nasional No.23 Tahun 2006 tentang Standar
Kompetensi Lulusan
5. Peraturan Pemerintah Nasional No.20 Tahun 2007 tentang Standar Penilaian
Pendidikan
Standar Kompetensi dan Kompetensi Dasar di dalam Standar Isi menjadi fokus
perhatian utama dalam penilaian. Untuk mengetahui tingkat pencapaian
kompetensi, guru dapat melakukan penilaian melalui tes dan non tes. Tes meliputi
tes lisan, tertulis(bentuk uraian, pilihan ganda, jawaban singkat, isian,
menjodohkan, benar-salah), dan tes perbuatan yang meliputi: kinerja, penugasan,
dan hasil katya. Penilaian non-tes contohnya seperti penilaian sikap, minat,
motivasi, penilaian diri, portofolio, lifeskill. Tes perbuatan dan penilaian non tes
dilakukan melalui pengamatan (observasi).
B. Tujuan dan fungsi penilaian berbasis kompetensi
Secara umum penilaian berbasis kompetensi bertujuan untuk mengetahui
pengetahuan awal siswa, mengetahui tingkat pencapaian kompetensi, mengetahui
perkembangan siswa, mendiagnosis kesulitan belajar siswa, mengetahui hasil suatu
proses pembelajaran, memotivasi siswa belajar, dan memberi umpan balik kepada
guru tentang pembelajaran yang dikelola.
Penilaian berbasis kompetensi memiliki sejumlah fungsi, yaitu sebagai bahan
pertimbangan dalam menentukan kenaikan kelas, umpan balik dalam perbaikan
program pengajaran, alat pendorong dalam meningkatkan kemampuan peserta
didik, dan sebagia alat bagi peserta didik untuk melakukan evaluasi terhadap
kinerja, serta bercermin diri (instropeksi diri).
C. Ciri – ciri Penilaian Berbasis Kompetensi
1. Penilaian berbasis kompetensi memiliki ciri – cirri sebagai berikut:
a. Harus memenuhi prinsip - prinsip dasar penilaian
b. Harus menggunakan acuan dan patokan belajar tuntas
4
c. Berorientasi pada kompetensi
d. Terintegrasi dengan proses pembelajaran
e. Dilakukan oleh guru dan siswa.
2. Prinsip –prinsip penilaian berbasis kompetensi
Dalam proses pelaksanaan evaluasi dengan sistem penilaian berbasis
kompetensi terdapat beberapa prinsip yang harus diperhatikan, diantaranya yaitu
a. Valid
Penilaian berbasis kompetensi harus mengukur apa yang seharusnya diukur
dengan menggunakan alat yang dapat dipercaya dan sahih.
b. Keterbukaan
Penilaian berbasis kompetensi adalah penilaian yang dilaksanakan secara
terbuka, artinya guru sebagai evaluator bukan hanya berperan sebagai orang
yang memberi nilai atau kritik, akan tetapi siswa yang dievaluasi perlu
memahami mengapa kritik itu muncul, oleh sebab itu guru harus terbuka
melalui argumentasi yang tepat dalam setiap memberikan penilaian.
c. Adil dan Obyektif
Penilaian harus adil terhadap semua siswa dan tidak membeda-bedakan latar
belakang siswa.
d. Mendidik
Penilaian harus memberi sumbangan yang positif terhadap pencapaian hasil
belajar siswa. Penilaian ini dapat dirasakan sebagai penghargaan yang
memotivasi bagi siswa yang berhasil dan sebagai pemicu semangat bagi
siswa yang kurang berhasil.
e. Berkesinambungan
Penilaian dilakukan secara berencana, bertahap, teratur, terus-menerus dan
berkesinambungan untuk memperoleh gambaran tentang perkembangan
kemajuan belajar siswa.
f. Bermakna
Penilaian hendaknya mudah dipahami dan mudah ditindak lanjuti oleh pihak-
pihak yang berkepentingan.
g. Berorientasi pada Proses dan Hasil
5
Penilaian berbasis kompetensi bertumpu pada dua sisi yang sama pentingnya,
yakni sisi proses dan hasil belajar secara seimbang. Penilaian berbasis
kompetensi mengikuti setiap aspek perkembangan siswa, bagaimana cara
belajar siswa, bagaimana motivasi belajar, sikap, minat, kebiasaan, dan lain
sebagainya dan pada akhirnya menilai bagaimana hasil belajar yang diperoleh
siswa.
3. Teknik Penilaian
Penilaian pembelajaran ini meliputi penilaian proses dan hasil. Pelaksanaan
penilaian dapat dilakukan dengan teknik tes maupun non tes. Teknik tes
contohnya tes tertulis, tes lisan dan tes perbuatan. Teknik non tes contohnya
yaitu pengamatan (sistematis), pengisian angket, pengukuran skla sikap,dan
minat (afektif), pemberian tugas, serta portofolio
Jenis Cara Pengujian Kompetensi dan Bentuk Soal
a. Cara Pengujian atau Tagihan
Pengujian atau tagihan adalah cara bagaimana ujian (penilaian) dilakukan.
Jenis pengujian / tagihan yang digunakan adalah :
1) Kuis
Kuis adalah ujian singkat yang menanyakan hal-hal prinsip yang telah
dipelajari sebelumnya. Kuis dapat diberikanpada awal, tengah atau
akhir proses pembelajaran. Jika banyak siswa yang gagal dalam
menyelesaikan kuis, sebaiknya guru mengulangi materi sebelumnya.
Kuis dapat dilakukan secra tertulis maupun lisan.
2) Ulangan harian
Ulangan harian merupakan ujian formatif setelah selesai pembahasan
satu kompetensi tertentu. Fungsinya untuk mengukur siswa setelah
belajar satu kompetensi. Soal yang digunakan sebaiknya variatif, baik
obyektif maupun uraian yang meliputi pemahaman,aplikasi dan
analisis.
3) Tugas individu-kelompok
Tugas individu/kelompok adalah tugas yang dapat diberikan setiap
minggu dengan bentuk soal uraian atau soal terbuka.
6
4) Ulangan semester
Ulangan semester adalah ulangan pada akhir semester dengan materi
yang diujikan berdasarkan kisi-kisi soal. Bentuk soal yang digunakan
dapat berupa campuran pilihan ganda dan uraian.
5) Ulangan kenaikan kelas
Ulangan kenaikan kelas adalah ulangan dengan materi yang diujikan
mengacu pada ketentuan : materi terkait pada kemampuan esensial,
berkelanjutan, memiliki nilai aplikatif atau dibutuhkan untuk belajar
pada bidang lain.
b. Bentuk soal pada pengujian
Bentuk soal yang digunakan untuk mengukur kompetensi sebaiknya terdiri
dari berbagai bentuk soal. Variasi bentuk soal antara lain :
1) Pertanyaan lisan
Pertanyaan lisan merupakan cara efektif untuk mengetahui seberapa
jauh siswa mencapai suatu kompetensi dasar tertentu.
2) Soal obyektif
Bentuk soal obyektif biasanya pilihan ganda dan benar-salah, dapat
pula soal berupa menjodohkan
3) Soal uraian
Soal uraian menuntut siswa untuk menggunakan respon atau
menguaraikan langkah untuk memperoleh jawaban atas soal tersebut.
Penyekoran dilakukan secara analitik, yaitu setiap penyelesaian langkah
diberi skor. Penyekorran juga dapat bersifat hirarki, artinya skor pada
suatu langkah berhubungan dengan langkah jawaban sebelumnya.
4) Soal terbuka
Soal terbuka merupakan soal yang mempunyai lebih dari satu cara
untuk memperoleh jawaban yang benar dan menuntut siswa
menemukan jawaban itu beserta syarat khususnya. Penyekoran
dilakukan secara holistic, artinya didasarkan pada respon siswa
keseluruhan.
7
D. Ranah penilaian berbasis kompetensi ( Kognitif, Afektif, dan Psikomotor )
Penilaian terhadap pencapaian kompetensi siswa yang mencakup penilaian
pada ranah kognitif, afektif, dan psikomotor. Yang sudah terbiasa dilakukan dalam
penilaian pembelajaran selama ini adalah penilaian menyangkut ranah kognitif.
Penilaian ranah kognitif umumnya dilakukan dengan tes tertulis dan bentuk
soalnya pilihan ganda. Penilaian ini dilakukan setelah siswa mempelajari suatu
kompetensi dasar yang harus dicapai.
Kompetensi siswa dalam ranah afektif yang perlu dinilai utamanya
menyangkut sikap dan minat siswa dalam belajar. Secara teknis penilaian ranah
afektif dilakukan melalui dua hal, yaitu Laporan diri oleh siswa yang biasanya
dilkukan dengan pengisian angket dan penagamatan sistematis guruterhadap afektif
siswa serta perlu lembar pengamatan. Penilaian ini dilakukan selama
berlangsungnya kegiatan belajar mengajar.
Kompetensi siswa dalam ranah psikomotor menyangkut gerak otot kecil.
Kemampuan psikomotor yang dibina dalam belajar, misalnya pada pelajaran fisika
berkaitan dengan kemampuan mengukur dengan satuan tertentu, kemampuan
menggunakan alat dalam praktikum. Penilaian ini dilakukan selama kegiatan
belajar mengajar berlangsung.
8
Sebuah batu dijatuhkan dari menara yang tingginya 100m tanpa kecepatan
awal. Jika g = 10 m/s2 , berapa waktu yang diperlukan batu untuk sampai ke
tanah.
2. Instrumen penilaian ranah afektif
Kemampuan pada ranah afektif dapat dinilai melalui laporan diri siswa dan
pengamatan oleh guru. Data hasil penilaian afektif sangat berguna untuk
menentukan usaha pembinaan terhadap siswa agar meningkat hasil belajarnya.
Selain itu juga berguna untuk memperbaiki proses pembelajaran.
a. Contoh untuk mengukur afektif siswa :
Contoh 1 : aspek sikap dan konsep diri
Diantara pernyataan-pernyataan dibawah ini, lingkarilah nomor penyataan
yang sesuai dengan dirimu
1) Pelajaran fisika ini menarik
2) Pelajaran fisika ini membosankan
3) Karena pelajaran fisika sulit, maka saya tidak menyukainya
4) Saya tidak suka mengerjakan soal-soal fisika karena soal-soalnya
tergolong sulit.
5) Saya tidak menyukai pembelajaran ini dilakukandalan kelompok belajar,
dst.
3. Instrumen penilaian ranah psikomotor
Penilaian ranah psikomotor siswa dapat dilakukan dengan kombinasi tes dan
pengamatan.
Contoh soal penilaian ranah psikomotor :
Soal : Ukurlah diameter pipa kecil dengan menggunakan jangka sorong.
No Aspek Nilai
1. Cara memegang 1 2 3 4 5
jangka sorong
2. Penggunaan jangka
sorong dalam
fungsinya
3. Kebenaran dalam
mengukur
4. Kecermatan dalam
mengukur
9
5. Kerapian dalam
membuat laporan
Keterangan :
Skor 5, bila dilakukan sangat tepat
Skor 4, bila dilakukan tepat
Skor 3, bila dilakukan agak tepat
Skor 2, bila dilakukan tidak tepat
Skor 1, bila dilakukan sangat tidak tepat
KESIMPULAN
Penilaian berbasis kompetensi adalah uraian keterangan yang teratur sebagai penjelasan
prosedur dan cara menilai pencapaian kompetensi oleh peserta didik. Selain itu penilaian
berbasis kompetensi juga dapat dirtikan sebagai teknik evaluasi yang harus dilakukan
pendidik dalam pembelajaran. Penilaian berbasis kompetensi dilakukan untuk
mengetahui tingkat pencapaian kompetensi peserta didik, dimana pendidik dapat
melakukan penilaian tersebut melalui tes dan non tes.
EVALUASI
EVALUASI
10
EVALUASI
A. Essay
1. Apa yang dimaksud dengan penilaian berbasis kompetensi?
2. Bagaimana tujuan dan fungsi penilaian berbasis kompetensi?
3. Sebutkan prinsip –prinsip penilaian berbasis kompetensi!
B. Pilihan Ganda
1. Uraian keterangan yang teratur sebagai penjelasan prosedur dan cara menilai
pencapaian kompetensi oleh siswa. Selain itu penilaian berbasis
kompetensi juga dapat dirtikan sebagai teknik evaluasi yang harus
dilakukan guru dalam pembelajaran di sekolah
a. Penilaian berbasis kompetensi
b. Penilaian berbasis intuisi
c. Penilaian berbasis mandiri
d. Penilaian berbasis profesi
e. Penilaian berbasis kelompok
2. Tujuan peniliaian berbasis kompetensi adalah , kecuali….
a. Menentukan kenaikan kelas
b. Umpan balik dalam perbaikan program pengajaran
c. Menentukan administrasi pendidikan
d. Alat pendorong dalam meningkatkan kemampuan peserta didik
e. Sebagia alat bagi peserta didik untuk melakukan evaluasi terhadap kinerja,
serta bercermin diri (instropeksi diri)
d. a, b, c benar
e. a,b,c salah
PROGRAM STUDI : Bidan Pendidik (D-IV)
MATA KULIAH : Evaluasi Remedial
TOPIK/SUB TOPIK : Menentukan kesahihan dan keterandalan evaluasi
PENDAHULUAN
12
Keandalan adalah kualitas yang menunjukkan kemantapan (consistency)
ekuivalensi atau stabilitas suatu pengukuran yang dilakukan
Objektivitas adalah kualitas yang menunjukkan identitas atau kesamaan dari skor-
skor atau diagnosis-diagnosis yang diperoleh dari data yang sama dari penskor-penskor
kompeten yang sama.
Kepraktisan (practicability) adalah suatu kualitas yang menunjukkan kemungkinan
dapat dijalankannya suatu kegunaan umum dari suatu teknik penilaian, dengan
mendasarkannya pada biaya, waktu yang diperlukan untuk menyusun, kemudahan
penyusunan, mudahnya penskoran, dan mudahnya penginterpretasian hasil-hasilnya.
URAIAN MATERI
A. VALIDITAS
Kesahihan menggantikan kata validitas (validity) yang dapat diartikan
sebagai ketepatan evaluasi mengevaluasi apa yang seharusnya dievaluasi. Dapat
diterjemahkan pula sebagai kelayakan interpretasi terhadap hasil dari suatu
instrument evaluasi atau tes, dan tidak terhadap instrument itu sendiri. Kesahihan
juga dapat dikatakan lebih menekankan pada hasil/ perolehan evaluasi, bukan pada
kegiatan evaluasinya.
Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi. Suatu
teknik evaluasi dikatakan mempunyai validitas yang tinggi (disebut valid) jika
teknik evaluasi atau tes itu dapat mengukur apa yang sebenarnya akan diukur. Atau
seperti dikatakan oleh cronbach “how well a test or evaluative techique does the job
that it is employed to do” . validitas bukanlah suatu ciri atau sifat yang mutlak dari
suatu teknik evaluasi; ia merupakan suatu ciri yang relatif terhadap tujuan yang
hendak dicapai oleh pembuat tes. Teknik yang sama dapat digunakan untuk
beberapa tujuan yang berbeda, dan validitasnya dapat berbeda-beda dari yang tinggi
kepada yang rendah, bergantung pada tujuan. Suatu tes pengerjaan berhitung
misalnya dapat mempunyai validitas yang tinggi untuk menentukan status siswa-
siswa sekarang dalam kecakapannya mengerjakan berhitung. Validitas tes itu
mungkin sedang atau cukup untuk mengukur atau meramalkan keberhasilan dalam
aspek-aspek matematis dari suatu pelajaran ilmu alam yang akan datang.
13
Oleh karena itu, validitas harus di tentukan dalam hubungannya dengan
tujuan yang akan dicapai dengan alat evaluasi itu
1. Jenis-jenis validitas
Telah dikatakan bahwa validitas suatu alat evaluasi bukanlah
merupakan ciri yang absolut atau mutlak. Suatu tes dapat memiliki validitas
yang bertingkat-tingkat; tinggi,sedang, rendah, bergantung pada tujuannya.
Sehubungan dengan itu, ada beberapa jenis validitas, yaitu:
a. Content validity (curricular validity)
Suatu tes dikatakan memiliki content validity jika scope dan isi tes
itu sesuai dengan scopedan isi kurikulum yang sudah diajarkan. Isi tes
sesuai dengan atau mewakili sampel hasil-hasil belajar yang seharusnya
dicapai menurut tujuan kurikulum.
b. Construct validity
Untuk menentukan adanya construct validity, suatu tes
dikorelasikan dengan suatu konsepsi atau teori. Items dalam tes itu harus
sesuai dengan ciri-ciri yang disebutkan dalam konsepsi tadi, yaitu
konsepsi tentang objek yang akan di tes. Dengan kata lain, hasil-hasil tes
itu disesuaikan dengan tujuan atau ciri-ciri tingkah laku (domein) yang
hendak di ukur.
c. Predictive validity
Suatu tes dikatakan memiliki predictive validity jika hasil korelasi
tes itu dapat meramalkan dengan tepat keberhasilan seseorang pada masa
mendatang di dalam lapangan tertentu. Tepat tidaknya ramalan tersebut
dapat dilihat dari korelasi koefisien antara hasil tes itu dengan hasil alat
ukur lain pada masa mendatang.
d. Concurrent validity
jika hasil suatu tes mempunyai korelasi yang tinggi dengan hasil
suatu alat ukur lain terhadap bidang yang sama pada waktu yang sama
pula, maka dikatakan tes itu memiliki concurrent validity (concurrent =
bersamaan waktu).
Validitas suatu tes dinyatakan dengan angka korelasi koefisien (r).
Kriteria korelasi koefisien adalah sebagai berikut:
0,00 - 0,20 sangat rendah (hampir tidak ada korelasi)
0,20 – 0,40 korelasi rendah
0,40 – 0,70 korelasi cukup
14
0,70 – 0,90 korelasi tinggi
0,90 – 1,00 korelasi sangat tinggi (sempurna)
Cara menghitung validitas suatu tes dapat dilakukan antara lain
sebagai berikut:
Dengan product moment correlation (metode pearson)
x' y '
Rumusnya: r :
( X ) ( Y )
2 2
B. KEANDALAN/KETERANDALAN
15
b. Dengan metode satu tes: sebuah tes di berikan dua kali kepada
sekelompok murid yang sama, tetapi dalam bentuk waktu yang berbeda.
Kedua hasil tes itu kemudian dicari korelasinya
c. Metode “split-half” (masih dengan satu tes): suatu tes dibagi menjadi dua
bagian yang sama tingkat kesukarannya, sama isi dan bentuknya,
kemudian dilihat skor masing-masing bagian paruhan tes tersebut dan
dicari korelasinya.
d. Termasuk “split-half method” dengan cara lain yang tidak memerlukan
perhitungan korelasi, yaitu sebagai berikut. dengan menggunakan deviasi
standar masing-masing dari kedua bagian tes dan deviasi standar seluruh
tes.
e. Dengan metode kuder-richardson, yaitu dengan menggunakan rumus yang
dikemukakan oleh dua orang ahli measurement yang bernama kuder dan
richardson.
16
mencakup juga faktor-faktor yang mempengaruhi keterandalan yang
dikemukakan oleh Arikunto.
KESIMPULAN
Keandalan (Reliability) adalah ketetapan atau ketelitian suatu alat evaluasi. Suatu
tes atau alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan
produktif. Jadi yang di pentingkan di sini ialah ketelitiannya: sejauh mana tes atau alat
tersebut dapat dipercaya kebenarannya.
Keterandalan evaluasi berhubungan dengan masalah kepercayaan, yakni tingkat
kepercayaan bahwa suatu instrument evaluasi mampu memberikan hasil yang tepat.
Keterandalan menunjukan kepada konsistensi (keajegan) pengukuran yakni
bagaimanakah keajegan skor tes atau hasil evaluasi lain yang berasal dari pengukuran
yang satu ke pengukuran yang lain.
Untuk memperjelas tentang faktor-faktor yang mempengaruhi keterandalan akan
diuraikan berikut ini.
a. Panjang tes (length of test). Tes ini dilakukan dengan tidak banyak menebak, maka
keterandalan hasil evaluasi semakin tinggi.
17
b. Sebaran skor (spread of scores). Karena koefisien keterlandan yang lebih besar
dihasilkan pada saat orang perorang tetap pada posisi yang relative sama dalam satu
kelompok dari satu pengujian ke pengujian lainnya, itu berarti selisih yang
dimungkinkan dari perubahan posisi dalam kelompok juga menyumbang
memperbesar koefisien keterandalan.
c. Tingkat kesulitan tes (difficulty of tes). Tes acuan norma (norm reference test).
Tingkat kesulitan tes yang ideal untuk meningkatkan koefisien keterandalan adalah
tes yang menghasilkan sebaran skor berbentuk atau kurva normal.
d. Objektivitas (objectivity). Objektivitas suatu tes menunjuk kepada tingkat skor
kemampuan yang sama (yang dimiliki oleh siswa satu dengan siswa yang lain)
memperoleh hasil yang sama dalam mengerjakan tes.
Uraian faktor-faktor yang mempengaruhi keterandalan yang disadur dari
mencakup juga faktor-faktor yang mempengaruhi keterandalan yang dikemukakan
oleh Arikunto.
EVALUASI
\
Pilihan Ganda
1. Validitas adalah...
a. ketepatan evaluasi mengevaluasi apa yang seharusnya dievaluasi
b. ketepatan evaluasi menganalisis apa yang seharusnya dievaluasi
c. ketepatan evaluasi mengevaluasi apa yang sebelumnya sudah dievaluasi
d. ketepatan mengevaluasi apa yang seharusnya dievaluasi
2. Faktor – faktor yang mempengaruhi validitas antara lain...
a. Faktor instrumen evaluasi itu sendiri.
b. Faktor-faktor administrasi evaluasi dan penskoran juga merupakan faktor-faktor
yang mempunyai suatu pengaruh yang menganggu kesahihan interpretasi hasil
evaluasi.
c. Faktor-faktor dalam respons-respons siswa merupakan faktor-faktor yang lebih
banyak mempengaruhi kesahihan daripada faktor yang ada instrumental evaluasi
atau pengadministrasiannya
d. Benar semua
3. Keterandalan adalah...
18
a. Ketetapan atau ketelitian suatu alat evaluasi. Suatu tes atau alat evaluasi
dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif.
b. Ketepatan evaluasi mengevaluasi apa yang seharusnya dievaluasi
c. Ketetapan meneliti suatu alat evaluasi
d. Ketepatan dalam menilai suatu alat evaluasi
4. Faktor-faktor yang mempengaruhi keterandalan antara lain (kecuali)...
a. Panjang tes
b. Sebaran skor
c. Tingkat kesulitan
d. Panjang soal
19
HAND OUT
PENDAHULUAN (INTRODUCTION)
20
pendidikan yaitu kurangnya evaluasi yang efektif. Sering terjadinya perubahan dalam
sistem pendidikan mungkin terutama disebabkan oleh kurangnya informasi yang dapat
diandalkan tentang hasil pendidikan, tentang praktek, dan programnya serta kurangnya
suatu sistem yang standar untuk memperoleh informasi tersebut dalam butir satu.(3)
Biasanya evaluasi pendidikan selalu dihubungkan dengan hasil belajar, namun
saat ini konsep evaluasi mempunyai arti yang lebih luas daripada itu. Setiap orang
tampaknya mempunyai maksud yang berbeda apabila sampai kepada kata evaluasi.
Untuk mengetahui lebih jauh apa yang dimaksud seseorang dengan evaluasi, maka harus
diketahui beberapa hal yang berkaitan dengan evaluasi salah satu diantaranya yaitu
mengenai metode evaluasi serta cara merancang dan menerapkannya (Robert O.
Brinkerhoff & Cs., 1983).(3)
Evaluasi dalam pendidikan tidak dapat dilepaskan dari tujuan evaluasi itu sendiri.
Evaluasi bertujuan untuk mendapat data pembuktian yang akan menunjukkan sampai
dimana tingkat kemampuan dan keebrhasilan siswa dalam pencapaian tujuantujuan
kurikuler. Di samping itu, juga dapat digunakan oleh guru-guru dan para pengawas
pendidikan untuk mengukur atau menilai sampai dimana keefektifan pengalaman-
pengalaman mengajar, kegiata-kegiatan belajar, dan metode-metode mengajar yang
digunakan. Dengan demikian, dapat dikatakan betapa penting peranan dan fungsi
evaluasi dalam proses belajar mengajar. Evaluasi juga dibedakan berdasarkan waktu
pelaksanaannya, kapan evaluasi dilakukan, untuk apa evaluasi dilakukan, dan acuan serta
paham yang dianut oleh evaluator.(1)
A. Pengertian Evaluasi
Evaluasi adalah suatu proses merencanakan, memperoleh, dan menyediakan
informasi yang sangat diperlukan untuk membuat alternatif-alternatif keputusan
(Mehrens & Lehmann, 1978:5).Setiap kegiatan evaluasi atau penilaian merupakan suatu
proses yang sengaja direncanakan untuk memperoleh informasi atau data; berdasarkan
data tersebutkemudian dicoba membuat suatu keputusan.(1)
21
Norman E.Gronlund (1976) merupakan suatu proses yang sistematis untuk
menentukan atau membuat keputusan sampai sejauh mana tujuan-tujuan pengajaran telah
dicapai oleh siswa.(1)
Dari rumusan-rumusan tersebut di atas, ada tiga aspek yang perlu diperhatikan
untuk lebih memahami apa yang dimaksud dengan evaluasi, khususnya evaluasi
pengajaran, yaitu:
Kegiatan evaluasi merupakan proses yang sistemastis. Hal ini berarti bahwa evaluasi
merupakan kegiatan yang terencana dan dilakukan secara berkesinambungan.
Evaluasi bukan hanya merupakan kegiatan akhir atau penutup dari suatu program
tertentu, melainkan merupakan kegiatan yang dilakukan pada permulaan, selama
program berlangsung dan pada akhir program setelah program itu dianggap selesai.
Yang dimaksud dengan program disini ialah program satuan pelajaran yang akan
dilaksanakan dalam satu pertemuan atau lebih, program caturwulan ataupun program
semester, dan juga program pendidikan yang dirancang untuk satu tahun ajaran (D1),
empat tahun ajaran (S1), atau enam tahun ajaran (SD). Dan sebagainya.
Di dalam kegiatan evaluasi diperlukan berbagai informasi atau data yang menyangkut
objek yang sedang di evaluasi. Dalam kegiatan pengajaran, data yang dimaksud
mungkin berupa perilaku atau penampilan siswa selama mengikuti pelajaran, hasil
ulangan atau tugas-tugas pekerjaan rumah, nilai ujian akhir caturwulan, nilai
midsmester, nilai ujian akhir semester, dan sebagainya. Berdasarkan data itulah
selanjutnya diambil suatu keputusan sesuai dengan maksud dan tujuan evaluasi yang
sedang dilaksanakan. Perlu dikemukakan bahwa ketepatan keputusan hasil evaluasi
sangat bergantung kepada kesahihan dan objektifitas data yang digunakan dalam
pengambilan keputusan.
Setiap kegiatan evaluasi khususnya evaluasi pengajaran tidak dapat dilepaskan dari
tujuan-tujuan pengajaran yang hendak dicapai. Tanpa menentukan atau merumuskan
tujuan-tujuan terlebih dahulu, tidak mungkin menilai sejauh mana pencapaian hasil
belajar siswa. Hal ini adalah karena setiap kegiatan penilaian memerlukan suatu
kriteria tertentu sebagai acuan dalam emnentukan batas ketercapaian objek yang
dinilai. Adapun tujuan pengajaran merupakan kriteria pokok dalam penilaian.(1)
B. Fungsi evaluasi
22
Fungsi evaluasi dalam pendidikan dan pengajaran dapat dikelompokkan menjadi
empat fungsi, yaitu:
1. Untuk mengetahui kemajuan dan perkembangan serta keberhasilan siswa setelah
mengalami atau melakukan kegiatan belajar selama jangka waktu tertentu. Hasil
evaluasi yang diperoleh itu selanjutnya dapat digunakan untuk memperbaiki cara
belajar siswa (fungsi formatif) dan atau untuk mengisi rapor atau surat tanda tamat
belajar, yang berarti pula untuk menetukan knaikan kelas atau lulus tidaknya seorang
siswa dari suatu lembaga pendidikan tertentu (fungsi sumatif).
2. Untuk mengetahui tingkat keberhasilan program pengajaran. Pengajaran sebagai
suatu sistem terdiri atas beberapa komponen yang saling berkaitan satu sama lain.
Komponen-komponen yang dimaksud antara lain adalah tujuan, materi atau bahan
pengajaran, metode dan kegiatan belajar mengajar, alat dan sumber pelajaran dan
prosedur serta alat evaluasi.
3. Untuk keperluan bimbingan dan konseling (BK). Hasil-hasil evaluasi yang telah
dilaksanakan oleh guru terhadap siswanya dapat dijadikan sumber informasi atau data
bagi pelayanan BK oleh para konselor sekolah atau guru pembimbing lainnya.
4. Untuk keperluan pengembangan dan perbaikan kurikulum sekolah yang
bersangkutan. Seperti telah dikemukakan di muka, hampir setiap saat guru
melaksanakan kegiatan evaluasi dalam rangka menlai keberhasilan belajar siswa dan
menilai program pengajaran, yang berarti pula menilai isi atau materi pelajaran yang
terdapat di dalam kurikulum.(1)
D. Model-Model Evaluasi
23
Model evaluasi ialah model desain evaluasi yang dibuat oleh ahli-ahli atau pakar-
pakar evaluasi yang biasanya dinamakan sama dengan pembuatannya atau tahap
pembuatannya. Ada ahli evaluasi yang membagi evaluasi sesuai dengan, isi yang akan
dibawakannya serta kepentingan atau penekanannya atau dapat juga disebut sesuai
dengan paham yang dianutnya yang disebut pendekatan, atau approach.. Evaluasi juga
dibedakan berdasarkan waktu pelaksanaannya, kapan evaluasi dilakukan, untuk apa
evaluasi dilakukan, dan acuan serta paham yang dianut oleh evaluator, dalam buku teks
ini disebut konsep evaluasi. Model-model evaluasi diantaranya:
1. Model Evalusai CIPP
Stufflebeam (1969, 1971, 1983, Stufflebeam & Shinkfield, 1985) adalah ahli yang
mengusulkan pendekatan yang berorientasi kepada pemegang keputusan (a decision
oriented evaluation approach structured). Ia merumuskan evaluasi sebagai “Suatu proses
menggambarkan, memperoleh, dan menyediakan informasi yang berguna untuk menilai
alternatif keputusan” (Stufflebeam, 1973, hlm. 127). Dia membagi evaluasi menjadi
empat macam, yaitu :
a. Contect evaluation to serve planning decision. Konteks evaluasi ini membantu
merencanakan keputusan, menentukan kebutuhan yang akan dicapai oleh program,
dan merumuskan tujuan program.
b. Input evaluation, structuring decision. Evaluasi ini menolong mengatur keputusan,
menentukan sumber-sumber yang ada, alternatif apa yang diambil, apa rencana dan
strategi untuk mencapai kebutuhan. Bagaimana prosedur kerja untuk mencapainya.
c. Proses evaluation, to serve implementing decision. Evaluasi proses untuk membantu
mengimplementasikan keputusan. Sampai sejauh mana rencana telah diterapkan? Apa
yang harus direvisi? Begitu pertanyaan tersebut terjawab, prosedur dapat dimonitor,
dikontrol, dan diperbaiki.
d. Product evaluation, to serve recycling decision. evaluasi produk untuk menolong
keputusan selanjutnya. Apa hasil yang telah dicapai? Apa yang dilakukan setelah
program berjalan? Huruf pertama dari konteks evaluasi dijadikan ringkasan CIPP,
model ini terkenal dengan nama model CIPP oleh Stufflebeam.
2. Evaluasi Model UCLA
Alkin (1969) menulis tentang kerangka kerja evaluasi yang hampir sama dengan
model CIPP. Alkin mendefinisikan evaluasi sebagai suatu proses meyakinkan keputusan,
memilih informasi yang tepat, mengumpulkan , dan menganalisis informasi sehingga
24
dapat melaporkan ringkasan data yang berguna bagi pembuat keputusan dalam memilih
beberapa alternatif. Ia mengemukakan lima macam evaluasi, yakni:
a. Sistem assesment, yang memberikan informasi tentang keadaan atau posisi sistem.
b. Program planning, membantu pemilihan program tertentu yang mungkin akan
berhasil membantu kebutuhan program.
c. Program implementation, yang menyiapkan informasi apakah program sudah
diperkenalkan kepada kelompok tertentu yang tepat seperti yang direncanakan.
d. Program improvement, yang memberikan informasi tentang bagaimana program
berfungsi, bagaimana program bekerja, atau berjalan? Apakah menuju pencapaian
tujuan, adakah hal-halatau masalah-masalah baru yang muncul tak terduga?
e. program certification, yang memberi informasi tentang nilai atau guna program.
3. Model Brinkerhoff
Setiap desain evaluasi umumnya terdiri atas elemen-elemen yang sama, ada
banyak cara untuk menggabungkan elemen tersebut, masing-masing ahli atau evaluator
mempunyai konsep yang berbeda dalam hal iini. Brinkerhoff & Cs. (1983)
mengemukakan tiga golongan evaluasi yang disusun berdasarkan penggabungkan
elemen-elemen yang sama, seperti evaluator-evaluator lain, namun dalam komposisi dan
versi mereka sendiri sebagai berikut:
a) Fixed vs Emergent Evaluation Design. Dapatkan masalah evaluasi dan kriteria
akhirnya dipertemukan?apabila demikian, apakah itu suatu keharusan?
b) Formative vs Summative Evaluation.Apakah evaluasi akan dipakai untuk perbaikan
atau untuk melaporkan kegunaan atau manfaat suatu program?atau keduanya?
c) Experimental and Quasi Experimental Design vs Natural/ Unobtrusive
Inquiry.Apakah evaluasi dakan melibatkan intervensi ke dalam kegiatan
program/mencoba memanipulasi kondisi, orang diperlakukan, variabel dipengaruhi
dan sebagainya, atau hanya diamati, atau keduanya?
Jawaban untuk ketiga pertanyaan tersebut mungkin tidak terlalu tepat (misalnya,
mungkin anda ingin mencoba quisi experimental disign yang melibatkan juga natural
in quiry). Namun kategori –kategori yang dikemukakan oleh pembagian yang luas
inimencerminkan sejumlah macam evaluasi dan kontrol yang anda inginkan selama
proses evaluasi. Menentukan di mana anda berdiri walaupun secara umum, hal ini
akan menolong anda mengembangkan langkah awal yang membantu anda
menerangkan, memberi petunjuk, dan menilai tugas-tugas evaluasi.
a. Fixed vs Emergent Evaluation Design
25
Desain evaluasi yang tetap (Fixed) ditentukan dan direncanakan secara sistematik
sebelum implementasi dikerjakan. Desain dikembangkan berdasarkan tujuan program
disertai seperangkat pertanyaan yang akan dijawab oleh informasi yang akan diperoleh
dari sumber-sumber tertentu. Rencana analisis dibuat sebelumnya di mana si pemakai
akan menerima informasi seperti yang telah ditentukan dalam tujuan. Walaupun desain
fixed ini lebih terstruktur daripada desain emergent, desain fixed juga dapat disesuaikan
dengan kebutuhan yang mungkin berubah. Kebanyakan evaluasi formal yang dibuat
secara individu dibuat berdasarkan desain fixed, karena tujuan program telah ditentukan
dengan jelas sebelumnya, dibiayai dan melalui usulan atau proposal evaluasi.
Desain fixed ini relatif memakan biaya banyak. Kegiatan-kegiatan berkisar antara
membuat pertanyaan-pertanyaan, menyiapkan dan membuat instrumen, menganalisis
hasil evaluasi, dan melaporkan secara formal hasil evaluasi kepada pemakai. Komunikasi
antara evaluator dan audiensi atau klien dilakukan secara teratur, biasanya formal atau
tertulis.
Evaluator berpedoman pada tujuan program untuk merumuskan masalah atau
pertanyaan-pertanyaan desain dan menstimulasi audiensi yang relevan untuk
mengembangkan dan membetulkan pertanyaan tersebut.
Strategi pengumpulan informasi khususnya menggunakan cara-cara formal
(misalnya tes, survei, kuesioner, dan rating scale), juga metode penelitian, kriteria
penelitian seperti validitas internal dan eksternal juga reliabilitas dianggap penting.
Pengumpulan data biasanya secara kuantitatif.
Desain evaluasi emergent. Evaluasi ini dibuat untuk beradaptasi dengan pengaruh
dan situasi yang sedang berlangsung dan berkembang seperti menampung pendapat-
pendapat audiensi, masalah-masalah, kegiatan program. Evaluasi ini menghabiskan
banyak waktu dari permulaan sampai akhir mencari tujuan dan isu, karena semuanya
pada dasarnya tidak dikhususkan dan ditentukan sebelumnya.
Biaya relatif lebih besar. Sumber-sumber dalam desain ditentukan untuk
mengamati program dan memfokuskan pertanyaan lebih lanjut.
Evaluator tidak mendorong audiensi memikir tentang program atau isu evaluasi.
Audiensi menentukan isu-isu penting dan informasi yang diperlukan desain.
Komunikasi antara evaluator dan audiensi terus berkesinambungan selama proses
evaluasi.
Observasi, studi kasus, dan laporan tim penyokong merupakan contoh metode
evaluasi ini. Pengukuran yang tidak selalu berpedoman pada tujuan biasanya dilakukan,
26
dan evaluator sering mengorbankan ketepatan pengukuran untuk lebih berguna. Informasi
yang kualitatif biasanya dikumpulkan. Desain terus berkembang, berubah, dan bereaksi
sesuai dengan situasi dan kondisi yang dapat dikatakan tak pernah berhenti.
b. Formative vs Summative Evaluation
Evaluasi formatif digunakan untuk memperoleh informasi yang dapat membantu
memperbaiki proyek, kurikulum, atau lokakarya. Dibuat untuk digunakan karyawan,
dapat juga mengorbankan kepentingan orang luar untuk lebih bermanfaat bagi program.
Ada yang mengatakan bahwa evaluasi yang paling melindungi program yaitu evaluasi
formatif.
Fokus evaluasi berkisar pada kebutuhan yang dirumuskan oleh karyawan atau
orang-orang program. Evaluator sering merupakan bagian daripada program dan bekerja
sama dengan orang-orang program. Strategi pengumpulan informasi mungkin juga
dipakai, tetapi penekanan pada usaha memberikan informasi yang berguna secepatnya
bagi perbaikan program. Desain evaluasi (Fixed atau emergent) dibuat bersama orang-
orang proyek dan direvisi untuk mencapai kebutuhan mereka.
Evaluasi Sumatif. Evaluasi sumatif dibuat untuk menilai kegunaan suatu
objek.sering diminta atau dibiayai oleh pemakai, oleh pemesan, atau oleh sponsor atau
administrator untuk urusan pajak. Evaluasi sumatif digunakan untuk menilai apakah suatu
program akan diteruskan atau dihentikan saja. Evaluator harus dapat dipercaya oleh
sejumlah audiensi yang akan dipengaruhi oleh keputusan tersebut. Untuk usaha-usaha
yang dibiayai perorangan, evaluasi suamatif ini lebih populer daripada evaluasi formatif.
Tidak begitu populer bagi karyawan program, bagaimana akan dipakai, dan apakah akan
dipakai tergantung kepada pembuat keputusan.
Pada evaluasi sumatif, evaluasi berfokus pada variabel-variabel yang dianggap
penting oleh sponsor atau pembuat keputusan. Evaluator luar atau tim reviu sering
dipakai, karena evaluator internal dapat mempunyai minat yang berbeda. Strategi
pengumpulan informasi akan memaksimalkan validatasi eksternal dan internal yang
mungkin dikumpulkan dalam waktu yang cukup lama.
Desain evaluasi dapat beruapa emergent, dapat juga berupa fixed, dibuat untuk
mencapai kebutuhan sponsor dan pemegang kunci keputusan.
c. Desain Eksperimental dan Desain Quasi Eksperimental vs Natural Inquiry
Beberapa evaluasi memakai metodologi penelitian klasik. Dalam hal seperti ini,
subjek penelitian diacak, perlakuan diberikan, dan pengukuran dampak dilakukan. Tujuan
dari penelitian itu yaitu untuk menilai manfaat suatu objek, suatu program atau strategi
27
baru yang dicobakan. Apabila siswa atau program dipilih secara acak, maka generalisasi
dapat dibuat paa populasi yang agak luas. Namun sepertinya tidak etik untuk
mengintervensi ke dalam lingkungan pendidikan dengan memilih atau memberi
perlakuan. Jadi, sampai sejauh mana lingkungan dapat dimanipulasi dan sampai sejauh
mana suatu strategi dianggap pantas, merupan pemikiran yang cukup serius dalam bidang
ini.
Dalam bebrapa hal, intervensi tidak mungkin dilakukan atau tidak dikehendaki.
Apabila proses sudah terjadi, evaluator harus melihat dokumen-dokumen sejarah,
mempelajari nilai tes, atau menganalisis penelitian yang dilakukan. Bila dianggap penting
untuk mengevaluasi suatu lingkungan atau program agar dapat diperbaiki, evaluator
mungkin memilih mengamatinya, bicara dengan orang-orang yang terlibat, dan selalu
merendah (low profile), sehingga program yang mereka evaluasi tidak terancam dan
mengubah diri karena kehadiran evaluator. Banyak metodologi, termasuk observasi,
survei, analisis meta, studi kasus, dan wawancara dapat dilakukan seperti itu untuk
mengurangi dampak evaluasi pada orang dan proyek, dan memaksimalkan laporan yang
sebenarnya.
Desain penelitian klasik memakan banyak waktu dan biaya yang digunakan untuk
mempersiapkan instrumen untuk menilai perlakuan, data kuantitatif biasanya
dikumpulkan, dan kriteria statistik juga digunakan. Kriteria statistik berfokus pada hasil
program dan dibuat sebelumnya. Interaksi dengan audiensi dilakukan untuk membuat
rencana, mengumpulkan informasi, dan melaporkan kembali.
Strategi pengumpulkan data teutama menggunakan instrumen formal seperti tes,
survei, kuesioner, dan skala rating serta memakai metode penelitian yang standar. Kriteria
penelitian seperti internal dan external validity dianggap penting. Data yang dikumpulkan
kebanyakan kuantitatif. Desain penelitian biasanya dibuat bersama pemesan atau
pemakai. Bila ada perubahan, hanya untuk memperlancar pencapaian tujuan sesuai
rencana.
Desain penelitian Natural Inquiry. Evaluator menghabiskan banyak waktu untuk
mengamati dan berbicara dengan audiensi yang relevan. Strategi yang multiple dan
sumber-sumber dipakai untuk mempertinggi reliabilitas pengumpulan data. Evaluator
merundingkan isu dengan audiensi, hal ini dilakukan sesuai dengan cara evaluator.
Interaksi dengan audiensi berkesinambungan dan informal. Observasi, studi kasus,
28
laporan tim penyokong, merupakan ciri-ciri desain penelitian ini. Demi untuk lebih
berguna, evaluator sering mengorbankan pengukuran dan tujuannya.
4. Model Stake atau Model Countenance
Stake (1967), analisis proses evaluasi yang dikemukakannya membawa dampak
yang cukup besar dalam bidang ini dan meletakkan dasar yang sederhana namun
merupakan konsep yang cukup kuat perkembangan yang lebih jauh dalam bidang
evaluasi. Stake menekankan adanya dua dasar kegiatan dalam evaluasi ialah Descriptions
dan judgement dan membedakan adanya tiga tahap dalam program pendidikan, yaitu:
Antecedents (Context), transaction (Proses), dan Outcomes (Output).
Matrix Description menunjukkan intents (Goasls) dan Observations (Effects)atau
yang sebenarnya terjadi. Judgements mempunyai dua aspek, yaitu Standard dan
Judgments.
Stake mengatakan bahwa apabila kita menilai suatu program pendidikan kita,
melakukan perbandingan yang relatif antara satu program dengan yang lain, atau
perbandingan yang absolut (satu program dengan standard).
Penekanan yang umum atau hal yang penting dalam model ini ialah bahwa
evaluator yang membuat penilaian tentang program yang dievaluasi. Stake mengatakan
bahwa description di satu pihak berbeda dengan judgement atau menilai. Dalam model
ini, antecedents (masukan), transaction (proses), dan outcomes (hasil) data dibandingkan
tidak hanya untuk menentukan apakah ada perbedaan tujuan dengan keadaan yang
sebenarnya, tetapi juga dibandingkan dengan standar yang absolut, untuk menilai manfaat
program. Stake mengatakan bahwa tak ada penelitian dapat diandalkan apabila tidak
dinilai.
29
usahanya berbeda penekanan pada aspek tertentu dalam tahap pengumpulan data, analisis
dan laporannya.
1) Pendekatan Experimental
Pendekatan experimental yaitu evaluasi yang berorientasi pada penggunaan
experimental science dalam program evaluasi. Pendekatan ini berasal dari kontrol
eksperimen yang biasanya dilakukan dalam penelitian akademik. Tujuan evaluator yaitu
untuk memperoleh kesimpulan yang bersifat umum tentang dampak umum tentang
dampak suatu program tertentu yang mengontrol sebanyak-banyaknya faktor dan
mengisolasi pengaruh program. Evaluator berusaha sekuat tenaga menggunakan metode
scientific sebanyak mungkin.
Evaluator menggunakan pendekatan eksperimental melakukan evaluasi seperti
seorang ilmuwan yang melakukan penelitian. Misalnya, termasuk menciptakan situasi
yang dikontrol, dimana beberapa subjek menerima perlakuan, sedang yang lainnya tidak,
dan membandingkan kedua kelompok untuk melihat dampak program. Evaluator
memakai teknik dasar desain eksperimental acak, kelompok kontrol, dan analisis
longitudinal untuk menarik kesimpulan tentang dampak perlakuan.
Kelemahan dari pendekatan eksperimental adalah kontrol tidak dapat dilakukan
begitu ketat dalam kenyataannya atau dalam keadaan yang sebenarnya. Namun, evaluator
akan berusaha sekuat mungkin untuk mengontrol misalnya melalui desain kuasi
eksperimen dan memakai teknik statistik yang canggih seperti analisis covariance untuk
mengatasi perbedaan yang tak dapat dikontrol dalam kondisi program.
Keuntungan dari pendekatan eksperimen ini yaitu kemampuannya dalam menarik
kesimpulan yang relatif objektif, generalisasi jawaban terhadap pertanyaan program yang
bersangkutan. Hal ini membuat pendekatan ini lebih populer, terpercaya, dan disukai
pemakai serta pembuat keputusan.
Pendekatan ini membuat evaluator sebagai orang ketiga yang objektif dalam
program yang menjalankan prinsip-prinsip desain penelitian dalam situasi yang diberikan
untuk memperoleh informasi yang tidak diragukan kebenarannya atas dampak
program.Evaluator sebagai ahli penelitian, jarang ada klien yang mengerti pentingnya
acak, perlunya konsistensi, dan lain-lain. Hal ini merupakan keterbatasan yang harus
diatasi evaluator yang dapat mempengaruhi hubungan antara evaluator dan klien.
30
Evaluator dan klien harus pandai-pandai membawa diri, menjaga hubungan baik dan
harmonis dengan klien, kalau tidak hubungan mungkin jadi renggang dan mungkin akan
menggagalkan pekerjaan evaluator.
2) Pendekatan yang Berorientasi pada Tujuan (Goal Oriented Approach)
Cara yang paling logis untuk merencanakan suatu program yaitu merumuskan
tujuan umum dan tujuan khususdan membentuk kegiatan program untuk mencapai tujuan
tersebut. Hal yang sama juga diperoleh pada pendekatan orientasi tujuan pada evaluasi.
Pendekatan ini memakai tujuan program sebagai kriteria untuk menentukan keberhasilan.
Evaluator mencoba mengukur sampai dimana pencapaian tujuan telah dicapai.
Pendekatan evaluasi semacam ini merupakan pendekatan yang amat wajar dan
praktis untuk desain dan pengembangan program. Model ini memberi petunjuk kepada
pengembangan program, menjelaskan hubungan antara kegiatan khusus yang ditawarkan
dan hasil yang akan dicapai. Peserta tidak hanya harus menjelaskan hubungan tersebut di
atas, tetapi jga harus menentukan hasil yang diinginkan dengan rumusan yang dapat
diukur. Dengan demikian ada hubungan yang logis antara kegiatan, hasil, dan prosedur
pengukuran hasil.
Tidak semua program direncanakan seperti tersebut di atas, merumuskan tujuan
dengan cukup jelas. Maka evaluator yang menganut pendekatan ini akan membantu klien
merumuskan tujuannya dan menjelaskan hubungan antara tujuan dan kegiatan. Bila ini
sudah tercapai maka pekerjaan evaluasi akan menjadi lebih sederhana.
Kalau evaluator berbicara tentang tujuan, klien kebanyakan berbicara tentang
hasil. Namun program dapat mempunyai tujuan dan prosedur. Evaluator juga dapat
membantu klien menerapkan rencana penerapan dan melihat proses pencapaian tujuan
yang memperlihatkan kemampuan program menjalankan kegiatan sesuai rencana. Begitu
tujuan umum dan tujuan khusus terjelaskan, tugas evaluator menentukan sampai sejauh
mana tujuan program telah tercapai. Bermacam-macam alat ukur akan dipakai untuk
melakukan tugas ini, tergantung pada tujuan yang akan diukur. Hasil evaluasi akan berisi
penjelasan tentang status tujuan program. Dalam hal ini keberhasilan diukur dengan
kriteria program khusus bukan dengan kelompok kontrol atau dengan program lain
seperti halnya dalam pendekatan eksperimen. Tentu saja prosedur untuk mengukur
pencapaian tujuan diusahakan sekuat tenaga. Mereka juga memakai analisis statistik bila
dianggap lebih baik. Kelebihan pendekatan yang berorientasi pada tujuan ini ialah
31
terletak pada hubungan antara tujuan dan kegiatan dan penekanan pada elemen yang
penting dalam program yang melibatkan individu pada elemen khusus bagi mereka.
Namun keterbatasan pendekatan ini yaitu kemungkinan evaluasi ini melewati
konsekuensi yang tak diharapkan akan terjadi.
Pendekatan ini mempengaruhi hubungan antara evaluator dan klien, karena proses
memperjelas tujuan ini memerlukan interaksi yang sering dengan klien, maka sifat
independen evaluator tidak seperti pada pendekatan eksperimen. Evaluator lebih bersifat
seperti mentor terhadap klien. Jarang digunakan teknik statistik canggih dalam
pendekatan ini. Hubungan evaluator dan klien menjadi lebih erat. Apabila tujuan sudah
dirumuskan dalam bentuk yang mudah diukur, maka seluruh proses evaluasi menjadi
lebih mudah dan sederhana.
3) Pendekatan yang Berfokus kepada Keputusan (The DecisionFocused Approach)
Pendekatan Evaluasi yang berfokus pada keputusan menekankan pada peranan
informasi yang sistematik untuk pengelola program dalam menjalankan tugasnya. Sesuai
dengan pandangan ini, informasi akan amat berguna apabila dapat membantu para
pengelola program membuat keputusan. Oleh sebab itu, kegiatan evaluasi harus
direncanakan sesuai dengan kebutuhan untuk keputusan program.
Pengumpulan data dan laporan dibuat untuk menambah efektifitas pengelola
program. Selanjutnya karena program sering berubah selama beroperasi dari awal sampai
akhir, kebutuhan pemegang keputusan juga akan berubah, dan evaluasi harus disesuaikan
dengan keadaan tersebut. Pada tingkat perencanaan, pembuat program memerlukan
informasi tentang masalah dan kapasitas organisasi. Selama dalam tingkat implementasi
administrator memerlukan informasi tentang proses yang sedang berjalan. Bila program
sudah selesai, keputusan-keputusan penting akan dibuat berdasarkan hasil yang dicapai.
Sebagai akibatnya, evaluator harus mengetahui dan mengerti perkembangan program dan
harus siap menyediakan bermacam-macam informasi pada bermacam-macam waktu.
Idealnya program dan sistem evaluasi dikembangkan bersama, tapi hal ini tidak selalu
dapat terjadi. Malahan sering evaluator diminta mengevaluasi setelah program berjalan.
Biasanya evaluator bekerja mundur, dari berbagai keputusan untuk mendesain
kegiatan pengumpulan data yang memberikan data yang relevan untuk mengurangi
keragu-raguan. Evaluator memerlukan 2 macam informasi dari klien. Pertama ia harus
mengetahui butir-butir keputusan penting pada setiap periode selama program berjalan.
Kedua ia perlu mengetahui macam informasi yang mungkin akan sangat berpengaruh
32
untuk setiap keputusan. Tentu ada juga ada beberapa keputusan yang dibuat berdasarkan
politik dan pertimbangan lain yang tidak berhubungan dengan informasi yang relevan.
Keunggulan pendekatan ini ialah perhatiannya terhadap kebutuhan pembuat
keputusan yang khusus dan pengaruh yang makin besar pada keputusan program yang
relevan.
Keterbatasan pendekatan ini yaitu banyak keputusan penting dibuat tidak pada
waktu yang tepat, tapi dibuat pada waktu yang kurang tepat. Seringkali banyak keputusan
dibuat tidak berdasarkan data, tapi tergantung pada impresi perorangan, politik, perasaan,
kebutuhan pribadi, dan lain-lain. Dalam hal ini evaluator mungkin dapat memberi
pengaruh positif yang lebih objektif dan rasional.
Pengaruh pendekatan ini pada pemfokusan evaluasi, seperti yang diperkirakan
bahwa proses pemfokusan evaluasi berasal dari pembuat keputusanitu sendiri. Orang
tersebut mungkin direktur program, dewan direksi, kelompokklien, karyawan, dan lain-
lain. Evaluator perlu mengetahui dan emnentukan siapa di antara orang-orang tersebut
yang emmegang kunci keputusan dan berkonsultasi dengannya. Evaluator mencoba
mempelajari sebanyak mungkin tentang konteks keputusan. Keputusan apa yang diambil?
siapa yang memebuat keputusan?apa saja alternatif yang ada?informasi apa yang kiranya
penting dan sebagainya. Misalnya, data yang ada, maka data tersebut tak perlu
dikumpulkan. Sebagai evaluator anda dapat menentukan dan mengumpulkan berbagai
informasi yang pilihannya relevan. Evaluasi model ini dianjurkan untuk beberapa
penelitian, dua orang yang amat terkenal yaitu, Stufflebeam (1971) dan Alkin (1969).
4) Pendekatan yang Berorientasi Kepada Pemakai (The User Oriented Approach)
Sejak tahun sembilan belas tujuh puluhan, evaluasi merupakan suatu komponen
standar dari hampir semua program yang dibiayai masyarakat. Para evaluator menjadi
sibuk, namun banyak yang merasa kurang puas atas hasil usahanya. Ketidakpuasan ini
disebabkan laporan mereka hanya berpengaruh sedikit sekali terhadap program yang
mereka evaluasi. Walaupun evaluasi sudah mencoba mengukur sampai sejauh mana
tujuan program telah dicapai, tapi hasilnya tidak seperti yang mereka harapan.
Sebagai jawaban atas hal tersebut, para peneliti mulai meneliti maslah utilisasi
evaluasi. Mereka mulai mengumpulkan bukti-bukti empiris yang membatasi pemakaian
informasi. Sejumlah faktor-faktor positif berhasil dirumuskan, termasuk keterlibatan
langsung para pemegang kunci keputusan, ketepatan waktu informasi, dan kepekaan
33
terhadap konteks organisasi. Lebih-lebih lagi keterlibatan personel tampaknya memegang
peran penting dalam mempromosikan pemakaian evaluasi.
Karena banyak faktor-faktor positif dapat dipengaruhi oleh perilaku evaluator,
sejumlah peneliti mengembangkan pendekatan baru yang menekankan perluasan
pemakaian informasi. Hal ini disebutkan pendekatan the user oriented. Seperti apa yang
dibayangkan, pamakai informasi yang potensial adalah yang menjadi tujuan utama.
Evaluator dalam hal ini menyadari sejumlah elemen yang cenderung akan
mempengaruhi kegunaan evaluasi. Hal ini termasuk elemen-elemen seperti cara-cara
pendekatan dengan klien, kepekaan faktor kondisi, dan situasi seperti kondisi yang telah
ada (pre-existing cobdition), keadaan organisasi dan pengaruh masyarakat, dan situasi di
mana evaluasi dilakukan dan dilaporkan. Elemen yang paling penting mungkin
keterlibatan pemakai yang potensial selama evaluasi berlangsung. Misalnya, evaluator
memfokuskan evaluasi dengan membentuk kelompok pemakai. Kelompok tersebut akan
menolong membuat kerangka evaluasi, merumuskan pertanyaan-pertanyaan yang
penting, memilih strategi pengukuran, mereviu hasil awal dan menggiring mereka segera
bertindak dan akhirnya menerima hasil evaluasi. Evaluator dalam hal ini mencoba
melibatkan orang-orang penting je dalam proses evaluasi, sehingga mereka akan merasa
tidak asing lagi terhadap informasi atau hasil evaluasi apabila disodorkan kepada mereka,
karena itu juga merupakan hasil kerja mereka. Kurang ditekankan pada laporan akhir dan
lebih banyak melibatkan dan berkomunikasikan dengan erat dengan para pemegang kunci
keputusan.
Evaluator menekankan usaha pada pemakai dan cara pemakaian informasi.
Urusan desain, teknik analisis data atau penjelasan tentang tujuan evaluasi juga mungkin
penting, tapi tidak sepenting yang pertama. Misalnya, apabila kebutuhan pemakai
berubah selama program berjalan, evaluasi juga akan berubah. Hal ini dapat terjadi dalam
pendekatan semacam ini. Evaluator menerima kenyataan bahwa ada hal-hal yang tak
terduga dalam setiap program. Hal-hal diluar program mungkin akan mempengaruhi
program, dan evaluasi yang berguna harus peka terhadap hal tersebut dan harus dapat
beradaptasi.
Kelebihan pendekatan ini ialah perhatiannya terhadap individu yang berurusan
dengan program dan perhatiannya terhadap informasi yang berguna untuk individu
34
tersebut. Hal ini tidak saja membuat evaluasi menjadi lebih berguna, tetapi juga dapat
menciptakan rasa telah berbuat bagi individu tersebut, dan hasil evaluasi akan selalu
terpakai.
Keterbatasan pendekatan ini yaitu ketergantungannya terhadap kelompok yang
sama dan kelemahan ini bertambah besar pengaruhnya sehingga hal-hal lain di luar itu
kurang mendapat perhatian. Kelompok itu dapat berganti komposisi berkali-kali dan ini
dapat mengganggu kelangsungan atau kelancaran kegiatan evaluasi. Akhirnya, mereka
yang lebih banyak bicara dan lebih persuasif dapat berpengaruh lebih besar. Lagi pula,
sulit untuk mengatakan atau meyakinkan bahwa semua minat dapat tertampung.
Pengaruh terhadap pemfokuskan evaluasi. Bila anda menganut pendekatan ini,
yang mementingkan pemakaian informasi bagi klien atau pemakai, maka anda harus
menaruh perhatian yang besar kepada orang-orang yang berpengaruh terhadap keputusan
program dan pada konteks atau lingkungan di nana proses itu dilakukan. Kebanyakan
evaluator mencoba mengenal orang-orang yang kiranya akan memakai informasinya,
memperbanyak partisipasinya dalam proses evaluasi, dan memperdalam perasaan ikut
membuat atau memiliki hasil evaluasi. Jadi, evaluator ini lebih menaruh perhatian pada
situasi dan hubungan antarpersonel dari pada aturan penelitian atau pada keperluan
pengukuran.
Evaluator lebih terlibat dalam kegiatan program daripada evaluator yang
menganut pendekatan lain. Mereka lebih bertindak sebagai prang dalam daripada sebagai
konsultan luar. Sampai tahap tertentu, evaluator seolah-olah sebagai siswa organisasi,
juga sebagai pengamat (observer) dari dinamika program. Evaluator bukan sebagai ahli,
tetapi sebagai rekan yang mencoba menolong untuk hal-hal yang diperlukan organisasi.
Pendekatan dilakukan dengan bersahabat, evaluator mencari pengetahuan tentang fungsi
program dan keperluan orang-orang yang mempengaruhi keputusan. Patton (1986)
menamakan pendekatan ini sebagai “active, reactive, adaptive” di mana evaluator
memberikan ide kepada kelompok pemakai, menerima saran mereka, dan
mengadaptasikan evaluasi sesuai dengan kebutuhan-kebutuhan klien atau pemakai.
Evaluator yang menganut pendekatan ini harus seorang komunikator yang efektif. Karena
interaksi dengan klien dan orang program dapat mempengaruhi kegunaan hasil,
kemampuan berkomunikasikan amat penting. Bahkan laporan tertentu dibuat dalam
35
bentuk yang akkan meningkatkan kegunaannya yaitu: singkat, langsung, laporan
akademis, sajian yang dilengkapi dengan gambar dan grafik, bukan dalam bentuk laporan
tertulis dengan karangan panjang. Pembaca yang tertarik memperdalam penddekatan ini
lebih jauh dapat membaca Patton (1986), Alkin, Daillok, dan White (1979), Braskomp da
Brown (1980).
5) Pendekatan yang Responsif (The Respomsive Approach)
Pendekatan ini merupakan pendekatan yang paling lain dari kelima bentuk
pendekatan yang dibacarakan dalam tulisan ini karena perspektif dalam usulan evaluasi
dan metode pencapaiannya. Evaluasi responsif percaya bahwa evaluasi yang berarti yaitu
yang mencari pengertian suatu isu dari berbagai sudut pandangan dari semua orang yang
terlibat, yang berminat, dan yang berkepentingan dengan program. Evaluator tak percaya
ada satu jawaban untuk suatu evaluasi program yang dapat ditemukan dengan memakai
tes, kuesioner, atau analisis statistik. Tapi setiap orang yang dipengaruhi oleh program
merasakannya secara unik, dan evaluator mencoba menolong menjawab pertanyaan yang
berhubungan dengan melukiskan atau menguraikan kenyataan melalui pendangan orang-
rang tersebut. Tujuan evaluator ialah berusaha mengerti urusan program melalui berbagai
sudut pendang yang berbeda.
Evaluator juga mengadopsi pendekatan yang bermacam-macam dalam
penelitiannya dan dalam masalah mencari tahu dinamika organisasi. Evaluasi responsif
ditandai oleh ciri-ciri penelitian yang kualitatif, naturalistik, bukan kuantitatif. Bukan
mengumpulkan data dengan instrumen tes atau kuesioner, tapi evaluator mengandalkan
observasi yang langsung atau tidak langsung terhadap kejadian dan interprestasi data
yang impresionistik. Evaluator mengobservasi, merekam, menampilkan data, mengecek
pengetahuan awal (preliminary understanding) peserta program, dan mencoba membuat
model yang mencerminkan pandangan berbagai kelompok. Dengan jalan ini evaluator
mencoba responsif terhadap orang-orang yang berkepentingan pada hasil evaluasi, bukan
pada permintaan desain penelitiian atau teknik pengukuran. Tapi bukan berarti evaluator
menghindari pengukuran dan teknik analisis sama sekali. Elemen yang penting dalam
pendekatan responsif ini yaitu pengumpulan dan menyintesis data. Tes tradisional dan
instrumen biasanya merupakan pertimbangan kedua. Data utama dalam pendekatan
responsif yaitu observasi langsung dan tak langsung, dan bentuk laporan ialah studi kasus
36
atau gambaran yang deskriptif. Evaluator bertindak sebagai organisasi antropologis,
pencari pengertian realitas melalui perspektif orang program, peserta program, dan
kelompok lain yang dipengaruhi oleh program tersebut.
Kelebihan pendekatan responsif ini ialah kepekaannya terhadap berbagai titik
pandangan, dan kemampuannya mengakomodasi pendapat yang ambigis dan tidak fokus.
Pendekatan responsif dapat beroperasi dalam situasi di mana terdapat banyak perbedaan
minat dari kelompok yang berbeda-beda, karena mereka dapat mengatur pendapat
tersebut dengan cara yang tepat. Demikian juga evaluasi responsif dapat mendorong
proses perumusan masalah dengan menyediakan informasi yang dapat menolong orang
mengerti isu lebih baik.
Keterbatasan pendekatan responsif ialah keenggananya membuat prioritas atau
penyederhanaan informasi untuk pemegang keputusan dan kenyataan yang praktis tidak
mungkin menampung semua sudut pandangan dari berbagai kelompok.
Pengaruh pendekatan ini terhadap pemfokuskan evaluasi ialah evaluator
menghabiskan banyak waktu berbicara dengan klien, mengamati kegiatan program,
mencoba menyaring hal-hal yang dipandang penting oleh klien, dan masalah-masalah,
konsep-konsep dan isu-isu dari berbagai sudut pandang. Akibatnya, evaluator harus dapat
menempatkan diri di tempat orang lain. Dia tak boleh membuat kesimpulan sendiri, tapi
lebih pada pihak memeriksa dan mengecek kembali kepastian pada sumber data primer.
Hal ini memerlukan kesabaran dan kepekaan. Evaluator mencoba menarik isu dan
masalah dari orang-orang proyek, peserta, klien, dan orang-orang lain yang berhubungan
dengan program. Tidak sebagai agen atau orang luar, evaluator bertindak sebagai
konselor, menolong peserta program, memperjelas pengertian mereka tentang
programnya sendiri. Akibatnya, evaluator harus menjadi pengamatan yang baik, mereka
harus dapat beradaptasi dengan berbagai sudut pandangan tanpa memperlihatkan
penilaian sebagai orang luar.
Evaluator harus dilatih melakukan teknik-teknik penelitian kualitatif. Ini termasuk
strategi open ended atau strategi akhir terbuka untuk pengumpulan data, seperti observasi
dan wawancara yang semi-struktur. Ini termasuk juga teknik mengorganisasi dan analisis
data kualitatif, seperti analisis impressionistic dan indexing.
6) Goal Free Evaluation
37
Alasan menegmukakan goal free evaluation (evaluasi bebas tujuan), dapat
diuraikan secara ringkas sebagai berikut:pertama, tujuan pendidikan tak dapat dikatakan
sebagai pemberian, seperti tujuan lain, ia harus di evaluasi. Lebih jauh lagi, tujuan
biasanya atau umumnya hanya formalitas, dan jarang menunjukkan tujuan yang
sebenarnya dari proyek, atau tujuan berubah. Lagi pula, banyak hasil program penti ng
tidak sesuai dengan tujuan program, misalnya membangun pusat vacational baru akan
menciptakan lapangan kerja baru, hasil yang diinginkan, tetapi tak pernah menghasilkan
tujuan proyek yang nyata. Scriven percaya bahwa fungsi evaluasi bebas tujuan ialah
untuk mengurangi bias dan menambah objektifitas. Dalam evaluasi yang berorientasi
pada tujuan, seorang evaluator dibeitahu tujuan proyek dan karenanya membatasi dalam
persepsinya, tujuan berlaku sebagai penutup mata (blinders), yang menyebabkannya
melewati hasil penting yang langsung berhubungan dengan tujuan.
Misalnya seorang evaluator diberitahu bahwa tujuan program rehabilitasi putus
sekolah ialah:
1) Mengembalikan anak ke sekolah
2) Melatih mereka dengan keterampilan tertentu
3) Memberi pekerjaan yang stabil
Evaluator mungkin menghabiskan waktunya mendesain dan mengukur untuk
melihat hal-hal tersebut, seperti jumlah para putus sekolah kembali ke sekolah, berapa
yang diberi pekerjaan dan tetap bekerja, dan sebagainya. Ini memang tujuan yang
berguna, dan program berhasil, serta sukses dalam mencapai tujuan tersebut. Tapi
bagaimana dengan kenyataan bahwa kejahatan remaja di sekolah menjadi tiga kali lipat
sejak anak putus sekolah dikembalikan? Dampak negatif inilah yang menjadi pemikiran
evaluasi bebas tujuan itu. Dampak negatif yang tak pernah termasuk dalam evaluasi yang
berorientasi pada tujuan atau goal based evaluation. Berikut ini merupakan ciri-ciri
evaluasi bebas tujuan:
a. Evaluator sengaja menghindar untuk mengetahui tujuan program
b. Tujuan yang telah dirumuskan terlebih dahulu tidak dibenarkan menyempitkan fokus
evaluasi.
c. Evaluasi bebas tujuan berfokus pada hasil yang sebenarnya, bukan pada hasil yang
direncanakan.
d. Hubungan evaluator dan manajer atau dengan karyawan proyek dibuat seminimal
mungkin.
e. Evaluasi menambah kemungkinan ditemukannya dampak yang tak diramalkan.
38
Mungkin akann lebih baik apabila evaluasi berorientasi pada tujuan dan evaluasi
bebas tujuan dikawinkan, karena mereka akan saling mengisi dan melengkapi. Evaluator
internal biasanya melakukan evaluasi yang berorientasi pada tujuan, karena ia sulit
menghindar atau mau tidak mau ia akan mengetahui tujuan program, akan tidak pantas
apabila ia tidak acuh. Manajer program jelas ingin mengetahui sampai seberapa jauh
tujuan program telah dicapai, dan evaluator internal akan dan harus menyediakan
informasi untuk manajernya. Di samping itu, perlu diketahui bagaimana orang luar
menilai program bukan hanya untuk mengetahui apa mutunya, tetapi juga untuk
mengetahui apa yangs eharusnya dilakukan, apa yang dilakukan di semua bagian, paada
semua yang telah dihasilkan, secara sengaja atau tidak sengaja. Yang belakangan ini
merupakan tugas evaluator bebas tujuan yang tidak mengetahui tujuan program. Jadi,
evaluasi yang berorientasi pada tujuan dan evaluasi bebas tujuan dapat bekerja sama
dengan baik.
Bila memilih model-model evaluasi atau apapun istilahnya yang harus
dipertimbangkan adalah apakah pendekatan atau konsep sebenarnya yang dimaksud
adalah sama yaitu strategi yang akan dipakai sebagai kerangka kerja dalam melakukan
evaluasi. Apa yang akan dipilih akan tergantung pada maksud dan tujuan evaluasi. Untuk
ini harus memilih teori atau fungsi dari model pendekatan tersebut dan tidak tergantung
pada satu model atau pendekatan atau konsep, harus dikuasai seluk beluk setiap model
yang menjadi pilihan dan tidak menjadi budak dari satu model atau pendekatan.
39
KESIMPULAN (SUMMARY)
Dari berbagai pengertian tersebut maka yang harus lebih dipahami dari evaluasi
adalah:
1. Kegiatan evaluasi merupakan proses yang sistematis
2. Kegiatan evaluasi ememrlukanberbagai informasi atau data yang menyangkut
objek yang sedang di evaluasi
3. Kegiatan evaluasi tidak dapat dilepaskan dari tujuan-tujuan pengajaran yang hendak
dicapai.
Evaluasi begitu penting peran dan fungsinya dalam pengembangan dan perbaikan
kurikulum
Terdapat 7 langkah evaluasi. Evaluasi harus memasukkan ketentuan dan tindakan
sejalan dengan fungsi evaluasi.
Ada banyak model evaluasi, dimana model-model tersebut dipakai sebagai strategi
atau pedoman kerja pelaksanaan evaluasi program
Pendekatan evaluasi dapat digunakana sesuai dengan tujuan dan sasaran yang ingin
dicapai seperti waktu pelaksanaannya, kapan evaluasi dilakukan, untuk apa evaluasi
dilakukan, dan acuan serta paham yang dianut oleh evaluator.
LATIHAN (EVALUATION)
HAND OUT
Uraian Materi :
KONSEP EVALUASI PROGRAM
Informasi yang dikumpulkan yaitu Informasi yang dicari untuk menjawab pertanyaan
– pertanyaan evaluasi. Informasi yang tidak memadai, yaitu informasi yang tidak
dapat dipercaya atau tidak relevan dengan pertanyaan – pertanyaan yang ditanyakan
evaluasi. Informasi yang memadai atau yang baik yaitu informasi yang datang dari
atau yang berasal dari sumber yang dapat dipercaya untuk menjawab pertanyaan
evaluasi.
Apabila telah diketahui bahwa informasi telah ada, ada beberapa prosedur yang dapat
membantu memperoleh informasi yang dikumpulkan. Biasanya tambah banyak
waktu dan sumber yang ada atau yang diberikan, informasi yang diperoleh akan
bertambah lengkap dan berguna informasi tersebut (Brikerhoff 1984).
Ada sejumlah pertimbangan penting yang harus diingat bila memilih informasi, salah
satu antaranya yaitu pertimbanagan tentang biaya efektif (cost effevtiveness)
41
memaksa evaluator untuk memikirkan tentang teknik yang akurat. Tergantungnya
pada evaluator dan klien prioritas apa yang dibuat tentang informasi yang akan
dikumpulkan.
Ada sejumlah pertimbangan yang perlu diingat ketika memilih informasi, umumnya
pertimbngan keungan (cost effectiveness), memaksa evaluator harus memakai teknik
akurasi. Terserah pada klien dan evaluator untuk membuat kriteria dan prioritas
informasi yang akan dikumpulkan. Informasi tersebut paling tidak harus menjawab
pertanyaan tentang evaluasi, dan harus mencapai kriteria – kriteria sebagai berikut :
a. Terpercaya
Informasi yang dapat dipercaya oleh klien yaitu informasi yang akurat, diberikan
oleh orang atau sumber yang juga terpercaya dan benar. Karena hanya informasi
yang dipercaya klien yang akan dipakai.
b. Praktis
Informasi yang praktis yaitu informasi yang diperoleh dengan wajar, tidak mahal,
dan tidak sulit. Sumber dan informasi yang kompleks, analisisnya akan mahal
dan belum tentu akan dipakai karena memakan waktu untuk menganalisisnya.
c. Prioritas
Dihubungkan dengan dana dan waktu. Informasi harus diserahkan tepat pada
waktunya, apabila terlambat, tentu tidak akan berguna lagi bagi pemegang
keputusan. Oleh sebab itu, harus dibuat jadwal dan target sehingga dapat
diselesaikan tepat waktunya dan diserahkan juga pada tepat waktu.
d. Akurasi
Informasi yang akurat, yaitu informasi yang relevan dan terpercaya dan tidak
banyakkesalahan, terutama tentang metode dan proses pengumpulan data dan
analisisnya. Informasi yang tidak akurat, yang banyak kesalahan, akan
memberikan salah tafsir dan dapat menyesatkan klien dan pemegang keputusan.
Oleh sebab itu perlu dimonitor, tentukan bagaimana analisisnya, kalau perlu sea
konsultan luar untuk menganalisis kembali data yang ruwet dan banyak.
Kemudahan Menganalisis
Informasi yang dikumpulkan hendaknya informasi yang dapat dianalisis atau dapat
dikerjakan oleh tenaga yang ada. Paling tidak anda mengerti bagaimana menganalisis
informasi tersebut, atau telah berpengalaman menganalisis informasi semacam itu.
a. Objektivitas
Informasi yang objektif yaitu informasi yang langsung dan yang belum dinodai
oleh klien atau orang lain yang mempunyai minat. Informasi yang bias karena
campur tangan orang lain, bahkan informasi yang tidak bias tetapi tergantung dari
hal tertentu juga tak akan terpakai. Oleh sebab itu, informasi harus direviu, meta
evaluasi diamati sebelum dilaporkan hal ini amat membantu pencapaian kriteria.
b. Kejelasan
Informasi yang jelas yaitu informasi yang mudah dan dapat dimengerti dan tidak
ambigis atau yang dapat memberi penafsiran ganda. Karena laporan yang tidak
praktis, yang bertele – tele dan tidak teratur tidak akan dimengerti oleh klien.
42
c. Pembatasan ruang lingkup
Informasi yang diberikan hendaknya cukup luas untuk menjawab pertanyaan
evaluasi, tetapi jangan terlalu luas sehingga sulit dikelola. Informasi yang banyak
memang memakai ongkos yang banyak, tetapi juga informasi yang sedikit tidak
akan memadai.
d. Keberadaan
Data yang mudah atau murah diperoleh dan sudah ada ini yang diperioritaskan.
Misalnya rekaman, laporan, fail, nilai tes, hasil survei, data demografi dll. Data
yang sudah ada biasanya gratis dan biasanya jarang ternodai atau bias karena
evaluasi yang lain.
e. Manfaat
Informasi yang berguna atau bermanfaat yaitu informasi yang tepat waktu dan
relevan terhadap pertanyaan klien. Informasi yang tidak dapat dipergunakan yaitu
informasi yang tidak tepat waktu dan tidak siap untuk dipakai, tidak perlu
diambil.
43
sumber materi tertentu
Analisis seri waktu Data terpilih Frekuensi praktikum
dibandingkan dengan siswa yang penting
yang lain beberapa klai. perilaku mereka.
Informasi yang memakai prosedur ini yaitu informasi yang bersifat naratif.
Prosedur kualitatif bertujuan menangkap fenomena yang lebih luas, yang open
ended (terbuka). Data ini lebih sulit dianalisis dan disingkat.
44
diulang atau tidak
Analisis sistem Komponen dan sub Evaluator menginterviu
komponen dan fungsi karyawan tentang
diuraikan program dan diuraikan
dalam sistem analisis.
Sampling ialah memilih satu porsi dari seluruh kelompok untuk mewakili seluruh
kelompok tersebut. Porsi ini dikenal dengan nama sampel, seluruh kelompok
disebut populasi. Bila membuat sampel, maksudnya akan mempelajari populasi
tanpa mengukur seluruh populasi.
Sampling sama dengan jalan pintas. Hal ini dapat menyingkat waktu dan uang,
dengan memilih satu porsi dari anggota yang potensial dari populasi untuk
memperoleh informasi. Seperti jalan pintas yang lain, risikonya yaitu membuat
keputusan atas dasar informasi yang tidak memadai.
1. Metode Sampling
Ada dua macam metode saml\pling yaitu random (acak) dan purposive
(disebut juga objektif dan subjektif).
Metode purposive, dipakai untuk membuat sampel yang akan mewakili sudut
pandang tertentu atas penialaian mereka yang memilih sampel. Berikut ini
beberapa metode sampling yang biasa digunakan, berikut contoh – contoh dari
metode ini (Brinkerhoff, 1983).
a. Random
1. Straight random sampling
Memilih sampel dengan metode acak, populasi ditentukan
sebelumnya. Porposi sampel menentukan tingkat ketetapan populasi
yang diwakilinya. Tambah besar sampel, bertambah tinggi ketepatan
generalisasinya.
Misalnya, P2LPTK melakukan random sampling untuk menentukan
tingkat kesiapan rata – rata guru yang diangkat di Jakarta.
2. Quota sampling
Sampel diambil dari populasi dengan kriteria tertentu dan dibuat
sebagai ukuran kategori tersebut. Misalnya, sampel orang tua murid,
dapat diambil secara acak dari daftar yang telah ditentukan
sebelumnya dari siswa yang orang tuanya berpendapatan tinggi,
sedang atau rendah. Hal ini tak dapat dilakukan dengan straigt random
45
sampling. Misalnya, universitas melakukan survei terhadap 5%
lulusan, pada setiap golongan pendapatan dan suku yang berbeda
untuk menentukan manfaat kurikulum tertentu dan tingkat
kepekaannya terhadap budaya yang berbeda.
3. Stratified sample
Sampel diambil dari beberapa strata, seperti mahasiswa tingkat I,II,III
atau guru, administrator, direktur dll. Stratified sample bermanfaat
apabila anda berminat pada salah satu strata lebih dari yang lain, dan
apabila sample lebih banyak dari strata yang lainnya. Setiap stratum
dianggap sebagai populasi. Misalnya, sebuah institusi melakukan
survei terhadap KB kepada semua direktur yang ada sebanyak 15
orang, 50% dari 40 orang administrator, 10% dari 1500 orang dosen.
4. Matrix sample
Metode ini mengambil sampel baik dari populasi tertentu, mauoun
misalnya dari butiran – butiran tes suatu instrumen tertentu. Hal ini
dapat dilakukan apabila respenden dan instrumen jumlahnya besar.
Lebih efektif apabila setiap responden hanya menjawab sejumlah butir
dari suatu instrumen. Bila butir tes diacak dan responden juga diacak,
maka generalisasi dapat diberikan untuk seluruh populasi dan
instrumen. Metode ini bermanfaat untuk survei yang luas atau program
tes yang besa tetapi dalam hal ini digunakan apabila nilai individu
tidak diperlukan. Misalnya untuk menentukan apakah suatu penataran
memberi dampak atas pengetahuan tentang KB, 10% peserta diberi tes.
Untuk memperpendek tes, setiap orang hanya menjawab 10 butir dari
50 butir instrumen.
b. Purposive
1. Key informant
Metode sampel individual ini dipakai untuk mengumpulkan informasi
tentang kondisi dan situasi tertentu. Misalnya, wakil persatuan,
pemimpin guru, pemimpin masyarakat, orang – orang terkemuka,
dapat dimintai informasi yang tepat tentang sikap guru dan pendapat
mereka, isu – isu masyarakat dan sebagainya. Misalnya panitia
lokakarya meminta informasi dari 5 ornag peserta untuk meperoleh
umpan balik, kelima peserta dipilih karena kelimanya adalah ketua
kelompok.
2. Expert judqes
Metode ini melibatkan sampling orang – orang yang mempunyai
keahlian terteentu, tantang kondisi atau ilmu pengetahuan tertentu
yang diminati.
46
Bila ingin mengetahui hal – hal tertentu sehubungan dengan keahlian
orang tersebut, wawancara satu jam dengan orang tersebut dapat
menyingkat waktu berjam – berjam dibanding dengan membaca
literatur tentang masalah tersebut. Misalnya, suatu institut melakukan
studi kasus terhadap karyawan lulusannya yang dianggap berhasil
dalam programnya, untuk melihat apakah persiapan mereka (institut
tersebut) cukup atau tidak dan untuk memperoleh ide – ide dan
pendapat untuk perbaikan – perbaikan.
3. Extreem group
Metode ini mencari sudut pandang yang konflik atau ekstrem, sedang
metode random bertujuan menghindari bias dan mencari rata – rata
atau ciri – ciri khusus. Extreem group sample sengaja tidak
mengacuhkan pendapat yang umum tetapi pendapat yang ekstrem.
Direktur – direktur program walaupun misalnya jumlahnya kecil
tentang situasi dan kondisi program, misalnya tentang kelemahan –
kelemahan, bahkan kelebihan – kelebihan program. Misalnya follow
up interview (wawancara lanjut) dilakukan terhadap siswa yang drop
out dari program.
4. Grapevine sampling
Metode ini memerlukan sampel yang berkembang atau tumbuh,
diamana setiao sampel ditentukan oleh sampel sebelumnya (anggota
sampel yang terdahulu). Misalnya untuk meminta informasi tentang
sikap tertentu guru – guru disebuah sekolah, dapat ditanya kepala
sekolahnya tentang sikap tertentu anggotanya, sikap negatif, positif
dan lain – lain. Kepala sekolah diwawancarai guru yang telah diantar,
lalu guru yang menyarankan penataran dan kemudian kepada guru
yang menatar dan demikian seterusnya untuk lebih banyak
memperoleh informasi sampel berulang ke yang pertama.
Instrumen adalah alat untuk merekem informasi yang akan dikumpulkan. Banyak
macam instrumen, antara lain wawancara, kuesioner, tes, ceklis, observasi dll.
Instrumen harus dipilih dan didesain dengan hati – hati. Instrumen yang tidak
tepat akan merusak rencana pengumpulan informasi. Hal ini penting yang harus
diingat dalam proses pembuatan instrumen yaitu menentukan apa yang
diperlukan, memilih, mengembangkan atau membuat instrumen.
47
1. Surveys
a. Open ended instruments (instrumen terbuka)
b. Forced choice instruments (instrumen tertutup)
2. Interviews
a. Closed formats, wawancara dengan format tertutup, pertanyaan dan
jawaban dibacakan kepada responden.
b. Semi open (semi terbuka), pertanyaan ditentukan dan pewawancara
membuat interpretensi jawaban kedalam formulir.
c. Open format (format terbuka), petunjuk umum diberikan kepada
pewawancara, jawaban didesain atau catatan, direkam dengan tape.
3. Observations
a. Open format, observer membuat catatan atau reaksi umum, perilaku dan
sebagainya tentang subjek yang dievaluasi.
b. Logs, semacam buku harian dimana observer mencatat reaksi dan perilaku
sendiri.
c. Sign system, diamana setiap perilaku khusus dihitung, dilakukan untuk
merekam perilaku tentenu dalam tempo waktu yang telah ditentukan.
d. Catagory system, dimana perilaku diamati, digolongkan kedalam kategori
tertentu untuk membuat rekaman tentang perilaku yang telah ditentukan
dalam waktu yang telah ditentukan.
4. Test
a. Multiple choice test (tes pilihan ganda)
b. True false (salah benar)
c. Matching (tes menjodohkan)
d. Short answers, fill in blanks (jawaban pendek, mengisi)
e. Essay tests (tes uraian)
5. Inventories
a. Open ended, yaitu responden membuat catatan tentang objek tertentu dan
item yang mereka temukan.
b. Checlist format, yaitu responden mengecek, atau menghitung dan
memberi nomor disebalh item yang terdaftar.
6. Site visits, expert reviews, panel hearings
Dalam prosedur diatas, dapat dianggap bahwa orang itu sendiri sebagai
instrumen. Instrumen bentuk ini dapat berupa :
a. Para ahli
b. Wakil konsumen
c. Anggota, karyawan
d. Publik
e. Orang tua murid, dll.
48
Hal ini langsung berhubungan dengan variabel yang telah ditentukan
sebelumnya. Konten intrumen harus dibatasi sebatas apa yang termasuk dalam
variable.
4. Pertimbangan khusus
Dalam hal ini mungkin termasuk versi khusus untuk responden yang cacat
(handicapped), yang memerlukan petunjuk khusus dan lain sebagainya. Perlu
dibuat rencana (blue print) dan kisi – kisi untuk setiap instrumen yang akan
dibuat atau mungkin memerlukan konsultasi dari teman – teman atau ahlinya.
6. Kapasitas responden
Kemampuannya, pendidikan dan penataran yang telah dilakukan sehubungan
dengan hal yang akan diukur.
49
Apabila tidak ada yang memadai untuk keperluan maka tentu harus membuat
instrumen sendiri.
Buatlah tabel kisi – kisi. Konten sesai dengan variabel yang telah ditentukan
ketepatannya, keputusan apa yang akan bergantung pada hasil pengukuran,
siapa respondennya akan menentukan bahasa yang akan dipakai. Analisisnya
bagaimana, bagaimana daya rekam instrumen, dll.
Jelaskan dasar konsep desain instrumen tentu akan dibuat asal – asalan, tetapi
memerlukan desain yang konseptual.
50
Validitas menunjukan kebenaran dan keaslian data yang dikumpulkan
instrumen. Instrumen harus mengukur apa yang harus diukur sesuai
dengan rencana.
b. Reliabilitas
51
2. Inter judge atau rater agreement, suatu penilaian harus
mencerminkan ciri – ciri objek yang dinilai, bukan perbedaan
antara pemakaian instrumen.
52
Mata Kuliah : Evaluasi Remedial
Kode Mata Kuliah : -
Topik : Gradding system ABCDE dengan sistim PAN dan PAP
Referensi
53
8. http ://blogwirabuana.wordpress.com/2011/03/16/penilaian-acuan-norma-pan-dan-
penilaian-acuan-patokan-pap.
Pendahuluan
Uraian Materi
54
A. Penskoran dan penilaian (scoring and grading)
Penskoran merupakan langkah pertama dalam proses pengolahan hasil
tes pekerjaan siswa atau mahasiswa. Penskoran adalah suatu proses perubahan
jawaban-jawaban tes menjadi angka-angka (mengadakan kuantifikasi). Sedangkan
penilaian adalah proses menentukan nilai suatu obyek dengan menggunakan
ukuran atau kriteria tertentu, seperti Baik , Sedang, Jelek.
Angka-angka hasil pensekoran itu kemudian diubah menjadi nilai-nilai
melalui proses pengolahan tertentu. Penggunaan simbol untuk menyatakan nilai-
nilai itu ada yang dengan angka, seperti angka dengan rentangan 0 – 10, 0 – 100,
atau 0 – 4, dan ada pula yang menggunakan huruf A, B, C, D, dan E.
Cara menskor hasil tes biasanya disesuaikan dengan bentuk soal-soal tes
yang dipergunakan, apakah tes objektif atau tes essay. Untuk soal-soal objektif
biasanya setiap jawaban benar diberi skor 1 (satu) dan setiap jawaban yang salah
diberi skor 0 (nol); total skor diperoleh dengan menjumlahkan skor yang
diperoleh dari semua soal.
Untuk soal-soal essay dalam penskorannya biasanya digunakan cara bobot
(weighting) kepada setiap soal menutur tingkat kesukarannya atau banyak
sedikitnya unsur yang harus terdapat dalam jawaban yang dianggap paling baik.
Misalnya: untuk soal no. 1 diberi skor maksimum 4, untuk soal no. 3 diberi skor
maksimum 6, untuk soal no. 5 skor maskimum 10, dan seterusnya.
Di lembaga-lembaga pendidikan kita, masih banyak pengajaran yang
melakukan penskoran soal essay, proses penskoran dan penilaiaan biasanya tidak
dibedakan satu sama lain; pekerjaan siswa atau mahasiswa langsung diberi nilai,
jadi bukan di skor terlebih dahulu. Oleh karena itu, hal ini sering kali
menimbulkan terjadinya halo effect, yang berarti dalam penilaiannya itu diikut
sertakan pula unsur-unsur yang relevan seperti kerapian dan ketidak rapian
tulisan, gaya bahasa, atau panjang-pendeknya jawaban sehingga cenderung
menghasilkan penilaian yang kurang andal.
55
Hasil penilaian kurang objektif. Jika tes yang berbentuk soal-soal essay
tersebut dinilai oleh lebih dari satu orang, sering kali terjadi perbedaan-perbedaan
di antara penilaian, bahkan juga hasil penilaian seseorang penilai sering kali
berbeda terhadap jawaban-jawaban yang sama dari soal tertentu. Kesalahan
seperti ini tidak akan selalu terjadi jika dalam pelaksanaannya diadakan
pemisahan antara proses penskoran dan penilaian.
56
kecermatan dan kemantapan (accuary) dan reliability; sedangkan
pada penilaian, perhatian terutama kepada validitas dan kegunaan
(validity and utility).
3. Dalam pemberian nilai hendaknya diperhatikan dua macam
orientasi, yaitu penilaian yang non – referenced dan yang criterion –
referenced.
Norm – referenced evaluation adalah penilaian yang diorientasikan
kepada suatu kelompok tertentu. Hasil evaluasi perseorangan siswa
atau mahasiswa dibandingkan dengan prestasi kelompoknya. Prestasi
kelompok menjadi patokan atau norm dalam menilai siswa secara
perorangan.
7. Kegiatan pemberian nilai hendaknya merupakan bagian integral dari
proses belajar-mengajar. Ini berarti bahwa tujuan penilaian, di
samping untuk mengetahui status siswa dan menaksirkan kemampuan
belajar serta penguasaannya terhadap bahan pelajaran, juga digunakan
sebagai feedback (umpan balik), baik kepada siswa sendiri maupun
bagi guru atau pengajar. Dari hasil tes, pengajar dapat mengetahui
kelebihan dan kelemahan siswa tertentu sehingga selanjutnya ia dapat
melakukan koreksi terhadap kesalahan yang diperbuatnya.
8. Penilaian harus bersifat komparabel. Artinya, setelah tahap
pengukuran yang menghasilkan angka-angka itu dilaksanakan,
prestasi-prestasi yang menduduki skor yang sama harus memperoleh
nilai yang sama pula. Atau, jika dilihat dari segi lain, penilaian harus
dilakukan secara adil, jangan sampai terjadi peng-anakemasan.
Penilian yang tidak adil mudah menimbulkan frustasi pada siswa dan
mahasiswa, yang selanjutnya dapat merusak perkembangan psikis
siswa dan mahasiswa sehingga pembentukan afektif dirusak
karenanya.
9. Sistem penilaian yang dipergunakan hendaknya jelas bagi siswa dan
bagi pengajar sendiri. Sumber ketidakberesan dalam penilaian
terutama adalah tidak jelasnya sistem penilaian itu sendiri bagi para
57
guru atau pengajar; apa yang dinilai serta macam skala penilaian yang
dipergunakan dan makna masing-masing skala itu.
58
dengan nilai-nilai siswa yang lain yang termasuk di dalam kelompok
itu.
59
4) Pengunaan PAN.
Berbeda dengan PAP, PAN tidak dapat digunakan untuk mengukur
kadar pencapaian tujuan dan tingkat penguasaan bahan. PAN sering
digunakan untuk fungsi prediktif, meramalkan keberhasilan
pendidikan siswa di masa mendatang atau untuk menentukan
peringkat/kedudukan siswa dalam kelompok.
5) Keunggulan PAN
Ada beberapa keunggulan yang dimiliki PAN, yaitu;
Hasil PAN dapat membuat guru bersikap positif dalam
memperlakukan siswa sebagai individu yang unik.
Hasil PAN akan merupakan informasi yang baik tentang
kedudukan siswa dalam kelompoknya.
PAN dapat digunakan untuk menyeleksi calon siswa yang dites
secara ketat.
6) Contoh PAN
Pada pelajaran bahasa Indonesia, siswa yang mendapat skor 80 di
kelas B akan mendapat nilai A, sedangkan di kelas C siswa yang
mendapat skor 65 akan mendapat nilai A juga. Mengapa bisa
demikian? karena nilai yang didapat siswa hanya dihubungkan dengan
norma kelompoknya. Pada kelas C, norma kelompoknya rendah, maka
skor 65 saja sudah mendapat nilai A, dan pada kelas B 88 norma
kelompoknya tinggi, maka skor 80 baru bisa mendapat nilai A,
sehingga skor 65 bisa bernilai Contoh lain : SPMB
60
Penilaian acuan patokan (PAP) biasanya disebut juga criterion
evaluation merupakan pengukuran yang menggunakan acuan yang
berbeda. Dalam pengukuran ini siswa dikomperasikan dengan kriteria
yang telah ditentukan terlebih dahulu dalam tujuan instruksional,
bukan dengan penampilan siswa yang lain. Keberhasilan dalam
prosedur acuan patokan tegantung pada penguasaaan materi atas
kriteria yang telah dijabarkan dalam item-item pertanyaan guna
mendukung tujuan instruksional .
Dengan PAP setiap individu dapat diketahui apa yang telah dan
belum dikuasainya. Bimbingan individual untuk meningkatkan
penguasaan siswa terhadap materi pelajaran dapat dirancang,
demikian pula untuk memantapkan apa yang telah dikuasainya dapat
dikembangkan. Guru dan setiap peserta didik (siswa) mendapat
manfaat dari adanya PAP. Melalui PAP berkembang upaya untuk
meningkatkan kualitas pembelajaran dengan melaksanakan tes
awal (pre test) dan tes akhir (post test). Perbedaan hasil tes akhir
dengan test awal merupakan petunjuk tentang kualitas proses
pembelajaran.
Pembelajaran yang menuntut pencapaian kompetensi tertentu
sebagaimana diharapkan dan termuat pada kurikulum saat ini, PAP
merupakan cara pandang yang harus diterapkan. PAP juga dapat
digunakan untuk menghindari hal-hal yang tidak diinginkan, misalnya
kurang terkontrolnya penguasaan materi, terdapat siswa yang
diuntungkan atau dirugikan, dan tidak dipenuhinya nilai-nilai
kelompok berdistribusi normal. PAP ini menggunakan prinsip belajar
tuntas (mastery learning).
2) Penggunaan PAP
PAP pada umumnya digunakan untuk menguji tingkat pe-nguasaan
bahan pelajaran.Pengujian tingkat penguasaan bahan biasanya
dilaksanakan pada pengajaran yang berori-entasi pada tujuan dan
61
strategi belajar tuntas. Oleh karena itu nilai seorang siswa yang
ditafsirkan dengan standar mutlak, sekaligus menunjukkan tingkat
penguasaan riilnya terhadap bahan pelajaran dan juga merupakan
standar pen-capaian indicator sesuai dengan standar ketuntasan
belajar.
3) Kelebihan PAP
Hasil PAP merupakan umpan balik yang dapat diguna-kan
guru sebagai introspeksi tentang program pembelajaran yang
telah dilaksanakan.
Hasil PAP dapat membantu guru dalam pengambilan
keputusan tentang perlu atau tidaknya penyajian ulang
topik/materi tertentu.
Hasil PAP dapat pula membantu guru merancang pelak-
sanaan program remidi.
4) Contoh PAP
Contoh, untuk dapat diterima sebagai calon penerbang setiap calon
harus memenuhi syarat antara lain tinggi badan sekurang-kurangnya
170 cm. Berdasarkan kriteria tersebut, maka siapapun yang tidak
memenuhi syarat akan dinyatakan gagal dan tidak diterima. Contoh
lain yaitu UTS, UAS, UNAS.
62
Penilaian Acuan Norma dan Penilaian Acuan Patokan mempunyai beberapa
persamaan sebagai berikut:
1) Penilaian acuan norma dan acuan patokan memerlukan adanya tujuan
evaluasi spesifik sebagai penentuan fokus item yang diperlukan. Tujuan
tersebut termasuk tujuan intruksional umum dan tujuan intruksional
khusus
2) Kedua pengukuran memerlukan sample yang relevan, digunakan
sebagai subjek yang hendak dijadikan sasaran evaluasi. Sample yang
diukur mempresentasikan populasi siwa yang hendak menjadi target
akhir pengambilan keputusan.
3) Untuk mandapatkan informasi yang diinginkan tenyang siswa, kedua
pengukuran sama-sama nenerlukan item-item yang disusun dalam satu
tes dengan menggunakan aturan dasar penulisan instrument.
4) Keduanya mempersyaratkan perumusan secara spesifik perilaku yang
akan diukur.
5) Keduanya menggunakan macam tes yang sama seperti tes subjektif, tes
karangan, tes penampilan atau keterampilan.
6) Keduanya dinilai kualitasnya dari segi validitas dan reliabilitasnya.
7) Keduanya digunakan ke dalam pendidikan walaupun untuk maksud
yang berbeda.
63
3) Penilaian acuan norma lebih mementingkan butir-butir tes yang
mempunyai tingkat kesulitan sedang dan biasanya membuang tes yang
terlalu mudah dan terlalu sulit. Penilaian acuan patokan mementingkan
butir-butir tes yang relevan dengan perilaku yang akan diukur tanpa
perduli dengan tingkat kesulitannya.
4) Penilaian acuan norma digunakan terutama untuk survey. Penilaian
acuan patokan digunakan terutama untuk penguasaan.
64
atau 50 lebih, sebaiknya digunakan table distribusi frekuensi bergolong.
Berikut ini sebuah contoh yang menggunakan table distribusi tunggal.
Misalkan seorang dosen memperoleh skor mentah dari hasil tes yang telah
diberikan kepada 20 orang mahasiswanya sebagai berikut :
73, 70, 68, 68, 67, 67, 65, 65, 63, 62
60, 59, 59, 58, 58, 56, 52, 50, 41, 40
Skor mentah itu akan diolah menjadi nilai huruf A, B, C, D, TL dengan
menggunakan M dan DS.
Skor mentah ini akan kita olah menjadi nilai A, B, C, D, TL. Untuk mencari
mean dan DS kita susun skor mentah tersebut kedalam table frekuensi.
Kelas Interval F D fd Fd2
1 96 – 105 1 +4 +4 16
2 86 – 95 6 +3 +18 54
3 76 – 85 7 +2 +14 28
4 66 – 75 10 +1 +10 10
5 56 – 65 11 0 0 0
6 46 – 55 4 -1 -4 4
7 36 – 45 5 -2 -10 20
8 26 – 35 3 -3 -9 27
9 16 - 25 3 -4 -12 48
65
50 +11 207
(N) (∑fd) (∑fd2)
Kesimpulan
66
Tugas
Studi Kasus
1. Seorang dosen meperoleh skor mentah dari dari tes yang telah diberikan
kepada 20 orang mahasiwa sebagai berikut;
73, 70, 68, 68, 67,67, 65, 65, 63, 62,
60, 59, 59, 58, 58, 56, 52, 50, 41, 40
Pertanyaan;
Hitung skor mentah dengan menentukan Mean dan Standar Devisiasi?
Ubahlah skor mentah menjadi nilai huruf A, B, C, D , E (TL) dengan
sistim PAN dan PAP?
67
HAND OUT
Referensi :
1. Purwanto, Ngalim. 2008. Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran.
Bandung : Remaja Rosdakarya
2. Arikunto, Suharsimi. 2008. Dasar-Dasar Evaluasi Pendidikan. Jakarta :
Bumi Aksara
3. Sriyati, Siti. 2012. Analisis Pokok Uji. http://file.upi.edu/Direktori/
FPMIPA/JUR._PEND._BIOLOGI/989012SITI_SRIYATI/Kumpulan_bahan_aj
ar_evaluasi_pembelajaran_%283%29/ANALISIS_POKOK_UJI_
%5BCompatibility_Mode%5D.pdf. Diunduh 19 Maret 2013
PENDAHULUAN
68
Salah satu komponen yang menjadi sasaran peningkatan kualitas pendidikan
adalah sistem pembelajaran di kelas. Proses pembelajaran ini merupakan
tanggungjawab guru dalam mengembangkan segala potensi yang ada pada siswa.
Tujuan pokok proses pembelajaran adalah untuk mengubah tingkah laku siswa
berdasarkan tujuan yang telah direncanakan dan disusun oleh guru sebelum proses
kegiatan pembelajaran berlangsung. Perubahan tingkah laku itu mencakup aspek
intelektual. 1
Ketika proses pembelajaran dipandang sebagai proses perubahan tingkah laku
siswa, peran penilaian dalam proses pembelajaran menjadi sangat penting. Penilaian
dalam proses pembelajaran merupakan suatu proses untuk mengumpulkan,
menganalisa dan menginterpretasi informasi untuk mengetahui tingkat pencapaian
tujuan pembelajaran.
Sebagai bagian yang sangat penting dari sebuah proses pembelajaran, penilaian
dalam proses pembelajaran hendaknya dirancang dan dilaksanakan oleh guru. Dengan
melakukan penilaian ketika melaksanakan proses pembelajaran, guru akan dapat
mengetahui tingkat keberhasilan proses pembelajaran dan akan memperoleh bahan
masukan untuk menentukan langkah selanjutnya. Dengan demikian, keefektifan suatu
proses pembelajaran banyak ditentukan oleh peran penilaian dalam proses
pembelajaran itu sendiri. Furqon (1999) menyatakan bahwa penilaian sebagai salah
satu komponen utama proses pembelajaran harus dipahami, direncanakan dan
dilaksanakan dalam upaya mendukung keberhasilan peningkatan mutu proses
pembelajaran. Mengingat hal tersebut, perlu dilakukan penilaian dalam proses
pembelajaran secara terus menerus dan berkesinambungan sebagai alat pemantau
tentang keefektifan proses belajar serta kemampuan siswa belajar.3
Penilaian dalam proses pembelajaran merupakan bagian penting dari proses
pembelajaran, karena itu hendaknya dilakukan oleh guru agar dapat memperoleh
informasi proses kemajuan belajar siswa dan informasi keefektifan pembelajaran yang
sedang berlangsung. Guru yang hanya mengutamakan penilaian hasil tidak akan
mendapatkan informasi yang akurat tentang siswa yang benar-benar memahami materi
dan siswa yang kurang memahami. Siswa yang dapat menjawab dengan benar suatu
persoalan, belum tentu mengetahui bagaimana mendapatkan jawaban tersebut.
69
Penilaian dalam proses pembelajaran lebih dapat berfungsi memberikan informasi
tentang siswa yang sudah memahami materi atau yang belum.
Penilaian ini berkesinambungan dengan penilaian hasil artinya hasil penilaian
dalam proses pembelajaran akan memberikan sumbangan positif terhadap penilaian
hasil. Dengan demikian perlu diupayakan agar guru melakukan penilaian dalam proses
pembelajaran di samping melakukan penilaian hasil belajar.3
URAIAN MATERI
70
Jadi, tujuan khusus dari items analysis ialah mencari soal tes mana yang baik
mana yang baik dan mana yang tidak baik, dan mengapa item atau soal tes mana yang
baik dan mana yang tidak baik. Dengan mengetahui soal-soal yang tidak baik itu
selanjutnya kita dapat mencari kemungkinan sebab-sebab mengapa item itu tidak baik.2
Dengan membuat analisis soal, sedikitnya kita dapat mengetahui tiga hal penting
yang kita peroleh dari setiap soal, yaitu:
a. Sampai di mana tingkat atau taraf kesukaran soal itu (difficulty level of an item);
b. Apakah soal itu mempunyai daya pembeda (discriminating power) sehingga dapat
membedakan kelompok siswa yang pandai dengan kelompok siswa yang bodoh;
c. Apakah semua alternatif jawaban (options) menarik jawaban-jawaban, ataukah
ada yang demikian ridak menarik sehingga tidak perlu dimasukkan kedalam soal.
TK = U+L
T
Keterangan:
TK : indeks TK atau tingkat/taraf kesukaran yang dicari
U : jumlah siswayang termasuk kelompok pandai (upper group) yang
menjawab benar untuk tiap soal
L : jumlah siswa yang termasuk kelompok kurang (lower group) yang
menjawab benar untuk setiap soal
T : jumlah siswa dari kelompok pandai dan kelompok kurang (jumlah upper
group dan lower group)
Klasifikasi indeks kesukaran
0,0 ---------------------------- 1,0
71
sukar mudah
2. Daya Pembeda
Daya pembeda soal, adalah kemampuan sesuatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh
(berkemampuan rendah).
Daya pembeda suatu soal tes dapat dihitung dengan menggunakan rumus
seperti berikut :
DP = U-L
⅟2 T
Keterangan :
DP : indeks DP atau daya pembeda yang dicari
U : jumlah siswayang termasuk kelompok pandai (upper group) yang
menjawab benar untuk tiap soal
L : jumlah siswa yang termasuk kelompok kurang (lower group) yang
menjawab benar untuk setiap soal
T : jumlah siswa dari kelompok pandai dan kelompok kurang (jumlah upper
group dan lower group)
72
b. Untuk soal yang berbentuk pilihan ganda (multiple choice):
Untuk pilihan ganda dengan option 3, jika tingkat kesukarannya sama atau
lebih kecil dari 0,21, dikategorikan soal yang sukar; sedangkan jika tingkat
kesukarannya sama atau lebih besar dari 0,79, dikategorikan soal yang
mudah.
Untuk pilihan ganda dengan option 4, jika tingkat kesukarannya sama atau
lebih kecil dari 0,24, dikategorikan soal yang sukar; sedangkan jika tingkat
kesukarannya sama atau lebih besar dari 0,76, dikategorikan soal yang
mudah.
c. Jika daya pembeda soal itu adalah 0 (nol) atau negatif (minus), maka soal itu perlu
direvisi / diperbaiki. Dengan melihat kriteria pada a dan b tersebut diatas dapat
disimpulkan makin tinggi nilai TK suatu soal, makin mudah soal tersebut dan
makin rendah TK suatu soal maka makin sukar soal tersebut.
73
1. Penyebar agama Islam yang mula-mula di Jawa Barat ialah:
Upper Lower
A. Sultan Hasanuddin 0 2
B. Fatahillah 25 20
C. Untung Surapati 0 2
D. Sunan Kalijaga 0 1
Dikosongkan 0 0
Interprestasi :
Soal ini mudah karena semua (25) orang dari kelompok upper group dan 20 orang
dari lower group dapat menjawab soal itu dengan benar. Namun, soal ini termasuk
baik karena dapat membedakan arah yang diinginkan ternyata jawabn-jawaban
yang salah terdapat pada kelompok lower group. Dua atau tiga soal semacam ini
baik digunakan sebagai permulaan tes.
74
Soal no.3 mendapat hasil sebagai berikut:
3) maksud perintah mengadakan ikatan dinas bagi siswa-siswa SPG ialah:
Upper Lower
a. untuk menarik para lulusan
SLP agar mau masuk ke
Sekolah guru. 15 6
b. membatasi lulusan SPG yang
akan melanjutkan pelajarannya
kesekolah yang lebih tinggi. 4 6
c. membantu paravsiswa yang
kurang mampu dalam melanjutkan
pelajarannya. 2 6
d. karena yang masuk SPG kebanyakan
anak-anak orang yang miskin. 4 7
Dikosongkan 0 0
Interprestasi :
Soal ini tidak baik karena: Pertama, soal itu terlalu sukar, hanya 8 dari 50, atau 16% saja
dari murid, yang dapat menjawab benar. Kedua, soal tersebut kurang mempunyai daya
pembeda (discriminating power) ternyata dari jawaban yang benar itu banyak terdapata
lower group, dan bukan pada upper group.
Dalam hal ini ada dua keterangan yang mungkin untuk data analisis soal tersebut: 1)
soal tersebut bersifat ambigous (mempunyai dua arti), terutama bagi siswa-siswa yang
mngetahui banyak tentang hal yang ditanyakan, atau (2) para siswa belum pernah
mempelajari hal-hal seperti yang ditanyakam.
75
Sumatera, tetapi di Pulau Sulawesi dan Bali. Maka untuk menggantinya sebaiknya
dicarikan nama danau lain yang ada di Pulau Sumatera, misalnya Danau Ranau dan
Danau Maninjau.
P = R
X 100
T
Keterangan :
P = presentase yang menjawab item itu benar
R = jumlah yang menjawab item itu benar
T = jumlah total (siswa) yang mencoba menjawab item itu.
76
6. Taksirlah daya pembeda (discriminating power) item itu dengan membandingkan
jumlah siswa dalam upper group yang menjawab item dengan benar. 1
Keterangan :
DP = daya pembeda atau discriminating power yang dicari
U = jumlah jawaban yang benar dari upper-group
L = jumlah jawaban yang benar dari lower-group
⅟2 T = setengah dari jumlah upper dan lower-group
S= R A - RB
T
77
Keterangan :
S = sensitivitas keberhasilan yang dicari
RA = jumlah siswa yang menjawab benar item itu sesudah pengajaran
RB = jumlah siswa yang menjawab benar item itu sebelum pengajaran
T = jumlah total jawaban item itu yang benar kedua-duanya, sebelum dan sesudah
pengajaran.
LATIHAN SISWA
HAND OUT
78
OBJEKTIF PRILAKU MAHASISWA
Setelah topik ini dibahas, mahasiswa mampu :
1. Menjelaskan kembali tentang penilaian dan kaitannya dengan ujian secara tepat.
2. Menjelaskan penilaian yang dapat dilakukan dalam ujian secara tepat
3. Menyebutkan dan menjelaskan syarat dari suatu alat ujian dengan benar.
4. Menjelaskan kemungkinan penggunaan pada alat ujian dengan benar
5. Menyebutkan syarat mutu suatu alat ujian dengan benar
6. Menyebutkan dan menjelaskan jenis-jenis alat ujian dengan tepat
7. Menjelaskan fungsi tes dan hal-hal lain yang perlu diperhatikan dengan tepat
8. Menjelaskan dalam bentuk bagan mengenai perbandingan tes dengan benar
9. Menjelaskan langkah-langkah penyusunan tes dengan tepat
10. Menjelaskan komponen-komponen yang terdapat dalam tes dengan benar
Referensi :
Penulis . Evaluasi Pembelajaran Prinsip-Teknik-Prosedur. 117-173
Toto Fathoni, Strategi Belajar Mengajar, Universitas Pendidikan Indonesia, 2004
Dasar-dasar Evaluasi Pendidikan
Mengajar dengan Sukses
Penilaian
Evaluasi di bidang pendidikan adalah cara untuk mengetahui sejauh mana sasaran
belajar suatu pembelajaran atau rangkaian pelajaran dapat tercapai. Sebelum
pembelajaran dimulai pengajar telah menentukan hal-hal yang harus diketahui dan dapat
dikerjakan oleh murid. Dan sesudah kursus selesai diberikan pengajar mengadakan
penelitian, apakah hal-hal yang ditentukan itu dapat tercapai. Inilah yang disebut
penilaian.
Penilaian memberi informasi tentang hasil pelajaran yang telah disajikan. Alat
untuk mengevaluasi disebut dengan tes, yang dipakai untuk menilai hasil belajar murid
79
dan hasil mengajar dari pengajar. Sedangkan yang dimaksud dengan ujian adalah
pelaksanaan penilaian hasil belajar murid. Tes sebagai alat untuk mengunakan penilaian
atau sebagai alat ujian. Tes dapat dipakai dalam berbagai macam pelaksanaan penilaian,
antara lain dalam setiap macam ulangan, tentamen, eksamen, dan lain-lainnya yang
semacam.
Alat ujian penting untuk menelaah hal-hal yang terjadi berhubungan dengan tujuan
operasional. Tetapi disamping itu alat ujian juga perlu untuk meningkatkan proses belajar.
80
Penilaian Formatif Penilaian Formatif Penilaian Akhir
81
meneliti perbandingan antara hasil yang dicapai oleh kelompok yang satu dengan
hasil yang dicapai oleh kelompok yang lain.
82
b. Ujian tertutup, yaitu jenis jawaban telah disediakan sehingga murid tinggal
memilih jawaban yang sudah disediakan. Ciri terpenting dari jenis ujian tertutup
adalah segi obyektifnya.
- Ujian salah benar, yaitu murid harus menyatakan apakah suatu pernyataan itu
salah atau benar
- Ujian pilihan berganda, yaitu ujian yang disediakan beberapa kemungkinan
jawabannya. Murid harus memilih salah satu yang dianggap benar dari
beberapa kemungkinan jawaban yang disediakan.
- Ujian menjodohkan, yaitu terdiri dari dua baris pengertian atau kalimat. Setiap
baris dari jalur pertama harus dicari jodohnya yang paling tepat dijalur kedua.
Fungsi Tes
Setiap kali akan memberikan tes, kebanyakan guru selalu bertanya kepada dirinya
sendiri:
Pertanyaan apakan yang akan saya berikan?
Jawaban apakah yang akan saya perlukan?
Untuk dapat menjawab pertanyaan-pertanyaan tersebut, guru harus selalu ingat akan
fungsi tes. Sehubungan denganhal-hal yang harus diingat pada waktu penyusunan tes,
maka fungsi tes dapat ditinjau dari 3 hal:
1) Fungsi untuk kelas
2) Fungsi untuk bimbingan
3) Fungsi untuk administrasi
Selain fungsi-fungsi tes ini, hal lain yang harus diingat adalah:
1) Hubungan dengan penggunaan
Diatas telah disajikan fungsi tes. Waktu menyusun tes, dalam hati harus
selalu diingat, fungsi mana yang saat ini dipentingkan karena fungsi yang berbeda
akan menentukan bentuk/isi tes yang berbeda pula.
83
2) Komprehensif
Sebuah tes sebaiknya mencakup suatu kebulatan, artinya meliputi berbagai
aspek yang dapat menggambarkan keadaan siswa secara keseluruhan (kecerdasan,
sikap, pribadi, perasaan sosial, dan sebagainya). Hal ini dapat dicapai apabila tes
itu merupakan rangkaian tes, misalnya dari kelas I sampai dengan kelas VI.
3) Kontinuitas
Berhubungan dengan prinsip komprehensif, maka prinsip kontinuitas
mempunyai persamaan tujuan. Sebaiknya tes disusun sedemikian rupa sehingga
menggambarkan kelanjutan dari awal anak memasuki suatu sekolah sampai dengan
kelas berakhir. Dengan demikian akan diketahui perkembangan anak itu dengan
terputus.
84
secara perseorangan.
f. Menentukan siswa
mana yang
memerlukan
bimbingan khusus.
g. Menentukan tingkat
pencapaian untuk
setiap anak.
85
Pertanyaan pemahaman biasanya menggunakan kata-kata perbedaan,
perbandingan, menduga, menggeneralisasikan, memberikan contoh, menuliskan
kembali, memperkirakan.
c. Soal aplikasi
Soal aplikasi adalah soal yang mengukur kemampuan siswa dalam
mengaplikasikan (menerapkan) pengetahuan untuk memecahkan masalah sehari-
hari atau persoalan yang dikemukakan oleh pembuat soal.
Kata-kata yang digunakan dalam soal aplikasi, atau kemampuan yang dituntut
antara lain, mengubah, menghitung, mendemontrasikan, menemukan,
memanipulasikan, menmodifikasikan, menghubungkan, menunjukkan,
menggunakan.
d. Soal analisis
Soal analisis adalah soal yang menuntut kemampuan siswa untuk menganalisis
atau menguraikan sesuatu persoalan untuk diketahui bagian-bagiannya. Dalam
hierarki taksonomi, analsis lebih tinggi dari aplikasi. Oleh karena itu soal analisis
harus dimulai dengan kasus yang dikarang sendiri oleh guru, bukan mengambil
uraiandari buku atau catatn pelajaran.
Kata-kata yang digunakan atau kemampuan yang dituntut antara lain meliputi :
merinci, menyusun diagram, membedakan, mengilustrasikan, menyimpulkan,
memilih, memisahkan, membagi.
e. Soal sintesis
Sebagai kebalikan kemampuan untuk menganalisis adalah kemampuan untuk
mengadakan sisntesis. Oleh karena itu soal sistesis juga harus dimulai dengan
sebuah kasus. Berdasarkan penelaahan kasus tersebut siswa diminta untuk
mengdakan sintesis, yaitu menyimpulkan, mengkategorikan, mengkombinasikan,
mengarang, membuat desain, mengorganisasikan, menghubungkan, menulis
kembali, membuat rencana, menyusun, menciptakan.
f. Soal evaluasi
Soal evaluasi adalah soal yang berhubungan dengan menilai, mengmbil
kesimpulan, membandingkan, mempertentangkan, mengkritik, mendeskripsikan,
membedakan, menerangkan, memutuskan, menafsirkan.
86
Komponen-komponen tes
a. Buku tes
Yakni lembaran atau buku yang memuat butir-butir soal yang harus dikerjakan
oleh siswa.
b. Lembar jawaban tes
Lembaran yang disediakan oleh penilaian bagi teste untuk mengerjakan tes. Untuk
soal pilihan ganda biasanya dibuat lembaran nomor dan huruf a, b, c, d, menurut
banyaknya alternatif yang disediakan.
c. Kunci jawaban tes
Berisi jawaban-jawaban yang dikehendaki. Ide dari kunci jawaban ini adalah agar:
- Pemeriksaan tes dapat dilakukan oleh orang lain.
- Pemeriksaannya betul.
- Dilakukan dengan mudah.
- Sesedikit mungkin masuknya unsur subjektif.
d. Pedoman penilaian
Pedoman penilaian atau pedoman skoring berisi keterangan perincian tentang skor
atau angka yang diberikan kepada siswa bagi soal-soal yang telah dikerjakan.
Tugas perkelompok.
2. Apa yang anda ketahui tentang penilaian dan kaitannya dengan ujian?
3. Jelaskan hal apa saja yang dapat dinilai dalam ujian!
4. Apa syarat yang harus dipenuhi oleh suatu alat ujian?
5. Jelaskan kemungkinan penggunaan alat ujian!
6. Sebutkan syarat mutu alat ujian!
7. Sebut dan jelaskan jenis alat ujian!
8. Jelaskan fungsi tes dan hal-hal yang perlu diingat!
9. Buatlah bagan mengenai perbandingan fungsi test!
10. Jelaskan langkah-langkah penyusunan test!
11. Jelaskan komponen-komponen test!
STUDI KASUS
87
Perguruan tinggi X merupakan salah satu perguruan tinggi baru yang dalam masa
mempersiapkan ujian akhir para mahasiswanya. Perguruan tinggi tersebut hanya memiliki
beberapa bank soal yang terbatas, untuk itu para dosen ataupun pengajar bersepakat untuk
mengadakan sosialisasi mengenai persiapan pembuatan tes untuk ujian.
Pertanyaan :
1. Apa yang anda ketahui tentang penilaian dan kaitannya dengan ujian?
2. Jelaskan hal apa saja yang dapat dinilai dalam ujian!
3. Apa syarat yang harus dipenuhi oleh suatu alat ujian?
4. Jelaskan kemungkinan penggunaan alat ujian!
5. Sebutkan syarat mutu alat ujian!
6. Sebut dan jelaskan jenis alat ujian!
7. Jelaskan fungsi tes dan hal-hal yang perlu diingat!
8. Buatlah bagan mengenai perbandingan fungsi test!
9. Jelaskan langkah-langkah penyusunan test!
10. Jelaskan komponen-komponen test!
88
HAND OUT
Referensi:
1. Yanti & Pertiwi, H.W. (2008). OSCA (Objective Structure Clinical Assessment)
Panduan Praktis Menghadapi UAP D III Kebidanan. Jogjakarta : Mitra Cendikia
Press
2. http://reproduksiumj.blogspot.com/2012/03/osce.html
PENDAHULUAN
Didalam dunia pendidikan, berhasil atau tidaknya peserta didik dapat dinilai dengan
cara melakukan evaluasi pelajaran yang telah diterima peserta didik selama masa
89
pendidikan. Pada mahasiswa Diploma III Kebidanan, sebelum mereka dinyatakan lulus
dan menjadi bidan, mereka akan melaksanakan suatu ujian akhir yang dikenal dengan
nama Ujian Akhir Program (UAP). UAP dilaksanakan dengan metode uji Objective
Structured Clinical Assesment (OSCA) yang mana metode ini merupakan suatu model uji
dimana perbedaan dengan model uji lain adalah pada tekhnik ujian dan cara menilai,
bukan pada materi uji, karena materi uji tetap berdasar kurikulum pendidikan D-III dan
pengalaman selama di klinik.
Tujuan penilaian dengan menggunakan OSCA adalah untuk mengevaluasi
kompetensi professional tenaga kesehatan yang mencakup evaluasi pengetahuan,
keterampilan komunikasi, keterampilan pemeriksaan fisik, keterampilan dalam
mengintepretasikan dan menganalisa hasil pemeriksaan diagnostik, keterampilan dalam
membuat diagnosis, menilai perilaku dan hubungan interpersonal. Oleh karena itu, OSCA
sangat penting sekali untuk dipelajari karena OSCA ini merupakan penilaian yang sangat
cocok untuk mengevaluasi kompetensi calon bidan, dan sangat bermanfaat bagi dosen
kebidanan.
Dalam hand out ini, mahasiswa akan mempelajari pengertian, keunggulan,
kekurangan, teknik uji, perencanaan penyusunan soal serta penilaian OSCA, sehingga
dapat memudahkan mahasiswa untuk menerapkan sistem penilaian dengan tekhnik
OSCA pada saat menjadi dosen nantinya.
MATERI
Explanation
A. Pengertian OSCA/OSCE
OSCA atau kependekan dari Objective Structured Clinical Assesment,
sebenarnya hanyalah suatu model uji dimana perbedaan dengan model uji lain adalah
pada tekhnik ujian dan cara menilai, bukan pada materi uji, karena materi uji tetap
berdasar kurikulum pendidikan D-III dan pengalaman selama di klinik (Yanti &
Pertiwi, 2008 : 5).
90
OSCA atau ada yang menyebut OSCE (Objective Structured Clinical
Examination) adalah alat uji yang digunakan untuk mengevaluasi kompetensi
professional tenaga kesehatan yang mencakup evaluasi pengetahuan, keterampilan
komunikasi, keterampilan pemeriksaan fisik, keterampilan dalam mengintepretasikan
dan menganalisa hasil pemeriksaan diagnostik, keterampilan dalam membuat
diagnosis, menilai perilaku dan hubungan interpersonal (Yanti & Pertiwi, 2008 : 5).
OSCA bisa terdiri dari 15-20 stasi, masing-masing stasi dibutuhkan waktu 5-30
menit, stasi secara umum dibagi dalam 2 kelompok yaitu:
1. Stasi prosedur (skill), untuk menilai kemampuan menjalankan tugas yang
diberikan terkait dengan keterampilan serta perilaku selama menjalankan tugas.
Stasi ini diobservasi dan dinilai oleh penguji diam (observer) yang melakukan
penilaian atas dasar checklist yang sudah disusun sebelumnya. Checklist terdiri
atas :
a. Content atau isi kegiatan yang harus dilakukan
b. Sikap yang ditunjukan dan perilaku yang dilakukan selama kegiatan
c. Tehnik yaitu hal-hal yang berkaitan dengan bagaimana prosedur kerja
dilaksanakan.
Setiap butir dalam checklist tersebut harus diberi skor, sesuai dengan
pentingnya kedudukan butir tersebut, dan perlu disepakati bersama diantara para
pakar penyusun soal OSCA.
91
pada stasi skill setiap peserta diobservasi dengan orang yang sama sehingga
mempunyai standar yang sama.
2. Structured berarti bahwa pada uji ini terdapat struktur yang konsisten mencakup
aspek pengetahuan, keterampilan dan sikap prilaku.
3. Clinical Assessment berarti bahwa materi uji adalah keterampilan atau
pengetahuan yang terkait dengan pasien (klinis) maupun penatalaksanaan kasus.
Sehinggga dari kata OSCA tersebut peserta akan dinilai secara objektif, tidak
ada faktor keberuntungan tentang kemampuannya memahami pengelolaan pasien.
Selain itu, uji OSCA dapat dilakukan dalam waktu sehari dengan uji dalam jumlah
yang banyak.
Mahara (1998) menyebutkan bahwa evaluasi klinik mempunyai dua fungsi
yang saling berkaitan, yaitu :
1. Fungsi pendidikan, dimana proses evaluasi seharusnya memberikan informasi
kepada mahasiswa dan dosen mengenai apakah yang dipelajari sudah sesuai
dengan apa yang diperlukan untuk meningkatkan proses belajar mengajar
2. Gatekeeping, pada fungsi ini, proses evaluasi dilakukan untuk mempertahankan
standar profesional dan melindungi publik atau masyarakat dengan penjaminan
bahwa mahasiswa mempunyai kualifikasi yang baik untuk praktek sesuai otonomi
profesi.
B. Keunggulan OSCA/OSCE
OSCA ini dipandang lebih valid, lebih reliabel dan lebih objektif dibanding
dengan ujian lisan kasus yang selama ini dipakai dalam menilai kemampuan klinis,
kemampuan komunikasi dan perilaku (Usha Nayar 1995 dalam Yanti & Pertiwi, 2008
: 8). Namun Newbel D (1998) Mengingatkan reliabilitas OSCA akan meningkat bila
jumlah stasi makin banyak.
Selain itu keuntungan OSCA adalah bisa melakukan evaluasi peserta dalam
jumlah yang banyak dalam waktu yang lebih pendek secara serentak, menguji
pengetahuan dan keterampilan yang lebih luas, dan semua peserta dievaluasi dengan
instrument serta bahan uji yang sama.
92
Keuntungan metode OSCA yang lain adalah dapat digunakan untuk menguji
berbagai kompetensi yang harus dikuasai peserta didik dalam waktu yang relative
singkat, dimana keberhasilan teruji dapat segera diketahui (Yanti & Pertiwi, 2008 : 8).
C. Kekurangan OSCA/OSCE
Adapun kekurangan dari metode OSCA yaitu penilaian hanya meliputi
pengetahuan secara umum, bukan suatu penilaian dengan pendekatan holistik dari
penanganan pasien dan dibutuhkan pengorganisasian serta persiapan penyusunan
soal-soal yang sangat membutuhkan waktu dan tenaga. Guna menghindari evaluasi
yang bersifat kompartemental beberapa stasi yang berurutan digunakan untuk
melakukan evaluasi masalah yang sama mulai dari anamnesis, pemeriksaan fisik,
komunikasi, perilaku serta interpretasi hasil pemeriksaan sehingga dapat dilakukan
secara penuh (Mittal & Sood, 1995 dalam Yanti & Pertiwi, 2008 : 8-9).
Faktor-faktor yang menyebabkan rendahnya reliabilitas OSCA antara lain
terlalu sedikit stasi atau terlalu sedikitnya waktu ujian, checklist seharusnya tidak ada
perbedaan dalam arti tidak terlalu mudah juga tidak terlalu susah, pasien yang tidak
reliabel (simulated pasien), penguji yang memberikan skor nilai dengan tidak
berpatokan pada standar penilaian, dan problem administrasi misalnya ruangan terlalu
bising, atau staf dan pelaksana yang tidak terorganisir dengan baik.
93
perlu dilatih terlebih dahulu sehingga mendekati pasien yang sesungguhnya, untuk
penguji perlu dilakukan pelatihan agar mampu melakukan tugasnya dengan benar.
Kelemahan lain dari evaluasi klinik dengan format OSCA antara lain
keterbatasan waktu setiap stasi, dan penggunaan checklist yang mengasumsikan
bahwa interaksi antara pasien/simulated pasien dengan teruji merupakan list of action,
checklist cenderung menekankan pada kecermatan atau ketelitian pada setiap
tindakan dilakukan atau tidak, dan hal ini menyebabkan kesulitan dalam penilaian
jika dilakukan tetapi tidak sempurna.
Adapun kelemahan lainnya yaitu keterbatasan pada apa yang seharusnya
disimulasikan sehingga hal ini membatasi dalam mengidentifikasi masalah pasien
seperti pada pasien yang sesungguhnya.
Dengan demikian maka diperlukan persiapan yang matang baik soal, penguji,
simulated pasien, tempat maupun petugas lain yang terlibat (Yanti & Pertiwi, 2008 :
10).
ST XIV
94
ISTRHT ST ST XII ST XI ISTRHT ST X ST IX
Keterangan gambar :
: Stasi Uji Tulis
: Istirahat
: Petunjuk Arah
1. Stasi
Stasi adalah tempat untuk mengerjakan materi uji baik yang berupa
pengetahuan atau knowledge maupun skill atau keterampilan. Jumlah stasi untuk
satu putaran uji kompetensi biasanya 15-20 stasi terdiri dari stasi ujian (skill dan
knowledge) dan stasi istirahat bila diperlukan tergantung jumlah peserta yang
akan diuji.
Sebagai contoh bila yang akan diuji dalam satu putaran ada 20 orang
sedangkan ditentukan jumlah stasi uji 15 maka 15 stasi adalah stasi uji dan 5 stasi
adalah stasi istirahat yang biasanya ditempatkan setelah stasi skill. Desain dari
stasi ini biasanya melingkar dengan tujuan agar teruji dapat melewati setiap stasi
searah jarum jam.
2. Tim Penguji
Tim penguji terdiri dari leader (ketua tim penguji), penguji skill (diam/
observer) dan penguji umum.
a. Leader/ Ketua tim penguji
Leader adalah seorang yang dipilih untuk memimpin jalannya uji
kompetensi. Adapun tugas leader secara terperinci adalah sebagai berikut
1) Membawa soal
2) Briefing dengan penguji dan teruji (bila memungkinkan briefing dilakukan
sehari sebelum ujian)
3) Melihat persiapan alat
95
4) Sebelum ujian dimulai briefing dengan simulated pasien
5) Membagikan nomor ujian
6) Mengundi penempatan stasi
7) Mengawasi proses ujian (dapat menggantikan menjadi penguji skill atau
keterampilan apabila penguji skill meninggalkan tempat ujian, atau
berhalangan datang karena ada sesuatu hal)
8) Mengawasi dan melakukan koreksi serta membantu proses yudisium
ditempat
9) Mengumpulkan soal-soal yang telah diujikan dan diserahkan kembali ke
dinkes propinsi
b. Penguji skill
Penguji skill adalah orang yang bertugas di stasi skill untuk melakukan
penilaian terhadap teruji pada saat teruji mendemonstrasikan kemampuan
psikomotornya dengan mengisi
checklist dari skill yang diujikan secara terperinci. Tugas dari penguji skill
adalah sebagai berikut:
1) Membantu leader dalam proses persiapan ujian
2) Melaksanakan penilaian pada stasi keterampilan
3) Sebagai penguji skill atau keterampilan harus benar-benar mematuhi
ketentuan sebagai penguji diam, tidak boleh berbicara atau mengajukan
pertanyaan kepada teruji atau simulated pasien.
c. Penguji umum
Penguji umum adalah orang yang bertugas mengawasi teruji pada stasi
knowledge atau menggantikan penguji diam pada stasi skill bila dibutuhkan.
3. Simulated pasien
Merupakan orang yang telah dilatih agar menjadi pasien seperti yang
sesungguhnya. Tugas stimulated pasien adalah memerankan pasien seperti yang
diminta dari soal yang biasanya berbentuk kasus. Namun validitas interaksi
dengan pasien lebih tinggi dibanding dengan simulated pasien.
96
4. Fasilitator
Fasilitator mempunyai tugas membantu menyiapkan alat dan bahan yang
diperlukan untuk mendemonstrasikan suatu soal berupa kasus yang akan
dikerjakan oleh teruji serta membantu menyediakan apa yang diperlukan penguji
selama proses ujian berlangsung.
5. Timer atau pengatur waktu
Timer adalah orang yang bertugas mengatur pergantian waktu yang
diperlukan untuk perpindahan teruji dari stasi satu ke stasi berikutnya dengan
membunyikan bel bila waktu untuk mengerjakan soal telah habis, sehingga
serentak teruji akan meninggalkan stasinya dan berpindah ke stasi berikutnya
searah jarum jam.
6. Pengolah nilai
Pengolah nilai biasanya difasilitasi sebuah komputer umtuk memasukan
nilai dari lembar jawab teruji yang telah selesai mengerjakan soal pada stasi yang
telah dilewati. Dalam hal ini sudah disiapkan format
baku yang sudah ditentukan dari pihak penyelenggara ujian sehingga disini akan
langsung terumuskan apakah teruji lulus apa tidak lulus pada stasi tersebut. Perlu
diketahui bahwa kelulusan dalam uji kompetensi OSCA ini ditentukan bukan
berdasarkan nilai total dari seluruh stasi yang diujikan, melainkan kelulusan dari
masing-masing stasi. Bila pada salah satu stasi, teruji tidak lulus berdasarkan nilai
batas lulus yang sudah ditentukan maka yang bersangkutan tetap dinyatakan tidak
lulus meskipun secara keseluruhan nilai totalnya bagus.
7. Petugas kebersihan
Selain petugas-petugas diatas juga diperlukan petugas kebersihan yang tidak
kalah pentingnya guna menjamin penciptaan suasana bersih dan nyaman selama
proses ujian berlangsung. Misalnya saja mengelap atau mengeringkan daerah
basah setelah terpakai teruji satu agar teruji berikutnya dapat langsung
menggunakan tempat tersebut.
8. Waktu ujian
97
Untuk mengerjakan soal disetiap stasi diperlukan waktu 10-15 menit
tergantung dari tingkat kesulitan soal. Waktu dari setiap stasi harus sama sehingga
dari keseluruhan teruji dapat melewati masing-masing stasi secara bergantian
sehingga proses ujian dapat berjalan secara lancar. Hal ini akan diatur oleh timer
dengan membunyikan bel untuk setiap pergantian stasi (Yanti & Pertiwi, 2008 :
16).
98
F. Penilaian OSCA/OSCE
1. Penilaian ujian
a. Ruang lingkup penilaian meliputi unsur pengetahuan, keterampilan dan sikap
dengan menggunakan metode OSCA yang dituangkan dalam 15 stasi, terdiri
dari 11 stasi uji tulis, dan 4 stasi uji keterampilan atau penampilan klinik
b. Penilaian dilakukan dengan menggabungkan nilai seluruh aspek pengetahuan,
keterampilan dan sikap (PKS) dengan nilai batas lulus uji tertulis adalah 60
dari setiap stasi dan uji keterampilan (skill) termasuk sikap adalah 70 dari
setiap stasi, kemudian di rerata (jumlah nilai dibagi 15)
2. Uji ulang OSCA hanya diberikan kesempatan dua kali, bila belum berhasil maka
dapat diikutkan pada periode UAP yang terdekat pada stasi yang belum lulus.
3. Bagi yang mengikuti uji ulang I, nilai yang diambil adalah nilai yang terbaik
dengan ketentuan dua tingkat diatas nilai ujian utama
4. Bagi yang mengikuti uji ulang II nilai yang diambil adalah nilai batas lulus.
5. Uji perbaikan, nilai yang diambil adalah nilai yang terbaik (Yanti & Pertiwi,
2008 : 42).
Activity
1. Jelaskan defenisi dari OSCA/OSCE dengan benar !
2. Jelaskan keunggulan OSCA/OSCE!
3. Jelaskan kekurangan OSCA/OSCE!
4. Jelaskan tekhnik OSCA/OSCE dengan benar !
5. Jelaskan secara sistematis perencanaan penyusunan soal OSCA/OSCE
6. Jelaskan tentang penilaian OSCA/OSCE dengan benar!
Summary
1. OSCA/OSCE adalah alat uji yang digunakan untuk mengevaluasi kompetensi
professional tenaga kesehatan yang meliputi aspek pengetahuan dan skill.
99
2. Teknik OSCA/OSCE lebih valid, reliable, dan lebih objektif, dapat melakukan test
yang banyak dalam waktu yang singkat dengan hasil yang bisa segera diketahui.
3. Penilaian OSCA/OSCE hanya menilai pengetahuan secara umum dan mahasiswa
belum tentu menguasai setiap stasi yang diujikan.
4. Tehnik OSCA/OSCE merupakan bentuk test yang fleksibel berdasarkan pada pasien
disetiap stasi
5. Perencanaan Penyusunan Soal OSCA/OSCE, meliputi stasi pengetahuan dan stasi
keterampilan
6. Penilaian OSCA/OSCE terdiri dari :
a. Penilaian ujian
b. Uji ulang OSCA hanya diberikan kesempatan dua kali
c. Uji perbaikan, nilai yang diambil adalah nilai yang terbaik
KESIMPULAN
100
3. Kekurangan OSCA/OSCE meliputi :
a. Penilaian hanya meliputi pengetahuan secara umum
b. Persiapan penyusunan soal-soal yang sangat membutuhkan waktu dan tenaga.
c. Ruangan terlalu bising, atau staf dan pelaksana yang tidak terorganisir dengan
baik.
d. Perlunya pertimbangan yang meliputi :
1) Apakah problem pasien relevan dan penting sesuai dengan kurikulum
2) Apakah setiap stasi mampu mengevaluasi keterampilan yang telah diajarkan
pada mahasiswa
3) Sudahkah dilakukan review untuk setiap stasi oleh seorang yang dipandang
ahli.
e. Memerlukan biaya yang sangat besar
f. Keterbatasan waktu setiap stasi
ST XIV
Tekhnik uji OSCA/OSCE terdiri dari stasi, tim penguji, simulated pasien, fasilitator,
timer atau pengatur waktu, pengolah nilai, petugas kebersihan, waktu ujian
5. Perencanaan Penyusunan Soal OSCA/OSCE, meliputi : stasi pengetahuan dan stasi
keterampilan
6. Penilaian OSCA/OSCE terdiri dari :
101
d. Penilaian ujian
e. Uji ulang OSCA hanya diberikan kesempatan dua kali
f. Uji perbaikan, nilai yang diambil adalah nilai yang terbaik
LATIHAN SISWA
102
Mata Kuliah : Evaluasi Remedial
Kode MK :
Topik : OSCE (Objective Stucture Clinical Examination)
Sub Topik : OSCEItem Development
Waktu : 40 menit
Dosen : Ima Salamah, AM.Keb
Dea Riyani Sasmita, AM.Keb
Febiyanti, AM.Keb
Siti Fatimah, AM.Keb
TUJUAN PEMBELAJARAN :
Setelah membaca hand out ini, mahasiswa mampu:
1. Tanpa melihat buku catatan, Mahasiswa dapat menyebutkan hal-hal yang
perlu disiapkan dalam penyusunan soal UAP OSCA D III Kebidanan dalam
Penyusunan perencanaan soal OSCE (pengetahuan dan keterampilan)
dengan benar
2. Tanpa melihat buku catatan, Mahasiswa dapat menyebutkan proporsi
bahan uji dalam metode OSCE harus mengacu pada 9 standar Kompetensi
minimal bidan dengan tepat
3. Tanpa melihat buku catatan, Mahasiswa dapat menjelaskan Matrik soal
OSCE dilihat dari jumlah stasi, kompetensi dalam Blue Print sesuai
penjelasan yang telah diberikan
4. Tanpa melihat buku catatan, Mahasiswa dapat menyebutkan beberapa
pedoman umum dalam pembuatan kontruksi MCQ dengan tepat
5. Tanpa melihat buku catatan , mahasiswa dapat menjelaskan mengenai
stuktur MCQ dengan benar
6. Dengan petunjuk yang telah diberikan, Mahasiswa dapat membuat 5 soal
MCQ (sesuai dengan struktur MCQ) untuk stasi pengetahuan dengan benar
103
REFERENSI :
1. Yanti, SST dan Herdini Widyaning Pertiwi S.SiT, 2008, OSCA panduan Praktis
menghadapi UAP DIII Kebidanan, Yogyakarta, Mitra Cendikia
2. Titik Sapartinah, SSiT., S.Kep.,MKes dkk, 2012, Kumpulan SOAL Pengetahuan
dalam ujian Metode OSCA , Jakarta, Kencana Prenada Media Group
3. Kemenkes, 2011, Panduan persiapan dan penyelengggaraan CBT Tenaga
Kesehatan Indonesia, Jakarta, HPEQ Project,
4. Constructing Written Test Questions For the Basic and Clinical Sciences, Third
Edision, National Board of Medical Examiners, 3750 Market Street Philadelphia, PA
19104
5. http://bukujurnalartikel.blogspot.com/2010/03/objective-structured-clinical.html
6. Assessment of clinical competence using objective structured examination, Harden et
al., Br Med J. 1975 Feb 22;1(5955):447-51
http://www.bmj.com/cgi/content/abstract/1/5955/447
7. (Ross, M., Carroll, G., Knight, J., Chamberlain, M., Fothergill-Bourbonnais, F., and
Linton, J. (1988) Using the OSCE to measure clinical skills performance in nursing.
Journal of Advanced Nursing, 13, 45-56).
8. How to perform an abdominal examination in the OSCE
http://www.instamedic.co.uk/osce/abdomen/
URAIAN MATERI :
PENDAHULUAN (INTRODUCTION)
104
PENJELASAN (EXPLANATION)
Hal-hal yang perlu disiapkan dalam penyusunan soal UAP OSCA D III
Kebidanan, meliputi :
1. Untuk stasi pengetahuan, perlu dipersiapkan :
a. Isi bahan uji dengan mengacu pada 9 standar kompetensi minimal
bidan yang terdapat pada kurikulum yang akan di evaluasi
b. Bentuk soal berupa kasus (1 kasus untuk 5 soal) dengan melakukan
uji validitas dan reliabilitas terlebih dahulu
c. Presentasi dari berbagai komponen bahan uji
d. Pembobotan dari checklist
e. Standar minimum untuk lulus
Proporsi bahan uji dalam metode OSCE harus mengacu pada 9 standar
Kompetensi minimal bidan yaitu
No Jenis mata kuliah Kompentensi Kebidanan Persentase
1 ASKEB I 20%
105
2 ASKEB II 20%
3 ASKEB III 10%
4 ASKEB IV 10%
5 ASKEB V 10%
6 ASKEB Neonatus, bayi dan balita 10%
7 ASKEB Gangguan system reproduksi 10%
8 ASKEB KB 10%
Matrik soal OSCE, jumlah stasi, kompetensi yang dujikan dan kebutuhan
alat bantu serta penguji diam dalam pelaksanaan UAP DIII Kebidanan,
diantaranya :
Stasi Kompetensi Alat Bantu Uji Penguji Keterangan
1 Kompetensi I : - Lembar soal Disiapkan lembar
Keterampilan dari pernyataan MCQ jawaban stasi
asuhan kebidanan pada - Lembar knowledge (I,II,
asuhan kehamilan jawaban dibawa IV,V, VII, VIII,
normal peserta X,XI, XII, XII, XV)
II Kompetensi II : - Lembar soal yang diberikan
Asuhan kebidanan pada pernyataan MCQ peserta pada saat
ibu hamil patologis tetap ditempat penjelasan awal
- Lembar
jawaban dibawa
peserta
III Kompetensi III : - Pasien Penguji
Skill asuhan kebidanan simulasi diam
pada ibu hamil fisiologis - Alat peraga
maupun patologis - Lembar
penilaian berupa
checklist
- Lembar
perintah untuk
penguji, teruji,
pasien simulasi dan
fasilitator
IV Kompetensi IV : - Lembar soal Disiapkan
Asuhan Kebidanan pada penyataan MCQ checklist dan
ibu bersalin fisiologis tetap ditempat informasi berupa
- Lembar instruksi untuk
jawaban dibawa teruji, pasien
peserta simulasi, penguji
V Kompetensi V : - Lembar soal dan fasilitator
Asuhan Kebidanan pada penyataan MCQ berkaitan dengan
ibu bersalin patologis tetap ditempat keterampilan
- Lembar pada kasus yang
jawaban dibawa diujikan pada
peserta
106
VI Kompetensi VI : - Pasien Penguji stasi skill (III,VI,IX
Skill asuhan kebidanan simulasi diam dan XIV)
pada ibu bersalin - Alat peraga
fisiologis maupun - Lembar
patologis penilaian berupa
checklist
- Lembar
perintah
VII Kompetensi VII : - Lembar soal
Asuhan Kebidanan pada penyataan MCQ
ibu nifas normal tetap ditempat
- Lembar
jawaban dibawa
peserta
VIII Kompetensi VIII : - Lembar soal
Asuhan Kebidanan pada penyataan MCQ
ibu nifas patologis tetap ditempat
- Lembar
jawaban dibawa
peserta
IX Kompetensi IX : - Pasien Penguji
Skill pada ibu nifas baik simulasi diam
fisiologis maupun - Alat peraga
patologis - Lembar
penilaian berupa
checklist
- Lembar
perintah
X Kompetensi X : - Lembar soal
Asuhan Kebidanan penyataan MCQ
patologis tetap ditempat
- Lembar
jawaban dibawa
peserta
XI Kompetensi XI : - Lembar soal
Asuhan Kebidanan ibu penyataan MCQ
dengan gangguan sistem tetap ditempat
reproduksi - Lembar
jawaban dibawa
peserta
XII Kompetensi XII : - Lembar soal
Asuhan Kebidanan pada penyataan MCQ
neonatus, bayi dan tetap ditempat
balita (sehat maupun - Lembar
sakit) jawaban dibawa
peserta
XIII Kompetensi XIII : - Lembar soal
Asuhan Kebidanan penyataan MCQ
Keluarga Berencana tetap ditempat
- Lembar
jawaban dibawa
peserta
XIV Kompetensi XIV : - Pasien Penguji
Skill asuhan Kebidanan simulasi diam
pada pelayanan KB - Alat peraga
- Lembar
penilaian berupa
checklist
- Lembar
perintah
107
XV Kompetensi XV : - Lembar soal
Asuhan Kebidanan penyataan MCQ
Komunitas tetap ditempat
- Lembar
jawaban dibawa
peserta
1. Stasi pengetahuan
- Soal berbentuk kasus
- Jawaban B/S atau MCQ
- Soal yang diberikan terkait dengan pengelolaan pasien suatu kasus
yaitu menyimpulkan diagnose, memformulasikan pemeriksaan
lanjutan, identifikasi masalah, interprestasi hasil pemeriksaan dan
pemecahan masalah klien.
Contoh :
Kompetensi ASKEB I maka focus soal adalah sekitar pemeriksaan
kehamilan sebagaimana peran bidan adalah melakukan asuhan
kebidanan pada ibu hamil baik fisiologis ataupun patologis
Materi yang diujikan adalah tentang diagnose kehamilan, meliputi :
paritas, usia kehamilan, letak anak, kehamilan ganda atau tunggal,
intrauteri/ekstrauteri, hidup/mati, serta rencana kemungkinan
komplikasi yang dihadapi klien dan rencana asuhan yang harus
diberikan
2. Stasi Skill
Yang diujikan adalah kemampuan melakukan tindakan sesuai perintah
yang ada. Skill yang diujikan dan teknik yang harus diperhatikan
adalah :
- Prosedur tindakan pada ibu hamil, bersalin, nifas, bayi baru lahir
maupun akseptor KB
108
- Adanya interaksi peserta uji dengan simulated pasien
- Tidak ada interaksi antara observer dengan peserta uji
1. Yakinkan bahwa setiap soal dapat dijawab tanpa harus melihat pilihan
jawaban atau yakinkan bahwa pilihan jawaban adalah 100 % benar atau
salah.
2. Usahakan agar data atau informasi penting seoptimal mungkin
dicantumkan pada soal (stem), sedangkan pilihan jawaban usahakan
sesingkat mungkin.
3. Hindari informasi berlebihan pada soal.
4. Hindari soal-soal yang bersifat menjebak dan terlalu kompleks serta tidak
relevan.
5. Gunakan pilihan jawaban yang secara gramatikal konsisten dan secara
logis kompatibel dengan soal.
6. Hindari kata-kata absolut seperti, selalu, tidak pernah, dan semua pada
pilihan jawaban, dan hindari pula istilah yang tidak jelas (meragukan)
seperti biasanya atau sering.
7. Hindari kalimat atau frase negatif seperti KECUALI, TIDAK, atau BUKAN.
8. Fokuskan soal pada konsep-konsep penting, dan hindari hanya menguji
kemampuan mengingat fakta.
9. Fokuskan soal-soal pada konsep penting dan kasus-kasus yang sering
serta memiliki potensi masalah serius.
10.Setiap soal diusahakan agar menilai aplikasi pengetahuan, tidak hanya
menguji daya ingat terhadap fakta terisolasi.
11.Seluruh distraktor (pengecoh= jawaban salah) dibuat homogen (dari sisi
gramatikal,panjang pendeknya kalimat).
STRUKTUR MCQ :
109
1. Vignete/Isi/steam
Relevan dengan kompetensi (blue print)
Berisi dg data yg memungkinkan mhsw kompeten menjawab dengan
benar
Mempresentasikan keadaan yang mungkin terjadi di konteks nyata
Fokus prinsip atau konsep penting/esensial yang perlu dimengerti
oleh mahasiswa, bukan hanya soal hafalan
Vignete bisa dijawab oleh mahasiswa yang kompeten tanpa melihat
jawaban
Tidak menjebak dan juga tidak terlalu rumit
Komponen: identitas klien, tempat pelayanan, keluhan, hasil
pemeriksaan
2. Lead in Question
Kalimat Tanya
Tidak mengandung kalimat opini (mungkin, seperti), misal:
“kemungkinan dari diagnosa pada kasus ini adalah....”
Berhubungan dg vignete
Hindari penggunaan kata “kecuali”
3. Option
Homogen
Alternatif jawaban jelas dan singkat
Alternatif jawaban memiliki panjang yang hampir sama dengan kunci
jawaban
Alternatif jawaban harus rasional
Alternatif jawaban cukup menarik mahasiswa tidak kompeten untuk
memilih
Secara tatabahasa konsisten dengan vignete & lead in question
Hindari penggunaan “salah satu di atas” dan “bukan salah satu di
atas”?
Hindari kata “selalu”, “jarang”, “kadang-kadang”?
Kunci jawaban diletakkan secara acak terhadap distractornya
Contoh :
Stasi I : kehamilan
110
Vignete Seorang perempuan berumur 23 tahun, G1P0A0 pada tanggal 28
Maret 2011 datang ke Bidan mengeluh lemes, mual, muntah, serta
sering kencing. Mensruasi terakhir tanggal 29 desember 2010
Option A. 8 minggu
B. 10 minggu
C. 12 minggu
D. 14 minggu
E. 16 minggu
Stasi IV : persalinan
Vignete Seorang perempuan berumur 30 tahun datang ke BPM mengaku
hamil anak ketiga dengan usia kehamilan 9 bulan, mengeluh mules
sejak semalam. Hasil pemeriksaan, TTV dalam batas normal, TFU:
32 cm, his: 3x/10’/40”, DJJ: 140x/menit, PD: portio tebal lunak,
pembukaan 4 cm, ketuban utuh, presentasi kepala, penurunan HII
Option A. 4 jam
B. 5 jam
C. 6 jam
D. 7 jam
E. 8 jam
Check list merupakan instrument yang sangat penting dalam menilai macam
perilaku dan segala macam keterampilan (anamnesa, pemeriksaan, tindakan
dan komunikasi). Setiap tindakan akan terlihat dalam 3 aspek yaitu aspek
111
perilaku, keterampilan dan aspek kelengkapan substansi (butir-butir)
tindakan. Maka dalam checklist yang dinilai meliputi 3 aspek tersebut
Pada anamnesa dan pemberian informasi maka 3 aspek besar yang dinilai
adalah
1. Butir butir penting anamnesa, termasuk didalamnya identitas penderita
serta butir-butir penting dalam pemberian informasi
2. Keterampilan dalam melakukan anamnesa / pemberian informasi
3. Sikap / perilaku terhadap pasien selama anamnesa
KESIMPULAN (SUMMARY)
112
Setiap mahasiswa diharapkan dapat membuat soal MCQ
Check list merupakan instrument yang sangat penting dalam menilai macam
perilaku dan segala macam keterampilan (anamnesa, pemeriksaan, tindakan
dan komunikasi)
LATIHAN (EVALUATION)
113
HAND OUT
Mata Kuliah : Evaluasi dan Remedial Pendidikan
Topik : Objective Structured Clinical Examination (OSCE)
Tujuan :
Setelah selesai perkuliahan mahasiswa mampu :
1. Menjelaskan konsep dasar OSCE/OSCA dengan benar
2. Menjelaskan langkah – langkah perancangan OSCE dengan tepat
3. Mampu mengaplikasi teknik OSCE 5 stasi melalui simulasi di kelas
Referensi :
1. Harden et al,(1975). Assesment of clinical competence using objective structured
examination
2. Ross, M (1988). Using the OSCE to measure clinical skill performance in nursing
3. Http ://www.instamedic.co.uk/osce/abdomen; How to perform an abdominal
examination in the OSCE
4. Http://www.ugm.ac.id/index.php?page=rilis&artikel=4198
5. Http://www.dtl.unimelb.edu.au/dtl.../272814.html; The evolution of OSCA-OSCE-
Clinical Examination of the Royal Australian College of Surgeons
6. Http://en.Wikipedia.org/wiki/Objective_structured_clinical_examination
7. Yanti & pertiwi, (2008). OSCA Panduan Praktis Menghadapi UAP DIII Kebidanan.
Mitra Cendikia Offset. Jakarta
PENDAHULUAN
Dengan penerapan kurikulum berbasis kompetensi (KBK), maka seorang lulusan
pendidikan kesehatan harus memiliki kompetensi yang telah ditetapkan. Seorang lulusan
pendidikan kesehatan harus mampu menunjukkan keterampilan kliniknya di dunia kerja.
Oleh karena itu,untuk memastikan seorang lulusan pendidikan kesehatan itu telah
memiliki kompetensi klinik maka diperlukan suatu penilaian untuk mengukur kompetensi
tersebut meliputi aspek kognitif,afektif dan psikomotor yang valid dan reabel.
Metode evaluasi klinik yang sudah terstandarisasi antara lain adalah OSCA atau
OSCE. OSCA dirancang untuk mengevaluasi keterampilan klinik secara objektif dengan
simulasi situasi klinik aktual.
114
MATERI
A. Konsep dasar OSCE
Explaination
Activity
115
Jelaskan konsep dasar OSCE!
Summary
OSCE adalah alat untuk menilai komponen kompetensi klinik seperti anamnesa,
pemeriksaan fisik, keterampilan procedur al, keterampilan komunikasi, interpretasi
hasil lab, manajemen dan lain-lain yang diuji menggunakan checklist yang telah
disetujui dan mahasiswa akan mengikuti beberapa station.
OSCE terdiri dari 10-20 stasi dan stasi dibagi menjadi 2 kelompok yaitu stasi
prosedur dan stasi knowledge.
B. Perancangan OSCE
Explanation
Langkah-langkah untuk merancang OSCE:
1. Penentuan komponen kompetensi klinik yang akan diujikan
Penentuan jenis keterampilan yang akan diujikan tergantung dari learning
outcome course. Komponen kompetensi klinik yang sering diujikan secara garis
besar meliputi history taking, pemeriksaan fisik, keterampilan procedural,
konseling, manajemen, interpretasi hasil laboratorium, dan radiograf. Blue print
sangat membantu dalam memilih dan merencanakan jenis keterampilan yang akan
diujikan. Pembuatan blue print ini dapat dilakukan oleh tim atau individu yang
berhubungan dengan learning objective course ini.
2. Penentuan waktu station
Penentuan waktu tiap station dipengaruhi oleh kompleksitas keterampilan
yang akan diujikan. Waktu yang sering dipilih berkisar antara 4-15 menit dan rata-
rata yang sering diterapkan adalah 5 menit.
3. Penentuan jumlah station yang terlibat
Penentuan jumlah station yang terlibat tidak ada ketentuan yang pasti.
Semakin banyak jumlah station maka semakin tinggi reliabilitas OSCE (Petrusa
2002).
Schumway dan Harden (2003) menyatakan bahwa untuk memenuhi
minimal reliabilitas diperlukan minimal 20 station. Akan tetapi penerapan OSCE
116
di Kanada untuk high stake tidak menunjukkan penurunan reliabilitas ketika
menggunakan hanya 12 station (D Blacmore, Personal Communication, 2004).
Berdasarkan hal di atas maka perlu dipertimbangkan feasibilitas maka penerapan
OSCE dengan 25 station tidak feasible sehingga penerapan OSCE dengan 10-12
station dapat diterima.
4. Penentuan standar setting
Penentuan standar setting untuk memutuskan nilai cut off seorang
mahasiswa lulus atau tidak lulus dapat menggunakan criterion reference.
5. Penentuan standar pasien (Resource Requirements)
Penggunaan standar pasien dalam OSCE dapat meningkatkan reliabilitas.
Standar pasien ini merupakan orang sehat yang dilatih untuk memerankan
keadaan pasien sesuai dengan scenario yang akan diujikan. Perekrutan standar
pasien ini dapat dilakukan dari karyawan institusi itu sendiri atau dari luar
institusi.
6. Logistik
7. Penentuan tim penguji
Tim penguji dipilih berdasarkan keahliannya untuk masing-masing station.
Penyediaan tim penguji cadangan perlu dilakukan untuk menghindari tim utama
berhalangan.
8. Biaya
Diperlukan biaya dalam OSCE untuk honor standar pasien, tim penguji,
dan staf pendukung lainnya.
9. Post exam review
Activity
Jelaskan langkah – langkah merancang OSCE!
Summary
Langkah-langkah untuk merancang OSCE:
1. Penentuan komponen kompetensi klinik yang akan diujikan
2. Penentuan waktu station
3. Penentuan jumlah station yang terlibat
4. Penentuan standar setting
5. Penentuan standar pasien (Resource Requirements)
117
6. Logistik
7. Penentuan tim penguji
8. Biaya
9. Post exam review
118
Gambar 1. Contoh denah lokasi 15 stasi dengan 4x istirahat
Activity
Lakukan simulasi OSCE 5 stasi!
Summary
Teknik OSCA membutuhkan 8 macam petugas yang mempunyai tugas khusus
demi lancarnya proses ujian.
OSCE biasanya menggunakan sistem perputaran stasi yang singkat (sekitar 5-10
menit, walaupun ada yang sampai 15 menit).
RINGKASAN
1. OSCE adalah alat untuk menilai komponen kompetensi klinik seperti anamnesa,
pemeriksaan fisik, keterampilan procedur al, keterampilan komunikasi, interpretasi
hasil lab, manajemen dan lain-lain yang diuji menggunakan checklist yang telah
disetujui dan mahasiswa akan mengikuti beberapa station.
2. Langkah-langkah untuk merancang OSCE:
a. Penentuan komponen kompetensi klinik yang akan diujikan
b. Penentuan waktu station
c. Penentuan jumlah station yang terlibat
d. Penentuan standar setting
e. Penentuan standar pasien (Resource Requirements)
119
f. Logistik
g. Penentuan tim penguji
h. Biaya
i. Post exam review
3. Dalam ujian OSCA terdapat 8 macam petugas yang mempunyai tugas masing –
masing. Mahasiswa mengelilingi semua stasi dengan waktu sekitar 5-15 menit/stasi,
dan diuji oleh 1-2 orang penguji / stasi
LATIHAN :
1. Jelaskan Konsep dasar OSCE !
2. Jelaskan langkah – langkah perancangan OSCE!
3. Simulasikan OSCE di dalam kelas !
DAFTAR PUSTAKA
1. Harden et al,(1975). Assesment of clinical competence using objective structured
examination
2. Ross, M (1988). Using the OSCE to measure clinical skill performance in nursing
3. Http ://www.instamedic.co.uk/osce/abdomen; How to perform an abdominal
examination in the OSCE
4. Http://www.ugm.ac.id/index.php?page=rilis&artikel=4198
5. Http://www.dtl.unimelb.edu.au/dtl.../272814.html; The evolution of OSCA-OSCE-
Clinical Examination of the Royal Australian College of Surgeons
6. Http://en.Wikipedia.org/wiki/Objective_structured_clinical_examination
120