PENILAIAN BERBASIS KOMPETENSI

EVALUASI PENDIDIKAN
BAHAN AJAR
Oleh :
Ma’mun Sutisna
PROGRAM DIPLOMA IV KEBIDANAN

FAKULTAS KEDOKTERAN
UNIVERSITAS PADJADJARAN
2013
1
HAND OUT
PROGRAM STUDI : Bidan Pendidik (D-IV)

MATA KULIAH : Evaluasi & Remedial Pendidikan
TOPIK/SUB TOPI : Penilaian Berbasis Kompetensi
OBJEKTIF PERILAKU : 1. Setelah mendapatkan materi, mahasiswa mampu

SISWA menjelaskan penilaian berbasis kompetensi sesuai
: dengan referensi secara tepat.
REFERENSI 1. Sanjaya, 2006, Strategi Pembelajaran Berorientasi

Standar Profesi Pendidikan, Jakarta: Prenada.
2. Atmodoworyo S, 2005, Manajemen Pendidikan
Indonesia, Jakarta: Ardadizja Jaya
3. Sanjaya W, 2008, Kurikulum dan Pembelajaran,
:
Jakarta: Prenada Media Group
4. Wena M, 2008, Jakarta: Bumi Aksara
PENDAHULUAN
PENDAHULUAN
Pada era sekarang ini atau yang lebih dikenal dengan era modernitas, segala sesuatu
telah mengalami perubahan atau yang namanya modernisasi. Salah satu yang terjadi dalam
era modern adalah perubahan tujuan pendidikan. Perubahan tujuan pendidikan tersebut
pastilah melahirkan suatu titik tekan atau kurikulum pembelajaran yang selalu mengiringi
setiap perubahan. Dan suatu kurikulum yang berbeda pasti melahirkan suatu sistem evaluasi
atau penilaian yang berbeda. Penilaian pada kurikulum KBK ini diharapkan dapat menjadi
feetback yang baik dan sepenuhnya dapat digunakan untuk mengetahu kompetensi yang
dicapai oleh peserta didik. Juga penilaian pada kurikulum ini diharapkan akan dapat menjadi
acuan menentukan keberhasilan peserta didik.
2
Namun sistem penilaian yang dipakai oleh guru atau pendidik pada masa ini masih
cenderung monoton dan masih terbawa dengan model penilaian pada kurikulum lama.
Disamping itu model penilaian KBK ini belum banyak dipakai, entah apa alasannya, akan
tetapi fakta berkata demikian. Maka dari itu kami akan mencoba menulis mengenai penilaian
yang berbasis kompetensi yang kami ambil dari berbagai referensi yang ada dan dari
pengetahuan yang kami miliki.
Penilaian Berbasis kompetensi (Performance Based Assessment) adalah pegujian yang

meminta peserta test untuk mendemonstrasikan kemampuannya dalam bentuk unjuk kerja
sikap (attitudinal performance), untuk kerja lisan (Verbal performance) dan perbuatan
(Physichal performance), serta mengaplikasikan kemampuannya dalam berbagai macam
konteks sesuai dengan kriteria yang diinginkan. Sering sekali ”performance assessment” juga
dikaitkan dengan suatu kriteria yang diinginkan dalam kehidupan sehari-hari yang dikenal
authenthic assessment.
Pada intinya siswa dinilai kemampuannya dengan berbagai cara. Tidak hanya dari hasil
ulangan tulis. Prinsip utama penilaian dalam Kurikulum Berbasis Kompetensi tidak hanya
menilai apa yang diketahui siswa, tetapi juga menilai apa yang dilakukan siswa. Penilaian itu
mengutamakan kualitas hasil kerja siswa dalam menyelesaikan tugas.
URAIAN MATERI
URAIAN MATERI
A. Pengertian Penilaian Berbasis Kompetensi
Penilaian berbasis kompetensi adalah uraian keterangan yang teratur sebagai
penjelasan prosedur dan cara menilai pencapaian kompetensi oleh siswa. Selain itu
penilaian berbasis kompetensi juga dapat dirtikan sebagai teknik evaluasi yang
harus dilakukan guru dalam pembelajaran di sekolah. Instrumen penilaiannya
dikembangkan mengacu pada pada indikator-indikator pencapaian kompetensi yang
di tetapkan. Penilaian mencakup semua kompetensi dasar. Penilaian dilakukan
untuk memperoleh informasi tentang kemajuan yang dicapai dan ketuntasan
penguasaan kompetensi dari siswa. Teknik dan pelaksanaannya diatur dalam
3
1. Undang-undang Republik Indonesia No. 20 tahun 2003 tentang Sistem
Pendidikan Nasional.
2. Peraturan Pemerintah No.19 Tahun 2005 tentang standar Nasional Pendidikan
3. Peraturan Menteri Pendidikan Nasional No.22 Tahun 2006 tentang Standar Isi
4. Peraturan Pemerintah Pendidikan Nasional No.23 Tahun 2006 tentang Standar
Kompetensi Lulusan
5. Peraturan Pemerintah Nasional No.20 Tahun 2007 tentang Standar Penilaian
Pendidikan
Standar Kompetensi dan Kompetensi Dasar di dalam Standar Isi menjadi fokus
perhatian utama dalam penilaian. Untuk mengetahui tingkat pencapaian
kompetensi, guru dapat melakukan penilaian melalui tes dan non tes. Tes meliputi
tes lisan, tertulis(bentuk uraian, pilihan ganda, jawaban singkat, isian,
menjodohkan, benar-salah), dan tes perbuatan yang meliputi: kinerja, penugasan,
dan hasil katya. Penilaian non-tes contohnya seperti penilaian sikap, minat,
motivasi, penilaian diri, portofolio, lifeskill. Tes perbuatan dan penilaian non tes
dilakukan melalui pengamatan (observasi).
B. Tujuan dan fungsi penilaian berbasis kompetensi
Secara umum penilaian berbasis kompetensi bertujuan untuk mengetahui
pengetahuan awal siswa, mengetahui tingkat pencapaian kompetensi, mengetahui
perkembangan siswa, mendiagnosis kesulitan belajar siswa, mengetahui hasil suatu
proses pembelajaran, memotivasi siswa belajar, dan memberi umpan balik kepada
guru tentang pembelajaran yang dikelola.
Penilaian berbasis kompetensi memiliki sejumlah fungsi, yaitu sebagai bahan
pertimbangan dalam menentukan kenaikan kelas, umpan balik dalam perbaikan
program pengajaran, alat pendorong dalam meningkatkan kemampuan peserta
didik, dan sebagia alat bagi peserta didik untuk melakukan evaluasi terhadap
kinerja, serta bercermin diri (instropeksi diri).
C. Ciri – ciri Penilaian Berbasis Kompetensi
1. Penilaian berbasis kompetensi memiliki ciri – cirri sebagai berikut:
a. Harus memenuhi prinsip - prinsip dasar penilaian
b. Harus menggunakan acuan dan patokan belajar tuntas
4
c. Berorientasi pada kompetensi
d. Terintegrasi dengan proses pembelajaran
e. Dilakukan oleh guru dan siswa.
2. Prinsip –prinsip penilaian berbasis kompetensi
Dalam proses pelaksanaan evaluasi dengan sistem penilaian berbasis
kompetensi terdapat beberapa prinsip yang harus diperhatikan, diantaranya yaitu
a. Valid
Penilaian berbasis kompetensi harus mengukur apa yang seharusnya diukur
dengan menggunakan alat yang dapat dipercaya dan sahih.
b. Keterbukaan
Penilaian berbasis kompetensi adalah penilaian yang dilaksanakan secara
terbuka, artinya guru sebagai evaluator bukan hanya berperan sebagai orang
yang memberi nilai atau kritik, akan tetapi siswa yang dievaluasi perlu
memahami mengapa kritik itu muncul, oleh sebab itu guru harus terbuka
melalui argumentasi yang tepat dalam setiap memberikan penilaian.
c. Adil dan Obyektif
Penilaian harus adil terhadap semua siswa dan tidak membeda-bedakan latar
belakang siswa.
d. Mendidik
Penilaian harus memberi sumbangan yang positif terhadap pencapaian hasil
belajar siswa. Penilaian ini dapat dirasakan sebagai penghargaan yang
memotivasi bagi siswa yang berhasil dan sebagai pemicu semangat bagi
siswa yang kurang berhasil.
e. Berkesinambungan
Penilaian dilakukan secara berencana, bertahap, teratur, terus-menerus dan
berkesinambungan untuk memperoleh gambaran tentang perkembangan
kemajuan belajar siswa.
f. Bermakna
Penilaian hendaknya mudah dipahami dan mudah ditindak lanjuti oleh pihak-
pihak yang berkepentingan.
g. Berorientasi pada Proses dan Hasil
5
Penilaian berbasis kompetensi bertumpu pada dua sisi yang sama pentingnya,
yakni sisi proses dan hasil belajar secara seimbang. Penilaian berbasis
kompetensi mengikuti setiap aspek perkembangan siswa, bagaimana cara
belajar siswa, bagaimana motivasi belajar, sikap, minat, kebiasaan, dan lain
sebagainya dan pada akhirnya menilai bagaimana hasil belajar yang diperoleh
siswa.
3. Teknik Penilaian
Penilaian pembelajaran ini meliputi penilaian proses dan hasil. Pelaksanaan
penilaian dapat dilakukan dengan teknik tes maupun non tes. Teknik tes
contohnya tes tertulis, tes lisan dan tes perbuatan. Teknik non tes contohnya
yaitu pengamatan (sistematis), pengisian angket, pengukuran skla sikap,dan
minat (afektif), pemberian tugas, serta portofolio
Jenis Cara Pengujian Kompetensi dan Bentuk Soal
a. Cara Pengujian atau Tagihan
Pengujian atau tagihan adalah cara bagaimana ujian (penilaian) dilakukan.
Jenis pengujian / tagihan yang digunakan adalah :
1) Kuis
Kuis adalah ujian singkat yang menanyakan hal-hal prinsip yang telah
dipelajari sebelumnya. Kuis dapat diberikanpada awal, tengah atau
akhir proses pembelajaran. Jika banyak siswa yang gagal dalam
menyelesaikan kuis, sebaiknya guru mengulangi materi sebelumnya.
Kuis dapat dilakukan secra tertulis maupun lisan.
2) Ulangan harian
Ulangan harian merupakan ujian formatif setelah selesai pembahasan
satu kompetensi tertentu. Fungsinya untuk mengukur siswa setelah
belajar satu kompetensi. Soal yang digunakan sebaiknya variatif, baik
obyektif maupun uraian yang meliputi pemahaman,aplikasi dan
analisis.
3) Tugas individu-kelompok
Tugas individu/kelompok adalah tugas yang dapat diberikan setiap
minggu dengan bentuk soal uraian atau soal terbuka.
6
4) Ulangan semester
Ulangan semester adalah ulangan pada akhir semester dengan materi
yang diujikan berdasarkan kisi-kisi soal. Bentuk soal yang digunakan
dapat berupa campuran pilihan ganda dan uraian.
5) Ulangan kenaikan kelas
Ulangan kenaikan kelas adalah ulangan dengan materi yang diujikan
mengacu pada ketentuan : materi terkait pada kemampuan esensial,
berkelanjutan, memiliki nilai aplikatif atau dibutuhkan untuk belajar
pada bidang lain.
b. Bentuk soal pada pengujian
Bentuk soal yang digunakan untuk mengukur kompetensi sebaiknya terdiri
dari berbagai bentuk soal. Variasi bentuk soal antara lain :
1) Pertanyaan lisan
Pertanyaan lisan merupakan cara efektif untuk mengetahui seberapa
jauh siswa mencapai suatu kompetensi dasar tertentu.
2) Soal obyektif
Bentuk soal obyektif biasanya pilihan ganda dan benar-salah, dapat
pula soal berupa menjodohkan
3) Soal uraian
Soal uraian menuntut siswa untuk menggunakan respon atau
menguaraikan langkah untuk memperoleh jawaban atas soal tersebut.
Penyekoran dilakukan secara analitik, yaitu setiap penyelesaian langkah
diberi skor. Penyekorran juga dapat bersifat hirarki, artinya skor pada
suatu langkah berhubungan dengan langkah jawaban sebelumnya.
4) Soal terbuka
Soal terbuka merupakan soal yang mempunyai lebih dari satu cara
untuk memperoleh jawaban yang benar dan menuntut siswa
menemukan jawaban itu beserta syarat khususnya. Penyekoran
dilakukan secara holistic, artinya didasarkan pada respon siswa
keseluruhan.
7
D. Ranah penilaian berbasis kompetensi ( Kognitif, Afektif, dan Psikomotor )
Penilaian terhadap pencapaian kompetensi siswa yang mencakup penilaian
pada ranah kognitif, afektif, dan psikomotor. Yang sudah terbiasa dilakukan dalam
penilaian pembelajaran selama ini adalah penilaian menyangkut ranah kognitif.
Penilaian ranah kognitif umumnya dilakukan dengan tes tertulis dan bentuk
soalnya pilihan ganda. Penilaian ini dilakukan setelah siswa mempelajari suatu
kompetensi dasar yang harus dicapai.
Kompetensi siswa dalam ranah afektif yang perlu dinilai utamanya
menyangkut sikap dan minat siswa dalam belajar. Secara teknis penilaian ranah
afektif dilakukan melalui dua hal, yaitu Laporan diri oleh siswa yang biasanya
dilkukan dengan pengisian angket dan penagamatan sistematis guruterhadap afektif
siswa serta perlu lembar pengamatan. Penilaian ini dilakukan selama
berlangsungnya kegiatan belajar mengajar.
Kompetensi siswa dalam ranah psikomotor menyangkut gerak otot kecil.
Kemampuan psikomotor yang dibina dalam belajar, misalnya pada pelajaran fisika
berkaitan dengan kemampuan mengukur dengan satuan tertentu, kemampuan
menggunakan alat dalam praktikum. Penilaian ini dilakukan selama kegiatan
belajar mengajar berlangsung.
D. Instrumen Penilaian Berbasis Kompetensi

1. Instrumen penilaian ranah kognitif
Bentuk soal yang digunakan dalam penilaian ranah kognitif dalah soal
obyektif, soal uraian, dan soal terbuka.
a. Contoh soal obyektif :
Sebuah batu di jatuhkan dari puncak menara yang tingginya 40m di atas
tanah. Jika g = 10 m/s2, maka kecepatan batu saat menyentuh tanah
adalah…..m/s
a. 20 b. 20 c. 10 d. 4 e. 3
b. Contoh soal uraian ;
8
Sebuah batu dijatuhkan dari menara yang tingginya 100m tanpa kecepatan
awal. Jika g = 10 m/s2 , berapa waktu yang diperlukan batu untuk sampai ke
tanah.
2. Instrumen penilaian ranah afektif
Kemampuan pada ranah afektif dapat dinilai melalui laporan diri siswa dan
pengamatan oleh guru. Data hasil penilaian afektif sangat berguna untuk
menentukan usaha pembinaan terhadap siswa agar meningkat hasil belajarnya.
Selain itu juga berguna untuk memperbaiki proses pembelajaran.
a. Contoh untuk mengukur afektif siswa :
Contoh 1 : aspek sikap dan konsep diri
Diantara pernyataan-pernyataan dibawah ini, lingkarilah nomor penyataan
yang sesuai dengan dirimu
1) Pelajaran fisika ini menarik
2) Pelajaran fisika ini membosankan
3) Karena pelajaran fisika sulit, maka saya tidak menyukainya
4) Saya tidak suka mengerjakan soal-soal fisika karena soal-soalnya
tergolong sulit.
5) Saya tidak menyukai pembelajaran ini dilakukandalan kelompok belajar,
dst.
3. Instrumen penilaian ranah psikomotor
Penilaian ranah psikomotor siswa dapat dilakukan dengan kombinasi tes dan
pengamatan.
Contoh soal penilaian ranah psikomotor :
Soal : Ukurlah diameter pipa kecil dengan menggunakan jangka sorong.
No Aspek Nilai
1. Cara memegang 1 2 3 4 5
jangka sorong
2. Penggunaan jangka
sorong dalam
fungsinya
3. Kebenaran dalam
mengukur
4. Kecermatan dalam
mengukur
9
5. Kerapian dalam
membuat laporan
Keterangan :
Skor 5, bila dilakukan sangat tepat
Skor 4, bila dilakukan tepat
Skor 3, bila dilakukan agak tepat
Skor 2, bila dilakukan tidak tepat
Skor 1, bila dilakukan sangat tidak tepat
KESIMPULAN
Penilaian berbasis kompetensi adalah uraian keterangan yang teratur sebagai penjelasan
prosedur dan cara menilai pencapaian kompetensi oleh peserta didik. Selain itu penilaian
berbasis kompetensi juga dapat dirtikan sebagai teknik evaluasi yang harus dilakukan
pendidik dalam pembelajaran. Penilaian berbasis kompetensi dilakukan untuk
mengetahui tingkat pencapaian kompetensi peserta didik, dimana pendidik dapat
melakukan penilaian tersebut melalui tes dan non tes.
EVALUASI
EVALUASI
10
EVALUASI
A. Essay
1. Apa yang dimaksud dengan penilaian berbasis kompetensi?
2. Bagaimana tujuan dan fungsi penilaian berbasis kompetensi?
3. Sebutkan prinsip –prinsip penilaian berbasis kompetensi!
B. Pilihan Ganda
1. Uraian keterangan yang teratur sebagai penjelasan prosedur dan cara menilai
pencapaian kompetensi oleh siswa. Selain itu penilaian berbasis
kompetensi juga dapat dirtikan sebagai teknik evaluasi yang harus
dilakukan guru dalam pembelajaran di sekolah
a. Penilaian berbasis kompetensi
b. Penilaian berbasis intuisi
c. Penilaian berbasis mandiri
d. Penilaian berbasis profesi
e. Penilaian berbasis kelompok
2. Tujuan peniliaian berbasis kompetensi adalah , kecuali….
a. Menentukan kenaikan kelas
b. Umpan balik dalam perbaikan program pengajaran
c. Menentukan administrasi pendidikan
d. Alat pendorong dalam meningkatkan kemampuan peserta didik
e. Sebagia alat bagi peserta didik untuk melakukan evaluasi terhadap kinerja,
serta bercermin diri (instropeksi diri)
3. Dibawah ini merupakan prinsip-prinsip dalam penilaian berbasis kompetensi

kecuali…..
a. Valid
b. Ketetutupan
c. Adil dan Obyektif
d. Mendidik
e. Berkesinambungan
4. Instrumen Penilaian Berbasis Kompetensi terbagi menjadi beberapa ranah,
kecuali….
a. Instrumen penilaian ranah kognitif
b. Instrumen penilaian ranah afektif
c. Instrumen penilaian ranah psikomotorik 11
d. a, b, c benar
e. a,b,c salah
PROGRAM STUDI : Bidan Pendidik (D-IV)
MATA KULIAH : Evaluasi Remedial
TOPIK/SUB TOPIK : Menentukan kesahihan dan keterandalan evaluasi
TUJUAN : 1. Setelah mendapatkan materi, mahasiswa mampu

PEMBELAJARAN : menjelaskan kesahihan evaluasi.
: 2. Setelah mendapatkan materi, mahasiswa mampu
menjelaskan keterandalan evaluasi
REFERENSI 1. Tayibnafis, R.Farida Yusuf.2010.

: Evaluasi Program. Jakarta:Rineka Cipta
2. Arikunto, Syharsini. 2008. Dasar-
Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara
PENDAHULUAN
Untuk mengukur kesesuaian, efisiensi, dan kemantapan (consistency) suatu alat

penilaian atau suatu tes dipergunakan bermacam-macam kualitas seperti validitas,
keandalan, objektivitas dan kepraktisan.
Validitas (kesahihan) adalah kualitas yang menunjukan hubungan antara suatu
pengukuran (diagnosis) dengan arti atau tujuan kriteria belajar atau tingkah laku.
Beberapa kriteria dapat di pilih umtuk memperlihatkan keefektifan terhadap peramalan
performance yang akan datang (yang akan terjadi), kriteria yang lain untuk
menunjukkan status yang muncul, kriteria yang lain lagi untuk menimbulkan sifat-sifat
yang representatif dari luasnya isi atau tingkah laku, dan kriteria yang lain lagi untuk
(melengkapi) penyediaan data untuk menunjang atau menolak beberapa teori psikologis.
12
Keandalan adalah kualitas yang menunjukkan kemantapan (consistency)
ekuivalensi atau stabilitas suatu pengukuran yang dilakukan
Objektivitas adalah kualitas yang menunjukkan identitas atau kesamaan dari skor-
skor atau diagnosis-diagnosis yang diperoleh dari data yang sama dari penskor-penskor
kompeten yang sama.
Kepraktisan (practicability) adalah suatu kualitas yang menunjukkan kemungkinan
dapat dijalankannya suatu kegunaan umum dari suatu teknik penilaian, dengan
mendasarkannya pada biaya, waktu yang diperlukan untuk menyusun, kemudahan
penyusunan, mudahnya penskoran, dan mudahnya penginterpretasian hasil-hasilnya.
URAIAN MATERI
A. VALIDITAS
Kesahihan menggantikan kata validitas (validity) yang dapat diartikan
sebagai ketepatan evaluasi mengevaluasi apa yang seharusnya dievaluasi. Dapat
diterjemahkan pula sebagai kelayakan interpretasi terhadap hasil dari suatu
instrument evaluasi atau tes, dan tidak terhadap instrument itu sendiri. Kesahihan
juga dapat dikatakan lebih menekankan pada hasil/ perolehan evaluasi, bukan pada
kegiatan evaluasinya.
Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi. Suatu
teknik evaluasi dikatakan mempunyai validitas yang tinggi (disebut valid) jika
teknik evaluasi atau tes itu dapat mengukur apa yang sebenarnya akan diukur. Atau
seperti dikatakan oleh cronbach “how well a test or evaluative techique does the job
that it is employed to do” . validitas bukanlah suatu ciri atau sifat yang mutlak dari
suatu teknik evaluasi; ia merupakan suatu ciri yang relatif terhadap tujuan yang
hendak dicapai oleh pembuat tes. Teknik yang sama dapat digunakan untuk
beberapa tujuan yang berbeda, dan validitasnya dapat berbeda-beda dari yang tinggi
kepada yang rendah, bergantung pada tujuan. Suatu tes pengerjaan berhitung
misalnya dapat mempunyai validitas yang tinggi untuk menentukan status siswa-
siswa sekarang dalam kecakapannya mengerjakan berhitung. Validitas tes itu
mungkin sedang atau cukup untuk mengukur atau meramalkan keberhasilan dalam
aspek-aspek matematis dari suatu pelajaran ilmu alam yang akan datang.
13
Oleh karena itu, validitas harus di tentukan dalam hubungannya dengan
tujuan yang akan dicapai dengan alat evaluasi itu
1. Jenis-jenis validitas
Telah dikatakan bahwa validitas suatu alat evaluasi bukanlah
merupakan ciri yang absolut atau mutlak. Suatu tes dapat memiliki validitas
yang bertingkat-tingkat; tinggi,sedang, rendah, bergantung pada tujuannya.
Sehubungan dengan itu, ada beberapa jenis validitas, yaitu:
a. Content validity (curricular validity)
Suatu tes dikatakan memiliki content validity jika scope dan isi tes
itu sesuai dengan scopedan isi kurikulum yang sudah diajarkan. Isi tes
sesuai dengan atau mewakili sampel hasil-hasil belajar yang seharusnya
dicapai menurut tujuan kurikulum.
b. Construct validity
Untuk menentukan adanya construct validity, suatu tes
dikorelasikan dengan suatu konsepsi atau teori. Items dalam tes itu harus
sesuai dengan ciri-ciri yang disebutkan dalam konsepsi tadi, yaitu
konsepsi tentang objek yang akan di tes. Dengan kata lain, hasil-hasil tes
itu disesuaikan dengan tujuan atau ciri-ciri tingkah laku (domein) yang
hendak di ukur.
c. Predictive validity
Suatu tes dikatakan memiliki predictive validity jika hasil korelasi
tes itu dapat meramalkan dengan tepat keberhasilan seseorang pada masa
mendatang di dalam lapangan tertentu. Tepat tidaknya ramalan tersebut
dapat dilihat dari korelasi koefisien antara hasil tes itu dengan hasil alat
ukur lain pada masa mendatang.
d. Concurrent validity
jika hasil suatu tes mempunyai korelasi yang tinggi dengan hasil
suatu alat ukur lain terhadap bidang yang sama pada waktu yang sama
pula, maka dikatakan tes itu memiliki concurrent validity (concurrent =
bersamaan waktu).
Validitas suatu tes dinyatakan dengan angka korelasi koefisien (r).
Kriteria korelasi koefisien adalah sebagai berikut:
0,00 - 0,20 sangat rendah (hampir tidak ada korelasi)
0,20 – 0,40 korelasi rendah
0,40 – 0,70 korelasi cukup
14
0,70 – 0,90 korelasi tinggi
0,90 – 1,00 korelasi sangat tinggi (sempurna)
Cara menghitung validitas suatu tes dapat dilakukan antara lain
sebagai berikut:
Dengan product moment correlation (metode pearson)
 x' y '
Rumusnya: r :
( X ) ( Y )
2 2
2. Faktor-faktor yang mempengaruhi kesahihan hasil evaluasi meliputi :

a. Faktor instrumen evaluasi itu sendiri.
b. Faktor-faktor administrasi evaluasi dan penskoran juga merupakan faktor-
faktor yang mempunyai suatu pengaruh yang menganggu kesahihan
interpretasi hasil evaluasi.
c. Faktor-faktor dalam respons-respons siswa merupakan faktor-faktor yang
lebih banyak mempengaruhi kesahihan daripada faktor yang ada
instrumental evaluasi atau pengadministrasiannya
B. KEANDALAN/KETERANDALAN
Keandalan (Reliability) adalah ketetapan atau ketelitian suatu alat evaluasi.

Suatu tes atau alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau
stabil dan produktif. Jadi yang di pentingkan di sini ialah ketelitiannya: sejauh
mana tes atau alat tersebut dapat dipercaya kebenarannya.
Keterandalan evaluasi berhubungan dengan masalah kepercayaan, yakni
tingkat kepercayaan bahwa suatu instrument evaluasi mampu memberikan hasil
yang tepat. Keterandalan menunjukan kepada konsistensi (keajegan) pengukuran
yakni bagaimanakah keajegan skor tes atau hasil evaluasi lain yang berasal dari
pengukuran yang satu ke pengukuran yang lain.
Keandalan suatu tes dinyatakan dengan coeficient of reliability (r), yaitu
dengan jalan mencari korelasi, misalnya:
a. Dengan metode dua tes: dua tes yang paralel dan setaraf (ekuivalen)
diberikan kepada sekelompok anak. Hasil kedua tes tersebut kemudian di
cari korelasinya. Dalam hal ini dapat juga digunakan metode pearson dan
metode spearman seperti dikatakan terdahulu.
15
b. Dengan metode satu tes: sebuah tes di berikan dua kali kepada
sekelompok murid yang sama, tetapi dalam bentuk waktu yang berbeda.
Kedua hasil tes itu kemudian dicari korelasinya
c. Metode “split-half” (masih dengan satu tes): suatu tes dibagi menjadi dua
bagian yang sama tingkat kesukarannya, sama isi dan bentuknya,
kemudian dilihat skor masing-masing bagian paruhan tes tersebut dan
dicari korelasinya.
d. Termasuk “split-half method” dengan cara lain yang tidak memerlukan
perhitungan korelasi, yaitu sebagai berikut. dengan menggunakan deviasi
standar masing-masing dari kedua bagian tes dan deviasi standar seluruh
tes.
e. Dengan metode kuder-richardson, yaitu dengan menggunakan rumus yang
dikemukakan oleh dua orang ahli measurement yang bernama kuder dan
richardson.
1. Faktor-faktor yang mempengaruhi keandalan suatu tes

Untuk memperjelas tentang faktor-faktor yang mempengaruhi
keterandalan akan diuraikan berikut ini.
a. Panjang tes (length of test). Tes ini dilakukan dengan tidak banyak
menebak, maka keterandalan hasil evaluasi semakin tinggi.
b. Sebaran skor (spread of scores). Karena koefisien keterlandan yang lebih
besar dihasilkan pada saat orang perorang tetap pada posisi yang relative
sama dalam satu kelompok dari satu pengujian ke pengujian lainnya, itu
berarti selisih yang dimungkinkan dari perubahan posisi dalam kelompok
juga menyumbang memperbesar koefisien keterandalan.
c. Tingkat kesulitan tes (difficulty of tes). Tes acuan norma (norm reference
test). Tingkat kesulitan tes yang ideal untuk meningkatkan koefisien
keterandalan adalah tes yang menghasilkan sebaran skor berbentuk atau
kurva normal.
d. Objektivitas (objectivity). Objektivitas suatu tes menunjuk kepada tingkat
skor kemampuan yang sama (yang dimiliki oleh siswa satu dengan siswa
yang lain) memperoleh hasil yang sama dalam mengerjakan tes.
Uraian faktor-faktor yang mempengaruhi keterandalan yang disadur dari
16
mencakup juga faktor-faktor yang mempengaruhi keterandalan yang
dikemukakan oleh Arikunto.
KESIMPULAN
Kesahihan menggantikan kata validitas (validity) yang dapat diartikan sebagai

ketepatan evaluasi mengevaluasi apa yang seharusnya dievaluasi. Dapat diterjemahkan
pula sebagai kelayakan interpretasi terhadap hasil dari suatu instrument evaluasi atau tes,
dan tidak terhadap instrument itu sendiri. Kesahihan juga dapat dikatakan lebih
menekankan pada hasil/ perolehan evaluasi, bukan pada kegiatan evaluasinya
Faktor-faktor yang mempengaruhi kesahihan hasil evaluasi meliputi :
b. Faktor-faktor administrasi evaluasi dan penskoran juga merupakan faktor-faktor yang
mempunyai suatu pengaruh yang menganggu kesahihan interpretasi hasil evaluasi.
c. Faktor-faktor dalam respons-respons siswa merupakan faktor-faktor yang lebih
banyak mempengaruhi kesahihan daripada faktor yang ada instrumental evaluasi atau
pengadministrasiannya
Keandalan (Reliability) adalah ketetapan atau ketelitian suatu alat evaluasi. Suatu
tes atau alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan
produktif. Jadi yang di pentingkan di sini ialah ketelitiannya: sejauh mana tes atau alat
tersebut dapat dipercaya kebenarannya.
Keterandalan evaluasi berhubungan dengan masalah kepercayaan, yakni tingkat
kepercayaan bahwa suatu instrument evaluasi mampu memberikan hasil yang tepat.
Keterandalan menunjukan kepada konsistensi (keajegan) pengukuran yakni
bagaimanakah keajegan skor tes atau hasil evaluasi lain yang berasal dari pengukuran
yang satu ke pengukuran yang lain.
Untuk memperjelas tentang faktor-faktor yang mempengaruhi keterandalan akan
diuraikan berikut ini.
a. Panjang tes (length of test). Tes ini dilakukan dengan tidak banyak menebak, maka
keterandalan hasil evaluasi semakin tinggi.
17
b. Sebaran skor (spread of scores). Karena koefisien keterlandan yang lebih besar
dihasilkan pada saat orang perorang tetap pada posisi yang relative sama dalam satu
kelompok dari satu pengujian ke pengujian lainnya, itu berarti selisih yang
dimungkinkan dari perubahan posisi dalam kelompok juga menyumbang
memperbesar koefisien keterandalan.
c. Tingkat kesulitan tes (difficulty of tes). Tes acuan norma (norm reference test).
Tingkat kesulitan tes yang ideal untuk meningkatkan koefisien keterandalan adalah
tes yang menghasilkan sebaran skor berbentuk atau kurva normal.
d. Objektivitas (objectivity). Objektivitas suatu tes menunjuk kepada tingkat skor
kemampuan yang sama (yang dimiliki oleh siswa satu dengan siswa yang lain)
memperoleh hasil yang sama dalam mengerjakan tes.
Uraian faktor-faktor yang mempengaruhi keterandalan yang disadur dari
mencakup juga faktor-faktor yang mempengaruhi keterandalan yang dikemukakan
oleh Arikunto.
EVALUASI
\
Pilihan Ganda
1. Validitas adalah...
a. ketepatan evaluasi mengevaluasi apa yang seharusnya dievaluasi
b. ketepatan evaluasi menganalisis apa yang seharusnya dievaluasi
c. ketepatan evaluasi mengevaluasi apa yang sebelumnya sudah dievaluasi
d. ketepatan mengevaluasi apa yang seharusnya dievaluasi
2. Faktor – faktor yang mempengaruhi validitas antara lain...
b. Faktor-faktor administrasi evaluasi dan penskoran juga merupakan faktor-faktor
yang mempunyai suatu pengaruh yang menganggu kesahihan interpretasi hasil
evaluasi.
c. Faktor-faktor dalam respons-respons siswa merupakan faktor-faktor yang lebih
banyak mempengaruhi kesahihan daripada faktor yang ada instrumental evaluasi
atau pengadministrasiannya
d. Benar semua
3. Keterandalan adalah...
18
a. Ketetapan atau ketelitian suatu alat evaluasi. Suatu tes atau alat evaluasi
dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif.
b. Ketepatan evaluasi mengevaluasi apa yang seharusnya dievaluasi
c. Ketetapan meneliti suatu alat evaluasi
d. Ketepatan dalam menilai suatu alat evaluasi
4. Faktor-faktor yang mempengaruhi keterandalan antara lain (kecuali)...
a. Panjang tes
b. Sebaran skor
c. Tingkat kesulitan
d. Panjang soal
19
HAND OUT
Mata Kuliah : Evaluasi Remedial

Kode Mata Kuliah : EA 4314
Topik : Merancang dan Menerapkan Macam-macam Metode
Evaluasi
:
Objektif Perilaku Siswa (OPS)
1. Setelah mengikuti pelajaran, mahasiswa dapat mendeskripsikan definisi evaluasi,
fungsi evaluasi, secara baik dan benar sesuai dengan penjelasan yang diberikan.
2. Tanpa melihat catatan, mahasiswa mampu menguraikan langkah-langkah
evaluasi dengan benar.
3. Setelah mengikuti pelajaran mahasiswa mampu merancang dan menerapkan
macam-macam metode evaluasi secara tepat dan benar sesuai dengan penjelasan
yang diberikan.
Referensi :
1. Purwanto, Ngalim. 2008. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran.
Bandung: Remaja Rosdakarya Offset
2. Arikunto, Suharsimi. 2008. Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi
Aksara.
3. Tayibnafis, R.Farida Yusuf. 2010. Evaluasi Program. Jakarta: Rineka Cipta.
Bahan & Sumber : LCD, OHP/OHT, Hand Out, White Board
PENDAHULUAN (INTRODUCTION)
Di negara-negara yang sudah maju, pendidikan dipandang sebagai sarana utama

untuk memecahkan masalah-masalah sosial. Untuk beberapa masalah tertentu,
kesejahteraan bangsa dibebankan ke pundak sekolah dan universitas. Kritik-kritik sering
muncul tentang sistem pendidikan yang sering berubah dan tidak seimbang, kurikulum
yang kurang tepat dengan mata pelajaran yang terlalu banyak dan tidak terfokus pada hal-
hal yang seharusnya diberikan. Namun masalah yang paling parah pada setiap sistem
20
pendidikan yaitu kurangnya evaluasi yang efektif. Sering terjadinya perubahan dalam
sistem pendidikan mungkin terutama disebabkan oleh kurangnya informasi yang dapat
diandalkan tentang hasil pendidikan, tentang praktek, dan programnya serta kurangnya
suatu sistem yang standar untuk memperoleh informasi tersebut dalam butir satu.(3)
Biasanya evaluasi pendidikan selalu dihubungkan dengan hasil belajar, namun
saat ini konsep evaluasi mempunyai arti yang lebih luas daripada itu. Setiap orang
tampaknya mempunyai maksud yang berbeda apabila sampai kepada kata evaluasi.
Untuk mengetahui lebih jauh apa yang dimaksud seseorang dengan evaluasi, maka harus
diketahui beberapa hal yang berkaitan dengan evaluasi salah satu diantaranya yaitu
mengenai metode evaluasi serta cara merancang dan menerapkannya (Robert O.
Brinkerhoff & Cs., 1983).(3)
Evaluasi dalam pendidikan tidak dapat dilepaskan dari tujuan evaluasi itu sendiri.
Evaluasi bertujuan untuk mendapat data pembuktian yang akan menunjukkan sampai
dimana tingkat kemampuan dan keebrhasilan siswa dalam pencapaian tujuantujuan
kurikuler. Di samping itu, juga dapat digunakan oleh guru-guru dan para pengawas
pendidikan untuk mengukur atau menilai sampai dimana keefektifan pengalaman-
pengalaman mengajar, kegiata-kegiatan belajar, dan metode-metode mengajar yang
digunakan. Dengan demikian, dapat dikatakan betapa penting peranan dan fungsi
evaluasi dalam proses belajar mengajar. Evaluasi juga dibedakan berdasarkan waktu
pelaksanaannya, kapan evaluasi dilakukan, untuk apa evaluasi dilakukan, dan acuan serta
paham yang dianut oleh evaluator.(1)
URAIAN MATERI (EXPLANATION)
A. Pengertian Evaluasi
Evaluasi adalah suatu proses merencanakan, memperoleh, dan menyediakan
informasi yang sangat diperlukan untuk membuat alternatif-alternatif keputusan
(Mehrens & Lehmann, 1978:5).Setiap kegiatan evaluasi atau penilaian merupakan suatu
proses yang sengaja direncanakan untuk memperoleh informasi atau data; berdasarkan
data tersebutkemudian dicoba membuat suatu keputusan.(1)
21
Norman E.Gronlund (1976) merupakan suatu proses yang sistematis untuk
menentukan atau membuat keputusan sampai sejauh mana tujuan-tujuan pengajaran telah
dicapai oleh siswa.(1)
Dari rumusan-rumusan tersebut di atas, ada tiga aspek yang perlu diperhatikan
untuk lebih memahami apa yang dimaksud dengan evaluasi, khususnya evaluasi
pengajaran, yaitu:

Kegiatan evaluasi merupakan proses yang sistemastis. Hal ini berarti bahwa evaluasi
merupakan kegiatan yang terencana dan dilakukan secara berkesinambungan.
Evaluasi bukan hanya merupakan kegiatan akhir atau penutup dari suatu program
tertentu, melainkan merupakan kegiatan yang dilakukan pada permulaan, selama
program berlangsung dan pada akhir program setelah program itu dianggap selesai.
Yang dimaksud dengan program disini ialah program satuan pelajaran yang akan
dilaksanakan dalam satu pertemuan atau lebih, program caturwulan ataupun program
semester, dan juga program pendidikan yang dirancang untuk satu tahun ajaran (D1),
empat tahun ajaran (S1), atau enam tahun ajaran (SD). Dan sebagainya.

Di dalam kegiatan evaluasi diperlukan berbagai informasi atau data yang menyangkut
objek yang sedang di evaluasi. Dalam kegiatan pengajaran, data yang dimaksud
mungkin berupa perilaku atau penampilan siswa selama mengikuti pelajaran, hasil
ulangan atau tugas-tugas pekerjaan rumah, nilai ujian akhir caturwulan, nilai
midsmester, nilai ujian akhir semester, dan sebagainya. Berdasarkan data itulah
selanjutnya diambil suatu keputusan sesuai dengan maksud dan tujuan evaluasi yang
sedang dilaksanakan. Perlu dikemukakan bahwa ketepatan keputusan hasil evaluasi
sangat bergantung kepada kesahihan dan objektifitas data yang digunakan dalam
pengambilan keputusan.

Setiap kegiatan evaluasi khususnya evaluasi pengajaran tidak dapat dilepaskan dari
tujuan-tujuan pengajaran yang hendak dicapai. Tanpa menentukan atau merumuskan
tujuan-tujuan terlebih dahulu, tidak mungkin menilai sejauh mana pencapaian hasil
belajar siswa. Hal ini adalah karena setiap kegiatan penilaian memerlukan suatu
kriteria tertentu sebagai acuan dalam emnentukan batas ketercapaian objek yang
dinilai. Adapun tujuan pengajaran merupakan kriteria pokok dalam penilaian.(1)
B. Fungsi evaluasi
22
Fungsi evaluasi dalam pendidikan dan pengajaran dapat dikelompokkan menjadi
empat fungsi, yaitu:
1. Untuk mengetahui kemajuan dan perkembangan serta keberhasilan siswa setelah
mengalami atau melakukan kegiatan belajar selama jangka waktu tertentu. Hasil
evaluasi yang diperoleh itu selanjutnya dapat digunakan untuk memperbaiki cara
belajar siswa (fungsi formatif) dan atau untuk mengisi rapor atau surat tanda tamat
belajar, yang berarti pula untuk menetukan knaikan kelas atau lulus tidaknya seorang
siswa dari suatu lembaga pendidikan tertentu (fungsi sumatif).
2. Untuk mengetahui tingkat keberhasilan program pengajaran. Pengajaran sebagai
suatu sistem terdiri atas beberapa komponen yang saling berkaitan satu sama lain.
Komponen-komponen yang dimaksud antara lain adalah tujuan, materi atau bahan
pengajaran, metode dan kegiatan belajar mengajar, alat dan sumber pelajaran dan
prosedur serta alat evaluasi.
3. Untuk keperluan bimbingan dan konseling (BK). Hasil-hasil evaluasi yang telah
dilaksanakan oleh guru terhadap siswanya dapat dijadikan sumber informasi atau data
bagi pelayanan BK oleh para konselor sekolah atau guru pembimbing lainnya.
4. Untuk keperluan pengembangan dan perbaikan kurikulum sekolah yang
bersangkutan. Seperti telah dikemukakan di muka, hampir setiap saat guru
melaksanakan kegiatan evaluasi dalam rangka menlai keberhasilan belajar siswa dan
menilai program pengajaran, yang berarti pula menilai isi atau materi pelajaran yang
terdapat di dalam kurikulum.(1)
C. Langkah-langkah dan Prosedur dalam Evaluasi

Proses melakukan evaluasi mungkin saja berbeda sesuai persepsi teori yang
dianut, ada bermacam-macam cara. Namun evaluasi harus memasukkan ketentuan dan
tindakan sejalan dengan fungsi evaluasi, yaitu:
1. Memfokuskan evaluasi
2. Mendesain evaluasi
3. Mengumpulkan informasi
4. Menganalisis informasi
5. Melaporkan hasil evaluasi
6. Mengelola Evaluasi
7. Mengevaluasi evaluasi(3)
D. Model-Model Evaluasi
23
Model evaluasi ialah model desain evaluasi yang dibuat oleh ahli-ahli atau pakar-
pakar evaluasi yang biasanya dinamakan sama dengan pembuatannya atau tahap
pembuatannya. Ada ahli evaluasi yang membagi evaluasi sesuai dengan, isi yang akan
dibawakannya serta kepentingan atau penekanannya atau dapat juga disebut sesuai
dengan paham yang dianutnya yang disebut pendekatan, atau approach.. Evaluasi juga
dibedakan berdasarkan waktu pelaksanaannya, kapan evaluasi dilakukan, untuk apa
evaluasi dilakukan, dan acuan serta paham yang dianut oleh evaluator, dalam buku teks
ini disebut konsep evaluasi. Model-model evaluasi diantaranya:
1. Model Evalusai CIPP
Stufflebeam (1969, 1971, 1983, Stufflebeam & Shinkfield, 1985) adalah ahli yang
mengusulkan pendekatan yang berorientasi kepada pemegang keputusan (a decision
oriented evaluation approach structured). Ia merumuskan evaluasi sebagai “Suatu proses
menggambarkan, memperoleh, dan menyediakan informasi yang berguna untuk menilai
alternatif keputusan” (Stufflebeam, 1973, hlm. 127). Dia membagi evaluasi menjadi
empat macam, yaitu :
a. Contect evaluation to serve planning decision. Konteks evaluasi ini membantu
merencanakan keputusan, menentukan kebutuhan yang akan dicapai oleh program,
dan merumuskan tujuan program.
b. Input evaluation, structuring decision. Evaluasi ini menolong mengatur keputusan,
menentukan sumber-sumber yang ada, alternatif apa yang diambil, apa rencana dan
strategi untuk mencapai kebutuhan. Bagaimana prosedur kerja untuk mencapainya.
c. Proses evaluation, to serve implementing decision. Evaluasi proses untuk membantu
mengimplementasikan keputusan. Sampai sejauh mana rencana telah diterapkan? Apa
yang harus direvisi? Begitu pertanyaan tersebut terjawab, prosedur dapat dimonitor,
dikontrol, dan diperbaiki.
d. Product evaluation, to serve recycling decision. evaluasi produk untuk menolong
keputusan selanjutnya. Apa hasil yang telah dicapai? Apa yang dilakukan setelah
program berjalan? Huruf pertama dari konteks evaluasi dijadikan ringkasan CIPP,
model ini terkenal dengan nama model CIPP oleh Stufflebeam.
2. Evaluasi Model UCLA
Alkin (1969) menulis tentang kerangka kerja evaluasi yang hampir sama dengan
model CIPP. Alkin mendefinisikan evaluasi sebagai suatu proses meyakinkan keputusan,
memilih informasi yang tepat, mengumpulkan , dan menganalisis informasi sehingga
24
dapat melaporkan ringkasan data yang berguna bagi pembuat keputusan dalam memilih
beberapa alternatif. Ia mengemukakan lima macam evaluasi, yakni:
a. Sistem assesment, yang memberikan informasi tentang keadaan atau posisi sistem.
b. Program planning, membantu pemilihan program tertentu yang mungkin akan
berhasil membantu kebutuhan program.
c. Program implementation, yang menyiapkan informasi apakah program sudah
diperkenalkan kepada kelompok tertentu yang tepat seperti yang direncanakan.
d. Program improvement, yang memberikan informasi tentang bagaimana program
berfungsi, bagaimana program bekerja, atau berjalan? Apakah menuju pencapaian
tujuan, adakah hal-halatau masalah-masalah baru yang muncul tak terduga?
e. program certification, yang memberi informasi tentang nilai atau guna program.
3. Model Brinkerhoff
Setiap desain evaluasi umumnya terdiri atas elemen-elemen yang sama, ada
banyak cara untuk menggabungkan elemen tersebut, masing-masing ahli atau evaluator
mempunyai konsep yang berbeda dalam hal iini. Brinkerhoff & Cs. (1983)
mengemukakan tiga golongan evaluasi yang disusun berdasarkan penggabungkan
elemen-elemen yang sama, seperti evaluator-evaluator lain, namun dalam komposisi dan
versi mereka sendiri sebagai berikut:
a) Fixed vs Emergent Evaluation Design. Dapatkan masalah evaluasi dan kriteria
akhirnya dipertemukan?apabila demikian, apakah itu suatu keharusan?
b) Formative vs Summative Evaluation.Apakah evaluasi akan dipakai untuk perbaikan
atau untuk melaporkan kegunaan atau manfaat suatu program?atau keduanya?
c) Experimental and Quasi Experimental Design vs Natural/ Unobtrusive
Inquiry.Apakah evaluasi dakan melibatkan intervensi ke dalam kegiatan
program/mencoba memanipulasi kondisi, orang diperlakukan, variabel dipengaruhi
dan sebagainya, atau hanya diamati, atau keduanya?
Jawaban untuk ketiga pertanyaan tersebut mungkin tidak terlalu tepat (misalnya,
mungkin anda ingin mencoba quisi experimental disign yang melibatkan juga natural
in quiry). Namun kategori –kategori yang dikemukakan oleh pembagian yang luas
inimencerminkan sejumlah macam evaluasi dan kontrol yang anda inginkan selama
proses evaluasi. Menentukan di mana anda berdiri walaupun secara umum, hal ini
akan menolong anda mengembangkan langkah awal yang membantu anda
menerangkan, memberi petunjuk, dan menilai tugas-tugas evaluasi.
a. Fixed vs Emergent Evaluation Design
25
Desain evaluasi yang tetap (Fixed) ditentukan dan direncanakan secara sistematik
sebelum implementasi dikerjakan. Desain dikembangkan berdasarkan tujuan program
disertai seperangkat pertanyaan yang akan dijawab oleh informasi yang akan diperoleh
dari sumber-sumber tertentu. Rencana analisis dibuat sebelumnya di mana si pemakai
akan menerima informasi seperti yang telah ditentukan dalam tujuan. Walaupun desain
fixed ini lebih terstruktur daripada desain emergent, desain fixed juga dapat disesuaikan
dengan kebutuhan yang mungkin berubah. Kebanyakan evaluasi formal yang dibuat
secara individu dibuat berdasarkan desain fixed, karena tujuan program telah ditentukan
dengan jelas sebelumnya, dibiayai dan melalui usulan atau proposal evaluasi.
Desain fixed ini relatif memakan biaya banyak. Kegiatan-kegiatan berkisar antara
membuat pertanyaan-pertanyaan, menyiapkan dan membuat instrumen, menganalisis
hasil evaluasi, dan melaporkan secara formal hasil evaluasi kepada pemakai. Komunikasi
antara evaluator dan audiensi atau klien dilakukan secara teratur, biasanya formal atau
tertulis.
Evaluator berpedoman pada tujuan program untuk merumuskan masalah atau
pertanyaan-pertanyaan desain dan menstimulasi audiensi yang relevan untuk
mengembangkan dan membetulkan pertanyaan tersebut.
Strategi pengumpulan informasi khususnya menggunakan cara-cara formal
(misalnya tes, survei, kuesioner, dan rating scale), juga metode penelitian, kriteria
penelitian seperti validitas internal dan eksternal juga reliabilitas dianggap penting.
Pengumpulan data biasanya secara kuantitatif.
Desain evaluasi emergent. Evaluasi ini dibuat untuk beradaptasi dengan pengaruh
dan situasi yang sedang berlangsung dan berkembang seperti menampung pendapat-
pendapat audiensi, masalah-masalah, kegiatan program. Evaluasi ini menghabiskan
banyak waktu dari permulaan sampai akhir mencari tujuan dan isu, karena semuanya
pada dasarnya tidak dikhususkan dan ditentukan sebelumnya.
Biaya relatif lebih besar. Sumber-sumber dalam desain ditentukan untuk
mengamati program dan memfokuskan pertanyaan lebih lanjut.
Evaluator tidak mendorong audiensi memikir tentang program atau isu evaluasi.
Audiensi menentukan isu-isu penting dan informasi yang diperlukan desain.
Komunikasi antara evaluator dan audiensi terus berkesinambungan selama proses
evaluasi.
Observasi, studi kasus, dan laporan tim penyokong merupakan contoh metode
evaluasi ini. Pengukuran yang tidak selalu berpedoman pada tujuan biasanya dilakukan,
26
dan evaluator sering mengorbankan ketepatan pengukuran untuk lebih berguna. Informasi
yang kualitatif biasanya dikumpulkan. Desain terus berkembang, berubah, dan bereaksi
sesuai dengan situasi dan kondisi yang dapat dikatakan tak pernah berhenti.
b. Formative vs Summative Evaluation
Evaluasi formatif digunakan untuk memperoleh informasi yang dapat membantu
memperbaiki proyek, kurikulum, atau lokakarya. Dibuat untuk digunakan karyawan,
dapat juga mengorbankan kepentingan orang luar untuk lebih bermanfaat bagi program.
Ada yang mengatakan bahwa evaluasi yang paling melindungi program yaitu evaluasi
formatif.
Fokus evaluasi berkisar pada kebutuhan yang dirumuskan oleh karyawan atau
orang-orang program. Evaluator sering merupakan bagian daripada program dan bekerja
sama dengan orang-orang program. Strategi pengumpulan informasi mungkin juga
dipakai, tetapi penekanan pada usaha memberikan informasi yang berguna secepatnya
bagi perbaikan program. Desain evaluasi (Fixed atau emergent) dibuat bersama orang-
orang proyek dan direvisi untuk mencapai kebutuhan mereka.
Evaluasi Sumatif. Evaluasi sumatif dibuat untuk menilai kegunaan suatu
objek.sering diminta atau dibiayai oleh pemakai, oleh pemesan, atau oleh sponsor atau
administrator untuk urusan pajak. Evaluasi sumatif digunakan untuk menilai apakah suatu
program akan diteruskan atau dihentikan saja. Evaluator harus dapat dipercaya oleh
sejumlah audiensi yang akan dipengaruhi oleh keputusan tersebut. Untuk usaha-usaha
yang dibiayai perorangan, evaluasi suamatif ini lebih populer daripada evaluasi formatif.
Tidak begitu populer bagi karyawan program, bagaimana akan dipakai, dan apakah akan
dipakai tergantung kepada pembuat keputusan.
Pada evaluasi sumatif, evaluasi berfokus pada variabel-variabel yang dianggap
penting oleh sponsor atau pembuat keputusan. Evaluator luar atau tim reviu sering
dipakai, karena evaluator internal dapat mempunyai minat yang berbeda. Strategi
pengumpulan informasi akan memaksimalkan validatasi eksternal dan internal yang
mungkin dikumpulkan dalam waktu yang cukup lama.
Desain evaluasi dapat beruapa emergent, dapat juga berupa fixed, dibuat untuk
mencapai kebutuhan sponsor dan pemegang kunci keputusan.
c. Desain Eksperimental dan Desain Quasi Eksperimental vs Natural Inquiry
Beberapa evaluasi memakai metodologi penelitian klasik. Dalam hal seperti ini,
subjek penelitian diacak, perlakuan diberikan, dan pengukuran dampak dilakukan. Tujuan
dari penelitian itu yaitu untuk menilai manfaat suatu objek, suatu program atau strategi
27
baru yang dicobakan. Apabila siswa atau program dipilih secara acak, maka generalisasi
dapat dibuat paa populasi yang agak luas. Namun sepertinya tidak etik untuk
mengintervensi ke dalam lingkungan pendidikan dengan memilih atau memberi
perlakuan. Jadi, sampai sejauh mana lingkungan dapat dimanipulasi dan sampai sejauh
mana suatu strategi dianggap pantas, merupan pemikiran yang cukup serius dalam bidang
ini.
Dalam bebrapa hal, intervensi tidak mungkin dilakukan atau tidak dikehendaki.
Apabila proses sudah terjadi, evaluator harus melihat dokumen-dokumen sejarah,
mempelajari nilai tes, atau menganalisis penelitian yang dilakukan. Bila dianggap penting
untuk mengevaluasi suatu lingkungan atau program agar dapat diperbaiki, evaluator
mungkin memilih mengamatinya, bicara dengan orang-orang yang terlibat, dan selalu
merendah (low profile), sehingga program yang mereka evaluasi tidak terancam dan
mengubah diri karena kehadiran evaluator. Banyak metodologi, termasuk observasi,
survei, analisis meta, studi kasus, dan wawancara dapat dilakukan seperti itu untuk
mengurangi dampak evaluasi pada orang dan proyek, dan memaksimalkan laporan yang
sebenarnya.
Desain penelitian klasik memakan banyak waktu dan biaya yang digunakan untuk
mempersiapkan instrumen untuk menilai perlakuan, data kuantitatif biasanya
dikumpulkan, dan kriteria statistik juga digunakan. Kriteria statistik berfokus pada hasil
program dan dibuat sebelumnya. Interaksi dengan audiensi dilakukan untuk membuat
rencana, mengumpulkan informasi, dan melaporkan kembali.
Strategi pengumpulkan data teutama menggunakan instrumen formal seperti tes,
survei, kuesioner, dan skala rating serta memakai metode penelitian yang standar. Kriteria
penelitian seperti internal dan external validity dianggap penting. Data yang dikumpulkan
kebanyakan kuantitatif. Desain penelitian biasanya dibuat bersama pemesan atau
pemakai. Bila ada perubahan, hanya untuk memperlancar pencapaian tujuan sesuai
rencana.
Desain penelitian Natural Inquiry. Evaluator menghabiskan banyak waktu untuk
mengamati dan berbicara dengan audiensi yang relevan. Strategi yang multiple dan
sumber-sumber dipakai untuk mempertinggi reliabilitas pengumpulan data. Evaluator
merundingkan isu dengan audiensi, hal ini dilakukan sesuai dengan cara evaluator.
Interaksi dengan audiensi berkesinambungan dan informal. Observasi, studi kasus,
28
laporan tim penyokong, merupakan ciri-ciri desain penelitian ini. Demi untuk lebih
berguna, evaluator sering mengorbankan pengukuran dan tujuannya.
4. Model Stake atau Model Countenance
Stake (1967), analisis proses evaluasi yang dikemukakannya membawa dampak
yang cukup besar dalam bidang ini dan meletakkan dasar yang sederhana namun
merupakan konsep yang cukup kuat perkembangan yang lebih jauh dalam bidang
evaluasi. Stake menekankan adanya dua dasar kegiatan dalam evaluasi ialah Descriptions
dan judgement dan membedakan adanya tiga tahap dalam program pendidikan, yaitu:
Antecedents (Context), transaction (Proses), dan Outcomes (Output).
Matrix Description menunjukkan intents (Goasls) dan Observations (Effects)atau
yang sebenarnya terjadi. Judgements mempunyai dua aspek, yaitu Standard dan
Judgments.
Stake mengatakan bahwa apabila kita menilai suatu program pendidikan kita,
melakukan perbandingan yang relatif antara satu program dengan yang lain, atau
perbandingan yang absolut (satu program dengan standard).
Penekanan yang umum atau hal yang penting dalam model ini ialah bahwa
evaluator yang membuat penilaian tentang program yang dievaluasi. Stake mengatakan
bahwa description di satu pihak berbeda dengan judgement atau menilai. Dalam model
ini, antecedents (masukan), transaction (proses), dan outcomes (hasil) data dibandingkan
tidak hanya untuk menentukan apakah ada perbedaan tujuan dengan keadaan yang
sebenarnya, tetapi juga dibandingkan dengan standar yang absolut, untuk menilai manfaat
program. Stake mengatakan bahwa tak ada penelitian dapat diandalkan apabila tidak
dinilai.
E. Pendekatan/Metode dalam Evaluasi (Stecher, Brian M & W. Alan Davis, 1987)

Tak ada satu definisi yang paling tepat untuk menyatakan evaluasi, juga tak ada
prosedur yang paling tepat untuk melakukan evaluasi. Ada beberapa konsep tentang
evaluasi dan bagaimana melakukannya, kita namakan sebagai pendekatan evaluasi.
Istilah pendekatan evaluasi ini diartikan sebagai beberapa pendapat tentang apa tugas
evaluasi dan bagaimana dilakukan, dengan kata lain tujuan dan prosedur evaluasi. Berikut
ini akan dibicarakan beberapa pendekatan memberikan petunjuk bagaimana memperoleh
informasi yang berarti atau tepat untuk klien atau pemakai. Namun masing-masing dalam
29
usahanya berbeda penekanan pada aspek tertentu dalam tahap pengumpulan data, analisis
dan laporannya.
1) Pendekatan Experimental
Pendekatan experimental yaitu evaluasi yang berorientasi pada penggunaan
experimental science dalam program evaluasi. Pendekatan ini berasal dari kontrol
eksperimen yang biasanya dilakukan dalam penelitian akademik. Tujuan evaluator yaitu
untuk memperoleh kesimpulan yang bersifat umum tentang dampak umum tentang
dampak suatu program tertentu yang mengontrol sebanyak-banyaknya faktor dan
mengisolasi pengaruh program. Evaluator berusaha sekuat tenaga menggunakan metode
scientific sebanyak mungkin.
Evaluator menggunakan pendekatan eksperimental melakukan evaluasi seperti
seorang ilmuwan yang melakukan penelitian. Misalnya, termasuk menciptakan situasi
yang dikontrol, dimana beberapa subjek menerima perlakuan, sedang yang lainnya tidak,
dan membandingkan kedua kelompok untuk melihat dampak program. Evaluator
memakai teknik dasar desain eksperimental acak, kelompok kontrol, dan analisis
longitudinal untuk menarik kesimpulan tentang dampak perlakuan.
Kelemahan dari pendekatan eksperimental adalah kontrol tidak dapat dilakukan
begitu ketat dalam kenyataannya atau dalam keadaan yang sebenarnya. Namun, evaluator
akan berusaha sekuat mungkin untuk mengontrol misalnya melalui desain kuasi
eksperimen dan memakai teknik statistik yang canggih seperti analisis covariance untuk
mengatasi perbedaan yang tak dapat dikontrol dalam kondisi program.
Keuntungan dari pendekatan eksperimen ini yaitu kemampuannya dalam menarik
kesimpulan yang relatif objektif, generalisasi jawaban terhadap pertanyaan program yang
bersangkutan. Hal ini membuat pendekatan ini lebih populer, terpercaya, dan disukai
pemakai serta pembuat keputusan.
Pendekatan ini membuat evaluator sebagai orang ketiga yang objektif dalam
program yang menjalankan prinsip-prinsip desain penelitian dalam situasi yang diberikan
untuk memperoleh informasi yang tidak diragukan kebenarannya atas dampak
program.Evaluator sebagai ahli penelitian, jarang ada klien yang mengerti pentingnya
acak, perlunya konsistensi, dan lain-lain. Hal ini merupakan keterbatasan yang harus
diatasi evaluator yang dapat mempengaruhi hubungan antara evaluator dan klien.
30
Evaluator dan klien harus pandai-pandai membawa diri, menjaga hubungan baik dan
harmonis dengan klien, kalau tidak hubungan mungkin jadi renggang dan mungkin akan
menggagalkan pekerjaan evaluator.
2) Pendekatan yang Berorientasi pada Tujuan (Goal Oriented Approach)
Cara yang paling logis untuk merencanakan suatu program yaitu merumuskan
tujuan umum dan tujuan khususdan membentuk kegiatan program untuk mencapai tujuan
tersebut. Hal yang sama juga diperoleh pada pendekatan orientasi tujuan pada evaluasi.
Pendekatan ini memakai tujuan program sebagai kriteria untuk menentukan keberhasilan.
Evaluator mencoba mengukur sampai dimana pencapaian tujuan telah dicapai.
Pendekatan evaluasi semacam ini merupakan pendekatan yang amat wajar dan
praktis untuk desain dan pengembangan program. Model ini memberi petunjuk kepada
pengembangan program, menjelaskan hubungan antara kegiatan khusus yang ditawarkan
dan hasil yang akan dicapai. Peserta tidak hanya harus menjelaskan hubungan tersebut di
atas, tetapi jga harus menentukan hasil yang diinginkan dengan rumusan yang dapat
diukur. Dengan demikian ada hubungan yang logis antara kegiatan, hasil, dan prosedur
pengukuran hasil.
Tidak semua program direncanakan seperti tersebut di atas, merumuskan tujuan
dengan cukup jelas. Maka evaluator yang menganut pendekatan ini akan membantu klien
merumuskan tujuannya dan menjelaskan hubungan antara tujuan dan kegiatan. Bila ini
sudah tercapai maka pekerjaan evaluasi akan menjadi lebih sederhana.
Kalau evaluator berbicara tentang tujuan, klien kebanyakan berbicara tentang
hasil. Namun program dapat mempunyai tujuan dan prosedur. Evaluator juga dapat
membantu klien menerapkan rencana penerapan dan melihat proses pencapaian tujuan
yang memperlihatkan kemampuan program menjalankan kegiatan sesuai rencana. Begitu
tujuan umum dan tujuan khusus terjelaskan, tugas evaluator menentukan sampai sejauh
mana tujuan program telah tercapai. Bermacam-macam alat ukur akan dipakai untuk
melakukan tugas ini, tergantung pada tujuan yang akan diukur. Hasil evaluasi akan berisi
penjelasan tentang status tujuan program. Dalam hal ini keberhasilan diukur dengan
kriteria program khusus bukan dengan kelompok kontrol atau dengan program lain
seperti halnya dalam pendekatan eksperimen. Tentu saja prosedur untuk mengukur
pencapaian tujuan diusahakan sekuat tenaga. Mereka juga memakai analisis statistik bila
dianggap lebih baik. Kelebihan pendekatan yang berorientasi pada tujuan ini ialah
31
terletak pada hubungan antara tujuan dan kegiatan dan penekanan pada elemen yang
penting dalam program yang melibatkan individu pada elemen khusus bagi mereka.
Namun keterbatasan pendekatan ini yaitu kemungkinan evaluasi ini melewati
konsekuensi yang tak diharapkan akan terjadi.
Pendekatan ini mempengaruhi hubungan antara evaluator dan klien, karena proses
memperjelas tujuan ini memerlukan interaksi yang sering dengan klien, maka sifat
independen evaluator tidak seperti pada pendekatan eksperimen. Evaluator lebih bersifat
seperti mentor terhadap klien. Jarang digunakan teknik statistik canggih dalam
pendekatan ini. Hubungan evaluator dan klien menjadi lebih erat. Apabila tujuan sudah
dirumuskan dalam bentuk yang mudah diukur, maka seluruh proses evaluasi menjadi
lebih mudah dan sederhana.
3) Pendekatan yang Berfokus kepada Keputusan (The DecisionFocused Approach)
Pendekatan Evaluasi yang berfokus pada keputusan menekankan pada peranan
informasi yang sistematik untuk pengelola program dalam menjalankan tugasnya. Sesuai
dengan pandangan ini, informasi akan amat berguna apabila dapat membantu para
pengelola program membuat keputusan. Oleh sebab itu, kegiatan evaluasi harus
direncanakan sesuai dengan kebutuhan untuk keputusan program.
Pengumpulan data dan laporan dibuat untuk menambah efektifitas pengelola
program. Selanjutnya karena program sering berubah selama beroperasi dari awal sampai
akhir, kebutuhan pemegang keputusan juga akan berubah, dan evaluasi harus disesuaikan
dengan keadaan tersebut. Pada tingkat perencanaan, pembuat program memerlukan
informasi tentang masalah dan kapasitas organisasi. Selama dalam tingkat implementasi
administrator memerlukan informasi tentang proses yang sedang berjalan. Bila program
sudah selesai, keputusan-keputusan penting akan dibuat berdasarkan hasil yang dicapai.
Sebagai akibatnya, evaluator harus mengetahui dan mengerti perkembangan program dan
harus siap menyediakan bermacam-macam informasi pada bermacam-macam waktu.
Idealnya program dan sistem evaluasi dikembangkan bersama, tapi hal ini tidak selalu
dapat terjadi. Malahan sering evaluator diminta mengevaluasi setelah program berjalan.
Biasanya evaluator bekerja mundur, dari berbagai keputusan untuk mendesain
kegiatan pengumpulan data yang memberikan data yang relevan untuk mengurangi
keragu-raguan. Evaluator memerlukan 2 macam informasi dari klien. Pertama ia harus
mengetahui butir-butir keputusan penting pada setiap periode selama program berjalan.
Kedua ia perlu mengetahui macam informasi yang mungkin akan sangat berpengaruh
32
untuk setiap keputusan. Tentu ada juga ada beberapa keputusan yang dibuat berdasarkan
politik dan pertimbangan lain yang tidak berhubungan dengan informasi yang relevan.
Keunggulan pendekatan ini ialah perhatiannya terhadap kebutuhan pembuat
keputusan yang khusus dan pengaruh yang makin besar pada keputusan program yang
relevan.
Keterbatasan pendekatan ini yaitu banyak keputusan penting dibuat tidak pada
waktu yang tepat, tapi dibuat pada waktu yang kurang tepat. Seringkali banyak keputusan
dibuat tidak berdasarkan data, tapi tergantung pada impresi perorangan, politik, perasaan,
kebutuhan pribadi, dan lain-lain. Dalam hal ini evaluator mungkin dapat memberi
pengaruh positif yang lebih objektif dan rasional.
Pengaruh pendekatan ini pada pemfokusan evaluasi, seperti yang diperkirakan
bahwa proses pemfokusan evaluasi berasal dari pembuat keputusanitu sendiri. Orang
tersebut mungkin direktur program, dewan direksi, kelompokklien, karyawan, dan lain-
lain. Evaluator perlu mengetahui dan emnentukan siapa di antara orang-orang tersebut
yang emmegang kunci keputusan dan berkonsultasi dengannya. Evaluator mencoba
mempelajari sebanyak mungkin tentang konteks keputusan. Keputusan apa yang diambil?
siapa yang memebuat keputusan?apa saja alternatif yang ada?informasi apa yang kiranya
penting dan sebagainya. Misalnya, data yang ada, maka data tersebut tak perlu
dikumpulkan. Sebagai evaluator anda dapat menentukan dan mengumpulkan berbagai
informasi yang pilihannya relevan. Evaluasi model ini dianjurkan untuk beberapa
penelitian, dua orang yang amat terkenal yaitu, Stufflebeam (1971) dan Alkin (1969).
4) Pendekatan yang Berorientasi Kepada Pemakai (The User Oriented Approach)
Sejak tahun sembilan belas tujuh puluhan, evaluasi merupakan suatu komponen
standar dari hampir semua program yang dibiayai masyarakat. Para evaluator menjadi
sibuk, namun banyak yang merasa kurang puas atas hasil usahanya. Ketidakpuasan ini
disebabkan laporan mereka hanya berpengaruh sedikit sekali terhadap program yang
mereka evaluasi. Walaupun evaluasi sudah mencoba mengukur sampai sejauh mana
tujuan program telah dicapai, tapi hasilnya tidak seperti yang mereka harapan.
Sebagai jawaban atas hal tersebut, para peneliti mulai meneliti maslah utilisasi
evaluasi. Mereka mulai mengumpulkan bukti-bukti empiris yang membatasi pemakaian
informasi. Sejumlah faktor-faktor positif berhasil dirumuskan, termasuk keterlibatan
langsung para pemegang kunci keputusan, ketepatan waktu informasi, dan kepekaan
33
terhadap konteks organisasi. Lebih-lebih lagi keterlibatan personel tampaknya memegang
peran penting dalam mempromosikan pemakaian evaluasi.
Karena banyak faktor-faktor positif dapat dipengaruhi oleh perilaku evaluator,
sejumlah peneliti mengembangkan pendekatan baru yang menekankan perluasan
pemakaian informasi. Hal ini disebutkan pendekatan the user oriented. Seperti apa yang
dibayangkan, pamakai informasi yang potensial adalah yang menjadi tujuan utama.
Evaluator dalam hal ini menyadari sejumlah elemen yang cenderung akan
mempengaruhi kegunaan evaluasi. Hal ini termasuk elemen-elemen seperti cara-cara
pendekatan dengan klien, kepekaan faktor kondisi, dan situasi seperti kondisi yang telah
ada (pre-existing cobdition), keadaan organisasi dan pengaruh masyarakat, dan situasi di
mana evaluasi dilakukan dan dilaporkan. Elemen yang paling penting mungkin
keterlibatan pemakai yang potensial selama evaluasi berlangsung. Misalnya, evaluator
memfokuskan evaluasi dengan membentuk kelompok pemakai. Kelompok tersebut akan
menolong membuat kerangka evaluasi, merumuskan pertanyaan-pertanyaan yang
penting, memilih strategi pengukuran, mereviu hasil awal dan menggiring mereka segera
bertindak dan akhirnya menerima hasil evaluasi. Evaluator dalam hal ini mencoba
melibatkan orang-orang penting je dalam proses evaluasi, sehingga mereka akan merasa
tidak asing lagi terhadap informasi atau hasil evaluasi apabila disodorkan kepada mereka,
karena itu juga merupakan hasil kerja mereka. Kurang ditekankan pada laporan akhir dan
lebih banyak melibatkan dan berkomunikasikan dengan erat dengan para pemegang kunci
keputusan.
Evaluator menekankan usaha pada pemakai dan cara pemakaian informasi.
Urusan desain, teknik analisis data atau penjelasan tentang tujuan evaluasi juga mungkin
penting, tapi tidak sepenting yang pertama. Misalnya, apabila kebutuhan pemakai
berubah selama program berjalan, evaluasi juga akan berubah. Hal ini dapat terjadi dalam
pendekatan semacam ini. Evaluator menerima kenyataan bahwa ada hal-hal yang tak
terduga dalam setiap program. Hal-hal diluar program mungkin akan mempengaruhi
program, dan evaluasi yang berguna harus peka terhadap hal tersebut dan harus dapat
beradaptasi.
Kelebihan pendekatan ini ialah perhatiannya terhadap individu yang berurusan
dengan program dan perhatiannya terhadap informasi yang berguna untuk individu
34
tersebut. Hal ini tidak saja membuat evaluasi menjadi lebih berguna, tetapi juga dapat
menciptakan rasa telah berbuat bagi individu tersebut, dan hasil evaluasi akan selalu
terpakai.
Keterbatasan pendekatan ini yaitu ketergantungannya terhadap kelompok yang
sama dan kelemahan ini bertambah besar pengaruhnya sehingga hal-hal lain di luar itu
kurang mendapat perhatian. Kelompok itu dapat berganti komposisi berkali-kali dan ini
dapat mengganggu kelangsungan atau kelancaran kegiatan evaluasi. Akhirnya, mereka
yang lebih banyak bicara dan lebih persuasif dapat berpengaruh lebih besar. Lagi pula,
sulit untuk mengatakan atau meyakinkan bahwa semua minat dapat tertampung.
Pengaruh terhadap pemfokuskan evaluasi. Bila anda menganut pendekatan ini,
yang mementingkan pemakaian informasi bagi klien atau pemakai, maka anda harus
menaruh perhatian yang besar kepada orang-orang yang berpengaruh terhadap keputusan
program dan pada konteks atau lingkungan di nana proses itu dilakukan. Kebanyakan
evaluator mencoba mengenal orang-orang yang kiranya akan memakai informasinya,
memperbanyak partisipasinya dalam proses evaluasi, dan memperdalam perasaan ikut
membuat atau memiliki hasil evaluasi. Jadi, evaluator ini lebih menaruh perhatian pada
situasi dan hubungan antarpersonel dari pada aturan penelitian atau pada keperluan
pengukuran.
Evaluator lebih terlibat dalam kegiatan program daripada evaluator yang
menganut pendekatan lain. Mereka lebih bertindak sebagai prang dalam daripada sebagai
konsultan luar. Sampai tahap tertentu, evaluator seolah-olah sebagai siswa organisasi,
juga sebagai pengamat (observer) dari dinamika program. Evaluator bukan sebagai ahli,
tetapi sebagai rekan yang mencoba menolong untuk hal-hal yang diperlukan organisasi.
Pendekatan dilakukan dengan bersahabat, evaluator mencari pengetahuan tentang fungsi
program dan keperluan orang-orang yang mempengaruhi keputusan. Patton (1986)
menamakan pendekatan ini sebagai “active, reactive, adaptive” di mana evaluator
memberikan ide kepada kelompok pemakai, menerima saran mereka, dan
mengadaptasikan evaluasi sesuai dengan kebutuhan-kebutuhan klien atau pemakai.
Evaluator yang menganut pendekatan ini harus seorang komunikator yang efektif. Karena
interaksi dengan klien dan orang program dapat mempengaruhi kegunaan hasil,
kemampuan berkomunikasikan amat penting. Bahkan laporan tertentu dibuat dalam
35
bentuk yang akkan meningkatkan kegunaannya yaitu: singkat, langsung, laporan
akademis, sajian yang dilengkapi dengan gambar dan grafik, bukan dalam bentuk laporan
tertulis dengan karangan panjang. Pembaca yang tertarik memperdalam penddekatan ini
lebih jauh dapat membaca Patton (1986), Alkin, Daillok, dan White (1979), Braskomp da
Brown (1980).
5) Pendekatan yang Responsif (The Respomsive Approach)
Pendekatan ini merupakan pendekatan yang paling lain dari kelima bentuk
pendekatan yang dibacarakan dalam tulisan ini karena perspektif dalam usulan evaluasi
dan metode pencapaiannya. Evaluasi responsif percaya bahwa evaluasi yang berarti yaitu
yang mencari pengertian suatu isu dari berbagai sudut pandangan dari semua orang yang
terlibat, yang berminat, dan yang berkepentingan dengan program. Evaluator tak percaya
ada satu jawaban untuk suatu evaluasi program yang dapat ditemukan dengan memakai
tes, kuesioner, atau analisis statistik. Tapi setiap orang yang dipengaruhi oleh program
merasakannya secara unik, dan evaluator mencoba menolong menjawab pertanyaan yang
berhubungan dengan melukiskan atau menguraikan kenyataan melalui pendangan orang-
rang tersebut. Tujuan evaluator ialah berusaha mengerti urusan program melalui berbagai
sudut pendang yang berbeda.
Evaluator juga mengadopsi pendekatan yang bermacam-macam dalam
penelitiannya dan dalam masalah mencari tahu dinamika organisasi. Evaluasi responsif
ditandai oleh ciri-ciri penelitian yang kualitatif, naturalistik, bukan kuantitatif. Bukan
mengumpulkan data dengan instrumen tes atau kuesioner, tapi evaluator mengandalkan
observasi yang langsung atau tidak langsung terhadap kejadian dan interprestasi data
yang impresionistik. Evaluator mengobservasi, merekam, menampilkan data, mengecek
pengetahuan awal (preliminary understanding) peserta program, dan mencoba membuat
model yang mencerminkan pandangan berbagai kelompok. Dengan jalan ini evaluator
mencoba responsif terhadap orang-orang yang berkepentingan pada hasil evaluasi, bukan
pada permintaan desain penelitiian atau teknik pengukuran. Tapi bukan berarti evaluator
menghindari pengukuran dan teknik analisis sama sekali. Elemen yang penting dalam
pendekatan responsif ini yaitu pengumpulan dan menyintesis data. Tes tradisional dan
instrumen biasanya merupakan pertimbangan kedua. Data utama dalam pendekatan
responsif yaitu observasi langsung dan tak langsung, dan bentuk laporan ialah studi kasus
36
atau gambaran yang deskriptif. Evaluator bertindak sebagai organisasi antropologis,
pencari pengertian realitas melalui perspektif orang program, peserta program, dan
kelompok lain yang dipengaruhi oleh program tersebut.
Kelebihan pendekatan responsif ini ialah kepekaannya terhadap berbagai titik
pandangan, dan kemampuannya mengakomodasi pendapat yang ambigis dan tidak fokus.
Pendekatan responsif dapat beroperasi dalam situasi di mana terdapat banyak perbedaan
minat dari kelompok yang berbeda-beda, karena mereka dapat mengatur pendapat
tersebut dengan cara yang tepat. Demikian juga evaluasi responsif dapat mendorong
proses perumusan masalah dengan menyediakan informasi yang dapat menolong orang
mengerti isu lebih baik.
Keterbatasan pendekatan responsif ialah keenggananya membuat prioritas atau
penyederhanaan informasi untuk pemegang keputusan dan kenyataan yang praktis tidak
mungkin menampung semua sudut pandangan dari berbagai kelompok.
Pengaruh pendekatan ini terhadap pemfokuskan evaluasi ialah evaluator
menghabiskan banyak waktu berbicara dengan klien, mengamati kegiatan program,
mencoba menyaring hal-hal yang dipandang penting oleh klien, dan masalah-masalah,
konsep-konsep dan isu-isu dari berbagai sudut pandang. Akibatnya, evaluator harus dapat
menempatkan diri di tempat orang lain. Dia tak boleh membuat kesimpulan sendiri, tapi
lebih pada pihak memeriksa dan mengecek kembali kepastian pada sumber data primer.
Hal ini memerlukan kesabaran dan kepekaan. Evaluator mencoba menarik isu dan
masalah dari orang-orang proyek, peserta, klien, dan orang-orang lain yang berhubungan
dengan program. Tidak sebagai agen atau orang luar, evaluator bertindak sebagai
konselor, menolong peserta program, memperjelas pengertian mereka tentang
programnya sendiri. Akibatnya, evaluator harus menjadi pengamatan yang baik, mereka
harus dapat beradaptasi dengan berbagai sudut pandangan tanpa memperlihatkan
penilaian sebagai orang luar.
Evaluator harus dilatih melakukan teknik-teknik penelitian kualitatif. Ini termasuk
strategi open ended atau strategi akhir terbuka untuk pengumpulan data, seperti observasi
dan wawancara yang semi-struktur. Ini termasuk juga teknik mengorganisasi dan analisis
data kualitatif, seperti analisis impressionistic dan indexing.
6) Goal Free Evaluation
37
Alasan menegmukakan goal free evaluation (evaluasi bebas tujuan), dapat
diuraikan secara ringkas sebagai berikut:pertama, tujuan pendidikan tak dapat dikatakan
sebagai pemberian, seperti tujuan lain, ia harus di evaluasi. Lebih jauh lagi, tujuan
biasanya atau umumnya hanya formalitas, dan jarang menunjukkan tujuan yang
sebenarnya dari proyek, atau tujuan berubah. Lagi pula, banyak hasil program penti ng
tidak sesuai dengan tujuan program, misalnya membangun pusat vacational baru akan
menciptakan lapangan kerja baru, hasil yang diinginkan, tetapi tak pernah menghasilkan
tujuan proyek yang nyata. Scriven percaya bahwa fungsi evaluasi bebas tujuan ialah
untuk mengurangi bias dan menambah objektifitas. Dalam evaluasi yang berorientasi
pada tujuan, seorang evaluator dibeitahu tujuan proyek dan karenanya membatasi dalam
persepsinya, tujuan berlaku sebagai penutup mata (blinders), yang menyebabkannya
melewati hasil penting yang langsung berhubungan dengan tujuan.
Misalnya seorang evaluator diberitahu bahwa tujuan program rehabilitasi putus
sekolah ialah:
1) Mengembalikan anak ke sekolah
2) Melatih mereka dengan keterampilan tertentu
3) Memberi pekerjaan yang stabil
Evaluator mungkin menghabiskan waktunya mendesain dan mengukur untuk
melihat hal-hal tersebut, seperti jumlah para putus sekolah kembali ke sekolah, berapa
yang diberi pekerjaan dan tetap bekerja, dan sebagainya. Ini memang tujuan yang
berguna, dan program berhasil, serta sukses dalam mencapai tujuan tersebut. Tapi
bagaimana dengan kenyataan bahwa kejahatan remaja di sekolah menjadi tiga kali lipat
sejak anak putus sekolah dikembalikan? Dampak negatif inilah yang menjadi pemikiran
evaluasi bebas tujuan itu. Dampak negatif yang tak pernah termasuk dalam evaluasi yang
berorientasi pada tujuan atau goal based evaluation. Berikut ini merupakan ciri-ciri
evaluasi bebas tujuan:
a. Evaluator sengaja menghindar untuk mengetahui tujuan program
b. Tujuan yang telah dirumuskan terlebih dahulu tidak dibenarkan menyempitkan fokus
evaluasi.
c. Evaluasi bebas tujuan berfokus pada hasil yang sebenarnya, bukan pada hasil yang
direncanakan.
d. Hubungan evaluator dan manajer atau dengan karyawan proyek dibuat seminimal
mungkin.
e. Evaluasi menambah kemungkinan ditemukannya dampak yang tak diramalkan.
38
Mungkin akann lebih baik apabila evaluasi berorientasi pada tujuan dan evaluasi
bebas tujuan dikawinkan, karena mereka akan saling mengisi dan melengkapi. Evaluator
internal biasanya melakukan evaluasi yang berorientasi pada tujuan, karena ia sulit
menghindar atau mau tidak mau ia akan mengetahui tujuan program, akan tidak pantas
apabila ia tidak acuh. Manajer program jelas ingin mengetahui sampai seberapa jauh
tujuan program telah dicapai, dan evaluator internal akan dan harus menyediakan
informasi untuk manajernya. Di samping itu, perlu diketahui bagaimana orang luar
menilai program bukan hanya untuk mengetahui apa mutunya, tetapi juga untuk
mengetahui apa yangs eharusnya dilakukan, apa yang dilakukan di semua bagian, paada
semua yang telah dihasilkan, secara sengaja atau tidak sengaja. Yang belakangan ini
merupakan tugas evaluator bebas tujuan yang tidak mengetahui tujuan program. Jadi,
evaluasi yang berorientasi pada tujuan dan evaluasi bebas tujuan dapat bekerja sama
dengan baik.
Bila memilih model-model evaluasi atau apapun istilahnya yang harus
dipertimbangkan adalah apakah pendekatan atau konsep sebenarnya yang dimaksud
adalah sama yaitu strategi yang akan dipakai sebagai kerangka kerja dalam melakukan
evaluasi. Apa yang akan dipilih akan tergantung pada maksud dan tujuan evaluasi. Untuk
ini harus memilih teori atau fungsi dari model pendekatan tersebut dan tidak tergantung
pada satu model atau pendekatan atau konsep, harus dikuasai seluk beluk setiap model
yang menjadi pilihan dan tidak menjadi budak dari satu model atau pendekatan.
39
KESIMPULAN (SUMMARY)
 Dari berbagai pengertian tersebut maka yang harus lebih dipahami dari evaluasi
adalah:
1. Kegiatan evaluasi merupakan proses yang sistematis
2. Kegiatan evaluasi ememrlukanberbagai informasi atau data yang menyangkut
objek yang sedang di evaluasi
3. Kegiatan evaluasi tidak dapat dilepaskan dari tujuan-tujuan pengajaran yang hendak
dicapai.
 Evaluasi begitu penting peran dan fungsinya dalam pengembangan dan perbaikan
kurikulum
 Terdapat 7 langkah evaluasi. Evaluasi harus memasukkan ketentuan dan tindakan
sejalan dengan fungsi evaluasi.
 Ada banyak model evaluasi, dimana model-model tersebut dipakai sebagai strategi
atau pedoman kerja pelaksanaan evaluasi program
 Pendekatan evaluasi dapat digunakana sesuai dengan tujuan dan sasaran yang ingin
dicapai seperti waktu pelaksanaannya, kapan evaluasi dilakukan, untuk apa evaluasi
dilakukan, dan acuan serta paham yang dianut oleh evaluator.
LATIHAN (EVALUATION)
1. Jelaskan pengertian evaluasi?

2. Sebutkan fungsi evaluasi?
3. Sebutkan langkah-langkah evaluasi?
4. Sebutkan dan jelaskan beberapa model evaluasi?
5. Sebutkan dan jelaskan pendekatan atau metode evaluasi?
HAND OUT
Program Studi : D IV Kebidanan Pendidik

40
Mata Kuliah : Evaluasi Remsdial Pendidikan
Topik/Sub Topik : Melaksanakan Evaluasi Program
Pendidikan
Tujuan :
1. Tanpa melihat catatan dan buku sumber, mahasiswa mampu menjelaskan kembali
informasi yang harus dikumpulkan dengan benar.
berapa banyak informasi yang harus dikumpulkan dengan benar.
memilih dan mengembangkan instrumen dengan benar.
4. Tanpa melihat catatan dan buku sumber mahasiswa mampu menjelaskan kembali
petunjuk umum tentang pembuatan instrumen dengan benar.
Uraian Materi :
KONSEP EVALUASI PROGRAM
A. MELAKSANAKAN EVALUASI PROGRAM
A. Informasi yang harus dikumpulkan
Informasi yang dikumpulkan yaitu Informasi yang dicari untuk menjawab pertanyaan
– pertanyaan evaluasi. Informasi yang tidak memadai, yaitu informasi yang tidak
dapat dipercaya atau tidak relevan dengan pertanyaan – pertanyaan yang ditanyakan
evaluasi. Informasi yang memadai atau yang baik yaitu informasi yang datang dari
atau yang berasal dari sumber yang dapat dipercaya untuk menjawab pertanyaan
evaluasi.
Memilih sumber informasi atau metode yang tepat biasanya berdasarkan

pertimbangan yang praktis, yaitu informasi yang sudah tersedia, dana yang sudah
tersedia dan dengan prosedur yang dapat dikerjakan.
Apabila telah diketahui bahwa informasi telah ada, ada beberapa prosedur yang dapat
membantu memperoleh informasi yang dikumpulkan. Biasanya tambah banyak
waktu dan sumber yang ada atau yang diberikan, informasi yang diperoleh akan
bertambah lengkap dan berguna informasi tersebut (Brikerhoff 1984).
Ada sejumlah pertimbangan penting yang harus diingat bila memilih informasi, salah
satu antaranya yaitu pertimbanagan tentang biaya efektif (cost effevtiveness)
41
memaksa evaluator untuk memikirkan tentang teknik yang akurat. Tergantungnya
pada evaluator dan klien prioritas apa yang dibuat tentang informasi yang akan
dikumpulkan.
Ada sejumlah pertimbangan yang perlu diingat ketika memilih informasi, umumnya
pertimbngan keungan (cost effectiveness), memaksa evaluator harus memakai teknik
akurasi. Terserah pada klien dan evaluator untuk membuat kriteria dan prioritas
informasi yang akan dikumpulkan. Informasi tersebut paling tidak harus menjawab
pertanyaan tentang evaluasi, dan harus mencapai kriteria – kriteria sebagai berikut :
a. Terpercaya
Informasi yang dapat dipercaya oleh klien yaitu informasi yang akurat, diberikan
oleh orang atau sumber yang juga terpercaya dan benar. Karena hanya informasi
yang dipercaya klien yang akan dipakai.
b. Praktis
Informasi yang praktis yaitu informasi yang diperoleh dengan wajar, tidak mahal,
dan tidak sulit. Sumber dan informasi yang kompleks, analisisnya akan mahal
dan belum tentu akan dipakai karena memakan waktu untuk menganalisisnya.
c. Prioritas
Dihubungkan dengan dana dan waktu. Informasi harus diserahkan tepat pada
waktunya, apabila terlambat, tentu tidak akan berguna lagi bagi pemegang
keputusan. Oleh sebab itu, harus dibuat jadwal dan target sehingga dapat
diselesaikan tepat waktunya dan diserahkan juga pada tepat waktu.
d. Akurasi
Informasi yang akurat, yaitu informasi yang relevan dan terpercaya dan tidak
banyakkesalahan, terutama tentang metode dan proses pengumpulan data dan
analisisnya. Informasi yang tidak akurat, yang banyak kesalahan, akan
memberikan salah tafsir dan dapat menyesatkan klien dan pemegang keputusan.
Oleh sebab itu perlu dimonitor, tentukan bagaimana analisisnya, kalau perlu sea
konsultan luar untuk menganalisis kembali data yang ruwet dan banyak.
Kemudahan Menganalisis
Informasi yang dikumpulkan hendaknya informasi yang dapat dianalisis atau dapat
dikerjakan oleh tenaga yang ada. Paling tidak anda mengerti bagaimana menganalisis
informasi tersebut, atau telah berpengalaman menganalisis informasi semacam itu.
a. Objektivitas
Informasi yang objektif yaitu informasi yang langsung dan yang belum dinodai
oleh klien atau orang lain yang mempunyai minat. Informasi yang bias karena
campur tangan orang lain, bahkan informasi yang tidak bias tetapi tergantung dari
hal tertentu juga tak akan terpakai. Oleh sebab itu, informasi harus direviu, meta
evaluasi diamati sebelum dilaporkan hal ini amat membantu pencapaian kriteria.
b. Kejelasan
Informasi yang jelas yaitu informasi yang mudah dan dapat dimengerti dan tidak
ambigis atau yang dapat memberi penafsiran ganda. Karena laporan yang tidak
praktis, yang bertele – tele dan tidak teratur tidak akan dimengerti oleh klien.
42
c. Pembatasan ruang lingkup
Informasi yang diberikan hendaknya cukup luas untuk menjawab pertanyaan
evaluasi, tetapi jangan terlalu luas sehingga sulit dikelola. Informasi yang banyak
memang memakai ongkos yang banyak, tetapi juga informasi yang sedikit tidak
akan memadai.
d. Keberadaan
Data yang mudah atau murah diperoleh dan sudah ada ini yang diperioritaskan.
Misalnya rekaman, laporan, fail, nilai tes, hasil survei, data demografi dll. Data
yang sudah ada biasanya gratis dan biasanya jarang ternodai atau bias karena
evaluasi yang lain.
e. Manfaat
Informasi yang berguna atau bermanfaat yaitu informasi yang tepat waktu dan
relevan terhadap pertanyaan klien. Informasi yang tidak dapat dipergunakan yaitu
informasi yang tidak tepat waktu dan tidak siap untuk dipakai, tidak perlu
diambil.
1. Beberapa prosedur pengumpulan data kuantatif dan instrumen

Menggunakan prosedur ini menghasilkan data numerik. Data ini disebut
convergent pada fenomena (pendapat, penampilan dan perilaku) dikurangi dan
dimasukan dalam kategori angka, kemudian angka – angka tersebut dapat
disingkat.
Prosedur Yang diukur atau direkam contoh
Observasi perilaku, Perilaku khusus, fisik dan Merekam frekuensi guru

ceklis verbal memakai teknik baru
Analis interaksi Verbal dan interaksi Observasi interaksi kelas
Ceklis dan penemuan Objek yang nyata dicek Redaksi buletin sekolah
atau dihitung dicek untuk materi yang
berhubungan
Penilaian ranting Ranting responden Ahli menilai kebenaran
tentang mutu, usaha, dan kurikulum sekolah
sebagainya
Tes pengetahuan Pengetahuan dan Jurusan dites khusus
keterampilan kognitif untuk pengetahuan hukum
pendidiakan
Survei pendapat Pendapat dan sikap Yang bertanggung jawab
dirate sikapnya
Tes hasil dan analisis Pekerjaan dan tugas Pimpinan diamati dan
khusus dirate bagaimana mereka
mewawancarai.
Menilai diri sendiri Responden menilai Siswa menilai diri sendiri
pengetahuan dan seberapa baiknya mereka
kemampuan mereka. dapat memakai alat
diagnosis yang berbeda.
Kuesioner survei Demografi, ciri – ciri Guru melaporkan berapa
variabel kali mereka memakai
43
sumber materi tertentu
Analisis seri waktu Data terpilih Frekuensi praktikum
dibandingkan dengan siswa yang penting
yang lain beberapa klai. perilaku mereka.
2. Beberapa prosedur pengumpulan data kualitatif
Informasi yang memakai prosedur ini yaitu informasi yang bersifat naratif.
Prosedur kualitatif bertujuan menangkap fenomena yang lebih luas, yang open
ended (terbuka). Data ini lebih sulit dianalisis dan disingkat.
Prosedur Yang diukur atau contoh

direkam
Analisis panjang dan Objek fisik Materi LRC diinventaris
mendetail sebelum dan sesudah
dipakai untuk
mengetahui pemakaian
atau perubahan
Analisi bukti fisik Sisa atau hasil lain Tempat sampah dilihat
diamati sesudah lokakarya untuk
mengetahui apa yang
dibuang
Studi kasus Orang – orang yang Bebrapa lulusan dari
berpengalaman dan setiap program didatangi
terpilih diproyek dan diwawancarai
Wawancara kelompok Jawaban dan pendapat Pemimpin jurusan
dan individu individu mewawancarai siswa
tentang edikuasi mata
kuliah
Panel, mendengar Pendapat, ide Tim guru memeriksa
penilaian kebutuhan
survei data untuk
penafsiran
Analisis rekaman Rekaman, fail, kuintasi Sumber – sumber
kuintasi dianalisis untuk
melihat yang sedang
digemari
Buku harian Perilaku dan reaksi Praktikum siswa terus
direkam secara naratif dicatat
Simulasi Perilaku siswa dalam Direkam dalam video
simulasi direkam
Tim penasehat dan Ide dan pandangan orang Tim diminta bertemu dan
penyokong – orang terpilih menilai manfaat program
Riviu penilaian Bukti – bukti kegiatan Tim juri meriviu data
program ditimbang dan praktikum untuk
dinilai menentukan apakah akan
44
diulang atau tidak
Analisis sistem Komponen dan sub Evaluator menginterviu
komponen dan fungsi karyawan tentang
diuraikan program dan diuraikan
dalam sistem analisis.
B. Berapa Banyak Informasi yang Harus Dikumpulkan
Sampling ialah memilih satu porsi dari seluruh kelompok untuk mewakili seluruh
kelompok tersebut. Porsi ini dikenal dengan nama sampel, seluruh kelompok
disebut populasi. Bila membuat sampel, maksudnya akan mempelajari populasi
tanpa mengukur seluruh populasi.
Sampling sama dengan jalan pintas. Hal ini dapat menyingkat waktu dan uang,
dengan memilih satu porsi dari anggota yang potensial dari populasi untuk
memperoleh informasi. Seperti jalan pintas yang lain, risikonya yaitu membuat
keputusan atas dasar informasi yang tidak memadai.
1. Metode Sampling
Ada dua macam metode saml\pling yaitu random (acak) dan purposive
(disebut juga objektif dan subjektif).
Metode acak dipakai untuk membuat sampel dengan tingkat keacakan

tertentu, bebas, dari bias. Dapat memakai perhitungan statistik untuk
menggeneralisasi penemuannya pada tingkat kebenaran tertentu.
Metode purposive, dipakai untuk membuat sampel yang akan mewakili sudut
pandang tertentu atas penialaian mereka yang memilih sampel. Berikut ini
beberapa metode sampling yang biasa digunakan, berikut contoh – contoh dari
metode ini (Brinkerhoff, 1983).
a. Random
1. Straight random sampling
Memilih sampel dengan metode acak, populasi ditentukan
sebelumnya. Porposi sampel menentukan tingkat ketetapan populasi
yang diwakilinya. Tambah besar sampel, bertambah tinggi ketepatan
generalisasinya.
Misalnya, P2LPTK melakukan random sampling untuk menentukan
tingkat kesiapan rata – rata guru yang diangkat di Jakarta.
2. Quota sampling
Sampel diambil dari populasi dengan kriteria tertentu dan dibuat
sebagai ukuran kategori tersebut. Misalnya, sampel orang tua murid,
dapat diambil secara acak dari daftar yang telah ditentukan
sebelumnya dari siswa yang orang tuanya berpendapatan tinggi,
sedang atau rendah. Hal ini tak dapat dilakukan dengan straigt random
45
sampling. Misalnya, universitas melakukan survei terhadap 5%
lulusan, pada setiap golongan pendapatan dan suku yang berbeda
untuk menentukan manfaat kurikulum tertentu dan tingkat
kepekaannya terhadap budaya yang berbeda.
3. Stratified sample
Sampel diambil dari beberapa strata, seperti mahasiswa tingkat I,II,III
atau guru, administrator, direktur dll. Stratified sample bermanfaat
apabila anda berminat pada salah satu strata lebih dari yang lain, dan
apabila sample lebih banyak dari strata yang lainnya. Setiap stratum
dianggap sebagai populasi. Misalnya, sebuah institusi melakukan
survei terhadap KB kepada semua direktur yang ada sebanyak 15
orang, 50% dari 40 orang administrator, 10% dari 1500 orang dosen.
4. Matrix sample
Metode ini mengambil sampel baik dari populasi tertentu, mauoun
misalnya dari butiran – butiran tes suatu instrumen tertentu. Hal ini
dapat dilakukan apabila respenden dan instrumen jumlahnya besar.
Lebih efektif apabila setiap responden hanya menjawab sejumlah butir
dari suatu instrumen. Bila butir tes diacak dan responden juga diacak,
maka generalisasi dapat diberikan untuk seluruh populasi dan
instrumen. Metode ini bermanfaat untuk survei yang luas atau program
tes yang besa tetapi dalam hal ini digunakan apabila nilai individu
tidak diperlukan. Misalnya untuk menentukan apakah suatu penataran
memberi dampak atas pengetahuan tentang KB, 10% peserta diberi tes.
Untuk memperpendek tes, setiap orang hanya menjawab 10 butir dari
50 butir instrumen.
b. Purposive
1. Key informant
Metode sampel individual ini dipakai untuk mengumpulkan informasi
tentang kondisi dan situasi tertentu. Misalnya, wakil persatuan,
pemimpin guru, pemimpin masyarakat, orang – orang terkemuka,
dapat dimintai informasi yang tepat tentang sikap guru dan pendapat
mereka, isu – isu masyarakat dan sebagainya. Misalnya panitia
lokakarya meminta informasi dari 5 ornag peserta untuk meperoleh
umpan balik, kelima peserta dipilih karena kelimanya adalah ketua
kelompok.
2. Expert judqes
Metode ini melibatkan sampling orang – orang yang mempunyai
keahlian terteentu, tantang kondisi atau ilmu pengetahuan tertentu
yang diminati.
46
Bila ingin mengetahui hal – hal tertentu sehubungan dengan keahlian
orang tersebut, wawancara satu jam dengan orang tersebut dapat
menyingkat waktu berjam – berjam dibanding dengan membaca
literatur tentang masalah tersebut. Misalnya, suatu institut melakukan
studi kasus terhadap karyawan lulusannya yang dianggap berhasil
dalam programnya, untuk melihat apakah persiapan mereka (institut
tersebut) cukup atau tidak dan untuk memperoleh ide – ide dan
pendapat untuk perbaikan – perbaikan.
3. Extreem group
Metode ini mencari sudut pandang yang konflik atau ekstrem, sedang
metode random bertujuan menghindari bias dan mencari rata – rata
atau ciri – ciri khusus. Extreem group sample sengaja tidak
mengacuhkan pendapat yang umum tetapi pendapat yang ekstrem.
Direktur – direktur program walaupun misalnya jumlahnya kecil
tentang situasi dan kondisi program, misalnya tentang kelemahan –
kelemahan, bahkan kelebihan – kelebihan program. Misalnya follow
up interview (wawancara lanjut) dilakukan terhadap siswa yang drop
out dari program.
4. Grapevine sampling
Metode ini memerlukan sampel yang berkembang atau tumbuh,
diamana setiao sampel ditentukan oleh sampel sebelumnya (anggota
sampel yang terdahulu). Misalnya untuk meminta informasi tentang
sikap tertentu guru – guru disebuah sekolah, dapat ditanya kepala
sekolahnya tentang sikap tertentu anggotanya, sikap negatif, positif
dan lain – lain. Kepala sekolah diwawancarai guru yang telah diantar,
lalu guru yang menyarankan penataran dan kemudian kepada guru
yang menatar dan demikian seterusnya untuk lebih banyak
memperoleh informasi sampel berulang ke yang pertama.
C. Memilih dan Mengembangkan Instrumen
Instrumen adalah alat untuk merekem informasi yang akan dikumpulkan. Banyak
macam instrumen, antara lain wawancara, kuesioner, tes, ceklis, observasi dll.
Instrumen harus dipilih dan didesain dengan hati – hati. Instrumen yang tidak
tepat akan merusak rencana pengumpulan informasi. Hal ini penting yang harus
diingat dalam proses pembuatan instrumen yaitu menentukan apa yang
diperlukan, memilih, mengembangkan atau membuat instrumen.
Beberapa instrumen yang biasa dipakai dalam prosedur pengumpulan informasi,

yaitu:
47
1. Surveys
a. Open ended instruments (instrumen terbuka)
b. Forced choice instruments (instrumen tertutup)
2. Interviews
a. Closed formats, wawancara dengan format tertutup, pertanyaan dan
jawaban dibacakan kepada responden.
b. Semi open (semi terbuka), pertanyaan ditentukan dan pewawancara
membuat interpretensi jawaban kedalam formulir.
c. Open format (format terbuka), petunjuk umum diberikan kepada
pewawancara, jawaban didesain atau catatan, direkam dengan tape.
3. Observations
a. Open format, observer membuat catatan atau reaksi umum, perilaku dan
sebagainya tentang subjek yang dievaluasi.
b. Logs, semacam buku harian dimana observer mencatat reaksi dan perilaku
sendiri.
c. Sign system, diamana setiap perilaku khusus dihitung, dilakukan untuk
merekam perilaku tentenu dalam tempo waktu yang telah ditentukan.
d. Catagory system, dimana perilaku diamati, digolongkan kedalam kategori
tertentu untuk membuat rekaman tentang perilaku yang telah ditentukan
dalam waktu yang telah ditentukan.
4. Test
a. Multiple choice test (tes pilihan ganda)
b. True false (salah benar)
c. Matching (tes menjodohkan)
d. Short answers, fill in blanks (jawaban pendek, mengisi)
e. Essay tests (tes uraian)
5. Inventories
a. Open ended, yaitu responden membuat catatan tentang objek tertentu dan
item yang mereka temukan.
b. Checlist format, yaitu responden mengecek, atau menghitung dan
memberi nomor disebalh item yang terdaftar.
6. Site visits, expert reviews, panel hearings
Dalam prosedur diatas, dapat dianggap bahwa orang itu sendiri sebagai
instrumen. Instrumen bentuk ini dapat berupa :
a. Para ahli
b. Wakil konsumen
c. Anggota, karyawan
d. Publik
e. Orang tua murid, dll.
D. Petunjuk Umum Dalam Pembuatan Instrumen (Brinker hoff 1986)
1. Konten yang diperlukan
48
Hal ini langsung berhubungan dengan variabel yang telah ditentukan
sebelumnya. Konten intrumen harus dibatasi sebatas apa yang termasuk dalam
variable.
2. Bahasa yang akan dipakai

Hal ini bergantung dari responden yang akan menjawab instrumen. Apakah
responden adalah orang yang berpendidikan rendah, sedang atau tinggi, yang
harus diingat yaitu hindari pemakaian bahasa asing, istilah – istialah asing
yang aneh.
3. Analisis yang dipakai

Bila akan memakai mesin scoring atau coding automatic atau manual, maka
instrumen harus disiapkan untuk itu.
4. Pertimbangan khusus
Dalam hal ini mungkin termasuk versi khusus untuk responden yang cacat
(handicapped), yang memerlukan petunjuk khusus dan lain sebagainya. Perlu
dibuat rencana (blue print) dan kisi – kisi untuk setiap instrumen yang akan
dibuat atau mungkin memerlukan konsultasi dari teman – teman atau ahlinya.
5. Ketepatan yang diperlukan

Kelengkapan ketepatan waktu dalam desimal atau persentasi dan sebagainya.
6. Kapasitas responden
Kemampuannya, pendidikan dan penataran yang telah dilakukan sehubungan
dengan hal yang akan diukur.
7. Kesesuaian dengan rencana analisis

Mengetahui sebelumnya apa yang akan dilakukan terhadap data sesudah
terkumpul, akan membantu menentukan ketepatan yang diperlukan, keteptan
pengukuran dapat diperoleh, misalnya dengan membuat instrumen yang lebih
rinci, petunjuk, jawaban dan kategori.
Sebelum membuat instrumen, sediakan waktu untuk mengecek apakah telah

ada instruemen serupa, walaupun nanti perlu diperbaiki dan dimodifikasi
sesuai dengan masalah. Informasi tentang itu dapat diperoleh dari teman
sejawat, publiser materi dan tes, katalog, proyek lain atau program serupa,
perpustakaan dan lain – lain
Setelah instrumen ditemukan, periksalah instrumen tersebut demi keperluan,

apakah konteksnya sesuai dengan keperluan, apakah variabel – variabelnya
sama, apakah ada konten yang hilang, apakah ketepatannya cukup, apakah
intrumen didapatkan pada waktu yang tepat, apakah dapat terjangkau dll.
49
Apabila tidak ada yang memadai untuk keperluan maka tentu harus membuat
instrumen sendiri.
Buatlah tabel kisi – kisi. Konten sesai dengan variabel yang telah ditentukan
ketepatannya, keputusan apa yang akan bergantung pada hasil pengukuran,
siapa respondennya akan menentukan bahasa yang akan dipakai. Analisisnya
bagaimana, bagaimana daya rekam instrumen, dll.
Jelaskan dasar konsep desain instrumen tentu akan dibuat asal – asalan, tetapi
memerlukan desain yang konseptual.
Buatlah konsep (draft) instrumen, periksalah konsep tersebut, cek kejelasan

dan kemudahan membacanya dan lakukan revisi konsep. Bertambah sering
konsep diperiksa bertambah baik instrumen yang dibuat.
Uji coba instrumen untuk memeriksa validitas dan realibilitasnya, apakah

sudah memenuhi syarat atau belum, lakukan pengecekan sehingga validitas
dan relibilitas yang diharapkan tercapai.
1. Periksalah instrumen yang telah dibuat

a. Validitasnya, instrumen menghasilkan informasi yang benar, berguna
dan autentik tentang apa yang diukur dan direkam.
b. Realibitasnya, instrumen mengukur dan merekam dengan akurat,
kesalahan diusahakan seminimum mungkin pada skor dan informasi
yang diperoleh dari instrumen.
c. Instrumen tidak berubah atau mempengaruhi objek yang diukur dan
yang direkam (adakalanya beberapa butir tes akan memberikan kunci
jawaban yang benar pada item yang lain). Hal ini harus dihindari
dengan membuat instrumen secermat mungkin.
d. Kesesuaian dengan responden, bahasa yang digunakan sesuai dengan
tingkat pendidikan dan pengetahuan responden.
e. Sesuai dengan analisis yang dikehendaki dalam jumlah dan kategori
yang telah direncanakan.
f. Ekonomis, instrmen tidak mahal, dalam memilih, mengembangkan,
menguji coba, merevisi, mengumpulkan, menganalisis dan
menginterpretasi harus mempertimbangkan kemampuan dalam segi
biaya dan waktu. Dalam hal ini juga memerlukan kesabaran dan
ketelitian pada saat menghadapi responden.
2. Validitas dan reabilitas instrumen

Validitas dan reabilitas merupakan ciri – ciri instrumen yang harus ada
pada setiap instrumen yang akan dipakai untuk mengumpulkan data.
Kalau tidak ada, mungkin anda akan mengumpulkan informasi yang tidak
tepat.
50
Validitas menunjukan kebenaran dan keaslian data yang dikumpulkan
instrumen. Instrumen harus mengukur apa yang harus diukur sesuai
dengan rencana.
Reabilitas menunjukan ketepatan pengukuran. Tambah banyak kesalahan

dalam pengukuran bertambah kecil relibilitas instrumen. Validitas dan
reliabilitas dapat dicapai dengan membuat desain instrumen dengan
cermat. Juga dengan melakukan uji coba, revisi instrumen dan prosedur
pengumpulan informasi.
3. Macam – macam validitas dan reliabilitas

a. Validitas
1. Content validity, apakah instrumen bersi materi yang benar, apakah
butir – butir tes konsisten dengan konten belajar, apakah perilaku
berhubungan dengan diagnosis kemampuan, apakah penilaian
mewakili tingkat kriteria.
2. Concurrent validity, apakah pengukuran memberikan hasil yang
konsisten dengan beberapa pengukuran yang independen,
misalnya, apakah self rating tentang pengetahuan berhubungan
dengan skor dalam tes pengetahuan.
3. Predictive validity, apakah kemampuan pengukuran meramalkan
pengukuran yang akan datang, apakah skor pada wawancara untuk
penerimaan dapat meramalkan keberhasilan dalam program
tersebut.
4. Contant validity, hal ini berhubungan dengan teori melatar
belakangu pengukuran dan memerlukan penelitian untuk
mengembangkan. Contoh untuk contant valibity, yaitu penelitian
untuk menentukan apakah orang yang mencapai skor yang baik
dalam lokakarya merupakan seorang mahasiswa yang memberi
hasil belajar yang baik. Atau penelitian untuk menentukan apakah
kemampuan memberi reinforcement yang positif berhubungan
dengan keberhasilan siswa.
b. Reliabilitas
1. Stability reoeatibility, suatu tes atau alat ukur yang menghasilkan

skor yang konsistenisten dari waktu ke waktu dikatakan reliabilitas
stabil. Penilaian konten suatu produk, misalnya, tidak akan
menghasilkan skor yang berbeda, skor tidak tergantung pada kapan
dan dimana analisis dilakukan.
51
2. Inter judge atau rater agreement, suatu penilaian harus
mencerminkan ciri – ciri objek yang dinilai, bukan perbedaan
antara pemakaian instrumen.
3. Equivalency, hal ini berhubungan dengan tingkat konsistensi antara

2 bentuk pilihan dari tes yang sama. Apabila tes ekuivalen
(memberi skor yang sama) maka perbedaan waktu dapat dikatakan
sebagai hasil pengajaran, bukan sebagai hasil karena telah
mengambil tes sebelumnya.
4. Internal consistency, hal ini berhubungan dengan betapa

sekelompok item (butir tes) saling berhubungan. Mengestimasi
reliabilitas semacam ini dapat dilakukan dengan mengecek tingkat
– tingkat korelasi antara split halves tes tersebut.
52
Kode Mata Kuliah : -
Topik : Gradding system ABCDE dengan sistim PAN dan PAP
Objektif Perilaku Siswa (OPS);

4. Setelah mengikuti pelajaran ini mahasiswa dapat menjelaskan perbedaan
penskoran dan penilaian dengan baik sesuai penjelasan.
5. Mahasiswa mampu menjelaskan menjelaskan prinsip – prinsip penilaian dengan
benar tanpa melihat catatan.
6. Mahasiswa mampu menjelaskan mampu menjelaskan perbedaan sistim penilaian
dengan PAN dan PAP secara tepat sesuai penjelasan yang diberikan
Referensi
1. Purwanto, Ngalim. 2008. Prinsip-prinsip dan Teknik Evaluasi Pengajaran.

Bandung : PT. Rosda Karya (BAB IV; 70 – 100).
2. Sukardi, H.M. 2008. Evaluasi Pendidikan; Prisip dan Operasionalnya.jakarta. Bumi
Aksara (hal 58 – 59)
3. Arikunto, Suharsisni. 2002. Dasar – Dasar Evaluasi; Edisi revisi. Jakarta. Bumi
Aksara. (hal 241- 259)
4. Gulo, W. 2005, Strategi Belajar Mengajar. Jakarta : Grasindo
5. Sukardi, E dan Maramis. 1986. Penilaian Keberhasilan Belajar. Jakarta : Erlangga
University
6. Sirait, Bistok. 1985. Menyusun Tes Hasil Belajar. Semarang : Press
7. Http : //nandangfkip.blogspot.com/2008/07/penilaian-pan-dan-pap. 2459.html
53
8. http ://blogwirabuana.wordpress.com/2011/03/16/penilaian-acuan-norma-pan-dan-
penilaian-acuan-patokan-pap.
Pendahuluan
‘Evaluation is a process which determines the extent to which objectives have

been achieved ( Cross, 1973;5). Evaluasi merupakan proses yang menentukan kondisi,
dimana suatu tujuan telah dapat dicapai. Definisi ini secar langsung menerangkan
hubungan evaluasi dengan suatu kegiatan yang mengukur derajat, dimana suatu tujuan
dapat di capai. Evaluasi juga merupakan proses memahami, member arti, mendapatkan
dan mengkomunikasikan suatu informasi bagi keperluan pengambil keputusan. (Sukardi,
MS, 2008 hal 1)
Menurut Undang – Undang Republik Indonesia Nomor 20 Tahun 2003 tentang
Sistem Pendidikan Nasional pasal 57 ayat (1)yaitu; “ Evaluasi dilakukan dalam rangka
pengendalian mutu pendidikan secara nasional sebagai bentuk akuntabilitas
penyelenggaraan pendidikan kepada pihak – pihak yang berkepentingan, diantaranya
terhadap peserta didik, lembaga dan program pendidikan”. (Sukardi, MS, 2008 hal 1).
Untuk pencapaian tujuan penddikan perlu penilaian terhadap peserta didik. Ada
bermacam – macam penilaian yang dilakukan diantaranya sistim penilaian ABCDE
dengan PAN dan PAP. PAN ( Patokan Acuan Norma) merupakan pengukuran yang
mendeskripiskan penampilan atas dasar posisi relative seorang siswa terhadap siswa lain
di dalam kelompok atau kelasnya. Sedangkan PAP ( Patokan Acuan ) merupakan hasil
penampilannya dalam mengerjakan suatu tes pengukuran. Pada penialain acuan patokan
ini hasil penampilan seorang siswa menunjukkan posisinya sendiri tanpa membandingkan
dengan hasil penampilan siswa sendiri. (Sukardi, MS hal 22- 23).
Uraian Materi
54
A. Penskoran dan penilaian (scoring and grading)
Penskoran merupakan langkah pertama dalam proses pengolahan hasil
tes pekerjaan siswa atau mahasiswa. Penskoran adalah suatu proses perubahan
jawaban-jawaban tes menjadi angka-angka (mengadakan kuantifikasi). Sedangkan
penilaian adalah proses menentukan nilai suatu obyek dengan menggunakan
ukuran atau kriteria tertentu, seperti Baik , Sedang, Jelek.
Angka-angka hasil pensekoran itu kemudian diubah menjadi nilai-nilai
melalui proses pengolahan tertentu. Penggunaan simbol untuk menyatakan nilai-
nilai itu ada yang dengan angka, seperti angka dengan rentangan 0 – 10, 0 – 100,
atau 0 – 4, dan ada pula yang menggunakan huruf A, B, C, D, dan E.
Cara menskor hasil tes biasanya disesuaikan dengan bentuk soal-soal tes
yang dipergunakan, apakah tes objektif atau tes essay. Untuk soal-soal objektif
biasanya setiap jawaban benar diberi skor 1 (satu) dan setiap jawaban yang salah
diberi skor 0 (nol); total skor diperoleh dengan menjumlahkan skor yang
diperoleh dari semua soal.
Untuk soal-soal essay dalam penskorannya biasanya digunakan cara bobot
(weighting) kepada setiap soal menutur tingkat kesukarannya atau banyak
sedikitnya unsur yang harus terdapat dalam jawaban yang dianggap paling baik.
Misalnya: untuk soal no. 1 diberi skor maksimum 4, untuk soal no. 3 diberi skor
maksimum 6, untuk soal no. 5 skor maskimum 10, dan seterusnya.
Di lembaga-lembaga pendidikan kita, masih banyak pengajaran yang
melakukan penskoran soal essay, proses penskoran dan penilaiaan biasanya tidak
dibedakan satu sama lain; pekerjaan siswa atau mahasiswa langsung diberi nilai,
jadi bukan di skor terlebih dahulu. Oleh karena itu, hal ini sering kali
menimbulkan terjadinya halo effect, yang berarti dalam penilaiannya itu diikut
sertakan pula unsur-unsur yang relevan seperti kerapian dan ketidak rapian
tulisan, gaya bahasa, atau panjang-pendeknya jawaban sehingga cenderung
menghasilkan penilaian yang kurang andal.
55
Hasil penilaian kurang objektif. Jika tes yang berbentuk soal-soal essay
tersebut dinilai oleh lebih dari satu orang, sering kali terjadi perbedaan-perbedaan
di antara penilaian, bahkan juga hasil penilaian seseorang penilai sering kali
berbeda terhadap jawaban-jawaban yang sama dari soal tertentu. Kesalahan
seperti ini tidak akan selalu terjadi jika dalam pelaksanaannya diadakan
pemisahan antara proses penskoran dan penilaian.
B. Prinsip – Prinsip dalam Penilaian

Adapun beberapa prinsip penilaian sebagai berikut ;
1. Penilaian hendaknya dilakukan atas hasil pengukuran yang
komprehensif.
Penilaian didasarkan atas sampel prestasi yang cukup banyak, baik
macamnya maupun jenisnya. Untuk itu dituntut pelaksanaan penilaian
secra berkesinambungan dan penggunaan bermacam – macam teknik
pengukuran. Dengan macam dan jumlah ujian yang lebih banyak,
prestasi siswa dapat diungkapkan secara lebih mantap meskipun harus
pula dicatat bahwa banyaknya macam dan jumlah ujian harus
dibarengi dengan kualitas soal- soal, sesuai dengan fungsinya sebagai
alat ukur.
2. Harus dibedakan antara penskoran (scoring) dan penilaian (grading).
Perbedaannya,bahwa penskoran berarti proses pengubahan prestasi
menjadi angka – angka, sedangkan penilaian memproses angka –
angka hasil kuantifikasi prestasi itu dalam hubungannya dengan
“kendudukan” personal siswa dan mahasiswa didalam skala tertentu,
misalnyatentang baik – buruk, bisa diterima – tidak bisa diterima,
dinyakan lulus – tidak lulus. Dalam penskoran terutama pada
56
kecermatan dan kemantapan (accuary) dan reliability; sedangkan
pada penilaian, perhatian terutama kepada validitas dan kegunaan
(validity and utility).
3. Dalam pemberian nilai hendaknya diperhatikan dua macam
orientasi, yaitu penilaian yang non – referenced dan yang criterion –
referenced.
Norm – referenced evaluation adalah penilaian yang diorientasikan
kepada suatu kelompok tertentu. Hasil evaluasi perseorangan siswa
atau mahasiswa dibandingkan dengan prestasi kelompoknya. Prestasi
kelompok menjadi patokan atau norm dalam menilai siswa secara
perorangan.
7. Kegiatan pemberian nilai hendaknya merupakan bagian integral dari
proses belajar-mengajar. Ini berarti bahwa tujuan penilaian, di
samping untuk mengetahui status siswa dan menaksirkan kemampuan
belajar serta penguasaannya terhadap bahan pelajaran, juga digunakan
sebagai feedback (umpan balik), baik kepada siswa sendiri maupun
bagi guru atau pengajar. Dari hasil tes, pengajar dapat mengetahui
kelebihan dan kelemahan siswa tertentu sehingga selanjutnya ia dapat
melakukan koreksi terhadap kesalahan yang diperbuatnya.
8. Penilaian harus bersifat komparabel. Artinya, setelah tahap
pengukuran yang menghasilkan angka-angka itu dilaksanakan,
prestasi-prestasi yang menduduki skor yang sama harus memperoleh
nilai yang sama pula. Atau, jika dilihat dari segi lain, penilaian harus
dilakukan secara adil, jangan sampai terjadi peng-anakemasan.
Penilian yang tidak adil mudah menimbulkan frustasi pada siswa dan
mahasiswa, yang selanjutnya dapat merusak perkembangan psikis
siswa dan mahasiswa sehingga pembentukan afektif dirusak
karenanya.
9. Sistem penilaian yang dipergunakan hendaknya jelas bagi siswa dan
bagi pengajar sendiri. Sumber ketidakberesan dalam penilaian
terutama adalah tidak jelasnya sistem penilaian itu sendiri bagi para
57
guru atau pengajar; apa yang dinilai serta macam skala penilaian yang
dipergunakan dan makna masing-masing skala itu.
C. Jenis – jenis Penilaian dalam Pendidikan.

a. Penilaian Acuan Norma
1) Pengertian PAN
PAN (Norm Referenced Evaluation) dikenal pula dengan sebutan
“Standar Relatif” atau norma kelompok. Pendekatan ini menafsirkan
hasil tes yang diperoleh siswa dengan membanding-kannya dengan hasil
tes siswa lain dalam kelompoknya.
Ada beberapa pendapat lain tentang pengertian Penilaian Acuan Norma,
yaitu;
 Acuan norma merupakan elemen pilihan yang memeberikan
daftar dokumen normatif yang diacu dalam standar sehingga
acuan tersebut tidak terpisahkan dalam penerapan standar. Data
dokumen normatif yang diacu dalam standar yang sangat
diperlukan dalam penerapan standar.
 Pengolahan dan pengubahan skor mentah menjadi nilai
dilakukan dengan mengacu pada norma atau kelompok. Cara ini
dikenal sebagai penilaian acuan norma (PAN).
 PAN adalah Nilai sekelompok peserta didik (siswa) dalam suatu
proses pembelajaran didasarkan pada tingkat penguasaan di
kelompok itu. Artinya pemberian nilai mengacu pada perolehan
nilai di kelompok itu.
 Penilaian Acuan Norma (PAN) yaitu dengan cara
membandingkan nilai seorang siswa dengan nilai kelompoknya.
Jadi dalam hal ini prestasi seluruh siswa dalam kelas / kelompok
dipakai sebagai dasar penilaian.
Dari beberapa pendapat diatas dapat disimpulkan bahwa, Penilaian
Acuan Norma adalah penilaian yang dilakukan dengan mengacu pada
norma kelmpok; nilai-nilai yang diperoleh siswa diperbandingkan
58
dengan nilai-nilai siswa yang lain yang termasuk di dalam kelompok
itu.
2) Ciri Penilaian Acuan Normatif :

 Penilaian Acuan Normatif digunakan untuk menentukan status
setiap peserta didik terhadap kemampuan peserta didik lainnya.
Artinya, Penilaian Acuan Normatif digunakan apabila kita
ingin mengetahui kemampuan peserta didik di dalam
komunitasnya seperti di kelas, sekolah, dan lain sebagainya.
 Penilaian Acuan Normatif menggunakan kriteria yang bersifat
“relative”. Artinya, selalu berubah-ubah disesuaikan dengan
kondisi dan atau kebutuhan pada waktu tersebut.
 Nilai hasil dari Penilaian Acuan Normatif tidak mencerminkan
tingkat kemampuan dan penguasaan siswa tentang materi
pengajaran yang diteskan, tetapi hanya menunjuk kedudukan
peserta didik (peringkatnya) dalam komunitasnya
(kelompoknya).
 Penilaian Acuan Normatif memiliki kecendrungan untuk
menggunakan rentangan tingkat penguasaan seseorang
terhadap kelompoknya, mulai dari yang sangat istimewa
sampai dengan yang mengalami kesulitan yang serius.
 Penilaian Acuan Normatif memberikan skor yang
menggambarkan penguasaan kelompok.
3) Pedoman Konversi PAN

Konversi didasarkan pada Mean dan Standar Deviasi (SD) yang
dihitung dari hasil tes yang diperoleh. Oleh karena itu untuk membuat
standar penilaian atau pedoman konversi, terlebih dahulu kita harus
menghitung Mean dan SD-nya. Jika dihubung-kan dengan skala
penilaian, maka pedoman konversi untuk PAN dapat mempergunakan
berbagai skala, misalnya skala lima, sembilan, sepuluh, dan seratus.
59
4) Pengunaan PAN.
Berbeda dengan PAP, PAN tidak dapat digunakan untuk mengukur
kadar pencapaian tujuan dan tingkat penguasaan bahan. PAN sering
digunakan untuk fungsi prediktif, meramalkan keberhasilan
pendidikan siswa di masa mendatang atau untuk menentukan
peringkat/kedudukan siswa dalam kelompok.
5) Keunggulan PAN
Ada beberapa keunggulan yang dimiliki PAN, yaitu;
 Hasil PAN dapat membuat guru bersikap positif dalam
memperlakukan siswa sebagai individu yang unik.
 Hasil PAN akan merupakan informasi yang baik tentang
kedudukan siswa dalam kelompoknya.
 PAN dapat digunakan untuk menyeleksi calon siswa yang dites
secara ketat.
6) Contoh PAN
Pada pelajaran bahasa Indonesia, siswa yang mendapat skor 80 di
kelas B akan mendapat nilai A, sedangkan di kelas C siswa yang
mendapat skor 65 akan mendapat nilai A juga. Mengapa bisa
demikian? karena nilai yang didapat siswa hanya dihubungkan dengan
norma kelompoknya. Pada kelas C, norma kelompoknya rendah, maka
skor 65 saja sudah mendapat nilai A, dan pada kelas B 88 norma
kelompoknya tinggi, maka skor 80 baru bisa mendapat nilai A,
sehingga skor 65 bisa bernilai Contoh lain : SPMB
b. Penilaian Acuan Patokan.

1) Pengertian PAP
60
Penilaian acuan patokan (PAP) biasanya disebut juga criterion
evaluation merupakan pengukuran yang menggunakan acuan yang
berbeda. Dalam pengukuran ini siswa dikomperasikan dengan kriteria
yang telah ditentukan terlebih dahulu dalam tujuan instruksional,
bukan dengan penampilan siswa yang lain. Keberhasilan dalam
prosedur acuan patokan tegantung pada penguasaaan materi atas
kriteria yang telah dijabarkan dalam item-item pertanyaan guna
mendukung tujuan instruksional .
Dengan PAP setiap individu dapat diketahui apa yang telah dan
belum dikuasainya. Bimbingan individual untuk meningkatkan
penguasaan siswa terhadap materi pelajaran dapat dirancang,
demikian pula untuk memantapkan apa yang telah dikuasainya dapat
dikembangkan. Guru dan setiap peserta didik (siswa) mendapat
manfaat dari adanya PAP. Melalui PAP berkembang upaya untuk
meningkatkan kualitas pembelajaran dengan melaksanakan tes
awal (pre test) dan tes akhir (post test). Perbedaan hasil tes akhir
dengan test awal merupakan petunjuk tentang kualitas proses
pembelajaran.
Pembelajaran yang menuntut pencapaian kompetensi tertentu
sebagaimana diharapkan dan termuat pada kurikulum saat ini, PAP
merupakan cara pandang yang harus diterapkan. PAP juga dapat
digunakan untuk menghindari hal-hal yang tidak diinginkan, misalnya
kurang terkontrolnya penguasaan materi, terdapat siswa yang
diuntungkan atau dirugikan, dan tidak dipenuhinya nilai-nilai
kelompok berdistribusi normal. PAP ini menggunakan prinsip belajar
tuntas (mastery learning).
2) Penggunaan PAP
PAP pada umumnya digunakan untuk menguji tingkat pe-nguasaan
bahan pelajaran.Pengujian tingkat penguasaan bahan biasanya
dilaksanakan pada pengajaran yang berori-entasi pada tujuan dan
61
strategi belajar tuntas. Oleh karena itu nilai seorang siswa yang
ditafsirkan dengan standar mutlak, sekaligus menunjukkan tingkat
penguasaan riilnya terhadap bahan pelajaran dan juga merupakan
standar pen-capaian indicator sesuai dengan standar ketuntasan
belajar.
Agar nilai yang diperoleh siswa dapat berfungsi seperti yang

diharapkan, yaitu mencerminkan tingkat penguasaan siswa, maka alat
tes yang dipergunakan harus dapat diper-tanggungjawabkan, baik dari
segi kelayakan, kesahihan, maupun keterpercayaannya. Butir-butir tes
yang disusun harus sesuai dengan tujuan dan deskripsi bahan
pelajaran yang diberikan.
3) Kelebihan PAP
 Hasil PAP merupakan umpan balik yang dapat diguna-kan
guru sebagai introspeksi tentang program pembelajaran yang
telah dilaksanakan.
 Hasil PAP dapat membantu guru dalam pengambilan
keputusan tentang perlu atau tidaknya penyajian ulang
topik/materi tertentu.
 Hasil PAP dapat pula membantu guru merancang pelak-
sanaan program remidi.
4) Contoh PAP
Contoh, untuk dapat diterima sebagai calon penerbang setiap calon
harus memenuhi syarat antara lain tinggi badan sekurang-kurangnya
170 cm. Berdasarkan kriteria tersebut, maka siapapun yang tidak
memenuhi syarat akan dinyatakan gagal dan tidak diterima. Contoh
lain yaitu UTS, UAS, UNAS.
D. Persamaan PAN dan PAP
62
Penilaian Acuan Norma dan Penilaian Acuan Patokan mempunyai beberapa
persamaan sebagai berikut:
1) Penilaian acuan norma dan acuan patokan memerlukan adanya tujuan
evaluasi spesifik sebagai penentuan fokus item yang diperlukan. Tujuan
tersebut termasuk tujuan intruksional umum dan tujuan intruksional
khusus
2) Kedua pengukuran memerlukan sample yang relevan, digunakan
sebagai subjek yang hendak dijadikan sasaran evaluasi. Sample yang
diukur mempresentasikan populasi siwa yang hendak menjadi target
akhir pengambilan keputusan.
3) Untuk mandapatkan informasi yang diinginkan tenyang siswa, kedua
pengukuran sama-sama nenerlukan item-item yang disusun dalam satu
tes dengan menggunakan aturan dasar penulisan instrument.
4) Keduanya mempersyaratkan perumusan secara spesifik perilaku yang
akan diukur.
5) Keduanya menggunakan macam tes yang sama seperti tes subjektif, tes
karangan, tes penampilan atau keterampilan.
6) Keduanya dinilai kualitasnya dari segi validitas dan reliabilitasnya.
7) Keduanya digunakan ke dalam pendidikan walaupun untuk maksud
yang berbeda.
E. Perbedaan dan Penilaian PAN dan PAP

1) Penilaian acuan norma biasanya mengukur sejumlah besar perilaku
khusus dengan sedikit butir tes untuk setiap perilaku. Penilaian acuan
patokan biasanya mengukur perilaku khusus dalam jumlah yang
terbatas dengan banyak butir tes untuk setiap perilaku.
2) Penilaian acuan norma menekankan perbedaan di antara peserta tes dari
segi tingkat pencapaian belajar secara relatif. Penilaian acuan patokan
menekankan penjelasan tentang apa perilaku yang dapat dan yang tidak
dapat dilakukan oleh setiap peserta tes.
63
3) Penilaian acuan norma lebih mementingkan butir-butir tes yang
mempunyai tingkat kesulitan sedang dan biasanya membuang tes yang
terlalu mudah dan terlalu sulit. Penilaian acuan patokan mementingkan
butir-butir tes yang relevan dengan perilaku yang akan diukur tanpa
perduli dengan tingkat kesulitannya.
4) Penilaian acuan norma digunakan terutama untuk survey. Penilaian
acuan patokan digunakan terutama untuk penguasaan.
F. Mengolah Skor Mentah Menjadi Nilai Huruf

Disamping penilaian yang idnyatakan dengan angka, kita mengenal pula
penilaian dengan huruf. Seperti penilaian yang dilakukan oleh guru taman
kanak-kanak dan atau guru-guru sekolah dasar kelas I dan II, mereka
menggunakan nilai huruf a, b, c, dan d.
Seperti pengolahan skor mentah menjadi 1-10, pengolahan skor mentah
menjadi nilai huruf pun menggunakan sifat-sifat yang terdapat pada kurva
normal atau distribusi normal dasar penghitungan.
Adapun cirri-ciri atau sifat-sifat distribusi normal antara lain adalah sebagai
berikut :
a. Memiliki jumalah kepadatan frekuensi yang tetap pada jarak deviasi-
deviasi tertentu.
b. Pada distribusi normal, mean, median dan mode berimpit (sama besar)
terletak tepat ditengah kurva dan membagi dua sama besar jarak
deviasinya.
G. Mengolah Skor Mentah Menjadi Nilai Huruf dengan

Menggunakan Mean (M) dan Deviasi Standar (DS)
Mencari mean (M) dan deviasi standar (DS) dalam rangka mengolah skor
mentah menjadi nilai huruf dapat dilakukan dengan dua cara, yaitu jika
banyaknya skor yang diolah kurang dari 30, digunakan table distribusi
frekuensi tunggal, dan jika banykanya skor lebih dari 30, misalnya sampai 40
64
atau 50 lebih, sebaiknya digunakan table distribusi frekuensi bergolong.
Berikut ini sebuah contoh yang menggunakan table distribusi tunggal.
Misalkan seorang dosen memperoleh skor mentah dari hasil tes yang telah
diberikan kepada 20 orang mahasiswanya sebagai berikut :
73, 70, 68, 68, 67, 67, 65, 65, 63, 62
60, 59, 59, 58, 58, 56, 52, 50, 41, 40
Skor mentah itu akan diolah menjadi nilai huruf A, B, C, D, TL dengan
menggunakan M dan DS.
H. Mengolah Skor Mentah Menjadi Nilai Huruf dengan

Batas Lulus = Mean
Cara lain untuk mengolah skor mentah menjadi nilai huruf ialah dengan
menggunakan mean dan Ds yang diperoleh dengan membuat table frekuensi.
Misalkan seorang dosen memperoleh skor dari hasil ujian semester dari 50
orang mahasiswa :
97, 93, 92, 90, 87, 86, 86, 83, 81, 80
80, 78, 76, 76, 75, 74, 73, 72, 72, 71
69, 67, 67, 67, 64, 63, 63, 62, 62, 60
58, 57, 57, 56, 56, 54, 52, 50, 47, 45
43, 39, 36, 36, 32, 29, 27, 26, 20, 16
Skor mentah ini akan kita olah menjadi nilai A, B, C, D, TL. Untuk mencari
mean dan DS kita susun skor mentah tersebut kedalam table frekuensi.
Kelas Interval F D fd Fd2
1 96 – 105 1 +4 +4 16
2 86 – 95 6 +3 +18 54
3 76 – 85 7 +2 +14 28
4 66 – 75 10 +1 +10 10
5 56 – 65 11 0 0 0
6 46 – 55 4 -1 -4 4
7 36 – 45 5 -2 -10 20
8 26 – 35 3 -3 -9 27
9 16 - 25 3 -4 -12 48
65
50 +11 207
(N) (∑fd) (∑fd2)
Kesimpulan
1. Penskoran adalah suatu proses perubahan jawaban-jawaban tes menjadi angka-

angka (mengadakan kuantifikasi) sedangkan penilaian adalah proses menentukan
nilai suatu obyek dengan menggunakan ukuran atau kriteria tertentu, seperti Baik ,
Sedang, Jelek.
2. Prinsip- prinsip penilaian adalah
 Penilaian hendaknya dilakukan atas hasil pengukuran yang komprehensif.
 Memperhatian perbedaan antara penskoran (scoring) dan penilaian
(grading).
 Dalam pemberian nilai hendaknya diperhatikan dua macam orientasi, yaitu
penilaian yang non – referenced dan yang criterion – referenced.
 Kegiatan pemberian nilai hendaknya merupakan bagian integral dari
proses belajar-mengajar.
 Penilaian harus bersifat komparabel
 Sistem penilaian yang dipergunakan hendaknya jelas bagi siswa dan bagi
pengajar sendiri.
3. Jenis Penilaian dilakukan dengan 2 sistim,yaitu;
 PAN ( Penilaian Acuan Norma)
 PAP ( Penilaian Acuan Patokan)
66
Tugas
1. Jelaskan pengertian dari penskoran dan penilaian ?

2. Jelaskan 3 prinsip dalam pemberian penilaian ?
3. Jelaskan sistim penialaian ABCDE sesuia PAN dan PAP ?
Studi Kasus
1. Seorang dosen meperoleh skor mentah dari dari tes yang telah diberikan
kepada 20 orang mahasiwa sebagai berikut;
73, 70, 68, 68, 67,67, 65, 65, 63, 62,
60, 59, 59, 58, 58, 56, 52, 50, 41, 40
Pertanyaan;
 Hitung skor mentah dengan menentukan Mean dan Standar Devisiasi?
 Ubahlah skor mentah menjadi nilai huruf A, B, C, D , E (TL) dengan
sistim PAN dan PAP?
67
HAND OUT

Topik : Analisis Item Tes
Objektif Perilaku Siswa (OPS)

1. Setelah mengikuti pelajaran ini mahasiswa dapat menyebutkan
analisis item test secara baik dan benar sesuai dengan penjelasan yang diberikan.
2. Mahasiswa mampu menjelaskan macam-macam analisis item tes
dengan benar tanpa melihat catatan.
3. Mahasiswa mampu menjelaskan menganalisis item test dengan
rumus yang telah diberikan secara tepat dan benar sesuai dengan penjelasan yang
diberikan.
Referensi :
1. Purwanto, Ngalim. 2008. Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran.
Bandung : Remaja Rosdakarya
2. Arikunto, Suharsimi. 2008. Dasar-Dasar Evaluasi Pendidikan. Jakarta :
Bumi Aksara
3. Sriyati, Siti. 2012. Analisis Pokok Uji. http://file.upi.edu/Direktori/
FPMIPA/JUR._PEND._BIOLOGI/989012SITI_SRIYATI/Kumpulan_bahan_aj
ar_evaluasi_pembelajaran_%283%29/ANALISIS_POKOK_UJI_
%5BCompatibility_Mode%5D.pdf. Diunduh 19 Maret 2013
PENDAHULUAN
68
Salah satu komponen yang menjadi sasaran peningkatan kualitas pendidikan
adalah sistem pembelajaran di kelas. Proses pembelajaran ini merupakan
tanggungjawab guru dalam mengembangkan segala potensi yang ada pada siswa.
Tujuan pokok proses pembelajaran adalah untuk mengubah tingkah laku siswa
berdasarkan tujuan yang telah direncanakan dan disusun oleh guru sebelum proses
kegiatan pembelajaran berlangsung. Perubahan tingkah laku itu mencakup aspek
intelektual. 1
Ketika proses pembelajaran dipandang sebagai proses perubahan tingkah laku
siswa, peran penilaian dalam proses pembelajaran menjadi sangat penting. Penilaian
dalam proses pembelajaran merupakan suatu proses untuk mengumpulkan,
menganalisa dan menginterpretasi informasi untuk mengetahui tingkat pencapaian
tujuan pembelajaran.
Sebagai bagian yang sangat penting dari sebuah proses pembelajaran, penilaian
dalam proses pembelajaran hendaknya dirancang dan dilaksanakan oleh guru. Dengan
melakukan penilaian ketika melaksanakan proses pembelajaran, guru akan dapat
mengetahui tingkat keberhasilan proses pembelajaran dan akan memperoleh bahan
masukan untuk menentukan langkah selanjutnya. Dengan demikian, keefektifan suatu
proses pembelajaran banyak ditentukan oleh peran penilaian dalam proses
pembelajaran itu sendiri. Furqon (1999) menyatakan bahwa penilaian sebagai salah
satu komponen utama proses pembelajaran harus dipahami, direncanakan dan
dilaksanakan dalam upaya mendukung keberhasilan peningkatan mutu proses
pembelajaran. Mengingat hal tersebut, perlu dilakukan penilaian dalam proses
pembelajaran secara terus menerus dan berkesinambungan sebagai alat pemantau
tentang keefektifan proses belajar serta kemampuan siswa belajar.3
Penilaian dalam proses pembelajaran merupakan bagian penting dari proses
pembelajaran, karena itu hendaknya dilakukan oleh guru agar dapat memperoleh
informasi proses kemajuan belajar siswa dan informasi keefektifan pembelajaran yang
sedang berlangsung. Guru yang hanya mengutamakan penilaian hasil tidak akan
mendapatkan informasi yang akurat tentang siswa yang benar-benar memahami materi
dan siswa yang kurang memahami. Siswa yang dapat menjawab dengan benar suatu
persoalan, belum tentu mengetahui bagaimana mendapatkan jawaban tersebut.
69
Penilaian dalam proses pembelajaran lebih dapat berfungsi memberikan informasi
tentang siswa yang sudah memahami materi atau yang belum.
Penilaian ini berkesinambungan dengan penilaian hasil artinya hasil penilaian
dalam proses pembelajaran akan memberikan sumbangan positif terhadap penilaian
hasil. Dengan demikian perlu diupayakan agar guru melakukan penilaian dalam proses
pembelajaran di samping melakukan penilaian hasil belajar.3
URAIAN MATERI
A. Teknik Analisis Soal Tes (Item Analysis)

Salah satu cara untuk memperbaiki proses belajar-mengajar yang paling efektif
ialah dengan jalan mengevaluasi tes belajar yang diperoleh dari proses belajar-mengajar
itu sendiri. Dengan kata lain, hasil tes itu kita olah sedemikian rupa sehingga dari hasil
pengolahan itu dapat diketahui komponen-komponen manakah dari proses belajar-
mengajar itu yang masih lemah.1
Pengolohan tes hasil belajar dalam rangka memperbaiki proses belajar-mengajar
dapat dilakukan dengan berbagai cara, antara lain:
1. Dengan membuat analisis soal (item analysis);
2. Dengan menghitung validitas dan keandalan tes.
Dalam pasal ini khusus akan dibicarakan cara yang pertama, yaitu teknik analisis soal
atau yang biasa disebut item analisis. 1
Menurut Thorndike dan Hagen (1977), analisis terhadap soal-soal (items) tes yang
telah dijawab oleh murid-murid mempunyai dua tujuan penting.
Pertama, jawaban-jawaban soal itu merupakan informasi diagnostik untuk
meneliti pelajaran dari kelas itu dan kegagalan belajarnya, serta selanjutnya untuk
memimbing ke arah cara belajar yang lebih baik.
Kedua, jawaban-jawaban terhadap soal-soal yang terpisah dan perbaikan (review)
soal-soal yang didasarkan atas jawaban-jawaban itu merupakan basis penyiapan tes-tes
yang leboih baik untuk tahun berikutnya.
70
Jadi, tujuan khusus dari items analysis ialah mencari soal tes mana yang baik
mana yang baik dan mana yang tidak baik, dan mengapa item atau soal tes mana yang
baik dan mana yang tidak baik. Dengan mengetahui soal-soal yang tidak baik itu
selanjutnya kita dapat mencari kemungkinan sebab-sebab mengapa item itu tidak baik.2
Dengan membuat analisis soal, sedikitnya kita dapat mengetahui tiga hal penting
yang kita peroleh dari setiap soal, yaitu:
a. Sampai di mana tingkat atau taraf kesukaran soal itu (difficulty level of an item);
b. Apakah soal itu mempunyai daya pembeda (discriminating power) sehingga dapat
membedakan kelompok siswa yang pandai dengan kelompok siswa yang bodoh;
c. Apakah semua alternatif jawaban (options) menarik jawaban-jawaban, ataukah
ada yang demikian ridak menarik sehingga tidak perlu dimasukkan kedalam soal.
1. Taraf kesukaran (difficulty level) soal

Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu
sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi
usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebakan
siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi
karena diluar jangkauannya.1
Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan rumus
sebagai berikut:
TK = U+L
T
Keterangan:
TK : indeks TK atau tingkat/taraf kesukaran yang dicari
U : jumlah siswayang termasuk kelompok pandai (upper group) yang
menjawab benar untuk tiap soal
L : jumlah siswa yang termasuk kelompok kurang (lower group) yang
menjawab benar untuk setiap soal
T : jumlah siswa dari kelompok pandai dan kelompok kurang (jumlah upper
group dan lower group)
Klasifikasi indeks kesukaran
0,0 ---------------------------- 1,0
71
sukar mudah
soal dengan tingkat kesukaran 0,00 – 0,30 = sukar

soal dengan tingkat kesukaran 0,31 – 0,70 = sedang
soal dengan tingkat kesukaran 0,71 – 1,00 = mudah
2. Daya Pembeda
Daya pembeda soal, adalah kemampuan sesuatu soal untuk membedakan
antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh
(berkemampuan rendah).
Daya pembeda suatu soal tes dapat dihitung dengan menggunakan rumus
seperti berikut :
DP = U-L
⅟2 T
Keterangan :
DP : indeks DP atau daya pembeda yang dicari
U : jumlah siswayang termasuk kelompok pandai (upper group) yang
menjawab benar untuk tiap soal
L : jumlah siswa yang termasuk kelompok kurang (lower group) yang
menjawab benar untuk setiap soal
T : jumlah siswa dari kelompok pandai dan kelompok kurang (jumlah upper
group dan lower group)
3. Kriteria untuk menentukan soal

Untuk mementukan apakah suatu soal dikatakan baik atau tidak baik sehingga
perlu direvisi, digunakan kriteria sebagai berikut:
a. Untuk soal berbentuk benar-salah (true-false)
 Jika tingkat kesukarannya sama atau lebih kecil dari 0,16, dikategorikan
soal yang sukar.
 Jika tingkat kesukarannya sama atau lebih besar dari 0,84, dikategorikan
soal yang mudah.
72
b. Untuk soal yang berbentuk pilihan ganda (multiple choice):
 Untuk pilihan ganda dengan option 3, jika tingkat kesukarannya sama atau
lebih kecil dari 0,21, dikategorikan soal yang sukar; sedangkan jika tingkat
kesukarannya sama atau lebih besar dari 0,79, dikategorikan soal yang
mudah.
 Untuk pilihan ganda dengan option 4, jika tingkat kesukarannya sama atau
lebih kecil dari 0,24, dikategorikan soal yang sukar; sedangkan jika tingkat
kesukarannya sama atau lebih besar dari 0,76, dikategorikan soal yang
mudah.
c. Jika daya pembeda soal itu adalah 0 (nol) atau negatif (minus), maka soal itu perlu
direvisi / diperbaiki. Dengan melihat kriteria pada a dan b tersebut diatas dapat
disimpulkan makin tinggi nilai TK suatu soal, makin mudah soal tersebut dan
makin rendah TK suatu soal maka makin sukar soal tersebut.
B. Analisis dan Interptrestasi Soal Tes Objektif

Cara analisis yang dilakukan oleh Thorndike dan Hagen ini kelihatan lebih
praktis dan sekaligus diikuti bagaimana dari soal tersebut yang masih lemah dan
perlu mendapat perbaikan.1
Contoh Analisis Soal (Item Analysis)
Misalkan 100 orang murid di tes dengan tes pilihan ganda yang berjumlah 95
soal. Hasil tes menunjukkan skor tertinggi 85 dan terendah 14. Dari hasil tes itu
kita ambil 25 orang (25%) yang tergolong upper group, dan 25 orang (25%) yang
tergolong lower group. Cara mengambil kelompok upper group dan lower group
adalah sebagai berikut : Mula-mula kita susun lembaran hasil tes itu dari lembaran
yang memiliki skor tertinggi (85) berturut-turut sampai kepada lembaran yang
memiliki lembaran terendah (14). Kemudoian kita ambil 25 lembar dari atas, dan
inilah kelompok kelompok upper group dan 25 lembardari bawah inilah
kelompok lower group. Misalkan dari kelompok upper group yang kita ambil
terdapat skor 59 s.d. 85, dan dari kelompok lower group tersapat skor 14 s.d 34.
Kelompok sedang (middle group) yang berjumlah 50 lembar (50%) kita biarkan.
Jawaban dari kedua kelompok upper group dan lower group itulah yang
kemudian kita tabulasikan dan kita analisis.
Berikut ini beberapa contoh.

Soal no.1 hasilnya sebagai berikut:
73
1. Penyebar agama Islam yang mula-mula di Jawa Barat ialah:
Upper Lower
A. Sultan Hasanuddin 0 2
B. Fatahillah 25 20
C. Untung Surapati 0 2
D. Sunan Kalijaga 0 1
Dikosongkan 0 0
Interprestasi :
Soal ini mudah karena semua (25) orang dari kelompok upper group dan 20 orang
dari lower group dapat menjawab soal itu dengan benar. Namun, soal ini termasuk
baik karena dapat membedakan arah yang diinginkan ternyata jawabn-jawaban
yang salah terdapat pada kelompok lower group. Dua atau tiga soal semacam ini
baik digunakan sebagai permulaan tes.
Soal no.2 hasilnya sebagai berikut :

2. Kegembiraan kerja bagi guru-guru di sekolah dapat tercapai apabila :
Upper Lower
A. guru-guru menerima tugas
pembagian kerja yang sama
beratnya. 3 5
B. tidak pernah ada kecaman dari
kepala sekolah. 9 15
C. kepala sekolah memperhatikan
dan menghargai tiap usaha
guru yang dilakukan dengan rasa
tanggung jawab. 13 5
D. kepala sekolah memperhatikan
penghidupan guru-guru. 0 0
Dikosongkan 0 0
Interprestasi:
Soal ini sukar, tetapi efektif. Bahwa soal tersebut tergolong sukar dapat dilihat hanya 13
dari 50 orang yang dapat menjawab soal itu dengan benar. Bahwa soal itu dikatakan
efektif dapat dilihat dari kenyataan bahwa ke 13 orang yang menjawab benar itu semua
terdapat pada kelompok upper group. Semua alternatif jawaban yang salah dipilih oleh
kelompok lower group yang jumlahnya lebih besar daripada kelompok upper group yang
menjawab salah. Sepintas lalu soal semacam ini menunjukkan betapa sulit untuk
menjawabnya secara mereka dengan membabi buta saja. Sebagian besar dari kelompok
lower group memusatkan perhatiannya pada satu alternatif jawaban yang seolah-olah
benar dapat diterima.
74
Soal no.3 mendapat hasil sebagai berikut:
3) maksud perintah mengadakan ikatan dinas bagi siswa-siswa SPG ialah:
Upper Lower
a. untuk menarik para lulusan
SLP agar mau masuk ke
Sekolah guru. 15 6
b. membatasi lulusan SPG yang
akan melanjutkan pelajarannya
kesekolah yang lebih tinggi. 4 6
c. membantu paravsiswa yang
kurang mampu dalam melanjutkan
pelajarannya. 2 6
d. karena yang masuk SPG kebanyakan
anak-anak orang yang miskin. 4 7
Dikosongkan 0 0
Interprestasi :
Soal ini tidak baik karena: Pertama, soal itu terlalu sukar, hanya 8 dari 50, atau 16% saja
dari murid, yang dapat menjawab benar. Kedua, soal tersebut kurang mempunyai daya
pembeda (discriminating power) ternyata dari jawaban yang benar itu banyak terdapata
lower group, dan bukan pada upper group.
Dalam hal ini ada dua keterangan yang mungkin untuk data analisis soal tersebut: 1)
soal tersebut bersifat ambigous (mempunyai dua arti), terutama bagi siswa-siswa yang
mngetahui banyak tentang hal yang ditanyakan, atau (2) para siswa belum pernah
mempelajari hal-hal seperti yang ditanyakam.
Soal no.4 hasilnya sebagai berikut:

4) Danau terbesar di Pulau Sumatera ialah :
Upper Lower
A. Danau Toba 21 17
B. Danau Poso 0 0
C. Danau Batur 0 0
D. Danau Kerinci 4 8
Dikosongkan 0 0
Interprestasi
Soal ini menunjukkan beberapa diskriminasi pada arah atau tujuan yang diingini (21
lawan 17), tetapi perbedaan itu tidak begitu tajam. Pola respons adalah satu dan terlalu
umum. Hanya dua dari empat alternatif jawaban yang berfungsi atau dipilih oleh siswa.
Jika soal ini akan diperbaiki maka yang perlu diubah atau bdiganti adalah alternatif
jawaban B dan C. Mungkin kedua alternatif jawaban tersebut tidak dipilih oleh siswa
karena mereka mengetahui bahwa Danau Poso dan Danau Batur tidak ada di Pulau
75
Sumatera, tetapi di Pulau Sulawesi dan Bali. Maka untuk menggantinya sebaiknya
dicarikan nama danau lain yang ada di Pulau Sumatera, misalnya Danau Ranau dan
Danau Maninjau.
C. Prosedur Analisis Item yang Lebih Sederhana Untuk “NORM-REFERENCED

TEST”
Ada beberapa prosedur analisis item yang dapat dilakukan terhadap norm-referenced
test (Thorndike, 1971). Bagi tes-tes hasil belajar yang informal yang digunakan
dalam pengajaran, agaknya diperlukan prosedur yang sederhana saja. Langkah-
langkah berikut merupakan prosedur yang simpel, tetap efektif. 3
Misalkan kita akan menganalisis 32 lembar jawaban tes multiple chioice dengan 5
option. Maka langkah-langkahnya adalah sebagai berikut:
1. Sususnlah 32 lembar jawaba tes tersebut pada skor yang paling tinggi sampai
kepada skor yang paling rendah.
2. Ambil ± sepertiga dari jumlah lembar jawaban tes itu yang mendapat skor tinggi,
dan sebutlah ini upper group (10 lembar). Dan ambil pula ± sepertiga dari
jumlah lembar jawaban tes yang memperoleh skor rendah, dan sebutlah lower
group (10 lembar pula). Pisahkan yang selebihnya, yaitu yang termasuk middle
group (12 lembar). Meskipun lembar midlle group ini dapat dimasukkan ke
dalam analisis, penggunaan upper dan lower group saja sudah cukup
menyederhanakan prosedur pengolahan (analisis).
3. Untuk tiap item, hitunglah jumlah siswa dari upper group yang memilih tiap
alternatif (option), kemudian kerjaka. Begitu juga pada lower group.
4. Catatlah jumlah dari langkah 3 tersebut di dalam catatan tes dalam kolom dimana
alternatif itu dipilih.
5. Taksirlah tingkat kesukaran soal (item diffuculty) dengan menghitung presentase
siswa yang menjawab item itu benar.
Rumus untuk menghitung item difficulty adalah sebagai berikut:
P = R
X 100
T
Keterangan :
P = presentase yang menjawab item itu benar
R = jumlah yang menjawab item itu benar
T = jumlah total (siswa) yang mencoba menjawab item itu.
76
6. Taksirlah daya pembeda (discriminating power) item itu dengan membandingkan
jumlah siswa dalam upper group yang menjawab item dengan benar. 1
Rumus daya pembeda : DP = U - L

⅟2 T
Keterangan :
DP = daya pembeda atau discriminating power yang dicari
U = jumlah jawaban yang benar dari upper-group
L = jumlah jawaban yang benar dari lower-group
⅟2 T = setengah dari jumlah upper dan lower-group
7.Tentukan keefektifan distruktornya dengan membandingkan jumlah siswa pada

upper group dan lower group yang memiliki tiap alternatif yang salah. Distruktor
yang baik akan memikat lebih banyak siswa dari lower group ketimbang dari
upper group.1
D. Interprestasi Data Analisis Item Tes Norm-Referenced

Jika kita menggunakan jumlah siswa yang relatif kecil dalam menganalisa item tes
hasil belajar kelas, informasi analisis item hendaknya diinterprestasikan dengan sangat
berhati-hati. Baik tingkat kesukaran maupun daya pembeda suatu item dapat berubah-
ubah atau berbeda-beda antara kelompok yang satu dengan kelompok yang lain. 3
E.Prosedur Analisis Item Untuk Criterion-Referenced Tests

Dasar pemikiran dalam mengevaluasi items dalam tes penguasaan criterion-
referenced adalah sampai sejauh mana tiap item dapat mengukur hasil pengajaran (effects
of instruction). Jika suatu item dapat dijawab dengan bemar oleh semua siswa, baik
sebelum maupun sudah diajari, jelaslah bahwa item itu tidak mengukur hasil pengajaran.
1
Untuk memperoleh keefektifan item berdasarkam hasil pengajaran, guru harus

memberikan tes yang sama sebelum dan sesudah mengjar. Item yang efektif akan dijawab
benaroleh sejumlah lebih besar siswa sesudah pengajaran daripada sebelum pengajaran.3
Indeks sensitivitas bagi keberhasilan pengajaran (sensitivity of instructional) (S)
dapat dihitung dengan menggunakan rumus berikut:
S= R A - RB
T
77
Keterangan :
S = sensitivitas keberhasilan yang dicari
RA = jumlah siswa yang menjawab benar item itu sesudah pengajaran
RB = jumlah siswa yang menjawab benar item itu sebelum pengajaran
T = jumlah total jawaban item itu yang benar kedua-duanya, sebelum dan sesudah
pengajaran.
LATIHAN SISWA
1. Jelaskan pengertian dari analisis item tes?

2. Tujuan khusus dari items analysis ialah?
3. Teknik analisis soal atau yang biasa disebut item analisis?
4. Prosedur Analisis Item Untuk Criterion-Referenced Tests yaitu?
HAND OUT

Topik : Manajemen Pengujian
78
OBJEKTIF PRILAKU MAHASISWA
Setelah topik ini dibahas, mahasiswa mampu :
1. Menjelaskan kembali tentang penilaian dan kaitannya dengan ujian secara tepat.
2. Menjelaskan penilaian yang dapat dilakukan dalam ujian secara tepat
3. Menyebutkan dan menjelaskan syarat dari suatu alat ujian dengan benar.
4. Menjelaskan kemungkinan penggunaan pada alat ujian dengan benar
5. Menyebutkan syarat mutu suatu alat ujian dengan benar
6. Menyebutkan dan menjelaskan jenis-jenis alat ujian dengan tepat
7. Menjelaskan fungsi tes dan hal-hal lain yang perlu diperhatikan dengan tepat
8. Menjelaskan dalam bentuk bagan mengenai perbandingan tes dengan benar
9. Menjelaskan langkah-langkah penyusunan tes dengan tepat
10. Menjelaskan komponen-komponen yang terdapat dalam tes dengan benar
Referensi :
Penulis . Evaluasi Pembelajaran Prinsip-Teknik-Prosedur. 117-173
Toto Fathoni, Strategi Belajar Mengajar, Universitas Pendidikan Indonesia, 2004
Dasar-dasar Evaluasi Pendidikan
Mengajar dengan Sukses
Penilaian
Evaluasi di bidang pendidikan adalah cara untuk mengetahui sejauh mana sasaran
belajar suatu pembelajaran atau rangkaian pelajaran dapat tercapai. Sebelum
pembelajaran dimulai pengajar telah menentukan hal-hal yang harus diketahui dan dapat
dikerjakan oleh murid. Dan sesudah kursus selesai diberikan pengajar mengadakan
penelitian, apakah hal-hal yang ditentukan itu dapat tercapai. Inilah yang disebut
penilaian.
Penilaian memberi informasi tentang hasil pelajaran yang telah disajikan. Alat
untuk mengevaluasi disebut dengan tes, yang dipakai untuk menilai hasil belajar murid
79
dan hasil mengajar dari pengajar. Sedangkan yang dimaksud dengan ujian adalah
pelaksanaan penilaian hasil belajar murid. Tes sebagai alat untuk mengunakan penilaian
atau sebagai alat ujian. Tes dapat dipakai dalam berbagai macam pelaksanaan penilaian,
antara lain dalam setiap macam ulangan, tentamen, eksamen, dan lain-lainnya yang
semacam.
Alat ujian penting untuk menelaah hal-hal yang terjadi berhubungan dengan tujuan
operasional. Tetapi disamping itu alat ujian juga perlu untuk meningkatkan proses belajar.
Hal-hal yang dapat dinilai dalam ujian :

a. Dengan ujian pengajar dapat menilai hasil pengajaran yang ia lakukan. Dengan
ujian ia dapat mengukur hasilnya yang disebut sebagai nilai hasil. Pengajar
berhasrat mengetahui sampai dimana mahasiswa atau muridnya berhasil
menyelesaikan proses belajar. Fungsi penilaian adalah melihat sampai dimana
mahasiswa berhasil untuk mengerti.
b. Dengan ujian pengajar juga dapat menilai jalannya proses belajar. Ini dinamakan
nilai proses. Pengajar meneliti sampai dimana pengajar berhasil memberi
kemungkinan kepada mahasiswa untuk menyelesaikan proses belajarnya.
c. Fungsi institusional. Fungsi ini lebih berkaitan dengan keputusan lembaga untuk
menentukan kelulusan murid atau mahasiswa. Keputusan ini sebetulnya tidak
termasuk penilaian tetapi lebih merupakan suatu prosessing.
Penilaian tidak hanya dilakukan diakhir pembelajaran, pelaksanaan penilaian di akhir
pembelajaran pada umumnya hanya berdasarkan kebiasaan saja. Penilaian dapat
dilakukan di tengah-tengah pembelajaran, dengan maksud untuk meneliti jalannya
pembelajaran hingga saat itu. Dengan cara demikian pengajar berkesempatan
menambahkan sesuatu, bilamana ternyata ada beberapa bagian yang belum dapat
dimengerti oleh murid. Penilaian yang dilakukan di tengah-tengah pembelajaran disebut
penilaian formatif. Penilaian tersebut dapat dilakukan beberapa kali selama masa
pembelajaran.
Pembelajaran
Awal Bagian 2 Bagian 3 Bagian 4 Bagian 5 Bagian 6 Akhi

r
80
Penilaian Formatif Penilaian Formatif Penilaian Akhir
(Alur penilaian formatif)
Syarat yang harus dipenuhi oleh suatu alat ujian :

a. Isi pertanyaan dari alat ujian atau tes harus menggambarkan tujuan yang hendak
dicapai oleh pengajar. Alat ujian harus sahih (valid), yang berarti sesuai dengan
tujuan operasional dan tujuan kursus.
b. Dalam suatu alat ujian jumlah pertanyaan yang disajikan harus menunjukan semua
tujuan yang direncanakan harus seimbang
Penggunaan alat ujian mempunyai beberapa kemungkinan penggunaannya, antara

lain:
a. Penggunaan prediktif
Alat ujian digunakan dengan maksud untuk mengukur, apakah dikemudian hari dapat
diharapkan suatu hasil. Setiap ujian masuk atau ujian saringan bersifat prediktif
(tetapi juga selektif). Dengan penggunaan prediktif orang mencoba
memperhitungkan apakah seseorang dikemudian waktu akan dapat belajar dengan
baik dan berhasil.
b. Penggunaan Selektif
Alat ujian digunakan untuk meneliti, sejauh mana murid dapat mencapai tujuan yang
telah ditentukan. Apakah murid telah cukup mengerti bahan yang diajarkan. Dengan
penggunaan semacam ini murid akan terbagi dalam kelompok lulus dan kelompok
tidak lulus.
c. Penggunaan Diagnostis
Alat ujian digunakan untuk memeriksa letak titik kuat dan titik lemah murid, atau
letak kekurangan pembelajaran. Disini pengajar menentukan diagnose, seperti yang
dilakukan oleh seorang dokter kepada penderita. Nilai hasil dan nilai proses dapat
diperoleh dengan penggunaan semacam ini
d. Penggunaan Komparatif
Penggunaan semacam ini dimaksudkan untuk mengetahui, apakah kelompok yang
satu dengan kelompok yang lain sama pandai atau sama sama rajinnya. Pengajar
81
meneliti perbandingan antara hasil yang dicapai oleh kelompok yang satu dengan
hasil yang dicapai oleh kelompok yang lain.
Syarat mutu alat ujian :

a. Relevansi, yaitu suatu alat ujian harus relevan. Artinya mengukur hal yang harus
diukur.
b. Keseimbangan, yaitu pertanyaan atau soal harus merata. Artinya, menyangkut
seluruh bahan dan bagian-bagiannya yang penting.
c. Berdaya guna atau efisien, yaitu dapat memberikan informasi secara cukup
bilamana dibandingkan dengan waktu yang digunakan oleh pengajar untuk
memperoleh informasi tersebut.
d. Obyektivitas, yaitu alat ujian dibuat sedemikian rupa sehingga jawaban yang
diberikan oleh murid hanya benar atau salah saja.
e. Kekhususan, yaitu harus berisi pertanyaan atau soal dibuat sedemikian rupa
sehingga hanya murid yang telah mempelajarinya saja yang dapat mengetahui
jawabannya.
f. Tingkat kesulitan, yaitu pertanyaan atau soal-soal ujian harus disesuaikan dengan
taraf pengetahuan murid.
g. Daya pembeda atau diferensiasi, yaitu alat ujian dibuat sedemikian rupa sehingga
murid menguasai bahan pelajaran dengan baik akan dapat mengerjakan soal ujian
dengan hasil yang baik.
h. Terpercaya, yaitu alat ujian dibuat sedemikian rupa sehingga agar dua kelompok
murid pada tingkatan yang sama akan menghasilkan hasil yang sama.
i. Kejujuran, yaitu alat ujian dibuat sedemikian rupa sehingga setiap murid
memperoleh kesempatan yang sama untuk meraih nilai baik.
j. Waktu, yaitu alat ujian dibuat sedemikian rupa sehingga diperoleh perbandingan
yang wajar antara waktu yang tersedia dengan keadaan soal ujian.
Jenis-jenis alat ujian :

a. Ujian terbuka, yaitu alat ujian yang diharapkan agar murid dapat merumuskan
sendiri jawaban atas soal atau pertanyaan ujian.
- Ujian Lisan, yaitu pembicaraan atau wawancara antara pengajar dan
muridnya.
- Ujian esei, yaitu ujian yang dilakukan secara tertulis, dan murid harus
memberikan jawabannya dengan uraian yang panjang lebar.
- Ujian isiian, yaitu ujian tertulis dengan teks yang masih harus dilengkapi oleh
murid.
82
b. Ujian tertutup, yaitu jenis jawaban telah disediakan sehingga murid tinggal
memilih jawaban yang sudah disediakan. Ciri terpenting dari jenis ujian tertutup
adalah segi obyektifnya.
- Ujian salah benar, yaitu murid harus menyatakan apakah suatu pernyataan itu
salah atau benar
- Ujian pilihan berganda, yaitu ujian yang disediakan beberapa kemungkinan
jawabannya. Murid harus memilih salah satu yang dianggap benar dari
beberapa kemungkinan jawaban yang disediakan.
- Ujian menjodohkan, yaitu terdiri dari dua baris pengertian atau kalimat. Setiap
baris dari jalur pertama harus dicari jodohnya yang paling tepat dijalur kedua.
Fungsi Tes
Setiap kali akan memberikan tes, kebanyakan guru selalu bertanya kepada dirinya
sendiri:
 Pertanyaan apakan yang akan saya berikan?
 Jawaban apakah yang akan saya perlukan?
 Berapa butir soal yang akan saya buat?

 Bagaimanakah bentuk kunci jawaban?
 Dan lain-lain pertanyaan lagi.
Untuk dapat menjawab pertanyaan-pertanyaan tersebut, guru harus selalu ingat akan
fungsi tes. Sehubungan denganhal-hal yang harus diingat pada waktu penyusunan tes,
maka fungsi tes dapat ditinjau dari 3 hal:
1) Fungsi untuk kelas
2) Fungsi untuk bimbingan
3) Fungsi untuk administrasi
Selain fungsi-fungsi tes ini, hal lain yang harus diingat adalah:
1) Hubungan dengan penggunaan
Diatas telah disajikan fungsi tes. Waktu menyusun tes, dalam hati harus
selalu diingat, fungsi mana yang saat ini dipentingkan karena fungsi yang berbeda
akan menentukan bentuk/isi tes yang berbeda pula.
83
2) Komprehensif
Sebuah tes sebaiknya mencakup suatu kebulatan, artinya meliputi berbagai
aspek yang dapat menggambarkan keadaan siswa secara keseluruhan (kecerdasan,
sikap, pribadi, perasaan sosial, dan sebagainya). Hal ini dapat dicapai apabila tes
itu merupakan rangkaian tes, misalnya dari kelas I sampai dengan kelas VI.
3) Kontinuitas
Berhubungan dengan prinsip komprehensif, maka prinsip kontinuitas
mempunyai persamaan tujuan. Sebaiknya tes disusun sedemikian rupa sehingga
menggambarkan kelanjutan dari awal anak memasuki suatu sekolah sampai dengan
kelas berakhir. Dengan demikian akan diketahui perkembangan anak itu dengan
terputus.
PERBANDINGAN FUNGSI TES

Fungsi Untuk Kelas Fungsi Untuk Bimbingan Fungsi Untuk
Administrasi
a. Mengadakan a. Menentukan arah a. Memberi petunjuk
diagnosis terhadap pembicaraan dengan dalam
kesulitan belajar orang tua tentang mengelompokkan
siswa. anak-anak mereka. siswa.
b. Mengevaluasi celah b. Membantu siswa b. Penempatan siswa
antara bakat dengan dalam menentukan memilih kelompok.
pencapaian. pilihan. c. Menilai kurikulum.
c. Menaikkan tingkat c. Membantu siswa d. Memperluas
prestasi. mencapai tujuan hubungan masyarakat
d. Mengelompokkan pendidikan dan (public relation).
siswa dalam kelas jurusan. e. Menyediakan
pada waktu metode d. Memberi kesempatan informasi untuk
kelompok. kepada pembimbing, badan-badan lain di
e. Merencanakan guru, dan orang tua luar sekolah.
kegiatan proses belajar dalam memahami
mengajar untuk siswa kesulitan anak.
84
secara perseorangan.
f. Menentukan siswa
mana yang
memerlukan
bimbingan khusus.
g. Menentukan tingkat
pencapaian untuk
setiap anak.
Langkah-langkah dalam penyusunan tes

Urutan langkah yang dilakukan adalah:
a. Menentukan tujuan mengadakan tes
b. Mengadakan pembatasan tujuan terhadap bahan yang akan diteskan.
c. Merumuskan tujuan instruksional bahan terhadap bahan yang akan diteskan.
d. Menderetkan semua TIK dalam tabel persiapan yang memuat pula aspek tingkah
laku terkandung dalam TIK itu. Tabel ini digunakan untuk mengadakan identifikasi
terhadap tingkah laku yang dikehendaki, agar tidak terlewati.
e. Menyusun tabel spesifikasi yang membuat pokok materi,aspek berfikir yang diukur
beserta imbangan antara kedua hal tersebut. Uraian secara terinci tentang tabel
spesifikasi, akan disajikan pada bab berikutnya.
f. Menuliskan butir-butir soal, didasarkan ata TIK-TIK yang sudah dituliskan pada
tabel TIK dan aspek tingkah laku yang dicakup.
Pengukuran ranah kognitif hanya ditekankan pada 3 aspek yaitu,

a. Soal ingatan
Pertanyaan ingatan biasa digunakan untuk mengukur penguasaan materi yang
berupa fakta, istilah, definisi, klasifikasi atau kategori.
b. Soal pemahaman
85
Pertanyaan pemahaman biasanya menggunakan kata-kata perbedaan,
perbandingan, menduga, menggeneralisasikan, memberikan contoh, menuliskan
kembali, memperkirakan.
c. Soal aplikasi
Soal aplikasi adalah soal yang mengukur kemampuan siswa dalam
mengaplikasikan (menerapkan) pengetahuan untuk memecahkan masalah sehari-
hari atau persoalan yang dikemukakan oleh pembuat soal.
Kata-kata yang digunakan dalam soal aplikasi, atau kemampuan yang dituntut
antara lain, mengubah, menghitung, mendemontrasikan, menemukan,
memanipulasikan, menmodifikasikan, menghubungkan, menunjukkan,
menggunakan.
d. Soal analisis
Soal analisis adalah soal yang menuntut kemampuan siswa untuk menganalisis
atau menguraikan sesuatu persoalan untuk diketahui bagian-bagiannya. Dalam
hierarki taksonomi, analsis lebih tinggi dari aplikasi. Oleh karena itu soal analisis
harus dimulai dengan kasus yang dikarang sendiri oleh guru, bukan mengambil
uraiandari buku atau catatn pelajaran.
Kata-kata yang digunakan atau kemampuan yang dituntut antara lain meliputi :
merinci, menyusun diagram, membedakan, mengilustrasikan, menyimpulkan,
memilih, memisahkan, membagi.
e. Soal sintesis
Sebagai kebalikan kemampuan untuk menganalisis adalah kemampuan untuk
mengadakan sisntesis. Oleh karena itu soal sistesis juga harus dimulai dengan
sebuah kasus. Berdasarkan penelaahan kasus tersebut siswa diminta untuk
mengdakan sintesis, yaitu menyimpulkan, mengkategorikan, mengkombinasikan,
mengarang, membuat desain, mengorganisasikan, menghubungkan, menulis
kembali, membuat rencana, menyusun, menciptakan.
f. Soal evaluasi
Soal evaluasi adalah soal yang berhubungan dengan menilai, mengmbil
kesimpulan, membandingkan, mempertentangkan, mengkritik, mendeskripsikan,
membedakan, menerangkan, memutuskan, menafsirkan.
86
Komponen-komponen tes
a. Buku tes
Yakni lembaran atau buku yang memuat butir-butir soal yang harus dikerjakan
oleh siswa.
b. Lembar jawaban tes
Lembaran yang disediakan oleh penilaian bagi teste untuk mengerjakan tes. Untuk
soal pilihan ganda biasanya dibuat lembaran nomor dan huruf a, b, c, d, menurut
banyaknya alternatif yang disediakan.
c. Kunci jawaban tes
Berisi jawaban-jawaban yang dikehendaki. Ide dari kunci jawaban ini adalah agar:
- Pemeriksaan tes dapat dilakukan oleh orang lain.
- Pemeriksaannya betul.
- Dilakukan dengan mudah.
- Sesedikit mungkin masuknya unsur subjektif.
d. Pedoman penilaian
Pedoman penilaian atau pedoman skoring berisi keterangan perincian tentang skor
atau angka yang diberikan kepada siswa bagi soal-soal yang telah dikerjakan.
Tugas perkelompok.
2. Apa yang anda ketahui tentang penilaian dan kaitannya dengan ujian?
3. Jelaskan hal apa saja yang dapat dinilai dalam ujian!
4. Apa syarat yang harus dipenuhi oleh suatu alat ujian?
5. Jelaskan kemungkinan penggunaan alat ujian!
6. Sebutkan syarat mutu alat ujian!
7. Sebut dan jelaskan jenis alat ujian!
8. Jelaskan fungsi tes dan hal-hal yang perlu diingat!
9. Buatlah bagan mengenai perbandingan fungsi test!
10. Jelaskan langkah-langkah penyusunan test!
11. Jelaskan komponen-komponen test!
STUDI KASUS
87
Perguruan tinggi X merupakan salah satu perguruan tinggi baru yang dalam masa
mempersiapkan ujian akhir para mahasiswanya. Perguruan tinggi tersebut hanya memiliki
beberapa bank soal yang terbatas, untuk itu para dosen ataupun pengajar bersepakat untuk
mengadakan sosialisasi mengenai persiapan pembuatan tes untuk ujian.
Pertanyaan :
1. Apa yang anda ketahui tentang penilaian dan kaitannya dengan ujian?
2. Jelaskan hal apa saja yang dapat dinilai dalam ujian!
3. Apa syarat yang harus dipenuhi oleh suatu alat ujian?
4. Jelaskan kemungkinan penggunaan alat ujian!
5. Sebutkan syarat mutu alat ujian!
6. Sebut dan jelaskan jenis alat ujian!
7. Jelaskan fungsi tes dan hal-hal yang perlu diingat!
8. Buatlah bagan mengenai perbandingan fungsi test!
9. Jelaskan langkah-langkah penyusunan test!
10. Jelaskan komponen-komponen test!
88
HAND OUT

Topik : Tekhnik OSCA/OSCE dalam Penilaian
Objektif Perilaku Siswa (OPS) :

1. Setelah mengikuti pelajaran ini, mahasiswa dapat menjelaskan pengertian
OSCA/OSCE dalam penilaian tanpa melihat referensi dengan baik dan benar
2. Tanpa melihat catatan mahasiswa dapat menjelaskan keunggulan OSCA/OSCE
dengan tepat
3. Tanpa melihat catatan mahasiswa dapat menjelaskan kekurangan OSCA/OSCE
dengan tepat
4. Tanpa melihat catatan mahasiswa dapat menjelaskan tekhnik uji OSCA/OSCE secara
sistematis
5. Tanpa melihat catatan mahasiswa dapat menjelaskan perencanaan penyusunan soal
OSCA/OSCE dengan baik dan benar
6. Tanpa melihat catatan mahasiswa dapat menjelaskan penilaian OSCA/OSCE secara
sistematis
Referensi:
1. Yanti & Pertiwi, H.W. (2008). OSCA (Objective Structure Clinical Assessment)
Panduan Praktis Menghadapi UAP D III Kebidanan. Jogjakarta : Mitra Cendikia
Press
2. http://reproduksiumj.blogspot.com/2012/03/osce.html
PENDAHULUAN
Didalam dunia pendidikan, berhasil atau tidaknya peserta didik dapat dinilai dengan
cara melakukan evaluasi pelajaran yang telah diterima peserta didik selama masa
89
pendidikan. Pada mahasiswa Diploma III Kebidanan, sebelum mereka dinyatakan lulus
dan menjadi bidan, mereka akan melaksanakan suatu ujian akhir yang dikenal dengan
nama Ujian Akhir Program (UAP). UAP dilaksanakan dengan metode uji Objective
Structured Clinical Assesment (OSCA) yang mana metode ini merupakan suatu model uji
dimana perbedaan dengan model uji lain adalah pada tekhnik ujian dan cara menilai,
bukan pada materi uji, karena materi uji tetap berdasar kurikulum pendidikan D-III dan
pengalaman selama di klinik.
Tujuan penilaian dengan menggunakan OSCA adalah untuk mengevaluasi
kompetensi professional tenaga kesehatan yang mencakup evaluasi pengetahuan,
keterampilan komunikasi, keterampilan pemeriksaan fisik, keterampilan dalam
mengintepretasikan dan menganalisa hasil pemeriksaan diagnostik, keterampilan dalam
membuat diagnosis, menilai perilaku dan hubungan interpersonal. Oleh karena itu, OSCA
sangat penting sekali untuk dipelajari karena OSCA ini merupakan penilaian yang sangat
cocok untuk mengevaluasi kompetensi calon bidan, dan sangat bermanfaat bagi dosen
kebidanan.
Dalam hand out ini, mahasiswa akan mempelajari pengertian, keunggulan,
kekurangan, teknik uji, perencanaan penyusunan soal serta penilaian OSCA, sehingga
dapat memudahkan mahasiswa untuk menerapkan sistem penilaian dengan tekhnik
OSCA pada saat menjadi dosen nantinya.
MATERI
Explanation
A. Pengertian OSCA/OSCE
OSCA atau kependekan dari Objective Structured Clinical Assesment,
sebenarnya hanyalah suatu model uji dimana perbedaan dengan model uji lain adalah
pada tekhnik ujian dan cara menilai, bukan pada materi uji, karena materi uji tetap
berdasar kurikulum pendidikan D-III dan pengalaman selama di klinik (Yanti &
Pertiwi, 2008 : 5).
90
OSCA atau ada yang menyebut OSCE (Objective Structured Clinical
Examination) adalah alat uji yang digunakan untuk mengevaluasi kompetensi
professional tenaga kesehatan yang mencakup evaluasi pengetahuan, keterampilan
komunikasi, keterampilan pemeriksaan fisik, keterampilan dalam mengintepretasikan
dan menganalisa hasil pemeriksaan diagnostik, keterampilan dalam membuat
diagnosis, menilai perilaku dan hubungan interpersonal (Yanti & Pertiwi, 2008 : 5).
OSCA bisa terdiri dari 15-20 stasi, masing-masing stasi dibutuhkan waktu 5-30
menit, stasi secara umum dibagi dalam 2 kelompok yaitu:
1. Stasi prosedur (skill), untuk menilai kemampuan menjalankan tugas yang
diberikan terkait dengan keterampilan serta perilaku selama menjalankan tugas.
Stasi ini diobservasi dan dinilai oleh penguji diam (observer) yang melakukan
penilaian atas dasar checklist yang sudah disusun sebelumnya. Checklist terdiri
atas :
a. Content atau isi kegiatan yang harus dilakukan
b. Sikap yang ditunjukan dan perilaku yang dilakukan selama kegiatan
c. Tehnik yaitu hal-hal yang berkaitan dengan bagaimana prosedur kerja
dilaksanakan.
Setiap butir dalam checklist tersebut harus diberi skor, sesuai dengan
pentingnya kedudukan butir tersebut, dan perlu disepakati bersama diantara para
pakar penyusun soal OSCA.
2. Stasi pengetahuan (Knowledge), peserta uji menjawab pertanyaan yang bisa

terkait dengan pemeriksaan sebelumnya atau diminta memberikan interpretasi
problem pasien atas data yang diberikan (kasus). Pertanyaan bisa juga atas dasar
hasil anamnesa, pemeriksaan fisik, dan laboratorium.
Alasan pemilihan metode uji OSCA dapat kita lihat dari arti OSCA itu sendiri
yaitu :
1. Objective karena soal sudah tersedia jawaban baku, B/S, MCQ (pilihan ganda)
atau jawaban pendek. Pertanyaan essai tidak digunakan pada uji ini. Sedangkan
91
pada stasi skill setiap peserta diobservasi dengan orang yang sama sehingga
mempunyai standar yang sama.
2. Structured berarti bahwa pada uji ini terdapat struktur yang konsisten mencakup
aspek pengetahuan, keterampilan dan sikap prilaku.
3. Clinical Assessment berarti bahwa materi uji adalah keterampilan atau
pengetahuan yang terkait dengan pasien (klinis) maupun penatalaksanaan kasus.
Sehinggga dari kata OSCA tersebut peserta akan dinilai secara objektif, tidak
ada faktor keberuntungan tentang kemampuannya memahami pengelolaan pasien.
Selain itu, uji OSCA dapat dilakukan dalam waktu sehari dengan uji dalam jumlah
yang banyak.
Mahara (1998) menyebutkan bahwa evaluasi klinik mempunyai dua fungsi
yang saling berkaitan, yaitu :
1. Fungsi pendidikan, dimana proses evaluasi seharusnya memberikan informasi
kepada mahasiswa dan dosen mengenai apakah yang dipelajari sudah sesuai
dengan apa yang diperlukan untuk meningkatkan proses belajar mengajar
2. Gatekeeping, pada fungsi ini, proses evaluasi dilakukan untuk mempertahankan
standar profesional dan melindungi publik atau masyarakat dengan penjaminan
bahwa mahasiswa mempunyai kualifikasi yang baik untuk praktek sesuai otonomi
profesi.
B. Keunggulan OSCA/OSCE
OSCA ini dipandang lebih valid, lebih reliabel dan lebih objektif dibanding
dengan ujian lisan kasus yang selama ini dipakai dalam menilai kemampuan klinis,
kemampuan komunikasi dan perilaku (Usha Nayar 1995 dalam Yanti & Pertiwi, 2008
: 8). Namun Newbel D (1998) Mengingatkan reliabilitas OSCA akan meningkat bila
jumlah stasi makin banyak.
Selain itu keuntungan OSCA adalah bisa melakukan evaluasi peserta dalam
jumlah yang banyak dalam waktu yang lebih pendek secara serentak, menguji
pengetahuan dan keterampilan yang lebih luas, dan semua peserta dievaluasi dengan
instrument serta bahan uji yang sama.
92
Keuntungan metode OSCA yang lain adalah dapat digunakan untuk menguji
berbagai kompetensi yang harus dikuasai peserta didik dalam waktu yang relative
singkat, dimana keberhasilan teruji dapat segera diketahui (Yanti & Pertiwi, 2008 : 8).
C. Kekurangan OSCA/OSCE
Adapun kekurangan dari metode OSCA yaitu penilaian hanya meliputi
pengetahuan secara umum, bukan suatu penilaian dengan pendekatan holistik dari
penanganan pasien dan dibutuhkan pengorganisasian serta persiapan penyusunan
soal-soal yang sangat membutuhkan waktu dan tenaga. Guna menghindari evaluasi
yang bersifat kompartemental beberapa stasi yang berurutan digunakan untuk
melakukan evaluasi masalah yang sama mulai dari anamnesis, pemeriksaan fisik,
komunikasi, perilaku serta interpretasi hasil pemeriksaan sehingga dapat dilakukan
secara penuh (Mittal & Sood, 1995 dalam Yanti & Pertiwi, 2008 : 8-9).
Faktor-faktor yang menyebabkan rendahnya reliabilitas OSCA antara lain
terlalu sedikit stasi atau terlalu sedikitnya waktu ujian, checklist seharusnya tidak ada
perbedaan dalam arti tidak terlalu mudah juga tidak terlalu susah, pasien yang tidak
reliabel (simulated pasien), penguji yang memberikan skor nilai dengan tidak
berpatokan pada standar penilaian, dan problem administrasi misalnya ruangan terlalu
bising, atau staf dan pelaksana yang tidak terorganisir dengan baik.
Untuk menilai validitas evaluasi klinik terhadap kompetensi profesional

mahasiswa pendidikan kesehatan dengan format OSCA perlu dipertimbangkan
apakah problem pasien relevan dan penting sesuai dengan kurikulum, akankah tiap
stasi mampu mengevaluasi keterampilan yang telah diajarkan pada mahasiswa, dan
sudahkah dilakukan review untuk setiap stasi oleh seorang yang dipandang ahli.
Pelaksanaan evaluasi klinik dengan menggunakan format OSCA memerlukan
biaya yang sangat besar tergantung dari jumlah stasi, pasien atau simulated pasien,
penguji dan petugas lain yang dibutuhkan. Dalam hal ini jumlah stasi yang banyak
membutuhkan penyiapan soal yang perlu diuji validitas dan reliabilitasnya, apabila
menggunakan pasien sesungguhnya perlu dipertimbangkan karena dapat membuat
pasien kelelahan menghadapi banyak teruji, bila menggunakan simulated pasien maka
93
perlu dilatih terlebih dahulu sehingga mendekati pasien yang sesungguhnya, untuk
penguji perlu dilakukan pelatihan agar mampu melakukan tugasnya dengan benar.
Kelemahan lain dari evaluasi klinik dengan format OSCA antara lain
keterbatasan waktu setiap stasi, dan penggunaan checklist yang mengasumsikan
bahwa interaksi antara pasien/simulated pasien dengan teruji merupakan list of action,
checklist cenderung menekankan pada kecermatan atau ketelitian pada setiap
tindakan dilakukan atau tidak, dan hal ini menyebabkan kesulitan dalam penilaian
jika dilakukan tetapi tidak sempurna.
Adapun kelemahan lainnya yaitu keterbatasan pada apa yang seharusnya
disimulasikan sehingga hal ini membatasi dalam mengidentifikasi masalah pasien
seperti pada pasien yang sesungguhnya.
Dengan demikian maka diperlukan persiapan yang matang baik soal, penguji,
simulated pasien, tempat maupun petugas lain yang terlibat (Yanti & Pertiwi, 2008 :
10).
D. Tekhnik Uji OSCA/OSCE

Evaluasi klinik dengan metode OSCA sebenarnya sudah diperkenalkan 30
tahun yang lalu sebagai pendekatan yang reliable untuk mengevaluasi keterampilan
klinik dasar di dunia kedokteran. OSCA merupakan bentuk tes yang fleksibel yang
berdasarkan pada pasien disetiap stasi. Pada setiap stasi, teruji melakukan interaksi
dengan pasien atau simulated pasien untuk mendemonstrasikan kemampuan
psikomotornya.
DENAH LOKASI PENEMPATAN STASI
(15 STASI + 5 STASI ISTIRAHAT)
ST I ST II ISTRHT ST III ST IV ST V ST VI ISTRHT
ISTRHT TEMPAT UNTUK TEMPAT UNTUK ST VII

KEPERLUAN ALAT-ALAT
ADMINISTRASI MEDIK
ST XV ST VIII
ST XIV
94
ISTRHT ST ST XII ST XI ISTRHT ST X ST IX
Keterangan gambar :
 : Stasi Uji Tulis
 : Istirahat
 : Stasi Uji Keterampilan
 : Petunjuk Arah
1. Stasi
Stasi adalah tempat untuk mengerjakan materi uji baik yang berupa
pengetahuan atau knowledge maupun skill atau keterampilan. Jumlah stasi untuk
satu putaran uji kompetensi biasanya 15-20 stasi terdiri dari stasi ujian (skill dan
knowledge) dan stasi istirahat bila diperlukan tergantung jumlah peserta yang
akan diuji.
Sebagai contoh bila yang akan diuji dalam satu putaran ada 20 orang
sedangkan ditentukan jumlah stasi uji 15 maka 15 stasi adalah stasi uji dan 5 stasi
adalah stasi istirahat yang biasanya ditempatkan setelah stasi skill. Desain dari
stasi ini biasanya melingkar dengan tujuan agar teruji dapat melewati setiap stasi
searah jarum jam.
2. Tim Penguji
Tim penguji terdiri dari leader (ketua tim penguji), penguji skill (diam/
observer) dan penguji umum.
a. Leader/ Ketua tim penguji
Leader adalah seorang yang dipilih untuk memimpin jalannya uji
kompetensi. Adapun tugas leader secara terperinci adalah sebagai berikut
1) Membawa soal
2) Briefing dengan penguji dan teruji (bila memungkinkan briefing dilakukan
sehari sebelum ujian)
3) Melihat persiapan alat
95
4) Sebelum ujian dimulai briefing dengan simulated pasien
5) Membagikan nomor ujian
6) Mengundi penempatan stasi
7) Mengawasi proses ujian (dapat menggantikan menjadi penguji skill atau
keterampilan apabila penguji skill meninggalkan tempat ujian, atau
berhalangan datang karena ada sesuatu hal)
8) Mengawasi dan melakukan koreksi serta membantu proses yudisium
ditempat
9) Mengumpulkan soal-soal yang telah diujikan dan diserahkan kembali ke
dinkes propinsi
b. Penguji skill
Penguji skill adalah orang yang bertugas di stasi skill untuk melakukan
penilaian terhadap teruji pada saat teruji mendemonstrasikan kemampuan
psikomotornya dengan mengisi
checklist dari skill yang diujikan secara terperinci. Tugas dari penguji skill
adalah sebagai berikut:
1) Membantu leader dalam proses persiapan ujian
2) Melaksanakan penilaian pada stasi keterampilan
3) Sebagai penguji skill atau keterampilan harus benar-benar mematuhi
ketentuan sebagai penguji diam, tidak boleh berbicara atau mengajukan
pertanyaan kepada teruji atau simulated pasien.
c. Penguji umum
Penguji umum adalah orang yang bertugas mengawasi teruji pada stasi
knowledge atau menggantikan penguji diam pada stasi skill bila dibutuhkan.
3. Simulated pasien
Merupakan orang yang telah dilatih agar menjadi pasien seperti yang
sesungguhnya. Tugas stimulated pasien adalah memerankan pasien seperti yang
diminta dari soal yang biasanya berbentuk kasus. Namun validitas interaksi
dengan pasien lebih tinggi dibanding dengan simulated pasien.
96
4. Fasilitator
Fasilitator mempunyai tugas membantu menyiapkan alat dan bahan yang
diperlukan untuk mendemonstrasikan suatu soal berupa kasus yang akan
dikerjakan oleh teruji serta membantu menyediakan apa yang diperlukan penguji
selama proses ujian berlangsung.
5. Timer atau pengatur waktu
Timer adalah orang yang bertugas mengatur pergantian waktu yang
diperlukan untuk perpindahan teruji dari stasi satu ke stasi berikutnya dengan
membunyikan bel bila waktu untuk mengerjakan soal telah habis, sehingga
serentak teruji akan meninggalkan stasinya dan berpindah ke stasi berikutnya
searah jarum jam.
6. Pengolah nilai
Pengolah nilai biasanya difasilitasi sebuah komputer umtuk memasukan
nilai dari lembar jawab teruji yang telah selesai mengerjakan soal pada stasi yang
telah dilewati. Dalam hal ini sudah disiapkan format
baku yang sudah ditentukan dari pihak penyelenggara ujian sehingga disini akan
langsung terumuskan apakah teruji lulus apa tidak lulus pada stasi tersebut. Perlu
diketahui bahwa kelulusan dalam uji kompetensi OSCA ini ditentukan bukan
berdasarkan nilai total dari seluruh stasi yang diujikan, melainkan kelulusan dari
masing-masing stasi. Bila pada salah satu stasi, teruji tidak lulus berdasarkan nilai
batas lulus yang sudah ditentukan maka yang bersangkutan tetap dinyatakan tidak
lulus meskipun secara keseluruhan nilai totalnya bagus.
7. Petugas kebersihan
Selain petugas-petugas diatas juga diperlukan petugas kebersihan yang tidak
kalah pentingnya guna menjamin penciptaan suasana bersih dan nyaman selama
proses ujian berlangsung. Misalnya saja mengelap atau mengeringkan daerah
basah setelah terpakai teruji satu agar teruji berikutnya dapat langsung
menggunakan tempat tersebut.
8. Waktu ujian
97
Untuk mengerjakan soal disetiap stasi diperlukan waktu 10-15 menit
tergantung dari tingkat kesulitan soal. Waktu dari setiap stasi harus sama sehingga
dari keseluruhan teruji dapat melewati masing-masing stasi secara bergantian
sehingga proses ujian dapat berjalan secara lancar. Hal ini akan diatur oleh timer
dengan membunyikan bel untuk setiap pergantian stasi (Yanti & Pertiwi, 2008 :
16).
E. Perencanaan Penyusunan Soal OSCA/OSCE

Hal-hal yang perlu disiapkan dalam penyusunan soal UAP OSCA D III
Kebidanan, meliputi :
1. Untuk stasi pengetahuan, perlu dipersiapkan :
a. Isi bahan uji dengan mengacu pada 9 standar kompetensi minimal bidan yang
terdapat pada kurikulum yang akan di evaluasi.
b. Bentuk soal berupa kasus (1 kasus untuk 5 soal) dengan melakukan uji
validitas dan reliabilitas terlebih dahulu
c. Presentasi dari berbagai komponen bahan uji
d. Pembobotan dari checklist

e. Standar minimum untuk lulus
2. Untuk stasi keterampilan, perlu disiapkan :
a. Briefing antara penguji dan staf pembantu ujian, misalnya simulated pasien,
fasilitator dan lain-lain
b. Persiapan pasien simulasi, boneka, kasus berupa data hasil anamnesis,
pemeriksaan fisik, laborat, dan lain-lain
c. Mempersiapkan dokumen yang meliputi :
1) Instruksi untuk peserta ujian
2) Instruksi untuk penguji
3) Instruksi kepada pasien simulasi
4) Pertanyaan yang diberikan
5) Checklist untuk penguji
98
F. Penilaian OSCA/OSCE
1. Penilaian ujian
a. Ruang lingkup penilaian meliputi unsur pengetahuan, keterampilan dan sikap
dengan menggunakan metode OSCA yang dituangkan dalam 15 stasi, terdiri
dari 11 stasi uji tulis, dan 4 stasi uji keterampilan atau penampilan klinik
b. Penilaian dilakukan dengan menggabungkan nilai seluruh aspek pengetahuan,
keterampilan dan sikap (PKS) dengan nilai batas lulus uji tertulis adalah 60
dari setiap stasi dan uji keterampilan (skill) termasuk sikap adalah 70 dari
setiap stasi, kemudian di rerata (jumlah nilai dibagi 15)
2. Uji ulang OSCA hanya diberikan kesempatan dua kali, bila belum berhasil maka
dapat diikutkan pada periode UAP yang terdekat pada stasi yang belum lulus.
3. Bagi yang mengikuti uji ulang I, nilai yang diambil adalah nilai yang terbaik
dengan ketentuan dua tingkat diatas nilai ujian utama
4. Bagi yang mengikuti uji ulang II nilai yang diambil adalah nilai batas lulus.
5. Uji perbaikan, nilai yang diambil adalah nilai yang terbaik (Yanti & Pertiwi,
2008 : 42).
Activity
1. Jelaskan defenisi dari OSCA/OSCE dengan benar !
2. Jelaskan keunggulan OSCA/OSCE!
3. Jelaskan kekurangan OSCA/OSCE!
4. Jelaskan tekhnik OSCA/OSCE dengan benar !
5. Jelaskan secara sistematis perencanaan penyusunan soal OSCA/OSCE
6. Jelaskan tentang penilaian OSCA/OSCE dengan benar!
Summary
1. OSCA/OSCE adalah alat uji yang digunakan untuk mengevaluasi kompetensi
professional tenaga kesehatan yang meliputi aspek pengetahuan dan skill.
99
2. Teknik OSCA/OSCE lebih valid, reliable, dan lebih objektif, dapat melakukan test
yang banyak dalam waktu yang singkat dengan hasil yang bisa segera diketahui.
3. Penilaian OSCA/OSCE hanya menilai pengetahuan secara umum dan mahasiswa
belum tentu menguasai setiap stasi yang diujikan.
4. Tehnik OSCA/OSCE merupakan bentuk test yang fleksibel berdasarkan pada pasien
disetiap stasi
5. Perencanaan Penyusunan Soal OSCA/OSCE, meliputi stasi pengetahuan dan stasi
keterampilan
6. Penilaian OSCA/OSCE terdiri dari :
a. Penilaian ujian
b. Uji ulang OSCA hanya diberikan kesempatan dua kali
c. Uji perbaikan, nilai yang diambil adalah nilai yang terbaik
KESIMPULAN
1. OSCA/OSCE adalah alat uji yang digunakan untuk mengevaluasi kompetensi

professional tenaga kesehatan yang mencakup evaluasi pengetahuan, keterampilan
komunikasi, keterampilan pemeriksaan fisik, keterampilan dalam mengintepretasikan
dan menganalisa hasil pemeriksaan diagnostik, keterampilan dalam membuat
diagnosis, menilai perilaku dan hubungan interpersonal
2. Keunggulan OSCA/OSCE meliputi :
a. Lebih valid, lebih reliabel dan lebih objektif dibanding dengan ujian lisan kasus
yang selama ini dipakai dalam menilai kemampuan klinis, kemampuan
komunikasi dan perilaku
b. Melakukan evaluasi peserta dalam jumlah yang banyak dalam waktu yang lebih
pendek secara serentak
c. Menguji pengetahuan dan keterampilan yang lebih luas, dan semua peserta
dievaluasi dengan instrument serta bahan uji yang sama.
d. Keberhasilan teruji dapat segera diketahui
100
3. Kekurangan OSCA/OSCE meliputi :
a. Penilaian hanya meliputi pengetahuan secara umum
b. Persiapan penyusunan soal-soal yang sangat membutuhkan waktu dan tenaga.
c. Ruangan terlalu bising, atau staf dan pelaksana yang tidak terorganisir dengan
baik.
d. Perlunya pertimbangan yang meliputi :
1) Apakah problem pasien relevan dan penting sesuai dengan kurikulum
2) Apakah setiap stasi mampu mengevaluasi keterampilan yang telah diajarkan
pada mahasiswa
3) Sudahkah dilakukan review untuk setiap stasi oleh seorang yang dipandang
ahli.
e. Memerlukan biaya yang sangat besar
f. Keterbatasan waktu setiap stasi
4. Tekhnik Uji OSCA/OSCE

DENAH LOKASI PENEMPATAN STASI
(15 STASI + 5 STASI ISTIRAHAT)
ST I ST II ISTRHT ST III ST IV ST V ST VI ISTRHT
ISTRHT TEMPAT UNTUK TEMPAT UNTUK ST VII

KEPERLUAN ALAT-ALAT
ADMINISTRASI MEDIK
ST XV ST VIII
ST XIV
ISTRHT ST ST XII ST XI ISTRHT ST X ST IX
Tekhnik uji OSCA/OSCE terdiri dari stasi, tim penguji, simulated pasien, fasilitator,
timer atau pengatur waktu, pengolah nilai, petugas kebersihan, waktu ujian
5. Perencanaan Penyusunan Soal OSCA/OSCE, meliputi : stasi pengetahuan dan stasi
keterampilan
6. Penilaian OSCA/OSCE terdiri dari :
101
d. Penilaian ujian
e. Uji ulang OSCA hanya diberikan kesempatan dua kali
f. Uji perbaikan, nilai yang diambil adalah nilai yang terbaik
LATIHAN SISWA
1. Jelaskan pengertian OSCA/OSCE dalam penilaian!

2. Jelaskan keunggulan OSCA/OSCE!
3. Jelaskan kekurangan OSCA/OSCE!
4. Jelaskan tekhnik uji OSCA/OSCE!
5. Jelaskan perencanaan soal OSCA/OSCE!
6. Jelaskan penilaian OSCA/OSCE!
102
Kode MK :
Topik : OSCE (Objective Stucture Clinical Examination)
Sub Topik : OSCEItem Development
Waktu : 40 menit
Dosen : Ima Salamah, AM.Keb
Dea Riyani Sasmita, AM.Keb
Febiyanti, AM.Keb
Siti Fatimah, AM.Keb
TUJUAN PEMBELAJARAN :
Setelah membaca hand out ini, mahasiswa mampu:
1. Tanpa melihat buku catatan, Mahasiswa dapat menyebutkan hal-hal yang
perlu disiapkan dalam penyusunan soal UAP OSCA D III Kebidanan dalam
Penyusunan perencanaan soal OSCE (pengetahuan dan keterampilan)
dengan benar
2. Tanpa melihat buku catatan, Mahasiswa dapat menyebutkan proporsi
bahan uji dalam metode OSCE harus mengacu pada 9 standar Kompetensi
minimal bidan dengan tepat
3. Tanpa melihat buku catatan, Mahasiswa dapat menjelaskan Matrik soal
OSCE dilihat dari jumlah stasi, kompetensi dalam Blue Print sesuai
penjelasan yang telah diberikan
4. Tanpa melihat buku catatan, Mahasiswa dapat menyebutkan beberapa
pedoman umum dalam pembuatan kontruksi MCQ dengan tepat
5. Tanpa melihat buku catatan , mahasiswa dapat menjelaskan mengenai
stuktur MCQ dengan benar
6. Dengan petunjuk yang telah diberikan, Mahasiswa dapat membuat 5 soal
MCQ (sesuai dengan struktur MCQ) untuk stasi pengetahuan dengan benar
103
REFERENSI :
1. Yanti, SST dan Herdini Widyaning Pertiwi S.SiT, 2008, OSCA panduan Praktis
menghadapi UAP DIII Kebidanan, Yogyakarta, Mitra Cendikia
2. Titik Sapartinah, SSiT., S.Kep.,MKes dkk, 2012, Kumpulan SOAL Pengetahuan
dalam ujian Metode OSCA , Jakarta, Kencana Prenada Media Group
3. Kemenkes, 2011, Panduan persiapan dan penyelengggaraan CBT Tenaga
Kesehatan Indonesia, Jakarta, HPEQ Project,
4. Constructing Written Test Questions For the Basic and Clinical Sciences, Third
Edision, National Board of Medical Examiners, 3750 Market Street Philadelphia, PA
19104
5. http://bukujurnalartikel.blogspot.com/2010/03/objective-structured-clinical.html
6. Assessment of clinical competence using objective structured examination, Harden et
al., Br Med J. 1975 Feb 22;1(5955):447-51
http://www.bmj.com/cgi/content/abstract/1/5955/447
7. (Ross, M., Carroll, G., Knight, J., Chamberlain, M., Fothergill-Bourbonnais, F., and
Linton, J. (1988) Using the OSCE to measure clinical skills performance in nursing.
Journal of Advanced Nursing, 13, 45-56).
8. How to perform an abdominal examination in the OSCE
http://www.instamedic.co.uk/osce/abdomen/
URAIAN MATERI :
PENDAHULUAN (INTRODUCTION)
Salah satu upaya untuk meningkatkan standar kompetensi dalam

penilaian adalah melalui OSCE (OBJECTIVE STRUCTURE CLINICAL
EXAMINATION). Dimana tujuan penilaian dengan menggunakan OSCE/OSCA
adalah untuk mengevaluasi kompetensi professional tenaga kesehatan yang
mencakup evaluasi pengetahuan, keterampilan komunikasi, keterampilan
pemeriksaan fisik, keterampilan dalam mengintepretasikan dan menganalisa
hasil pemeriksaan diagnostik, keterampilan dalam membuat diagnosis, menilai
perilaku dan hubungan interpersonal. Untuk melakukan penilaian tersebut
maka perlu adanya rambu rambu dalam membuat soal OSCE / OSCA
tersebut.
Dalam handout ini, mahasiswa akan mempelajari perencanaan

penyusunan soal, pembuatan soal dan sistem penilaian dengan tekhnik OSCA
pada saat menjadi dosen nantinya.
104
PENJELASAN (EXPLANATION)
Perencanaan penyusunan soal OSCE
Hal-hal yang perlu disiapkan dalam penyusunan soal UAP OSCA D III
Kebidanan, meliputi :
1. Untuk stasi pengetahuan, perlu dipersiapkan :
a. Isi bahan uji dengan mengacu pada 9 standar kompetensi minimal
bidan yang terdapat pada kurikulum yang akan di evaluasi
b. Bentuk soal berupa kasus (1 kasus untuk 5 soal) dengan melakukan
uji validitas dan reliabilitas terlebih dahulu
c. Presentasi dari berbagai komponen bahan uji
d. Pembobotan dari checklist
e. Standar minimum untuk lulus
2. Untuk stasi keterampilan, perlu disiapkan :

a. Briefing antara penguji dan staf pembantu ujian, misalnya simulated
pasien, fasilitator dan lain-lain
b. Persiapan pasien simulasi, boneka, kasus berupa data hasil
anamnesis,
pemeriksaan fisik, laborat, dan lain-lain
c. Mempersiapkan dokumen yang meliputi :
1) Instruksi untuk peserta ujian
2) Instruksi untuk penguji
3) Instruksi kepada pasien simulasi
4) Pertanyaan yang diberikan
5) Checklist untuk penguji
Proporsi Bahan uji OSCE
Proporsi bahan uji dalam metode OSCE harus mengacu pada 9 standar
Kompetensi minimal bidan yaitu
No Jenis mata kuliah Kompentensi Kebidanan Persentase
1 ASKEB I 20%
105
2 ASKEB II 20%
3 ASKEB III 10%
4 ASKEB IV 10%
5 ASKEB V 10%
6 ASKEB Neonatus, bayi dan balita 10%
7 ASKEB Gangguan system reproduksi 10%
8 ASKEB KB 10%
BLUE PRINT OSCE
Matrik soal OSCE, jumlah stasi, kompetensi yang dujikan dan kebutuhan
alat bantu serta penguji diam dalam pelaksanaan UAP DIII Kebidanan,
diantaranya :
Stasi Kompetensi Alat Bantu Uji Penguji Keterangan
1 Kompetensi I : - Lembar soal Disiapkan lembar
Keterampilan dari pernyataan MCQ jawaban stasi
asuhan kebidanan pada - Lembar knowledge (I,II,
asuhan kehamilan jawaban dibawa IV,V, VII, VIII,
normal peserta X,XI, XII, XII, XV)
II Kompetensi II : - Lembar soal yang diberikan
Asuhan kebidanan pada pernyataan MCQ peserta pada saat
ibu hamil patologis tetap ditempat penjelasan awal
- Lembar
jawaban dibawa
peserta
III Kompetensi III : - Pasien Penguji
Skill asuhan kebidanan simulasi diam
pada ibu hamil fisiologis - Alat peraga
maupun patologis - Lembar
penilaian berupa
checklist
- Lembar
perintah untuk
penguji, teruji,
pasien simulasi dan
fasilitator
IV Kompetensi IV : - Lembar soal Disiapkan
Asuhan Kebidanan pada penyataan MCQ checklist dan
ibu bersalin fisiologis tetap ditempat informasi berupa
- Lembar instruksi untuk
jawaban dibawa teruji, pasien
peserta simulasi, penguji
V Kompetensi V : - Lembar soal dan fasilitator
Asuhan Kebidanan pada penyataan MCQ berkaitan dengan
ibu bersalin patologis tetap ditempat keterampilan
- Lembar pada kasus yang
jawaban dibawa diujikan pada
peserta
106
VI Kompetensi VI : - Pasien Penguji stasi skill (III,VI,IX
Skill asuhan kebidanan simulasi diam dan XIV)
pada ibu bersalin - Alat peraga
fisiologis maupun - Lembar
patologis penilaian berupa
checklist
- Lembar
perintah
VII Kompetensi VII : - Lembar soal
Asuhan Kebidanan pada penyataan MCQ
ibu nifas normal tetap ditempat
- Lembar
jawaban dibawa
peserta
VIII Kompetensi VIII : - Lembar soal
ibu nifas patologis tetap ditempat
- Lembar
jawaban dibawa
peserta
IX Kompetensi IX : - Pasien Penguji
Skill pada ibu nifas baik simulasi diam
fisiologis maupun - Alat peraga
patologis - Lembar
penilaian berupa
checklist
- Lembar
perintah
X Kompetensi X : - Lembar soal
Asuhan Kebidanan penyataan MCQ
patologis tetap ditempat
- Lembar
jawaban dibawa
peserta
XI Kompetensi XI : - Lembar soal
Asuhan Kebidanan ibu penyataan MCQ
dengan gangguan sistem tetap ditempat
reproduksi - Lembar
jawaban dibawa
peserta
XII Kompetensi XII : - Lembar soal
neonatus, bayi dan tetap ditempat
balita (sehat maupun - Lembar
sakit) jawaban dibawa
peserta
XIII Kompetensi XIII : - Lembar soal
Keluarga Berencana tetap ditempat
- Lembar
jawaban dibawa
peserta
XIV Kompetensi XIV : - Pasien Penguji
Skill asuhan Kebidanan simulasi diam
pada pelayanan KB - Alat peraga
- Lembar
penilaian berupa
checklist
- Lembar
perintah
107
XV Kompetensi XV : - Lembar soal
Komunitas tetap ditempat
- Lembar
jawaban dibawa
peserta
MODEL SOAL OSCE/OSCA
1. Stasi pengetahuan
- Soal berbentuk kasus
- Jawaban B/S atau MCQ
- Soal yang diberikan terkait dengan pengelolaan pasien suatu kasus
yaitu menyimpulkan diagnose, memformulasikan pemeriksaan
lanjutan, identifikasi masalah, interprestasi hasil pemeriksaan dan
pemecahan masalah klien.
Contoh :
Kompetensi ASKEB I maka focus soal adalah sekitar pemeriksaan
kehamilan sebagaimana peran bidan adalah melakukan asuhan
kebidanan pada ibu hamil baik fisiologis ataupun patologis
Materi yang diujikan adalah tentang diagnose kehamilan, meliputi :
paritas, usia kehamilan, letak anak, kehamilan ganda atau tunggal,
intrauteri/ekstrauteri, hidup/mati, serta rencana kemungkinan
komplikasi yang dihadapi klien dan rencana asuhan yang harus
diberikan
2. Stasi Skill
Yang diujikan adalah kemampuan melakukan tindakan sesuai perintah
yang ada. Skill yang diujikan dan teknik yang harus diperhatikan
adalah :
- Prosedur tindakan pada ibu hamil, bersalin, nifas, bayi baru lahir
maupun akseptor KB
- Waktu yang diberikan sama dengan stasi pengetahuan = 10 menit

- Peserta harus jeli membaca perintah soal
- Alat sudah disediakan
- Observer dibekali checklist
108
- Adanya interaksi peserta uji dengan simulated pasien
- Tidak ada interaksi antara observer dengan peserta uji
LEMBAR SOAL MCQ
PEDOMAN UMUM KONTRUKSI MCQ :
1. Yakinkan bahwa setiap soal dapat dijawab tanpa harus melihat pilihan
jawaban atau yakinkan bahwa pilihan jawaban adalah 100 % benar atau
salah.
2. Usahakan agar data atau informasi penting seoptimal mungkin
dicantumkan pada soal (stem), sedangkan pilihan jawaban usahakan
sesingkat mungkin.
3. Hindari informasi berlebihan pada soal.
4. Hindari soal-soal yang bersifat menjebak dan terlalu kompleks serta tidak
relevan.
5. Gunakan pilihan jawaban yang secara gramatikal konsisten dan secara
logis kompatibel dengan soal.
6. Hindari kata-kata absolut seperti, selalu, tidak pernah, dan semua pada
pilihan jawaban, dan hindari pula istilah yang tidak jelas (meragukan)
seperti biasanya atau sering.
7. Hindari kalimat atau frase negatif seperti KECUALI, TIDAK, atau BUKAN.
8. Fokuskan soal pada konsep-konsep penting, dan hindari hanya menguji
kemampuan mengingat fakta.
9. Fokuskan soal-soal pada konsep penting dan kasus-kasus yang sering
serta memiliki potensi masalah serius.
10.Setiap soal diusahakan agar menilai aplikasi pengetahuan, tidak hanya
menguji daya ingat terhadap fakta terisolasi.
11.Seluruh distraktor (pengecoh= jawaban salah) dibuat homogen (dari sisi
gramatikal,panjang pendeknya kalimat).
STRUKTUR MCQ :
109
1. Vignete/Isi/steam
 Relevan dengan kompetensi (blue print)
 Berisi dg data yg memungkinkan mhsw kompeten menjawab dengan
benar
 Mempresentasikan keadaan yang mungkin terjadi di konteks nyata
 Fokus prinsip atau konsep penting/esensial yang perlu dimengerti
oleh mahasiswa, bukan hanya soal hafalan
 Vignete bisa dijawab oleh mahasiswa yang kompeten tanpa melihat
jawaban
 Tidak menjebak dan juga tidak terlalu rumit
 Komponen: identitas klien, tempat pelayanan, keluhan, hasil
pemeriksaan
2. Lead in Question
 Kalimat Tanya
 Tidak mengandung kalimat opini (mungkin, seperti), misal:
“kemungkinan dari diagnosa pada kasus ini adalah....”
 Berhubungan dg vignete
 Hindari penggunaan kata “kecuali”
3. Option
 Homogen
 Alternatif jawaban jelas dan singkat
 Alternatif jawaban memiliki panjang yang hampir sama dengan kunci
jawaban
 Alternatif jawaban harus rasional
 Alternatif jawaban cukup menarik mahasiswa tidak kompeten untuk
memilih
 Secara tatabahasa konsisten dengan vignete & lead in question
 Hindari penggunaan “salah satu di atas” dan “bukan salah satu di
atas”?
 Hindari kata “selalu”, “jarang”, “kadang-kadang”?
 Kunci jawaban diletakkan secara acak terhadap distractornya
Contoh :
Stasi I : kehamilan
110
Vignete Seorang perempuan berumur 23 tahun, G1P0A0 pada tanggal 28
Maret 2011 datang ke Bidan mengeluh lemes, mual, muntah, serta
sering kencing. Mensruasi terakhir tanggal 29 desember 2010
Lead In Berdasarkan data diatas, maka usia kehamilan Ny. K adalah
Option A. 8 minggu
B. 10 minggu
C. 12 minggu
D. 14 minggu
E. 16 minggu
Stasi IV : persalinan
Vignete Seorang perempuan berumur 30 tahun datang ke BPM mengaku
hamil anak ketiga dengan usia kehamilan 9 bulan, mengeluh mules
sejak semalam. Hasil pemeriksaan, TTV dalam batas normal, TFU:
32 cm, his: 3x/10’/40”, DJJ: 140x/menit, PD: portio tebal lunak,
pembukaan 4 cm, ketuban utuh, presentasi kepala, penurunan HII
Lead In Berapa lama diperkirakan pembukaan lengkap?
Option A. 4 jam
B. 5 jam
C. 6 jam
D. 7 jam
E. 8 jam
Stasi IV : persalinan patologis

Vignete Seorang perempuan berumur 25 tahun G1P0A0, aterm telah
melahirkan bayi secara spontan. Setelah placenta lahir, bidan
melakukan masase uterus dan tidak teraba adanya kontraksi. Dari
hasil pemeriksaan didapatkan ibu mengalami perdarahan, placenta
lahir lengkap, kandung kemih kosong dan terjadi robekan perineum
derajat I
Lead In Menurut saudara apa diagnose ibu tersebut?
Option A. Robekan perineum

B. Robekan Servik
C. Sisa plasenta
D. Atonia uteri
E. Inversio uteri
CHECK-LIST DAN PEMBOBOTANNYA
Check list merupakan instrument yang sangat penting dalam menilai macam
perilaku dan segala macam keterampilan (anamnesa, pemeriksaan, tindakan
dan komunikasi). Setiap tindakan akan terlihat dalam 3 aspek yaitu aspek
111
perilaku, keterampilan dan aspek kelengkapan substansi (butir-butir)
tindakan. Maka dalam checklist yang dinilai meliputi 3 aspek tersebut
Pada anamnesa dan pemberian informasi maka 3 aspek besar yang dinilai
adalah
1. Butir butir penting anamnesa, termasuk didalamnya identitas penderita
serta butir-butir penting dalam pemberian informasi
2. Keterampilan dalam melakukan anamnesa / pemberian informasi
3. Sikap / perilaku terhadap pasien selama anamnesa
Pada pemeriksaan fisik juga terdapat 3 aspek penilaian :

1. Butir butir pemeriksaan fisik yang dilakukan
2. Keterampilan teknik melakukan pemeriksaan fisik
3. Sikap dan perilaku selama melakukan pemeriksaan fisik
Penetapan berapa skor tiap butir butirnya tidak ada pedoman yang pasti,
akan tetapi butir yang sangat penting dan mutlak harus dilakukan skornya
harus lebih besar dibandingkan yang lain
Untuk memudahkan penilaian secara keseluruhan maka ada tiga kategori
skor berdasarkan kelengkapan substansi tindakan yaitu nol (0) bila tidak
dilakukan; satu (1) bila dilakukan tetapi kurang benar; dua (2) bila
dilakukan dengan benar
KESIMPULAN (SUMMARY)
 Penyusunan Perencanaan soal OSCE – Objective Structured Clinical

Examination meliputi stasi pengetahuan dan keterampilan
 Proporsi bahan uji dalam metode OSCE harus mengacu pada 9 standar
Kompetensi minimal bidan
 Proses pengembangan soal mengacu pada standar kompetensi, yang dibuat
kedalam blue print dan soal
 Dalam pembuatan soal MCQ harus mengacu pada pedoman umum
kontruksi MCQ
 Struktur MCQ terdiri dari Vignette, lead in question dan option
112
 Setiap mahasiswa diharapkan dapat membuat soal MCQ
 Check list merupakan instrument yang sangat penting dalam menilai macam
perilaku dan segala macam keterampilan (anamnesa, pemeriksaan, tindakan
dan komunikasi)
LATIHAN (EVALUATION)
1. Sebutkan hal-hal yang perlu disiapkan dalam penyusunan soal UAP

OSCA/OSCE D III Kebidanan dalam Penyusunan perencanaan soal OSCE
(pengetahuan dan keterampilan) ?
2. Sebutkan proporsi bahan uji dalam metode OSCE harus mengacu pada 9
standar Kompetensi minimal bidan ?
3. Jelaskan Matrik soal OSCE dilihat dari jumlah stasi, kompetensi dalam
Blue Print yang anda ketahui ?
4. Sebutkan beberapa pedoman umum dalam pembuatan kontruksi MCQ ?
5. Jelaskan mengenai stuktur MCQ yang anda diketahui ?
6. Jelaskan mengenai aspek aspek penilaian dalam checklist?
7. Buatlah soal sebanyak 5 soal MCQ (sesuai dengan struktur MCQ) untuk
stasi pengetahuan dengan benar (dalam kelompok)
113
HAND OUT
Mata Kuliah : Evaluasi dan Remedial Pendidikan
Topik : Objective Structured Clinical Examination (OSCE)
Tujuan :
Setelah selesai perkuliahan mahasiswa mampu :
1. Menjelaskan konsep dasar OSCE/OSCA dengan benar
2. Menjelaskan langkah – langkah perancangan OSCE dengan tepat
3. Mampu mengaplikasi teknik OSCE 5 stasi melalui simulasi di kelas
Referensi :
1. Harden et al,(1975). Assesment of clinical competence using objective structured
examination
2. Ross, M (1988). Using the OSCE to measure clinical skill performance in nursing
3. Http ://www.instamedic.co.uk/osce/abdomen; How to perform an abdominal
examination in the OSCE
4. Http://www.ugm.ac.id/index.php?page=rilis&artikel=4198
5. Http://www.dtl.unimelb.edu.au/dtl.../272814.html; The evolution of OSCA-OSCE-
Clinical Examination of the Royal Australian College of Surgeons
6. Http://en.Wikipedia.org/wiki/Objective_structured_clinical_examination
7. Yanti & pertiwi, (2008). OSCA Panduan Praktis Menghadapi UAP DIII Kebidanan.
Mitra Cendikia Offset. Jakarta
PENDAHULUAN
Dengan penerapan kurikulum berbasis kompetensi (KBK), maka seorang lulusan
pendidikan kesehatan harus memiliki kompetensi yang telah ditetapkan. Seorang lulusan
pendidikan kesehatan harus mampu menunjukkan keterampilan kliniknya di dunia kerja.
Oleh karena itu,untuk memastikan seorang lulusan pendidikan kesehatan itu telah
memiliki kompetensi klinik maka diperlukan suatu penilaian untuk mengukur kompetensi
tersebut meliputi aspek kognitif,afektif dan psikomotor yang valid dan reabel.
Metode evaluasi klinik yang sudah terstandarisasi antara lain adalah OSCA atau
OSCE. OSCA dirancang untuk mengevaluasi keterampilan klinik secara objektif dengan
simulasi situasi klinik aktual.
114
MATERI
A. Konsep dasar OSCE
Explaination
OSCE (Objective Structured Clinical Examination) adalah sebuah bentuk tes

modern yang sering digunakan dalam ilmu kesehatan (seperti kebidanan, ortopedi,
kedokteran, fisioterapi, radiografi, keperawatan, farmasi, dokter gigi, naturopathi,
dll).
Tes ini didesain untuk menilai performa kemampuan klinik dan kompetensi dalam
keterampilan seperti komunikasi, pemeriksaan klinik, prosedur medis, latihan
peresepan, teknik manipulasi, pemposisian radiografi, evaluasi gambar radiografi, dan
interpretasi hasil.
OSCE adalah alat untuk menilai komponen kompetensi klinik seperti anamnesa,
pemeriksaan fisik, keterampilan procedur al, keterampilan komunikasi, interpretasi
hasil lab, manajemen dan lain-lain yang diuji menggunakan checklist yang telah
disetujui dan mahasiswa akan mengikuti beberapa station.
OSCE pertama kali dikenalkan oleh Harden dari Universitas Dundee. OSCE
pertama kali diadopsi oleh Amerika Utara dan lalu berkembang di UK secara luas
pada tahun 1990. OSCE sekarang ini digunakan untuk menilai keterampilan klinik di
fakultas kedokteran dan sertifikasi dokter di USA, Kanada, UK, Australia, New
Zealand, dan negara lain.
OSCA/OSCE bisa terdiri dari 10 – 20 stasi, masing – masing stasi dibutuhkan
waktu antara 5 – 30 menit. Semakin banyak stasi yang dilakukan maka semakin
tinggi reliabilitas dan juga konten validitas dari OSCE. Objektifitas OSCE dilakukan
dengan penerapan keterampilan klinik yang sudah distandarkan dan penggunaan
checklist penilaian
Stasi secara umum dibagi menjadi 2 kelompok :

1. Stasi prosedur (skill)
2. Stasi knowledge
Activity
115
Jelaskan konsep dasar OSCE!
Summary
OSCE adalah alat untuk menilai komponen kompetensi klinik seperti anamnesa,
OSCE terdiri dari 10-20 stasi dan stasi dibagi menjadi 2 kelompok yaitu stasi
prosedur dan stasi knowledge.
B. Perancangan OSCE
Explanation
Langkah-langkah untuk merancang OSCE:
1. Penentuan komponen kompetensi klinik yang akan diujikan
Penentuan jenis keterampilan yang akan diujikan tergantung dari learning
outcome course. Komponen kompetensi klinik yang sering diujikan secara garis
besar meliputi history taking, pemeriksaan fisik, keterampilan procedural,
konseling, manajemen, interpretasi hasil laboratorium, dan radiograf. Blue print
sangat membantu dalam memilih dan merencanakan jenis keterampilan yang akan
diujikan. Pembuatan blue print ini dapat dilakukan oleh tim atau individu yang
berhubungan dengan learning objective course ini.
2. Penentuan waktu station
Penentuan waktu tiap station dipengaruhi oleh kompleksitas keterampilan
yang akan diujikan. Waktu yang sering dipilih berkisar antara 4-15 menit dan rata-
rata yang sering diterapkan adalah 5 menit.
3. Penentuan jumlah station yang terlibat
Penentuan jumlah station yang terlibat tidak ada ketentuan yang pasti.
Semakin banyak jumlah station maka semakin tinggi reliabilitas OSCE (Petrusa
2002).
Schumway dan Harden (2003) menyatakan bahwa untuk memenuhi
minimal reliabilitas diperlukan minimal 20 station. Akan tetapi penerapan OSCE
116
di Kanada untuk high stake tidak menunjukkan penurunan reliabilitas ketika
menggunakan hanya 12 station (D Blacmore, Personal Communication, 2004).
Berdasarkan hal di atas maka perlu dipertimbangkan feasibilitas maka penerapan
OSCE dengan 25 station tidak feasible sehingga penerapan OSCE dengan 10-12
station dapat diterima.
4. Penentuan standar setting
Penentuan standar setting untuk memutuskan nilai cut off seorang
mahasiswa lulus atau tidak lulus dapat menggunakan criterion reference.
5. Penentuan standar pasien (Resource Requirements)
Penggunaan standar pasien dalam OSCE dapat meningkatkan reliabilitas.
Standar pasien ini merupakan orang sehat yang dilatih untuk memerankan
keadaan pasien sesuai dengan scenario yang akan diujikan. Perekrutan standar
pasien ini dapat dilakukan dari karyawan institusi itu sendiri atau dari luar
institusi.
6. Logistik
7. Penentuan tim penguji
Tim penguji dipilih berdasarkan keahliannya untuk masing-masing station.
Penyediaan tim penguji cadangan perlu dilakukan untuk menghindari tim utama
berhalangan.
8. Biaya
Diperlukan biaya dalam OSCE untuk honor standar pasien, tim penguji,
dan staf pendukung lainnya.
9. Post exam review
Activity
Jelaskan langkah – langkah merancang OSCE!
Summary
Langkah-langkah untuk merancang OSCE:
1. Penentuan komponen kompetensi klinik yang akan diujikan
2. Penentuan waktu station
3. Penentuan jumlah station yang terlibat
4. Penentuan standar setting
5. Penentuan standar pasien (Resource Requirements)
117
6. Logistik
7. Penentuan tim penguji
8. Biaya
9. Post exam review
C. Teknik Uji OSCA

Explaination
1. Stasi
Stasi adalah tempat teruji untuk mengerjakan materi uji baik pengetahuan atau
keterampilan
2. Tim Penguji
Tim penguji terdiri dari leader,penguji skill dan penguji umum.
3. Pasien Simulasi, orang yang berperan sebagai pasien
4. Fasilitator, bertugas untuk membantu menyiapkan alat dan bahan yang diperlukan
5. Timer, orang yang bertugas untuk mengatur waktu pergantian stasi
6. Pengolah nilai
7. Petugas kebersihan
8. Waktu Ujian
Pelaksanaan Ujian OSCE

OSCE biasanya menggunakan sistem perputaran stasi yang singkat (sekitar 5-10
menit, walaupun ada yang sampai 15 menit).
Masing – masing mahasiswa diuji satu demi satu pos stasi oleh satu atau dua
penguji juga pasien simulasi.
Masing – masing stasi diisi oleh penguji yang berbeda, penguji mengobservasi
mahasiswa yang melakukan ujian di stasi nya masing-masing.
Mahasiswa mengelilingi semua stasi. Hal ini lebih baik daripada ujian tradisional
dimana semua mahasiswa diuji dengan standar yang sama.
Contoh denah lokasi penempatan stasi.
118
Gambar 1. Contoh denah lokasi 15 stasi dengan 4x istirahat
Activity
Lakukan simulasi OSCE 5 stasi!
Summary
Teknik OSCA membutuhkan 8 macam petugas yang mempunyai tugas khusus
demi lancarnya proses ujian.
OSCE biasanya menggunakan sistem perputaran stasi yang singkat (sekitar 5-10
menit, walaupun ada yang sampai 15 menit).
RINGKASAN
1. OSCE adalah alat untuk menilai komponen kompetensi klinik seperti anamnesa,
2. Langkah-langkah untuk merancang OSCE:
a. Penentuan komponen kompetensi klinik yang akan diujikan
b. Penentuan waktu station
c. Penentuan jumlah station yang terlibat
d. Penentuan standar setting
e. Penentuan standar pasien (Resource Requirements)
119
f. Logistik
g. Penentuan tim penguji
h. Biaya
i. Post exam review
3. Dalam ujian OSCA terdapat 8 macam petugas yang mempunyai tugas masing –
masing. Mahasiswa mengelilingi semua stasi dengan waktu sekitar 5-15 menit/stasi,
dan diuji oleh 1-2 orang penguji / stasi
LATIHAN :
1. Jelaskan Konsep dasar OSCE !
2. Jelaskan langkah – langkah perancangan OSCE!
3. Simulasikan OSCE di dalam kelas !
DAFTAR PUSTAKA
1. Harden et al,(1975). Assesment of clinical competence using objective structured
examination
2. Ross, M (1988). Using the OSCE to measure clinical skill performance in nursing
3. Http ://www.instamedic.co.uk/osce/abdomen; How to perform an abdominal
examination in the OSCE
4. Http://www.ugm.ac.id/index.php?page=rilis&artikel=4198
5. Http://www.dtl.unimelb.edu.au/dtl.../272814.html; The evolution of OSCA-OSCE-
Clinical Examination of the Royal Australian College of Surgeons
6. Http://en.Wikipedia.org/wiki/Objective_structured_clinical_examination
120

PENILAIAN BERBASIS KOMPETENSI

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

PENILAIAN BERBASIS KOMPETENSI

Diunggah oleh

Hak Cipta:

Format Tersedia

EVALUASI PENDIDIKAN

PROGRAM DIPLOMA IV KEBIDANAN

PROGRAM STUDI : Bidan Pendidik (D-IV)

OBJEKTIF PERILAKU : 1. Setelah mendapatkan materi, mahasiswa mampu

REFERENSI 1. Sanjaya, 2006, Strategi Pembelajaran Berorientasi

Penilaian Berbasis kompetensi (Performance Based Assessment) adalah pegujian yang

D. Instrumen Penilaian Berbasis Kompetensi

3. Dibawah ini merupakan prinsip-prinsip dalam penilaian berbasis kompetensi

TUJUAN : 1. Setelah mendapatkan materi, mahasiswa mampu

REFERENSI 1. Tayibnafis, R.Farida Yusuf.2010.

Untuk mengukur kesesuaian, efisiensi, dan kemantapan (consistency) suatu alat

2. Faktor-faktor yang mempengaruhi kesahihan hasil evaluasi meliputi :

Keandalan (Reliability) adalah ketetapan atau ketelitian suatu alat evaluasi.

1. Faktor-faktor yang mempengaruhi keandalan suatu tes

Kesahihan menggantikan kata validitas (validity) yang dapat diartikan sebagai

Mata Kuliah : Evaluasi Remedial

Bahan & Sumber : LCD, OHP/OHT, Hand Out, White Board

Di negara-negara yang sudah maju, pendidikan dipandang sebagai sarana utama

URAIAN MATERI (EXPLANATION)

C. Langkah-langkah dan Prosedur dalam Evaluasi

E. Pendekatan/Metode dalam Evaluasi (Stecher, Brian M & W. Alan Davis, 1987)

1. Jelaskan pengertian evaluasi?

Program Studi : D IV Kebidanan Pendidik

A. MELAKSANAKAN EVALUASI PROGRAM

A. Informasi yang harus dikumpulkan

Memilih sumber informasi atau metode yang tepat biasanya berdasarkan

1. Beberapa prosedur pengumpulan data kuantatif dan instrumen

Observasi perilaku, Perilaku khusus, fisik dan Merekam frekuensi guru

2. Beberapa prosedur pengumpulan data kualitatif

Prosedur Yang diukur atau contoh

B. Berapa Banyak Informasi yang Harus Dikumpulkan

Metode acak dipakai untuk membuat sampel dengan tingkat keacakan

C. Memilih dan Mengembangkan Instrumen

Beberapa instrumen yang biasa dipakai dalam prosedur pengumpulan informasi,

D. Petunjuk Umum Dalam Pembuatan Instrumen (Brinker hoff 1986)

1. Konten yang diperlukan

2. Bahasa yang akan dipakai

3. Analisis yang dipakai

5. Ketepatan yang diperlukan

7. Kesesuaian dengan rencana analisis

Sebelum membuat instrumen, sediakan waktu untuk mengecek apakah telah

Setelah instrumen ditemukan, periksalah instrumen tersebut demi keperluan,

Buatlah konsep (draft) instrumen, periksalah konsep tersebut, cek kejelasan

Uji coba instrumen untuk memeriksa validitas dan realibilitasnya, apakah

1. Periksalah instrumen yang telah dibuat

2. Validitas dan reabilitas instrumen

Reabilitas menunjukan ketepatan pengukuran. Tambah banyak kesalahan

3. Macam – macam validitas dan reliabilitas

1. Stability reoeatibility, suatu tes atau alat ukur yang menghasilkan

3. Equivalency, hal ini berhubungan dengan tingkat konsistensi antara

4. Internal consistency, hal ini berhubungan dengan betapa

Objektif Perilaku Siswa (OPS);

1. Purwanto, Ngalim. 2008. Prinsip-prinsip dan Teknik Evaluasi Pengajaran.

‘Evaluation is a process which determines the extent to which objectives have

B. Prinsip – Prinsip dalam Penilaian

C. Jenis – jenis Penilaian dalam Pendidikan.

2) Ciri Penilaian Acuan Normatif :

3) Pedoman Konversi PAN

b. Penilaian Acuan Patokan.

Agar nilai yang diperoleh siswa dapat berfungsi seperti yang

D. Persamaan PAN dan PAP

E. Perbedaan dan Penilaian PAN dan PAP

F. Mengolah Skor Mentah Menjadi Nilai Huruf