Penilaian berbasis
Evaluation/Quality tempat kerja
Assurance
Objectives/ Hubungkan
Outcomes
pengajaran,
pembelajaran, dan
penilaian
Dapat menilai
dimensi ‘apakah’
Assessment Methods dari piramida
Miller
PROSES BERKELANJUTAN
Sikap Pengetahuan
Tingkah laku
Pengetahu kognitif
Kerja tim / Penarikan
an
interprofessional Pemahaman
Profesionalisme Aplikasi
Kunci kualitas
Analisis
pribadi
motivasi Perpaduan
Evaluasi
Keterampil
Sikap an
Keterampilan
Komunikasi
Pemeriksaan fisik
Prosedur
Informatika
Belajar mandiri
Manajemen waktu
Penyelesaian masalah
PENILAIAN PENDORONG
PEMBELAJARAN
TUJUAN
Berada dalam
Evidensial
"e-portfolio"
Pemantauan
kemajuan yang
Triangulasi
dinilai secara
lokal
PIRAMIDA MILLER
Expert
Demonstrasi pembelajaran
Misalnya melalui simulasi OSCE SHOWS
Interpretasi / Aplikasi
Misalnya melalui presentasi kasus, esai KNOWS
Diperpanjang MCQ jenis pencocokan
HOW Novice
Fakta Berkumpul
Misalnya soal pilihan tradisional yang
benar / salah KNOWS
Based on work by Miller GE. The assessment of clinical skills/competence/performance: Acad.Med. 1990:65(9); 63-67
Adapted by Drs. R. Mehay & R. Burns. UK (jan 2009)
Metode Penilaian
• Adil
• Berdasarkan Kriteria
• Metode Penilaian
• Diberikan Bobot Pada Masing-Masing Komponen
mengumpulkan informasi dari semua sumber yang relevan
dan untuk menentukan apakah tujuan kursus telah
terpenuhi secara memadai
BAGAIMANA CARANYA ?
Hal yang perlu dipertimbangkan
U = aV x bR x cL x dA x eC
V= validity
R= reliability
L=impact on learning
A=acceptance
C=cost
Lynch et al., 2004 – 88 different types of assessment
PENILAIAN
KEANDALAN VALIDITY
Apakah tes secara Apakah kita mengukur apa
konsisten mengukur apa yang seharusnya kita ukur
yang seharusnya diukur? Gunakan instrumen yang
Jenis-jenis keandalan: sesuai untuk pengetahuan,
Inter-rater (konsistensi over- keterampilan, atau sikap
penilai) yang Anda uji
Uji-tes ulang (konsistensi dari
Jenis utama validitas
waktu ke waktu)
Menghadapi
Konsistensi internal (atas
berbagai item / bentuk) Konten
membangun
Faktor-Faktor Yang Mempengaruhi
Reliability
Group Objectivity of
Test length
homogenity scoring
Semakin
Tes yang Semakin
banyak
lebih lama heterogen
tujuan
memberikan kelompok,
penilaian,
skor yang semakin
semakin
lebih tinggi
tinggi
reliability reliability
reliability
Reliability of an oral examination
(Swanson, 1987)
1. Swanson, 1987
2. Norcini et al, 1985 4. Wass et al., 2001
7. Ram et al., 1999
3. Stalenhoef-Halling et Petrusa, 2002
8. Gorter, 2002
al., 1990 Norcini et al 1999
Table 1. Perbandingan Alat Penilaian Yang Umum Digunakan
Oral +/- + +/- Assess higher order reasoning Time intensive for faculty
Trainee can clarify answers Examiner cueing
Standardization issues
OSCE + + - Fidelity Deconstruct patient-physician dynamic
Scheduled Potential scenarios limited
Assess behaviour in critical events Expensive to run
ITER - + + Assess ‘soft domains Student’s characteristic influence
Flexible assessment
Longitudinal assessment Poor discrimination between domains
Reliability issues
MSF +/- + - Assess soft domains Time intensive
Interprofessional May affect patient- physician dynamic
Inter raters Observer training
Portfolios - +/- - Self reflection Time intensive
Promotes remediation Intentional misrepresentation
Longitudinal assessment Time consuming
Logs NA +/- + Increases exposure to technical skills Assumes repetition equals competence
tracking Time consuming
SEBERAPA SERING ?
Mini-CEX (Clinical Examination
Exercise)
Penilaian Validity
Sekitar 4 pertemuan cukup Wilkinson et al (2008)
untuk mencapai 95% CI <1 91% peserta pelatihan
dan 12-14 diperlukan untuk merasa bahwa DOPS
mencapai koefisien reabilitas adalah metode yang adil
0,8 (Norcini et al 1995, 2003, untuk menilai
Homboe et al 2003).
keterampilan prosedural
Davies et al (2009) interval
kepercayaan 95% untuk Davies et al (2009) Skor
sejumlah DOPS yang untuk DOPS meningkat
diberikan adalah sebagai antara paruh pertama dan
berikut: 4 prosedur 0,59; 6 kedua tahun ini,
(0,48); 8 (0,42); 12 (0,34) menunjukkan validitas
CbD (Case based Discussion)
Penilaian Validity
Davies et al (2009) Davies et al (2009) Skor
interval pada skala enam untuk CbD meningkat
poin untuk sejumlah CbD antara paruh pertama dan
yang diberikan adalah kedua tahun ini,
sebagai berikut: 4 kasus menunjukkan validitas
0,55; 6 kasus (0,45); 8 kasus
(o.39); 12 kasus (0,32)
PERSYARATAN MINIMUM