Bondan Palestin
ERROR & CONFIDENCE
• Mengurangi kesalahan (error)
– All assessment scores have error
– Want to minimize so scores are accurate
– Protocols & periodic staff training/retraining
• Increasing confidence
– Results lead to correct placement
– Assessments that produce valid, reliable, and usable
results
HASIL PENGUKURAN
• Norm-referenced
– Individual’s score compared to others in their
peer/norm group
• School tests, 95%
– Norm group needs to be representative of test
takers the test was designed for
Kualitas Pengukuran
• Validitas (kesahihan):
Berkaitan dengan alat yang dipakai untuk melakukan
pengukuran
Menggambarkan seberapa jauh pengukuran yang
dilakukan mengukur nilai yang sebenarnya ingin
diukur
Kesesuaian antara definisi operasional dengan
konsep yang mau diukur
• Reliabilitas (keterandalan; stabilitas;
konsistensi):
Berkaitan dengan akurasi hasil pengukuran atau
pengamatan
Jika pengukuran diulangi lagi apakah akan
menghasilkan hasil yang sama
Reliable, but Not Valid!
Not Reliable, Not Valid!
Reliable and Valid
• Alat ukur yang TIDAK RELIABEL pasti
TIDAK VALID.
• Alat ukur yang RELIABEL BELUM
TENTU VALID
Contoh
Validitas Logis
(Logical Validity)
Validitas kriteria atau
VALIDITAS validitas konvergen
(criterion-related validity)
Validitas konstrak
(Construct Validity)
VALIDITAS ISI
Validitas Isi (Content Validity)
• Untuk mengetahui sejauhmana item-item dalam tes
mencakup keseluruhan kawasan isi obyek yang hendak
diukur atau sejauhmana isi tes mencerminkan ciri atribut
yang hendak diukur
• Menggambarkan seberapa jauh kumpulan variabel
(item) yang menghasilkan indeks komposit
menggambarkan satu konsep tertentu
Contoh: kumpulan pertanyaan untuk mengukur
PERILAKU
• SUBJECTIVE VALIDATION. Dua pengukuran validitas
berdasarkan evaluasi subjektif terhadap definisi
operasional : (1) validitas muka (face validity) dan (2)
validitas logis (logical validity)
Validitas Isi (Content Validity)
• Face validity: seberapa jauh satu variabel
menggambarkan konsep yang ingin diukur
• Penilaian content atau face validity lebih judmental
oleh expert bukan statistik
• Review literatur atau opini ahli
• Blueprint komponen utama variabel
• Per Austin (1991), minimum requirement for any
assessment
• Teknik pengukuran validitas isi, yaitu:
1) konsultasi kepada ahli untuk menilai format penampilan alat
ukur
2) menyusun kisi-kisi alat ukur
CONTOH Validitas isi
Tahap
Tahap 11 Tahap
Tahap 22 Tahap
Tahap 33 Tahap
Tahap 44
1. Penyebab 2 pertanyaan
2. Cara penularan 5 pertanyaan
3. Cara pencegahan 6 pertanyaan
4. Cara perawatan mandiri 10 pertanyaan
5. Prosedur pengobatan 5 pertanyaan
I. Identitas Responden
Nama Responden :
Kabupaten : Sleman
Kecamatan : Prambanan
Kelurahan :
Rukun warga (RW) :
Rukun tetangga :
Umur :
Pendidikan :
Jenis kelamin :
Pekerjaan :
II. PENGETAHUAN
Keterangan
1. Pilihlah jawaban yang benar dengan cara melingkari huruf a,b,c
atau d
2. Setiap pertanyaan hanya ada satu jawaban benar
• Penyekoran terdiri dari tiga alternatif, yaitu (1) tidak relevan, (2)
kurang relevan atau (3) relevan dengan domain yang diukur
• Skor CVR pada tiap aitem dapat berkisar antara 1 hingga -1.
• Skor yang tinggi menunjukkan validitas konten yang lebih tinggi
untuk item tersebut
• Sebuah aitem yang memiliki CVR=0 menunjukkan bahwa separuh
panel memberikan penilaian item tersebut sebagai aitem yang
relevan dengan domain yang diukur.
• Setiap nilai positif menunjukkan bahwa lebih dari setengah dari
panel diberi nilai item tersebut termasuk pada kategori aitem yang
cukup baik untuk dilibatkan dalam instrumen pengukuran
• Aitem yang memiliki CVR sangat rendah akan tidak dilibatkan
dalam administrasi pengujian instrumen (pilot test/try out).
• Aitem yang memiliki nilai CVR rendah menunjukkan bahwa item
yang bersangkutan tidak mewakili domain ukur.
CONTENT VALIDITY RATIO (CVR)
HASIL CONTENT VALIDITY RATIO (CVR)
PANELIS
Aitem CVR
1 2 3 4 5 6 7 8 9 10
A.1 3 3 3 3 3 3 3 3 3 3 0,625
A.2 3 3 3 3 3 3 3 3 3 3 0,625
A.3 3 3 3 3 3 3 3 3 3 3 0,625
A.4 3 3 3 3 3 3 3 3 3 3 0,625
A.5 3 3 3 3 3 3 3 3 3 3 0,625
A.6 3 3 3 3 3 3 3 3 3 3 0,625
A.7 3 3 3 3 3 3 3 3 3 3 0,625
A.8 3 3 3 3 3 3 3 3 3 3 0,625
A.9 3 3 3 3 3 3 3 3 3 3 0,625
A.10 2 1 1 3 1 2 2 3 3 3 -0,125
A.11 2 3 3 3 1 3 2 2 3 3 0,125
A.12 3 2 3 1 3 3 3 2 3 3 0,250
A.13 3 3 3 3 3 2 3 1 3 2 0,250
A.14 3 3 3 3 3 3 2 3 3 2 0,375
A.15 2 3 3 3 2 3 1 3 3 2 0,125
A.16 1 3 2 3 1 1 1 1 3 2 -0,250
A.17 2 1 3 1 3 2 1 1 2 3 -0,250
A.18 2 3 3 2 3 3 3 3 3 3 0,375
CONTENT VALIDITY RATIO (CVR)
• Formula
untuk menentukan CVR adalah
sebagai berikut:
Test Result
Threshold
Call these patients “negative” Call these patients “positive”
Test Result
Some definitions ...
Call these patients “negative” Call these patients “positive”
True Positives
Test Result
True
negatives
Test Result
False
negatives
Test Result
‘‘-’’ ‘‘+’’
Test Result
‘‘-’’ ‘‘+’’
Test Result
0%
0% 100%
False Positive Rate
(1-specificity)
ROC curve comparison
100% 100%
True Positive Rate
100% 100%
0
0 %
% 0 100
0 100 False Positive %
False Positive % %
% Rate
Rate
+ A B A+B
- C D C+D
Jumlah A+C B+D N
A. Jumlah subyek sakit yang diklasifikasikan sakit (POSITIF
SEJATI)
B. Jumlah subyek tak sakit yang diklasifikasikan sakit
(POSITIF PALSU)
C. Jumlah subyek sakit yang diklasifikasikan tak sakit
(NEGATIF PALSU)
D. Jumlah subyek tak sakit yang diklasifikasikan tak sakit
(NEGATIF SEJATI)
Validitas Kriteria (Criterion Validity)
• Sensitivitas:
– Probabilitas hasil test menujukkan hasil positif jika pada gold
standar hasilnya positif
– Akurasi tes untuk mengklasifikasikan sakit terhadap subyek sakit.
– Makin tinggi sensitivitas tes akan semakin sedikit jumlah subyek
yang sakit tetapi keliru diklasifikasikan tes negatif (negatif palsu).
• Spesifisitas:
– Probabilitas hasil test menunjukkan hasil negatif jika pada gold
standar hasilnya negatif
– Akurasi tes untuk mengklasifikasikan tak sakit terhadap subyek tak
sakit.
– Makin tinggi spesifisitas tes akan semakin sedikit jumlah subyek
yang tak sakit tetapi keliru diklasifikasikan tes positif (positif palsu)
Validitas Kriteria (Criterion Validity)
• Nilai prediksi positif:
Probabilitas diperolehnya hasil gold standard positif jika
hasil test positif
• Nilai prediksi negatif:
Probabilitas diperolehnya hasil gold standar negatif jika
hasil test negatif.
Validitas Kriteria (Criterion Validity)
Gold standard Jumlah
Test + -
+ A B A+B
- C D C+D
Jumlah A+C B+D N
• Sensitifitas: A/(A+C)
• Spesifisitas: D/(B+D)
• Nilai prediksi positif: A/(A+B)
• Nilai prediksi negatif: C/(C+D)
Validitas Kriteria (Criterion Validity)
• Contoh :
80
60
Sensitivity
40
20
0
0 20 40 60 80 100
100-Specificity
CONTOH Validitas Kriteria
80
60
Sensitivity
40
20
0
0 20 40 60 80 100
100-Specificity
CONTOH Validitas Kriteria
Kriteria
Kriteria ::≤3
≤3
Sensitivitas
Sensitivitas :88,9%
: 88,9%
Spesifisitas
Spesifisitas ::47,8%47,8%
Nilai
Nilaiprediktif
prediktif++::40,0%
40,0%
Nilai
Nilaiprediktif
prediktif-- ::91,7%
91,7%
AUC = 0,667
Kriteria
Kriteria ::≤3
≤3
Sensitivitas
Sensitivitas :88,9%
: 88,9%
Spesifisitas
Spesifisitas ::47,8%47,8%
Nilai
Nilaiprediktif
prediktif++::40,0%
40,0%
Nilai
Nilaiprediktif
prediktif-- ::91,7%
91,7%
AUC = 0,667
Kriteria
Kriteria :: ≤≤ 33
Sensitivitas
Sensitivitas :: 42,9% 42,9%
Spesifisitas
Spesifisitas :: 100,0%100,0%
Nilai
Nilaiprediktif
prediktif++ :: 100,0%
100,0%
Nilai AUC = 0,705
Nilaiprediktif
prediktif-- :: 20,0%
20,0%
Kriteria
Kriteria :: ≤≤ 33
Sensitivitas
Sensitivitas :: 42,9% 42,9%
Spesifisitas
Spesifisitas :: 100,0%100,0%
Nilai
Nilaiprediktif
prediktif++ :: 100,0%
100,0%
Nilai AUC = 0,705
Nilaiprediktif
prediktif-- :: 20,0%
20,0%
Kriteria
Kriteria :: ≤3
≤3
Sensitivitas
Sensitivitas :: 88,9%88,9%
Spesifisitas
Spesifisitas :: 47,8%47,8%
Nilai
Nilaiprediktif
prediktif++:: 40,0%
40,0%
Nilai
Nilaiprediktif
prediktif-- :: 91,7%
91,7%
Kriteria
Kriteria ::≤≤33
Sensitivitas
Sensitivitas ::42,9% 42,9%
Spesifisitas
Spesifisitas ::100,0%100,0%
AUC = 0,667 Nilai
Nilaiprediktif
prediktif++::100,0%
100,0%
Nilai
Nilaiprediktif
prediktif-- :: 20,0%
20,0% AUC = 0,705
• Marginal homogeneity:
mengukur seberapa jauh 2 atau lebih pengamat
menghasilkan hasil yang sama secara umum
(distribusi tepi/marginal distribution) pada saat
mengelompokkan individu yang sama. Diukur
dengan Mc Nemar test
• Kesesuaian/Agreement:
mengukur seberapa jauh 2 atau lebih pengamat
setuju pada pengelompokkan seluruh individu pada
kelompok yang diamati. Diukur dengan koefisien
Kappa-Cohen.
Koefisien Kappa
• Penilaian:
• K=1 : Perfect agreement
• K=0.80 - 0.99 : Excellent agreement
• K=0.60 – 0.79 : Good agreement
• K=0.40 – 0.59 : Fair agreement
• K < 0.40 : Poor agreement
Internal Consistency
• Digunakan untuk mengukur apakah sejumlah
pertanyaan/pengukuran mengukur hal yang
sama
• Contoh: pengetahuan tentang pencegahan
HIV/AIDS diukur dengan 10 pertanyaan ya/tidak.
Pengetahuan diukur dengan menjumlahkan
pertanyaan yang dijawab secara benar. Internal
consistency menilai apakah 10 pertanyaan tsb
mengukur hal yang sama.
Internal Consistency
• Internal consistency diukur dengan
menggunakan :
– Skala data item ordinal koefisien Alpha-
Cronbach
– Skala data item dikotomi koefisien Kuder-
Richardson 20 (KR20)
• Penilaian Alpha-Cronbach sama dengan
penilaian pada koefisien Kappa
• Split-half models. Korelasi antara 2 kelompok:
– Guttman split-half reliability, Spearman-Brown
reliability (equal and unequal length), and coefficient
alpha for each half
Internal Consistency
Cara-cara meningkatkan reliabilitas