Anda di halaman 1dari 15

Kualitas Pengukuran

Iwan Ariawan
Biostatistika-FKMUI
Kualitas Pengukuran
Reliabilitas:
menggambarkan seberapa jauh pengukuran yang
diperoleh dengan menggunakan instrumen
(termasuk kuesioner) jika diulangi akan
menghasilkan hasil yang sama
Validitas:
menggambarkan seberapa jauh pengukuran yang
dilakukan mengukur nilai yang sebenarnya ingin
diukur.
Contoh
Si A memiliki berat badan 68 kg pada saat
ditimbang dengan menggunakan timbangan standar
penelitian. Di sebuah mall si A melakukan
penimbangan dan hasilnya beratnya adalah 75 kg.
Karena kurang percaya dengan hasilnya, si A
melakukan penimbangan lagi di timbangan yang sama
di mall tersebut dan beratnya tetap 75 kg.
Contoh di atas menggambarkan timbangan di mall
memiliki reliabilitas yang baik (hasilnya selalu
konsisten), tetapi validitas buruk (tidak mengukur hal
yang sebenarnya)
Reliabilitas
Temporal/intra observer reliability
Agreement/inter observer reliability
Internal Consistency
Temporal/intra observer reliability
Pengukuran pada subyek yang sama oleh orang
yang sama pada waktu yang berbeda
menghasilkan hasil yang sama
Dapat diukur dengan test-retest correlation
coefficient
Masalah:
Jika pertanyaan yang sama diulang pada jangka waktu pendek,
ingatan dari respons yang pertama dapat mempengaruhi respons
yang kedua sehingga nilai r cenderung tinggi
Perubahan pada subyek yang diukur dapat terjadi bukan akibat
kesalahan pengukuran (unreliability) tetapi juga akibat
perubahan pada faktor mendasar yang diukur (instability).
Agreement/inter observer reliability
Marginal homogeneity:
mengukur seberapa jauh 2 atau lebih pengamat
menghasilkan hasil yang sama secara umum
(distribusi tepi/marginal distribution) pada saat
mengelompokkan individu yang sama. Diukur
dengan Mc Nemar test
Kesesuaian/Agreement:
mengukur seberapa jauh 2 atau lebih pengamat
setuju pada pengelompokkan seluruh individu
pada kelompok yang diamati. Diukur dengan
koefisien Kappa.
Koefisien Kappa
Penilaian:
K=1 : Perfect agreement
K=0.80 - 0.99: Excellent agreement
K=0.60 0.79: Good agreement
K=0.40 0.59: Fair agreement
K < 0.40 : Poor agreement
Internal Consistency
Digunakan untuk mengukur apakah sejumlah
pertanyaan/pengukuran mengukur hal yang sama
Contoh: pengetahuan tentang pencegahan
HIV/AIDS diukur dengan 10 pertanyaan
ya/tidak. Pengetahuan diukur dengan
menjumlahkan pertanyaan yang dijawab secara
benar. Internal consistency menilai apakah 10
pertanyaan tsb mengukur hal yang sama.
Internal Consistency
Internal consistency diukur dengan
menggunakan koefisien Cronbach Alpha
Penilaian Cronbach Alpha sama dengan
penilaian pada koefisien Kappa
Validitas
Content Validity
Criterion Validity
Construct Validity
Content Validity
Menggambarkan seberapa jauh kumpulan
variabel (item) yang menghasilkan indek
komposit menggambarkan satu konsep tertentu
Contoh: kumpulan pertanyaan untuk mengukur
depresi
Face validity: seberapa jauh satu variabel
menggambarkan konsep yang ingin diukur
Penilaian content atau face validity lebih
judmental oleh expert bukan statistik
Criterion Validity
Menggambarkan seberapa jauh hasil satu
pengukuran sesuai dengan hasil pengukuran lain
dengan menggunakan instrumen yang dianggap
standar
Criterion validity dinilai dengan membandingkan
hasil satu pengukuran dengan pengukuran
menurut gold standard
Criterion Validity
Sensitifitas:
Probabilitas hasil test menujukkan hasil positif jika pada
gold standar hasilnya positif
Spesifisitas:
Probabilitas hasil test menunjukkan hasil negatif jika
pada gold standar hasilnya negatif
Nilai prediksi positif:
Probabilitas diperolehnya hasil gold standard positif jika
hasil test positif
Nilai prediksi negatif:
Probabilitas diperolehnya hasil gold standar negatif jika
hasil test negatif.
Criterion Validity
Gold standard Jumlah
Test + -

+ A B A+B
- C D C+D
Jumlah A+C B+D N
Sensitifitas: A/(A+C)
Spesifisitas: D/(B+D)
Nilai presiksi positif: A/(A+B)
Nilai prediksi negatif: C/(C+D)
Construct Validity
Menggambarkan seberapa jauh hasil satu
pengukuran sesuai dengan hasil
pengukuran lain yang secara teoritis
menggambarkan konsep yang diukur
Contoh: apakah skor depresi yang
dikembangkan dapat membedakan orang
depresi dengan orang tidak depresi
(menurut PPDGJ/ICD 10)

Anda mungkin juga menyukai