Anda di halaman 1dari 77

Kualitas Pengukuran

Bondan Palestin
ERROR & CONFIDENCE
• Mengurangi kesalahan (error)
– All assessment scores have error
– Want to minimize so scores are accurate
– Protocols & periodic staff training/retraining
• Increasing confidence
– Results lead to correct placement
– Assessments that produce valid, reliable, and usable
results
HASIL PENGUKURAN
• Norm-referenced
– Individual’s score compared to others in their
peer/norm group
• School tests, 95%
– Norm group needs to be representative of test
takers the test was designed for
Kualitas Pengukuran
• Validitas (kesahihan):
 Berkaitan dengan alat yang dipakai untuk melakukan
pengukuran
 Menggambarkan seberapa jauh pengukuran yang
dilakukan mengukur nilai yang sebenarnya ingin
diukur
 Kesesuaian antara definisi operasional dengan
konsep yang mau diukur
• Reliabilitas (keterandalan; stabilitas;
konsistensi):
 Berkaitan dengan akurasi hasil pengukuran atau
pengamatan
 Jika pengukuran diulangi lagi apakah akan
menghasilkan hasil yang sama
Reliable, but Not Valid!
Not Reliable, Not Valid!
Reliable and Valid
• Alat ukur yang TIDAK RELIABEL  pasti
TIDAK VALID.
• Alat ukur yang RELIABEL  BELUM
TENTU VALID
Contoh

• Si “A” memiliki berat badan 68 kg pada saat ditimbang


dengan menggunakan timbangan standar penelitian. Di
sebuah mall si “A” melakukan penimbangan dan hasilnya
beratnya adalah 75 kg. Karena kurang percaya dengan
hasilnya, si A melakukan penimbangan lagi di timbangan
yang sama di mall tersebut dan beratnya tetap 75 kg.

• Contoh di atas menggambarkan timbangan di mall


memiliki reliabilitas yang baik (hasilnya selalu konsisten),
tetapi validitas buruk (tidak mengukur hal yang
sebenarnya)
VALIDITAS
Validitas
• Describes how well the assessment
results match their intended purpose
• Are you measuring what you think you are
measuring?
• Relationship between program &
assessment content
• Does not have validity for all purposes,
populations or time
Validitas
• Depends on different types of evidence
• Is a matter of degree (no tool is perfect)
• Is a unitary concept
– Change from past
– Former types are now considered as
evidence
• Content validity/content-related evidence
Validitas
Validitas Muka
(Face Validity)
Validitas isi
(Content Validity)

Validitas Logis
(Logical Validity)
Validitas kriteria atau
VALIDITAS validitas konvergen
(criterion-related validity)

Validitas konstrak
(Construct Validity)
VALIDITAS ISI
Validitas Isi (Content Validity)
• Untuk mengetahui sejauhmana item-item dalam tes
mencakup keseluruhan kawasan isi obyek yang hendak
diukur atau sejauhmana isi tes mencerminkan ciri atribut
yang hendak diukur
• Menggambarkan seberapa jauh kumpulan variabel
(item) yang menghasilkan indeks komposit
menggambarkan satu konsep tertentu
Contoh: kumpulan pertanyaan untuk mengukur
PERILAKU
• SUBJECTIVE VALIDATION. Dua pengukuran validitas
berdasarkan evaluasi subjektif terhadap definisi
operasional : (1) validitas muka (face validity) dan (2)
validitas logis (logical validity)
Validitas Isi (Content Validity)
• Face validity: seberapa jauh satu variabel
menggambarkan konsep yang ingin diukur
• Penilaian content atau face validity lebih judmental
oleh expert bukan statistik
• Review literatur atau opini ahli
• Blueprint komponen utama variabel
• Per Austin (1991), minimum requirement for any
assessment
• Teknik pengukuran validitas isi, yaitu:
1) konsultasi kepada ahli untuk menilai format penampilan alat
ukur
2) menyusun kisi-kisi alat ukur
CONTOH Validitas isi

Tahap
Tahap 11 Tahap
Tahap 22 Tahap
Tahap 33 Tahap
Tahap 44

kenali rincikan rincikan kembangkan


VARIABEL SUB ITEM Kalimat
penelitian VARIABEL PERTANYAAN PERTANYAAN
penelitian

1. Penyebab 2 pertanyaan
2. Cara penularan 5 pertanyaan
3. Cara pencegahan 6 pertanyaan
4. Cara perawatan mandiri 10 pertanyaan
5. Prosedur pengobatan 5 pertanyaan

PENGETAHUAN ttg 1. Sikap terhadap prosedur 10 pertanyaan


penyakit dan program pengobatan
pengobatan 2. Sikap terhadap petugas kesehatan 10 pertanyaan

PERILAKU SIKAP thd program


3. Sikap terhadap fasilitas yankes
10 pertanyaan
pengobatan & petugas
KEPATUHAN 1. Frekuensi kontrol kes 4 pertanyaan

BEROBAT TINDAKAN sesuai


2. Kepatuhan mengikuti
prosedur pengobatan
12 pertanyaan

dengan saran &


3. Ketrampilan diri dlm 5 pertanyaan
prosedur pengobatn
perawatan mandiri
CONTOH Validitas isi
Nama Petugas : Tanggal Wawancara :
Tanda tangan :

I. Identitas Responden
Nama Responden :
Kabupaten : Sleman
Kecamatan : Prambanan
Kelurahan :
Rukun warga (RW) :
Rukun tetangga :
Umur :
Pendidikan :
Jenis kelamin :
Pekerjaan :

II. PENGETAHUAN
Keterangan
1. Pilihlah jawaban yang benar dengan cara melingkari huruf a,b,c
atau d
2. Setiap pertanyaan hanya ada satu jawaban benar

1. Menurut Bapak,apakah penyebab penyakit demam berdarah :


a. Kuman
b. Bakteri
c. Virus
d. Virus dengue

2. Apakah gejala penyakit DBD :


a. Demam dan berkeringat
b. Sakit kepala dan lemah
c. Panas mendadak dan timbul bercak-bercak merah di kulit
d. Demam dan muntah

TAMPILAN MANA YANG BAGUS?


Validasi konten dengan
teknik Delphi
• Teknik Delphi  untuk mendapatkan
konsensus para panelis melalui
pendekatan intuitif terhadap konten
maupun tampilan instrument/produk
penelitian (Waltz, Strickland, Lenzm,
2010)

Langkah-Langkah teknik Delphi
1. Peneliti menentukan dan memilih panelis yang
dipandang memiliki keahlian dalam bidangnya agar
tujuan penelitian dapat tercapai (personal identification
and selection)
2. Peneliti menyusun butir-butir instrumen berdasarkan
kajian teori
3. Peneliti memberikan kuesioner pada putaran pertama
kepada responden, selanjutnya mereview instrumen
dan menganalisis jawaban instrumen yang telah
dikembalikan
4. Analisis dilakukan dengan menghitung Content Validity
Ratio (CVR) (Shultz & Whitney, 2004)
CONTENT VALIDITY RATIO (CVR)

• Penyekoran terdiri dari tiga alternatif, yaitu (1) tidak relevan, (2)
kurang relevan atau (3) relevan dengan domain yang diukur
• Skor CVR pada tiap aitem dapat berkisar antara 1 hingga -1.
• Skor yang tinggi menunjukkan validitas konten yang lebih tinggi
untuk item tersebut
• Sebuah aitem yang memiliki CVR=0 menunjukkan bahwa separuh
panel memberikan penilaian item tersebut sebagai aitem yang
relevan dengan domain yang diukur.
• Setiap nilai positif menunjukkan bahwa lebih dari setengah dari
panel diberi nilai item tersebut termasuk pada kategori aitem yang
cukup baik untuk dilibatkan dalam instrumen pengukuran
• Aitem yang memiliki CVR sangat rendah akan tidak dilibatkan
dalam administrasi pengujian instrumen (pilot test/try out).
• Aitem yang memiliki nilai CVR rendah menunjukkan bahwa item
yang bersangkutan tidak mewakili domain ukur.
CONTENT VALIDITY RATIO (CVR)
HASIL CONTENT VALIDITY RATIO (CVR)

PANELIS
Aitem CVR
1 2 3 4 5 6 7 8 9 10
A.1 3 3 3 3 3 3 3 3 3 3 0,625
A.2 3 3 3 3 3 3 3 3 3 3 0,625
A.3 3 3 3 3 3 3 3 3 3 3 0,625
A.4 3 3 3 3 3 3 3 3 3 3 0,625
A.5 3 3 3 3 3 3 3 3 3 3 0,625
A.6 3 3 3 3 3 3 3 3 3 3 0,625
A.7 3 3 3 3 3 3 3 3 3 3 0,625

A.8 3 3 3 3 3 3 3 3 3 3 0,625

A.9 3 3 3 3 3 3 3 3 3 3 0,625
A.10 2 1 1 3 1 2 2 3 3 3 -0,125
A.11 2 3 3 3 1 3 2 2 3 3 0,125
A.12 3 2 3 1 3 3 3 2 3 3 0,250
A.13 3 3 3 3 3 2 3 1 3 2 0,250
A.14 3 3 3 3 3 3 2 3 3 2 0,375
A.15 2 3 3 3 2 3 1 3 3 2 0,125
A.16 1 3 2 3 1 1 1 1 3 2 -0,250
A.17 2 1 3 1 3 2 1 1 2 3 -0,250
A.18 2 3 3 2 3 3 3 3 3 3 0,375
CONTENT VALIDITY RATIO (CVR)

• Formula
  untuk menentukan CVR adalah
sebagai berikut:

CVR = rasio validitas isi, jumlah


Ne = Jumlan panelis yang memberikan penilaian 3 (penting/relevan),
N = Jumlah semua panelis.
TABEL CONTENT VALIDITY RATIO (CVR)
VALIDITAS KRITERIA
Validitas Kriteria (Criterion Validity)
• Menggambarkan seberapa jauh hasil satu
pengukuran sesuai dengan hasil pengukuran
lain dengan menggunakan instrumen yang
dianggap standar
• Criterion validity dinilai dengan membandingkan
hasil satu pengukuran dengan pengukuran
menurut GOLD STANDARD
• Menggunakan uji statistik  validitas atau
koefisien korelasi
• +1 to -1 (1 memiliki hubungan sangat kuat) ; 0 =
tak ada hubungan
Overlaping 2 populasi

• TN = True Negative (Negatif sejati) • FN = False Negative (Negatif palsu)


• TP = True Positive (Positif sejati) • FP = False Positive (Positif palsu)
True disease state vs. Test
result
Test not rejected rejected
Disease
No disease
(D = 0)
 X
specificity
Type I error
(False +) 
Disease
(D = 1)
X 
Power 1 - ;
Type II error
sensitivity
(False -) 
Specific Example

Pts without Pts with


the disease disease

Test Result
Threshold
Call these patients “negative” Call these patients “positive”

Test Result
Some definitions ...
Call these patients “negative” Call these patients “positive”

True Positives

Test Result

without the disease


with the disease
Call these patients “negative” Call these patients “positive”

Test Result False


Positives
without the disease
with the disease
Call these patients “negative” Call these patients “positive”

True
negatives

Test Result

without the disease


with the disease
Call these patients “negative” Call these patients “positive”

False
negatives

Test Result

without the disease


with the disease
Moving the Threshold: right

‘‘-’’ ‘‘+’’

Test Result

without the disease


with the disease
Moving the Threshold: left

‘‘-’’ ‘‘+’’

Test Result

without the disease


with the disease
ROC curve
100%
True Positive Rate
(sensitivity)

0%

0% 100%
False Positive Rate
(1-specificity)
ROC curve comparison

A good test: A poor test:

100% 100%
True Positive Rate

True Positive Rate


0% 0
%
0 100% 100%
0
% False Positive Rate % False Positive Rate
ROC curve extremes
Best Test: Worst test:

100% 100%

True Positive Rate


True Positive Rate

0
0 %
% 0 100
0 100 False Positive %
False Positive % %
% Rate
Rate

The distributions The distributions


don’t overlap at all overlap completely
Validitas Kriteria (Criterion Validity)
Gold standard Jumlah
Test + -

+ A B A+B
- C D C+D
Jumlah A+C B+D N
A. Jumlah subyek sakit yang diklasifikasikan sakit (POSITIF
SEJATI)
B. Jumlah subyek tak sakit yang diklasifikasikan sakit
(POSITIF PALSU)
C. Jumlah subyek sakit yang diklasifikasikan tak sakit
(NEGATIF PALSU)
D. Jumlah subyek tak sakit yang diklasifikasikan tak sakit
(NEGATIF SEJATI)
Validitas Kriteria (Criterion Validity)
• Sensitivitas:
– Probabilitas hasil test menujukkan hasil positif jika pada gold
standar hasilnya positif
– Akurasi tes untuk mengklasifikasikan sakit terhadap subyek sakit.
– Makin tinggi sensitivitas tes  akan semakin sedikit jumlah subyek
yang sakit tetapi keliru diklasifikasikan tes negatif (negatif palsu).
• Spesifisitas:
– Probabilitas hasil test menunjukkan hasil negatif jika pada gold
standar hasilnya negatif
– Akurasi tes untuk mengklasifikasikan tak sakit terhadap subyek tak
sakit.
– Makin tinggi spesifisitas tes  akan semakin sedikit jumlah subyek
yang tak sakit tetapi keliru diklasifikasikan tes positif (positif palsu)
Validitas Kriteria (Criterion Validity)
• Nilai prediksi positif:
Probabilitas diperolehnya hasil gold standard positif jika
hasil test positif
• Nilai prediksi negatif:
Probabilitas diperolehnya hasil gold standar negatif jika
hasil test negatif.
Validitas Kriteria (Criterion Validity)
Gold standard Jumlah
Test + -

+ A B A+B
- C D C+D
Jumlah A+C B+D N

• Sensitifitas: A/(A+C)
• Spesifisitas: D/(B+D)
• Nilai prediksi positif: A/(A+B)
• Nilai prediksi negatif: C/(C+D)
Validitas Kriteria (Criterion Validity)

• Tes penyaringan yang sahih adalah tes yang sangat


sensitif dan sangat spesifik
• Idealnya masing-masing bernilai 100%
• Pada kenyataannya, keadaan itu tidak mungkin dicapai,
tetapi bisa didekati
• Me sensitivitas akan me spesifisitas, sebaliknya
Me spesifisitas akan me sensitivitas
• Sebab  pada umumnya tes klinik tidak hanya
menunjukkan subyek yang dengan jelas dikategorikan
normal dan yang dikategorikan abnormal, tetapi juga
subyek-subyek yang berada di daerah perbatasan (grey
zone atau borderline)
Validitas Kriteria (Criterion Validity)

• Analisis menggunakan kurva Receiver Operator


Characteristic (ROC)  menerangkan ketepatan
tes dalam berbagai tingkatan titik potong.
• Kurva ROC berfungsi sebagai nomogram untuk
menentukan titik potong diagnosis yang terbaik.
• Ketepatan keseluruhan dari tes skrening dapat
dijelaskan menurut luas daerah di bawah kurva
ROC, semakin besar luas area di bawah kurva
maka hasil tes akan bertambah baik (Fletcher,
Fletcher, & Wagner, 1992).
Uji validitas kriteria Skor Depresi dan Skor Demensia

CONTOH Validitas Kriteria

• Contoh :

Penilaian Uji Penyaringan Uji Baku


Skor Depresi Minimum Data Set- Skala Depresi
based Depression Geriatri (Geriatric
Rating Scale 16- Depression Scale
item (MDSDRS-16) 15-item) (GDS-15)

 Analisis kurve ROC diolah dgn aplikasi MedCalc® version 9.0


 Dipilih instrumen penelitian yang memiliki sensitivitas dan
spesifisitas maksimal serta persentase area di bawah kurve
ROC (Area Under the ROC Curve / AUC) lebih besar (Frank
Schoonjans, 2006)
CONTOH Validitas Kriteria
MEDCALC
MEDCALC
MEDCALC
MEDCALC
CONTOH Validitas Kriteria

Skor Skala Depresi Geriatri [Observer 1]


100

80

60
Sensitivity

40

20

0
0 20 40 60 80 100
100-Specificity
CONTOH Validitas Kriteria

Skor Set Data Minimal untuk Skala Depresi [Observer 1]


100

80

60
Sensitivity

40

20

0
0 20 40 60 80 100
100-Specificity
CONTOH Validitas Kriteria

Kriteria
Kriteria ::≤3
≤3
Sensitivitas
Sensitivitas :88,9%
: 88,9%
Spesifisitas
Spesifisitas ::47,8%47,8%
Nilai
Nilaiprediktif
prediktif++::40,0%
40,0%
Nilai
Nilaiprediktif
prediktif-- ::91,7%
91,7%

AUC = 0,667

• Hasil uji diagnostik  sensitivitas dan spesifisitas


maksimum pada titik potong skor 3 (tiga)
• Nilai sensitivitas 88,9% (IK95% : 51,7% - 98,2%)
• Nilai spesifisitas 47,8% (IK95%: 26,8%-69,4%)
• Nilai prediksi positif 40,0%
• Nilai prediksi negatif 91,7%
CONTOH Validitas Kriteria

Kriteria
Kriteria ::≤3
≤3
Sensitivitas
Sensitivitas :88,9%
: 88,9%
Spesifisitas
Spesifisitas ::47,8%47,8%
Nilai
Nilaiprediktif
prediktif++::40,0%
40,0%
Nilai
Nilaiprediktif
prediktif-- ::91,7%
91,7%

AUC = 0,667

• Luas wilayah di bawah kurve (AUC) sebesar 0,667 (IK95%: 0,479-0,822 ; p


= 0,1024)  pemilihan individu yang dilakukan secara acak pada kelompok
positif depresi memiliki kesempatan 66,7% lebih besar bila dibandingkan
dengan memilih individu secara acak pada kelompok negatif depresi.
• Kesimpulan statistik  AUC tidak berbeda secara nyata (p>0,05) dengan
area teoritis (Ho : AUC=0,50) sehingga uji penapisan GDS-15 tidak mampu
untuk membedakan diagnosis depresi baik pada kelompok positif maupun
kelompok negatif dalam batas kemaknaan 5%
CONTOH Validitas Kriteria

Kriteria
Kriteria :: ≤≤ 33
Sensitivitas
Sensitivitas :: 42,9% 42,9%
Spesifisitas
Spesifisitas :: 100,0%100,0%
Nilai
Nilaiprediktif
prediktif++ :: 100,0%
100,0%
Nilai AUC = 0,705
Nilaiprediktif
prediktif-- :: 20,0%
20,0%

• Hasil uji diagnostik  sensitivitas dan spesifisitas maksimum pada


titik potong skor 3 (tiga)
• Nilai sensitivitas 42,9% (IK95% : 24,5%-62,8%)
• Nilai spesifisitas 100,0% (IK95%: 40,2%-100,0%)
• Nilai prediksi positif 100,0%
• Nilai prediksi negatif 20,0%
CONTOH Validitas Kriteria

Kriteria
Kriteria :: ≤≤ 33
Sensitivitas
Sensitivitas :: 42,9% 42,9%
Spesifisitas
Spesifisitas :: 100,0%100,0%
Nilai
Nilaiprediktif
prediktif++ :: 100,0%
100,0%
Nilai AUC = 0,705
Nilaiprediktif
prediktif-- :: 20,0%
20,0%

• Luas wilayah di bawah kurve (AUC) sebesar 0,705 (IK95%: 0,518-0,852 ; p


= 0,1836), artinya pemilihan individu yang dilakukan secara acak pada
kelompok positif depresi memiliki kesempatan 70,5% lebih besar bila
dibandingkan dengan memilih individu secara acak pada kelompok negatif
depresi.
• Kesimpulan statistik  AUC tidak berbeda secara nyata (p>0,05) dengan
area teoritis (Ho : AUC=0,50) sehingga uji penapisan MDSDRS-16 tidak
mampu untuk membedakan diagnosis depresi baik pada kelompok positif
maupun kelompok negatif dalam batas kemaknaan 5%
CONTOH Validitas Kriteria

Kriteria
Kriteria :: ≤3
≤3
Sensitivitas
Sensitivitas :: 88,9%88,9%
Spesifisitas
Spesifisitas :: 47,8%47,8%
Nilai
Nilaiprediktif
prediktif++:: 40,0%
40,0%
Nilai
Nilaiprediktif
prediktif-- :: 91,7%
91,7%

Kriteria
Kriteria ::≤≤33
Sensitivitas
Sensitivitas ::42,9% 42,9%
Spesifisitas
Spesifisitas ::100,0%100,0%
AUC = 0,667 Nilai
Nilaiprediktif
prediktif++::100,0%
100,0%
Nilai
Nilaiprediktif
prediktif-- :: 20,0%
20,0% AUC = 0,705

INSTRUMEN MANA YANG DIGUNAKAN?


VALIDITAS KONSTRUK
Validitas Konstruk (Construct Validity)
• Menggambarkan seberapa jauh hasil satu pengukuran
sesuai dengan hasil pengukuran lain yang secara teoritis
menggambarkan konsep yang diukur
• Contoh: apakah skor depresi yang dikembangkan dapat
membedakan orang depresi dengan orang tidak depresi
(menurut PPDGJ/ICD 10)
• Prosedur pengujian validitas konstrak  hasil komputasi
interkorelasi diantara berbagai hasil tes dan kemudian
diikuti oleh analisis lebih lanjut terhadap matriks korelasi
yang diperoleh melalui pendekatan analisis faktor (factor
analysis)
• Analisis faktor  mereduksi data / proses untuk
mensederhanakan sejumlah variabel menjadi lebih
sedikit faktor (Kerlinger, 2002)
Validitas Konstruk (Construct Validity)

• Ketika peneliti menghitung koefisien korelasi


suatu item dengan skor tes  peneliti sedang
menghitung korelasi skor dengan bagian dari
dirinya sendiri
• Hal tersebut menimbulkan koefisien korelasinya
cenderung menjadi tinggi (spurious overlap).
Akibatnya terjadi overestimasi terhadap korelasi
antara item yang bersangkutan dengan skor tes
• Perhitungan koreksi terhadap spurious overlap
melalui perhitungan Korelasi Item-Total yang
Terkoreksi (Corrected Item-Total Correlation)
Validitas Konstruk (Construct Validity)
RELIABILITAS
Reliabilitas
• Temporal/intra observer reliability
• Agreement/inter observer reliability
• Internal Consistency
Temporal / intra observer reliability
• Pengukuran pada subyek yang sama oleh orang
yang sama pada waktu yang berbeda menghasilkan
hasil yang sama
• Dapat diukur dengan test-retest correlation
coefficient
• Masalah:
– Jika pertanyaan yang sama diulang pada jangka waktu pendek,
ingatan dari respons yang pertama dapat mempengaruhi respons
yang kedua sehingga nilai r cenderung tinggi
– Perubahan pada subyek yang diukur dapat terjadi bukan akibat
kesalahan pengukuran (unreliability) tetapi juga akibat perubahan
pada faktor mendasar yang diukur (instability).
Agreement / inter observer reliability

• Marginal homogeneity:
mengukur seberapa jauh 2 atau lebih pengamat
menghasilkan hasil yang sama secara umum
(distribusi tepi/marginal distribution) pada saat
mengelompokkan individu yang sama. Diukur
dengan Mc Nemar test
• Kesesuaian/Agreement:
mengukur seberapa jauh 2 atau lebih pengamat
setuju pada pengelompokkan seluruh individu pada
kelompok yang diamati. Diukur dengan koefisien
Kappa-Cohen.
Koefisien Kappa
• Penilaian:
• K=1 : Perfect agreement
• K=0.80 - 0.99 : Excellent agreement
• K=0.60 – 0.79 : Good agreement
• K=0.40 – 0.59 : Fair agreement
• K < 0.40 : Poor agreement
Internal Consistency
• Digunakan untuk mengukur apakah sejumlah
pertanyaan/pengukuran mengukur hal yang
sama
• Contoh: pengetahuan tentang pencegahan
HIV/AIDS diukur dengan 10 pertanyaan ya/tidak.
Pengetahuan diukur dengan menjumlahkan
pertanyaan yang dijawab secara benar. Internal
consistency menilai apakah 10 pertanyaan tsb
mengukur hal yang sama.
Internal Consistency
• Internal consistency diukur dengan
menggunakan :
– Skala data item ordinal  koefisien Alpha-
Cronbach
– Skala data item dikotomi  koefisien Kuder-
Richardson 20 (KR20)
• Penilaian Alpha-Cronbach sama dengan
penilaian pada koefisien Kappa
• Split-half models. Korelasi antara 2 kelompok:
– Guttman split-half reliability, Spearman-Brown
reliability (equal and unequal length), and coefficient
alpha for each half
Internal Consistency
Cara-cara meningkatkan reliabilitas

• Exploratory studies, preliminary interviews, ujicoba,


terhadap subjek penelitian dengan karakteristik sama
dengan target aktual
• Menambah jumlah item
• Semakin besar jumlah sampel (sampai jumlah tertentu)
yang representatif dengan populasi yang mau diukur 
makin reliabel.
• Analisis item satu-satu. Item dengan nilai diskriminasi
jelek dibuang; skor random atau tidak bisa membedakan
subjek dilihat dari hal yang diukur. Corrected item-total
correlation.
• Cek masalah pengadministrasian pengukuran, instruksi,
dsb
r tabel = 0,288

Anda mungkin juga menyukai