RELIABILITAS
VALIDITAS
Pertanyaan :
Apa yang diukur test?
Seberapa baik pengukuran itu.
Seberapa baik test ini dapat memprediksi prestasi/
performance di sekolah/tempat kerja ?
Seberapa baik test ini mengukur hasil belajar ?
Seberapa baik test ini mengukur depresi?
VALIDITAS
Pengertian :
Masalah validitas test/pengukuran mempertanyakan apa
yang diukur test dan seberapa baik pengukuran itu.
Validitas dihubungkan dengan pemakaian test. Seberapa
baik test ini dapat memprediksi prestasi/performance di
sekolah/tempat kerja ?- validitas prediktif.
Seberapa baik test ini mengukur hasil belajar ?
Seberapa baik test ini mengukur depresi. Apakah
variabilitas skor menggambarkan variabilitas tingkat
depresi ?
VALIDITAS
Definisi :
Validitas meneliti hubungan antara skor test dan
perilaku yang dapat diamati (observable facts) di
luar test yang diukur secara independen
(terpisah).
Pengukuran skor test -------- Pengukuran perilaku
(performance pada test) di luar test
Kedua pengukuran di atas independen (terpisah satu
dengan yang lainnya)
VALIDITAS
Jenis-jenis validitas :
Content Validation ( Content-Description Procecures)
(Face Validity)
Prediction Validation (Criterion-Prediction Procedures)
Concurrent validation
Predictive validation
Construct Validation
Convergent validation
Discriminant validation
VALIDITAS - content validation
Pengertian :
prosedur yang memeriksa apakah isi test
merupakan sample yang representatif dari
domain perilaku yang hendak diukur.
Pemakaian
Pada ‘criterion-reference tests’ - achievement test.
Pada ‘occupational tests’- menyeleksi pegawai.
Pada ‘self-report inventories’.
VALIDITAS - content validation
Pertimbangan Praktis :
1. Apakah perlu pembobotan terhadap tujuan instruksional ?
2. Bagaimana memasangkan (matching) antara item dengan
tujuan instruksional ?
3. Aspek-aspek apa dari item perlu dinilai?:
pokok bahasan; proses kognitif/kompleksitas tugas; Format/ penyajian
soal; Cara pemberian respons.
4. Bagaimana hasil penelitian content validation dirangkum ?
Persentase soal yang mengukur dan yang tidak mengukur tujuan
instruksional.
Dan lain-lain.
VALIDITAS - (face validity)
Pengertian :
apa yang diukur oleh test dilihat dari penampilannya.
Suatu test mempunyai Face Validity bila subyek yang
mengambil test itu percaya/yakin mengenai apa yang
diukur test itu. Karena isi test, yaitu soal-soal, jenis
tugas yang harus dikerjakan subyek.
Rapport/kerjasama dari pihak subyek dipengaruhi oleh
face validity test.
Face validity tidak sama dengan content validity.
“…. The extent to which items appear to measure a
construct that is meaningful to laypersons or typical
examinees” (Mosier, 1947).
VALIDITAS–Prediction Validation
Pengertian :
meneliti seberapa efektif suatu test dapat
meramalkan kinerja individu dalam kegiatan-kegiatan
tertentu di luar test.
Menggunakan test untuk meramalkan kriteria apa saja
yang mungkin terjadi atau kinerja apa saja yang sudah
dilakukan.(Prediction dalam arti luas)
Koefisien Validitas = koefisien korelasi antara skor-
skor test dan skor-skor kinerja individu.
Kinerja individu yang diramalkan = KRITERIA
Skor-skor test = PREDIKTOR
VALIDITAS – Prediction Validation
Jenis ‘prediction validation’ :
Concurrent validation
data kriteria diperoleh pada saat yang bersamaan
dengan data prediktor.
Predictive validation
data kriteria diperoleh setelah jangka waktu
tertentu sesudah data prediktor dikumpulkan
(prediction dalam arti sempit).
VALIDITAS - Prediction Validation
Prosedur :
Carilah perilaku yang tepat/cocok untuk dijadikan kriteria
dan bagaimana cara mengukurnya.
Carilah sample yang cocok dan mewakili populasi yang
dituju oleh test.
Berikan test kepada sample di atas dan catat skor setiap
subyek.
Bila data kriteria sudah ada, ukurlah performa setiap
subyek pada kriteria tersebut.
Tentukan besarnya korelasi antara skor test dan performa
pada kriteria.
Hasil penelitian dipakai untuk peramalan sample lain.
VALIDITAS – Prediction Validation
Masalah praktis :
Besar sample
sample harus besar (N>200). Bila sample kecil, sampling error akan
besar. Jadi mempengaruhi keakuratan prediksi.
Criterion contamination
bila skor kriteria (misal evaluasi kinerja) dipengaruhi oleh skor
prediktor.
Supaya tidak terjadi , pengumpulan data test (prediktor) dan data
kinerja (kriteria) dilakukan oleh 2 orang yang bekerja sendiri-sendiri.
Restriction of range
terjadi bila rentang variasi skor-skor pada prediktor dan atau kriteria
sempit/terbatas. Jadi merendahkan korelasi.
VALIDITAS - construct validation
Pengertian :
meneliti seberapa banyak suatu test mengukur
suatu konstruk teoritis atau suatu trait.
Konstruk :
konsep hipotetis yang dirumuskan untuk menjelaskan perilaku.
Bersifat abstrak, tidak dapat dilihat secara langsung.
Contoh inteligensi, kreativitas, anxiety, neurotisisme,
agressivitas.
Dirumuskan secara operasional. Test inteligensi : test Stanford
Binet dan test Wais-R.
Dirumuskan secara sintaktis :
Nomothetic span : korelasi dengan konstruk-konstruk lain (teori).
Korelasi dengan kriteria dalam dunia nyata. Contoh : inteligensi dan
prestasi akademik.
VALIDITAS - construct validation
Prosedur :
1.Rumuskan hipotesis-hipotesis tentang hubungan
antara konstruk dengan :
aspek-aspek demografis; kriteria performance; konstruk lain yang
hubungannya dengan kriteria performance telah diketahui.
2. Buat suatu alat/test yang terdiri atas item-item yang
merupakan manifestasi konkrit konstruk.
3. Kumpulkan data empiris yang dapat menguji
hipotestis.
4. Tentukan apakah hasil mendukung hipotesis-
hipotesis.
VALIDITAS - construct validation
Convergent validation
suatu test berkorelasi tinggi dengan variabel-variabel
yang secara teoritis harus berkorelasi dengan test tsb.
Discriminant validation :
tes berkorelasi rendah / tak signifikan dengan variabel-
variabel yang secara teoritis harus tidak berkorelasi
dengan test tsb.
Prosedur :
dua atau lebih cara untuk mengukur konstruk tsb.
konstruk-konstruk lain yang berbeda dengan konstruk
yang diteliti, tapi dapat diukur dengan cara yang sama
sesuai dengan cara untuk mengukur konstruk yang
diteliti.
Dpt digunakan apabila jlh aitem dlm tes adlh genap shg dpt
dibelah m’jadi dua bagian yg seimbang.
Pembelahan dpt dilakukan dgn mengelompokkan aitem2
b’nomor ganjil m’jadi satu dan aitem2 b’nomor genap m’jadi satu
pula.
Formula Spearman-Brown adalah:
Formula Rulon
Formula Rulon jg dikenakan pd data skor suatu tes yg dibelah m’jadi dua
bagian yg seimbang.
Komputasi reliabilitas didasarkan pd selisih skor subjek pd kedua
belahan tsb. Selisih skor itulah sumber variasi eror dan karenanya bila
dibandingkan dgn variasi skor akan dpt m’jadi dasar m’estimasi
reliabilitas tes.
Rumusnya :
Formula Alpha