Anda di halaman 1dari 36

VALIDITAS &

RELIABILITAS
VALIDITAS

 Pertanyaan :
 Apa yang diukur test?
 Seberapa baik pengukuran itu.
 Seberapa baik test ini dapat memprediksi prestasi/
performance di sekolah/tempat kerja ?
 Seberapa baik test ini mengukur hasil belajar ?
 Seberapa baik test ini mengukur depresi?
VALIDITAS

 Pengertian :
 Masalah validitas test/pengukuran mempertanyakan apa
yang diukur test dan seberapa baik pengukuran itu.
 Validitas dihubungkan dengan pemakaian test. Seberapa
baik test ini dapat memprediksi prestasi/performance di
sekolah/tempat kerja ?- validitas prediktif.
 Seberapa baik test ini mengukur hasil belajar ?
 Seberapa baik test ini mengukur depresi. Apakah
variabilitas skor menggambarkan variabilitas tingkat
depresi ?
VALIDITAS

 Definisi :
 Validitas meneliti hubungan antara skor test dan
perilaku yang dapat diamati (observable facts) di
luar test yang diukur secara independen
(terpisah).
 Pengukuran skor test -------- Pengukuran perilaku
(performance pada test) di luar test
 Kedua pengukuran di atas independen (terpisah satu
dengan yang lainnya)
VALIDITAS

 Jenis-jenis validitas :
 Content Validation ( Content-Description Procecures)
 (Face Validity)
 Prediction Validation (Criterion-Prediction Procedures)
 Concurrent validation
 Predictive validation
 Construct Validation
 Convergent validation
 Discriminant validation
VALIDITAS - content validation
 Pengertian :
 prosedur yang memeriksa apakah isi test
merupakan sample yang representatif dari
domain perilaku yang hendak diukur.

 Dilakukan terhadap test-test yang mengukur


tingkat penguasaan individu dalam keterampilan
tertentu/materi program pengejaran tertentu
(achievement test)
VALIDITAS - content validation
 Prosedur :
 1. merumuskan domain perilaku.
 2. Memilih expert/seorang ahli dalam domain
tersebut.
 3. Membuat kerangka berstruktur untuk proses
‘matching item’ dengan domain perilaku.
 4. Mengumpulkan dan menyimpulkan data dari proses
matching tersebut.
 5. Membuat format item/soal dan menentukan
jawaban.
VALIDITAS - content validation
 Domain perilaku dirumuskan dalam bentuk :
 daftar tujuan instruksional
 aspek-aspek isi (pokok bahasan).
 Test specification (kisi-kisi), berisi :
 tujuan instructional/ proses-proses berfikir yang
hendak dicapai.
 Materi/pokok bahasan/topik.
 Topik dan proses berpikir yang dipentingkan.
 Jumlah item untuk setiap topik dan proses berpikir.
VALIDITAS - content validation
 Karakteristik item yang harus dinilai oleh tim penilai :
 Item mengukur pokok bahasan yang mana ?
 Item mengukur proses kognitif yang mana ?
 Format stimulus/cara menyajikan stimulus, cara
memberikan respons/jawaban.

 Pemakaian
 Pada ‘criterion-reference tests’ - achievement test.
 Pada ‘occupational tests’- menyeleksi pegawai.
 Pada ‘self-report inventories’.
VALIDITAS - content validation
 Pertimbangan Praktis :
 1. Apakah perlu pembobotan terhadap tujuan instruksional ?
 2. Bagaimana memasangkan (matching) antara item dengan
tujuan instruksional ?
 3. Aspek-aspek apa dari item perlu dinilai?:
 pokok bahasan; proses kognitif/kompleksitas tugas; Format/ penyajian
soal; Cara pemberian respons.
 4. Bagaimana hasil penelitian content validation dirangkum ?
 Persentase soal yang mengukur dan yang tidak mengukur tujuan
instruksional.
 Dan lain-lain.
VALIDITAS - (face validity)
 Pengertian :
 apa yang diukur oleh test dilihat dari penampilannya.
 Suatu test mempunyai Face Validity bila subyek yang
mengambil test itu percaya/yakin mengenai apa yang
diukur test itu. Karena isi test, yaitu soal-soal, jenis
tugas yang harus dikerjakan subyek.
 Rapport/kerjasama dari pihak subyek dipengaruhi oleh
face validity test.
 Face validity tidak sama dengan content validity.
 “…. The extent to which items appear to measure a
construct that is meaningful to laypersons or typical
examinees” (Mosier, 1947).
VALIDITAS–Prediction Validation
 Pengertian :
 meneliti seberapa efektif suatu test dapat
meramalkan kinerja individu dalam kegiatan-kegiatan
tertentu di luar test.
 Menggunakan test untuk meramalkan kriteria apa saja
yang mungkin terjadi atau kinerja apa saja yang sudah
dilakukan.(Prediction dalam arti luas)
 Koefisien Validitas = koefisien korelasi antara skor-
skor test dan skor-skor kinerja individu.
 Kinerja individu yang diramalkan = KRITERIA
 Skor-skor test = PREDIKTOR
VALIDITAS – Prediction Validation
 Jenis ‘prediction validation’ :
 Concurrent validation
 data kriteria diperoleh pada saat yang bersamaan
dengan data prediktor.

 Predictive validation
 data kriteria diperoleh setelah jangka waktu
tertentu sesudah data prediktor dikumpulkan
(prediction dalam arti sempit).
VALIDITAS - Prediction Validation
 Prosedur :
 Carilah perilaku yang tepat/cocok untuk dijadikan kriteria
dan bagaimana cara mengukurnya.
 Carilah sample yang cocok dan mewakili populasi yang
dituju oleh test.
 Berikan test kepada sample di atas dan catat skor setiap
subyek.
 Bila data kriteria sudah ada, ukurlah performa setiap
subyek pada kriteria tersebut.
 Tentukan besarnya korelasi antara skor test dan performa
pada kriteria.
 Hasil penelitian dipakai untuk peramalan sample lain.
VALIDITAS – Prediction Validation
 Masalah praktis :
 Besar sample
 sample harus besar (N>200). Bila sample kecil, sampling error akan
besar. Jadi mempengaruhi keakuratan prediksi.
 Criterion contamination
 bila skor kriteria (misal evaluasi kinerja) dipengaruhi oleh skor
prediktor.
 Supaya tidak terjadi , pengumpulan data test (prediktor) dan data
kinerja (kriteria) dilakukan oleh 2 orang yang bekerja sendiri-sendiri.
 Restriction of range
 terjadi bila rentang variasi skor-skor pada prediktor dan atau kriteria
sempit/terbatas. Jadi merendahkan korelasi.
VALIDITAS - construct validation
 Pengertian :
 meneliti seberapa banyak suatu test mengukur
suatu konstruk teoritis atau suatu trait.
 Konstruk :
 konsep hipotetis yang dirumuskan untuk menjelaskan perilaku.
 Bersifat abstrak, tidak dapat dilihat secara langsung.
 Contoh inteligensi, kreativitas, anxiety, neurotisisme,
agressivitas.
 Dirumuskan secara operasional. Test inteligensi : test Stanford
Binet dan test Wais-R.
 Dirumuskan secara sintaktis :
 Nomothetic span : korelasi dengan konstruk-konstruk lain (teori).
 Korelasi dengan kriteria dalam dunia nyata. Contoh : inteligensi dan
prestasi akademik.
VALIDITAS - construct validation

 Prosedur :
 1.Rumuskan hipotesis-hipotesis tentang hubungan
antara konstruk dengan :
 aspek-aspek demografis; kriteria performance; konstruk lain yang
hubungannya dengan kriteria performance telah diketahui.
 2. Buat suatu alat/test yang terdiri atas item-item yang
merupakan manifestasi konkrit konstruk.
 3. Kumpulkan data empiris yang dapat menguji
hipotestis.
 4. Tentukan apakah hasil mendukung hipotesis-
hipotesis.
VALIDITAS - construct validation

 Convergent validation
 suatu test berkorelasi tinggi dengan variabel-variabel
yang secara teoritis harus berkorelasi dengan test tsb.

 Discriminant validation :
 tes berkorelasi rendah / tak signifikan dengan variabel-
variabel yang secara teoritis harus tidak berkorelasi
dengan test tsb.

(Campbell & Fiske, 1959)


VALIDITAS - construct validation
Convergent & Discriminant validation

 Prosedur :
 dua atau lebih cara untuk mengukur konstruk tsb.
 konstruk-konstruk lain yang berbeda dengan konstruk
yang diteliti, tapi dapat diukur dengan cara yang sama
sesuai dengan cara untuk mengukur konstruk yang
diteliti.

 Contoh ‘Multi trait-multi method matrix’ Campbell & Fiske


 method : self report; projective technic; peer rating.
 Konstruk : dominance; sociability; achievement.
RELIABILITAS
PENGERTIAN RELIABILITAS

 Reliabilitas  keterpercayaan, keterandalan,


keajegan, konsistensi, kestabilan, dsb.
 Sejauh mana hasil suatu pengukuran dpt dpercaya.
 Hasil ukur dpt dprcaya apabila dlm beberapa kali
p’ukuran thd klpk subjek yg sama diperoleh hasil yg
relatif sama, kalau aspek yg diukur dlm diri subjek
mmg blm berubah.
Koefisien Reliabilitas

 Tinggi-rendahnya reliabilitas, scr empirik ditunjukkan oleh suatu angka


yg disebut koefisien reliabilitas.
 Tinggi-rendahnya reliabilitas dicerminkan oleh tinggi-rendahnya
korelasi antara dua distribusi skor dari dua alat ukur yg paralel yg
dikenakan pd sekelompok individu yg sama.
 Semakin tinggi koefisien korelasi antara hasil ukur dari dua tes yg
paralel, berarti konsistensi diantara keduanya semakin baik dan kedua
alat ukur itu disebut sbg alat ukur yg reliabel.
 Koefisien korelasi antara dua variabel dilambangkan oleh huruf r.
apabila skor pd alat ukur yg pertama diberi lambang X dan skor pd alat
ukur paralelnya diberi lambang X’, maka koefisien korelasi antara
keduanya diberi lambang rxx’  simbol koefisien reliabilitas.
 Scr teoritik besarnya koefisien reliabilitas b’kisar antara 0 – 1  namun
pd kenyataannya koefisien sebesar 1 tdk pernah dijumpai.
Estimasi Reliabilitas

 Dapat dilakukan melalui salah-satu


pendekatan umum, yaitu
- Pendekatan Tes-Ulang (test-retest)
- Pendekatan Tes-Sejajar (alternate-forms)
- Pendekatan Konsistensi Internal (internal
consistency)
Pendekatan Tes-Ulang

 Pendekatan ini menunjukkan konsistensi


pengukuran dari waktu ke waktu dan m’hasilkan
koefisien reliabilitas yg sering disebut sbg koefisien
stabilitas.
 Komputasi korelasi antara distribusi skor dari kedua
pengenaan tes m’hasilkan estimasi reliabilitas
instrumen yg b’sangkutan.
 Kelemahan pendekatan tes-ulang adalah kurang
praktisnya pengenaan tes dua kali dan besarnya
kemungkinan t’jadi efek bawaan (carry-over effects)
dari satu pengenaan tes ke pengenaan yg kedua.
Pendekatan Tes-Sejajar

 Pendekatan tes-sejajar hanya dpt dilakukan apabila tersedia dua


bentuk instrumen p’ukur yg dpt dianggap memenuhi asumsi
paralel.
 Untuk dpt paralel kedua bentuk instrumen harus disusun dgn
tujuan m’ukur objek psikologis yg sama, b’dasarkan blue-print
(pola-rancangan) yg sama serta spesifikasi yg sama pula.
 Komputasi koefisien korelasi antara distribusi skor dari
pengenaan kedua instrumen itu m’hasilkan koefisien reliabilitas
yg berlaku bagi keduanya.
 Kelemahan pendekatan ini t’letak pd sulitnya menyusun dua alat
ukur yg memenuhi p’syaratan paralel atau sejajar dan juga msh
mgkn t’jadi efek bawaan.
Pendekatan Konsistensi Internal

 Estimasi reliabilitas dgn p’dekatan konsistensi internal didasarkan pd


data dari sekali pengenaan satu bentuk alat ukur pd sekelompok
subjek (single trial administration)
 Komputasi koefisien reliabilitasnya dilakukan setelah keseluruhan
instrumen yg telah dikenakan pd subjek itu dibelah m’jadi bbrp
bagian (dpt dibelah m’jadi 2, 3, 4 bahkan sjlh aitemnya)
 Jenis2 teknik komputasi reliabilitas konsistensi internal misalnya:
- Formula Spearman-Brown
- Formula Kuder-Richardson
- Formula Rulon - Formula Kristof
- Formula Alpha - Formula Analisis Varians
Formula Spearman-Brown

 Dpt digunakan apabila jlh aitem dlm tes adlh genap shg dpt
dibelah m’jadi dua bagian yg seimbang.
 Pembelahan dpt dilakukan dgn mengelompokkan aitem2
b’nomor ganjil m’jadi satu dan aitem2 b’nomor genap m’jadi satu
pula.
 Formula Spearman-Brown adalah:
Formula Rulon

 Formula Rulon jg dikenakan pd data skor suatu tes yg dibelah m’jadi dua
bagian yg seimbang.
 Komputasi reliabilitas didasarkan pd selisih skor subjek pd kedua
belahan tsb. Selisih skor itulah sumber variasi eror dan karenanya bila
dibandingkan dgn variasi skor akan dpt m’jadi dasar m’estimasi
reliabilitas tes.
 Rumusnya :
Formula Alpha

 u/ melakukan estimasi reliabilitas Alpha tes dpt dibelah m’jadi bbrp


bagian.
 Belahan2 tsb harus seimbang. Jika tdk, maka koefisien yg diperoleh
akan rendah & m’rupakan underestimasi thd reliabilitas yg sebenarnya.
 Formula Alpha u/ tes yg dibelah dua adalah:
…. Alpha
 Bila tes dibelah m’jadi 3 bagian, maka
formula alpha u/ komputasi reliabilitasnya
adalah:
Formula Kuder-Richardson 20

 Hanya dpt dikenakan pd data skor dikotomi


dari tes yg seolah-olah dibagi-bagi m’jadi
belahan sebanyak aitemnya.
 Rumusnya:
Interpretasi Koefisien Reliabilitas

 Interpretasi thd koefisien reliabilitas b’sifat relatif. Tdk ada batasan


mutlak yg menunjukkan angka koefisien terendah yg harus dicapai agar
suatu pengukuran dpt disebut reliabel.
 Biasanya suatu koefisien reliabilitas di sekitar 0,9 dpt dianggap
memuaskan.
 Dlm m’bandingkan koefisien reliabilitas, interpretasi tdk dpt lepas dari
besarnya varians skor (S2x). Dari sini kemudian dpt dihitung suatu
statistik yg disebut eror standar dlm pengukuran (Se):
Interpretasi …….
 Besar-kecilnya Se m’rupakan indikator keterpercayaan pengukuran yg
komparabel.
 Semakin kecil harga Se berarti pengukuran tsb semakin terpercaya
dikarenakan variasi erornya semakin kecil.
 Eror standar dlm pengukuran dpt digunakan u/ m’estimasi skor
sebenarnya (skor-murni) dlm suatu tes. Rumusnya:

Anda mungkin juga menyukai