Anda di halaman 1dari 28

PENGUKURAN

TES PSIKOLOGI :
TEKNIK DAN
METODOLOGI

RELIABILITAS DAN
VALIDITAS
Kuliah 4 - 5
Tugas
1. Cari dan jelaskan reliabilitas dan validitas masing-
masing tes psikologi berikut:
a. Wechsler-Bellevue Intelligence Scale
b. Edwards Personal Preference Schedule
c. RMIB
d. Forer Sentence Completion Test
2. Jelaskan perbedaan kuesioner tes kepribadian dan
kuesioner Asperger Syndrome dengan kuesioner no 2
3. Cari dan jelaskan perbedaannya dengan tes-tes
psikologi dan kuesioner yang diberikan
Pengantar
Seperti diketahui, tes-tes psikologi sangat
banyak
Pembuatan tes psikologi ???
Apa benar bisa mengukur apa yg ingin diukur
krn kaitannya dengan mental sso??
Sejauh mana derajat kepercayaan tes tsb?
RELIABILITAS : KONSEP DASAR

Definisi : merujuk pada kekonsistenan nilai yang


diperoleh oleh orang yang sama ketika diberikan tes
yang sama namun pada waktu yang berbeda.
Konsep yg mendasari reliabilitas ialah:
penghitungan eror pd st nilai ttt
Eror yang dimaksud disini adalah : perbedaan antara
kemampuan yg sebenarnya yg dimiliki oleh sso
dengan skor yg diperoleh melalui pengukuran yg
mengukur kemamp tsb
Pada tes psikologi, eror yg dimaksud bukan
merupakan kesalahan test taker atau kesalahan yg
disengaja ketika proses pengerjaan tes,
Namun merupakan ketidaktepatan dalam proses
pembuatan alat tes, seperti faktor2 X yg tdk terukur
atau tdk tdeteksi pd pembentukan tes yg mengukur st
pl.
OKI, setelah membuat tes, kita harus mengukur
erornya dan cari cara untuk meminimalkan eror tsb
Bahasa statistiknya, bila mlkk reliabilitas tes maka
akan didapatkan perkiraan total variance atau variasi
total dari nilai tes, yg disebut error variance
Dengan memiliki tes yg minim eror maka tes tsb
semakin reliabel.
Bila tesnya memiliki banyak eror maka tes tsb tidak
relibel.
Misal : kita ingin mengukur fluktuasi mood.
Maka bila nilai skor tesnya turun naik =
relibilitas = baik/buruk????
Krn day-by-day changes in scores on a test
would be relevant to the purpose of the test =
mengukur mood, krn mood tdk sll sama setiap
harinya.
Jadi, kondisi apapun yg tdk relevan dgn tujuan
tes dibuat dpt menyebabkan error variance
Sehingga, stp tester hrs mengusahakan kondisi
tes yg seragam = lingkungannya, instruksi,
time limit, rapport, atau faktor lainnya.
The Correlational Coefficient
Ialah : derajat kekonsistenan dari dua nilai yg
independent
Simbol : r = relationship atau korelasi
Korelasi ada 3 :
- Korelasi positif = kenaikan nilai di var X diikuti
kenaikan var Y
- Korelasi negatif = reversal scores from one var to the
other.
- Korelasi nol = bila tidak ada hub dari dua variabel
yang ada
Pengukuran Korelasi
Pearson Product-Moment Correlational Coefficient
(PPMCC)
Hasil dari PPMCC adl :
1. Posisi indv dlm kelomp (SS = standarad score)
2. Jumlah penyimpangan indiv = apk diatas mean or
dibawah mean kelp
Bila nilai indv jatuh di atas rata2 kelp maka kor +
sdgk di bwh rata2 kelp maka kor -
Statistical Significance
Korelasi yg dihasilkan signifikan atau tidak?
Untuk melihat itu digunakan level signifikansi
= yi resiko kesalahan yang akan digunakan u/
menarik kesimpulan dari data yg ada
Ada bbrp level signifikasi = .01, .05, .09
Bila kita menyebutkan bhw korelasi signifikan
di level .05 maksudnya adl probabilitas
kesalahannya adl 5 dari 100, begitu seterusnya
Dalam pengukuran tes, maka level signifikansi
yg digunakan kebanyakan .01 dan .05
How reliable is reliable???
Seberapa tinggi koefisien reliabilitas dikatakan
memiliki reliabilitas yang tinggi?
Tergantung tes, namun biasanya bila koefisien
mencapai .70 atau .80 maka tes tersebut dapat
dikatakan reliabel
BERBAGAI TIPE RELIABILITAS
1. Metode Tes-retest
Ialah : metode yg digunakan u/ mcari reliabilitas
dgn cara mengulang tes yg sama pada dua
kesempatan yg berbeda
Rtt yg diperoleh merupakan korelasi dari nilai tes
individu yang diperoleh di waktu pengetesan yg
berbeda
Error variance yg diperoleh berasal dr fluktuasi
performance indiv di sesi 1 dan 2
Variasi ini krn situasi pengetesan yg tdk dpt
dikontrol, spt suasana, cuaca, sudden noises,
broken pencil, dll.
Selain itu eror dpt disebabkan keadaan indv
ketika melakukan tes, spt sakit, cemas,
khawatir, dll
Evaluasi test-retest
- Kelebihan : simpel dan straightforward
- Kekurangan : interval pendek = recall their
former responses, shg korelasinya akan tinggi.
Hal ini menjadikan nature of the test itself may
also change with repetition.
BERBAGAI TIPE RELIABILITAS
2. Alternate-Form Reliability
Salah satu metode mendapatkan reliabilitas
tes dgn memberikan tes yg bentuknya setara
pada kesempatan yg berbeda namun pada
indv yang sama
Jadi harus diperhitungkan juga interval
pemberian tesnya.
3. Split-Half Reliability
Internal consistency : apakah belahan 1 dan
belahan 2 itemnya konsisten = content
sampling
Yang dilihat adalah item-itemnya konsisten
apa tdk
Antara belahan 1 dan 2 dikorelasikan, bila
kor nya tinggi maka tes tsb reliable
4. Kuder-Richardson Reliability dan Coefficient
Alpha
Single administration of single form
Yang ditekankan adalah inter item consistency = yi
konsistensi jawaban terhadap item
Eror variance nya didpt dari :
1. Content sampling
2. Heterogeneity dari contoh tingkah laku
Sumber error dalam metode asesmen
reliabilitas
Sumber eror Contoh Metode How assessed

Time sampling Tes yg sama Tes-retest Korelasi ant 2 skor


diberikan pada 2 yg didapat pada 2
wkt yg berbeda kesempatan tsb.
Item sampling Item-item yg Alternate forms or Korelasi antara
berbeda yg parallel forms bentuk tes yg mirip
digunakan untuk yg memiliki item2
mengukur 1 pl yg berbeda
Internal Item2 yg konsisten Split half, KR20,
consistency pada tes yg sama dan alpha cronbach

Observer Catatan yg berbeda Kappa statistic


differences dari msg2 observer
VALIDITAS : KONSEP DASAR
Ialah : apakah tes mengukur apa yang ingin
diukur dan seberapa jauh dpt mengukur apa yg
ingin diukur tsb
Jd jangan tll percaya dengan judul dari tes,
biasanya hiperbola
So, kl ingin buat alat tes yang baik jg harus
memberikan nama yg baik shg bila sso melihat
nama tes tsb, lgs mengetahui apa yg diukur o/
tes tsb
Lebih lanjut lagi, validitas tes tdk dpt
dilaporkan sbg tinggi atau rendah tp apk
isi tes tsb mengukur apa yg ingin diukur
Misal : tes informal ingin mengetahui
kemampuan berhitung anak usia 5 thn. Isi tes
= kebanyakan soal2 yg kaitannya dgn
geometrik = TES TDK VALID
Tes yg valid bila isinya : contoh : sebutkan
urutan angka 1 50, dll
Fundamentally, all procedures for determining
test validity are concerned with relationship
between performance on the test and other
independently observable facts about the
behavior characteristics under consideration.
METODE MENDAPATKAN
VALIDITAS TES
1. Content-Description Procedures
Melibatkan pemeriksaan sistematis terhadap isi tes
u/ melihat apk tes tsb mcover contoh perilaku yg
akan diukur
Caranya :
- Menggunakan subject-matter expert
- Item2 yg didapat dr expert dispesifikkan = topiknya,
tujuan instruksional tes
- Stlh itu ditentukan brp item yg dibutuhkan untuk
mengukur hal2 yg sdh dispesifikkan sblmnya.
Content-validity jangan disamakan dgn face
validity
Krn face validity bukan fokus pd cara2
pengukuran tes tapi lebih pada apa2 saja yg
muncul dipermukaan (superficially)
2. Construct-Identification Procedures
Construct-validity berfokus pd peran teori2
psikologi. Hal ini dilakukan untuk menyusun
definisi operasional tingkah laku yg akan
diukur dlm tes
Contoh konstrak adl aptitude, scholastic,
verbal fluency, mechanical comprehension,
dll
3. Criterion-Prediction Procedures
Prosedur ini mengindikasikan keefektifan tes
dalam memprediksi kinerja individu di masa
yad
Jd sering disebut : predictive validity
Item2nya tsb dpt memprediksi kinerja indv di
masa yad
Misal : tes bakat = apk tes tersebut dpt
meramalkan performance kita di masa yad.
Contoh lain : tes yg diberikan u/ job
applicants, students = selecting students for
admission to professional school, dll.

Anda mungkin juga menyukai