Anda di halaman 1dari 111

Dr.

Selviana
Tujuan Pembelajaran
 Mahasiswa memahami teori-teori dasar
pengukuran.
 Mahasiswa mampu memahami dan
menjelaskan evaluasi rehadap alat ukur
psikologi.
 Mahasiswa mampu memahami dan
menjelaskan pengembangan alat ukur
Psikologi.
Materi
1. Pengertian Psikometri, Pengukuran, Jenis-
jenis Tes.
2. Teori Tes Klasik.
3. Reliabilitas.
4. Validitas.
5. Pengantar Analisis Faktor.
6. Pengembangan Alat Ukur.
7. Teori Tes Modern
Referensi
1. Penulis : Saifuddin Azwar
Judul buku : Dasar-dasar Psikometri
2. Penulis : Guilford
Judul buku : Psychometric Method
3. Penulis : Nunnally
Judul buku : Psychometric Theory
4. Penulis : Kuncono
Judul buku : Analisis Butir
Pengertian Psikometri

 Psikometri adalah cabang ilmu psikologi yang


berkaitan dengan pengukuran (pengukuran
menghasilkan angka-angka tetapi psikometri
lebih mengarah kepada teorinya).
Psikometri Sebagai Embrio
Pengukuran Psikologi
 Pengembangan alat tes atau alat ukur perilaku
memiliki sejarah yang sangat panjang.
 Aktivitas pengembangan tes mulai muncul di
Cina sudah sejak 3000 tahun yang lalu.
 Salah satu tujuannya waktu itu adalah untuk
menyeleksi orang-orang untuk menduduki
jabatan tinggi di pemerintahan.
 Fakta sejarah berikutnya tentang aktivitas
pengembangan tes muncul sekitar akhir 1800-
an, ketika pionir di bidang ilmu Psikologi
mendirikan laboratorium untuk mempelajari
perilaku manusia.
 Penggunaan tes kini telah menjadi bagian dari
keseharian kehidupan individu. Tes sudah
banyak digunakan di sekolah-sekolah.
Perusahaan, dsb
 Tujuan utamanya adalah untuk menggambarkan
perilaku atau kualitas lain secara akurat.
 Tujuan lainnya antaralain untuk :
 mengevaluasi
 melakukan diagnosa,
 mengestimasi perilaku di masa depan,
 sebagai alat bantu dalam konseling (contohnya; untuk
mengatasi masalah dan merencanakan masa depan
seseorang),
 sebagai alat bantu baik dalam proses seleksi karyawan
dan pelajar maupun dalam perencanaan dan evaluasi
program.
 Pengukuran pada dasarnya merupakan
pemberian angka terhadap atribut atau
variable pada suatu kontinum (proses
kuantifikasi). Seperti : panjang, berat,
kecepatan, dsb
 Pengukuran berguna dalam memberikan
gambaran mengenai suatu atribut, sehingga
atribut tersebut dapat dideskripsikan
• Pernyataan yang menyebutkan sebuah garis itu
berukuran panjang akan memberikan kesan
yang subyektif karena luasnya makna panjang.
Akan tetapi jika dikatakan panjang garis tersebut
20 cm, maka angka tersebut akan memberikan
gambaran kuantitatif yang lebih obyektif, dimana
angka 20 cm ini berada pada suatu kontinum
panjang.
• Kita mungkin masih ragu jika seseorang
mengatakan si A itu tinggi, hal ini dimungkinkan
karena kita masih mempersepsikan secara luas
arti tinggi, lain halnya jika dikatakan tinggi si A itu
180 cm, anda akan yakin bahwa si A itu tinggi
meskipun anda belum pernah melihat si A
sekalipun.
 Secara operasional, pengukuran merupakan suatu
prosedur pembandingan antara atribut yang akan
diukur dengan alat ukurnya.
 Sehingga karakteristik pengukuran adalah :
 Merupakan perbandingan antara atribut yang diukur
dengan alat ukurnya.
 Hasilnya dinyatakan secara kuantitatif, artinya
pengukuran baik atribut fisik maupun psikologis selalu
dinyatakan dalam bentuk angka.
 Hasilnya bersifat deskriptif, artinya hanya sebatas
memberikan angka dan tidak memberikan makna lain.
 Pengukuran selalu menyangkut ciri-ciri/ atribut tertentu
dari suatu objek. Jadi yang diukur bukanlah objek itu
sendiri melainkan ciri / atribut dari objek tersebut.
Postulat Pengukuran
 Postulat = pendapat singkat yang
dianggap benar.
1. Postulat yang berhubungan dengan
persamaan (equalities) atau identitas.
2. Postulat yang berhubungan dengan sifat
rank order.
3. Postulat yang berhubungan dengan sifat
additive (penambahan).
Postulat Persamaan/ Identitas
1. a = b atau a ≠ b
2. Jika a = b, maka b = a
3. Jika a= b, dan b = c, maka a = c

Postulat Rank Order


1. Jika a > b, maka b < a
2. Jika a > b, b > c, maka a > c
Postulat Sifat Additive
1. Jika a = p dan b > a, maka a + b > p
2. a + b = b + a
3. Jika a= p dan b = q, maka a + b = b + q
Bilangan identik atau sama bisa saling
menggantikan.
4. ( a + b ) + c = a + ( b + c )
Apakah orang ini tinggi?
Tidak jika di
banding saya

Ya jika di banding
saya
• Jadi dibutuhkan suatu pembanding jika kita ingin
memutuskan bahwa seseorang tinggi, sedang atau
pendek.

• Dalam kasus lain kita membutuhkan pembanding


jika ingin mekatakan bahwa si A itu anak yang
pandai atau tidak, berbakat atau tidak, dsb

• Ilustrasi tersebut menjelaskan bahwa intepretasi


terhadap suatu pengukuran hanya dapat bersifat
evaluatif apabila disandarkan pada suatu norma
atau suatu kriteria.
 Karakteristik Evaluasi :

1. Merupakan perbandingan antara hasil ukur


dengan suatu norma atau suatu kriteria
2. Hasilnya bersifat kualitatif
3. Hasilnya dinyatakan secara evaluatif
NOMINAL

 ≈ Kategorisasi atau identifikasi.


 ≈ Misal jenis kelamin, agama, suku,
nomor pemain bola (identifikasi).
 → Menggunakan postulat persamaan
atau identitas.
ORDINAL

 Perjenjangan.
≈ Jarak antar jenjang tidak sama.
≈ Misal ranking kelas, prestasi olahraga.
→ Menggunakan postulat yang rank order.
INTERVAL
1. Perjenjangan.
≈ Jarak/ interval (diasumsikan) sama.
≈ Nilai nol Tidak mutlak. Berarti objek tidak
mempunyai atribut yang diukur.

2. Tidak dimungkinkan adanya perkalian/ pembagian.


≈ Misal nilai ujian, skor kecerdasan.
→ Menggunakan postulat rank order (karena
perjenjangan) dan additive
(karena jarak antar jenjang dianggap sama, rasio).
RATIO

1. Merupakan skala pengukuran dengan


level tertinggi
2. Memiliki harga nol mutlak
3. Dapat dikenakan semua operasi hitung
( + ), ( - ), ( x ), ( : )
4. Misalnya ukuran-ukuran berat, panjang
Nominal Ordinal Interval Ratio
Membedakan √ √ √ √
Berjenjang √ √ √
Jarak antar jenjang
sama √ √
Memiliki nol mutlak √
Diskusi
 Level skala apa yang terkandung dalam
skala LIKERT ??
Pengertian

 Tes berarti suatu prosedur standar untuk


mengukur secara kuantitatif (skor) maupun
kualitatif (evaluasi) satu / beberapa aspek
atribut psikologis dengan menggunakan
sample perilaku verbal maupun non verbal.
Tujuan
1. Membandingkan dua atau lebih aspek atribut
psikologis pada individu yang sama.

Kecerdasan Inteligensiku
emosiku 145 122

2. Membandingkan individu yang berbeda


pada aspek atribut psikologis yang sama.

Inteligensiku Inteligensiku
126 400
PERMASALAHAN TES PSIKOLOGI
1. Tidak ada pendekatan tunggal dalam pengukuran
konstrak apapun yang dapat diterima secara universal.
2. Pengukuran psikologis pada umumnya didasarkan
pada sample perilaku yang jumlahnya terbatas.
3. Pengukuran selalu mungkin mengandung error.
4. Satuan dalam skala pengukuran tidak dapat
didefinisikan dengan baik.
5. Konstrak psikologis tidak dapat didefinisikan secara
operasional semata tapi harus pula menampakkan
hubungan dengan konstrak atau fenomena lain yang
dapat diamati.
JENIS TES

1. Performansi maksimal
2. Performansi tipikal
Performansi Maksimal
 Performansi terbaik yang mampu diperlihatkan oleh individu
sebagai respons terhadap aitem-aitem dalam suatu tes.
 Performansi maksimal identik dengan kemampuan (abilitas)
kognitif.
 Harus dibuat stimulus-stimulus yang berstruktur jelas
sehingga tujuan pertanyaan dan arah arah jawaban yang
dikehendaki oleh tes dapat difahami betul oleh individu
sebelum ia mencoba memberikan responsnya
 Karena respons individu berkaitan dengan kemampuan
kognitifnya maka jawsaban yang diberikan oleh individu dapat
di katakana sebagai jawaban yang “benar” atau yang “salah”
 Contoh : tes inteligensi (WAIS-R, WISC-R, Stanford-Binet,
CFIT, Kauffman ABC, dll.), tes bakat (subtes-subtes FACT,
DAT), berbagai tes prestasi belajar (Tes semester,
EBTANAS), dan tes potensi belajar (TPA, UMPTN, SAT,
GRE)
Performansi Tipikal
 Merupakan performansi yang ditampakkan oleh individu
sebagai proyeksi dari kepribadiannya sendiri sehingga
indikator perilaku yang diperlihatkannya merupakan
kecenderungan umum dirinya dalam menghadapi situasi
tertentu
 Harus dirancang dengan menggunakan stimulus yang
tidak berstruktur sehingga individu membuat
penafsirannya sendiri terhadap stimulus tersebut dan
merespons sesuai dengan aspek afektif dalam dirinya
saat itu
 Tidak dapat dikatakan sebagai “Benar” atau “salah”
 Contoh : tes kepribadian (Rorschach, Wartegg, TAT),
skala-skala sikap, inventori minat, dan berbagai skala
yang disusun untuk mengungkap aspek-aspek afektif
dalam kepribadian
SASARAN UKUR
Apakah semua hal dapat diukur ?

❑ Jika sesuatu itu ada, maka ada dalam suatu


jumlah. Maka seharusnya dapat diukur
(croncbach)
❑ Jika sesuatu membuat perbedaan, maka
terdapat dasar untuk pengukuran (ebel)

❑ Kalau ada dalam satu jumlah dan menunjukkan


suatu perbedaan maka dapat dicari alat dan
skala unur untuk mengukurnya
Jenis sasaran Ukur

Atribut Responden

Konstanta Variabel

Komunikasi Hasil Belajar Mahasiswa


Sikap Karyawan

Spesifik

Intensitas Hasil Belajar Mahasiswa


Komunikasi Sikap Karyawan
VARIABEL
 Konsep yang memiliki variasi nilai
 Dalam banyak hal, pengukuran dilakukan
terhadap variabel dengan menghasilkan
hasil ukur
 Pengukuran dapat dilakukan terhadap satu
atau lebih dimensi (Unidimensi dan
Multidimensi)
UNIDIMENSI
 Mengukur satu dimensi saja
 Misal :
 Kemampuan matematika
 Kemampuan bahasa
 Minat belajar
 Bakat melukis
MULTI DIMENSI

 Mengukur lebih dari satu dimensi


 Misal :
 Inteligensi
 Kecerdasan emosional
 Kecemasan menghadapi ujian
JENIS VARIABEL
 Variabel Manifes
 Langsung dapat di ukur
 Misal : Skor ujian, skor IQ, skor kecerdasan
emosi
 Variabel Laten
 Tidak langsung dapat di ukur
 Misal : Keberhasilan belajar, IQ, Kecerdasan
emosi
Bagaimana cara mengukur variabel
laten ??
Variabel Variabel
Laten Kesepadanan
Manifes

Keberhasilan
Belajar Kesepadanan
?
Skor Ujian

Sebarapa baik siswa Semakin banyak soal


menguasai materi yang dijawab benar
yang diberikan semakin tinggi nilai

Semakin baik penguasaan materi


semakin banyak soal yang dijawab
benar, maka semakin besar nilai
yg diperoleh
Inteligensi Kesepadanan
?
Skor IQ

Kecakapan seseorang •Skor kemampuan verbal


dalam kemampuan •Skor kefasihan kata
verbal, kefasihan kata, •Skor bekerja dgn bilangan
bekerja dengan
bilangan, dsb
Permasalahan berikutnya,
Apakah benar-benar sepadan ??

Permasalahan seberapa baik kesepadanan variabel


laten dengan variabel manifesnya merupakan
permasalahan validitas dan reliabilitas
Responden

 Orang, peristiwa, data, dsb yang


menjadi obyek penelitian
 Sasaran responden mencakup :
 Seluruh populasi (sensus)
 Sebagian populasi (sampel)
 Individu
Responden & Data

Populasi Penarikan sampel Sampel Responden


Responden

Ukuran & Teknik Sampling


Pengukuran Pengukuran
Validitas & Reliabilitas

Penarikan sampel Sampel Data


Populasi Data
Pensampelan
• Idealnya penelitian dilakukan pada
semua unit populasi (sensus)
• Pensampelan dilakukan jika :
– Ada keterbatasan sumber daya penelitian
(biaya, waktu, tenaga)
– Sensus akan merusak populasi
• Sampel harus mewakili populasinya
(representatif)
• Representatif atau tidak tergantung
ukuran sampel dan teknik sampling
Ukuran Sampel
Sampel

1,1,1,2,2,3,3,
3,4,4,4,5,5,5

n = 14
Populasi Mean = 3.07

1,1,1,1,2,2,3,3,3,4,4,4,5,5
,5,5,5,5,6,6,6,7,7,8,8,8,9,
9,9,9,9,9,9,9

N = 34 Sampel
Mean = 5.5
1,1,1,2,2,3,3,3,4,4,
4,5,5,5,5,5,5,6,6,6,
7,7,8,8,8,9,9,9,9,9,
9,9,9

N = 33
Mean = 5.5
Teknik Sampling (Random)

POPULASI

SAMPEL
Teknik Sampling (Stratified)

Populasi

Sampling

Sampel
Validitas
 Mengukur apa yang harus di ukur
 Metode estimasi :
 Content
○ Face & Logical
 Construct
○ Multi Trait-Multi Method & Analisis Faktor
 Criterion
○ Prediktif & Konkuren
Reliabilitas
 Sejauh mana alat ukur memberikan hasil
yang relatif sama jika dilakukan berulang kali
sejauh atribut yang diukur belum berubah
 Metode estimasi :
 Test-test (tes-retes) = koefisien reliabilitas yang
dihasilkan (Stabilitas)
 Paralel test (Ekuivalensi)
 Penyajian Tunggal (Internal konsistensi)
LEBIH LANJUT MENGENAI
VALIDITAS DAN RELIABILITAS
DIBAHAS MINGGU DEPAN
ASUMSI SKOR
 Performansi individu, yang diungkap oleh
suatu skala pengukuran atau tes psikologis,
dinyatakan dalam bentuk angka yang disebut
skor
 Skor tidak lain daripada harga suatu jawaban
terhadap pertanyaan dalam tes dan
meskipun tidak sempurna merupakan
representasi dari suatu atribut laten
 Skor kuantitatif yang langsung diperoleh dari
pengukuran diberi simbol huruf X
 Bersamaan dengan itu, bagi setiap individu
yang mendapat skor tampak X, terdapat pula
angka lain yang merupakan skor
sesungguhnya
 Skor sesungguhnya adalah angka performansi
yang benar dan merupakan representasi murni
dari atribut laten, yang tidak pernah dapat
diketahui besarnya oleh karena tidak dapat
diungkap secara langsung oleh tes
 Skor sesungguhnya (true-scores) ini
selanjutnya disebut skor murni dan
disimbolkan dengan huruf T.
 Kemudian, menyertai setiap hasil
pengukuran, diteorikan pula adanya
komponen eror (error) yang besarnya
bagi setiap individu dalam setiap tes juga
tidak dapat diketahui.
 Komponen error dalam pengukuran ini
kita simbolkan dengan huruf E
 X = Obtained scores / Observed scores,
adalah skor tampak atau skor hasil
pengukuran

 T = True scores, adalah skor


sesungguhnya

 E = Error, adalah kesalahan pengukuran


Asumsi 1 : X= T+E
 Skor-tampak (X) ditentukan bersama oleh
besarnya skor-murni (T) dan besarnya error
pengukuran (E)
 Andaikan skor IQ si A yang murni atau yang
sesungguhnya adalah Tiq = 104, sedangkan
pada suatu tes IQ dia memperoleh angka Xiq
= 110, maka hasil pengukuran yang
dilakukan oleh tes tersebut terhadap A
mengandung error sebesar E = +6
Asumsi 2 : (X) = T
 Asumsi ini menyatakan bahwa skor-murni T
merupakan nilai harapan X (expected value of
X), yaitu (X).
 Jadi T merupakan harga rata-rata dari
distribusi teoretik skor X apabila orang yang
sama dikenai tes yang sama berulangkali
dengan asumsi pengulangan tes itu dilakukan
tidak terbatas
 Misal: IQ A Tiq = 104 merupakan rata-rata
teoritik dari distribusi teoritik X IQ A, andai ia
dites berulangkali sampai tak terbatas
banyaknya.
Asumsi 3 : et = 0
 Menurut asumsi ini bagi suatu kelompok
populasi subjek yang dikenai tes distribusi
eror pengukuran E dan distribusi skor-murni
T tidak berkorelasi satu sama lain
 Variasi eror tidak tergantung pada variasi
skor-murni
 skor-murni yang tinggi tidak akan mempunyai
eror yang selalu positif ataupun selalu negatif
Asumsi 4 : e1e2 = 0
 Bila e1 melambangkan eror pada pengukuran atau tes
pertama dan e2 melambangkan eror pada tes yang ke
dua maka asumsi ini mengatakan bahwa distribusi eror
pengukuran pada kedua tes tersebut, yaitu e1 dan e2,
tidak berkorelasi satu sama lain.
 Besarnya eror pada suatu tes tidak tergantung pada eror
pada tes lain.
 Seorang subjek yang skornya pada tes yang pertama
mengandung eror besar, tidak berarti akan mempunyai
eror yang besar pula pada tes yang ke dua.
 Asumsi ini berlaku dengan pengertian bahwa pada tes
yang pertama dan pada tes yang kedua tidak terjadi
pengaruh kelelahan, pengaruh latihan, dan
semacamnya.
Asumsi 5 : e1t2 = 0

 Asumsi ke lima mengatakan bahwa eror


pada suatu tes (E1) tidak berkorelasi dengan
skor-murni pada test lain (T2)
 Artinya, eror pada satu tes tidak tergantung
pada skor-murni pada tes lain
Reliabilitas

 Kata lain : keajegan, kekonsistenan


 Sejauh mana alat ukur dapat dipercaya
 Sejauh mana alat ukur memberikan
hasil yang relatif tidak berbeda sejauh
atribut yang di ukur belum berubah
Intepretasi Reliabilitas
Intepretasi 1
 xx’ = korelasi skor-tampak antara dua tes
yang paralel
 Interpretasi ini mengatakan bahwa reliabilitas
tes ditentukan oleh sejauhmana distribusi
skor-tampak pada dua tes yang paralel
berkorelasi
 Co: Korelasi antara dua tes yang pararel
sebesar 0.828. Berapa koefisien
reliabilitasnya: 0.828
Intepretasi 2
 xx2 = besarnya proporsi varians X yang
dijelaskan oleh hubungan liniernya dengan X’
 Dalam hal ini, besarnya kuadrat koefisien
reliabilitas dapat diartikan sebagai besarnya
proporsi varians suatu tes yang dapat
dijelaskan oleh variasi skor pada tes lain yang
paralel dengannya.
 Berapa koefisien reliabilitas apabila diketahui
korelasi skor tampak dan skor murni sebesar
0.846 = 0.716 (0.846²)
Besarnya proporsi varians X yang
dijelaskan oleh hubungan liniernya
dengan X’

r = 0.80
r2 = 0.64
64% varian X dapat di
jelaskan oleh varian X’

X X’
Intepretasi 3
 xx, = 2x / 2x’
 Koefisien reliabilitas merupakan perbandingan
antara varians skor-murni dan varians skor-
tampak pada suatu tes.
 Dapat juga dikatakan bahwa koefisien reliabilitas
adalah besarnya proporsi varians skor-tampak
yang merupakan varians skor-murni.
 Suatu koefisien reliabilitas sebesar 0,80 berarti
bahwa 80 persen dari varians skor-tampak
merupakan varians skor-murni.
 Bila reliabilitas tes tidak sempurna, yaitu bila besarnya
koefisien xx, < 1,0 berarti dalam pengukuran yang
dilakukan oleh tes yang bersangkutan terkandung
sejumlah eror
 Semakin kecil koefisien reliabilitas, yaitu semakin jauh
dari angka 1,0 berarti semakin besar variasi eror
pengukuran yang terjadi.
 Koefisien reliabilitas yang besarnya mendekati atau
sama dengan 0 menunjukkan bahwa skor-tampak dalam
tes itu merefleksikan eror pengukuran semata-mata
sehingga perbedaan di antara skor-tampak yang ada
tidak menunjukkan perbedaan yang sebenarnya di
antara skor-murni subjek melainkan menunjukkan
adanya eror yang timbul secara random
Intepretasi 4
 xx, = xt2
 Koefisien reliabilitas merupakan kuadrat
koefisien korelasi antara skor-tampak dan
skor-murni. Jadi, apabila koefisien
reliabilitas rxx, = 0,64 maka rxt = 0,64 =
0,80. Bila besarnya koefisien rxx,= 0,49
maka rxt = 0,49 = 0,70.
 Co: Besarnya proporsi varian tes yang
dapat dijelaskan oleh tes pararelnya
sebesar 0.850. Berapa besar reliabilitas tes
tersebut: √850 = 0.922
Intepretasi 5
 xx, = 1 – xe2
 Dinyatakan dalam interpretasi ini bahwa koefisien reliabilitas adalah
sama dengan satu dikurangi oleh kuadrat koefisien korelasi antara
skor-tampak dengan eror pengukuran. Semakin besar korelasi
antara skor-tampak dan eror pengukuran, akan semakin kecil
koefisien reliabilitasnya.
 Berapakah reliabilitas tes apabila koefisien korelasi skor tampak dan
error pengukuran 0.265. 1 – 0.265² = 1 – 0.070 = 0.93
 Berapa korelasi skor tampak dan error apabila diketahui koefisien
reliabilitas 0.723.
0.723 = 1 - n²
n² = 1 – 0.723
n = √0.277 = 0.526
Intepretasi 6
 Interpretasi ini mengaitkan reliabilitas dengan
besarnya proporsi varians eror yang
dicerminkan oleh varians skor-tampak.
 Telah kita ketahui bahwa besarnya varians
eror akan mempengaruhi tingginya
reliabilitas. Bila varians eror sangat kecil
maka tes akan mempunyai reliabilitas yang
tinggi
 Koefisien reliabilitas tes yang berada di antara 0 dan 1,0 dapat
diartikan sebagai berikut :
1. Hasil pengukuran yang dilakukan oleh tes yang bersangkutan
mengandung sejumlah eror.
2. X = T + E.
3. x2 = 12 + e2, yaitu varians skor-tampak terdiri atas varians skor-
murni dan varians eror.
4. Perbedaan skor-tampak yang diperoleh subjek sebagian memang
mencerminkan adanya perbedaan skor-murni dan sebagian lain
mencerminkan adanya eror.
5. xt = xx2, yaitu korelasi antara skor-tampak dan skor-murni sama
dengan akar kuadrat reliabilitas.
6. xe = (1 – xx,), yaitu korelasi antara skor-tampak dengan eror
adalah sama dengan akar kuadrat dari (1 dikurangi koefisien
reliabilitas).
7. xx, = t2/x2.
8. Semakin tinggi koefisien reliabilitas rxx, berarti estimasi X terhadap T
semakin dapat dipercaya dikarenakan varians erornya semakin
kecil.
Pendekatan Tes Ulang
 Pendekatan tes-ulang dilakukan dengan
menyajikan tes dua kali pada satu kelompok
subjek dengan tenggang waktu diantara kedua
penyajian tersebut.
 Asumsi yang menjadi dasar dalam cara ini
adalah bahwa suatu tes yang reliabel tentu akan
menghasilkan skor-tampak yang relatif sama
apabila dikenakan dua kali pada waktu yang
berbeda.
 Koefisien korelasi yang memperlihatkan keeratan
variasi skor antara kedua pemberian tes itu
merupakan koefisien reliabilitas tes yang
bersangkutan
 Dalam menggunakan pendekatan tes-ulang ini harus
diperhatikan pula kemungkinan adanya perubahan kondisi
subjek sejalan dengan berbedanya waktu diantara kedua
penyajian tes. Perubahan kondisi subjek yang terjadi tidak
pada keseluruhan subjek dan tidak searah sedikit-banyak
akan ada pengaruhnya terhadap koefisien reliabilitas yang
diperoleh.
 Dalam bentuk lain, efek bawaan dapat terjadi dikarenakan
masih ingatnya subjek akan jawaban yang pernah
diberikannya pada waktu pertamakali tes disajikan, dan
kemudian pada waktu tes tersebut disajikan yang pernah ia
berikan
 Disamping itu, terdapat kemungkinan timbulnya rejeksi atau
reaksi penolakan terhadap tes dalam diri subjek, yang
dinyatakan dalam bentuk perilaku pengerjaan tes dengan
tidak bersungguh-sungguh
Tes Paralel
 Dalam pendekatan bentuk-paralel, tes yang akan
diestimasi reliabilitasnya harus ada paralelnya, yaitu tes
lain yang sama tujuan ukurnya dan setara isi aitemnya
baik secara kualitas maupun kuantitasnya. Dengan
bahasa sederhana dapat dikatakan bahwa kita harus
punya dua tes yang kembar.
 Untuk membuat dua tes menjadi parallel, penyusunannya
haruslah didasarkan pada satu spesifikasi yang sama.
Spesifikasi ini meliputi antara lain tujuan ukur, batasan
objek ukur dan operasionalisasinya, indikator-indikator
perilakunya, banyaknya aitem, format aitem, juga kalau
perlu meliputi taraf kesukaran aitem, dan lain sebagainya.
 Bila telah diperoleh dua tes yang paralel maka
estimasi reliabilitasnya dilakukan dengan
mengenakan dua tes tersebut bersamaan pada
sekelompok subjek.
 Dua tes yang parallel yang menghasilkan skor
berkorelasi tinggi satu sama lain disebut tes yang
reliable dan koefisien korelasinya merupakan
koefisien reliabilitas tes yang bersangkutan.
 Kelemahan utama dalam pendekatan ini terletak
pada sulitnya menyusun dua tes yang parallel itu
sendiri
Konsistensi Internal
 Pendekatan konsistensi internal dilakukan
dengan menggunakan satu bentuk tes yang
dikenakan hanya sekali saja pada sekelompok
subjek (single-trial administration)
 Pendekatan reliabilitas konsistensi internal
bertujuan melihat konsistensi antara item atau
antar bagian dalam tes itu sendiri. Untuk itu,
setelah skor setiap aitem diperoleh dari
sekelompok subjek, tes dibagi menjadi
beberapa belahan
Berbagai Macam Teknik
Pembelahan

Random
• Penentuan kelompok berdasar kriteria acak

Ganjil Genap
• Penentuan kelompok berdasar item ganjil genap

Matched Random Subset


• Berdasar taraf kesukaran dan daya beda
• Untuk item-item yang mengukur kognisi
Random
Ganjil-Genap
Matched Random Subsets
VALIDITAS
 Mengukur apa yang harus di ukur
 Metode Estimasi :
1. Content Validity
a. Face Validity
b. Logical Validity
2. Construct Validity
a. Multri Trait – Multi Method
b. Factorial Validity
3. Criterion Validity
a. Predictive
external
b. Concurent
c. Item Validity / Discriminating Power Internal
Content Validity

1. Merupakan validitas yang diestimasi melalui


pengujian terhadap isi tes dengan analisis
rasional.
2. Validitas ini mencari jawab atas pertanyaan
sejauhmana item-item dalam tes mencakup
keseluruhan kawasan isi obyek yang hendak
diukur.
Validitas conten/isi terbagi menjadi :
a. Validitas muka, merupakan validitas yang
paling rendah signifikansinya karena hanya
didasari oleh format penampilan tes.
Validitas muka penting dalam memancing
motivasi individu agar menghadapi tes
dengan sungguh-sungguh.
b. Validitas Logik/validitas sampling, menunjuk
pada sejauh mana isi tes merupakan
representasi dari ciri-ciri atribut yang hendak
diukur. Suatu obyek yang hendak diukur oleh
tes haruslah dibatasi lebih dulu kawasan
perilakunya secara seksama.
Construct Validity
1. Merupakan tipe validitas yang menunjukkan
sejauhmana tes mengungkap suatu trait atau
konstrak teoritik yang hendak diukur.
2. Meski pengujian validitas ini biasanya
membutuhkan analisis statistik seperti halnya
dengan validitas empirik lainnya namun
validitas konstrak tidak dinyatakan dalam
bentuk suatu koefesien validitas.
Multi Trait – Multi Method
 Suatu alat tes Motivasi di konstruksi
berdasarkan faktor :
1. Eksternal / E
2. Internal / I

 Dan di buat dengan dua macam metode


penskalaan :
1. 5 pilihan / 5p ( option : SS S N TS STS ; skor 1 – 5 )
2. 2 pilihan /2p ( option : Ya – Tidak ; skor 1 – 0 )

 Alat ukur diberikan kepada sekelompok


subyek, sehingga setiap responden
mengerjakan : E-5p, E-2p, I-5p, I-2p
E-5p E-2p I-5p I-2p
1 5 6 3 3
2 6 5 8 6
3 7 7 5 6
4 8 8 4 4
5 7 7 7 7
6 6 6 9 9
7 7 6 4 4
8 6 6 8 8
9 5 5 9 8
10 6 6 4 5
Dasar pemikiran dalam validasi ini adalah bahwa adanya validitas yang
baik diperlihatkan oleh korelasi yang tinggi antara dua pengukuran
terhadap trait yang sama pada dua metode yang berbeda
FACTORIAL VALIDITY
Analisis Faktor (1)
 Analisis faktor didasari oleh koefesien korelasi linear
dan koefesien regresi liner
 Pada dasarnya koefesien korelasi merupakan cosinus
sudut yang dibentuk dari garis regresi
 xy = cos 
 Koefesien korelasi akan maksimal ( xy = 0.71 ) apabila
Y
 = 45o

 = 30o
cos  = 0.8660
xy = 0,8660
30o
X
Analisis Faktor (1)
 Apabila terdapat tiga atau lebih variabel yang
dikorelasikan misalnya terdapat tiga tes yakni tes I, tes II
dan tes III dengan inter korelasi :
12 = 0.8660 ➔ 12 = 30o

23 = 0.6428 ➔ 23 = 50o

13 = 0.1736 ➔ 13 = 80o


Tes 1
Tes 2

30o

50o Tes 3
Analisis Faktor (2)
• Kondisi akan menjadi rumit apabila terdapat banyak variabel.
Misalnya :
12 = 10o
13 = 70o
14 = 90o
15 = 100o
23 = 60o
24 = 80o
25 = 90o
34 = 20o
35 = 30o
45 = 10o

• Apabila suatu kondisi mengharuskan demikian maka analisa


sudut disederhanakan dengan memilih sumbu (utama, kedua,
ketiga, dan seterusnya tergantung keperluan) dan semua sudut
dibuat terhadap sumbu tersebut.
Analisis Faktor (2)
Muatan faktor merupakan cos
Sumbu I sudut terhadap sumbu.
Sub Tes III
Sub Tes I

Sub Tes II
55.2o
145.2o
Sumbu II

Seperti pada Sub Tes 1 (T1)


membentuk sudut :

55,2o ke sumbu I ;
Cos ( 55,2o ) = 0.5707

145,2o ke sumbu II ;
Cos ( 145,2o ) = -0.821
Tes 1 lebih dekat dengan sumbu 1 ( Faktor 1 )
xixixi…
Perhatikan posisi sub tes III berikut :
Faktor 1

Sub Tes III

Pada kondisi ini sub tes III


30o secara bersamaan mengkutub
Faktor 2 pada faktor/sumbu 1 dan 2,
60o
yakni 45o pada faktor 1 dan
45o 45o pada faktor 2
45o
Dengan demikian, sub tes III
membentuk sudut 30o
terhadap faktor 1 dan 60o
terhadap faktor 2

Solusi yang dapat dilakukan pada kondisi ini


adalah dengan melakukan rotasi
Penerapan Dalam Pengujian Validitas Konstrak

Sebuah alat ukur Motivasi dibuat


berdasarkan blue print berikut :

Faktor Favorable Unfavorable


Eksternal 1,2,3 4,5,6

Internal 7,8,9 10,11,12

Di uji coba pada 467 orang responden, diperoleh


distribusi sebagai berikut :
Uji Persyaratan Analisis

KMO and Bartlett's Test


Kaiser-Meyer-Olkin Measure of Sampling
Adequacy. .869

Bartlett's Tes t of Approx. Chi-Square 2342.770


Spheric ity df 66
Sig. .000

• Lihat Sig. Uji Bartlett’s Test of Sphericity,


diperoleh p = 0.000
• Dengan demikian data layak di uji lanjut
Uji Persyaratan Analisis
Anti-image Matrices

VAR00001 VAR00002 VAR00003 VAR00004 VAR00005 VAR00006 VAR00007 VAR00008 VAR00009 VAR00010 VAR00011 VAR00012
Anti-image Correlation VAR00001 .888a .065 .021 -.027 -.118 -.051 .011 .008 .033 -.005 -.225 -.052
VAR00002 .065 .863a .077 -.312 -.381 -.063 -.019 -.015 -.003 -.073 -.074 .004
VAR00003 .021 .077 .807a -.027 .085 -.067 .035 .037 .071 -.271 -.127 -.241
VAR00004 -.027 -.312 -.027 .884a -.267 -.185 -.123 -.019 .084 -.055 -.068 -.048
VAR00005 -.118 -.381 .085 -.267 .860a -.210 -.037 -.058 -.043 .011 .042 -.094
VAR00006 a
-.051 -.063 -.067 -.185 -.210 .897 -.028 .109 -.018 -.011 -.035 -.028
VAR00007 .011 -.019 .035 -.123 -.037 -.028 .909a .096 -.032 -.030 -.134 -.165
VAR00008 .008 -.015 .037 -.019 -.058 .109 .096 .826a -.308 -.117 -.554 -.184
VAR00009 .033 -.003 .071 .084 -.043 -.018 -.032 -.308 .886a -.295 -.067 -.205
VAR00010 -.005 -.073 -.271 -.055 .011 -.011 -.030 -.117 -.295 .902a -.010 -.148
VAR00011 -.225 -.074 -.127 -.068 .042 -.035 -.134 -.554 -.067 -.010 .837a .057
VAR00012 -.052 .004 -.241 -.048 -.094 -.028 -.165 -.184 -.205 -.148 .057 .907a
a. Measures of Sampling Adequacy(MSA)

 Lihat angka pada garis diagonal pada kolom anti Image


Matrix
 Apabila angka-angka tersebut diatas 0.5 maka item
layak di uji lanjut, jika tidak keluarkan
Component Matrix
Component Matrixa

Component
Karenanya perlu dilakukan rotasi
1 2
VAR00001
VAR00002 .657
Hasil Rotasi
VAR00003
Rotated Component Matrixa
VAR00004 .681
VAR00005 .684 .508 Component
VAR00006 .503 1 2
VAR00007 VAR00001
VAR00008 .769 VAR00002 .801
VAR00009 .710 VAR00003 .593
VAR00010 .717 VAR00004 .812
VAR00011 .755 VAR00005 .830
VAR00012 .738 VAR00006 .694
Extraction Method: Principal Component Analysis. VAR00007
a. 2 components extracted. VAR00008 .816
VAR00009 .785
VAR00010 .759
Terbentuk 2 faktor/sumbu, 1 VAR00011
VAR00012
.738
.722
dan 2 Extraction Method: Principal Component Analysis.
Perhatikan item 5, merupakan Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 3 iterations.
faktor “banci” (mengkutub pada
dua faktor)
Item 5 mengkutub pada faktor 2
Seleksi Item dengan analisis faktor
Rotated Component Matrixa

Component • Angka-angka yang tercantum


1 2
VAR00001 merupakan faktor loading dari
VAR00002
VAR00003 .593
.801
setiap item
VAR00004 .812
VAR00005
VAR00006
.830
.694
• Faktor Loading yang baik
VAR00007 umumnya > 0.5, dikarenakan
VAR00008
VAR00009
.816
.785
sudah di seting sebelumnya
VAR00010 .759 maka faktor loading < 0.5 tidak di
VAR00011
VAR00012
.738
.722
tampilkan
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization. • Bandingkan hasil dengan Blueprint
a. Rotation converged in 3 iterations.

• Item 1 & 7 drop karena tidak


Faktor Favorable Unfavorable memiliki faktor loading memadai
( < 0.5)
Eksternal 1 , 2, 3 4, 5, 6
• Item 3 drop karena keluar dari
Internal 7, 8, 9 10, 11, 12 kelompoknya (mengukur faktor 1)
CRITERION VALIDITY
Kisi-Kisi
Skala Strategi Multiple Goal Orientation

No Dimensi No Item Jml


Mastery Goal
1 1,2,3 3
Orientation
Performance Goal
2 4,5,6 3
Orientation
Work Avoidance
3 7,8,9 3
Orientation
Total Item 9
Kisi-Kisi
Skala Strategi Efikasi diri

No Dimensi No Item jml

1 Tingkat 1,2,3 3

2 Kekuatan 4,5,6,7 4

3 Generalitas 8,9 2
Total Item 9

Anda mungkin juga menyukai