Non-Kognitif
Karakteristik Performansi Tipikal
• Validitas hasil tergantung ‘kejujuran’ testee
• Stimulus tidak terstruktur jelas
• Respon dimaknai berbeda
Pentingnya alat ukur “yang benar”
• Alat ukur memegang peranan yang kritikal dalam
pengukuran
• Alat ukur yang tidak benar akan membuat pengukuran
menjadi tidak benar
• Pengukuran yang tidak benar akan menghasilkan data
tidak benar
• Data yang tidak benar akan menghasilkan kesimpulan
tidak benar
Pengukuran
• Proses kuantifikasi atribut dari suatu entitas dengan mengikuti aturan
tertentu (Steven, 1946)
• Kesamaan dalam definisi:
• Hasil pengukuran selalu berupa angka
• Atribut (yang diangkakan) dalam pendidikan, ilmu social, dan humaniora
bersifat teoretik/konseptual
• Karena itu pengukuran dalam pendidikan, ilmu social, dan humaniora tidak
pernah 100% akurat, karena pengukuran hanya dapat dilakukan secara tidak
langsung (melalui indicator-indicator dari atribut yang diangkakan)
Teoretik/
Definisi
Konseptual Operasional
Alat Ukur
(Persepsi,
Attitude,
Intensi) Item
kisi2
Indikator
Item
Konstruk
Indikator Item
Indikator
• Metode untuk mengukur konstruk.
• Suatu proses untuk membuat suatu konsep bisa
diukur
• Proses dimana peneliti memilih indicator atau
sekumpulan indicator untuk mengukur konsep
disebut Operasionalisasi
• Hasilnya adalah kisi-kisi (blue print)
(Babbie, 1989)
Tujuan dan Standar
• Tujuan:
• Mendapatkan alat ukur yang efisien dengan
menjamin reliabilitas dan validitas hasil
pengukurannya
• Standar:
• Standards for Educational and Psychological Testing
– AERA, APA, NCME (1999, 2014)
Ketersediaan alat ukur
Ketersediaan:
• Membuat alat tes baru
• Melakukan adaptasi tes
Rutin:
• Melakukan uji validitas dan reliabilitas secara berkala
• Re-norming
Tahapan Penyusunan Alat Ukur
Konseptualisasi
Blue Print
Penulisan item
(review dan revisi)
Reliabilitas dan
Standard Eror of
Measurement
Analisis berdasarkan
teori tes klasik
Distribusi jawaban
terhadap setiap item,
Data
Daya pembeda,
DIF/Bias
Analisis berdasarkan
latent theory/IRT
Analisis teori tes klasik
Distribusi jawaban setiap butir soal
• Korelasi antar butir soal (inter item correlation matrix) → antar item
berkorelasi 0.8/0.9 pilih salah satu item
• Item statistics
• P-value (tingkat kesukaran) → hanya untuk item yang dinilai secara dikotomis
(ada kunci=1, salah-0)
• Daya pembeda (korelasi anatara item dengan total atau corrected total score)
→ untuk item tes typical performance
Reliabilitas
• Test-retest
• Parallel form dan split-halves → 2 form atau 2x tes
• Internal consistency: Cronbach’s alpha
Analisis berdasarkan teori tes klasik
• Daya pembeda: korelasi item vs. total (atau
corrected item-total correlation)
• Negatif: item bekerja berlawanan dengan item
lainnya → perlu dibuang
• Sangat kecil: item tidak memberikan kontribusi
terhadap penilaian perbedaan individu
• Sangat besar, negative: Unfavorable item yang
skoringnya belum dibalik
Rule of thumb (Popham, dll.) untuk Daya
Pembeda
Magnitude Interpretation Decision
≥ .40 Very good Include
discrimination
≥ .30, but <.40 Good discrimination Include
≥ .20, but <.30 Marginal Evaluate
discrimination
≥ 0, but <.20 Poor discrimination Revise/discard
<0 Reverse discrimination Discard
Analisis berdasarkan teori tes klasik
• Reliabilitas
• 0,7 atau lebih tinggi
• 0,9 untuk high stake atau diagnostic
Perakitan
• Berdasarkan hasil analisis dan revisi dari uji coba dipilih item
yang:
• Memiliki daya pembeda tertinggi
• Distribusi jawaban cukup menyebar
• Mengukur setiap indikator dalam kisi-kisi
• Melakukan re-analisis hanya dengan menggunakan item-
item terpilih
• Reliabilitas
• Corrected item total correlation
Validasi
Evidence based
on test content
Validitas 1999
Evidence based
Evidence based
on the
on relations to
consequences
other variables
of testing
Brief Explanation about Review
Jenis
Judgemental Empirik
Tujuan Revisi Apakah memenuhi kaidah-kaidah Hasil uji coba :
(tahap konstruksi penulisan item CTT/IRT/LT (dengan
item untuk Oleh : cross-reviewer CFA)
diperbaiki)
Validitas SME: CVR dan CVI (Relevance, Hubungan dengan
Clarity, Importance) variabel/tes lain
Internal struktur
(apakah sesuai
aspek dan indicator)
→ dengan CFA