A. TERMINOLOGI
Pada sebuah gambar kurva mengenai Error Standar Pengukuran (ESM), ketika ada dukungan
terhadap sebuah informasi maka kita akan lebih memusat dalam memandangnya. Jadi, ketika ada titik-
titik regresi (pada kurva tersebut) yang sudah terprediksi lalu ketika kita akan ditanyakan, misalkan ketika
X nya adalah 2 maka berapa Y nya? Maka kita akan memiliki error standar yg rendah. Tapi ketika X nya
adalah 19 atau 18, maka kita tidak memiliki informasi sehingga error standarnya itu akan tinggi.
Contoh diatas adalah analogi reliabilitas yang menjelaskan ketika tidak ada informasi, maka tidak
ada orang yang akan mendapat skor dan itu tidak terukur dengan baik. Artinya hal tersebut akan
menghasilkan error standar yang besar. Jadi reliabilitas itu terkait akurasi dan presisi dan hal ini mirip
dengan konsep error standar di statistika.
Apa yang menyebabkan presisi dan akurasi itu rendah? Mengenai ini bisa diilustrasikan dengan
lompat galah. Misalnya ada tiga orang secara berurutan memiliki kemampuan melompat dari tinggi ke
rendah. Mereka bertiga mengikuti lomba galah dengan tingkat ketinggian yang berurutan dari yang
terendah sampai yang tertinggi. Dari ilustrasi tersebut mirip dengan analogi error standar sebelumnya.
Bahwa tidak ada informasi yang didapatkan, ketikanya sama-sama gagal dan juga sama-sama berhasil
sehingga presisi yang dihasilkan pada tes tersebut rendah.
Tes yang menghasilkan presisi yang rendah adalah karena ada informasi. Jadi ketika urutan
paling awal dari ketiga orang tersebut gagal itu karena ada informasii dan variasi juga pada urutan
setelahnya dan urutan seterusnya ada informasi yang akhirnya dicapai bitline, tapi ada variasi pada urutan
ditengah karena itulah menyebabkan presisi menjadi tinggi (karena ada informasi disana). Konsep-konsep
reliabilitas bisa juga dilihat sebagi akurasi atau presisi skor.
rxx’
X
Skor yang dihasilkan Skor diwaktu lain
Skor dalam bentuk lain
Skor antar bagiannya
Rumus reliabilitas dan validitas itu berbeda. Banyak orang masih salah dalam membedakannya,
kalau rumus reliabilitas adalah dengan dirinya sendiri, sedangkan validitas adalah dari orang lain.
rit korelasi butir total termasuk dari reliabilitas atau validitas? Jadi rit (item total) lebih berkaitan atau
mendekati dengan koefisien validitas. Maka dari itu ketika ada yang mengatakan validitasnya adalah 0,3
yang terlihat dari korelasi item totalnya 0,3 tersebut dapat dikatakan adalah pemahaman yang kurang
tepat. Karena ketika ritnya itu tinggi maka akan meningkatkan reliabilitas akan tetapi belum tentu
validitasnya.
Reliabilitas adalah properti dari skor bukan tes. Reliabilitas juga adalah ukuran yang menunjukkan
seberapa besar skor yang dihasilkan terbebas dari error pengukuran yang bersifat acak. Karena error yang
bersifat sistematis itu berkaitan dengan validitas.
Reliabilitas skor
Reliailitas hasil pengukuran
Reliabilitas informasi
Reliabilitas pengukuran
4. Setiap koefisien reliabilitas punya asumsi
Setiap koefisien reliabilitas dikembangkan berdasarkan asumsi. Asumsi ini berkaitan dengan
dengan bagaimana hubungan antara satu bagian tes dengan bagian lainnya. Bagian ini bisa berupa butir
atau kumpulan butir. Asumsi mengenai hubungan ini akan menentukan koefisien reliabilitas yang akan
tepat untuk dipakai dalam laporan.
Jadi reliabilitas berdasarkan asumsi pada karakteristik dari belahan-belahan yang ada. Jika
belahannya sama, misal pada bagian 1 terdapat 5 butir, bagian 2 terdapat 3 butir dan bagian 3 terdapat 2
butir berarti asumsi yang berlaku adalah asumsi ekuivalen atau asumsi kongenerik.
Jenis Asumsi Teori Skor Murni Klasik
PARALEL M1 = M2 │ E1 ≠ E2
TAU EKIVALEN M1 = M2 │ E1 ≠ E2
TAU EKIVALEN M1 = C+ M2│ E1≠ E2
ESENSIAL
KONJENERIK M1 = M2 │ E1 ≠ E2
Skala 1 Skala 2
1. Saya tidak nyenyak tidur Saya cakep
2. Saya memiliki keinginan untuk minggat Saya ganteng
3. Saya tidak berselera untuk makan Saya menawan
Sebuah tes itu PARALEL ketika M1 dari belahan 1, belahan 2 dan belahan 3 itu sama. Dan error
juga diasumsikan sama sehingga kita bisa mengkorelasikan.
TAU EKIVALEN asumsinya adalah ketika errornya berbeda tap M1 sama.
TAU EKIVALEN ESENSIAL ketika ada satu konstan, misalkan belahan 1 itu 5, belahan 2 itu 2,
dan belahan selanjutnya 3, maka konstan terus penambahannya.
Validitas dan reliabilitas menjadi sebuah simalakama (trade off). Konsistensi internal yang tinggi
dapat dicapai dengan memperbesar korelasi antar butir (redundant items). Namun disatu sisi konsistensi
internal yang tinggi akan mengorbankan konten yang membuat domain menjadi sangat narrow.
Reliabilitas (homogenitas butir/konsistensi internal) akan cenderung besar ketika ukuran tes
sangat panjang. Hasil penelitian menunjukkan bahwa meskipun sebuah tes mengukur lebih dari satu
dimensi(multidimensi) koefisien alpha yang dihasilkan dari skor tes tersebut bisa sangat tinggi.
Sumber informasi mengestimasi reliabilitas ada 2;
Karakteristik konstruk psikologi yang cenderung luas dan berjenjang ada level 1, level 2
contohnya CHC
Terkadang proses dekomposit konstruk menjadi aspek satu komponen
Pengembangan skala dengan ukuran yang panjang
Adanya artifak dalam pengembangan alat ukur
JAWABAN:
1. Kalau mendekati 1 ya lebih baik, tapi dalam beberapa literatur justru ada yang menghapus item
dengan korelasi antar item itu yang diatas 0.7 kalau tidak salah bukunya Klain. Jadi koefisien
antar item disarankan jangan sampai diatas 0.7 karena itu menunjukkan retedensi sehingga
tergantung dari masing-masing. Kalau reliabilitas yang tinggi itu mungkin kita libatkan sebagai
pengujian, apakah jawaban terhadap 2 item itu konsisten atau tidak. Tapi dalam beberapa
keperluan mungkin item-item yang redundant itu lebih ke valid ke domain ukurnya, otomatis
yang dikorbankann reliabilitasnya. Jadi semakin mengecil karena justru yang diatas 0,7 itu
dikeluarkan.
2. Jika reliabilitas kita itu diestimasi dari sampel yang hiterogen itu berarti skornya mendekati true.
Ketika itu sudah kuat basisnya maka saat dipakaii lagi ternyata reliabilitasnya itu rendah yang
awalnya 0.8 misalnya, menjadi 0.6. Maka berarti datanya ada yang kurangg pas bukan karena alat
ukurnya yang salah. Sehingga lebih kearah datanya. Kesimpulan itu bisa terjadi ketika reliabilitas
kita dibangun oleh data yang kuat.
3. Korelasi item total itu mendekati rxx dari pada rxy, jadii lebih mendekati ke reliabilitas dari pada
ke validitas. Karena skor total itu representasinya dari x’ bukan y, sehingga ketika mengatakan
korelasi item total atau daya diskriminasi itu menunjukkan daya efisien validitas maka itu adalah
hal yg keliru.
4. Bisa setiap dimensinya atau jika dijadikan satu bisa jadi reliabilitas scor composite (dibuku
Prof.Azwar) yang diperkenalkan reliabilitas koefisiennya mosier. Selain koefisien mosier ada
beberapa koefisien lain seperti koefisien alpha berstarta. Koefisien alpha tapi jika diterapkan pada
data yang bersifat multidimensi jika itu adalah dimensi-dimensi yang bisa dijumlahkan maka
reliabilitasnya bisa jadii reliabilitas score composite. Tapi kalau dimensi-dimensi itu tidak bisa
dijumlahkan maka satu dimensi itu ada satu koefisien reliabilitas. Jadi satu dimensi satu faktor itu
reliabilitasnya sendiri-sendiri. Tapi terdapat konsekuensi jika sendiri. Namun ketika itu dimensi-
dimensi yang bisa dijumlahkan maka itu bisa dikompositkan dengan reliabilitas mosier.
D. KESIMPULAN
Sebelumnya terdapat banyak salah kaprah dalam penelitian di psikologi seperti terdapat
banyak jurnal yang membahas tentang pengukuran kepribadian dan sebagian dalam laporannya
itu menyebutkan bahwa korelasi item total itu merupakan validitas. Jadi melalui diskusi
pembahasan ini telah dikonfirmasi bahwa korelasi item total atau yang dikenal dengan daya
diskriminasi itu bukanlah validitas.
Melalui forum diskusi ini juga banyak hal-hal yang dapat dikonfirmasi termasuk
mengenai isu reliabilitas tes atau reliabilitas hasil tes yang menjadi banyak perdebatan yang tidak
berujung. Padahal ketika itu dipahami sebagai reliabilitas tes maka muncullah banyak pendapat-
pendapat yang bisa dikonfirmasi. Maka dapat disimpulkan apabila kita menggunakan alat tes
yang sudah ada dan sudah pernah diuji maka tidak perlu lagi untuk diuji reliabilitasnya.
Kemudian juga konfirmasi mengenai item total adalah validitas melalui diskusi ini bisa
menjadi perhatian bersama. Dan yang terakhir sebagian dari kita kita itu mendengar reliabilitas =
alpha cronbach dan hal ini seperti tidak ada pilihan lain, padahal ternyata untuk menggunakan
pendekatan mana yang akan digunakan juga adalah hal yang harus dipertimbangkan.