Anda di halaman 1dari 5

Beberapa isu mengenai Reliabilitas Hasil Pengukuran untuk didiskusikan.

Pemateri oleh Wahyu Widhiarso, Fakultas Psikologi Universitas Gajah Mada.

A. TERMINOLOGI

Ada beberapa terminologi tentang Reliabilitas yaitu:

 Stabilitas; yaitu ketika reliabilitas itu berkaitan dengn waktu


 Ekivalensi; yaitu ketika berkaitan dengan dua form yg setara
 Konsistensi; ada istilah part atau belahan ketika itu konsisten, misal antara pikiran orang dengan
perilakunya (itu berarti reliabel/konsisten)
 Reprodusibilitas; ada sedikit yg terlupakan dalam beberapa hal ini yg biasanya dipakai untuk
skala gabungan yg biasanya sejauh mana hasil pengukuran itu menghasilkan informasi yang
konsisten
 Presisi; menurut pemateri menitikberatkan pada reliabilitas itu sebagai faktor presisi atau akurasi.
Hal ini berkaitan dengan Error Standar Pengukuran (ESM)

Pada sebuah gambar kurva mengenai Error Standar Pengukuran (ESM), ketika ada dukungan
terhadap sebuah informasi maka kita akan lebih memusat dalam memandangnya. Jadi, ketika ada titik-
titik regresi (pada kurva tersebut) yang sudah terprediksi lalu ketika kita akan ditanyakan, misalkan ketika
X nya adalah 2 maka berapa Y nya? Maka kita akan memiliki error standar yg rendah. Tapi ketika X nya
adalah 19 atau 18, maka kita tidak memiliki informasi sehingga error standarnya itu akan tinggi.

Contoh diatas adalah analogi reliabilitas yang menjelaskan ketika tidak ada informasi, maka tidak
ada orang yang akan mendapat skor dan itu tidak terukur dengan baik. Artinya hal tersebut akan
menghasilkan error standar yang besar. Jadi reliabilitas itu terkait akurasi dan presisi dan hal ini mirip
dengan konsep error standar di statistika.

Apa yang menyebabkan presisi dan akurasi itu rendah? Mengenai ini bisa diilustrasikan dengan
lompat galah. Misalnya ada tiga orang secara berurutan memiliki kemampuan melompat dari tinggi ke
rendah. Mereka bertiga mengikuti lomba galah dengan tingkat ketinggian yang berurutan dari yang
terendah sampai yang tertinggi. Dari ilustrasi tersebut mirip dengan analogi error standar sebelumnya.
Bahwa tidak ada informasi yang didapatkan, ketikanya sama-sama gagal dan juga sama-sama berhasil
sehingga presisi yang dihasilkan pada tes tersebut rendah.

Tes yang menghasilkan presisi yang rendah adalah karena ada informasi. Jadi ketika urutan
paling awal dari ketiga orang tersebut gagal itu karena ada informasii dan variasi juga pada urutan
setelahnya dan urutan seterusnya ada informasi yang akhirnya dicapai bitline, tapi ada variasi pada urutan
ditengah karena itulah menyebabkan presisi menjadi tinggi (karena ada informasi disana). Konsep-konsep
reliabilitas bisa juga dilihat sebagi akurasi atau presisi skor.

B. POIN-POIN UNTUK DIDISKUSIKAN


1. Ingat rumusnya (rumus reliabilitas)

rxx’
X
Skor yang dihasilkan  Skor diwaktu lain
 Skor dalam bentuk lain
 Skor antar bagiannya
Rumus reliabilitas dan validitas itu berbeda. Banyak orang masih salah dalam membedakannya,
kalau rumus reliabilitas adalah dengan dirinya sendiri, sedangkan validitas adalah dari orang lain.
rit korelasi butir total termasuk dari reliabilitas atau validitas? Jadi rit (item total) lebih berkaitan atau
mendekati dengan koefisien validitas. Maka dari itu ketika ada yang mengatakan validitasnya adalah 0,3
yang terlihat dari korelasi item totalnya 0,3 tersebut dapat dikatakan adalah pemahaman yang kurang
tepat. Karena ketika ritnya itu tinggi maka akan meningkatkan reliabilitas akan tetapi belum tentu
validitasnya.

2. Jangan hanya tinggi, tapi juga siapa sampelnya (apa karakteristiknya)


Karena reliabilitas adalah konsep yang bergantung pada populasi. Reliabilitas hanya dapat
dimaknai jika diinterpretasikan dalam hal perbedaan individu dalam populasi tertentu.
Ketika dari hasil penelitian ke penelitian yang lain, oleh karena itu agar reliabilitas diawal itu stabil maka
ketika diterapkan di SPSS itu harus sampel yang mungkin besar, karakteristiknya itu hiterogen dan
sebagainya. Karena jika hanya tinggi itu empat orangpun bisa tinggi karena orang itu jawabannya
konsisten seperti hanya memilih ya, ya, ya… atau setuju, setuju, setuju… sehingga didapatkan misalnya
0.98 itu perlu di validasi dengan yang diinformasikan seperti sampelnya itu besar, setimasinya benar,
kemudian ada informasi yang seperti apa, erroe standarnya seperti dsb. Jadi, jangan hanya tinggi tapi juga
laporkan siapa sampelnya.
Supaya reliabilitas yang didapatkan stabil antar sampel, maka upayakan reliabilitas ditarik dari
sampel dengan karakteristik yang heterogen. Dalam pelaporan reliabilitas perlu melaporkan karakteristik
sampel yang ditarik ketika reliabilitas hasil pengukuran di estimasi.
3. Reliabilitas bukan untuk tes, tapi untuk skor

Reliabilitas adalah properti dari skor bukan tes. Reliabilitas juga adalah ukuran yang menunjukkan
seberapa besar skor yang dihasilkan terbebas dari error pengukuran yang bersifat acak. Karena error yang
bersifat sistematis itu berkaitan dengan validitas.

Ada Beberapa Alternatif Terminologi

 Reliabilitas skor
 Reliailitas hasil pengukuran
 Reliabilitas informasi
 Reliabilitas pengukuran
4. Setiap koefisien reliabilitas punya asumsi

Setiap koefisien reliabilitas dikembangkan berdasarkan asumsi. Asumsi ini berkaitan dengan
dengan bagaimana hubungan antara satu bagian tes dengan bagian lainnya. Bagian ini bisa berupa butir
atau kumpulan butir. Asumsi mengenai hubungan ini akan menentukan koefisien reliabilitas yang akan
tepat untuk dipakai dalam laporan.

Jadi reliabilitas berdasarkan asumsi pada karakteristik dari belahan-belahan yang ada. Jika
belahannya sama, misal pada bagian 1 terdapat 5 butir, bagian 2 terdapat 3 butir dan bagian 3 terdapat 2
butir berarti asumsi yang berlaku adalah asumsi ekuivalen atau asumsi kongenerik.
Jenis Asumsi Teori Skor Murni Klasik

PARALEL M1 = M2 │ E1 ≠ E2
TAU EKIVALEN M1 = M2 │ E1 ≠ E2
TAU EKIVALEN M1 = C+ M2│ E1≠ E2
ESENSIAL
KONJENERIK M1 = M2 │ E1 ≠ E2

Skala 1 Skala 2
1. Saya tidak nyenyak tidur Saya cakep
2. Saya memiliki keinginan untuk minggat Saya ganteng
3. Saya tidak berselera untuk makan Saya menawan

 Sebuah tes itu PARALEL ketika M1 dari belahan 1, belahan 2 dan belahan 3 itu sama. Dan error
juga diasumsikan sama sehingga kita bisa mengkorelasikan.
 TAU EKIVALEN asumsinya adalah ketika errornya berbeda tap M1 sama.
 TAU EKIVALEN ESENSIAL ketika ada satu konstan, misalkan belahan 1 itu 5, belahan 2 itu 2,
dan belahan selanjutnya 3, maka konstan terus penambahannya.

Saya memperhatikan kebutuhan orang lain Rendah


Saya suka menyapa orang lain Peningkatan
Saya meluangkan waktu untuk orang lain intensitas
Saya meluangkan waktu untuk orang lain
Saya sering membantu orang lain
Saya merasakan kebahagiaan orang lain
Tinggi
Sangat menyenangkan jika bisa membuat orang lain bahagia

Dalam pengembangan SKALA THURSTONE, pengembangan harus memiliki butir-butir yang


memiliki peningkatan level. Contoh diatas menunjukkan peningkatan intensitas konstruk kepedulian
sosial. Mulai dari yang paling rendah intensitasnya (memperhatikan) hingga yang tinggi (membahagiakan
orang lain).

Simalakama Validitas & Reliabilitas

Validitas dan reliabilitas menjadi sebuah simalakama (trade off). Konsistensi internal yang tinggi
dapat dicapai dengan memperbesar korelasi antar butir (redundant items). Namun disatu sisi konsistensi
internal yang tinggi akan mengorbankan konten yang membuat domain menjadi sangat narrow.

Reliabilitas Tinggi Tak Selalu Undimensi

Reliabilitas (homogenitas butir/konsistensi internal) akan cenderung besar ketika ukuran tes
sangat panjang. Hasil penelitian menunjukkan bahwa meskipun sebuah tes mengukur lebih dari satu
dimensi(multidimensi) koefisien alpha yang dihasilkan dari skor tes tersebut bisa sangat tinggi.
Sumber informasi mengestimasi reliabilitas ada 2;

 Kovarian/korelasi yaitu Alpha, Guttmen, Feldt, SB


 Bobot faktor yaitu Omega, Theta, Komposit

Reliabilitas Pengukuran Multidimensi

Penyebab pengukuran di psikologi cenderung multidimensi karena:

 Karakteristik konstruk psikologi yang cenderung luas dan berjenjang ada level 1, level 2
contohnya CHC
 Terkadang proses dekomposit konstruk menjadi aspek satu komponen
 Pengembangan skala dengan ukuran yang panjang
 Adanya artifak dalam pengembangan alat ukur

Koefisien Reliabilitas Multidimensi

 Koefisien alpha berstata (stratified alpha)


 Koefisen reliabilitas skor komposit mosier
 Koefisien omega (McDonald)
 Koefisien reliabilitas skor komposit Raykov
 Koefisien reliabilitas konstruk (construct reliability)

C. SESI TANYA JAWAB


1. Apakah benar reliabilitas yang baik untuk penelitian sosial termasuk psikologi adalah 0.7-0.8?
Jika 0.9 atau mendekati 1 itu tidak baik, bagaimana penjelasan logis atas argumen ini? Jika kita
menemukan reliabilitas alat ukur yang tergolong sama tinggi mendekati 1 apa yang perlu
dilakukan?
2. Apakah reliabilitas hanya diestimasi saat uji coba saja atau perlu juga saat sudah mengambil data
penelitian? Jika kita sudah mengambil data penelitian kemuadian ada item yang gugur lagi
apakah item itu harus dibuang atau tidak usah digugurkan sepanjang reliabilitasnya adalah 0.7?
3. Mengacu penjelasan dari pemateri 2 untuk melihat validitas sebaiknya melihat korelasi item
dengan skor total atau item corected corelation?
4. Untuk reliabilitas alat ukur multidimensiona jika menggunakan krom bava yang dilaporkan
adalah reliabilitas terdomainnya atau reliabilitas secara keseluruhan atau bisa jadi kedua-duanya
harus dilaporkan?

JAWABAN:

1. Kalau mendekati 1 ya lebih baik, tapi dalam beberapa literatur justru ada yang menghapus item
dengan korelasi antar item itu yang diatas 0.7 kalau tidak salah bukunya Klain. Jadi koefisien
antar item disarankan jangan sampai diatas 0.7 karena itu menunjukkan retedensi sehingga
tergantung dari masing-masing. Kalau reliabilitas yang tinggi itu mungkin kita libatkan sebagai
pengujian, apakah jawaban terhadap 2 item itu konsisten atau tidak. Tapi dalam beberapa
keperluan mungkin item-item yang redundant itu lebih ke valid ke domain ukurnya, otomatis
yang dikorbankann reliabilitasnya. Jadi semakin mengecil karena justru yang diatas 0,7 itu
dikeluarkan.
2. Jika reliabilitas kita itu diestimasi dari sampel yang hiterogen itu berarti skornya mendekati true.
Ketika itu sudah kuat basisnya maka saat dipakaii lagi ternyata reliabilitasnya itu rendah yang
awalnya 0.8 misalnya, menjadi 0.6. Maka berarti datanya ada yang kurangg pas bukan karena alat
ukurnya yang salah. Sehingga lebih kearah datanya. Kesimpulan itu bisa terjadi ketika reliabilitas
kita dibangun oleh data yang kuat.
3. Korelasi item total itu mendekati rxx dari pada rxy, jadii lebih mendekati ke reliabilitas dari pada
ke validitas. Karena skor total itu representasinya dari x’ bukan y, sehingga ketika mengatakan
korelasi item total atau daya diskriminasi itu menunjukkan daya efisien validitas maka itu adalah
hal yg keliru.
4. Bisa setiap dimensinya atau jika dijadikan satu bisa jadi reliabilitas scor composite (dibuku
Prof.Azwar) yang diperkenalkan reliabilitas koefisiennya mosier. Selain koefisien mosier ada
beberapa koefisien lain seperti koefisien alpha berstarta. Koefisien alpha tapi jika diterapkan pada
data yang bersifat multidimensi jika itu adalah dimensi-dimensi yang bisa dijumlahkan maka
reliabilitasnya bisa jadii reliabilitas score composite. Tapi kalau dimensi-dimensi itu tidak bisa
dijumlahkan maka satu dimensi itu ada satu koefisien reliabilitas. Jadi satu dimensi satu faktor itu
reliabilitasnya sendiri-sendiri. Tapi terdapat konsekuensi jika sendiri. Namun ketika itu dimensi-
dimensi yang bisa dijumlahkan maka itu bisa dikompositkan dengan reliabilitas mosier.

D. KESIMPULAN
Sebelumnya terdapat banyak salah kaprah dalam penelitian di psikologi seperti terdapat
banyak jurnal yang membahas tentang pengukuran kepribadian dan sebagian dalam laporannya
itu menyebutkan bahwa korelasi item total itu merupakan validitas. Jadi melalui diskusi
pembahasan ini telah dikonfirmasi bahwa korelasi item total atau yang dikenal dengan daya
diskriminasi itu bukanlah validitas.
Melalui forum diskusi ini juga banyak hal-hal yang dapat dikonfirmasi termasuk
mengenai isu reliabilitas tes atau reliabilitas hasil tes yang menjadi banyak perdebatan yang tidak
berujung. Padahal ketika itu dipahami sebagai reliabilitas tes maka muncullah banyak pendapat-
pendapat yang bisa dikonfirmasi. Maka dapat disimpulkan apabila kita menggunakan alat tes
yang sudah ada dan sudah pernah diuji maka tidak perlu lagi untuk diuji reliabilitasnya.
Kemudian juga konfirmasi mengenai item total adalah validitas melalui diskusi ini bisa
menjadi perhatian bersama. Dan yang terakhir sebagian dari kita kita itu mendengar reliabilitas =
alpha cronbach dan hal ini seperti tidak ada pilihan lain, padahal ternyata untuk menggunakan
pendekatan mana yang akan digunakan juga adalah hal yang harus dipertimbangkan.

Anda mungkin juga menyukai