“RELIABILITAS LANJUTAN”
Disusun Oleh
Kelompok 9
Dosen Pengampu:
2022 M / 1443 H
KATA PENGANTAR
Assalamu’alaikum Warahmatullahi Wabarakatuh
Segala puji bagi Allah SWT yang telah memberikan pertolongan dan kemudahan sehingga
kami mampu menyelesaikan makalah serta yang berjudul “Reliabilitas Lanjutan” ini dengan
tepat waktu. Shalawat serta salam semoga terlimpah curahkan kepada Nabi Muhammad SAW,
keluarga, dan sahabatnya hingga akhir zaman.
Makalah ini disusun untuk memenuhi tugas dari Bapak Dr. Reza Fahmi S.sos, MA dan Ibu
Nerhamidah S.Psi. M.Psi. Pada mata kuliah Psikometri untuk menambah pengetahuan penulis
dan pembaca tentang Reliabel lebih lanjut lagi, yang dimana di dalamnya memuat tentang
definisi, fungsi skor, asumsi dan hubungan pengukuran dengan skor murni.
Kami mengucapkan terima kasih kepada Bapak Dr. Reza Fahmi S.sos, MA dan Ibu
Nerhamidah S.Psi. M.Psi. atas arahan dan bimbingannya sehingga kami dapat menyelesaikan
tugas ini dengan baik. Kami menyadari bahwa makalah ini masih jauh dari kata sempurna,
dengan begitu kami mengharapkan kritik serta saran untuk perbaikan makalah agar makalah
dapat lebih baik lagi kedepannya. Semoga makalah ini dapat memberikan manfaat buat kita
semua. Akhirul kalam atas segala kesalahan kami mohon maaf, terima kasih.
Pemakalah
I
DAFTAR ISI
KATA PENGANTAR...................................................................................................................
DAFTAR ISI.................................................................................................................................II
BAB I PENDAHULUAN..............................................................................................................1
A. Latar Belakang...................................................................................................................1
B. Rumusan Masalah...............................................................................................................1
C. Tujuan Masalah..................................................................................................................2
BAB II PEMBAHASAN...............................................................................................................3
A. Definisi Reliabilitas............................................................................................................3
D. Metode-Metode Estimasi....................................................................................................8
A. Kesimpulan.......................................................................................................................17
B. Penutup.............................................................................................................................17
DAFTAR PUSTAKA
II
BAB I
PENDAHULUAN
A. Latar Belakang
Dalam mengumpulkan data sebuah penelitian dengan apa pun caranya, maka akan selalu
memerlukan alat atau disebut juga dengan instrumen penelitian. Penentuan alat atau
instrumen penelitian yang digunakan tergantung dari jenis dan tujuan penelitian. Jika sudah
dilakukan penentuan pada instrumen penentuan maka diperlukan kereliabelan alat ukur yang
digunakan. Dimana instrumen dalam mengukur suatu atribut psikologis haruslah reliabel dan
tingkat kereliabelan dalam pengukuran sangatlah penting dan diperlukan. Hal ini agar tidak
terjadi bias atau keambiguan dalam mengukur suatu konstruk atau atribut penelitian. Selain
itu pengukuran pada suatu penelitian yang tidak reliabel bisa saja bertentangan dengan
kelaziman.
Reliabilitas sendiri merupakan suatu instrumen yang jika digunakan beberapa kali untuk
mengukur objek yang sama akan menghasilkan data yang sama. Ini menunjukkan sejauh
mana konsistensi hasil suatu pengukuran. Suatu kuisioner dapat dikatakan reliabel apabila
jawaban dari kuisioner tersebut konsisten atau stabil dari waktu ke waktu. Jadi, hasil
instrumen dari suatu penelitian itu harus memiliki reliabilitas yang tinggi. Jika instrumen
penelitian yang digunakan memiliki reliabilitas yang rendah maka kesimpulan dari
pengukuran atau pengujian tersebut tidak tepat.
Reliabel ialah syarat yang mutlak untuk mendapatkan hasil penelitian yang terhindar dari
bias. Tetapi, hal ini masih dipengaruhi oleh kondisi objek yang diteliti serta kemampuan
peneliti dalam menggunakan instrumen pada saat pengumpulan data. Jadi, reliabilitas ini
merujuk pada ketetapan pengukuran pada suatu pengujian. Reliabilitas ialah syarat yang
sangat diperlukan, reliabilitas yang rendah dianggap membatasi nilai validitas yang diperoleh.
B. Rumusan Masalah
a. Apa yang dimaksud dengan reliabilitas?
b. Apa fungsi skor dalam reliabilitas?
c. Bagaimana asumsi dan hubungan pengukuran dengan skor murni?
d. Apa saja metode-metode estimasi?
e. Apa saja teknik pengukuran reliabilitas?
1
C. Tujuan Masalah
a. Untuk mengetahui apa itu reliabilitas.
b. Untuk mengetahui fungsi skor dalam reliabilitas.
c. Untuk mengetahui asumsi dan hubungan pengukuran dengan skor murni.
d. Untuk mengetahui metode-metode estimasi.
e. Untuk mengetahui teknik pengukuran reliabilitas.
2
BAB II
PEMBAHASAN
A. Definisi Reliabilitas
Reliabilitas berasal dari bahasa inggris yaitu reability atau reliable yang artinya dapat
dipercaya. Menurut Sukadji (2000) reliabilitas merupakan seberapa besar tingkat
kekonsistenan pengukuran pada suatu penelitian. Menurut Nursalam (2003), reliabilitas ialah
kesamaan pada hasil pengukuran atau pengamatan dari suatu fakta atau kenyataan hidup yang
telah diukur secara berulang dalam waktu yang berbeda.
Sedangkan menurut Sugiyono, reliabilitas ialah serangkaian pengukuran atau alat ukur
yang mempunyai konsistensi apabila pengukuran yang dilakukan secara berulang dengan
menggunakan alat ukur. Reliabilitas tes adalah tingkat konsistensi terhadap suatu tes yaitu
sejauh mana tes dapat dipercaya untuk menghasilkan skor konsisten yang relatif tidak
berubah walaupun diuji atau diteskan pada situasi yang berbeda. Azwar (2011) juga
berpendapat bahwa reliabilitas berasal dari kata reability yang artinya sejauh mana hasil
pengkuran mempunyai keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, yang
bisa dipercaya. Hasil ukur bisa dipercaya apabila dilakukan beberapa kali pengukuran pada
suatu subjek yang sama tetap memperoleh hasil yang relatif sama. Allen dan Yen (1979)
menyatakan bahwa suatu tes dapat dikatakan reliabel apabila skor-skor yang diperoleh dari
suatu instrumen memiliki tinggi nilai atau skor yang sebenarnya dimiliki oleh subjek
penelitian.
Reliabilitas tes adalah proporsi variabilitas skor tes yang disebabkan oleh perbedaan
yang sebenarnya di antara individu. Koefisien reliabilitas yang diperoleh dari perhitungan
skor-tampak yang merupakan suatu estimasi terhadap tingginya reliabilitas tes, sedangkan
besarnya reliabilitas yang sesungguhnya tidak dapat diketahui. Secara teoritik koefisien,
reliabilitas berkisar antara antar 0 sampai 1. Akan tetapi secara empirik koefisien reliabilitas
tes yang mencapai angka 1,0 tidak pernah dijumpai.
3
B. Fungsi Skor dalam Reliabilitas
Angka yang diperoleh sebagai hasil dari suatu prosedur pengukuran yang mengggunakan
tes atau skala disebur skor (score). Skor individual (yang diberikan pada responden atas
jawabannya) pada suatu tes atau pengukuran diberi simbol huruf misalnya huruf X, huruf Y,
huruf X’, huruf Y’, dan semacamnya.
Ada beberapa macam fungsi skor dalam reliabilitas antara lain, yaitu:
4
C. Asumsi dan Hubungan Pengukuran dengan Skor Murni
Performans individual pada suatu tes psikologi dinyatakan dalm bentuk kuantitatif yang
disebut skor (score). Skor tidak lain daripada harga suatu jawaban terhadap pertanyaan dalam
tes. Skor ini merupakan skor perolehan (obtained scores atau disebut juga observed scores)
yang selanjutnya disebut skor-tampak dan diberi simbol huruf X.
Skor-tampak X yang diperoleh seseorang pada suatu tes yang mengukur kecerdasan
misalnya, belum tentu mencerminkan tingkat kecerdasan orang tersebut yang sesungguhnya.
Skor yang menunjukkan tingkat kecerdasan sesungguhnya merupakan angka performans
yang murni dan tidak pernah dapat diketahui besarnya oleh karena tidak dapat diungkap
secara langsung oleh tes. Karena itu, selain memiliki skor-tampak, secara teoritik setiap
individu yang menjawab soal tes memiliki pula suatu skor sesungguhnya (true-scores) yang
selanjutnya disebut sebagai skor-murni dan sdilambangkan oleh huruf T.
Karena skor-tampak belum tentu sama besar dengan skor-murni maka terdapat selisih
antara keduanya yang disebut eror pengukuran (measurement error) yang besarnya bagi
setiap subjek dalam setiap tes juga tidak dapat diketahui secara langsung. Eror pengukuran
disimbolkan dengan huruf E.
Dalam Teori Skor-Murni Klasik, eror dalam pengukuran adalah penyimpangan skor-
tampak dari skor harapan teoritik yang terjadi secara acakk (random) atau terjadi tidak secara
sistematik, sedangkan penyimpangan yang terjadi secara sistematik tidaklah dianggap sebagai
sumber eror.
Hubungan di antara ketiga komponen skor tersebut dapat digambarkan sebagai suatu
hubungan aditif, yaitu X = T+E. Bahwasanya skor yang langsung diperoleh dari pengukuran
(X) bukan angka sebenarnya dari suatu atribut, melainkan terdiri dari skor murni (T) yang
tidak pernah diketahui secara langsung dan skor E yang juga tidak dapat diketahui dengan
tepat.
Hubungan antara eror pengukuran (E) dan skor murni (T) diuraikan oleh Allen & Yen
(1979) dalam beberapa asumsi berikut :
1.
Contoh : Si A dites IQ. Memperoleh skor murni (T) 104 , skor tampak X 110, maka hasil
pengukurannya mengandung E = +6 .
5
Jadi besarnya skor tampak X akan tergantung antara lain pada besarnya eror pengukuran
E, sedangkan besarnya skor murni T bagi setiap individu pada setiap pengulangan
pengukuran yang sama diasumsikan sebagai tetap.
2.
Asumsi ini menyatakan bahwa skor murni T merupakan nilai harapan X (expected value
of X) yaitu έ(X). Jadi T merupakan harga rata-rata dari distribusi teoritik skor X apabila orang
yang sama dikenai tes yang sama berulang kali dengan asumsi pengulangan tes ini dilakukan
tidak terbatas banyaknya sedangkan setiap pengulangan tes adalah independen satu sama lain.
Karena besar skor murni diasumsikan tetap dalam setiap pengukuran, maka besar
varians skor tampak akan tergantung pada variasi eror pengukuran.
3.
Asumsi ini menyatakan bahwa bagi suatu kelompok populasi subjek yang dikenai tes
distribusi eror pengukuran E dan distribusi skor murni T tidak berkorelasi satu sama lain.
Korelasi antara eror pengukuran dan skor murni adalah nol. Variasi eror tidak tegantung pada
variasi skor murni.
4.
Asumsi ini menyatakan bahwa bila E1 dan E2 tidak berkorelasi satu sama lain. Artinya
besarnya eror pada suatu tes tidak tergantung pada eror pada tes lain.
5.
Asumsi ini menyatakan bahwa eor pada suatu tes tidak berkorelasi dengan skor murni
pada tes lain. Artinya, eror pada suatu tes tidak tergantung pada skor murni di tes lain.
Allen & Yen (1979) menguraikan enam cara untuk menginterpretasikan koefisien
reliabilitas tes :
Interpretasi 1
6
Interpretasi mengatakan bahwa realibilitas tes ditentukan oleh sejauh mana distribusi skor
tampak pada suatu tes yang pararel berkorelasi
Interpretasi 2
Pxx² = besarnya proporsi varians yang dijelaskan oleh hubungan liniernya dengan X
Interpretasi mengatakan bahwa besarnya kuadrat koefisien realibilitas dapat diartikan seabagi
besarnya proporsi varians suata tes yang dapat dijelaskan oleh variasi skor pada tes lain yang
pararel dengannya.
Interpretasi 3
Bahwa koefisien relibilitas merupakan perbandingan antara varians skor murni dan varians
skor tampak pada suatu tes
Interpretasi 4
Pxx = Pxt²
Koefisien relibilitas merupakan kuadrat koefisien korelasi antara skor tampak dan skor murni,
ada fakta bahwa koefisien korelasi antara skor suatu tes dengan skor pada tes atau variabel
lain tidak akan lebih tinggi dari pada koefisien korelasi skor tampak tes itu dengan skor
murninya sendiri.
Interpretasi 5
Pxx = 1 ~ Pxe²
Bahwa koefisien relibilitas adalah sama dengan datu dikurangi oleh kuadrat koefisien
korelasi antara skor-tampak dengan eror pengukuran. Semakin besar korelasi antara skor
tampak dan eror pengukuran, akan semakin kecil koefisien realibitasnya.
Interpretasi 6
7
όx² mempunyai pengaruh penting terhadap koefisien relibilitas. Dibawah asumsi varians eror
tetap, tinggi rendahnya koefisien relibilitas akan tergantung pada besar kecilnya varians skor
tampak dari kelompok subjek yang bersangkutan.
D. Metode-Metode Estimasi
Tujuan dari reliabilitas ialah untuk menunjukkan konsistensi skor-skor yang diberikan
skorer satu dengan skorern yang lainnya. Namun reliabilitas alat ukur juga menunjukkan
derajat kekeliruan pengukuran yang tidak dapat ditentukan dengan pasti melainkan hanya
bisa di estimasi (Suryabrata: 2000). Estimasi reliabilitas alat ukur dapat dicapai dengan
menggunakan tiga metode. Ketiga metode tersebut ialah metode test-retest atau tes ulang,
alternate-forms atau tes paralel, dan split half atau konsistensi internal (Guilford, 1954;
Thorndike, 1997; Azwar, 2000; Suryabrata, 2000).
1. Tes-Ulang (Test-Retest)
Metode tes-ulang dilakukan dengan menyajikan satu tes pada satu kelompok subjek
dua kali dengan tenggang waktu yang cukup diantara kedua penyajian tersebut. Jadi,
dalam hal ini alat ukurnya sama, respondennya sama, dalam waktu yang berbeda.
Reliabilitas diukur dari koefisien korelasi antara percobaan pertama dengan yang
berikutnya. Bila koefisien korelasi positif dan signifikan, maka instrumen tersebut sudah
dinyatakan reliabel.
Metode ini merupakan perhitungan yang paling baik untuk mengetahui penyebab
timbulnya kesalahan yang berkaitan dengan waktu. Pada teknik ini kita memberikan
pertanyaan/kuesioner kepada responden yang sama dan waktu berbeda dengan
menggunakan kalimat yang sama. Misalnya: Pada minggu I ditanyakan: Bagaimana
tanggapan saudara terhadap kualitas dosen di Universitas Persada Indonesia?. Pada
minggu III ditanyakan: Ditanyakan lagi pada responden yang sama dengan pertanyaan
yang sama.
Oleh karena itu, metode tes-ulang lebih cocok untuk digunakan sebagai prosedur
estimasi reliabilitas bagi skor tes yang mengukur aspek psikologis yang relatif stabil dan
tidak mudah berubah.
8
2. Bentuk-Paralel (Alternate-Forms)
Dalam metode bentuk-paralel, tes yang akan diestimasi reliabilitasnya harus tersedia
paralelnya, yaitu tes lain yang sama tujuan ukurnya dan setara isi aitemnya baik secara
kualitas maupun kuantitasnya. Dengan bahasa sederhana dapat dikatakan bahwa harus
tersedia dua tes yang kembar. Metode bentuk-paralel dilakukan dengan cara memberikan
sekaligus dua bentuk tes yang paralel satu-sama lain, kepada sekelompok subjek.
Dalam pelaksanaannya, bila aitem dalam tes tidak sangat banyak, kedua tes yang
paralel tersebut dapat digabungkan terlebih dahulu sehingga seakan-akan merupakan
satu bentuk tes. Setelah seluruh tes selesai dikerjakan oleh subjek barulah masing-masing
aitem dipisahkan dan dikembalikan pada tes semula untuk diperiksa dan diberi skor,
sehingga diperoleh dua distribusi skor. Keuntungan penggabungan ini adalah tidak
terkesannya beban mengerjakan dua tes bagi subjek dan bila urutan nomor aitem
gabungan itu diletakkan sedemikian rupa dapat mengurangi efek carry-over dari satu
bentuk ke bentuk tes yang lain. Kalau penggabungan kedua tes tidak dimungkinkan
karena masing-masing tes itu sendiri sudah panjang (berisi banyak aitem) maka kedua
tes tersebut hendaknya diberikan berturut-turut dengan tenggang waktu yang singkat.
Dalam pendekatan konsistensi internal data skor diperoleh melalui prosedur yang
menggunakan satu bentuk tes yang dikenakan hanya sekali saja pada satu kelompok
subjek (single-trial administration / penyajian tunggal), sehingga metode ini mempunyai
nilai praktis dan efisiensi yang tinggi dibandingkan prosedur tes-ulang dan bentuk
paralel.
Metode ini bertujuan untuk melihat konsistensi antar-aitem atau antar-bagian dalam
tes, sehingga komputasi koefisien reliabilitas dilakukan bukan terhadap skor tes tapi
terhadap skor aitem dalam tes atau terhadap skor bagian-bagian tes. Untuk itu, item-
aitem dipisahkan menjadi paling tidak dua kelompok. Pengelompokan itu disebut sebagai
pembelahan dan setiap kelompok disebut sebagai bagian atau belahan tes.
9
Tes yang akan diestimasi reliabilitasnya dapat dibelah menjadi dua bagian, tiga,
empat, bahkan dapat dibelah menjadi belahan-belahan yang jumlahnya sebanyak jumlah
aitemnya sehingga setiap belahan berisi hanya satu aitem saja. Bila suatu tes dibelah
menjadi belahan-belahan yang masing-masing berisi lebih daripada satu aitem saja,
adalah sangat penting untuk menjadikan banyaknya aitem dalam masing-masing belahan
sama sehingga kesemua belahan itu seimbang. Keseimbangan belahan-belahan itu tidak
saja menyangkut banyaknya aitem akan tetapi hendaknya juga meliputi aspek isi dan
karakteristik aitem-aitemnya.
Membelah suatu tes menjadi beberapa bagian yang setara parameter dan isi,
maksudnya adalah mengusahakan agar antara belahan yang satu dengan yang lain
memiliki jumlah aitem yang sama banyak, taraf kesukaran yang seimbang, isi yang
sebanding, dan sedapat mungkin memenuhi ciri-ciri paralel sebagaimana yang telah
dikemukakan terdahulu. Walaupun tersedia rumusan guna mengestimasi reliabilitas tes
yang belahannya tidak paralel akan tetapi estimasi terhadap bagian-bagian yang paralel
itu akan lebih meyakinkan bahwa hasil estimasi yang diperoleh mendekati harga
reliabilitas yang sesungguhnya, bukan merupakan underestimasi (estimasi yang terlalu
rendah) bukan pula overestimasi (estimasi yang terlalu tinggi).
Membelah tes menjadi dua atau tiga bagian secara random dilakukan dengan
undian sederhana terhadap aitem dalam tes guna menentukan aitem-aitem nomor
berapa sajakah yang dimasukkan ke dalam kelompok atau belahan pertama dan
mana yang diikutkan ke dalam belahan ke dua atau ke tiga.
Pembelahan tes secara random hanya boleh dilakukan bila tes yang dibelah
berisi aitem-aitem yang homogen. Pengertian homogen dalam hal ini harus
dipandang dari segi isi (content) dan segi daya diskriminasi, serta dari segi taraf
kesukarannya apabila tes yang bersangkutan mengukur aspek kemampuan. Suatu tes
yang berisi aitem-aitem yang sifatnya heterogen bila dibelah secara random dapat
menghasilkan belahan-belahan yang tidak setara sațu sama lain, kecuali bila tes
tersebut berisi aitem yang berjumlah sangat besar.
10
Bila tes yang akan dibelah terdiri dari beberapa komponen, randomisasi
penempatan aitem ke dalam setiap, belahan harus dilakukan terhadap aitem dalam
setiap komponen masing-masing, bukan terhadap aitem secara keseluruhan sehingga
keseimbangan belahan mencakup juga kesetaraan komponennya.
b) Pembelahan Gasal-Genap
Pembelahan tes dengan cara gasal-genap (odd-even splits) sangat populer dan
tidak sulit dilakukan. Dalam cara ini, seluruh aitem yang bernomor urut gasal
dijadikan satu kelompok menjadi belahan pertama dan seluruh aitem yang bernomor
urut genap dijadikan satu kelompok menjadi belahan kedua. Jadi, belahan pertama
berisi aitem bernomor 1, 3, 5, 7, .. dan seterusnya, sedangkan belahan ke dua berisi
aitem bernomor 2, 4, 6, 8, .. dan seterusnya. Dengan pembelahan secara gasal-genap
diharapkan dapat diperoleh dua bagian tes yang setara dari segi isi dan dari segi taraf
kesukaran aitem-aitemnya.
Untuk tes yang mengukur aspek kemampuan, yang indeks kesukaran aitem dan
koefisien korelasi aitem dengan skor total tesnya telah diketahui, Gulliksen (1950)
mengusulkan suatu cara pembelahan yang disebutnya matched-random subsets.
Dengan cara ini, setiap aitem dalam tes seakan diletakkan pada satu posisi tertentu
atau titik koordinat dalam grafik berdasarkan besamya angka koefisien korelasi
antara aitem yang bersangkutan dengan skor tes (rix) dan indeks kesukaran aitem (p).
11
Dengan melihat posisi aitem pada grafik dapat diketahui bahwa setiap aitem
yang letaknya berdekatan berarti memiliki karakteristik yang relatif sama atau mirip
satu sama lain. Setiap pasangan dua aitem yang posisinya berdekatan lalu diundi
untuk menentukan aitem mana yang akan dimasukkan kedalam belahan pertama dan
mana yang akan diikutkan kedalam belahan ke dua.
Ada beberapa teknik yang dapat digunakan untuk mengukur reliabilitas suatu instrumen
penelitian, tergantung dari skala yang digunakan. Teknik-teknik pengukuran reliabilitas,
antara lain sebagai berikut.
Formula Spearman Brown digunakan pada pembelahan tes yang menghasilkan dua
belahan yang paralel, yang dapat dilakukan dengan pembelahan gasal-genap atau dengan
pembelahan matched-random subsets. Formula ini bisa diterapkam pada instrumen tes yang
skor-skor itemnya dikotomi (skor 0 atau 1) ataupun tidak dikotomi (skor 0 s/d skor 4).
Koefisien reliabilitas diperoleh dari korelasi dua hasil skor dalam kedua belahan yang
terbentuk.
Instrumen penelitian yang reliabilitasnya diuji dengan teknik Spearman Brown adalah
instrumen penelitian yang mempunyai beberapa kriteria, seperti:
a. Pilihan jawaban untuk setiap pertanyaan hanya ada dua jawaban. Misalnya jawaban Ya
diisi dengan nilai 1 dan jawaban Tidak diisi dengan nilai 0.
b. Jumlah instrumen penelitian harus genap, agar dapat dibelah. Antara belahan pertama
dan kedua harus seimbang.
12
Teknik atau rumus ini dapat digunakan untuk menentukan apakah suatu instrumen
penelitian reliabel atau tidak, bila jawaban yang diberikan responden berbentuk skala seperti
1-3, dan 1 -5, serta 1-7 atau jawaban responden yang menginterpretasikan penilaian sikap.
Misalnya responden memberikan jawaban sebagai berikut:
2. Memuaskan (M) =4
3. Netral (N) =3
Kriteria suatu instrumen penelitian dikatakan reliabel dengan menggunakan teknik ini,
bila koefisien reliabilitas (r11) > 0,6.
Formula koefisien alpha untuk estimasi terhadap reliabilitas skor tes yang dibelah
menjadi dua bagian sama panjang, adalah:
3. Formula-Formula Kuder-Richardson
Jika suatu tes mempunyai jumlah item soal yang tidak terlalu banyak dan pemberian
skornya dengan dikotomi, maka pembelahan tes menjadi dua bagian cenderung akan
menghasilkan bagian yang tidak setara. Akan tetapi jika dilakukan pembelahan yang lebh
banyak, akan mengakitbakan jumlah item dalam tiap belahan menjadi sedikit. Hal ini bisa
mengakibatkan estimasi reliabilitasnya menjadi tidak akurat.
Salah satu alternatif yang bisa dilakukan adalah membelah tes menjadi sebanyak item
soal. Jadi setiap belahan hanya memuat satu butir soal saja. Estimasi reliabilitasnya dilakukan
dengan rumus alpha yang telah disesuaikan, dan dikenal dengan nama formula Kudher-
13
Richardson-20 atau KR-20, atau koefisien α-20. Koefisien ini menggambarkan sejauh mana
kesetaraan butir-butir atau item-item dalam suatu instrumen tes.
Instrumen penelitian yang reliabilitasnya diuji dengan teknik Kuder dan Richardson (K-
R 20) adalah instrumen penelitian yang mempunyai beberapa kriteria, yaitu:
a. Pilihan jawaban untuk setiap pertanyaan hanya ada dua jawaban. Misalnya jawaban Ya
diisi dengan nilai 1 dan jawaban Tidak diisi dengan nilai 0.
b. Jumlah instrumen penelitian (pertanyaan) harus ganjil, sehingga tidak bisa dibelah.
c. Kriteria pengujian, jika nilai reliabilitas instrumen (r11) > 0,7 maka instrumen penelitian
dinyatakan reliabel (sahih).
Rumus:
Instrumen penelitian yang reliabilitasnya diuji dengan teknik Kuder dan Richardson (K-
R 21) prinsipnya sama dengan Kuder dan Richardson (K-R 20) bedanya hanya terletak pada
saat mengaplikasikan rumus reliabilitas instrumen, bila pada rumus (K-R 20) menggunakan
variabel p dan q , sedangkan pada rumus (K-R 21) variabel p dan q diganti dengan variabel
(rata-rata skor total).
Rumus:
4. Formula Rulon
Rulon memberikan formula untuk pembelahan tanpa harus berasumsi bahwa kedau
belahan memiliki varians yang sama. Perbedaan skor atau nilai dari kedau hasil pembelahan
tes akan memiliki distribusi perbedaan skor dengan varian. Besarnya akan dpengaruhi oleh
varian eror dari masing-masing belahan. Karena varians eror dari tiap belahan menentukan
varians eror keseluruahan tes, maka varians eror tes bisa diestimasi melalui besarnya
perbedaan skor diantara dua belahan tersebut. Formula Rulon dirumuskan sebagai:
14
Formula Ruon dapat diterapkan pada instrumen tes yang memiliki skor dikotomi.
Koefisien reliabilitas Rulon yang dikenakan pada tes yang sudah dilakukan pembelahan
menjadi dua merupakan estimasi reliabilitas untuk keseluruhan tes.
Jika suatu tes hanya bisa dibelah menjadi dua belahan akan tetapi banyaknya item pada
kedua belahan itu tidak dapat sama maka koefisien alpha tidak dapat lagi digunakan untuk
mengestimasi reliabilitasnya. Hal itu dikarenakan kedua belahan yang terjadi tidak akan
memenuhi asumsi τ-requivalent. Belahan tes yang berisi item dalam jumlah berbeda disebut
belahan yang tidak sama panjang.
Apabila kedua belahan yang dihasilkan tidak mempunyai panjang yang sama atau
mempunyai jumlah item yang berbeda akan tetapi isinya masih homogen, dan data diperoleh
dari subjek penelitian dalam jumlah yang besar, rumus yang diusulkan oleh Feldt untuk
mengestimasi reliabilitasnya adalah sebagai berikut:
Tes yang mempunyai jumlah butir soal atau item tidak genap, tidak bisa dibelah menjadi
dua bagian. Jika dibelah menjadi dua akan menghasilkan dua belahan soal dengan jumlah
butir soal yang tidak sama, sehingga tidak dapat memenuhi asumsi τ-aquivalent. Oleh karena
itu rumusan atau formula alpha tidak dapat diterapkan dalam hal ini. Salah satu alternatif
solusinya adalah membelah soal menjadi tiga bagian apabila soal tersebut memiliki jumlah
item soal yang banyak. Asalkan soal berisi item-item yang homgen. Perhitungan untuk
15
mendapatkan koefisien korelasinya berdasarkan pada estimasi skor yang ditemukan oleh
Kristof, yaitu:
Kristof menunjukkan bahwa mengsetimasi varians skor murni tes dapat dilakukan
dengan cara memperhitungkan kovarians antar ketiga belahan tes tanpa perlu
mempertimbangkan besarnya varians masing-masing. Untuk perhitungan koefisien
reliabilitasnya, digunakan rumusan dasar reliabilitas yaitu:
7. Formula Hoyt
Tes yang berisi aitem dalam jumlah tidak banyak atau tes yang tidak dapat dibelah
dua atau belah tiga dengan sama panjang, akan tidak sesuai bila diestimasi reliabilitas hasil
ukurnya oleh formula-formula sebelumnya. Dalam kondisi demikian, formula Hoyt (1941)
yang didasarkan pada desain analisis varians (anova) dua-jalan menjadi solusi yang tepat.
Konsep estimasi reliabilitas pengukuran dalam pendekatan analisis varians Hoyt adalah
memandang distribusi aitem-aitem keseluruhan subjek sebagai data pada suatu desain
eksperimen faktorial dua-jalan tanpa replikasi, yang dikenal pula sebagai item by subject
design. Setiap aitem dianggap seakan bagian dari suatu treatment atau perlakuan yang
berbeda sehingga setiap kali subjek dihadapkan pada suatu aitem seakan-akan ia berada pada
suatu perlakuan. Dalam hal ini banyaknya aitem merupakan banyaknya perlakuan sehiingga
dapat dikatakan bahwa desain ini membelah tes menjadi belahan sebanyak jumlah aitem-
aitemnya. Maka dirumuskan koefisien reliabilitas Hoyt sebagai:
16
BAB III
PENUTUP
A. Kesimpulan
Reliabilitas adalah tingkat konsistensi skor yang dicapai oleh orang yang sama dengan tes
yang sama namun pada waktu yang berbeda. Atau konsistensi skor juga dapat diperoleh
dengan pertanyaan yang berbeda namun memiliki aspek yang sama kesamaan dari berbagai
aspek. Angka yang diperoleh sebagai hasil dari suatu prosedur pengukuran yang
mengggunakan tes atau skala disebur skor (score). Ada beberapa fungsi skor dalam
reliabilitas diantaranya: untuk mengukur stabilitas, untuk mengukur stabilitas dan ekivalen,
untuk mengukur kesulitan internal, reliabilitas terwakili, dan reliabilitas seimbang.
Skor yang langsung diperoleh dari pengukuran (X) bukan angka sebenarnya suatu
atribut, melainkan terdiri dari skor murni (T) yang tidak pernah diketahui secara langsung dan
skor E yang juga tidak dapat diketahui dengan tepat. Hubungan di antara ketiga komponen
skor tersebut dapat digambarkan sebagai suatu hubungan aditif, yaitu X = T+E. Adapun 5
asumsi terkait hubungan antara skor murni (T) dan eror pengukuran (E).
Reliabilitas alat ukur juga menunjukkan derajat kekeliruan pengukuran yang tidak dapat
ditentukan dengan pasti melainkan hanya bisa di estimasi. Terdapat tiga metode estimasi
yaitu, metode test-retest atau tes ulang, alternate-forms atau tes paralel, dan split half atau
konsistensi internal. Adapun teknik pengukuran reliabilitas yaitu dengan formula Spearman-
Brown, formula Alpha Cronbach, formula-formula Kuder-Richardson, formula Rulon,
formula belah-dua dengan panjang berbeda, formula Kristof untuk belah-tiga, dan formula
Hoyt.
B. Penutup
Semoga dengan makalah ini dapat menambah pengetahuan pembaca tentang Reliabilitas
dan bermanfaat bagi kehidupan pembaca sehari-hari. Namun di sini kami menyadari bahwa
makalah ini masih jauh dari kata sempurna, oleh sebab itu kami mohon maaf atas kesalahan
yang terdapat dalam makalah ini. Untuk itu kami membutuhkan kritik dan saran dari
pembaca agar kami dapat memperbaiki kesalahan yang terdapat dalam makalah ini
kedepannya.
17
DAFTAR PUSTAKA
Allen, M.J., & Yen. IM. (1979). Introduction to Moesuremont Theory. Califomia: Brooks,
Cole Publishing Company.
Azwar, Saifuddin. (2003). Sikap Manusia Teori dan Pengukurannya. Yogyakarta: Pustaka
Pelajar.
Azwar, Saifuddin. (2019). Reliabilitas dan Validitas Edisi 4. Yogyakarta: Pustaka Pelajar.
https://559840/mod_folder/content/0/PERTEMUAN%25204%2520RELIABILITAS
%2520INSTRUMEN%2520PENELITIAN.pdf diakses pada 15 Mei 2022