RELIABILITAS
Disusun Oleh:
NIM: S032302021
SURAKARTA
2023
BAB I
PENDAHULUAN
A. Latar Belakang
Salah satu aspek positif kemajuan dari dunia penelitian yang ada di Indonesia, adalah
muncul banyaknya para peneliti-peneliti muda yang kini lebih kritis lagi dalam meneliti
objek-objek yang ada. Di Indonesia, banyak sekali para peneliti ataupun bukan peneliti yang
banyak melakukan sebuah riset guna memenuhi tugas ataupun sebagai pembuktian dari
sebuah kejadian. Yang dimana setiap penelitian tersebut biasanya memerlukan sebuah
pengujian agar nantinya mampu menjadi sebuah hasil ilmiah yang benar-benar valid dan
bersifat riel tanpa adanya kebohongan ataupun ketidaknyataan yang mengesankan data yang
diperoleh bersifat dibuat-buat. Agar kajian kita bisa bersifat riel maka kita sebagai seorang
peneliti harus menguji terlebih dahulu hasil penelitian kita yang disebut dengan uji reabilitas.
Kebanyakan dari kita mengira bahwa jika kita mempunyai kesimpulan dari hasil
penelitian kita terhadap kejadian-kejadian yang terbatas, maka kesimpulan itu berlaku dengan
sempurna untuk seluruh kejadian yang sejenis. Perkiraan semacam itu belum tentu benar,
untuk menghindari hal-hal yang semacam itu maka kita harus melakukan reliabilitas, yang
berguna untuk menunjukkaan kevalidan data dari hasil sebuah penelitian yang kita lakukan.
kecocokan skor dengan skor sesungguhnya. Reliabilitas ini bisa dicapai melalui tingkat
kecocokan di antara skor pada lebih dari sekali pengukuran. Jika makin cocok dengan skor
sesungguhnya maka makin tinggi tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu
merupakan kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap ada,
namun kemungkinan itu sangatlah kecil sekali dan tidak akan banyak berpengaruh terhadap
A. Rumusan Masalah
B. Tujuan
PEMBAHASAN
Reliabilitas adalah sejauh mana hasil ujian siswa tetap atau konsisten dari
prosedur penilaian (Nitko, 2007). Menurut Ellen, suatu tes dikatakan reliabel jika skor
observasi nilai awal berhubungan dengan skor yang sebenarnya. Sedangkan menurut
(Rbel, 1986:71) syarat-syarat yang digunakan untuk menggambarkan salah satu sifat
yang paling signifikan dari satu nilai uji dengan cara yang konsisten. Jadi kesimpulannya
reliabilitas itu adalah jika skor observasi atau nilai responden (siswa) konsisten (tetap).
Reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.
reliabilitas menunjukkan sejauh mana hasil pengukuran dengan alat tersebut dapat
dipercaya. Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat
Dua atau lebih guru menandai kenerja siswa pada tugas yang sama.
Siswa menyelesaikan tugas yang berbeda pada waktu yang sama atau pada waktu
yang berbeda.
dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan
yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian
reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau seandainya
memahami konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut
harapan diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas ini
tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek yang tidak
lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar,
maka konsep reliabilitas terkait dengan pemotretan berkali-kali. Instrumen yang baik
adalah instrumen yang dapat dengan ajeg memberikan data yang sesuai dengan
kenyataan.
Yang sering ditangkap kurang tepat bagi pembaca adalah adanya pendaat bahwa
“ajeg” atau “tetap” diartikan sebagai “sama”. Dalam pembicaraan evaluasi ini tidak
demikian. Ajeg atau tetap tidak selalu harus sama, tetapi mengikuti perubahan secara
ajeg. Jika keadaan si A mula-mula berada lebih rendah dibandingkan dengan B, maka
jika diadakan pengukuran ulang, si A juga berada lebih rendah dari B. Itulah yang
dikatakan ajeg atau tetap, yaitu sama dalam kedudukan siswa di antara anggota
kelompok yang lain. Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah
menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini penting.
Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena menyokong
terbentuknya validitas. Sebuah tes mungkin reliable tetapi tidak valid. Sebalinya, sebuah
A reliable measure in one that provides consistent and stable indication of the
kejiwaan manusia itu sendiri tidak ajeg. Misalnya kemampuan, kecakapan, sikap dan
Beberapa hal yang sedikit banyak mempengaruhi hasil tes banyak sekali. Namun
1. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir
soalnya
Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan dengan
tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas
reliabilitas berhubung dengan penambahan banyaknya butir soal dalam tes ini ada
sebuah rumus yang diberikan oleh Spearman dan Brown sehingga terkenal dengan
dimana:
rnn = besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru.
salah jawab.
Contoh:
Suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabilitas 0,70. Kemudian
butir-butir soal itu ditambah menjadi 60 butir soal. Maka koefisien reliabilitas baru
adalah:
1 ,5 x 0 ,70
¿
1+ ( 1, 5−1 ) x 0 ,70
1, 05
=
1 ,35
= 0,79
soal tes adakalanya tidak berarti bahkan adakalanya merugikan. Hal ini disebabkan
karena:
a. Sampai pada suatu batas tertentu, penambahan banyaknya butir soal sudah tidak
Misalnya seorang guru sudah cukup membuat 100 soal bentuk objektif dan 10
soal bentuk esai sudah cukup mempunyai validitas isi dan tingkah laku. Guru
tersebut ingin menambah butir-butir soal sehingga menjadi 200 dan 20 dengan
menambahkan soal-soal yang parallel. Tentu saja hal ini hanya akan menambah
waktu, biaya dan tenaga saja tanpa ada keuntungan apa-apa. Kualitas butir-butir
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa
tes. Tes yang dicobakan kepada bukan kelompok terpilih, akan menunjukkan
reliabilitas yang lebih besar daripada yang dicobakan pada kelompok tertentu yang
kepada para tes-tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak
akan banyak terdapat pertanyaan. Ketenangan ini tentu saja akan berpengaruh
b. Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa
terhadap tes. Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat
menyebabkan rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes.
c. Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana disekelilingnya
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang
sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya
beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui
Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di luar tes
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah
Dengan metode bentuk parallel ini, dua buah tes yang paralel misalnya tes
Matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada
sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari
kedua hasil tes inilah yang menunjukkan koefisien reliabilitasnya tes seri A. jika
koefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan sebagai alat
Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan dua buah
tes dan masing-masing dicobakan pada kelompok siswa yang sma. Oleh karena itu, ada
baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor “masih
ingat soalnya” yang dlam evaluasi disebut adanya practice-effect dan carry-over effect,
artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal
tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena
harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes.
Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tetapi
dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode
ini dapat disebut dengansingle-test-double-trial method. Kemudian hasil dari kedua kali
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara
ini kurang mengena karena tercoba akan masih ingat akan butir-butir soalnya. Ooleh
karena itu, tenggang waktu antara pemberian tes pertama dengan kedua menjadi
permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa masih banyak ingat
materi. Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor atau kondisi
tes sudah akan berbeda dan siswa sendiri barangkali sudah mempelajari sesuatu. Tentu
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes
pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice effect
dan carry over effect.Yang penting adalah adanya kesejahteraan hasil atau ketetapan hasil
Contoh :
Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh semua
siswa. Metode ini juga disebut self-correlation method (korelasi diri sendiri) karena
Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes dua kali
percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam
menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu
Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien
korelasi langsung ditafsirkan itulah koefisiensi reliabilita, maka dengan ketiga metode ini
tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru
diketahui reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh tes harus
di mana:
Contoh:
2 x 0 , 60 1, 20
Maka, reliabilitas tes = = = 0,75
1+0 , 60 1, 60
Banyak pemakai metode ini salah membela hasil tes pada waktu, menganalisis.
Yang mereka lakukan adalah mengelompokkan hasil separo subjek peserta tes dan separo
yang lain kemudian hasil kedua kelompok ini dikorelasikan. Yang benar adalah
membelah item atau butir soal. Tidak akan keliru kiranya bagi pemakai metode ini harus
ingat bahwa banyaknya butir soal harus genap agar dapat dibelah.
a. Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut
b. Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada nomor-
nomor awal dan separo pada nomor-nomor akhir yang selanjutnya disebut belahan
awal-akhir.
Langkah pertama yang harus dilakukan adalah mengadakan analisis butir soal
yang lebih terkenal dengan nama analisis item. Item yang dapat dijawab dengan benar
diberi skor dan bagi yang salah diberi skor 0. Skor-skor untuk seluruh subjek dan seluruh
a. Pembelahan ganjil-genap
Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil-genap adalah sebagai
berikut:
(1,3,5,7,9) (2,4.6,8,10)
1. Hartati 5 3
2. Yoyok 3 2
3. Oktaf 0 4
4. Wendi 3 2
5. Diana 3 3
6. Paul 4 0
7. Susana 4 3
8. Helen 3 5
Kelanjutan dari tabel ini adalah menghitung dengan rumus korelasi product moment.
∑X = 25 ∑X2= 93
∑Y= 22 ∑Y2= 76
∑XY = 63
Setelah dihitung dengan rumus korelasi product moment dengan angka kasar diketahui
bahwa rXy=-0,3786. Harga tersebut baru menunjukkan reliabilitas separo tes. Oleh
karena itu, rXy untuk belahan ini disebut dengan istilah r1/21/2 atau rgg singkatan dari rganjil.rgenap
Untuk mencari reliabilitas seluruh tes digunakan rumus Spearman-Brown yang rumusnya
telah dikemukakan di depan. Jika koefisien reliabilitas separo tes ini dimasukkan ke
2 x−0,3786
=
1+(−0,3786)∗¿ ¿
−0,7572
= = -0,5493
1,3789
*)
pengurangan merupakan bilangan dengan harga mutlak, jadi tiak mengenal negative
b. Pembelahan awal-akhir
Dengan data yang tertera pada Tabe I analisis item tes Matematika diketahui jumlah
∑X = 25 ∑X2= 93
∑Y= 22 ∑Y2= 76
∑XY = 63
Setelah dimasukkan ke dalam rumus korelasi product moment dengan angka kasar
Rumus :
kuadrat. Dengan demikian bagi peminat yang menghitung dengan kalkulator statistic
varians ini diperoleh dengan mengkuadratkan standar deviasi. Untuk mereka yang
tidak menggunakan kalkulator statistic maka varians dapat dicari dengan rumus
sebagai berikut :
Standar Deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB).
Namun huruf S (B besar) juga dapat dikatakan sudah menyebut standar deviasi.
rumus S, yaitu:
S= √
∑ X2
N
Dimana :
S: Standar Deviasi
kuadrat.
22
76− 76−60 , 5
8 ¿ = 1,937
8
8
47
295− 295−276 , 13
8 ¿ = 2,36
¿ 8
8
Rumus :
Dimana
Untuk memperjelas keterangan maka tabel belahan awal-akhir dikutip disini lagi.
∑d = 3
∑d2= 43
5,234
r11= 1- 2 ,36 = 1-2,218 = -1,218
sama, keduanya lebih besar dari 1,00. Secara teoritik koefisien ini salah tetapi karena
Telah disinggung di bagian depan bahwa salah satu syarat untuk dapat
menggunakan metode belah dua adalah bahwa banyaknya item harus genap agar
dapat dibelah. Syarat yang kedua item-item yang membentuk soal tes harus
homogen atau paling tidak setelah dibelah terdapat keseimbangan antara belahan
dicari dengan rumus yang deketemukan oleh Kuder dan Richardson. Kedua orang
ahli ini menemukan banyak rumus yang diberi nomor. Rumus yang digunakan untuk
mencari reliabilitas dan banyak digunakan orang ada dua rumus yaitu rumus K-R 20
Dimana :
n = banyaknya item
Dalam buku-buku lain n (n kecil) ini sering diganti dengan huruf k (k kecil), yang
standar deviasi, ditulaskan SB sebagai singkatan dari kata “simpangan Baku”. Maka
Penggunaan huruf k ini juga berlaku bagi rumus-rumus lain yang melibatkan
rumus K-R.20 ini akan dibuatkan table analisis item yang lain.
1, 85−1 ,31
= 1,17x s dapat dicari dengan menarik akar varians
1 , 85
0 ,54
= 1, 17x s = 1,36 (dicari dengan kalkulator)
1 ,85
Rumus :
Ket : M = mean atau rerata skor total
Jika dibandingkan reliabilitas yang dihitung dengan K-R. 20 dan K-R. 21 lebih besar
Vs Vr−Vs
Rumus : r11= 1- atau r11=
Vr Vr
Keterangan
Vr = varians responden
Vs = varianas sisa
berikut :
2
∑B (∑ X t )2
Jk(r) = –
N k xN
Keterangan :
K = banyaknya item
2
∑ X t (∑ X t )2
Jk(r) = –
k k xN
Keterangan :
2
∑B = jumlah kuadrat jawab benar seluruh item
(∑ B)(∑ S)
Jk(t) =
( ∑ B )+(∑ S)
Keterangan :
Dalam mencari varians ini diperlukan d.b (derajat kebebasan) dari masing-masing
sumber varians kemudian d.b ini digunakan sebagai penyebut terhadap setiap jumlah
dikurangi 1
jumlah kuadrat
Jadi, Variansi =
d .b
Contoh perhitungan :
Dengan menggunakan table analisis item yang digunakan untuk mencari realibilitas
tes dengan rumus K-R dapat dicari reliabilitas dengan rumus Hoyt. Namun karena
DENGAN RUMUS
HOYT
Berdasarkan table ini dapat dicari reliabilitas soal dengan rumus Hoyt melalui
langkah-langkah :
2
∑ X t (∑ X t )2
Jk(r) = −
k kN
2
141 35
= −
7 7 x 10
= 20,143 – 17,5
= 2,643
∑ B (∑ X t )2
2
Jk(i) = −
N (k x N )
2
219 35
= −
10 7 x 10
= 21,9 – 17,5
= 4,4
(35)(35)
=
( 35 ) +(35)
1225
=
70
= 17,5
= 10,457
TABEL F
Untuk mencari d.b sia, harus dicari d.b total dahulu baru dikurangi d.b responden
d.b total = k x N – 1 + 7 x 10 – 1 = 70 -1 = 69
d.b responden = N – 1 = 10 – 1 = 9
d.b item =k–1=7–1=6
= 69 – 9 – 6 = 54
Vs
r11 = 1-
Vr
0,1936
= 1-
0,294
= 1- 0,658 + 0,342
Suatu butir soal urain menghendaki gradualisasi penilaian. Barangkali butir soal
omor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi
Untuk keperluan reliabilitas saol keseluruhan perlujuga dilakukan analisis butir soal
seperti halnya soal bentuk objektif. Skor untuk masing-masing butir soal
dicantumkan pada kolom item menurut apa adanya. Rumus yang digunakan adalah
( )( )
2
n ∑σ
r11 = 1− 2 i
n−1 σt
Dimana :
2
∑ σ i = jumlah varians skor tiap-tiap iem
2
σ t =varians total
1 A 10 6 8 8 10 10 52 2704
2 B 6 4 4 6 6 5 31 961
3 C 8 2 6 8 7 8 39 1521
4 D 7 3 7 7 6 6 36 1296
5 E 0 5 3 2 4 4 18 324
6 F 2 4 2 8 6 8 30 900
7 G 4 3 6 6 6 6 31 961
8 H 5 5 5 7 7 7 36 1296
9 I 5 5 4 6 8 5 33 1089
10 J 3 6 3 4 6 6 28 784
Dengan data yang tertera dalam table, dicari varians tiap-tiap item dahulu, baru
dijumlahkan
Perlu diingat kembali rumus varians yang sudah kita kenal, yaitu :
(∑ X )2
∑ X 2− ∑ X t ( ∑ X t )2
2
2
σ = N atau σt = −
N N
N
2
50
328− 328−250 78
σ2(1) = 10 = = =7 , 8
10 10
10
2
43
201−
σ2(2) = 10 201−184 , 9 16 ,1
= = =1 , 61
10 10 10
2
48
264−
σ2(3) = 10 264−230 , 4 33 , 6
= = =3 , 36
10 10 10
2
62
2 418−
σ (4) = 10 418−435 , 6 33 ,6
= = =3 ,36
10 10 10
66
451−
2
σ (5) = 10 458−435 , 6 22 , 4
= = =2 , 24
10 10 10
2
65
458−
σ2(6) = 10 451−422 ,5 28 , 5
= = =2 , 85
10 10 10
Jumlah varians semua item ∑ σ 2i =7 , 8+1 , 61+ 3 ,36+ 2 ,24 +2 ,85 = 21,22
2
334
11836−
Varians total = 10
10
11836−11155 ,6
=
10
680 , 4
=
10
= 68,04
6
r11 = x¿ )
6−1
6
= x ¿ 1-0,312)
5
6
= x 0,688
5
moment.
BAB III
PENUTUP
Kesimpulan
1. Reliabilitas tes marupakan suatu alat ukur yang digunakan untuk mengetahui konsistensi
apabila orang tersebut berbicara ajeg, tidak berubah-ubah pembicaraannya dari waktu ke
waktu.Dalam sebuah tes pentingnya diamati keajegan dan kepastian tes tersebut dilihat
DAFTAR PUSTAKA
http://ebook.repo.mercubuana-yogya.ac.id/Kuliah/materi_20131_doc/reliabilitas.pdf (akses 8
september 2017)