Menurut sumarna (2004) setiap skor yang diperoleh peserra tes terdiri atas
tiga hal ; skor amatan yang sering pula disebut sebagai skor perolehan (observed
test score) , skor yang sebenarnya (true score) yaitu skor yang sesuai dengan
kemampuan peserta test yang sebenarnya, dan kesalahan pebgukuran, yaitu
faktor-faktor yang mempengaruhi ketidakajegan suatu pengukuran adalah situasi
yang mempengaruhi perolehan skor. Secara umum konsep dasar tersebut
dinyatakan dalam persamaan matematis sebagai berikut :
Persamaan ini menunjukkan bahwa skor tes ditentukan oleh dua hal, yaitu
reliabilitas skor sebenarnya dua variabilitas kesalahan pengukuran. Jika kesalahan
pengukuran itu memberikan kontribusi yang signifikan, maka tes menjadi tidak
ajeg. Dengan kata lain, apabila varian kesalahan pengukuran relatif tidak berarti ,
maka pengukuran menjadi ajeg. Koefisien reliabilitas (rxx )menyajikan indeks
relatif pengaruh skor sebenarnya dan skor kesalahan pengukuran terhadap skor
yang diperoleh. Persamaan umum reliabilitas diturunkan dari perbandingan antara
varian skor sebenarnya dengan varian skor perolehan :
Besar kecilnya reliabilitas suatu tes ditentukan oleh besar kecilnya nilai
korelasi hasil tes yang dinamakan indeks reliabilitas. Untuk mengestimasi
reliabilitas banyak formula yang dapat digunakan. Crocker dan Algina (1986)
memberikan pendekatan untuk mengintesmasi reliabilitas dengan memperhatikan
sumber kesalahan utama melalui penggunaan koefisien reliabilitas, ekuivalen, dan
keajegan internal. Guilford (1954) memberikan beberapa modifikasi yang
dilakukan oleh Tucker untuk memperbaiki dan menyederhanakan ketidak
akuratan formula Kuder-Richardson dan pengunaan analisis varian pengukuran
prestasi belajar digunakan internak keajegan seperti formula Cronbach alpha
ataupun Kuder-Richardson. Akan tetapi dalam prakteknya penggunaan formula
itu memngkinkan adanya usaha-usaha tertentu untuk meninggikan koefisien
reliabilitasnya dengan cara mengubah pola susunan skor, sehingga untuk
menghindari hal itu maka penggunaan analisis varian lebih dapat dipertanggung
jawabkan.
Semakin sukar soal-soal dalam perangkat tes akan semakin besar pula
variasi skor yang diperoleh belahan. Dengan demikian maka akan semakin besar
pula reliabilitas tes tersebut. Sebaliknya, semakin rendah tingkat kesukaran suatu
soal semakin kecil pula reliabilitasnya. Untuk itu harus dihindari banyakanya
terkaan yang dilakukan peserta tes dan diusahakan menyesuaikan pengetahuan
peserta tes dengan tes yang diujikan kepada mereka.
Namun tes paralel memiliki kelemahan yaitu penggunaan tes paralel lebih
mahal dan tidak praktis dibandingkan metode tes ulang. Kelemahan berikutnya
adalah sangat sukar membuat dua buah tes yang benar-benar homogen. Hal yang
paling utama adalah tidak adanya jaminan apakah kedua tes yang dugunakan
benar-benar mengukur hal yang sama. Dengan demikian, dua tes yang dirancang
kurang baik akan menghasilkan reliabiitas yang rendah (Surapranata, 2004)
b. Persamaan Flanagan
persamaan lain yang dapat digunakan untuk menentukan reliabilitas belah
dua adalah persamaan flanagan yaitu :
𝑆¹+𝑆 ²
r11 = 2 ( 𝑆2
)
¹
2
r11 = reliabilitas tes, 𝑆 = varian beda, d= perbedaan skor belahan pertama dan
¹
2
kedua 𝑆 = varian total
¹