RELIABILITAS TES
Deskripsi Bab
Bab ini menyajikan konsep tentang reliabilitas suatu tes dan cara mengukur
reliabilitas tes. Bab ini menyajikan secara mendalam tentang reliabilitas mulai dari
konsep, perhitungan dengan menggunakan statistic yang cukup sederhana dan
interpretasi reliabilitas yang diperoleh.
Relevansi
Bab ini penting dipelajari sebagai dalam melakukan pengukuran reliabilitas
suatu tes. Sehingga mahasiswa dapat menilai apakah tes yang baru dibuat guru atau
pembuat soal ujian memenuhi syarat reliable atau tidak. Jika belum menguasai
konsep tentang cara mengukur relibilitas tes maka dapat menyulitkan saat melakukan
penilaian tes secara kuantitatif. Reliabilitas atau keajengan suatu skor adalah hal yang
sangat penting dalam menentukan apakah tes telah menyajikan pengukuran yang
baik. Hal yang paling penting dalam keajengan atau reliabilitas skor adalah adanya
pengambilan keputusan tentang peserta didiknya peserta tes. Sebagai contoh misalnya
sekolah mengharuskan peserta didiknya untuk lulus sebelum sebelum mereka
menamatkan pendidikannya.
Capaian Pembelajaran
1. Mampu melakukan uji validitas alat ukur serta reliabilitas bagi sebuah tes
2. Mampu melakukan uji reliabilitas tes objektif dan mencari reliabilitas tes
uraian
Penyajian
Pengukuran dalam sains maupun dalam ilmu social seperti dalam penilaian
kelas tidak pernah ajeg. Ketika kita melakukan pengukuran, baik untuk sains maupun
untu ilmu social lebih dari satukali, pasti ada sedikit perbedaan. Ketika seseorang
mengukur tinggi beberapa kali pada hari yang sama akan dihasilkan angka yang
1
berbeda. Mungkin saja untuk pertama pengukuran panjang sebuah buku adalah 20,55
cm dan pengukuran yang kedua diperoleh angka 20,45 cm. seseorang yang mengukur
tinggi permukaan air didalam buret misalnya saja 10,55 mm. pada pengukuran yang
kedua bisa saja diperoleh angka 98,60. Dari bebebrapa kasus ini tampak bahwa angka
yang diperoleh dari hasil pengukuran, baik untuk sains maupun pengetahuan social
menunjukkan ha yang tidak ajeg. Surapranata, 2005 menyatakan Metode yang
mempelajari, megidentifikasi dan mengestimasi keajengan atau ketidakajengan skor
tes merupakan focus dan pengkajian tentang reabilitas.
A Pengertian Reliabilitas
Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen.
Reliabilitas tes berkenaan dengan pertanyaan apakah suatu tes teliti dan dapat
dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu tes dikatakan reliabel
jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada
waktu atau kesempatan yang berbeda (Zainal Arifin, 2011: 258) dalam (Amalia.
Widayati, 2012:6).
Reliabilitas sering diartikan dengan keterandalan. Artinya, suatu tes memiliki
keterandalan jika tes tersebut dipakai mengukur berulang-ulang hasilnya sama.
Dengan demikian reliabilitas dapat pula diartikan dengan keajegan atau stabilitas
(Chabib Thoha, 2003:188) dalam (Amalia. Widayati, 2012:6).
Reliabilitas mengarah kepada keakuratan dan ketepatan dari suatu alat ukur
dalam suatu prosedur pengukuran. Koefisien reliabilitas mengindikasikan adanya
stabilitas skor yang didapatkan oleh individu, yang merefleksikan adanya proses
reproduksi skor. Skor disebut stabil bila skor yang didapat pada suatu waktu dan pada
waktu yang lain hasilnya relatif sama. Makna lain reliabilitas dalam terminologi
stabilitas adalah subjek yang dikenai pengukuran akan menempati ranking yang
relatif sama pada testing yang terpisah dengan alat tes yang ekuivalen (Singh, 1986;
Thorndike, 1991) dalam (Widodo,2006:2).
2
Uji Reliabilitas adalah data untuk mengukur suatu kuesioner yang merupakan
indikator dari variabel atau konstruk. Suatu kuesioner dikatakan reliabel atau handal
jika jawaban seseorang terhadap pernyataan adalah konsisten atau stabil dari waktu
ke waktu. Kehandalan yang menyangkut kekonsistenan jawaban jika diujikan
berulang pada sampel yang berbeda (Zahreza Fajar Setiara Putra, 2014:178).
Scarvia B. Andreson dkk dalam Arikunto (2009:87) menyatakan bahwa
persyaratan bagi tes, yaitu validitas dan reabilitas ini penting. Dalam hal ini validitas
lebih penting, dan reliabilitas ini perlu, karena menyokong terbentuknya validitas.
Sebuah tes mungkin reliable tetapi tidak valid. Sebaliknya, sebuah tes yang valid
biasanya reliable.
3
mereka cenderung member jawaban A dari empat alternaif yang
disalinkan atau cenderung memilih B dari soal benar salahyang
disajikan.
Khusus yang berkaitan dengan soal
Pengetahuan khusus yang berkaitan dengan cekta atau konsep
khusus
Pengetahuan dan keamampuan khusus yang berkaitan dengan soal
III Karakteristik umum yang temporer sepertipp;
Kesehatan
Kejelahan
Motivasi
Gangguan emosi
Kemampuan umum dan teknik yang digunakan ketika mengambil tes
Penahaman mekanisme tes
Faktor panas,cahaya,ventilasi,dan lain sebagainya
IV Karakteristik khusus yang temporer seperti;
Khusus yang berkaitan dengan tes secara keseluruhan
Pemahaman terhadap petunjuk khusus
Trik atau teknik-teknik mengatasi tes
Pengalaman/latihan menghadapi tes terlebih lagi dalam tes psikomotor
Kebiasaan menghadapi sebuah tes
Khusus yang berkaitan dengan perhatian dan keakuratan
Fluktuasi ingatan yang dimiliki peseta didik
Hal-hal yang berkaitan dengan perhatian dan keakuran
V Faktor penyelenggaraan
Waktu,bebas dari gangguan,dan petunjuk yang jelas
Pengawasan
Penskoran
VI Faktor yang tidak pernah diperhitungkan
Keberuntungan karena factor menebak
Mengingat soal yang telah dilihatnya
4
menggunakan kesalahan pengukuran tersebut. Setiap dasar yang diperoleh seorang
peserta tes terdiri atas tiga hal; skor amatas yang sering pula disebut sebagai skor
perolehan [observed text scorel], skor yang sebenarnya [true score] yaitu skor yang
sesuai dengan kemampuan peserta tes yang sebenarnya, dan kesalahan pengukuran,
yaitu faktor-faktor yang mempengaruhi ketidakajegan suatu pengukuren adalah
situasi yang mempengaruhi peroleh skor. Secara umum konsep dasar tersebut
dinyatakan dalam persamaan matematis sebagai berikut;
Skor perolehan = skor + Kesalahan pengukuran
[observed test sebenarnya [error of measurement]
Score] [true score]
X=T+e
Persamaan ini menunjukkan bahwa skor tes ditentukan oleh dua hal, yaitu
bariabilitas skor sebenarnya dan variabilitas kesalahan pengukuran. Jika kesalahan
pengukuran itu memberikan kontribusi yang signifikan, maka tes menjadi tidak ajeg.
5
Dengan kata lain, apabila varian kesalahan pengukuran relative tidak berarti, maka
pengukuran menjadi ajeg (Surapranata, 2005).
Koefisien reliabilitas (rxx) menyajikan indeks relative pengaruh skor sebenarnya
dan skor kesalahan [engukuran terhadap skor yang diperoleh. Persamaan umum
reliabilitas diturunkan dari perbandingan antar varian skor sebenarnya dengan varian
skor perolehan:
rxx
6
Menurut Arikunto (2009:90), ada beberapa cara yang digunakan untuk
melakukan uji reliabilitas tes, yaitu:
7
permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa masih banyak igat
materi. Sebaliknya jika tenggang waktu terlalu lama, maka factor-faktor atau kondisi
tes sudah akan berbeda, dan siswa sendiri barangkali sudah mempelajari sesuatu.
Tentu saja factor-faktor ini akan berpengaruh pula terhadap reliabilitas
(Arikunto,2009:91).
3. Metode belah dua atau split-half-method
Dalam prosedur ini tes diberikan kepada kelompok subjek cukup satu kali atau
pada satu saat. Butir-butir soal dibagi menjadi dua bagian yang sebanding, biasanya
dengan membedakan soal nomor genap dengan soal nomor ganjil. Setiap bagian soal
diperiksa hasilnya, kemudian skor dari kedua bagian tersebut dikorelasikan untuk
dicari koefisien korelasinya. Mengingat korelasi tersebut hanya berlaku sebagian,
tidak untuk seluruh soal, maka koefisien korelasi yang diperolehnya tidak untuk
seluruh soal, tetapi hanya untuk separuhnya (Amalia. Widayati,2012:7).
Menurut Arikunto (2009:93) untuk mengetahui reliabilitas seluruh tes harus
digunakan rumus Sperman-Brown sebagai berikut:
Di mana:
r 1/21/2 = Kolerasi antara skor-skor setiap belahan tes
r11 = Koefisien reliabilitas yang sudah disesuaikan
Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa
banyaknya butir sal harus genap agar dapat dibelah. Ada dua cara membelah butir
soal yaitu:
a. Membelah atas item-item genap dan item-item ganjil yang selanjutnya
disebut belahan ganjil-genap
b. Membelah atas item-item awal dan item-item akhir yaitu sebagian jumlah
pada nomor-nomor awal dan sebagian pada nomor-nomor akhir yang
selanjutnya disebut belahan awal-akhir.
8
Menurut Sudijono (2009:213) Tes hasil belajar bentuk objektif penentuan
reliabilitas tes dapat dilakukan dengan menggunakan tiga macam pendekatan. Ketiga
macam pendekatan yang dimaksud adalah:
1. Pengujian Relianilitas Tes Hasil Belajar Bentuk Objektif Dengan Menggunakan
Pendekatan Single Tes-Single Trial (Single Tes-Single Trial Method)
Penentuan reliabilitas ter dilakukan dengan jalan melakukan pengukuran
terhadap satu kelompok subjek, dimana pengukuran itu dilakukan dengan hanya
menggunakan satu jenis alat pengukur, dan bahwa pelaksanaan pengukuran itu hanya
dilakukannya satu kali saja. Dengan kata lain pendekatan Single Tes-Single Trial
adalah merupakan pendekatan “serba single” atau pendekatan “serba satu”, yaitu satu
kelompok subyek, satu jenis alat pengukur, dan satu kali pengukuran; atau satu
keompok testee, satu jenis tes, dan satu kali testing.
Dengan menggunakan pendekatan Single Tes-Single Trial, maka tinggi
rendahnya reliabilitas tes hasil belajar objektif dapat diketahui dengan melihat besar
kecilnya koefisien reliabilitas tes, yang-seperti halnya pada tes uraian-dilambangkan
dengan: r11 atau rtt (koefisien reliabilitas tes secara total). Adapun untuk mencari atau
menghitung r11 atau rtt itu, dapat digunakan lima jenis formula yaitu: (1) Formula
spearman-Brown, (2) formula Flanagan, (3) Formula rulon, (4) Formula Kuder-
Richardson, dan (5) Formula C. Hoyt.
Sekalipun formula kelima jenis formula ini sama-sama termasuk dalam
pendekatan Single Tes-Single Trial, namun kelima formula ini memiliki perbedaan
tertentu yaitu:
Pertama, dengan menggunakan Formula spearman-Brown, formula Flanagan,
Formula rulon, maka penentuan reliabilitas tes hasil belajar obyektif dilakukan
dengan jalan”membelah dua” tes. Sedangkan Formula Kuder-Richardson, dan
Formula C. Hoyt maka penentuan reliabilitas tes hasil belajar obyektif tidak
menggunakan teknik belah dua.
Kedua, sekalipun penggunaan formula spearman-Brown, formula Flanagan,
Formula rulon sama-sama mengunakan teknik belah dua, namun sasaran yang
9
dijadikan landasan berpijak dalam penentuan reliabilitas tes tersebut berbeda. Pada
formula spearman-Brown didasrkan pada kolerasi, yaitu kolerasi antara separuh
belahan pertama tes dengan separuh belahan kedua dari tes tersebut. formula
Flanagan didasrkan pada deviasi (selisih skor dengan mean totalnya, yaitu: x= X-
Mx). Formula rulon didasrkan pada selisih skor yang dimiliki oleh kedua tes tersebut,
yang dilambangkan dengan:d (=difference), di mana d = (X-Y).
Ketiga, Formula Kuder-Richardson dan Formula C. Hoyt sama-sama tidak
menggunakan formula belah dua; sekalipun demikian diantara keduanya terdapat
perbedaan prinsip. Formula Kuder-Richardson, maka penentuan reliabilitas tes hasil
belajar bentuk objektif dilakukan dengan jalan melakukan penganalisasian secara
langsung terhadap skor-skor item tes hasil belajar yang bersangkutan. Sedangkan
Formula C. Hoyt penentuan reliabilitas tes hasil belajar bentuk objektif itu,
sasarannya adalah interaksi antara testee (subjek yang menjawab item) dengan item
tes hasil belajar itu sendiri (yang dijawab oleh subyek). Teknik penganalisasian
seperti inilah yang lebih dikenal dengan istilah: Teknik Analisis Varian (ANAVA).
a. Pendekatan Single Tes-Single Trial dengan menggunakan formula spearman-
Brown
Untuk mengetahui reliabilitas tes secara keseluruhan spearman-Brown
menciptakan formula sebagai berikut:
Dimana:
rtt = Koefisien reliabilitas tes secara total (tt=total test)
rhh = Koefisien korelasi product moment antara bagian pertama tes dengan bagian kedua dari
tes tersebut (hh=half-half)
1 & 2 = bilangan konstan.
10
SDx’ = Standar Deviasi Variabel X dalam arti tiap interval sebagai unit dimana i= 1
SDy’ = Standar Deviasi Variabel Y dalam arti tiap interval sebagai unit dimana i= 1
11
b) Menjumlahkan skor dari butir item yang terletak disebelah kanan tes, yang
dimiliki oleh masing-masing individu.
c) Mencari (menghitung) koefisien korelasi “r” product moment, antara
variable X (separuh belahan kiri) dengan variable Y (separuh belahan
kanan) yaitu rhh atau r atau rxy). Dari hasil perhitungan subtitusikan kedalam
rumus:
12
4. Pendekatan Single Tes-Single Trial dengan menggunakan formula flanagan
Model item Gasal Genap
Langkah-langkah yang perlu ditempuh dalam penentuan reliabilitas dengan
penndekatan dan model ini yaitu:
a) Hitung terlebih dahulu: jumlah kuadrat dari deviasi skor-skor variable X (,
jumlah kuadrat dari deviasi skor-skor variable Y (, dan jumlah kuadrat dari
deviasi total skor-skor variable X dan variable Y (=.
b) Mencari (menghitung) varian skor-skor item bernomor gasal, dengan
menggunakan rumus:
13
c) Menghitung koefisien reliabilitas tesnya )
)
6. Pendekatan Single Tes-Single Trial dengan menggunakan formula Rulon
Rumus yang dikemukakan oleh rulon untuk koefisien reliabilitas tes adalah
sebagai berikut:
Adapun formula yang diajukan oleh Kuder dan Richardson ada dua buah yang
masing-masing diberi kode KR20 dan KR21 yaitu:
1) Rumus KR20
2) Rumus KR21
14
Dengan menggunakan teknik analisis varian maka koefisien reliabilitas tes
dapat diperoleh dengan rumus:
Jawaban:
Penjumlahan dari skor-skor yang dimiliki oleh item bernomor gasal dan item
bernomor gena
15
Angka indekskolerasi “r” prodeuct moment, antara variable X dengan variable Y
Jadi: Koefisien reliabilitas tes sebesar 0,84 ternyata jauh lebih besar dari 0,70.
Dengan demikian hasil tes tersebut dinyatakan sebagai hasil tes belajar yang memiliki
reliabilitas tinggi (Arikunto, 2009).
16
2. Hitunglah reliabilitas tes dari table dibawah ini dengan menggunakan rumus K-R
20
Jawaban:
Rumus K-R 20 :
3. Hitunglah reliabilitas tes dari table dibawah ini dengan menggunakan rumus K-R
21
Jawaban:
Rumus K-R 21 :
)
17
4. Contoh soal Pendekatan Single Test-SingleTrial dengan Menggunakan Formula
Flanagan, di Mana Diterapkan Model Item Gasal dan Genap
Lankah 1: Dengan mengangkat kembali data yang disajikan pada tabel 6.6. kolom
(1) sampai dengan kolom (3), kita hitung terlebih dahulu:jumlah kuadrant dai
devisiasi skor-skor variabel X (=), jumlah kuadratdari deviasi skor-skor Y (=), dan
jumlah kuadran dari variasi total skor-skor variabel X dan variabel Y (= .
Perhatikanlah perhitungan-perhitungannya pada tabel berikut ini:
Siswa Skor Item
Bernomor
x y x2 y2 (x+y) (x+y)2
Gasal Genap
(X) (Y)
18
T 10 10 +2,56 +1,4 6,5536 1,96 3,96 63,3616
U 12 12 +4,56 +3,4 20,7936 11,56 7,96 1,0816
V 6 9 -1,44 +0,4 2,0736 0,16 -1,04 1,0816
W 7 8 -0,44 -0,6 0,1936 0,36 -1,04 1,0816
X 12 12 +4,56 +3,4 20,7936 11,56 7,96 63,3616
Y 7 7 -0,44 -1,6 0,1936 2,56 -2,04 4,1616
25 = 186 = 215 = 0= 0= 134,16 = 132,00 = 0= 444,96 =
2 2
N ) )2
19
S12 =
Telah diketahui 2 = 134, 16dan N = 25. Dengan demikian dapat kita ketahui besarnya
S12sebagai berikut:
S12= = = 5,3664
Langkah 3: Mencari (menghitung) varian skor-skor item bernomor genap, dengan
menggunakan rumus:
S22 =
Telah diketahui = 123,00 dan N = 25. Dengan demikian dapat kita ketahui besarnya
S22 sebagai berikut:
S22 = = = 5, 28
Langkah 4: Mencari (menghitung) varian total, dengan menggunakan rumus:
St 2 =
Telah diketahui )2 = 444,96 dan N = 25. Dengan demikian dapat kita ketahui S12
sebgai berikut:
St2 = = = 17,7984
Langkah 5: Mencari koefisien reliabilitas tes (r11) dengan rumus:
r11 = 2(1- )
Telah diketahui S12= 5,3664; S22 = 5, 28; St2 = 17,7984; dengan demikian:
r11 = 2 (1 – ) = 2 ( 1 – )
= 2 (1 – 0,598166127)
= 2 x 0,401833872
= 0,803667745
= 0,804 (dibulatkan)
Langkah 6: Memberikan interpretasi terhadap r11. Brdasarkan hasil-hasil perhitungan
diatas, telah kita ketahui besarnya koefisien reliabilitas ter (r 11) sebesar 0,804. karna r11
sebesar 0,804 itu sudah berada diatas 0,70 maka kita dapat mentatakan bahwa tes
belajar bidang study Ushul Fiqh tersebut diatas sudah memiliki reliabilitas yang
tinggi. (= reliabel).
20
PENUTUP
Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen.
Reliabilitas tes berkenaan dengan pertanyaan apakah suatu tes teliti dan dapat
dipercaya sesuai dengan kriteria yang telah ditetapkan. Reliabilitas sering diartikan
dengan keterandalan. Artinya, suatu tes memiliki keterandalan jika tes tersebut
dipakai mengukur berulang-ulang hasilnya sama. Dengan demikian reliabilitas dapat
pula diartikan dengan keajegan atau stabilitas.
Reliabilitas mengarah kepada keakuratan dan ketepatan dari suatu alat ukur
dalam suatu prosedur pengukuran. Koefisien reliabilitas mengindikasikan adanya
stabilitas skor yang didapatkan oleh individu, yang merefleksikan adanya proses
reproduksi skor. Skor disebut stabil bila skor yang didapat pada suatu waktu dan pada
waktu yang lain hasilnya relatif sama. Uji Reliabilitas adalah data untuk mengukur
suatu kuesioner yang merupakan indikator dari variabel atau konstruk. Suatu
kuesioner dikatakan reliabel atau handal jika jawaban seseorang terhadap pernyataan
adalah konsisten atau stabil dari waktu ke waktu.
Latihan
1. Apa yang dimaksud dengan Reliabilitas?
2. Bagaimana sumber keajegan dan ketidakajegan?
3. Bagaimana model umum Reliabilitas?
4. Bagaimana metode sederhan mengestimasi Reliablitas?
5. Bagaimana cara-cara mencari besarnya Reliabilitas?
6. Bagaimana teknik pengujian Reliabilitas tes hasil belajar bentuk objektif?
Umpan Balik
21
Bacalah dan pahami bab ini kemudian kerjakan latihan soal tersebut dengan sebaik
baiknya.Apabila penguasaan konsepmu kurang dari 80% maka lakukan lagi
perbaikan agar dapat diperoleh penguasaan yang lebih baik lagi.
22