Anda di halaman 1dari 17

Nama: Nisa Rahmi Mardiah

NIM : 1706130
Kelas: 3C PGSD
VALIDITAS DAN RELIABILITAS
1. Validitas
Dalam Azwar (1987: 173 dalam Matondang 2009) menyatakan bahwa validitas
berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan
suatu instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes dikatakan
memiliki validitas yang tinggi apabila alat tersebut menjalankan fungsi ukur secara tepat
atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran
tersebut. Artinya hasil ukur dari pengukuran tersebut merupakan besaran yang
mencerminkan secara tepat fakta atau keadaan sesungguhnya dari apa yang diukur.
Afiyanti (2008) mengatakan bahwa konsep validitas dalam penelitian kualitatif
yang sering digunakan adalah kredibilitas. kredibilitas menjadi suatu hal yang penting
ketika mempertanyakan suatu kualitas hasil suatu penelitian kualitatif. Standar kredibilitas
identik dengan standar validitas internal dalam penelitian kuantitatif.
Sejalan dengan itu, dalam hal pengujian tes di sekolah, suatu tes dapat dikatakan
valid dan tes tersebut harus mengukur sesuatu yang harus diukur. Dalam hal ini tes yang
dilakukan oleh seorang guru seharusnya mempertimbangkan validitas dari suatu tes.
Validitas adalah masalah proses pembuktian yang berkelanjutan, mengacu pada sejauh
mana bukti dan teori mendukung interpretasi terhadap skor tes sesuai tujuan tes. Proses
validasi melibatkan proses pengumpulkan bukti untuk memberikan dasar ilmiah untuk
interpretasi skor tes. Validitas adalah masalah interpretasi terhadap nilai tes, bukan tes itu
sendiri, karena validitas tidak seberapa terkait dengan bentuk atau jenis tes, tetapi
interpretasi terhadap skor tes. Oleh karena itu, ketika skor tes digunakan atau ditafsirkan
lebih dari satu cara, setiap cara interpretasi dimaksudkan harus divalidasi. (Sumintono, B
& Widhiarso. W, 2013).
Dalam Sumintono, B & Widhiarso, W (2013) menyatakan bahwa ada banyak
literatur yang membagi validitas menjadi tiga tipe, yaitu validitas isi, validitas kriteria, dan
validitas konstruk. Pada perkembangan terkini, validitas lebih menyangkut masalah
pembuktian. Setidaknya ini yang dipakai oleh asosiasi pendidikan dan psikologi di
Amerika Serikat (AERA atau American Educational Research Association dan APA atau
American Psychological Association). Berikut ini ada bukti yang dapat dipakai untuk
menunjukkan validitas tes yang kita susun berdasarkan standar dari AERA dan APA:
a. Bukti berdasarkan isi tes. Bukti ini menyangkut hubungan antara isi tes dan konstruk
yang diukur. Isi tes memuat spesifikasi isi (misalnya, kisi-kisi, cetak biru tes) serta
properti tes seperti jenis butir (contohnya, jenis soal pilihan ganda), instruksi, tugas yang
diberikan, dan penulisan butir. Pembuktian validitas tipe ini dapat dilakukan melalui
analisis logis atau empiris terhadap domain isi tes, landasan teori yang dipakai, bahasa
dalam penulisan butir, serta properti-properti tes lainnya. Berikut ini beberapa contoh
bahan yang dapat menjadi bukti validitas tes berdasarkan isinya: (1) persetujuan pakar
atau praktisi terhadap kisi-kisi dan butir-butir tes; (2) persetujuan ahli bahasa yang
mengevaluasi daya keterbacaan pernyataan di dalam butir; (3) pendapat siswa yang
mengatakan bahwa mereka dapat memahami dengan baik semua pernyataan di dalam
butir.
b. Bukti berdasarkan proses respons. Bukti ini menyangkut bagaimana siswa merespons
butir. Misalnya, kita membuat butir berbentuk soal cerita untuk mengukur penalaran
matematika (mathematical reasoning), maka jawaban benar yang diberikan oleh siswa
pada soal ini haruslah berdasarkan kemampuan penalaran matematika, dan bukan
kemampuan dia dalam memahami bacaan. Bukti-bukti mengenai proses respons dapat
dikumpulkan melalui wawancara untuk mendapatkan informasi mengenai proses
kognitif apa yang dibutuhkan siswa dalam menjawab soal. Jika proses tersebut relevan
dengan kemampuan yang diukur, tes atau butir yang dikaji memiliki bukti kevalidan.
c. Bukti berdasarkan struktur internal. Struktur internal tes dapat menunjukkan sejauh
mana butir dan komponen tes sesuai dengan konstruk yang diukur. Tes dapat memiliki
satu komponen atau beberapa komponen. Antara satu komponen tes dan komponen
lainnya dapat berkaitan atau tidak. Jika komponen-komponen tersebut memiliki
keterkaitan yang rendah, tes akan cenderung bersifat multidimensi. Jika keterkaitannya
tinggi, tes tersebut bersifat unidimensi. Struktur ini dapat dibuktikan melalui analisis
faktor yang mengindikasikan struktur faktor tes dan reliabilitas yang mengindikasikan
homogenitas butir-butir tes. Beberapa analisis statistik juga menunjukkan struktur
internal, misalnya bobot faktor (factor loading) dan indeks ketepatan butir-model
(misalnya, koefisien infit dan outfit dalam pemodelan rasch, akan dijelaskan kemudian).
d. Bukti berdasarkan keterkaitan dengan variabel lain. Variabel eksternal dapat berupa (a)
kriteria yang diharapkan diprediksi oleh skor tes dan (b) konstruk lain yang memiliki
kesamaan dengan konstruk yang diukur oleh tes. Termasuk dalam bukti ini adalah bukti
konvergensi dan diskriminasi. Hubungan antara skor tes yang kita kembangkan dan skor
tes lain yang mengukur konstruk yang sama memberikan bukti konvergensi, sedangkan
hubungan antara skor tes yang kita susun dan tes lain yang mengukur konstruk berbeda
memberikan bukti diskriminansi.
e. Bukti berdasarkan konsekuensi tes. Bukti ini terkait dengan konsekuensi dari
pengambilan keputusan yang didasarkan oleh skor tes. Keputusan tersebut dapat berupa
penentuan kelulusan atau kenaikan kelas, penempatan pada kelas khusus, atau ada
tidaknya kebutuhan khusus. Jika konsekuensi yang dialami siswa itu memberikan
manfaat yang positif, tes yang kita kembangkan valid. Namun sebaliknya, jika tes yang
kita susun menunjukkan bahwa si A memiliki kebutuhan khusus padahal sebenarnya
tidak, tes yang kita kembangkan memiliki validitas yang rendah.

Bukti kualitatif juga dapat menunjukkan validitas. Selama ini banyak yang
beranggapan bahwa validitas itu bersifat formal yang hanya menekankan pada bukti
kuantitatif yang ditunjukkan dengan koefisien validitas. Dari beberapa bukti yang
dipaparkan di muka, validitas banyak bersumber dari penggalian informasi tambahan, baik
sebelum maupun setelah tes diberikan.

2. Cara Menghitung Validitas


Djaali (2000: 77) menyatakan bahwa untuk menghitung validitas internal untuk
skor butir dikotomi digunakan koefisien korelasi biserial (rbis) dengan rumus:

r  X i X t pi
bis i 
St qi
Keterangan:
rbis i  = koefisien korelasi antara skor butir ke i dengan skor total.
X i = rata-rata skor total responden yang menjawab benar butir ke i.
X t = rata-rata skor total semua responden.
St = standar deviasi skor total semua responden.
pi = proporsi jawaban yang benar untuk butir ke i.
qi = proporsi jawaban yang salah untuk butir ke i.

Selanjutnya, dikatakan bahwa untuk menghitung koefisien validitas internal untuk skor
butir politomi digunakan korelasi product moment (r) dengan rumus:

x x i t

r
it

x x i t

2 2

dengan:
rit = koefisien korelasi antara skor butir soal dengan skor total.

 xi = jumlah kuadrat deviasi skor dari Xi.

 xt = jumlah kuadrat deviasi skor dari Xt.


Contoh Langkah-langkah Pengujian Validitas Banding Tes (BAPM, 2008)
(1) Hitung koefisien korelasi antara skor hasil tes yang akan diuji validitasnya dengan
hasil tes yang terstandar yang dimiliki oleh orang yang sama dengan menggunakan
rumus korelasi produk momen menggunakan angka kasar
(korelasi produk momen Pearson), yaitu:
n N n

n xi yi xi yi
r i 1 i 1 i 1
xy
n n 2 n n 2 … (1)
2 2
nx x i
n y y i
i i
i1 i 1 i1 i 1

dengan
rxy adalah koefisien korelasi antara variable X dan variable Y xi
adalah nilai data ke-i untuk kelompok variable X
yi adalah nilai data ke-i untuk kelompok variable Y n
adalah banyak data
Catatan:
a. Korelasi produk momen Pearson mensyaratkan agar data yang dikorelasikan
sekurang-kurangnya berskala interval.
b. Rumus korelasi produk momen Pearson sudah tersedia dalam kalkulator
scientific, MS Excel, Software-software statistic.
c. Tabel r Pearson sudah tersedia pada lampiran buku-buku statistika.

(2) Hitung koefisien valiliditas instrument yang diuji (rhitung) , yaing nilainya sama
dengan korelasi korelasi hasil langkah-1 x koefisien validitas instrument terstandar.
(3) Bandingkan nilai koefisien validitas hasil langkah-2 dengan nilai koefisien korelasi

Pearson / tabel Pearson (rtabel) pada taraf signifikansi α (biasanya dipilih 0,05) dan
n = banyaknya data yang sesuai. (Lihat lampiran).
Kriteria :

Instrumen valid, jika rhitung ≥ rtabel

Instrumen tidak valid, jika rhitung < rtabel


1) Tentukan kategori dari validitas instrument yang mengacu pada pengklasifikasian
validitas yang dikemukakan oleh Guilford (1956, h.145) adalah sebagai berikut:
0,80 < rxy 1,00 validitas sangat tinggi (sangat baik)

0,60 < rxy 0,80 validitas tinggi (baik)


0,40 < rxy 0,60 validitas sedang (cukup)
0,20 < rxy 0,40 validitas rendah (kurang)
0,00 < rxy 0,20 validitas sangat rendah (jelek)
rxy 0,00 tidak valid

Contoh Uji Validitas Tes Banding:


Misalkan akan diuji validitas tes matematika (X) yang telah diujicobakan
dengan menggunakan kategori nilai rata-rata tes formatif matematika siswa kelas VI
SD Z Bandung yang terdiri dari 15 orang siswa.

No. Nama Siswa Nilai tes Rata-rata tes


matematika (X) formatif (Y)
1. Arman Maulana 5,62 7,43
2. Benyamin 7,35 8,77
3. Cindy Claudia 4,21 5,61
4. Dewi Sandra 3,75 6,86
5. Erni Kulit 6,25 7,21
6. Febri Lawalata 8,98 8,35
7. Gugun Gondrong 5,68 7,21
8. Hetty Koes Endang 6,55 6,02
9. Inne Cintya 7,50 7,90
10. Jimmy Manopo 9,25 8,40
11. Koes Hendratmo 5,77 6,25
12. Liem Sue King 6,66 6,70
13. Moerdiyono 4,00 7,25
14. Nining Meida 6,45 7,66
15. Oon Hasanah 7,04 5,33

Langkah-langkah perhitungan dengan menggunakan Microsoft Excel

1) Buka sheet 1, kemudian isi sel A1 dengan No. Isi sel B1 dengan Nama Siswa. Isi
sel C1 dengan X (nilai tes matematika). Isi sel D1 dengan Y (rata-rata tes formatif).
2) Isi sel A2 sampai dengan sel A16 dengan angka 1 sampai dengan 15.
3) Isi sel B2 sampai dengan sel B16 dengan Nama Siswa.
4) Isi sel C2 sampai dengan sel C16 dengan nilai-nilai tes matematika siswa.
5) Isi sel D2 sampai dengan sel D16 dengan nilai-nilai tes formatif matematika
6) Pada sel B17 ketik Koefisien korelasi Pearson
7) Pada sel B18 ketik Koefisien validitas instrumen
8) Pada sel B19 ketik r tabel Pearson
9) Pada sel B20 ketik Kriteria
10) Pada sel B21 ketik Kategori
11) Pada sel C17 ketik rumus =PEARSON(C2:C16,D2:D16)
Untuk menghitung koefisien korelasi antara data yang ada pada sel C2 sampai
dengan C16 dengan data yang ada pada sel D2 sampai dengan D16
12) Pada sel C18 ketik rumus untuk menghitung Koefisien validitas instrumen, yaitu:
=C17*1
Untuk menghitung validitas banding instrument.
 Angka 1 dipilih berdasarkan asumsi bahwa rata-rata tes formatif sudah
terstandar sempurna.
 Jika koefisien validitas instrument yang terstandar diketahui, misalnya
0,724, maka koefisien validitas instrument yang diuji dapat dihitung dengan
menggunakan rumus: =C17*.724
13) Pada sel C19 ketik angka yang ada pada kolom α = 0,05 dengan n = 15 pada r tabel
Pearson, yaitu 0,5140
14) Pada sel C20 ketik rumus untuk Kriteria, yaitu: =IF(C18<C19,"Tidak
valid","Valid")
15) Pada sel C21 ketik rumus untuk menentukan Kategori validitas instrumen, yaitu:
=IF(C18<0,"Tidak valid",IF(C18<0.2,"Sangat
rendah",IF(C18<0.4,"Rendah",IF(C18<0.6,"Sedang",IF(C18<0.8,"Tinggi","Sanga
t tinggi")))))

Hasil uji validitas banding disajikan dalam bentuk gambar berikut.

Langkah-langkah Pengujian Validitas Butir Soal Tes

1) Hitung koefisien validitas butir soal nomor 1 (r1) dengan cara menghitung
koefisien korelasi produk momen Pearson antara setiap skor soal nomor 1
dengan skor total yang dimiliki oleh orang yang sama.
2) Bandingkan nilai koefisien validitas hasil langkah-1 dengan nilai koefisien
korelasi Pearson / tabel Pearson (rtabel) pada taraf signifikansi α (biasanya dipilih
0,05) dan n = banyaknya data yang sesuai. (Lihat lampiran).
Kriteria:
 Instrumen valid, jika r1 ≥ rtabel

 Instrumen tidak valid, jika r1 < rtabel


3) Tentukan kategori dari validitas instrument yang mengacu pada
pengklasifikasian validitas yang dikemukakan oleh Guilford (1956, h.145).
4) Ulangi langkah (1) sampai dengan (3) untuk menguji validitas butir soal yang
lainnya.
5) Jika ada butir soal yang tidak valid, dilakukan uji validitas instrument tahap 2
yaitu dengan cara sebagai berikut:
 Buang setiap soal yang tidak valid.
 Hitung nilai total yang baru, yaitu hasil penjumlahan skor butir soal yang valid,
selanjutnya disebut skor total baru untuk uji validitas tahap kedua.
 Lakukan pengujian validitas untuk setiap butir soal yang valid hasil uji
validitas tahap pertama dengan skor total seperti langkah (1) sampai dengan (4)
pada uji validitas tahap pertama.
6) Uji validitas dihentikan, setelah semua butir soal valid.
Contoh Uji validitas butir soal:
Misalkan akan diuji validitas tes objektif matematika yang terdiri dari 5 soal yang telah
diujicobakan terhadap 10 orang siswa kelas VI SD Z Bandung. Data selengkapnya
dapat dilihat pada tabel 2. Tabel 2
Nomor Soal
No. Siswa 1 2 3 4 5 6
1 A 1 1 1 1 1 1
2 B 1 1 1 1 0 0
3 C 0 1 0 1 1 1
4 D 0 0 0 0 1 1
5 E 1 1 0 1 0 0
6 F 1 1 0 1 1 1
7 G 0 1 1 1 0 0
8 H 1 0 0 1 1 1
9 I 0 1 1 1 1 0
10 J 1 1 1 1 1 0

Keterangan:

0 = siswa menjawab salah 1 = siswa menjawab benar


Langkah-langkah:
1) Klik insert – klik worksheet (untuk menampilkan sheet 4).
2) Isi sel A1 dan A2 dengan No. Kemudian isi sel A3 sampai dengan sel A12
dengan angka 1 sampai dengan 10.
3) Isi sel B1 dan sel B2 dengan nama siswa. Kemudian isi sel A3 sampai dengan
A12 dengan A sampai dengan J.
4) Isi sel C1 sampai dengan sel H1 dengan Nomor Soal. Kemudian isi sel C2
sampai dengan sel H2 dengan angka 1 sampai 6.
5) Isi sel I1 dan sel I2 dengan Total.
6) Pada I3 hitung jumlah jawaban yang benar dengan menggunakan rumus
=sum(c3:h3).
7) Copy isi sel I3 kemudian temple (paste) pada sel I4 sampai dengan I12.
8) Isi sel B13 dengan Validitas.
9) Pada sel C13 hitung validitas butir soal nomor 1 dengan cara menghitung
koefisien korelasi Pearson antara isi sel C3:C12 (nilai setiap siswa nilai untuk
soal nomor 1) dengan isi sel I3:I12 (nilai total siswa) menggunakan rumus
=Pearson(c3:c12,$I$3:$I$12).
10) Copy isi sel C13. Kemudian tempel (paste) pada sel D13 sampai dengan H13.
11) Isi sel B14 dengan Kategori.
12) Pada sel C14 tentukan kategori untuk validitas butir soal 1 dengan
menggunakan rumus
=IF(C13<0,"tidak valid",IF(C13<0.2,"sgt rdh",IF(C13<0.4,"rendah",
IF(C13<0.6, "sedang",IF(C13<0.8,"tinggi","sgt tgi"))))).

Kemudian copy isi sel C14 dan tempelkan pada sel D14 sampai dengan H14.
Hasil uji validitas butir soal dapat dilihat pada gambar 2.
Dari hasil pengujian diketahui bahwa dari 6 soal ada 1 soal yang tidak valid,
yaitu soal nomor 1. Ini berarti bahwa harus dilakukan uji validitas tahap-2 dengan cara
menguji kembali setiap butir soal yang valid setelah butir soal nomor 1 dibuang.
Hasil pengujian dapat dilihat pada gambar 3. Dalam gambar 3 terlihat
bahwa:
1) Kelima butir soal yang diuji sudah valid, sehingga uji validitas dihentikan.
2) Hasil pengujian kedua, menunjukkan bahwa ada peningkatan koefisien validitas
untuk kelima butir soal.

3. Reliabilitas
Dalam Afiyanti (2008) Istilah reliabilitas dalam penelitian kualitatif dikenal dengan
istilah dependabilitas. Konsep Reliabilitas ini juga sering menjadi pertimbangan lain dalam
menilai keilmiahan suatu temuan penelitian kualitatif.
Validitas suatu tes yang diberikan ke siswa juga harus reliabel atau ajek, yang
bermakna pengukuran dengan ujian yang dilakukan mendapatkan hasil yang konsisten.
Misalnya, ujian yang diberikan hari ini kepada siswa oleh seorang guru, seharusnya
memberikan nilai yang tidak jauh berbeda apabila diberikan esoknya (karena tidak ada
aktivitas pembelajaran atau lupa pada jangka waktu yang hanya satu hari). Kecilnya
reliabilitas dapat terjadi karena set soal ujian yang tidak baik (butir soal yang
membingungkan) ataupun tidak adanya konsistensi dalam pemberian skor. Kedua hal
tersebut adalah tanggung jawab guru untuk menghindarinya. (Sumintono, B & Widhiarso,
W, 2013).
Ada tiga terminologi yang menggambarkan reliabilitas pengukuran, yaitu stabilitas
(stability), ekuivalensi (equivalency), dan konsistensi internal (internal consistency).
Reliabilitas sebagai koefisien stabilitas menunjukkan hasil yang sama didapatkan dari
pengulangan tes, ekuivalensi menunjukkan seberapa jauh dua tes yang paralel akan
menghasilkan skor tes yang sama, dan konsistensi internal menunjukkan seberapa
konsisten hasil skor tiap butir dalam satu tes. Reliabilitas dapat diestimasi jika ada yang
dibandingkan. Perbandingan antar-waktu yang diturunkan menjadi pendekatan reliabilitas
tes ulang, perbandingan antar-bentuk tes yang diturunkan menjadi reliabilitas tes paralel,
dan perbandingan antar-komponen tes yang diturunkan menjadi pendekatan konsistensi
internal.
a. Pendekatan Tes Ulang. Relabilitas tes ulang didapatkan dari korelasi antara skor
dari tes yang sama. Jika tes diberikan kepada siswa dengan populasi yang sama,
diharapkan koefisien reliabilitas yang mendekati 1. Pada tipe ini, koefisien
reliabilitas didapatkan melalui korelasi skor tes antarwaktu. Ada dua jenis koefisien
korelasi yang dipakai, pertama adalah korelasi Pearson (product moment) dan
korelasi intrakelas (interclass correlation/ICC).
b. Pendekatan Tes Paralel. Tipe ini disusun untuk mengatasi permasalahan yang ada
pada tipe reliabilitas tes paralel berkaitan dengan isu efek bawaan atau kontaminasi.
Reliabilitas tes paralel disebut juga dengan reliabilitas form pengganti (alternate
form). Sama seperti reliabilitas tes ulang, harga reliabilitas didapatkan dari korelasi
antara skor dari kedua tes yang paralel.
c. Pendekatan Konsistensi Internal. Reliabel dalam pengertian konsistensi internal
menunjukkan bahwa antara satu bagian tes dan bagian lainnya menghasilkan
pengukuran yang konsisten. Konsistensi intenal diindikasikan oleh tingginya
korelasi antara belahan tes. Belahan ini dapat berupa butir maupun komponen tes.
Karena itu, dalam pendekatan konsistensi internal dikenal konsistensi dua belahan
tes yang biasa dihitung dengan koefisien Spearman-Brown, atau tiga belahan yang
biasa dihitung dengan koefisien Feldt, atau yang dihitung dengan menggunakan
koefisien alpha.
Konsep reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan masalah
kekeliruan pengukuran. Kekeliruan pengukuran sendiri menunjukkan sejauh mana
inkonsistensi hasil pengukuran terjadi apabila dilakukan pengukuran ulang terhadap
kelompok subyek yang sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil
ukur berkaitan erat dengan kekeliruan dalam pengambilan sampel yang mengacu pada
inkonsistensi hasil ukur apabila pengukuran dilakukan ulang pada kelompok yang berbeda.
Reliabilitas alat penilaian adalah ketepatan atau keajegan alat tersebut dalam menilai apa
yang dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan
hasil yang relatif sama.
Djaali (2000: 81) menyatakan bahwa reliabilitas konsistensi gabungan butir
berkaitan dengan kemantapan antara butir suatu tes. Hal ini dapat diungkapkan dengan
pertanyaan, apakah terhadap obyek ukur yang sama, butir yang satu menunjukkan hasil
ukur yang sama dengan butir yang lainnya? Dengan kata lain bahwa terhadap bagian obyek
ukur yang sama, apakah hasil ukur butir yang satu tidak kontradiksi dengan hasil ukur butir
yang lain.
Jika terhadap bagian obyek ukur yang sama, hasil ukur melalui butir yang satu
kontradiksi atau tidak konsisten dengan hasil ukur melalui butir yang lain maka
pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya. Dengan
kata lain tidak reliabel dan tidak dapat digunakan untuk mengungkap ciri atau keadaan
yang sesungguhnya dari obyek ukur. Kalau hasil pengukuran pada bagian obyek ukur yang
sama antara butir yang satu dengan butir yang lain saling kontradiksi atau tidak konsisten
maka kita jangan menyalahkan obyek ukur, melainkan alat ukur (tes) yang dipersalah-kan
dengan mengatakan bahwa tes tersebut tidak reliabel terhadap obyek yang diukur.
Koefisien reliabilitas konsistensi gabungan butir untuk skor butir dikotomi dapat
dihitung dengan menggunakan rumus Kuder-Richardson yang dikenal dengan nama KR-
20 (Djaali, 2000: 77) dengan rumus:

KR-20 = k 
1
 p i
q 
i 
 2 
k  1 St 
Keterangan:
k = cacah butir.
piqi = varians skor butir.
pi = proporsi jawaban yang benar untuk butir nomor i.
qi = proporsi jawaban yang salah untuk butir nomor i.
St2 = varians skor total responden.

Koefisien reliabilitas gabungan butir untuk skor butir politomi, maka koefisien reliabilitas
dihitung menggunakan koefisien Alpha (Djaali, 2000: 122) dengan rumus:
r  k 1  si2
2

ii  
s
k 1 t 
Keterangan:
rii = koefisien reliabilitas.
k = cacah butir.
si2 = varians skor butir.
st2 = varians skor total responden.

Interpretasi terhadap koefisien reliabilitas merupakan intrepretasi relatif, artinya tidak


ada batasan mutlak yang menunjukkan berapa angka koefisien minimal yang harus dicapai agar
suatu pengukuran dapat disebut reliabel. Namun, memberikan informasi tentang hubungan
varians skor teramati dengan varians skor sejati kelompok individu. Misalnya, diperoleh
koefisien reliabilitas sama dengan 0,87. Koefisien reliabilitas ini dapat diartikan bahwa: (1)
87% varians skor teramati diakibatkan oleh varians skor sejati kelompok individu, dan (2)
korelasi antara skor teramati dan skor sejati sama dengan 0,87 atau 0,93.

Reliabilaitas adalah tingkat ketetapan suatu instrumen mengukur apa yang harus diukur.
Ada tiga cara pelaksanaan untuk menguji reliabilitas suatu tes, yaitu: (1) tes tunggal (single
test), (2) tes ulang (test retest), dan (3) tes ekuivalen (alternate test).

Selanjutnya koefisien reliabilitas keseluruhan tes dihitung menggunakan formula


Spearman-Brown, yaitu:

Kategori koefisien reliabilitas (Guilford, 1956: 145) adalah sebagai berikut:


 0,80 < r11 1,00 reliabilitas sangat tinggi
 0,60 < r11 0,80 reliabilitas tinggi
 0,40 < r11 0,60 reliabilitas sedang
 0,20 < r11 0,40 reliabilitas rendah.
 -1,00 r11 0,20 reliabilitas sangat rendah (tidak reliable).
Berikut Contoh Uji Reliabilitas Belah Dua dengan menggunakan Software MS Excel (Hidayat,
Anwar. 2012):

No Item Jumlah
Jumlah
Responden Awal
1 2 3 4 5 6 7 8 9 10 Akhir (Y)
(X)
1 5 4 2 3 5 2 4 1 2 1 19 10
2 4 3 2 4 3 3 4 3 2 1 16 13
3 3 5 3 4 3 4 3 3 3 2 18 15
4 4 3 3 2 5 4 1 5 2 2 17 14
5 5 4 2 3 5 3 4 1 5 2 19 15
6 3 3 1 4 5 2 1 5 3 3 16 14
7 4 3 2 1 3 4 2 2 2 4 13 14
8 5 3 2 4 3 2 1 4 2 1 17 10
9 5 4 2 4 5 2 3 5 5 2 20 17
10 5 2 2 3 3 2 2 2 4 2 15 12
11 5 5 3 5 4 5 3 5 3 5 22 21
12 5 5 5 4 5 3 2 5 2 3 24 15
13 3 5 1 4 4 2 1 1 2 3 17 9
14 5 3 3 2 4 2 1 3 2 3 17 11
15 3 2 2 4 5 2 3 2 3 1 16 11
16 3 5 3 3 5 4 3 5 5 5 19 22
17 5 4 5 3 3 1 2 3 1 3 20 10
18 5 4 4 4 5 3 3 5 5 5 22 21
19 3 5 2 3 3 3 2 3 5 4 16 17
20 5 2 4 3 5 3 5 5 2 5 19 20
Awal Akhir Awal Awal Awal Awal Awal Akhir Akhir Akhir Akhir Akhir
Pearson (r1/2
0,4
r1/2)
Spearman Brown 0,6
R Tabel 0,5
Tidak Reliabel
Untuk menghitung uji reliabilitas tes bentuk uraian dapat dilakukan dengan menggunakan
rumus Cronbach-Alpha, yaitu:
DAFTAR PUSTAKA

Afiyanti (2008). Validitas dan Reliabilitas dalam Penelitian Kualitatif. Jurnal Keperawatan
Indonesia, Volume 12, No. 2, Juli 2008; Hal 137-141.

Djaali., dkk. Pengukuran Dalam Pendidikan. Jakarta: Program Pascasarjana, 2000.

Hidayat, Anwar (2012). Penjelasan Uji Reliabilitas Instrumen Lengkap. [Online] Diakses dari:
https://www.statistikian.com/2012/10/uji-reliabilitas-instrumen.html

Matondang, Zulkifli (2009). Validitas dan Reliabilitas Suatu Instrumen Penelitian. Jurnal
Tabularasa PPS UNIMED. Vol.6 No.1, Juni 2009

Sumintono, B & Widhiarso, W (2013). Aplikasi Pemodelan RASCH Pada Assessment Pendidikan.
Cimahi: Trim Komunikata Publishing House.

Anda mungkin juga menyukai