PENDAHULUAN
A. Latar Belakang
Salah satu aspek positif kemajuan dari dunia penelitian yang ada di
Indonesia, adalah muncul banyaknya para peneliti-peneliti muda yang kini
lebih kritis lagi dalam meneliti objek-objek yang ada. Di Indonesia, banyak
sekali para peneliti ataupun bukan peneliti yang banyak melakukan sebuah
riset guna memenuhi tugas ataupun sebagai pembuktian dari sebuah kejadian.
Yang dimana setiap penelitian tersebut biasanya memerlukan sebuah
pengujian agar nantinya mampu menjadi sebuah hasil ilmiah yang benar-benar
valid dan bersifat riel tanpa adanya kebohongan ataupun ketidaknyataan yang
mengesankan data yang diperoleh bersifat dibuat-buat. Agar kajian kita bisa
bersifat riel maka kita sebagai seorang peneliti harus menguji terlebih dahulu
hasil penelitian kita yang disebut dengan uji reabilitas.
Kebanyakan dari kita mengira bahwa jika kita mempunyai kesimpulan
dari hasil penelitian kita terhadap kejadian-kejadian yang terbatas, maka
kesimpulan itu berlaku dengan sempurna untuk seluruh kejadian yang sejenis.
Perkiraan semacam itu belum tentu benar, untuk menghindari hal-hal yang
semacam itu maka kita harus melakukan reliabilitas, yang berguna untuk
menunjukkaan kevalidan data dari hasil sebuah penelitian yang kita lakukan.
Reliabilitas mampu menunjukkan tingkat kepercayaan terhadap skor
atau tingkat kecocokan skor dengan skor sesungguhnya. Reliabilitas ini bisa
dicapai melalui tingkat kecocokan di antara skor pada lebih dari sekali
pengukuran. Jika makin cocok dengan skor sesungguhnya maka makin tinggi
tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu merupakan
kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap
ada, namun kemungkinan itu sangatlah kecit sekali dan tidak akan banyak
berpengaruh terhadap hasil akhir dari sebuah pengujian.
1
B. Rumusan Masalah
Berdasarkan latar belakang di atas maka rumusan masalah dalam
makalah ini sebagai berikut:
1. Apakah yang dimaksud dengan reliabilitas?
2. Bagaimanakah Pelaksanaan tes untuk menentukan Reliabilitas?
3. Bagaimanakah metode mencari besar nilai reliabilitas?
4. Bagaimanakah cara menghitung reliabilitas serta contohnya dengan
menggunakan program Quest dan SPSS?
5. Apakah sajakah Faktor- faktor yang mempengaruhi Reliabilitas?
C. Tujuan
Berdasarkan rumusan masalah, maka tujuan dalam makalah ini dapat
diuraikan sebagai berikut:
1. Untuk Menjelaskan pengertian reliabilitas.
2. Untuk Menentukan Pelaksanaan tes untuk menentukan Reliabilitas
3. Untuk Menentukan metode mencari besar nilai reliabilitas.
4. Untuk Menentukan cara menghitung reliabilitas serta contohnya dengan
menggunakan program Quest dan SPSS.
2
BAB II
PEMBAHASAN
3
antara hasil tes pertama dan kedua. Reliabilitas sebuah tes merupakan derajat
konsistensi dari tes tersebut dalam mengukur sesuatu yang diharapkan dapat
terukur[ CITATION Tel11 \l 1033 ].
Sebuah tes yang memiliki reliabilitas yang tinggi belum pasti memiliki
validitas yang tinggi, namun sebuah tes yang memiliki validitas yang tinggi
biasanya dapat dipastikan memiliki reliabilitas yang tinggi pula (Arikunto,
2010: 87; Alias, 2005). Suatu tes (alat ukur) dinyatakan memiliki
reliabilitas/taraf kepercayaan yang tinggi apabila tes tersebut dapat
memberikan hasil/gambaran data atau informasi yang tetap apabila diujikan
beberapa kali, walaupun pada testee (objek-dalam hal ini siswa) yang berbeda
[CITATION Ari101 \p 86 \l 1033 ].
4
satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-
test-double-trial method. Kemudian hasil dari kedua tes tersebut dihitung
korelasinya.
Tes ekuivalen adalah tes yang terdiri dari dua perangkat dimana soal –
soal pada perangkat pertama ekuivalen dengan soal – soal pada perangkat
kedua. Pengertian ekuivalen disini adalah soal – soal yang memuat konsep
yang sama, tetapi soal tersebut tidak persis sama. Selain memuat konsep
yang sama, tingkat kesukarannya pun harus sama. Misalkan untuk soal
pemfaktoran suku tiga bentuk ekuivalen dengan bentuk , tetapi tidak
ekuivalen dengan bentuk sebab meskipun konsep suku tiga dan
pemfaktoranya sama tetapi tingkat kesukarannya berbeda. Untuk
menentukan reliabilitasnya dihitung dengan cara mengkorelasikan hasil tes
untuk soal perangkat pertama dengan hasil tes dari perangkat kedua.
5
dalam penelitian pendidikan mengacu pada tiga prinsip reliabilitas, yaitu: (1)
Stabilitas; (2) Ekuivalensi; dan (3) Konsistensi internal [CITATION Ayo12 \l
1033 ]. Beberapa metode/cara untuk menentukan besar nilai reliabilitas
berbasis tiga prinsip tersebut, antara lain: (1) metode tes ulang (test-retest
method); (2) metode bentuk paralel (alternate/parallel form); (3) metode
belah dua (split-half method); (4) metode Kuder-Richardson-20 & 21; (5)
metode Cronbach alpha (Ayodele, 2012; Arikunto, 2010: 90-112; Cook &
Beckman, 2006) yang dijelaskan lebih lanjut sebagai berikut:
1. Metode tes ulang (test-retest method)
Metode tes ulang (test-retest method) merupakan metode yang
digunakan dimana tes diberikan kepada satu orang testee pada dua
kesempatan yang berbeda [ CITATION Coo06 \l 1033 ]. Metode tes ulang
dilakukan untuk menghindari penyusunan dua seri tes. Satu tes disusun
oleh tester untuk dicobakan dua kali. Oleh karena tesnya hanya satu dan
dicobakan dua kali, metode ini dapat disebut juga single-test-double-trial-
method. Besar nilai reliabilitas melalui metode ini dapat dilihat pada besar
koefisien korelasi antara tes pertama dan tes kedua [CITATION Ari101 \p
91 \l 1033 ]. Koefisien korelasi untuk tes yang dapat dinyatakan reliabel
dan layak untuk dicobakan yaitu 0.70 keatas [ CITATION Tel11 \l 1033 ].
Ayodele [CITATION Ayo12 \n \t \l 1033 ] menyatakan terdapat
beberapa faktor yang perlu diperhatikan dalam penggunaan metode ini,
antara lain:
a. Rentang waktu antara tes pertama (test) dan tes kedua (retest) tidak
boleh panjang (lama) untuk me
b. nghindari faktor perubahan situasi.
c. Rentang waktu antara tes pertama (test) dan tes kedua (retest) tidak
boleh pendek (cepat) untuk menghindari faktor testee yang masih
mengingat materi tes pertama.
d. Testee harus mengetahui materi soal pertama maupun kedua dan
seharusnya terdapat perbedaan skor antara test dan retest.
6
Rentang waktu antara tes pertama dan tes kedua idealnya antara 2-4
minggu (Felder & Spurlin, 2005; Tella, 2011; Carmines & Zeller, 1979).
7
Arikunto[CITATION Ari101 \p 93 \n \t \l 1033 ] menguraikan bahwa ada
dua cara dalam membelah item (butir) soal, yaitu:
a. Membelah dengan membagi item berdasarkan nomor genap-ganjilnya
item yang selanjutnya disebut dengan belahan genap-ganjil.
b. Membelah dengan membagi item berdasarkan awal-akhir item, 50%
item awal disebut bagian awal, 50% item akhir disebut item akhir,
selanjutnnya pembelahan ini disebut belahan awal-akhir.
Secara umum persamaan yang digunakan untuk menentukan besar
nilai reliabilitas melalui metode belah dua yaitu dengan menggunakan
rumus Spearman-Brown (Arikunto, 2010: 93; Cook & Beckman, 2006;
Ayodele, 2012) seperti disajikan berikut:
2r
Reliabilitas = dimana r = korelasi antar skor-skor setiap belahan
1+ r
Secara khusus metode belah dua dengan belahan genap-ganjil
menggunakan rumus Flanagan yaitu:
S12 S 22
r11 21 2
ST
Keterangan:
r11 = reliabilitas tes secara keseluruhan
S12 = varians skor belahan ganjil
S22 = varians skor belahan genap
ST2 = varians skor total
8
d = difference yaitu perbedaan skor antara belahan awal dan
belahan akhir
Keterangan:
r20 = reliabilitas tes secara keseluruhan
k = jumlah item
S2 = varians skor
p = proporsi subjek yang menjawab item dengan benar
q = proporsi subjek yang menjawab item dengan salah/p=1-q
9
Rumus K-R 21 disajikan seperti berikut:
Keterangan:
r21 = reliabilitas tes secara keseluruhan
k = jumlah item
S2 = varians skor
M = mean skor
Keterangan:
α = reliabilitas tes yang dicari
N = jumlah item
Si 2 = varians skor tiap item
Sx2 = varians total
10
1. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan
program SPSS
Skor perolehan dari testee disusun seperti gambar berikut:
11
Reliability Statistics
Cronbach's
Alpha N of Items
.248 30
Model yang dipilih pada pengujian ini yaitu dengan menggunakan
model/metode Alpha sehingga interpretasi output yang muncul yakni
dengan melihat angka pada kolom Cronbach's Alpha dimana pada uji ini,
nilai reliabilitas dari data yang diuji adalah 0.248. Oleh karena nilai
reliabilitas tidak memenuhi standar reliabilitas (jumlah soal 30, standar
reliabilitas = 0.55) maka data/paket tes dinyatakan kurang reliabel.
12
kemampuan yang diukur. Dengan demikian, ketepatan pengukuran
pada level-level skor yang tertentu tidak dikenal/tidak diketahui.
Oleh karena itu, pada makalah ini ditunjukkan cara mencari nilai
reliabilitas dengan menggunakan program Quest yang merupakan salah
satu program analisis item berbasis IRT.
Etimasi reliabilitas menurut IRT dihitung berdasarkan item disebut
indeks sparasi item dan berdasarkan testee (case/person) dan disebut
dengan indeks sparasi person. Semakin tinggi estimasi ideks sparasi
item semakin tepat keseluruhan item dianalisis menurut model yang
digunakan. Semakin tinggi indeks sparasi person semakin konsisten
setiap item pengukur digunakan untuk mengukur testee yang
bersangkutan. Estimasi reliabilitas berdasarkan testee (case/person)
sama kedudukannya dengan reliabilitas menurut CTT—yakni
reliabilitas menurut alpha Cronbach untuk data politomus dan
reliabilitas menurut Kuder-Richardson-20 untuk data dikotomus.
Indeks separasi item (item separation index atau RI) disebut dengan
istilah ”reliabilitas sampel”, indeks sparasi person disebut dengan
”reliabilitas tes”.
Cara menghitung reliabilitas dengan menggunakan program Quest
dipaparkan sebagai berikut:
a. Membuat data yang akan dianalisis pada notepad dengan kode
simpan .txt atau .dat seperti gambar berikut:
13
14
b. Membuat sintaks pada windows Quest seperti gambar berikut:
15
Sel
anjutnya akan muncul beberapa output dan output yang dipilih untuk
melihat nilai reliabilitas yaitu output yang berkode XXXXsh.out. Berikut
salah satu contoh output untuk menginterpretasikan nilai reliabilitas tes:
16
Berdasarkan reliability of estimate diperoleh nilai reliabilitas 0.00 yang
bermakna bahwa data kurang reliabel. Nilai reliabilitas berdasarkan
estimasi case atau testee disebut dengan reliabitas tes. Semakin tinggi
nilainya semakin meyakinkan bahwa pengukuran memberikan hasil yang
konsisten. Hasil ini juga ditentukan oleh karakteristik sampel. Semakin
rendah berarti juga semakin banyak sampel untuk uji coba yang tidak
memberikan informasi yang diharapkan. (tidak mengerjakan, atau
mengerjakan secara asal-asalan). Data tersebut merupakan hasil tes pilihan
ganda yang berupa data dengan skala dikotomus.
17
1. Panjang test, semakin panjang test evaluasi, semakin banyak jumlah item
materi pembelajaran diukur. Ini menunjukan dua kemungkinan yaitu test
semakin mendekati kebenaran, dan dalam memgikuti test, semakin kecil
siswa menebak. Berarti semakin tinggi koefisien reliabilitas.
2. Penyebaran skor koefisien reliabiltas secara langsung dipengeruhioleh
bentuk sebaranskor dalam kelompok siswa yang diukur. Semakin tinggi
sebaran semakin tingi estimasi koefisien reliabilitas. Hal ini tejadi karena
posisi skor siswa, secara individual mempunyai kedudukan sama pada tes
retest lain,sebagai acuan.
3. Kesulitan test; test normative yang terlalu mudah atau terlalu sulitskor
untuk siswa cenderung menghasilkan reliabilitas rendah. Fenomena
tersebut, akan menghasilkan sebaran skor yang cenderung terbatas pada
salah satu sisi. Untuk test yang terlalu mudah skor jawaban siswa akan
mengumpul ada sisi atas, untuk tes terlalu sulit skor jawaban siswa akan
cenderung mengumpul pada ujung bawah. Dua kejadian tersebut
mempunyai kesamaan yaitu bahwa perbedaan di antara individu adalah
kecil dan cenderung tidak relevan
4. Objektivitas; yang di maksud objekif yaitu derajat dimana siswa dengan
kompetensi sama mencapai hasil sama. Ketika prosedur test evaluasi
memiliki objektivitas tinggi, maka reliabilitas test tidak dipengaruhi oleh
prosedur teknik penskoran. Item test objektif yang dihasilkan tidak
dipengaruhi pertimbangan atau opini seorang evaluator.
18
BAB III
PENUTUP
A. Kesimpulan
Berdasarkan uraian materi diatas, maka isi dari makalah ini dapat
disimpulkan sebagi berikut :
1. Reliabilitas merupakan derajat konsistensi, kepercayaan, ketetapan,
kestabilan dari suatu tes dalam mengukur sesuatu yang diharapkan dapat
terukur.
2. Metode yang digunakan untuk mencari besar nilai reliabilitas dalam
penelitian pendidikan mengacu pada tiga prinsip reliabilitas, yaitu: (1)
Stabilitas; (2) Ekuivalensi; dan (3) Konsistensi internal.
3. Beberapa metode/cara untuk menentukan besar nilai reliabilitas berbasis
tiga prinsip tersebut, antara lain: (1) metode tes ulang (test-retest method);
(2) metode bentuk paralel (alternate/parallel form); (3) metode belah dua
(split-half method); (4) metode Kuder-Richardson-20 & 21; (5) metode
Cronbach alpha.
4. Cara menghitung nilai reliabilitas dengan menggunakan program SPSS
dapat menggunakan beberapa model sesuai dengan kebutuhan penguji.
5. Cara menghitung nilai reliabilitas dengan menggunakan program Quest
dapat dilihat pada output yang berkode sh.out dengan menginterpretasikan
angka pada reliability of estimate.
19
DAFTAR ISI
Carmines, E. G., & Zeller, R. A. (1979). Reliability and validity assessment. USA:
Sage Publications.
Cook, D. A., & Beckman, T. J. (2006). Current concepts in validity and reliability
for psychometric instruments: theory and application. The American
Journal of Medicine, 119(2), 166.e7-166.e16.
Felder, R. M., & Spurlin, J. (2005). Applications, reliabillity and validity of the
index of learning styles. International Journal Engng Education, 21(1),
103-112.
20
Ross, J. A. (2006). The Reliability, validity, and utility of self-assessment.
Practical Assessment Research & Evaluation, 11(10), 1-13.
Subali, B., & Suyata, P. (2011a). Panduan analisis data pengukuran pendidikan
untuk memperoleh bukti empirik kesahihan menggunakan program Quest.
Yogyakarta: (Versi Elektronik).
21