Anda di halaman 1dari 21

BAB I

PENDAHULUAN
A. Latar Belakang
Salah satu aspek positif kemajuan dari dunia penelitian yang ada di
Indonesia, adalah muncul banyaknya para peneliti-peneliti muda yang kini
lebih kritis lagi dalam meneliti objek-objek yang ada. Di Indonesia, banyak
sekali para peneliti ataupun bukan peneliti yang banyak melakukan sebuah
riset guna memenuhi tugas ataupun sebagai pembuktian dari sebuah kejadian.
Yang dimana setiap penelitian tersebut biasanya memerlukan sebuah
pengujian agar nantinya mampu menjadi sebuah hasil ilmiah yang benar-benar
valid dan bersifat riel tanpa adanya kebohongan ataupun ketidaknyataan yang
mengesankan data yang diperoleh bersifat dibuat-buat. Agar kajian kita bisa
bersifat riel maka kita sebagai seorang peneliti harus menguji terlebih dahulu
hasil penelitian kita yang disebut dengan uji reabilitas.
Kebanyakan dari kita mengira bahwa jika kita mempunyai kesimpulan
dari hasil penelitian kita terhadap kejadian-kejadian yang terbatas, maka
kesimpulan itu berlaku dengan sempurna untuk seluruh kejadian yang sejenis.
Perkiraan semacam itu belum tentu benar, untuk menghindari hal-hal yang
semacam itu maka kita harus melakukan reliabilitas, yang berguna untuk
menunjukkaan kevalidan data dari hasil sebuah penelitian yang kita lakukan.
Reliabilitas mampu menunjukkan tingkat kepercayaan terhadap skor
atau tingkat kecocokan skor dengan skor sesungguhnya. Reliabilitas ini bisa
dicapai melalui tingkat kecocokan di antara skor pada lebih dari sekali
pengukuran. Jika makin cocok dengan skor sesungguhnya maka makin tinggi
tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu merupakan
kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap
ada, namun kemungkinan itu sangatlah kecit sekali dan tidak akan banyak
berpengaruh terhadap hasil akhir dari sebuah pengujian.

1
B. Rumusan Masalah
Berdasarkan latar belakang di atas maka rumusan masalah dalam
makalah ini sebagai berikut:
1. Apakah yang dimaksud dengan reliabilitas?
2. Bagaimanakah Pelaksanaan tes untuk menentukan Reliabilitas?
3. Bagaimanakah metode mencari besar nilai reliabilitas?
4. Bagaimanakah cara menghitung reliabilitas serta contohnya dengan
menggunakan program Quest dan SPSS?
5. Apakah sajakah Faktor- faktor yang mempengaruhi Reliabilitas?
C. Tujuan
Berdasarkan rumusan masalah, maka tujuan dalam makalah ini dapat
diuraikan sebagai berikut:
1. Untuk Menjelaskan pengertian reliabilitas.
2. Untuk Menentukan Pelaksanaan tes untuk menentukan Reliabilitas
3. Untuk Menentukan metode mencari besar nilai reliabilitas.
4. Untuk Menentukan cara menghitung reliabilitas serta contohnya dengan
menggunakan program Quest dan SPSS.

2
BAB II
PEMBAHASAN

A. Pengertian Reliabilitas Tes


Reliabilitas berasal dari kata rely yang artinya percaya dan reliable
yang artinya dapat di percaya (Purwanto, 2010). Reliabilitas sering diartikan
dengan keterandalan artinya suatu tes memiliki keterandalan bila mana tes
tersebut dipakai mengukur berulang-ulang hasilnya sama. Dengan demikian
reliabilitas dapat pula diartikan dengan keajengan atau stabilitas. Reliabilitas
diartikan dengan keajengan bila mana tes tersebut diujikan berkali- kali
hasilnya relatif sama, artinya setelah hasil tes pertama dengan tes berikutnya
dikorelasikan terdapat hasil korelasi yang signifikan.
Reliabilitas juga menunjuk pada ketetapan (konsistensi) dari nilai yang
diperoleh sekelompok individu dalam kesempatan yang berbeda dengan tes
yang sama ataupun yang itemnya ekuivalen(Thoha,1991). Reliabilitas dan
validitas merupakan indikator utama pada sebuah tes. Validitas berhubungan
dengan makna ketepatan, dan reliabilitas berhubungan dengan makna
ketetapan dan kepercayaan [CITATION Ali05 \l 1033 ]. Lankes [CITATION
Lan08 \n \t \l 1033 ] menyatakan bahwa reliabilitas menunjuk pada sesuatu
atau seseorang yang independen dan konsisten secara kualitas. Reliabilitas
merupakan indikator konsistensi antara dua atau lebih pengukuran pada tes
yang sama [ CITATION Ali05 \l 1033 ].
Secara garis besar dapat dinyatakan bahwa reliabilitas menunjuk pada
konsistensi (stabilitas) skor yang dihasil melalui pengukuran dengan
menggunakan alat ukur tertentu (Reynolds, et al., 2009: 91; Ross, 2006).
Makna ketetapan/konsistensi dalam konteks reliabilitas dapat diilustrasikan
seperti: jika diperoleh hasil tes A menunjukkan nilai yang lebih rendah dari
hasil tes B, maka ketika dilakukan tes ulang dengan alat ukur yang serupa
kepada keduanya, hasil tes tetap akan menunjukkan bahwa A memperoleh
nilai yang lebih rendah dari hasil tes B, meskipun nilai keduanya tidak sama

3
antara hasil tes pertama dan kedua. Reliabilitas sebuah tes merupakan derajat
konsistensi dari tes tersebut dalam mengukur sesuatu yang diharapkan dapat
terukur[ CITATION Tel11 \l 1033 ].
Sebuah tes yang memiliki reliabilitas yang tinggi belum pasti memiliki
validitas yang tinggi, namun sebuah tes yang memiliki validitas yang tinggi
biasanya dapat dipastikan memiliki reliabilitas yang tinggi pula (Arikunto,
2010: 87; Alias, 2005). Suatu tes (alat ukur) dinyatakan memiliki
reliabilitas/taraf kepercayaan yang tinggi apabila tes tersebut dapat
memberikan hasil/gambaran data atau informasi yang tetap apabila diujikan
beberapa kali, walaupun pada testee (objek-dalam hal ini siswa) yang berbeda
[CITATION Ari101 \p 86 \l 1033 ].

B. Pelaksanaan Tes Untuk Menentukan Reliabilitas


Untuk mengestimasi reliabilitas suatu alat penilaian (tes dan non tes)
ada tiga cara yang paling banyak dipergunakan, yaitu tes tunggal (single test),
tes ulang (test re-test), dan tes ekuivalen (alternate test).
1. Tes Tunggal (single Test)
Tes tunggal adalah tes yang terdiri dari satu perangkat (satu set) yang
diberikan terhadap sekelompok subyek dalam satu kali pelaksanaan.
Dengan demikian hasil tes ini hanya terdapat satu kelompok data berupa
skor hasil tes. Ada bermacam – macam teknik yang bisa digunakan untuk
menentukan reliabilitas jenis tes tunggal ini.
2. Tes Ulang ( Test Re-test)
Tes ulang adalah tes yang terdiri dari seperangkat tes yang diberikan
kepada sekelompok subyek dua kali. Reliabilitasnya dihitung dengan cara
mengkorelasikan hasil tes pertama dengan tes kedua. (Metode tes ulang
adalah penggunaan tes yang sama dua kali pada sejumlah peserta tes yang
sama).
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua
seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya
memiliki satu seri tes tetapi dicobakan dua kali. Oleh karena tesnya hanya

4
satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-
test-double-trial method. Kemudian hasil dari kedua tes tersebut dihitung
korelasinya.

3. Tes Ekuivalen (alternate test)

Tes ekuivalen adalah tes yang terdiri dari dua perangkat dimana soal –
soal pada perangkat pertama ekuivalen dengan soal – soal pada perangkat
kedua. Pengertian ekuivalen disini adalah soal – soal yang memuat konsep
yang sama, tetapi soal tersebut tidak persis sama. Selain memuat konsep
yang sama, tingkat kesukarannya pun harus sama. Misalkan untuk soal
pemfaktoran suku tiga bentuk  ekuivalen dengan bentuk  , tetapi tidak
ekuivalen dengan bentuk  sebab meskipun konsep suku tiga dan
pemfaktoranya sama tetapi tingkat kesukarannya berbeda. Untuk
menentukan reliabilitasnya dihitung dengan cara mengkorelasikan hasil tes
untuk soal perangkat pertama dengan hasil tes dari perangkat kedua.

C. Metode Mencari Besar Nilai Reliabilitas


Besar nilai reliabilitas dari sebuah paket tes ditentukan oleh nilai
koefisien reliabilitas. Nilai koefisien reliabilitas dipengaruhi oleh jumlah item
dalam sebuah paket soal. Hubungan antara jumlah item soal dengan koefisien
reliabilitas disajikan seperti berikut:
Tabel 1
Hubungan Antara Jumlah Item dengan Koefisien Reliabilitas

Jumlah Soal Koefisien Reliabilitas


5 0.20
10 0.33
20 0.50
40 0.67
60 0.75
80 0.80
100 0.83
200 0.95
300 0.94
[ CITATION Ebe91 \l 1033 ]
Terdapat berbagai cara untuk mencari/menentukan besar nilai
reliabilitas. Metode yang digunakan untuk mencari besar nilai reliabilitas

5
dalam penelitian pendidikan mengacu pada tiga prinsip reliabilitas, yaitu: (1)
Stabilitas; (2) Ekuivalensi; dan (3) Konsistensi internal [CITATION Ayo12 \l
1033 ]. Beberapa metode/cara untuk menentukan besar nilai reliabilitas
berbasis tiga prinsip tersebut, antara lain: (1) metode tes ulang (test-retest
method); (2) metode bentuk paralel (alternate/parallel form); (3) metode
belah dua (split-half method); (4) metode Kuder-Richardson-20 & 21; (5)
metode Cronbach alpha (Ayodele, 2012; Arikunto, 2010: 90-112; Cook &
Beckman, 2006) yang dijelaskan lebih lanjut sebagai berikut:
1. Metode tes ulang (test-retest method)
Metode tes ulang (test-retest method) merupakan metode yang
digunakan dimana tes diberikan kepada satu orang testee pada dua
kesempatan yang berbeda [ CITATION Coo06 \l 1033 ]. Metode tes ulang
dilakukan untuk menghindari penyusunan dua seri tes. Satu tes disusun
oleh tester untuk dicobakan dua kali. Oleh karena tesnya hanya satu dan
dicobakan dua kali, metode ini dapat disebut juga single-test-double-trial-
method. Besar nilai reliabilitas melalui metode ini dapat dilihat pada besar
koefisien korelasi antara tes pertama dan tes kedua [CITATION Ari101 \p
91 \l 1033 ]. Koefisien korelasi untuk tes yang dapat dinyatakan reliabel
dan layak untuk dicobakan yaitu 0.70 keatas [ CITATION Tel11 \l 1033 ].
Ayodele [CITATION Ayo12 \n \t \l 1033 ] menyatakan terdapat
beberapa faktor yang perlu diperhatikan dalam penggunaan metode ini,
antara lain:
a. Rentang waktu antara tes pertama (test) dan tes kedua (retest) tidak
boleh panjang (lama) untuk me
b. nghindari faktor perubahan situasi.
c. Rentang waktu antara tes pertama (test) dan tes kedua (retest) tidak
boleh pendek (cepat) untuk menghindari faktor testee yang masih
mengingat materi tes pertama.
d. Testee harus mengetahui materi soal pertama maupun kedua dan
seharusnya terdapat perbedaan skor antara test dan retest.

6
Rentang waktu antara tes pertama dan tes kedua idealnya antara 2-4
minggu (Felder & Spurlin, 2005; Tella, 2011; Carmines & Zeller, 1979).

2. Metode bentuk paralel (alternate/parallel form)


Metode ini disebut juga dengan alternate-forms method (Arikunto,
2010: 90; Ayodele, 2012; Cook & Beckman, 2006). Tester yang
menggunakan metode ini perlu mengembangkan dua paket tes yang
mempunyai kesamaan dalam tujuan, isi, spesifikasi, jumlah, format,
tingkat kesukaran dan diskriminan. Menentukan besar nilai reliabilitas
menggunakan tes paralel disebut juga dengan metode double-test-double-
trial-method (Arikunto, 2010: 91; Ayodele, 2012). Dua paket tes yang
dikembangkan dicobakan pada testee yang sama dalam kesempatan yang
sama maupun kesempatan yang berbeda.
Hal ini dapat diilustrasikan apabila paket soal A yang ingin diketahui
reliabilitasnya diberikan kepada testee, selanjutnya paket soal B diberikan
juga kepada testee baik dalam kesempatan yang sama (jika
memungkinkan) maupun kesempatan yang berbeda. Besar nilai reliabilitas
melalui metode ini dapat dilihat pada besar koefisien korelasi antara kedua
tes. Koefisien korelasi untuk tes yang dapat dinyatakan reliabel dan layak
untuk dicobakan yaitu 0.70 keatas.

3. Metode belah dua (split-half method)


Pada metode ini, satu paket tes dicobakan pada testee hanya satu kali
sehingga disebut juga single-test-single-trial-method. Hasil tes dianalisis
dengan metode belah dua. Persyaratan khusus untuk penggunaan metode
ini yaitu memastikan bahwa item soal dikembangkan dengan jumlah yang
genap sehingga dapat dibagi dua sama banyak.
Kemungkinan terjadinya kesalahan dalam metode belah dua ini yaitu
adanya kecenderungan kesalahan dalam melakukan belah dua dengan
membelah dua testee. Prosedur dalam metode belah dua yaitu dengan
membelah item tes, bukan membelah dua testee dari jumlah total.

7
Arikunto[CITATION Ari101 \p 93 \n \t \l 1033 ] menguraikan bahwa ada
dua cara dalam membelah item (butir) soal, yaitu:
a. Membelah dengan membagi item berdasarkan nomor genap-ganjilnya
item yang selanjutnya disebut dengan belahan genap-ganjil.
b. Membelah dengan membagi item berdasarkan awal-akhir item, 50%
item awal disebut bagian awal, 50% item akhir disebut item akhir,
selanjutnnya pembelahan ini disebut belahan awal-akhir.
Secara umum persamaan yang digunakan untuk menentukan besar
nilai reliabilitas melalui metode belah dua yaitu dengan menggunakan
rumus Spearman-Brown (Arikunto, 2010: 93; Cook & Beckman, 2006;
Ayodele, 2012) seperti disajikan berikut:
2r
Reliabilitas = dimana r = korelasi antar skor-skor setiap belahan
1+ r
Secara khusus metode belah dua dengan belahan genap-ganjil
menggunakan rumus Flanagan yaitu:

 S12  S 22 
r11  21  2  
 ST 
Keterangan:
r11 = reliabilitas tes secara keseluruhan
S12 = varians skor belahan ganjil
S22 = varians skor belahan genap
ST2 = varians skor total

Metode belah dua dengan belahan awal-akhir menggunakan rumus Rulon


yaitu: 2
Sd
r 11 =1−
S2t
Keterangan:
r11 = reliabilitas tes secara keseluruhan
Sd 2 = varians beda

8
d = difference yaitu perbedaan skor antara belahan awal dan
belahan akhir

Penggunaan metode ini disertai dengan beberapa syarat yang perlu


diperhatikan, antara lain:
a. Banyaknya item harus genap sehingga pembelahan dapat terbagi sama
rata.
b. Item-item soal harus homogen atau paling tidak setelah dilakukan
pembelahan terdapat keseimbangan antar belahan.

4. Metode Kuder-Richardson-20 & 21


Metode ini digunakan apabila kesulitan memenuhi persyaratan pada
metode belah dua. Metode K-R 20 &21 digunakan pada data dikotomus,
data yang secara sederhana apabila benar mendapatkan poin 1 dan salah
mendapatkan poin 0 (Carmines & Zeller, 1979: 48; Reynolds, Livingston,
& Willson, 2009: 101; Cook & Beckman, 2006). Data seperti itu
umumnya terdapat pada jenis tes objektif seperti pilihan ganda, benar-
salah, menjodohkan, dll.
Terdapat dua rumus yang digunakan pada metode Kuder-
Richardson-20 & 21 yaitu rumus K-R 20 dan rumus K-R 21. Rumus K-R
20 disajikan seperti berikut:

Keterangan:
r20 = reliabilitas tes secara keseluruhan
k = jumlah item
S2 = varians skor
p = proporsi subjek yang menjawab item dengan benar
q = proporsi subjek yang menjawab item dengan salah/p=1-q

9
Rumus K-R 21 disajikan seperti berikut:

Keterangan:
r21 = reliabilitas tes secara keseluruhan
k = jumlah item
S2 = varians skor
M = mean skor

5. Metode Cronbach alpha


Metode Cronbach alpha umumnya digunakan pada tipe data yang
bukan data dikotomus seperti pada metode-metode sebelumnya, namun
metode ini dapat diterapkan pada tipe data yang lebih kompleks
(politomus). Metode ini dapat juga digunakan untuk menghitung
reliabilitas tes uraian (Arikunto, 2010: 108; Cook & Beckman, 2006;
Ayodele, 2012). Besar nilai reliabilitas dapat dihitung dengan
menggunakan rumus Alpha seperti disajikan berikut:

Keterangan:
α = reliabilitas tes yang dicari
N = jumlah item
Si 2 = varians skor tiap item
Sx2 = varians total

D. Cara Menghitung Reliabilitas Serta Contohnya


Berikut diuraikan cara menghitung reliabilitas serta contohnya dengan
menggunakan program SPSS dan Quest.

10
1. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan
program SPSS
Skor perolehan dari testee disusun seperti gambar berikut:

Pada windows SPSS, klik AnalyzeScaleReliability Analysis


masukkan semua Butir ke dalam Items Pilih metode yang diinginkan
pada tool ModelOk

Windows akan muncul seperti berikut:

Setelah itu akan muncul output seperti berikut:

11
Reliability Statistics
Cronbach's
Alpha N of Items
.248 30
Model yang dipilih pada pengujian ini yaitu dengan menggunakan
model/metode Alpha sehingga interpretasi output yang muncul yakni
dengan melihat angka pada kolom Cronbach's Alpha dimana pada uji ini,
nilai reliabilitas dari data yang diuji adalah 0.248. Oleh karena nilai
reliabilitas tidak memenuhi standar reliabilitas (jumlah soal 30, standar
reliabilitas = 0.55) maka data/paket tes dinyatakan kurang reliabel.

2. Cara Menghitung Reliabilitas Serta Contohnya dengan menggunakan


program Quest
Program Quest merupakan salah satu program yang digunakan
berbasis pendekatan Item Respons Theory dimana diantaranya: Quest,
Ascal, Rascal, Bilog, Bigstep, dll. Sebelum IRT dikembangkan, terlebih
dahulu terdapat satu pendekatan dalam menganalisis item yaitu
pendekatan Classical Test Theory atau CTT dimana salah satu contoh
program berbasis CTT yaitu Iteman. Namun, Subali & Suyata (2011a;
2011b) memaparkan bahwa terdapat keterbatasan dalam proses analisis
item berbasis CTT, diantaranya:
a. Statistika CTT bergantung kepada subpopulasi penempuh tes.
Berbeda grup penempuh tes berbeda pula nilai rata-rata skor dari
atribut variabel yang diukur. Dengan demikian, para pengembang tes
harus hati-hati ketika memilih sampel untuk kalibrasi item. Jika
sampel-sampel kalibrasi berbeda karakteristik/sifat dengan sampel
operasional (sampel populasi yang sesungguhnya sebagai target),
properti-properti psikometri hasil pengukuran akan berubah secara
dramatis.
b. Ketepatan pengukuran suatu tes (galat baku atau standard error
pengukuran) secara implisit dirata-ratakan ke semua level

12
kemampuan yang diukur. Dengan demikian, ketepatan pengukuran
pada level-level skor yang tertentu tidak dikenal/tidak diketahui.
Oleh karena itu, pada makalah ini ditunjukkan cara mencari nilai
reliabilitas dengan menggunakan program Quest yang merupakan salah
satu program analisis item berbasis IRT.
Etimasi reliabilitas menurut IRT dihitung berdasarkan item disebut
indeks sparasi item dan berdasarkan testee (case/person) dan disebut
dengan indeks sparasi person. Semakin tinggi estimasi ideks sparasi
item semakin tepat keseluruhan item dianalisis menurut model yang
digunakan. Semakin tinggi indeks sparasi person semakin konsisten
setiap item pengukur digunakan untuk mengukur testee yang
bersangkutan. Estimasi reliabilitas berdasarkan testee (case/person)
sama kedudukannya dengan reliabilitas menurut CTT—yakni
reliabilitas menurut alpha Cronbach untuk data politomus dan
reliabilitas menurut Kuder-Richardson-20 untuk data dikotomus.
Indeks separasi item (item separation index atau RI) disebut dengan
istilah ”reliabilitas sampel”, indeks sparasi person disebut dengan
”reliabilitas tes”.
Cara menghitung reliabilitas dengan menggunakan program Quest
dipaparkan sebagai berikut:
a. Membuat data yang akan dianalisis pada notepad dengan kode
simpan .txt atau .dat seperti gambar berikut:

13
14
b. Membuat sintaks pada windows Quest seperti gambar berikut:

Dengan keterangan sebagai berikut:

15
Sel
anjutnya akan muncul beberapa output dan output yang dipilih untuk
melihat nilai reliabilitas yaitu output yang berkode XXXXsh.out. Berikut
salah satu contoh output untuk menginterpretasikan nilai reliabilitas tes:

16
Berdasarkan reliability of estimate diperoleh nilai reliabilitas 0.00 yang
bermakna bahwa data kurang reliabel. Nilai reliabilitas berdasarkan
estimasi case atau testee disebut dengan reliabitas tes. Semakin tinggi
nilainya semakin meyakinkan bahwa pengukuran memberikan hasil yang
konsisten. Hasil ini juga ditentukan oleh karakteristik sampel. Semakin
rendah berarti juga semakin banyak sampel untuk uji coba yang tidak
memberikan informasi yang diharapkan. (tidak mengerjakan, atau
mengerjakan secara asal-asalan). Data tersebut merupakan hasil tes pilihan
ganda yang berupa data dengan skala dikotomus.

E. Faktor-faktor yang Mempengaruhi Reliabilitas


Reliabilitas dapat dipengaruhi oleh waktu penyelenggaran tes-retes.
Interval penyelengaraan yang terlalu dekat atau jauh, akan mempengruhi
koefisien reliabilitas. Faktor-factor lain yang mempengaruhi di antaranya;

17
1. Panjang test, semakin panjang test evaluasi, semakin banyak jumlah item
materi pembelajaran diukur. Ini menunjukan dua kemungkinan yaitu test
semakin mendekati kebenaran,  dan dalam memgikuti test, semakin kecil
siswa menebak. Berarti semakin tinggi koefisien reliabilitas.
2. Penyebaran skor koefisien reliabiltas secara langsung dipengeruhioleh
bentuk sebaranskor dalam kelompok siswa yang diukur. Semakin tinggi
sebaran semakin tingi estimasi koefisien reliabilitas. Hal ini tejadi karena
posisi skor siswa, secara individual mempunyai kedudukan sama pada tes
retest lain,sebagai acuan.
3. Kesulitan test; test normative yang terlalu mudah atau terlalu sulitskor
untuk siswa cenderung menghasilkan reliabilitas rendah. Fenomena
tersebut, akan menghasilkan sebaran skor yang cenderung terbatas pada
salah satu sisi. Untuk test yang terlalu mudah skor jawaban siswa akan
mengumpul ada sisi atas, untuk tes terlalu sulit skor jawaban siswa akan
cenderung mengumpul pada ujung bawah. Dua kejadian tersebut
mempunyai kesamaan yaitu bahwa perbedaan di antara individu adalah
kecil dan cenderung tidak relevan
4. Objektivitas; yang di maksud objekif yaitu derajat dimana siswa dengan
kompetensi sama mencapai hasil sama. Ketika prosedur test evaluasi
memiliki objektivitas tinggi, maka reliabilitas test tidak dipengaruhi oleh
prosedur teknik penskoran. Item test objektif yang dihasilkan tidak
dipengaruhi pertimbangan atau opini seorang evaluator.

18
BAB III
PENUTUP

A. Kesimpulan
Berdasarkan uraian materi diatas, maka isi dari makalah ini dapat
disimpulkan sebagi berikut :
1. Reliabilitas merupakan derajat konsistensi, kepercayaan, ketetapan,
kestabilan dari suatu tes dalam mengukur sesuatu yang diharapkan dapat
terukur.
2. Metode yang digunakan untuk mencari besar nilai reliabilitas dalam
penelitian pendidikan mengacu pada tiga prinsip reliabilitas, yaitu: (1)
Stabilitas; (2) Ekuivalensi; dan (3) Konsistensi internal.
3. Beberapa metode/cara untuk menentukan besar nilai reliabilitas berbasis
tiga prinsip tersebut, antara lain: (1) metode tes ulang (test-retest method);
(2) metode bentuk paralel (alternate/parallel form); (3) metode belah dua
(split-half method); (4) metode Kuder-Richardson-20 & 21; (5) metode
Cronbach alpha.
4. Cara menghitung nilai reliabilitas dengan menggunakan program SPSS
dapat menggunakan beberapa model sesuai dengan kebutuhan penguji.
5. Cara menghitung nilai reliabilitas dengan menggunakan program Quest
dapat dilihat pada output yang berkode sh.out dengan menginterpretasikan
angka pada reliability of estimate.

19
DAFTAR ISI

Alias, M. (2005). Assessment of learning outcomes: validity and reliability of


classroom tests. World Transactions on Engineering and Technology
Education, 4(2), 235-238.

Arikunto, S. (2010). Dasar-dasar evaluasi pendidikan. Jakarta: Bumi Aksara.

Ayodele, J. (2012). Validity and reliability issues in educational research.


Journal of Educational and  Social Research, 2(2), 391-400.

Carmines, E. G., & Zeller, R. A. (1979). Reliability and validity assessment. USA:
Sage Publications.

Cook, D. A., & Beckman, T. J. (2006). Current concepts in validity and reliability
for psychometric instruments: theory and application. The American
Journal of Medicine, 119(2), 166.e7-166.e16.

Ebel, R. L., & Frisbie, D. A. (1991). Essential of educational measurement . New


Jersey: Prentice Hall.

Felder, R. M., & Spurlin, J. (2005). Applications, reliabillity and validity of the
index of learning styles. International Journal Engng Education, 21(1),
103-112.

Lankes, R. D. (2008). Credibility on the internet: shifting from authority to


reliability. Journal of Documentation, 64(5), 667-686.

Purwanto, Evaluasi Hasil Belajar ,Yogyakarta: Putaka Pelajar,2010.

Reynolds, C. R., Livingston, R. B., & Willson, V. (2009). Measurement and


assesment in education. New Jersey: Pearson Education.

20
Ross, J. A. (2006). The Reliability, validity, and utility of self-assessment.
Practical Assessment Research & Evaluation, 11(10), 1-13.

Subali, B., & Suyata, P. (2011a). Panduan analisis data pengukuran pendidikan
untuk memperoleh bukti empirik kesahihan menggunakan program Quest.
Yogyakarta: (Versi Elektronik).

Subali, B., & Suyata, P. (2011b). Panduan menggunakan program Quest.


Yogyakarta: (Versi Elektronik).

Tella, A. (2011). Reliability and factor analysis of a blackboard course


management system success: a scale development and validation in an
educational context. Journal of Information Technology Education, 10, 1-
26.

21

Anda mungkin juga menyukai