MAKALAH
diajukan untuk memenuhi salah satu tugas mata kuliah Evaluasi Pembelajaran
dosen pengampu: Rahmat Rizal., S.Pd., M.Pd.
disusun oleh:
Kelompok 5
1 Ani Mahisarani (14210617889)
2 Azmi Endah Permatasari (1421061)
3 Pipin Aripin (1421061)
Kelas : 6D-Matematika PGSD
Puji syukur kami panjatkan kehadirat Allah SWT karena berkat rahmat dan
hidayah-Nya, kami dapat menyelesaikan Makalah dalam tugas mata kuliah Evaluasi
Pembelajaran yang berjudul Analisis Reliabilitas Tes dengan baik.
Kami menyadari dalam pembuatan makalah ini masih jauh dari kata sempurna
dan kami masih belajar dalam seluruh tataran pembuatan makalah ini. Maka dari itu
kami sangat mengharapkan masukan ataupun saran beserta kritik dan aspek terkait
untuk kemajuan dan semakin berkembangnya daya kualitas dari makalah yang akan
kami buat untuk selanjutnya.
Semoga makalah yang kami buat ini bermanfaat bagi pembaca. Atas segala
saran dan bantuan, kami sampaikan terima kasih.
Penulis
1
DAFTAR ISI
Halaman
KATA PENGANTAR.......................................................................................... i
DAFTAR ISI........................................................................................................ ii
BAB I PENDAHULUAN
1.1 Latar Belakang................................................................................................. 1
1.2 Rumusan Masalah........................................................................................... 3
1.3 Tujuan Penulisan............................................................................................. 4
1.4 Metode Penulisan............................................................................................ 4
1.5 Sistematika Penulisan...................................................................................... 5
BAB II PEMBAHASAN
2.1 Pengertian Analisis Reliabilitas Tes............................................................... 6
2.2 Tipe-Tipe Reliabilitas..................................................................................... 9
2.3 Faktor yang Mempengaruhi Reliabilitas Instrumen....................................... 10
2.4 Objek Evaluasi kurikulum.............................................................................. 12
2.5 Prinsip, Jenis, dan Desain Evaluasi Kurikulum............................................. 14
2.6 Pendekatan Pengembangan Kriteria Evaluasi................................................ 17
2.7 Model-Model Evaluasi Kurikulum................................................................ 20
2.8 Peranan Evaluasi Kurikulum.......................................................................... 26
BAB III PENUTUP
3.1 Keimpulan...................................................................................................... 30
3.2 Saran............................................................................................................... 31
DAFTAR PUSTAKA........................................................................................... 33
2
BAB I
PENDAHULUAN
Data yang kurang memiliki validitas dan reliabilitas, akan menghasilkan kesimpulan
yang bias, kurang sesuai dengan yang seharusnya, dan bahkan bisa saja bertentangan
dengan kelaziman. Untuk membuat alat ukur instrumen itu, diperlukan kajian teori,
pendapat para ahli serta pengalaman-pengalaman yang kadangkala diperlukan bila
definisi operasional variabelnya tidak kita temukan dalam teori. Alat ukur atau
instrumen yang akan disusun itu tentu saja harus memiliki validitas dan reliabilitas,
agar data yang diperoleh dari alat ukur itu bisa reliabel, valid dan disebut dengan
validitas dan reliabilitas alat ukur atau validitas dan reliabilitas instrumen
1
Dengan demikian, inti penilaian adalah proses memberikan atau menentukan
nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Proses pemberian nilai
tersebut berlangsung, baik dalam bentuk validitas maupun reliabilitas. Hal ini
mengisyaratkan bahwa objek yang dinilainya adalah hasil belajar siswa.
Keberhasilan mengungkapkan hasil dan proses belajar siswa sebagaimana
adanya (objektivitas hasil penilaian) sangat tergantung pada kualitas alat penilaiannya
di samping pada cara pelaksanaannya.
Berdasarkan beberapa data di atas serta dikaitkan dengan permasalahan yang
kami akan jelajahi, maka penulisan ini akan difokuskan pada pembahasan tentang
Validitas dan Reliabilitas Tes Hasil Belajar Siswa agar dapat lebih memahami apa
itu sebenarnya validitas dan reliabilitas serta lebih memahami bagaimana mengetahui
suatu alat penilaian dikatakan mempunyai kualitas yang baik.
2
1.5 Sistematika Penulisan
Makalah ini terdiri dari tiga bab. Bab I membahas tentang latar belakang,
rumusan masalah, tujuan, metode penulisan dan sistematika penulisan. Bab II
membahas tentang. Serta Bab III membahas tentang simpulan dan saran.
3
BAB II
PEMBAHASAN
1
Menurut Sukadji (dalam Nur Chaerah, 2013:17) reliabilitas suatu tes adalah
seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur.
Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien
tinggi berarti reliabilitas tinggi. Menurut Nursalam (dalam Nur Chaerah, 2013:17)
Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau
kenyataan hidup tadi diukur atau diamati berkali kali dalam waktu yang berlainan.
Alat dan cara mengukur atau mengamati sama sama memegang peranan penting
dalam waktu yang bersamaan. Sedangkan menurut Sukardi (dalam Nur Chaerah,
2013:17) relaibelitas adalah karakter lain dari evaluasi. Reliabelitas juga dapat
diartikan sama dengan konsistensi atau keajegan. Suatu instrument evaluasi dikatakan
mempunyai nilai reliabelitas tinggi, apabila tes yang dibuat mempunyai hasil
konsisten dalam mengukur yang hendak diukur.
Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabila pembaca
telah memahami konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid
menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan. Dalam
hal reliabilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan
ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan,
artinya bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan
berkali-kali. Instrumen yang baik adalah instrumen yang dapat dengan ajeg
memberikan data yang sesuai dengan kenyataan.
Sehubungan dengan reliabilitas ini, Scarvia B. Anderson (dalam Suharsimi
Arikunto, 2013:101) menyatakan bahwa persyaratan bagi tes, yaitu validitas dan
reliabilitas ini penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu,
karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable tetapi tidak
valid. Sebaliknya, sebuah tes yang valid biasanya reliable. A reliable measure in one
that provides consistent and stable indication of the characteristic being investigated.
Untuk dapat memperoleh gambaran yang ajeg memang sulit karena unsur
kejiwaan manusia itu sendiri tidak ajeg. Misalnya kemampuan, kecakapan, sikap dan
sebagainya berubah-ubah dari waktu ke waktu.
2
Beberapa hal yang sedikit banyak mempengaruhi hasil tes banyak sekali.
Namun secara garis besar dapat dikelompokkan menjadi 3 hal:
1. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-
butir soalnya
Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan dengan
tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas
menunjukkan tinggi rendahnya reliabilitas tes. Dengan demikian maka semakin
panjang tes, maka reliabilitasnya semakin tinggi. Dalam menghitung besarnya
reliabilitas berhubung dengan penambahan banyaknya butir soal dalam tes ini ada
sebuah rumus yang diberikan oleh Spearman dan Brown sehingga terkenal dengan
rumus Spearman Brown.
Rumusnya adalah:
nr
rnn
1+ ( n1 ) r
Keterangan :
rnn = Besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru
n = Berapa kali butir-butir soal itu ditambah
r = Besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah
Contoh:
Suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabilitas 0,70. Kemudian
butir-butir soal itu ditambah menjadi 60 butir soal. Maka koefisien reliabilitas baru
adalah:
nr
rnn
1+ ( n1 ) r
1,5 0,70
1+ ( 1,51 ) 0,70
1,05
1,35
0,79
3
Dengan demikian maka penambahan sebanyak 20 butir soal dari 40 butir,
memperbesar koefisien reliabilitas sebesar 0,09. Akan tetapi penambahan butir-butir
soal tes adakalanya tidak berarti bahkan adakalanya merugikan. Hal ini disebabkan
karena:
1) Sampai pada suatu batas tertentu, penambahan banyaknya butir soal sudah tidak
menambah tinggi reliabilitas tes.
2) Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan waktu, biaya
dan tenaga yang dikeluarkan untuk itu. Misalnya seorang guru sudah cukup membuat
100 soal bentuk objektif dan 10 soal bentuk esai sudah cukup mempunyai validitas isi
dan tingkah laku. Guru tersebut ingin menambah butir-butir soal sehingga menjadi
200 dan 20 dengan menambahkan soal-soal yang parallel. Tentu saja hal ini hanya
akan menambah waktu, biaya dan tenaga saja tanpa ada keuntungan apa-apa. Kualitas
butir-butir soal ditentukan oleh:
a) Jelas tidaknya rumusan soal.
b) Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah
jawab.
c) Petunjuknya jelas sehingga mudah dan cepat dikerjakan.
4
1) Petunjuk yang diberikan sebelum tes dimulai akan memberikan ketenangan kepada
para tes-tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak
terdapat pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil tes.
2) Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap
tes. Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan
rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes.
3) Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana disekelilingnya
ramai dan sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak
langsung akan mempengaruhi reliabilitas soal tes.
5
Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan
dua buah tes dan masing-masing dicobakan pada kelompok siswa yang sma. Oleh
karena itu, ada orang menyebutkan sebagai double test-double-trial method.
Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes
sehingga tidak ada faktor masih ingat soalnya yang dlam evaluasi disebut
adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh
pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat
karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk
mencobakan dua kali tes.
6
Contoh:
7
R11 = Koefisien reliabilitas yang sudah disesuaikan.
Contoh:
Korelasi antar belahan tes = 0,60
2 0,60 1,20
Maka reliabilitas tes = =0,75
1+0,60 1,60
Banyak pemakai metode ini salah membela hasil tes pada waktu,
menganalisis. Yang mereka lakukan adalah mengelompokkan hasil separo subjek
peserta tes dan separo yang lain kemudian hasil kedua kelompok ini dikorelasikan.
Yang benar adalah membelah item atau butir soal. Tidak akan keliru kiranya bagi
pemakai metode ini harus ingat bahwa banyaknya butir soal harus genap agar dapat
dibelah.Ada dua cara membelah butir soal ini, yaitu:
1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut
belahan ganjil-genap, dan
2) Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada
nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya disebut
belahan awal-akhir.
8
1 Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5
2 Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3
3 Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3
4 Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2
5 Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1
6 Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1
Susan
7 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2
a
8 Helen 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5
Kertas yang digunting bergigi dapat digunakan sebagai alat bantu dalam
menentukan jumlah skor pada item ganjil dan jumlah skor pada item genap. Bagian
berlekuk dapat dipaskan pada item-item genap ataupun item-item ganjil. Jika sudah
diketahui jumlah skor pada item ganjil, otomatis diketahui jumlah skor pada item
genap karena skor totalnya sudah diketahui terlebih dahulu.
Penyajian contoh membelah diatas berarti bahwa perhitungan reliabilitas
dilakukan dengan membelah dua cara. Pembelahannya hanya memilih salah satu saja,
untuk selanjutnya dihitung dengan korelasi product moment.
1) pembelahan ganjil-genap
Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil-genap sebagai
berikut :
Item ganjil Item genap
No Nama (1,3,5,7,9) (2,4,6,8,10)
(X) (Y)
1 Hartati 5 3
2 Yoyok 3 2
3 Oktaf 0 4
4 Wendi 3 2
5 Diana 3 3
6 Paul 4 0
7 Susana 4 3
9
Kelanjutan dari tabel ini adalah menghitung dengan rumus korelasi product
moment.
Dengan menggunakan kalkulator diketahui bahwa :
X = 25 X2 = 93
Y = 22 Y2 = 76
XY = 63
Setelah dihitung dengan rumus korelasi product moment dengan angka
kasar diketahui bahwa rxy = -0,3786. Harga tersebut baru menunjukkan reliabilitas
separo tes. Oleh karena itu, rxy untuk belahan ini disebut dengan istilah r1/21/2 atau
rgg singkatan dari rganjil-genap. Untuk mencari reliabilitas seluruh tes digunakan
rumus Spearman-Brown yang rumusnya telah dikemukakan di depan. Jika koefisien
reliabilitas separo tes ini dimasukan ke dalam rumus hitungannya demikian:
2r
R11
( 1+r )
20,3786
1+ (0,3786 )
0,7572
=0,5493
1,3786
2) pembelahan awal-akhir
Dengan data yang tertera pada table analisis item tes Matematika diketahui
jumlah skor belahan awal-akhir sebagai berikut :
10
6 Paul 3 1
7 Susana 5 2
Seperti halnya pada waktu menghitung dengan belahan ganjil genap maka
kelanjutannya adalah menghitung dengan rumus korelasi product moment. Dengan
menggunakan kalkulator diketahui:
X = 25 X2 = 93
Y = 22 Y2 = 76
XY = 63
11
Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat.
Dengan demikian bagi peminat yang menghitung dengan kalkulator statistic varians
ini diperoleh dengan mengkuadratkan standar deviasi. Untuk mereka yang tidak
menggunakan kalkulator statistic maka varians dapat dicari dengan rumus sebagai
berikut :
S2 = X2 (X)2
N
N
Standar Deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB).
Namun huruf S (B besar) juga dapat dikatakan sudah menyebut standar deviasi.
Dalam kalkulator tertera dengan symbol a.
Bagi yang berminat mencari S dulu untuk mencari varians, dapat menggunakan
rumus S, yaitu:
S= X2
N
Dimana :
S: Standar Deviasi
X: simpangan X dan X yang dicari dari X- X
S2 : Varians, selalu dituliskan dalam bentuk kuadrat, karena standar deviasi
kuadrat.
N: banyaknya subjek pengikut tes.
12
S21 = 93- 252 S22 = 76-222
8 8
8 8
= 93-78,125 = 76-
60,5
8 8
= 1,859 = 1,937
R11 = 1- S2d
S2t
Dimana :
S2d : varians beda (varians different)
D: different, adalah perbedaan antara skor belahan pertama (awal) dengan skor
belahan kedua (akhir)
13
Dengan kalkulator atau hitungan biasa diketahui bahwa :
d = 3
d2= 43
Dari perhitungan dengan rumus Flanagan maupun Rulon ternyata hasilnya sama,
keduanya lebih besar dari 1,00. Secara teoretik koefisien ini salah tetapi karena
pembulatan dalam perhitungan, seperti dijelaskan didepan, hasil seperti ini dapat saja
terjadi.
contoh perhitungan reliabilitas soal tes bentuk uraian dengan menggunakan rumus
alpha:
14
tabel hasil belajar 40 siswa dengan skor 0-10 per butir dengan banyak soal ada 7 butir
soal
15
16
2.2 Tipe-tipe Reliabelitas
Menurut Sukardi (dalam Nur Chaerah, 2013) Ada beberapa tipe reliabelitas
yang digunakan dalam kegiatan evaluasi dan masing-masing reliebelitas mempunyai
konsistensi yang berbeda-beda. Beberap tipe reliebelitas di antaranya: tes-retes,
ekivalen, dan belah dua yang ditentukan melalui korelasi.
Berbagai tipe tersebut akan diuraikan sebagai berikut:
1. Relibalelitas Dengan Tes-Retes
Reliabelitas tes-retes tidak lain adalah derajat yang menunjukkan
konsistensi hasil sebuah tes dari waktu ke waktu. Tes-Retes menunjukkan variasi skor
yang diperoleh dari penyelenggaraan satu tes evaluasi yang dilaksanakan dua kali
atau lebih, sebagai akibat kesalahan pengukuran. Dengan kata lain, kita tertarik dalam
mencari kejelasan bahwa skor siswa mencapai suatu tes pada waktu tertentu adalah
sama hasilnya, ketika siswa itu dites lagi dengan tes yang sama. Dengan melakukan
tes-retes tersebut. Seorang guru akan mengetahui seberapa jauh konsistensi suatu tes
mengukur apa yang ingin diukur.
Sedangkan Arikunto Metode tes ulang (tes-retes) dilakukan untuk
menghindari dua penyusunan dua seri tes. Dalam menggunakan teknik atau metode
ini pengetes hanya memiliki satu seri tes tapi dicobakan dua kali. Oleh karena tesnya
satu dan dicobakan dua kali, maka metode ini dapat disebut juga dengan single-test-
double-trial-method.
Reliebelitas tes retes dapat dilakukan dengan cara seperti berikut:
1. Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
2. Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan
kembali tes yang sama dengan kelompok yang sama tersebut.
3. Korelasikan kedua hasil tes tersebut.
Jika hasil koefisien menunjukkan tinggi, berarti reliabilias tes adalah bagus.
Sebaliknya, jika korelasi rendah, berarti tes tersebut mempunyai konsistensi rendah.
17
Sesuai dengan namanya yaitu ekivalen, maka tes evaluasi yang hendak
diukur reliabelitasnya dibuat identik dengan tes acuan. Setiap tampilannya, kecuali
substansi item yang ada, dapat berbeda. Kedua tes tersebut sebaliknya mempunyai
karate yang sama. Karakteristik yang dimaksud misalnya mengukur variabel yang
sama, mempunyai jumlah item sama, struktur sama, mempunyai tingkat kesulitan dan
mempunyai petunjuk, cara penskoran, dan interpretasi yang sama (Sukardi 2008
dalam Nur Chaerah, 2013:18).
Pernyataan serupa juga disampaikan oleh Arikunto (dalam Nur Chaerah,
2013:18) tes paralel atau equivalent adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran dan susunan, tetapi butir-butirnya berbeda. Dalam istilah
bahasa Inggris disebut Alternate-forms method (parallel forms).
Tes reliabelitas secara ekivalen dapat dilaksanakan dengan mengikuti langkah-
langkah sebagai berikut:
1. Tentukan sasaran yang hendak dites
2. Lakukan tes yang dimaksud kepada subjek sasaran tersebut.
3. Administrasinya hasilnya secara baik.
4. Dalam waktu yang tidak terlalu lama, lakukan pengetesan yang kedua kalinya
pada kelompok tersebut
5. Korelasikan kedua hasil skor tersebut (Sukardi, 2008 dalam Nur Chaerah, 2013).
Perlu diketahui juga bahwa tes ekivalensi mempunyai kelemahan yaitu
bahwa membuat dua buah tes yang secara esensial ekivalen adalah sulit. Akibatnya
akan selalu terjadi kesalahan pengukuran (Sukardi dalam Nur Chaerah, 2013).
Pernyataan lain juga disampaikan oleh Arikunto (dalam Nur Chaerah, 2013)
kelemahan dari metode ini adalah pengetes pekerjaannya berat karena harus
menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan
dua kali tes.
18
Menurut Sukardi (dalam Nur Chaerah, 2013) Reliabilitas belah dua ini
termasuk reliabilitas yang mengukur konsistensi internal. Yang dimaksud konsistensi
internal adalah salah satu tipe reliabilitas yang didasarkan pada keajegan dalam setiap
item tes evaluasi. Relibilitas belah dua ini pelaksanaanya hanya satu kali.
Cara melakukan reliabilitas belah dua pada dasarnya dapat dilakukan
dengan urutan sebagai berikut:
1. Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.
2. Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan
membagi item dengan nomor ganjil dengan item dengan nomor genap pada
kelompok tersebut.
3. Hitung skor subjek pada kedua belah kelompok penerima item genap dan item
ganjil.
4. Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan
dengan teknik pengukuran (Sukardi, dalam Nur Chaerah, 201).
19
Reliabilitas telah didefinisikan dengan cara yang berbeda oleh pengarang
yang berbeda. Cara yang terbaik untuk membahas reliabilitas adalah sejauhmana hasil
pengukuran dari suatu instrumen mewakili karakteristik yang diukur. Sebagai contoh,
reliabilitas didefinisikan seberapa besar konsistensi skor tes yang dicapai peserta tes
pada pengujian ulang. Definisi ini akan memuaskan jika skor tes dapat
menggambarkan kemampuan peserta tes; jika tidak maka skor tes tidak sistematis,
tidak dapat diulangi atau tidak terikat. Reliabilitas juga diartikan sebagai indikator
ketidakhadiran kesalahan acak. Jika kesalahan acak dapat diperkecil maka skor tes
akan lebih konsisten dari suatu pengujian ke pengujian berikutnya.
Definisi teoretis dari reliabilitas adalah proporsi keragaman skor tes yang
disebabkan oleh keragaman sistematis dalam populasi peserta tes. Jika terdapat
keragaman sistematis yang lebih besar dalam suatu populasi dibanding dengan
populasi lainnya, seperti dalam semua siswa sekolah negeri dibandingkan hanya
dengan kelas tertentu, tes akan mempunyai reliabilitas lebih besar untuk populasi
yang lebih bervariasi. Reliabilitas adalah karakteristik bersama antara tes dan
kelompok peserta tes. Reliabilitas tes bervariasi dari suatu kelompok dengan
kelompok lainnya.
Para profesional pengukuran menganggap reliabilitas sebagai persyaratan
utama suatu instrumen penilaian. Dalam teori tes diakui bahwa skor tes akan valid
(benar) jika skor tes tersebut reliabel (Mehrens & Lehmann, 1991). Asumsi ini
didasarkan pada suatu model matematika teori tes dimana skor perolehan terdiri atas
skor tulen dan skor galat (obtained score = true score + error score). Semakin sedikit
kesalahan dalam suatu tes (yaitu semakin reliabel) semakin valid skor tes. Karenanya,
suatu penilaian yang tidak reliabel secara otomatis tidak valid.
Penekanan utama dalam mengumpulkan data untuk menentukan reliabilitas
tes adalah pada konsistensi dihubungkan dengan reliabilitas skor atau reliabilitas
penilai. Reliabilitas skor berarti bahwa jika suatu tes telah diadministrasikan pada
penempuh ujian untuk kedua kalinya, maka penempuh ujian akan tetap memperoleh
skor yang sama dengan pengadministrasian yang pertama. Salah satu cara para
20
spesialis pengukuran dalam menentukan reliabilitas skor tes adalah melalui tes
standar. Jika penempuh ujian diuji kembali, mereka harus melengkapi tugas yang
sama persis dalam kondisi yang juga persis sama. Hal ini akan membantu dalam
pencapaian hasil tes yang konsisten.
21