Anda di halaman 1dari 32

MAKALAH

PENILAIAN PROSES DAN HASIL PEMBELAJARAN

“RELIABILITAS”

Dosen Pengampu :
Dr. Kusno, M.Pd

Disusun Oleh:
Kelompok 4 Kelas 6A

Yunenti Nurrohmah (1801060011)


Ajeng Risdafa Andini (1801060013)
Meilita Anggie Nurlatifah (1801060019)

PROGRAM STUDI PENDIDIKAN MATEMATIKA


FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS MUHAMMADIYAH PURWOKERTO
2021
DAFTAR ISI

Halaman Cover .....................................................................................................................i


Daftar Isi ...............................................................................................................................1
Materi “Reliabilitas” .............................................................................................................2
A. Pengertian reliabilitas ................................................................................................2
B. Teknik Pengujian Reliabilitas ...................................................................................7

Soal Evaluasi..........................................................................................................................27
Daftar Pustaka........................................................................................................................30

1
BAB IV
RELIABILITAS

A. Pengertian Reliabilitas
Reliabilitas merupakan penerjemahan dari kata reliability yang mempunyai asal
kata rely (percaya atau mengandalkan) dan ability (kemampuan). Pengukuran yang
memiliki reliabilitas tinggi disebut sebagai pengukuran yang reliabel. Walaupun
reliabilitas memiliki berbagai nama lain seperti keterpercayaan, keterandalan, keajegan,
kestabilan, konsistensi, dan sebagainya, namun ide pokok yang terkandung dalam konsep
reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya. Konsep
reliabilitas dalam arti reliabilitas alat ukur berkaitan erat dengan masalah kekeliruan
pengukuran. Kekeliruan pengukuran sendiri menunjukkan sejauh mana inkonsistensi
hasil pengukuran terjadi apabila dilakukan pengukuran ulang terhadap kelompok subyek
yang sama. Sedangkan konsep reliabilitas dalam arti reliabilitas hasil ukur berkaitan erat
dengan kekeliruan dalam pengambilan sampel yang mengacu pada inkonsistensi hasil
ukur apabila pengukuran dilakukan ulang pada kelompok yang berbeda.
Pengukuran yang memiliki reliabilitas tinggi, disebut pengukuran reliabel.
Reliabilitas suatu alat ukur atau alat evaluasi dimaksud sebagai suatu alat yang
memberikan hasil yang relatif tetap (konstan, ajeg), jika pengukuran itu diberikan kepada
subjek yang sama meskipun dilakukan oleh orang yang berbeda, waktu dan tempat yang
berbeda. Suatu tes dapat dikatakan reliabel bila skor yang diperoleh melalui tes itu
merupakan skor yang sesungguhnya menggambarkan kemampuan peserta tes, bukan
karena berspekulasi yang akan melahirkan skor yang kebetulan. (Saifuddin, 1997 : 170).
Pengertian Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur
yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan
secara berulang. Kondisi itu ditengarai dengan konsistensi hasil dari penggunaan alat ukur
yang sama yang dilakukan secara berulang dan memberikan hasil yang relatif sama dan
tidak melanggar kelaziman. Untuk pengukuran subjektif, penilaian yang dilakukan oleh
minimal dua orang bisa memberikan hasil yang relatif sama (reliabilitas antar penilai).
Pengertian Reliabilitas tidak sama dengan pengertian validitas. Artinya pengukuran yang
memiliki reliabilitas dapat mengukur secara konsisten, tapi belum tentu mengukur apa
yang seharusnya diukur.(Sugiono, 2005)

2
Reliabilitas, atau keandalan, adalah konsistensi dari serangkaian pengukuran atau
serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes
dengan tes ulang) akan memberikan hasil yang sama, atau untuk pengukuran yang lebih
subjektif, apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar
penilai). Reliabilitas tidak sama dengan validitas. Artinya pengukuran yang dapat
diandalkan akan mengukur secara konsisten, tapi belum tentu mengukur apa yang
seharusnya diukur.
Menurut (Khumaedi, 2012) reliabilitas merupakan koefisien yang menunjukkan
sejauh mana suatu instrumen/at pengukur dapat dipercaya, artinya apabila alat/instrumen
tersebut digunakan secara berulang untuk mengukur sesuatu yang sama, maka hasilnya
relatif stabil atau konsisten (tetap). Secara empiris, tinggi rendahnya reliabilitas
ditunjukkan oleh suatu angka yang disebut koefisien realibilitas yang besarnya antara 0
sampai dengan 1, dimana semakin tinggi koefisien reliabilitasnya maka semakin
konsisnten juga hasil pengukurannya.
Dalam penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap
konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi yang
sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang konsisten untuk
pengukuran yang sama. Tidak bisa diandalkan bila pengukuran yang berulang itu
memberikan hasil yang berbeda-beda. Reliabillitas tes merupakan hal yang sangat penting
untuk menentukan kualitas tes. Apabila siswa memperoleh skor yang tidak ajeg pada
beberapa kali ujian, padahal tes yang diberikan sama, maka keputusan akhir mengenai
lulus atau tidaknya juga akan berbeda. Maka dari itu, dalam menyusun tes hasil belajar
perlu dilihat seberapa besar nilai koefisien reliabilitas dari tes yang akan dipakai. Apabila
hasil skor tes pertama sama dengan hasil skor tes kedua, maka tes dikatakan memiliki
reliabilitas yang tinggi atau terdapat korelasi yang tinggi antara hasil tes pertama dengan
hasil tes kedua. Apabila Antara hasil tes pertama dan kedua tidak terdapat hubungan atau
hubungannya rendah, maka tes itu dikatakan tidak reliable. (Setiyawan, 2014)
Keterandalan dalam evaluasi menunjuk kepada kestabilan alat evaluasi atau alat
ukur dalam melaporkan hasil ukurannya.Alat ukur yang konsisten hasilnya pada situasi
yang berbeda yang tadi disebut sebagai alat ukur yang terandalkan atau alat ukur yang
reliabel.
Menurut Ebel, faktor yang mempengaruhi koefisien reliabilitas akan antara lain
adalaha.
- Dari tes yang lebih panjang daripada tes yang lebih pendek (from a
3
longer test than from a shorter test)
- Dari tes yang tersusun dari item yang lebih homogen daripada tes yang lebih
heterogen (from a test composed of more homogeneous items than from a more
heterogeneous test)
- Dari tes yang memiliki daya pembeda lebih tinggi daripada yang
mempunyai daya pembeda lebih rendah (from a test composed of more
discriminating item than from a test composed of less discriminating items)
- Dari tes yang tingkat kesulitannya sedang daripada tes yang terlalu sulit atau
terlalu mudah (from a test whose items are of middle difficulty than from a test
composed mainly of quite difficult or quite easy items)
- Dari kelompok yang mempunyai jarak kemampuan yang lebar daripada yang
berkemampuan homogen (from a group having a wide range of ability than
from a group more homogeneous in ability)
- Dari tes yang membutuhkan waktu terbatas daripada waktu yang lebih longgar
(from a speeded test than from one all examinees can complete in the time
available)

Faktor yang mempengaruhi keterandalan alat ukur adalah :


1. Jumlah soal
Alat evaluasi yang terdiri dari soal yang jumlahnya lebih banyak cenderung
lebih reliabel dibandingkan dengan soal yang jumlahnya lebih sedikit oleh kerena itu
soal tes obyektif yang jumlahnya banyak cenderung lebih reliabel. Hal ini terjadi
karena semakin panjang tes (semakin banyak
butir soal) sehingga semakin banyak perilaku yang terukur dengan lebih
tepat.
Apabila tes memiliki banyak butir, maka reliabilitasnya dapat
meningkat, asal penambahan butir tersebut mengacu pada pendiskripsian
yang jelas terhadap variabel yang diukur. Jadi, dalam menyiapkan suatu tes perlu
dipertimbangkan jumlah butirnya. Walaupun ditemukan semakin
banyak butir berarti semakin tinggi reliabilitas, bukanlah berarti bahwa
perlu disiapkan butir tes sebanyak-banyaknya, tetapi tetap berada pada
batas dimensi dan indikator dari variabel yang diukur . Sebagai contoh kita ambil
dalam tes Matematika yang terdiri atas 40 soal dengan indeks reliabilitas 0,70.
kemudian soal ditambah 20 butir sehingga berjumlah 60. Tes dengan 40 soal ini akan

4
memiliki reliabilitas yang berbeda dengan tes yang terdiri atas 60 soal.

2. Homogenitas
Alat evaluasi yang terdiri dari soal yang lebih homogen cenderung lebih
reliabel dibandingkan dengan soal yang heterogen, maksudnya ialah bahwa soal-soal
tersebut bertipe sejenis, berjenjang yang bertingkat. Dalam tes hasil belajar, item-item
tes itu mempunyai tipe-tipe tersendiri, ada item yang mengungkap aspek kognitif
berpikir rendah, sedang, dan tinggi, demikian pula ada item yang mengungkap aspek
sikap dan keterampilan (taksonomi bloom).
Soal yang memiliki homogenitas tinggi cenderung mengarah pada tingginya
tingkat realibilitas. Dua buah tes yang sama jumlah butir-butirnya akan tetapi berbeda
isinya, misalnya yang satu mengukur tentang pengetahuan kebahasaan dan yang
satunya tentang kemampuan matematika akan menghasilkan tingkat reliabilitas yang
berbeda. Tes matematika cenderung menghasilkan tingkat reliabilitas yang lebih
tinggi daripada tes kebahasaan karena dari segi isi kemampuan menyelesaikan soal
matematika lebih homogen  daripada pengetahuan kebahasaan.
3. Waktu penyelesaian soal
Waktu untuk mentelesaikan soal harus cukup, tidak kurang juga tidak
berlebihan. Misalkan kita akan menggunakan metode Test Ulang dalam menguji
reliabilitas insrumen, selang waktu dalam pelaksanaan akan mempengaruhi hasil. Jika
selang waktu yang diberikan terlalu lama, akan memungkinkan peserta yang mencoba
tes ulang mengalami kesulitan pada tes berikutnya karena materi sudah lupa atau
bingung dalam pengerjaannya sehingga pada hasil tes ulang mendapat hasil yang
renda. Bisa juga mendapatkan hasil yang lebih tinggi jika peserta memahami akan
kesalahan sebelumnya dan berusaha memperbaiki sehingg amenjadi lebih baik.
Namun hal tersebut mempengaruhi reliabilitas instrumen soal tersbeut.
4. Keseragaman kondisi
Untuk syarat ini, setiap tes dalam evaluasi perlu disusun standar
administrasinya (pelaksanaannya).
5. Tingkat kesukaran dan Level Kelompok
Soal evaluasi yang terlalu sulit atau terlalu mudah menimbulkan rendahnya
tingkat keterandalan soal evaluasi, untuk itu dalam tes hasil belajar perlu diukur
tingkat kesukarannya. Presisi pengukuran dari

5
sebuah tes bisa berhubungan dengan level kemampuan dari orang yang
diukur; bagaimanapun juga, tidak ada aturan yang dapat memformulasikan
keadaan hubungan ini. Sifat hubungan ini bergantung pada bagaimana
cara tes itu disusun. Untuk mereka yang merasa bahwa tes terlalu sulit,
sepertinya mereka akan sering menebak, akurasinya akan menjadi rendah.
Pada keadaan lain, jika tes terlalu mudah untuk kelompok itu, seperti
mereka pasti bisa menjawab kebanyakan item dengan benar, tes tersebut
bisa menjadi tidak efektif dalam membedakan dalam anggota kelompok.
Hal ini ekuivalen dengan tingkat kesulitan tes. Tes yang sangat mudah atau sangat
sulit tidak dapat mengukur perbedaan individu.
(Tim MKDK IKIP Semarang, 1996)

6
B. Teknik Pengujian Reliabilitas

Berikut bagan pengujian Reliabilitas dapat kita lihat di bawah ini.


BAGAN PENGUJIAN RELIABILITAS
Teknik Pengujian Reliabilitas

Teknik Hasil Belajar Bentuk Teknik Hasil Belajar Bentuk


Uraian Objektif

Reliabilitas Reliabilitas
internal eksternal

Pendekatan Pendekatan Pendekatan


Tes Tunggal Tes Ulang Ekuivalen
(Single Tes – Single (Single Tes – Double (Double Tes – Double
Trial) Trial Method) Trial)

Teknik Belah Dua Teknik Non Belah


(Split – Half Technique)

F. Kuder F. C Hoyt
Richardson

Rumus Kr – 20 Rumus Kr – 21

Metode Awal Metode Gasal Metode Random


Akhir Genap

F. Spearman F. Flanagan F. Rulon


Brown

Reliabilitas dalam fungsinya sebagai alat pengukur tes hasil belajar dapat dibedakan
menjadi dua teknik yaitu:
1. Teknik pengujian reliabilitas tes hasil belajar bentuk uraian
Reliabilitas internal diperoleh dengan cara menganalisis data dari hasil uji coba.
Untuk menguji reliabilitas internal dapat dilakukan dengan beberapa cara. Salah satunya
adalah rumus Alpha.Penggunaan rumus Alpha didasarkan atas pertimbangan bahwa rumus
ini dapat digunakan untuk menguji reliabilitas instrumen yang skornya berbentuk skala 1 –5.

7
Selain itu, teknik ini pun cocok dilakukan untuk mencari reliabilitas tes bentuk uraian
(Arikunto, 1986 : 163).
Tes hasil belajar bentuk uraian dikenal dengan istilah essay test atau subjektif test.
Untuk menentukan apakah tes hasil belajar bentuk uraian yang disusun oleh staf pengajar
telah mamiliki daya keajegan mengukur reliabilitas yang tinggi ataukah belum digunakan
rumus alpha yaitu:

( k −k 1 ) ( 1 − )
∑ σ b2
r 11 =
σ 2
1

r11 = reliabilitas instrumen


k = Banyaknya butir pertanyaan atau banyaknya soal
b2 = Jumlah varians butir
12 = Varians total
(Arikunto, 2002 : 171)
Dalam pemberian interprestasi terhadap koefisien reliabilitas tes (r11) pada umumnya
digunakan patokan sabagai berikut:
0,00 < r11 ≤ 0,20 = derajat reliabilitas sangat rendah
0,20 < r11 ≤ 0,40 = derajat reliabilitas rendah
0,40 < r11 ≤ 0,60 = derajat reliabilitas sedang
0,60 < r11 ≤ 0,80 = derajat reliabilitas tinggi
0,80 < r11 ≤ 1,00 = derajat reliabilitas sangat tinggi
Contoh soal tes bentuk uraian:
Dibawah ini merupakan hasil tes bentuk uraian yang terdiri dari 5 item dan diikuti 6
siswa. Hasil tes tersebut telah disusun pada tabel berikut :
Tabel hasil tes dalam bentuk uraian
Subje Nomor Soal Skor Total
k 1 2 3 4 5

A 10 10 20 25 35 100
B 10 8 15 18 25 76
C 8 5 10 12 18 53
D 7 3 12 10 10 42
E 9 8 18 20 20 75
F 5 5 10 15 30 65

8
Xt 49 39 85 100 138 411
xt2 419 287 1293 1818 3574 30199
i 1,77 2,36 3,85 5,02 8,16 18,46
i2 3,14 5,58 14,81 25,22 66,67 340,92

Dari data pada tabel di atas diperoleh :


N= 6
i2 = 3,14 + 5,58 + 14,81 +25,22 + 66,67 = 115,42
(∑ x t )
2 2
∑ x 2−
t N
∑ 30199 − 4116 30199 − 28153 ,5 2045 ,5
σ 2= =
t N 6 = 6 = 6 = 340,92
Dimasukkan dalam rumus:

)( ) ( )(
∑ σ 12
r 11 = ( n
n−1
1−
σ
1
2
=
5
5−1
1−
115,42
340,92 = 0,83)
Koefisien reliabilitas tersebut menyatakan bahwa, soal yang dibuat reliabilitasnya sangat
tinggi.
2. Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Objektif
Pada tes hasil belajar bentuk objektif untuk menentukan reliabilitas dapat ditentukan
dengan menggunakan tiga macam pendekatan.
a. Reliabilitas internal
Reliabilitas internal yaitu Perhitungan dilakukan berdasarkan data dari
instrumen tersebut saja Sebagai contoh reliabilitas internal adalah pendekatan tes
tunggal (single test – single trial)
Tes tunggal adalah tes yang terdiri dari suatu perangkat (satu set) yang
dikenakan terhadap sekelompok subjek dalam satu kali pelaksanaan reliabilitas
yang didasarkan atas tes tunggal dinamakan internal consistenci reliability.
Pendekatan tes tunggal dibagi kedalam dua macam teknik.
1) Pendekatan Tes Tunggal (single test – single trial)
Tes tunggal adalah tes yang terdiri dari suatu perangkat (satu set) yang
dikenakan terhadap sekelompok subjek dalam satu kali pelaksanaan reliabilitas
yang didasarkan atas tes tunggal dinamakan internal consistenci reliability.
Pendekatan tes tunggal dibagi kedalam dua macam teknik.
a) Teknik belah dua (split-half technique)

9
Dalam penggunaan teknik ini pengetes hanya menggunakan sebuah tes dan
dicobakan satu kali. Syarat untuk dapat menggunakan metode belah dua adalah
bahwa banyaknya item harus genap agar dapat dibelah. Syarat yang kedua, item-
item yang membentuk soal tes harus homogen atau paling tidak setelah dibelah
terdapat keseimbangan antara belahan pertama dan belahn kedua.
Cara-cara yang dapat digunakan untuk pembelahan tes adalah:
(1) Pembelahan awal-akhir
Pembelahan ini hampir sama dengan pembelahan gasal-genap. Nomor yang
awal dijadikan satu kelompok menjadi belahan pertama sedangkan nomor
yang akhir dikelompokkan menjadi belahan yang kedua.
(2) Pembelahan gasal-genap
Pembelahan dengan cara gasal-genap sangat populer dan mudah dilakukan.
Dalam cara ini seluruh item yang bernomor urut gasal dijadikan satu
kelompok menjadi belahan pertama dan seluruh item yang bernomor urut
genap dijadikan satu kelompok menjadi belahan yang kedua.
(3) Pembelahan cara Random
Membelah tes menjadi dua bagian secara random dapat dilakukan dengan cara
undian sederhana guna menentukan item-item nomor berapa sajakah yang
dimasukkan menjadi belahan pertama dan mana yang diikutkan menjadi
belahan kedua.
Pembelahan secara random hanya boleh dilakukan apabila tes yang akan
dibelah berisi item-item yang homogen. Pengertian homogen dalam hal ini harus
dipandang dari segi isi dan juga dari segi taraf kesukarannya. Suatu tes yang berisi
item heterogen bila dibelah secara random dapat menghasilka belahan-belahan
yang tidak setara satu sama lain kecuali apabila tes tersebut terdiri dari item yang
berjumlah sangat besar.
( Saifuddin, 1997:66)
Untuk mencari reliabilitas dengan teknik belah dua dapat digunakan
beberapa rumus antara lain:
Mencari reliabilitas dengan rumus Sperman – Brown

Untuk menentukan reliabilitas suatu perangkat (set) tes dengan teknik belah
dua dilakukan dengan jalan membelah alat evaluasi tersebut menjadi dua bagian
yang sama (relatif sama), sehingga masing-masing tes memiliki dua macam score.

10
Kedua macam score itu adalah untuk bagian (belahan) pertama dan kelompok
score untuk belahan kedua dari perangkat alat evaluasi tadi.
Salah satu cara untuk menentukan koefisien reliabilitas suatu alat evaluasi
dengan teknik belah dua yaitu formula Sperman-Brown. Prinsip penggunaan
formula Sperman-Brown adalah dengan menghitung koefisien korelasi diantara
kedua belahan sebagai koefisien reliabilitas bagian dari alat evaluasi tersebut yang
dinotasikan dengan r ½½. Untuk menghitung r ½½ digunakan rumus Product
moment dengan angka kasar, dari Karl Pearson:
N ∑ XY − ( ∑ X ) ( ∑ Y )
r XY =
√ { N ∑ X − (∑ X ) } { N ∑ Y
2 2 2 2
− (∑ Y ) }
N = Banyaknya subjek
X = Kelompok data belahan pertama
Y = Kelompok data belahan kedua
(Arikunto, 2002 : 157)
Untuk mengetahui koefisien reliabilitas alat evaluasi keseluruhan, Sperman-
Brown mengemukakan rumus:
1 1
2r 2 2
r 11 =
1 + r 1212
, untuk metode ganjil genap atau awal akhir.
Dengan keterangan:
r11 = reliabilitas instrumen
r1 1
2 2 = rXY yang disebutkan sebagai indeks korelasi antara dua belahan instrumen.
(Arikunto, 2002 : 156)

Metode ganjil genap yaitu pembelahan menurut nomor soal ganjil dan
nomor genap. Sedangkan metode awal akhir yaitu pembelahan menurut nomor
urut. Sebagai contoh untuk menghitung koefisien reliabilitas dengan formula
Sperman-Brown dengan metode ganjil genap, lihat hasil tes matematika pada tabel
berikut ini:
Tabel Kelompok skor dengan metode ganjil-genap
Skor Kelompok ganjil Skor Kelompok genap
Subjek XY
(X) (Y)

A 5 5 25

11
4
B 5 20
4
C 5 20
3
D 5 15
4
E 4 16
2
F 5 10
2
G 3 6
3
H 1 3
3
I 1 3
1
J 2 2
N= X = 36 Y= 31 XY =
10 120
X2= 156 Y2 = 109

Koefisien reliabilitas setengah bagian tes tersebut diatas dapat dicari sebagai
berikut:
N ∑ XY − ( ∑ X ) ( ∑ Y )
r XY =
√{ N ∑ X − (∑ X ) } { N ∑ Y
2 2 2
− (∑ Y )
2
}
10 (120 ) − (36 ) (31) 1200−1116
= =
√ {10(156)− ( 36 ) } { 10(109) − ( 31 ) }
2 2
√ { 1560−1296 }{ 1090−961 }
84 84 84
=
√(264)(129) = √34056 = 184 ,5427 = 0,4552
1 1

r 11 =
2r 2 2 2 ( 0 , 4552 ) 0,9104
+ r 1212
1
= 1+0 , 4552 = 1,4552 = 0,6256
Koefisien reliabilitas tersebut menyatakan bahwa, soal yang dibuat reliabilitasnya
tinggi.
Mencari Reliabilitas Dengan Rumus Flanagan

Untuk mencari reliabilitas instrumen dengan menggunakan rumus Flanagan,


kita juga harus melakukan analisis butir dahulu dengan menggunakan teknik belah
dua ganjil-genap. Rumusnya adalah sebagai berikut:

Rumus:
r 11=2 1−
( V 1V 2
Vt )
12
Keterangan : rII = reliabilitas instrumen
V1 = varians belahan pertama (varians skor butir-butir
ganjil)
V2 = varians belahan kedua (varians skor butir-butir genap)
Vt = varians skor total
(Arikunto, 2002 : 160)
Dibawah ini contoh mencari reliabilitas dengan menggunakan rumus Flanagan:
Dari Tabel Kelompok skor di atas dapat dicari reliabilitas dengan rumus Flanagan
sebagai berikut :

(
r 11=2 1−
V 1V 2
Vt )
2 2
(∑ X ) (∑ Y )
∑X − 2
N ∑Y 2

N
Dengan V1 = N , V2 = N ,
2
(∑ Z )
∑Z − 2
N
Vt = N
Z =X+Y
Tabel kelompok skor dengan Rumus Flanagan
Subjek X Y Z XY X*X Y*Y Z*Z
A 5 5 10 25 25 25 100
B 5 4 9 20 25 16 81
C 5 4 9 20 25 16 81
D 5 3 8 15 25 9 64
E 4 4 8 16 16 16 64
F 5 2 7 10 25 4 49
G 3 2 5 6 9 4 25
H 1 3 4 3 1 9 16
I 1 3 4 3 1 9 16
J 2 1 3 2 4 1 9
Jumlah       
Variansi 2.64 1.29 5.61
Reliabilitas 0.785882

13
2
(∑ X ) 1296
∑X 2

N
156−
10 156−129 ,6 26 ,4
V1 = N = 10 = 10 = 10 = 2,64
2
(∑ Y ) 961
∑Y 2

N
109−
10 109−96 ,1 12,9
V2 = N = 10 = 10 = 10 = 1,29
2
(∑ Z ) 4489
∑Z −2
N
505−
10 505−448, 9 56,1
Vt = N = 10 = 10 = 10 = 5,61

(
r 11=2 1−
V 1V 2
Vt ) 2(1−2,64⋅1,29
= 5,61 ) 2 (1−
5,61 )
3, 4056
=
= 2 (1 – 0,6071) = 0,7858
Koefisien reliabilitas tersebut menyatakan bahwa, soal yang dibuat reliabilitasnya
tinggi.
Mencari Reliabilitas dengan Rumus Rulon

Rulon (1939) merumuskan suatu formula untuk mengestimasi reliabilitas


belah-dua tanpa perlu berasumsi bahwa kedua belahan mempunyai varians yang
sama.
Menurut Rulon, perbedaan skor subjek pada kedua belahan tes akan
membentuk distribusi perbedaan skor dengan varians yang besarnya ditentukan
oleh varians eror masing-masing belahan.
Untuk menguji reliabilitas instrumen dengan rumus Rulon kita juga harus
melalui langkah analisis butir.
Rumusnya adalah :
Vd
r II =1−
Vt
Keterangan: rII =reliabilitas instrumen
Vt = varians total atau varians skor total
Vd = varians (varians difference)
d = skor pada belahan awal dikurangi skor pada belahan
akhir.
Dari tabel kelompok skor dapat dicari reliabilitas dengan rumus Rulon sebagai
berikut :

14
Tabel kekompok skor dengan Rumus Rulon
selisih
Subjek X Y (d) Z Z*Z d*d
A 5 5 0 10 100 0
B 5 4 1 9 81 1
C 5 4 1 9 81 1
D 5 3 2 8 64 4
E 4 4 0 8 64 0
F 5 2 3 7 49 9
G 3 2 1 5 25 1
H 1 3 -2 4 16 4
I 1 3 -2 4 16 4
J 2 1 1 3 9 1
Jumlah      
Vt 5,61
Vd 2,25
Reliabilitas 0,598930481

b) Teknik Non Belah Dua


Mencari Reliabilitas dengan Rumus F. Kuder Richardson (KR)

Pakar yang mengemukakan teknik non belah dua adalah Kuder dan
Richardson. Kuder dan Richardson mengemukakan cara untuk menghitung
koefisien reliabilitas tanpa membelah alat evaluasi menjadi dua bagian. Tetapi
membagi alat evaluasi menurut banyaknya butir soal yang disajikan, yaitu dengan
cara menganalisis masing-masing soal itu.
Ada dua rumus yang digunakan yaitu:
- Rumus KR-20

Rumus KR-20 dapat diterapkan pada instrumen yang yang mempunyai data

15
skor dikotomi dari tes yang seolah-olah dibagi-bagi menjadi belahan sebanyak
butir yang dimiliki. Hasil perhitungan dengan rumus KR-20 lebih teliti, tetapi
perhitungan lebih rumit.(Bowo, 2008)
Rumus yang digunakan adalah sebagai berikut:

( k k−1 )( )
v t −∑ pq
r 11 =
Vt

Keterangan :
r11 = reliabilitas instrumen
k = Banyaknya butir pertanyaan
p = Proporsi subjek yang menjawab betul pada sesuatu butir soal
(proporsi subjek yang mendapat skor 1)
q = Proporsi subjek yang menjawab salah pada sesuatu butir soal sehingga
q = 1- p
Vt = Varians total
(Arikunto, 2002: 163)
Dibawah ini contoh mencari reliabilitas dengan menggunakan rumus KR-20:
Hitunglah koefisien reliabilitas hasil tes Matematika yang terdiri dari 12 butir soal
dan diikuti 10 subjek dengan menggunakan rumus KR-20. Pada tabel :
Tabel persiapan penggunaan rumus KR-20
No Subjek Nomor Soal Total

1 2 3 4 5 6 7 8 9 10 11 12
1 A 1 1 1 1 1 1 1 1 1 1 0 0 10
2 B 1 1 1 1 1 0 1 1 1 1 0 0 9
3 C 1 1 1 1 1 0 1 1 0 0 1 1 9
4 D 1 1 1 0 1 0 1 1 0 1 1 0 8
5 E 1 1 1 1 1 1 0 0 1 1 0 0 8
6 F 1 0 1 1 1 0 1 0 0 0 1 1 7
7 G 1 1 1 0 0 1 0 0 1 0 0 0 5
8 H 1 1 0 0 0 1 0 0 0 1 0 0 4
9 I 1 1 0 0 0 1 0 0 0 1 0 0 4
10 J 1 0 1 0 0 1 0 0 0 0 0 0 3

16
Np 10 8 8 5 6 6 5 4 4 6 3 2
t=67
Nq 0 2 2 5 4 4 5 6 6 4 7 8
P 1 0,8 0,8 0,5 0,6 0,6 0,5 0,4 0,4 0,6 0,3 0,2
t2=505
Q 0 0,2 0,2 0,5 0,4 0,4 0,5 0,6 0,6 0,4 0,7 0,8
Pq 0 0,16 0,16 0,25 0,24 0,24 0,25 0,24 0,24 0,24 0,21 0,16 pq=2,39
Misal mencari pq untuk soal nomor 2
Banyaknya subjek yang skornya 1 8
= = 0,8
p= N 10
q = 1 – 0,8 = 0,2
Nilai varian total (vt) 561, maka kita langsung menggunakan rumus KR-20, yaitu

( )( ) ( )(
v t −∑ pq
r 11 =
k
k −1 vt
=
12
12 −1
5,61−2,39
5,61
= ) ( )( )
12 3 ,22
11 5 ,61
= 1,0909 x 0,5739 = 0,626
Koefisien reliabilitas tersebut menyatakan bahwa, soal yang dibuat reliabilitasnya
tinggi.
- Rumus KR-21

Rumus KR-21 lebih sederhanadalam perhitungannya.Kelemahan KR-21


adalah kurang teliti dibandingkan dengan KR-20.(Bowo, 2008)

Rumus:
( )(
r II =
k
k −1
1−
M ( k− M )
kV t )
Keterangan: rII = realibilitas instrument
K = banyaknya butir soal atau butir pertanyaan
M = skor rata-rata
Vt = varians total
(Arikunto, 2002: 164)
Dibawah ini contoh mencari reliabilitas dengan menggunakan rumus KR-21:
Hitunglah koefisien reliabilitas hasil tes Matematika yang terdiri dari 12 butir soal
dan diikuti 10 subjek dengan menggunakan rumus KR-21. Pada tabel 6. :
Tabel 6. persiapan penggunaan rumus KR-21
No Subjek Nomor Soal Total Kuadrat
total

17
1 2 3 4 5 6 7 8 9 10 11 12
1 A 1 1 1 1 1 1 1 1 1 1 0 0 10 100
2 B 1 1 1 1 1 0 1 1 1 1 0 0 9 81
3 C 1 1 1 1 1 0 1 1 0 0 1 1 9 81
4 D 1 1 1 0 1 0 1 1 0 1 1 0 8 64
5 E 1 1 1 1 1 1 0 0 1 1 0 0 8 64
6 F 1 0 1 1 1 0 1 0 0 0 1 1 7 49
7 G 1 1 1 0 0 1 0 0 1 0 0 0 5 25
8 H 1 1 0 0 0 1 0 0 0 1 0 0 4 16
9 I 1 1 0 0 0 1 0 0 0 1 0 0 4 16
10 J 1 0 1 0 0 1 0 0 0 0 0 0 3 9
Jumlah                         67 505
M     6,7
Varians     5,61
Reliabilitas                           0,51547561
Koefisien reliabilitas tersebut menyatakan bahwa, soal yang dibuat reliabilitasnya
sedang.
Mencari reliabilitas dengan rumus Hoyt

Berbeda dengan rumus-rumus yang lain, C. Hoyt memandang bahwa sebuah


tes dapat dipandang sebagai sebuah interaksi faktorial di mana skor-skor tes
dianggap sebagai hasil eksperimen. Dalam hal ini, berlaku sebagai faktor I adalah
subjek (responden) sedangkan faktor II adalah butir soal. Dengan demikian
masing-masing sel terdiri atas satu subjek, untuk selanjutnya dapat dicari interaksi
antara subjek dengan butir soal.(Bowo, 2008)
Kelebihan rumus ini adalah dapat diterapkan baik pada soal yang
mempunyai skor dikotomi 1 dan 0 maupun pada soal yang mempunyai variasi skor
pada butirnya (tes sikap maupun tes uraian).(Bowo, 2008)
Untuk instrumen yang penyekorannya 1 dan 0 masih ada lagi cara lain untuk
mengetahui reliabilitas yaitu dengan rumus hoyt rumusnya ada dua macam yaitu:
v5 v r −v s
r II =1− r II =
Rumus: v r atau vr

Keterangan: rII = realibilitas instrumen

18
vr = varians responden
vs = varians sisa

Langkah-langkahnya:
1. Mencari jumlah kuadrat responden dengan rumus:
∑ X 2t − ( ∑ X t )2
Jk(r) = k kN
Keterangan:
Jk(r) = jumlah kuadrat responden

∑ X 2t = jumlah kuadrat jawab benar seluruh butir


k = banyaknya butir
N = banyaknya responden
(Xt)2 = kuadrat dari jumlah skor total
2. Mencari jumlah kuadrat butir
2

Jk ( b ) =
∑ B2 − ( ∑ X t )
N ( kN )
Jk(b) = jumlah kuadrat butir

∑ B2 = jumlah kuadrat jawab benar seluruh butir


k = banyaknya butir
N = banyaknya responden
3. Mencari jumlah kuadrat total dengan rumus:
( ∑ B )( ∑ S )
Jk ( t)=
(∑ B )+(∑ S )
Keterangan:
Jk(t) = Jumlah kuadrat total
B = Jumlah jawaban benar seluruh butir
S = Jumlah jawaban salah seluruh butir
4. Mencari jumlah kuadrat sisa dengan rumus
Jk(s) = Jk(t) – Jk(r) - Jk(b)
5. Mencari varians responden dan varians sisa dengan menggunakan tabel F

19
6. Memasukkan ke dalam rumus rII
( ∑ B )( ∑ S )
Jk ( t)=
(∑ B )+(∑ S )
Dibawah ini contoh mencari reliabilitas dengan menggunakan rumus Hoyt:
Hitunglah koefisien reliabilitas hasil tes Matematika yang terdiri dari 12 butir soal
dan diikuti 10 subjek dengan menggunakan rumus Hoyt Pada tabel :

1. Mencari jumlah kuadrat responden dengan rumus:


∑ X t 2 (∑ X t )2 505 4489
Jk ( r ) = − = −
k ( kN ) 12 120 = 42,0833 - 37,4083 = 4,675
2. Mencari jumlah kuadrat butir
2
∑ B2 ( ∑ X t ) 431 4489
Jk ( b ) = − = −
N ( kN ) 10 120 = 43,1 – 37,4083 = 5,691
3. Mencari jumlah kuadrat total dengan rumus:

(∑ B )(∑ S ) ( 67 ) (53 ) 3551


Jk ( t)= =
(∑ B )+(∑ S ) ( 67 ) + ( 53 ) = 120 = 29,5916
4. Mencari jumlah kuadrat sisa dengan rumus
Jk(s) = Jk(t) – Jk(r) - Jk(b) = 29,5916 – 4,675 – 5,691 = 19,2256

Tabel persiapan penggunaan rumus Hoyt


No Subjek Nomor Soal
Kuadrat
Total
total
1 2 3 4 5 6 7 8 9 10 11 12
1 A 1 1 1 1 1 1 1 1 1 1 0 0 10 100
2 B 1 1 1 1 1 0 1 1 1 1 0 0 9 81
3 C 1 1 1 1 1 0 1 1 0 0 1 1 9 81
4 D 1 1 1 0 1 0 1 1 0 1 1 0 8 64
5 E 1 1 1 1 1 1 0 0 1 1 0 0 8 64
6 F 1 0 1 1 1 0 1 0 0 0 1 1 7 49
7 G 1 1 1 0 0 1 0 0 1 0 0 0 5 25
8 H 1 1 0 0 0 1 0 0 0 1 0 0 4 16

20
9 I 1 1 0 0 0 1 0 0 0 1 0 0 4 16
10 J 1 0 1 0 0 1 0 0 0 0 0 0 3 9
B 10 8 8 5 6 6 5 4 4 6 3 2 67 505
B*B 100 64 64 25 36 36 25 16 16 36 9 4 431
S 0 2 2 5 4 4 5 6 6 4 7 8 53

Mencari varians responden dan varians dengan menggunakan table F

Sumber Jumlah d.b Varians


Variansi Kuadrat
Responden 4,675 9 4,675
9 = 0,52
Butir 5,691 11 5,691
11 = 0,52
Sisa 19,2256 99 19,2256
99 = 0,2
Total 29,5916 119 29,5916
119 = 0,25

Rumus d.b = banyaknya N setiap sumber variansi – 1


jumlah kuadrat
Variansi = db
Cara mencari d.b =
- d.b total = (kN) – 1 = (12 x 10) – 1 = 119
- d.b responden = N – 1 = 10 – 1 = 9
- d.b butir = k –1 = 12 – 1 = 11
- d. b sisa = d.b total – d.b responden – d.b butir = 119 – 9 – 11 = 99
1. Memasukkan ke dalam rumus rII
Vs 0,2
r II =1− =1−
Vr 0,52 = 1 – 0,38 = 0,62

b. Reliabilitas eksternal
Ukuran atau kriteriumnya berada diluar instrumen maka dari hasil

21
pengujian ini akan diperoleh reliabilitas eksternal. Reliabilitas eksternal dibagi
menjadi 2 yaitu pendekatan tes ulang dan pendekatan tes ekuivalen (teknik paralel)
1) Pendekatan Tes Ulang
Metode ini diterapkan untuk menghindari adanya penyusunan dua seri tes.
Teknisnya adalah sebuah tes yang sama diberikan dua kali kepada responden yang
sama dengan jarak waktu tertentu. Jika hasil tes pertama mempunyai kesejajaran
dengan hasil tes yang kedua maka tes tersebut dikatakan reliable. Oleh karena
pengujian ini dilakukan terhadap sebuah tes yang diuji cobakan dua kali maka
sering disebut pula sebagai single-test-double-trial-method.(Bowo, 2008)
Penggunaan alat penilaian terhadap subjek yang sama dilakukan dua kali
dalam waktu yang berlainan disebut tes ulang. Tes ulang dilakukan untuk
menghindari penyusunan dua seri tes. Dalam penggunaan teknik ini, pengetes hanya
memiliki satu seri tes tetapi dicobakan dua kali.
Untuk tes yang banyak mengungkap pengetahuan atau ingatan dan
pemahaman, cara ini kurang mengena karena tercoba akan masih ingat butir-butir
soalnya. Oleh karena itu, tenggang waktu antara pemberian tes pertama dengan
kedua menjadi permasalah tersendiri. Jika tenggang waktu terlalu sempit, siswa
masih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu lama, maka
factor-faktor atau kondisi tes sudah akan berbeda, dan siswa sendiri barang kali
sudah mempelajari sesuatu. Tentu saja factor-faktor ini akan berpengaruh pula
terhadap reliabilitas. (Arikunto, 1995:88)
Selain itu pendekatan tes ulang ( Tes- Re Test ) dilakukan dengan
menyajikantes dua kali pada suatu kelompok subjek dengan tenggang waktu di
antara kedua penyajian tersebut. Asumsi yang menjadi dasar dalam cara ini adalah
bahwa suatu tes yang reliabel tentu akan menghasilkan skor~tampak yang relatif
sama apabila dikenakan dua kali pada waktu yang berbeda.
Reliabilitasnya dihitung dengan cara mengkorelasikan hasil evaluasi pertama
dengan yang kedua. Tes hasil belajar dapat dikatakan tes hasil belajar yang reliabel
apabila antara skor-skor hasil tes pertama dengan skor hasil tes kedua menunjukkan
adanya keajegan atau kestabilan. Misalnya tes hasil belajar Matematika untuk SD
kelas V diberikan hari ini lalu diperiksa hasilnya, seminggu kemudian tes tersebut
diberikan lagi pada siswa yang sama dan hasilnya diperiksa. Hasil penilaian yang
pertama kemudian dikorelasikan dengan hasil penilaian yang kedua untuk
memperoleh koefisien korelasi (r). Persyaratan yang dipenuhi:
22
Pertama : Bahwa dalam jangka waktu antara penyelenggaraan tes pertama
denganpenyelenggaraan tes kedua. Guru sama sekali tidak boleh
menyinggung-nyinggung, memberikan atau memberikan agin atau
semacam petunjuk mengenai tes yang pertama.
Kedua : Testing dilakukan dalam situasi dan kondisi yang sama, artinya harus
diusahakan agar situasi dan kondisi pelaksanaan kedua tes itu tidak
berbeda dengan situasi dan kondisi sewaktu tes pertama berlangsung.
Selanjutnya, setelah tes selesai, skor-skor hasil tes pertama dikorelasikan
dengan skor-skor hasil tes kedua. Jika terdapat korelasi positif yang signifikan
antara skor-skor hasil tes kedua maka tes hasil belajar bidangstudi Matematika itu
dapat dinyatakan sebagai tes hasil belajar yang reliabel. Untuk mencari korelasi
antara skor-skor pertama dengan skor-skor hasil tes kedua, dapat dipergunakan
teknik korelasi rank-order (teknik korelasi tata jenjang) dari Spearman dengan
menggunakan rumus:
6 ∑ D2
ρ =1−
N ( N 2 − 1)
ρ = Koefisien korelasi antara variabel (skor hasil 1 dengan variabel 2)
D = Beda antara rank var 1 dengan rank var 2, D = R1
N = Peserta tes
Contoh:
Tentukan apakah tes hasil belajar Matematika yang diikuti oleh 20 siswa, dan
dilaksanakan sebanyak 2 kali dengan materi soal yang sama, memiliki reliabilitas
yang tinggi. Hasil yang diperoleh dari dua tes berikut tertera dalam tabel tersebut :

Teste Skor Rank (Urutan Kedudukan) D = (R1-


D2
Test 1 Test 2 Test 1 Test 2 R2)
A 58 60 6 7.5 -1.5 2.25
B 64 59 12 5.5 6.5 42.25
C 70 74 18 20 -2 4
D 72 68 20 16 4 16
E 57 59 5 5.5 -0.5 0.25
F 67 60 15 7.5 7.5 56.25
G 54 56 2 2 0 0

23
H 61 63 9 12 -3 9
I 71 70 19 17 2 4
J 65 67 13 15 -2 4
K 55 57 3 3 0 0
L 68 73 16 19 -3 9
M 62 64 10 13 -3 9
N 50 52 1 1 0 0
O 66 61 14 9.5 4.5 20.25
P 69 72 17 18 -1 1
Q 56 58 4 4 0 0
R 60 62 8 11 -3 9
S 63 65 11 14 -3 9
T 59 61 7 9.5 -2.5 6.25
N=20 0 201.5

Dari tabel telah kita ketahui D2 = 201.5 sedangkan N = 20 kita subtitusikan
kedalam rumus:
6∑D 6∑ D
2 2
ρ =1− =1− 1209
=1−
N ( N 2 − 1) 20(202 − 1 ) 7980 =1 – 0,151503759= 0,84896241 =
0,849
Koefisien reliabilitas tersebut menyatakan bahwa soal yang dibuat mempunyai
reliabilitas sangat tinggi.
2) Pendekatan Ekuivalensi
Penentuan reliabilitas tes dengan menggunakan pendekatan alternate form
ini sering dikenal dengan istilah pendekatan bentuk paralel. Pendekatan tes
ekuivalen dengan soal-soal pada perangkat kedua.
Tes yang akan diestimasi reliabilitasnya harus ada paralelnya, yaitu tes lain
yang sama tujuan ukurnya dan setara isi aitemnya baik secara kualitas maupun
kuantitasnya. Dengan bahasa sederhana dapat dikatakan bahwa kita harus punya dua
tes yang kembar. Sebenarnya, dua tes yang paralel hanya ada secara teoritik, tidak
benar-benar paralel secara empirik.

24
Untuk membuat dua tes menjadi paralel, penyusunannya haruslah
didasarkan pada satu spesifikasi yang sama. Secara empirik, kemudian dua tes yang
paralel itu haruslah menghasilkan mean skor dan varians yang setara dan korelasi
yang juga tidak berbeda dengan suatu variabel ketiga. Hanya itulah bukti
terpenuhinya sifat paralel antara dua tes yang dapat diperoleh dalam penyusunan
tes. Untuk membuktikan bahwa kedua tes menghasilkan dua skor murni yang sama
bagi setiap subjek serta memberikan dua varians eror yang sama sebagaimana
dituntut oleh teori skor murni klasikal, tidaklah dapat dilakukan.

Berikut ini adalah contoh soal yang ekuivalen:


Tes 1 Tes 2
Carilah faktor dari persamaan x2 – 5x – 6 Carilah faktor dari persamaan x2 – 6x + 8

Berikut ini adalah contoh soal yang tidak ekuivalen:


Tes 1 Tes 2
Carilah faktor dari persamaan x2 – 5x – 6 Carilah faktor dari persamaan 5x2 + 7x –4

Untuk menghitung koefisien korelasi antara nilai hasil tes dari seri pertama
dengan nilai hasil tes seri kedua digunakan teknik korelasi product momment dari
pearson dengan rumus sebagai berikut:

r xy =
∑ XY − ( ∑ X ) (∑ Y )
N

√ { N ∑ X 2 − (∑ X )2}{N ∑ Y 2−(∑ Y )2}


rxy = Koefisien korelasi
X = nilai hasil tes seri pertama
Y = nilai hasil tes seri kedua
N = peserta tes
Dibawah ini contoh mencari reliabilitas dengan menggunakan rumus pendekatan
ekuivalensi:
Tentukan reliabilitas tes dengan menggunakan pendekatan ekuivalen memuat 30
butir item dan seri kedua juga memuat 30 butir item. Data nilai hasil tes untuk seri
pertama dan kedua tertera dalam tabel berikut:

25
Tabel Hasil Tes pertama dan kedua
No Urut Nilai Test X Nilai Test Y XY X2 Y2
1 60 65 3900 3600 4225
2 50 60 3000 2500 3600
3 76 69 5244 5776 4761
4 65 70 4550 4225 4900
5 55 64 3520 3025 4096
6 60 55 3300 3600 3025
7 63 70 4410 3969 4900
8 70 75 5250 4900 5625
9 62 62 3844 3844 3844
10 59 64 3776 3481 4096
11 55 57 3135 3025 3249
12 60 65 3900 3600 4225
13 73 71 5183 5329 5041
14 68 72 4896 4624 5184
15 57 64 3648 3249 4096
16 50 55 2750 2500 3025
17 60 70 4200 3600 4900
18 70 68 4760 4900 4624
19 60 65 3900 3600 4225
20 75 80 6000 5625 6400
21 60 60 3600 3600 3600
22 55 60 3300 3025 3600
23 62 56 3472 3844 3136
24 50 55 2750 2500 3025
25 56 63 3528 3136 3969
26 70 61 4270 4900 3721
27 55 60 3300 3025 3600
28 60 63 3780 3600 3969
29 50 58 2900 2500 3364
Jumlah 1766 1857 114066 109102 120025

26
r xy =
N ∑ XY − (∑ X ) (∑ Y )
√ { N ∑ X 2 − ( ∑ X )2}{ N ∑ Y 2 − (∑ Y )2 }
(29)(114066 )− ( 1765 ) ( 1857 )
=
√ {29 .109102 − (1766 )2 }{ 29 .120025 − (185 )2}

= 0,74
SOAL EVALUASI

Soal Pilihan Ganda. Pilih salah satu opsi jawaban A,B,C,D atau E pada soal di bawah
ini!
1. Suatu metode pengujian reliabilitas instrumen dengan cara membuat instrumen yang
sama berdasar konsep atau pemahamannya namun dalam hal konteks berbeda disebut
dengan metode ....
A. Ekuivalen
B. Test Retest
C. Belah Dua
D. Non Belah Dua
E. Tes Tunggal
2. Yang termasuk Rumus pengujian reliabilitas internal teknik Belah dua yaitu ....
A. F. Kuder
B. Ekuivalen
C. F. Spearmen Brown
D. F. Flanagan
E. F. Rulon
3. Pernyataan yang tidak benar mengenai koefisien reliabilitas di bawah ini adalah ..
A. Koefisien reliabilitas dapat dipengaruhi oleh butir soal yang diujikan
B. Instrumen yang memiliki homogenitias yang tinggi sebanding dengan tingkat
koefisien reliabilitasnya
C. Semakin banyak jumlah soal pada instrumen maka koefisien reliabilitas semakin
rendah
D. Koefisien reliabilitas berkisar antara 0 sampai dengan 1
E. Tingkat oefisien relibilitas bergantung pada waktu penyelesaian instrumen

27
Soal Uraian. Kerjakan soal di bawah ini dengan menggunakan liersi yang sudah di
pelajari saudara, kerjakan dengan cermat dan lengkap.

1. Jelaskan Perbedaan Metode/Teknik pengujian Reliabilitas dengan pendekatan tes tunggal,


tes retest , dan pendekatan ekuivalen!
2. Dibawah ini merupakan hasil tes bentuk uraian yang terdiri dari 5 item dan diikuti oleh
siswa kelas VII A. Hasil tes tersebut telah disusun pada tabel berikut :

Tabel hasil tes dalam bentuk uraian


Frekuensi Nomor Soal Skor
1 2 3 4 5 Total

10 10 10 20 25 35 100
8 10 8 15 18 25 76
2 8 5 10 12 18 53
5 7 3 12 10 10 42
1 9 8 18 20 20 75
4 5 5 10 15 30 65
Ujilah tingkat reliabilitas dari soal uraian di atas!
3. Disajikan data hasil instrument tes matematika 10 siswa.

No Subje Nomor Soal


k Total

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 A 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1
2 B 1 1 1 1 1 0 1 1 1 1 0 0 1 1 0
3 C 1 1 1 1 1 0 1 1 0 0 1 1 1 1 0
4 D 1 1 1 0 1 0 1 1 0 1 1 0 0 1 0
5 E 1 1 1 1 1 1 0 0 1 1 0 0 0 1 0
6 F 1 0 1 1 1 0 1 0 0 0 1 1 1 1 1
7 G 1 1 1 0 0 1 0 0 1 0 0 0 0 1 0
8 H 1 1 0 0 0 1 0 0 0 1 0 0 1 1 1
9 I 1 1 0 0 0 1 0 0 0 1 0 0 0 0 0
10 J 1 0 1 0 0 1 0 0 0 0 0 0 0 1 1

28
a. Uji reliabilitasnya dengan menggunakan metode belah dua dan non belah dua.
b. Analisislah hasil dari kedua metode kemudian tulis kelenihan dan ekkeurangan
masing-masing metode di atas.

29
DAFTAR PUSTAKA

Arikunto, S. 1986. Beberaqpa Pengertian Tentang Validitas Dan Reliabilitas. Jakarta: Bumi
Aksara.
Arikunto,S. 1995. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

-------------. 2002. Prosedur Penelitian Suatu Pendekatan Praktek.Jakarta: Rineka Cipta.

-------------. 2005. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

Azwar, S.1997. Reliabilitas dan Validitas. Yogyakarta: Pustaka pelajar.

Bowo. 2008. Validitas Dan Reliabilitas. [ tersedia ]. Online :


http://www.scribd.com/doc/45901810/validitas-reliabilitas-bowo-2.
diakses tanggal 13 maret 2011.

Diknas. 2009. Reliabilitas. [ tersedia]. Online :


http://id.wikipedia.org/wiki/Reliabilitas/. Diakses pada tanggal 11 maret 2011

Filed. 2009. Arti Reliabilitas. [tersedia]. Online:


http:// Find-pdf.com/cari-pengertian+Reliabilitas+menurut+para+ahli/.
diakses tanggal 11 Maret 2011

Subino. 1987. Konstruksi Dan Analisis Tes Suatu Pengantar Kepada Teori Tes Dan
Pegukuran. Bandung: PPB FIP IKIP.

Sugiono. 2005. Validitas Dan Reliabilitas. [tersedia]. Online:


http//find-pdf.com/cari pengertian+reliabilitas+para+ahli/.diakses tanggal 11
Maret 2011

Ruseffendi, E.T. 1991. Penilaian Pendidikan dan Hasil Belajar Siswa Khususnya dalam
Pengajaran Matematika. Bandung: PPB FIP IKIP.

Tim MKDK IKIP Semarang. 1996. Belajar dan Pembelajaran. Semarang.

Wahyudin. 2003. Evaluasi dan Tes dalam Pembelajaran Matematika. Bandung: Program
Pasca Sarjana Universitas Pendidikan Indonesia.

Zainul, Asmawi. 1997. Program Pengembangan Ketrampilan Teknik Instruksional. Jakarta:


Dinas Pendidikan dan Kebudayaan.
Setiyawan, Adhi.2014. Faktor-Faktor yang Mempengaruhi Reliabilitas Tes. Online :
file:///C:/Users/Administrator/Downloads/53-Article%20Text-164-1-10-
20200205.pdf dalam Jurnal An Nûr, Vol. VI No. 2. Yogyakarta. Diakses pada
tanggal 25 Februari 2021

Widodo, Prasetyo Budi.2006. RELIABILITAS DAN VALIDITAS KONSTRUK SKALA


KONSEP DIRI UNTUK MAHASISWA INDONESIA. Online:
file:///C:/Users/Administrator/Downloads/686-1388-1-PB.pdf dalam Jurnal
Psikologi Universitas Diponegoro Vol.3 No. 1. Semarang. Diakses pada

30
tanggal 25 Februari 2021

Matondang, Zulkifli.2009.VALIDITAS DAN RELIABILITAS SUATU INSTRUMEN


PENELITIAN. Online: http://digilib.unimed.ac.id/705/1/Validitas%20dan
%20reliabilitas%20suatu%20instrumen%20penelitian.pdf dalam JURNAL
TABULARASA PPS UNIMED Vol.6 No.1. Diakses pada tanggal 25 Februari
2021

Robert L. Ebel, Essentials of Educational Measurement (3rd ed), (New Jersey: Prentice Hall,
Inc., 1979), hal 288.(Jurnal An Nûr, Vol. VI No. 2 Desember 2014)

Khumaedi, M. (2012). 5273-11270-1-PB.pdf (Vol. 12, pp. 25–30).


https://journal.unnes.ac.id/nju/index.php/JPTM/article/view/5273

Setiyawan, A. (2014). Faktor-Faktor yang Mempengaruhi Reliabilitas Tes. Jurnal An Nûr,


VI(2), 341–354.

31

Anda mungkin juga menyukai