Oleh
HUSNUL LAILI
11709251003
SITI NASIAH
11709251015
NELLY RHOSYIDA
11709251016
A. DEFINISI UMUM
Reliabilitas adalah derajat kekonsistenan hasil/nilai siswa pada
pemberian penilaian yang berulang (Nitko, Anthony J. & Susan M.
B. 2011 : 64). Konsistensi merupakan konsep penting untuk
memutuskan
seberapa
besar
derajat
kepercayaan
dari
hasil
terhadap siswa
dalam penggunaannya
untuk
tes.
2
XT
xx'
dimana X
dan X adalah skor amatan untuk dua tes yang paralel) adalah
koefisien reliabilitas.
xx' =1
xx' =0
), suatu
dengan X
Interpretasi ini merupakan interpretasi Standar untuk koefisien
korelasi Pearson, yang dijelaskan pada bab 2.8. korelasi kuadrat
dapat selalu di interpretasikan sebagai perbandingan pada
variansi dalam satu variable yang dijelaskan dengan hubungan
2
linear dengan variable lain. Sehingga, xx
'
dapat ditinjau
yang sempurna,
skor
amatan
xx' =1
, maka
mencerminkan
T
=1 , dan semua variansi
2
X
variansi
xx' =1
skor
sebenarnya
, adanya perbedaan
Jika
2E
(E) = 0 maka
pasti 0. karena
ketika
kesalahan
pengukurannya
(error).
bahwa
smua
skor
xx' <1
Ketika
pengukurannya. Ketika
xx' =0
dibuat
,
, maka
mencerminkan
2E=0 . Sehingga
tanpa
ada
error
2T = 2E
error
membuat
dalam
, yang berarti
saja.
Untuk
itu,
mengilustrasikan
hubungan
tersebut.
Kurva
mewakili
di tunjukkan
xx' =0,81
, maka
XT
0,9 ;
jika
xx' =0,25
, maka
XT =0,5
XT > xx '
, skor amatan
xx ' = XT
, jika
maka
xx '
oleh
XT
karena
XY
XY
tidak bisa
itu,ketidak
reliabelan
mempengaruhi
0,49 ,
maka
XT=0,7 .
Dalam
situasi
XY
(koefisien validitas) dapat sebesar 0,7 dan oleh karena itu, dapat
lebih tinggi dari koefisien reliabilitas.
'
2
5. x x =1 XE
Bahwa koefisien reliabilitas adalah 1 dikurang kuadrat korelasi
antara skor pengamatan dan skor kesalahan. Secara ideal,
XE
seharusnya 0, tapi
Hubungan antara
XE
XE=0
x x '
dan
4.3.
'
2
2
6. x x =1 E / X
hanya jika
'
x x =1 .
'
x x =1
maka
2E=0
dan ketika
'
x x =0
maka
sama
dalam
kelompok
yang
dibatasi
sebagai
x x ' =1 , maka :
skor
2X = 2T
ketika
x x ' =0 , maka :
0 x x' 1 , maka :
Ketika
skor
2
2
2
sebenarnya dan beberapa variansi skor kesalahan ( X = T + E )
x x '
XT
XE
1x x '
8.
'
x x ' = 2T / 2X
1. Metode Tes/Retest
Estimasi reliabilitas dengan test/retest merupakan
metode
didapat pada tes pertama dan jika variansi dalam skor amatan
diantara peserta uji korelasinya adalah 1.0 maka menunjukan
reliabilitas sempurna. Tapi, jika himpunan skor dari tes pertama
tidak
berhubungan
estimasinya
xx' =
dengan
himpunan
skor
tes
kedua,
0.
mengulangnya.
r XX '
melakukannya,
Jika
sebagian
besar
akan overestimate
peserta
xx'
tes
atau pada
nilai
ketangkasan dan
dengan
tes
berulang
pada
tes
yang
mengukur
dengan
variasi
waktu,
seperti
kesempatan.
mempengaruhi
Perbedaan
estimasi
lama
reliabillitas
waktu
dengan
dapat
cara
yang
dari
reliabilitas
sebenarnya.
Contohnya,
r xx'
, antara
dikonstruksikan
kesamaan
(atau
sangat
mirip)
ratarata
skor
bentuk
r xz
alternatif.
ini
akan
mencerminkan
bagaimana keduanya
parallel.
Untuk memperoleh reliabilitas dengan metode ini, kita perlu
membuat dua buah instrument tes yang diberikan pada subjek
yang sama namun pada waktu yang berbeda. Dengan demikian,
kita akan memperoleh dua himpunan skor dari tes pertama dan
kedua. Estimasi reliabilitas kita peroleh dari korelasi skor
pertama dan kedua.
Namun, menggunakan estimasi reliabilitas bentuk alternatif atau
paralel tidak selalu menghilangkan kemungkinan carry over
effect khususnya yang berhubungan dengan gaya respon,
suasana hati atau sikap. Seperti
dari
xx'
atau
x x
'
r xz
secara
atau
z z .
'
x x
'
, dan underestimate
rxx
'
z z
'
'
x x
'
dan
z z
'
r xz
adalah
akan
reliabilitas
menghasilkan
tes
jika
bentuk
estimasi
alternatifnya
yang
bagus
paralel
dari
atau
jika
keduanya fungsi linear dari skor tes paralel dan jika carry over
effects dan perubahan skor karena waktu tidak mempengaruhi
korelasi.
3. Metode Konsistensi Internal : Split Halves
Reliabilitas konsistensi internal diestimasi menggunakan satu
bentuk tes yang hanya diberikan sekali dan untuk menghindari
masalah yang ditimbulkan pada tes berulang. Metode ini lebih
dikenal sebagai estimasi reliabilitas dengan metode split half
(metode belah dua). Tes ini dibagi menjadi dua bagian, yang
merupakan
bentuk
alternatif
dari
masing-masing,
dan
tersebut sehingga
equivalent
(lihat
bagian 3.1). Jika bagian dari tes ini parallel, reliabilitas dari
keseluruhan
tes
diestimasi
dengan
menggunakan
rumus
koefisien
dapat
digunakan
untuk
11
beberapa
menyelesaikan
peserta
tes
ujian
mungkin
(menurunkan
skor
tidak
dapat
bagian
kedua).
Peserta
ujian
diberi
waktu
yang
sama
untuk
dua bentuk
Metode
dua
ini
statistic
melibatkan
dihitung
dua
metode
beberapa
langkah.
untuk
masing-masing
masing-masing
item
diplotkan
pada
grafik
membentuk
setengah
bagian
yang
lainnya.
Y Y
'
dan
Y' )
per
bagian.
Rumus
Spearman-Brown,
yang
2 Y Y
1+ Y Y
'
(4.1)
'
13
Y Y
X X
, karena
'
Y Y
'
'
X X
biasanya
'
adalah reliabilitas
bagian tes.
Y Y
Y Y
'
0.00
0.33
0.57
0.75
0.89
1.00
'
'
0.00
0.20
0.40
0.60
0.80
1.00
b. Koefisien
Y2
equivalent , koefisien
akan
memberian
batas
Y1
merupakan reliabilitas
equivalent , koefisien
bawah
dari
reliabilitas
rendah,
bukan merupakan
untuk
X X =
dan
2X
X =Y 1+Y 2
'
Dimana
2 [ X ( Y + Y ) ]
2Y
(4.2)
2
X
dan
2Y
Brown akan lebih besar jika bagian tes berkorelasi tinggi dan
akan bernilai kecil jika sebaliknya. Bagian tes akan berkorelasi
tinggi hanya jika mengukur trait yang sama atau yang
berkorelasi tinggi; sehingga, reliabilitas
Brown dan koefisien
rumus Spearman
amatan
dari
bagian
tes
sama,
dengan
bagiannya
antara skor kedua bagiannya adalah 0.5. varians skor per bagian
adalah 7 dan 5, dan varians skor total adalah 17.9. dengan
menggunakan
rumus
Spearman
Brown
(persamaan
4.1),
2(0.5)
=0.67
1+0.5
Reliabilitas
skor
total
diestimasi
dengan
koefisien
2 [17.9( 7+5 ) ]
=0.66
17.9
yang
lebih
kecil
dibandingkan
menghasilkan
menggunakan
rumus
Spearman Brown.
Manfaat terbesar estimasi reliabilitas konsistensi internal adalah
tes hanya perlu diberikan sekali untuk dapat mengestimasi
relibilitasnya. Bagaimanapun juga, metode konsistensi internal
ini tidak terpenuhi ketika tes tidak dapat dibagi menjadi
beberapa bagian yang parallel atau
equivalent
dasar atau
harusnya tidak
dan ganjil tiap peserta uji bisa jadi hampir identik, akibatnya
nilai estimasi reliabilitas mendekati 1. Dan jika estimasi dengan
split half berdasarkan korelasi setengah bagian pertama dan
bagian kedua, nilai estimasi bias jadi mendekati 0, ketika
sebagian besar peserta uji mendapatkan nilai tinggi pada bagian
16
pertama dan nilai rendah pada bagian kedua. Pada kasus ini,
korelasi antara bagian-bagiannya mencerminkan error antara
bagian pertama dan kecepatan pada bagian kedua. Metode
matched random subsets tidak lagi sesuai untuk tes kecepatan,
karena item yang sulit dan korelasi item akan menjadi fungsi
dari tes daripada fungsi sifat-sifat item itu sendiri.
KASUS UMUM RELIABILITAS INTERNAL KONSISTENSI
Teknik membagi tes menjadi dua bagian dengan metode
sebelumnya dapat digeneralisasikan untuk membagi tes menjadi
lebih dari dua bagian. Contohnya, metode genap dan ganjil
dapat dimodifikasi dengan membuat pertiga untuk tes dengan
sembilan item dengan memasukkan item pertama, keempat,
dan ketujuh ke dalam sepertiga bagian pertama, item kedua,
kelima, dan kedelapan dalam sepertiga bagian kedua, serta item
ketiga, keenam, dan kesembilan dalam bagian ketiga. Metode
matched random subsets
ini
mengasumsikan
bahwa
tes
dibagi
menjadi
equivalent
, rumus
a. koefisien
Rumus
koefisien
digunakan
untuk
mengestimasi
X X =
'
N
N1
[ 2X 2Y ]
i=1
2
X
(4.3)
Dimana
X = skor amatan yang dibentuk dari mengkombinasikan N
N
X = Y
komponen,
i=1
2X = varians populasi X
2Y = varians populasi dari komponen ke-I , Yi
i
X X KR20=
'
N
N1
[ 2X pi (1 pi )]
i=1
(4.4)
18
pi
Dimana
adalah
mendapatkan i
proporsi
peserta
ujian
yang
1, sama dengan
dimana
pi
adalah proporsi
(20) .
-20 , disingkat
Rumus Kuder-Richardson 21
Rumus Kuder-Richardson yang lain yang sangat berguna
ketika setiap Yi merupakan item dikotomi adalah
[ ]
X X KR21=
'
N
N 1
[ 2X N p (1 p )]
i=1
(4.5)
Dimana
p
p= ( X )/ N
(21) , selanjutnya
KR20 KR21
(4.6)
(yaitu, pada
yang
sama
equivalent .
dan
Nilai
yang
tinggi.
Sehingga
rumus
pada
bagian
ini
varians
^pi
komponen-komponennya,
s 2X
s 2Y ,
i
pada persamaan
s 2Y =4.8
s 2Y =5.2
4.3) =
[ ][
3 [2515]
=0.6 .
2
25
20
equivalent
, 0.6
X =2
skor
varians
item,
[ ][
5
4
[31]
= 0.833
3
2
^p= =0.4 , dan
5
N ^p ( 1 ^p )=1.2 .
Estimasi batas
[ ][
5
4
KR21
[31.2]
=0.75 .
3
menghasilkan
estimasi
batas
bawah
lebih
kecil
untuk
mengestimasi
(4.7)
'
'
21
Dimana
X
skor
amatan
total
yang
dibentuk
dengan
N
Yi
i=1
=reliabilitas populasi X
'
= reliabilitas populasi
'
Yi
X X Y Y
'
X X
'
'
jika N dan
'
N XX
Y Y =
1
1+( 1) X X
N
X X
'
diketahui.
'
'
'
(4.8)
Dan jika diketahui
X X
dan
'
Y Y
'
X X (1Y Y )
Y Y (1 X X )
'
'
'
'
(4.9)
Berikut
contoh
aplikasi
persamaan-persamaan
tersebut.
22
reliabilitas (
populasi (
rXX
X X
'
dan
Y Y
dan
'
rY Y
'
'
).
1. Kita punya tes lima menit dengan reliabilitasnya 0.6. jika kita
melakukan tes tiga kali dengan menambahkan komponen
yang pararel, maka berapa estimasi reliabilitas tes yang lebih
panjang?
N = 3 dan
rXX =
'
r Y Y =0.6
, maka diperoleh
'
3(0.6)
=0.82
1+2.( 0.6)
1
(0.9)
5
rY Y =
=0.64
1
1+ 1 0.9
5
'
( )
N=
'
0.9(10.8)
=2.25
0.8(10.9)
23
berulang
dengan
tes
yang
sama
atau
parallel.
dengan
skor
=0
sebenarnya.
Gambar
4.6
menunjukkan
hingga T+
, atau
, maka skornya
'
Jika diasumsikan
24
3. Asumsi bahwa
s E =s X 1r X X
'
berbeda.
9. Seleksi tugas-tugas penilaian yang dikerjakan dengan baik dari
perbedaan siswa-siswa yang berprestasi terhadap siswa-siswa
yang kurang mampu
E. KESIMPULAN
Reliabilitas (
xx'
penting
untuk
memutuskan
seberapa
besar
derajat
, adalah
standar deviasi dari skor error untuk peserta ujian khusus dalam
pengetesan berulang yang independen dengan tes yang sama atau
tes yang parallel. Standar eror ini dapat diestimasi dari standar
deviasi skor amatan dan reliabilitas yang diestimasi pada kelompok
peserta uji, menggunakan rumus
^ =s X 1r X X
'
REFERENSI
Nitko, Anthony J. & Susan M. B. 2011. Educational Assessment of
Students 6th Edition. USA : Pearson Education, Inc.
Mary J. Allen & Wendy M. Yen. 1979. Introduction to Measurement
Theory. California: A Division of Wadsworth, Inc.
Singh, Arun Kumar. 1986. Tests, Measurement and Research Methods
in Behavioral Sciences. New Delhi: Tata McGraw Hill.
26