Anda di halaman 1dari 10

Pertemuan 12

RELIABILITAS

Pendahuluan
Pada bab yang lalu, anda telah memahami bentuk bentuk instrumen pengumpul data. Bentuk-
bentuk tersebut bisa diterima atau tidak, sangat banyak tergantung pada tingkat reliabilitas instrumen.
Karena itu, akan dibahas dalam bab ini tentang reliabilitas instrumen.

Indikator
Setelah memperoleh uraian dalam bab ini, diharapkan mahasiswa mampu :
a. Menjelaskan pengertian reliabilitas
b. Menjelaskan faktor yang mempengaruhi Reliabilitas
c. Menjelaskan macam-macam cara mencari reliabilitas
d. Menghitung tingkat reliabilitas instrumen

Pengertian Reliabilitas
Banyak sekali para ilmuwan yang memberikan pengertian tentang reliabilitas. Dari berberapa
definisi yang ada terdapat satu kesamaan dalam melihat makna reliabilitas tersebut. Reliabilitas
sering diartikan dengan keterandalan (dependability), artinya suatu tes memiliki keterandalan
bilamana tes tersebut dipakai mengukur berulang-ulang hasilnya sama.
Reliabilitas juga diartikan dengan keajegan (consistency) bilamana tes tersebut diujikan
berkali-kali hasilnya relatif sama, artinya setelah hasil tes pertama dengan tes berikutnya
dikorelasikan terdapat hasil korelasi yang signifikan. Disamping itu dapat diketahui dengan jalan
menggunakan dobel tes, yakni disusun dua buah tes yang paralel kemudian keduanya diujikan dan
hasilnya dikorelasikan. Bila kedua hasil tersebut menunjukkan korelasi positif dan signifikan maka tes
tersebut memiliki keajegan. Reliabilitas diartikan juga dengan kestabilian ( stability) bilamana tes itu
diujikan dan hasilnya diadakan analisis reliabilitas dengan menggunakan kriteria internal dalam tes
tersebut. Cara untuk mengetahui koefisien stabilitas ini adalah dengan beberapa rumus yang
seluruhnya cukup menggunakan satu tes dengan sekali diujikan. (Thaha, 1991: 119)
Sebetulnya reliabilitas merupakan sifat yang ada pada data atau skor yang dihasilkan oleh
instrumen, namun untuk memudahkan reliabilitas dapat dikatakan merupakan sifat dari instrumennya
juga. Reliabilitas bukanlah bersifat dikotomis, tapi merupkan rentangan yang biasanya dinyatakan
dalam bentuk angka 0 (nol) sampai 1 (satu). Dengan demikian kurang tepat kiranya kalau
dipertanyakan apakah suatu instrumen itu memiliki reliabilitas atau tidak, akan tetapi tepatnya adalah
apakah suatu instrumen dapat menghasilkan data atau skor yang memiliki tingkat reliabilitas yang
memadai atau tidak. Suatu instrumen memiliki tingkat reliabilitas yang tinggi, sedang, atau rendah.
(Saukah, 1994: 2)
Hampir sama dengan pengertian tersebut, bahwa keberadan reliabilitas tidak semata-mata
berupa dua pilihan, reliabel ataukah tidak reliabel, akan tetapi merupakan rentangan yang berjenjang
dari tingkat yang paling tinggi sampai tingkat yang paling rendah. Reliabilitas tingkat paling tinggi
yang secara statistik dituliskan sebagai 1,00 yang menandakan adanya keajegan mutlak tanpa
perbedaan dan penyimpangan sedikitpun. Reliabilitas mutlak itu pada umumnya hanya dianggap
bersifat teoritis sebab pada kenyataannya hampir tidak ada hasil pengukuran yang mutlak ajeg tanpa
perbedaan, lebih-lebih pengukuran dalam bidang yang memiliki banyak aspek seperti pengajaran
bahasa.
A. Faktor-faktor yang mempengaruhi Tingkat Reliabilitas
Tingkat reliabilitas suatu instrumen atau tes dipengaruhi oleh banyak hal, antara lain :
1) Jumlah butir soal, banyaknya soal pada suatu instrumen ikut mempengaruhi derajat
reliabilitasnya. Dengan semakin banyaknya soal-soal maka tes yang bersangkutan cendeung untuk
menjadi semakin reliabel sebagaimana dinyatakan dalam rumus Spearman – Brown.
Hubungan antara jumlah butir dengan reliabilitas instrumen dapat didilihat pada keadaan berikut :
Jumlah butir Reliabilitas
5 0,20
10 0,33
20 0,50
40 0,67
80 0,80
160 0,89
320 0,94
640 0,97

Gambaran diatas menujukkan bahwa semakin tinggi tingkat reliabilitas instrumen, semakin
sedikit peningkatan yang terjadi akibat pelipatgandaan butirnya. Gejala yang terlihat dari pemakaian
rumus tersebut akan berlaku apabila dua asumsinya terpenuhi, yaitu :
a) Butir-butir instrumen yang ditambahkan tersebut memiliki karakteristik yang sama dengan butir-
butir yang sudah ada, misalnya tidak lebih mudah atau lebih sulit.
b) Subjek yang mengisi instrumen atau mengerjakan tes tersebut tidak terpengaruh secara
psikologis dengan bertambahnya jumlah butir-butirnya, misalnya tidak menjadi lelah dan lain
sebagainya.
2) Homoginitas soal tes, soal yang memiliki homoginitas tinggi cenderung mengarah kepada
tingginya tingkat reliabilitas. Dua buah tes yang sama jumlah butir-butirnya akan tetapi berbeda
isinya, misalnya yang satu mengukur pengetahuan kebahasaan dan yang lainnya mengukur
kemampuan Fisika akan menghasilkan tingkat reliabilitas berbeda. Tes Fisika cenderung
menghasilkan tingkat reliabilitas yang lebih tinggi daripada tes kebahasaan karena dari segi isi
kemampuan menyelesaikan soal Fisika lebih homogen daripada pengetahuan kebahasaan.
3) Waktu yang diperlukan untuk menyelesaikan tes, semakin terbatasnya waktu dalalm
pengerjaan tes maka akan mendorong tes untuk cenderung memiliki reliabilitas yang tinggi, hal ini
terutama apabila reliabilitas diperoleh dengan cara split half (belah dua).
4) Keseragaman kondisi pada saat tes diberikan, kondisi pelaksanaan tes yang semakin
seragam akan memunculkan reliabilitas yang makin tinggi.
5) Kecocokan tingkat kesukaran terhadap peserta tes, bahwa soal-soal dengan tingkat
kesukaran sedang cenderung lebih reliabel dibandingkan dengan soal-soal yang sangat sukar
maupun yang sangat mudah.
6) Heteroginitas kelompok, bahwa semakin heterogin suatu kelompok dalam pengerjaan suatu tes
maka tes tersebut semakin cenderung untuk menunjukkan tingkat reliabilitas yang tinggi.(Joni, 1984:
38)
7) Variabilitas skor, instrumen yang menghasilkan rentangan skor yang lebih luas atau lebih tinggi
variabilitasnya akan memiliki tingkat reliabilitas yang lebih tinggi daripada yang menghasilkan
rentangan skor yang lebih sempit. Seperti, tes bentuk pilihan ganda cenderung menghasilkan tingkat
reliabilitas lebih tinggi daripada tes bentuk benar salah.
8) Motivasi individu, motivasi masing-masing individu dalam mengerjakan suatu instrumen akan
mempengaruhi tingkat reliabilitas. Perbedaan motivasi antar individu dalam kelompok akan
menimbulkan kesalahan acak pada pengukurannya, oleh karena individu yang tidak memiliki
motivasi tidak akan mengerjakan instrumen tersebut secara sungguh-sungguh sehingga jawaban
yang diberikan tidak akan mencerminkan kenyataan yang sebenarnya.(Saukah 1994: 8)

Dengan mengetahui faktor-faktor yang mempengaruhi tingkat reliabilitas tersebut, kita dapat
melakukan upaya untuk meningkatkan reliabilitas instrumen yang pada akhirnya akan meningkatkan
kualitas penelitian kita terhadap suatu instrumen dalam hubungannya dengan tingkat reliabilitas yang
dimilikinya. Upaya peningkatan reliabilitas instrumen dapat dilakukan terutama dalam proses
mempersiapkan dan mengembangkan instrumen serta pada waktu kita menggunakan instrumen
tersebut untuk menjaring data.

Macam-macam Cara mengetahui Tingkat Reliabilitas

Sebagaimana dikemukakan pada bagian sebelumnya bahwa reliabilitas suatu instrumen


dinytakan dalam rentangan skala 0 sampai dengan 1. Angka-angka tersebut dinamakan koefisien
korelasi. Angka-angka tersebut diperoleh dari perhitungan menurut rumus-rumus tertentu sesuai
dengan sifat dan keadaan tes yang yang digunakan. Koefisien korelasi yang dinyatakan dalam rumus
r merupakan ungkapan korelasi antara hasil penggunaan suatu tes dengan hasil penggunaan lain dari
tes yang sama.
Penggunaan rumus-rumus tersebut bergantung pada jenis dan bentuk tes yang digunakan.
Disamping itu juga perlu memperhatikan keadaan yang ada seperti kendala yang ditemui dalam
penyelenggaraan tes tersebut. Hal lain yang juga perlu diperhatikan adalah interpretasi terhadap hasil
penghitungannya.
Ada beberapa cara yang dapat digunakan unutuk mengetahui atau menguji tingkat reliabilitas
suatu tes, yaitu sebagai berikut :

1) Metode Tes Ulang (test-retest)


Yaitu penggunaan tes yang sama dua kali pada sejumlah peserta tes yang sama. Koefisien korelasi
yang menunjukkan tingkat keajegan skor yang dihasilkan suatu tes dapat diperoleh dengan
mengkorelasikan dua deret skor, hasil pengulangan tes yang sama. Dalam hal ini perlu dipehitungkan
faktor tenggang waktu antara kedua penyelenggaraan tes. Pada metode ini perlu diusahakan agar
kajian reliabilitas dilakukan dengan memperkecil pengaruh faktor ingatan maupun perkembangan
kemampuan.
Beberapa kelemahan metode ini antara lain sebagai berikut:
a) Di antara kedua waktu tes, terjadi perubahan dalam diri responden sehingga perbedaan
antara hasil pengukuran yang pertama dengan yang kedua merupakan perbedaan yang benar.
Sebagai contoh, pada waktu tes pertama responden belum menikah, belum mempunyai pekerjaan
dan mempunyai sikap pesimis terhadap hidup, maka pada waktu tes kedua ia sudah menikah,
mempunyai pekerjaan tetap, dan sikapnya berubah optimis.
b) Dibandingkan dengan yang pertama, dalam tes yang kedua responden cenderung lebih siap
dalam menjawab pertanyaan.
c) Responden hanya mengingat dan mengulang kembali jawaban yang pernah diberikannya.
(Hagul, 1981: 92)

2) Metode Tes Setara (equivalent)


Yaitu dengan mengembangkan dua tes setara yang mampu menghasilkan skor yang sama
atau setara pula bagi kelompok pesrta tes yang sama tanpa mengulang penggunaan tes yang sama.
Dengan dua tes setara maka faktor waktu penyelenggaraan yang berdekatan tidak lagi menjadi
masalah.
Rumus korelasi yang dipakai untuk menghitung tingkat reliabilitas suatu instrumen dengan
metode tes ulang dan tes setara adalah rumus Pearson product moment dengan syarat skor yang
diperoleh adalah berbentuk data interval. Dan apabila data yang diperoleh adalah data ordinal maka
rumus yang dipakai adalah Spearman rank-order (rho).
Rumus Pearson product moment adalah
R = Σ[(X-X) (Y-Y)]
NSxSy
X = skor masing-masing individu dalam satu perangkat
Y = skor individu dalam perangkat yang lain
N = jumlah individu
Sx = simpang baku satu perangkat
Sy = simpang baku pada pernagkat yang lain
Sedangkan rumus Spearman rank-order adalah
p = 1 6 Σ D2
N(N2-1)
D = perbedan perangkat (rank) antara masing-masing skor
pada dua perangkat tersebut

3) Metode Belah Dua


Tes cukup dilakukan sekali. Untuk menghitung koefisien reliabilitas maka semua jawaban
masing-masing peserta dibagi menjadi dua bagian, yaitu jawaban butir nomor genap dan jawaban
butir nomor ganjil. Koefisien reliabilitas diperoleh berdasarkan perhitungan korelasi dua bagian
tersebut. Hasil korelasi tersebut baru menunjukkan tingkat reliabilitas separuh dari instrumen tersebut.
Oleh karena itu tingkat reliabilitas dari instrumen itu secara utuh perlu diperkirakan dengan cara
menggunakan rumus Spearman – Brown
2⋅r 1/2⋅1/2
r 11=
( 1+r 1/2⋅1/2 )

r 11 = reliabilitas instrumen penuh


r ½ ½ = tingkat reliabilitas separuh

4) Metode Kuder-Richardson
Penerapan metode ini dengan persyaratan penggunaan skor dengan dua kemungkinan yaitu
skor 1 untuk jawaban benar dan skor 0 untuk jawaban salah. Pada metode ini ada KR-20 dan KR-21.
Penerapan KR-20 dengan penghitungan persentase jawaban benar untuk masing-maing butir soal
2
(diberi tanda p),disamping varian seluruh skor (ditandai S ). Sedangkan rumus KR-21 penerapannya
hanya memerlukan penghitungan skor rataan (ditandai dengan M, mean)
Rumus KR-20 adalah

r 11= ( )(
n
n−1

S 2−∑ pq
S2 )
k = jumlah butir dalam instrumen
p = proporsi individu yang menjawab suatu butir dengan benar
(misalnya, jika untuk butir nomor 1 ada 10 dari 40 orang
menjawab benar, nilai p untuk butir ini adalah 10 dibagi 40 =
0,25)
q = proporsi individu yang menjawab salah (q = 1-p ; sehingga
untuk butir nomor 1 tersebut, q = 1-0,25 = 0,75)
pq = varians dari satu butir yang diskor secara dikotomis
Sedangkan rumus untuk mencari varian :
2
(∑ X )
2
∑X 2

N
S =
N
2
S = Varian
N = jumlah peserta tes

Rumus KR-21 adalah

r 11= ( n−1
n
)⋅(1− M (n⋅Sn−M ) ) 2
t
M = rerata seluruh skor dalam instrumen
Sx2 = varians skor total

5) Metode Koefisien Alfa


Metode ini digunakan pada soal-soal yang tidak bisa dilakukan dengan penskoran 1 atau nol
seperti dalam soal bentuk esai. Jadi tidak bisa diterapkan pada butir-butir yang tidak bisa diskor
secara dikotomis, melainkan berbentuk rentangan. Rumusnya adalah

( )(∑ S1
)
2
n
r 11 = 1− 2
n−1 St

Si2 = varians skor setiap butir


S 2t = varians skor total

6) Metode Antar Penilai


Penerapan metode ini, setiap pekerjaan tes dinilai oleh lebih dari seorang penilai minimal
dua orang. Masing-masing melakukan penilaian secara terpisah atas dasar kriteria yang telah
ditentukan sebelumnya. Bila skor yang diberikan oleh para penilai itu dikorelasikan maka hasilnya
menunjukan tingkat koefisien reliabilitas hasil tes tersebut. Korelasi product moment menghasilkan
angka yang menunjukkan reliabilitas satu perangkat skor sebagai hasil penskoran satu orang,
sedangkan untuk menghitung reliabilitas rata-rata dari dua perangkat skor tersebut maka dapat
dihitung dengan menggunakan rumus Spearman-Brown.

7) Metode perkiraan
Dengan menggunakan dua macam tabel, satu untuk tes yang dikategorikan sebagai tes
mudah dan satu lagi untuk tes yang sulit. Cara penghitungan ini dapat dilakukan berdasarkan jumlah
butir tes (n), rataan (R), dan simpangan baku (SB).
R = (SX : N)
X = skor
N = banyaknya skor yang dihitung

SB = (Sx2 : N)
x = selisih antara suatu skor dengan R
Kriteria Tingkat Reliabilitas Yang Memadai
Belum ada ukuran yang baku secara absolut untuk menentukan tingkat reliabilitas yang
dianggap memadai. Namun para ahli cenderung sepakat terhadap adanya ketentuan bersifat
relatif yang tergantung pada beberapa factor:
Faktor pertama, berkaitan dengan masalah apakah instrumen itu berupa tes yang dibuat
oleh guru untuk digunakan dikelasnya, ataukah tes yang dibuat oleh lembaga professional (tes
baku).
Pada umumnya, tingkat reliabilitas yang memadai bagi soal tes buatan guru adalah
berkisar antara 0,50 sampai 0,95. Berbeda dengan soal tes baku atau terstandar yang menuntut
pencapaian angka reliabilitas lebih tinggi antara 0,85 sampai 0,95. Ada beberapa sebab
mengapa tes buatan guru r = 0,50 dianggap cukup memadai, yaitu :
a. Tes buatan guru pada EBTA ini bukanlah satu-satunya faktor penentu dalam menilai
kemampuan seorang siswa, sebab keputusan-keputusan yang diambil oleh guru disekolahnya
dalam memberi skor pada ijazah tidak hanya didasarkan pada skor tes EBTA ini saja, melainkan
juga didasarkan pada skor yang diperoleh dari beberapa kali penyelenggaraan tes seperti tes
semester satu dan semester dua. Sedangkan tes semester itu sendiri sudah kita kenal sebagai
tes buatan guru murni. Oleh karena itu tes buatan guru atau EBTA yang mencapai tingkat
reliabilitas 0,69 ini dianggap cukup memadai.
b. Tes buatan guru tidak disusun melalui proses uji coba yang mendalam terhadap butir-
butirnya, untuk memberikan revisi-revisi terhadap tingkat kesulitan, daya beda dan lain-lain. Hal
ini berbeda dengan tes baku atau terstandar yang harus melalui uji coba mendalam untuk
menjaring butir-butir yang baik dan membuang yang tidak baik. Sehingga rentangan yang dituntut
dalam tes terstandar mencapai 0,85 sampai 0,95, seperti dalam tes UMPTN dan TOEFL.
Faktor kedua, berkaitan dengan bagaimana skor hasil instrumen itu akan dipakai,yaitu
berkaitan dengan penting tidaknya keputusan yang diambil, dan seberapa besar bobot skor dalam
perannya sebagai penentu dalam keputusan tersebut. Jika skor itu akan dipakai sebagai factor
untuk menentukan nasib individu, tingkat reliabilitasnya minimal harus 0,85. Sedangkan jika skor
itu akan dipakai untuk mengambil keputusan yang menyangkut kelompok, tingkat reliabilitasnya
minimal harus 0,65.
Tingkat reliabilitas instrumen yang mengukur aspek afektif , misalnya angket dan skala
sikap, cenderung lebih rendah dari pada tes yang mengukur aspek kognitif. Oleh karena itu,
tuntutan tingkat reliabilitas untuk instrumen yang mengukur aspek afektif cenderung telah lunak
dari pada yang mengukur aspek kognitif. Oleh karena aspek afektif cenderung lebih labil dari
pada aspek kognitif, yang seringkali dipakai untuk menghitung tingkat reliabilitas instrumen yang
mengukur aspek afektif adalah cara belah dua, rumus KR-20 atau KR-21 dan rumus Coefficient
Alpha.(Saukah, 1994: 16)

MENGHITUNG TINGKAT RELIABILITAS


Agar memudahkan aplikasi perhitungan tingkat reliabilitas, berikut akan diberikan beberapa
contoh perhitungan Reliabilitas sesuai rumus-rumus dan cara yang telah dikemukakan
sebelumnya :
Contoh :
Dalam sebuah tes Bahasa Arab yang terdiri dari 10 orang dengan menggunakan 7 butir soal,
diperoleh data sebagai berikut :
TABEL CONTOH PERHITUNGAN
MENCARI RALIABILITAS
SKOR TOTAL
NOMOR BUTIR / ITEM 2
NO NAMA (X) X
1 2 3 4 5 6 7

1 Tukul 1 0 1 1 1 1 0 5 25

2 Jojon 0 1 1 0 1 1 1 5 25

3 Kirun 0 0 0 0 1 0 1 2 4

4 Santi 0 1 1 1 1 1 1 6 36

5 Joko 1 0 0 0 1 0 0 2 4

6 Rani 0 1 1 1 1 0 0 4 16

7 Pilus 0 0 0 1 1 1 0 3 9

8 Rara 0 1 0 1 1 0 0 3 9

9 Karyo 0 1 0 1 1 0 0 3 9

10 Dody 0 0 0 1 1 0 0 2 4

Np 2 5 4 7 10 4 3 35 141

p 0.2 0.5 0.4 0.7 1 0.4 0.3

q 0.8 0.5 0.6 0.3 0 0.6 0.7

pq 0.16 0.25 0.24 0.21 0 0.24 0.21 ∑pq = 1,31

Keterangan
Np = Jumlah yang menjawab benar
p = Proporsi subyek yang menjawab item dengan benar ( % )
q = Proporsi subyek yang menjawab item dengan salah ( q = 1 – p )
∑pq = jumlah hasil perkalian antara p dan q
n = banyaknya item
Menggunakan Rumus KR-20
r 11=
n
( )(
n−1

S 2−∑ pq
S
2 )
R = tingkat reliabilitas
2
S = varian
n = banyaknya item
N = banyaknya siswa
Rumus varian :
2
(∑ X )
2
∑X 2

N
S =
N

2
35
141−
10
S 2=
10

18 ,5
S 2=
10

S 2 =1,85
Dimasukkan dalam rumus KR-20

r 11= ( )(
7
7−1

1, 85−1, 31
1 ,85 )
r 11= ( )( )
7 0 ,54

6 1, 85

r 11=( 1 ,17 )⋅( 0 , 29 )

r 11=0 ,3415 dibulatkan 0,342

Menggunakan Rumus KR-21

r 11 = ( )(
n
n−1
⋅ 1−
M ( n−M )
n⋅S 2t )
M = Mean ( jml skor total : jml peserta = 3,5 )
r 11= ( )(
7
7−1
⋅ 1−
3,5(7−3,5)
7×1 , 85 )
r 11= ( 76 )⋅( 1−123,5×3,5
, 95 )

(
r 11=( 1 ,17 )⋅ 1−
12 ,25
12 , 95 ) =( 1,17 )⋅( 1−0 ,946 )

r 11=( 1 ,17 )⋅( 0 , 0541 )

r 11=0 , 06329

Jika dibandingkan reliabilitas yang dihitung dengan KR-20, maka KR-21 hasilnya lebih kecil. Dan
memang menggunakan rumus KR-20 cenderung memberikan hasil yang lebih tinggi, tetapi pekerjaannya
lebih rumit.

Menggunakan Rumus Koefisien Alpha


Dalam sebuah ujian Bahasa Indonesia yang berbentuk essay, diperoleh skor siswa sebagai berikut :

TABEL CONTOH PERHITUNGAN


MENCARI RALIABILITAS DENGAN RUMUS ALPHA

NOMOR ITEM Kuadrat


Skor
NO NAMA Skor
1 2 3 4 5 6 Total
total

1 Tukul 10 6 8 8 10 10 52 2704

2 Jojon 6 4 4 6 6 5 31 961

3 Kirun 8 2 6 8 7 8 39 1521

4 Santi 7 3 7 7 6 6 36 1296

5 Joko 0 5 3 2 4 4 18 324

6 Rani 2 4 2 8 6 8 30 900

7 Pilus 4 3 6 6 6 6 31 961

8 Rara 5 5 5 7 7 7 36 1296

9 Karyo 5 5 4 6 8 5 33 1089

10 Dody 3 6 3 4 6 6 28 784

Jumlah 50 43 48 62 66 65 334 11836


Jumlah Kuadrat 328 201 264 418 458 451

7,8 1,61 3,36 3,36 2,24 2,85 Jml varian =


Varian tiap butir
21,22

Varian total :
2
(∑ X )
2
∑X 2

N
S =
N

2
334
11836−
10 11836−11155 ,6
S 2= =
10 10

680 , 4
S2=
10 = 68, 04

Dimasukkan dalam rumus Alpha :

( )( ∑
)
n S21
r 11= ⋅ 1− 2
n−1 St

r 11= ( )(
6
6−1
⋅ 1−
21 , 22
68 ,04 )
r 11= ()6
5
⋅( 1−0 ,312 ) = ()
6
5
⋅(0 ,688 )

r 11=0 ,8256 dibulatkan 0,826

Tingkat reliabilitas 0,826 termasuk cukup tinggi dan baik dalam evaluasi pendidikan.

Anda mungkin juga menyukai