Anda di halaman 1dari 11

RELIABILITAS

A. Realibilitas Instrumen

Kata realibilitas dalam bahasa Indonesia diambil dari kata realibility dalam bahasa
Inggris, berasal dari kata asal realiable yang artinya dapat dipercaya. Instrumen tes
dikatakan dapat dipercaya (realiable) jika memberikan hasil yang tetap atau ajek
(konsisten) apabila diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama yang
pada waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan (ranking)
yang sama atau ajek dalam kelompoknya.
Konsep realibilitas ini tidak akan sulit dimengerti apabila kita telah memahami
konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan
diperolehnya data yang valid sesuai dengan kenyataan. Dalam hal realibitas ini
tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketetapan objek yang tidak
lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar,
maka konsep realibilitas terkait dengan pemotretan berkali-kali. Instrumen yang baik
adalah instrumen yang dapat dengan ajek memberikan data yang sesuai dengan
kenyataan.
Ajek atau tetap tidak selalu harus sama skornya, skor dapat berubah tetapi mengikuti
perubahan secara ajek. Jika keadaan A mula-mula berada lebih dibandingkan dengan B,
maka jika diadakan pengukuran ulang, si A tetap berada lebih rendah dari B. Itulah yang
dikatakan ajek atau tetap, yaitu tetap dalam kedudukan siswa diantara anggota kelompok
yang lain. Jika dihubungkan denga vasiliditas maka vasiliditas berhubungan dengan
ketepatan sedangkan realibitas berhubungan denga ketetapan atau keajekan.
Berdasarkan beragam makna tersebut, dapat dalam bidang pengukuran ada aneka
ragam istilah menunjuk pada istilah realibilitas, yaitu diantaranya ada yang menggunakan
istilah konsistensi, keajekan, ketetapan, kestabilan dan keandalan. Instrumen yang
realiable belum tentu valid. Meteran yang putus dibagian ujungnya, bila digunakan
berkali-kali akan menghasilkan data yang sama (realiable), tetapi selalu tidak valid, hal
ini dikarenakan instrumen (meteran) tersebut rusak. Realibilitas instrumen merupakan

101
syarat untuk pengujian validitas instrumen. Oleh karena itu, walaupun instrumen yang
valid pada umumnya pasti reliable tetapi pengujian realibilitas instrumen perlu dilakukan.
Berdasarkan cara-cara melakukan pengujian tingkat realibnilitas instrumen, secara
garis besar ada dua jenis realibilitas, yaitu realibilitas eksternal dan realibilitass internal
(external realibility and internal realibility). Realibilitas eksternal diperoleh jika ukuran
atau kriteria tingkat realibilitas berada diluar instrumen yang bersangkutan. Sebaliknya
jika kriteria maupun perhitungan didasarkan pada data dari instrumen itu sendiri, akan
menghasilkan realibilitas internal.
1. Realibilitas Eksternal (Eksternal Realibility)

Ada dua cara untuk menguji realibilitass eksternal suatu instrumen yaitu dengan
metode bentuk paralel (equivalent method) dan metode tes berulang (test-retest method)

a. Metode bentuk paralel (equivalent method)

Metode paralel dilakukan dengan cara menyusun dua instrumen yang hampir sama
(equivalent), kemudian diuji cobakan pada sekelompok responden yang sama (responden
mengerjakan 2 kali) kemudian dari hasil uji coba tersebut dikorelasikan dengan teknik
korelasi produk moment. Data dari hasil 2 kali uji coba, yang satu dianggap sebagai nilai
x, sedangkan yang lainnya dianggap sebagai nilai y. Karena dalam metode ini ada dua
instrumen dan dilakukan dua kali tes maka disebut dengan metode berulang atau test
retest.
Instrumen paralel atau equivalent adalah dua buah instrumen yang mempunyai
kesamaan tujuan, tingkat kesulitan dan susunan, tapi butir-butir pertanyaan atau
permintaan / pernyataan berbeda. Sebagai contoh penggunaan metode ini, dua buah tes
yang paralel misalnya tes bahasa Inggris seri A yang akan diberi realibilitasnya dan tes
seri B diujikan kepada sekelompok siswa yang sama kemudian hasilnya dikorelasikan.
Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan realibilitas tes seri A.
Untuk menentukan apakah instrumen tersebut realiabel atau tidak, konsisten korelasi hasil
perhitungan atau R hitung (rh) dikonsultasikan dengan nilai R tabel (rt) dalam tabel
korelasi product moment. Apabila R hitung lebih besar atau sama denga R tabel ( rh besar
sama rt) diartikan ada korelasi yang signifikan, instrumen dianggap realiable. Sebaiknya

102
apabila R hitung lebih kecil dari R tabel (rh kecil dari rt ) diartikan tidak ada korelasi yang
signifikan, kesimpulan instrumen dianggap tidak reliabel.
Kelemahan metode ini adalah membutuhkan waktu dan biaya lebih karena harus
menyusun dua instrumen dan harus bersedia waktu yang lama untuk mencobakan dua kali
tes.
b. Metode Tes Berulang (Test-Retest Method)
Metode ini dilakukan untuk menghindari penyusunan instrumen dua kali. Dengan
menggunakan metode ini kita hanya menyusun satu perangkat instrumen. Instrumen
tersebut diujicobakan pada sekolompok responden, hasilnya dicatat. Pada kesempatan
yang lain isntrumen tersebut diberikan pada kelompok responden yang sama untuk
dikerjakan lagi, dan hasil kedua juga dicatat. Kemudian kedua hasil tersebut
dikorelasikan. Perhitungan dan pernafsiran hasil korelasi menggunakan aturan yang
sama dengan metode paralel.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, metode
ini kurang sesuai karena responden masih ingat akan butir-butir soalnya. Oleh karena itu
tenggang waktu antara tes pertama dengan tes kedua menjadi permasalahan sendiri. Jika
tenggang waktu terlalu dekat, siswa masih banyak yang ingat materi.
Sebaliknya apabila tenggang waktu terlalu lama, maka faktor-faktor tes sudah
berbeda, dan siswa sendiri barangkali sudah mempelajari sesuatu. Tentu saja faktor ini
akan berpengaruh terhadap realibilitas. Pada umumnya hassil tes yang kedua cenderung
lebih baik daripada hasil tes pertama. Hal dimungkinkan karena adanya carry over effect.
2. Realibiltas Internal (Internal Realibility)
Realibilitas internal diperoleh dengan cara menganalisis data dari satu kali
pengumpulan data. Berdasarkan sistem pemberian skor (scoring system) instrumen, ada
dua metode analisis realibilitas internal, yaitu:
a. Instrumen Skor Diskrit

Instrumen skor diskrit, nominal atau pilah adalah instrumen yang skor
jawaban/responnya hanya dua, yaitu 1 (satu) dan 0 (nol). Dengan kata lain hanya dua
jawaban yaitu benar dan salah. Jawaban yang benar diberi skor 1 (satu) sedangkan
jawaban yang salah diberi skor 0 (nol). Untuk instrumen yang skornya diskrit (1 dan 0)

103
tingkat realibilitasnya dapat dicari dengan menggunakan (1) metode belah dua (split-half
metode), (2) rumes flanagen, (3) rumus rulon, (4) rumus K-R.20 (5) rumus K-R.21, (6)
rumus hoyt.
Dalam setiap pembahasan yang ada, metode yang paling banyak digunakan yaitu,
metode belah dua ini yang dikemukakan oleh Spearmen-Brown. Dalam metode belah dua
yang dibelah menjadi dua kelompok adalah jumlah butir instrumen, bukan jumlah
responden. Haal ini perlu ditegaskan untuk menghindari kesalahan karena yang dibagi
menjadi dua kelompok adalah jumlah responden. Oleh karena itu, untuk memudahkan
dalam membagi menjadi dua kelompok jumlah butir instrumen harus genap, jangan ganjil
karena akan menyulitkan dalam pengelompokkan.
Ada dua cara membelah butir instrumen, yaitu:
1). Membelah butir instrumen menjadi kelompok butir nomor genap dan kelompok butir
nomor ganjil yang selanjutnya disebut dengan belahan genap-ganjil.

2). Membelah butir instrumen menjadi kelompok butir nomor awal dan kelompok butir
nomor akhir, yaitu separuh jumlah paada nomor-nomor awal dan separuh pada
nomor-nomor akhir yang selanjutnya disebut dengan belahan awal-akhir.

Dua belah butir instrumen (baik berdasar nomor ganjil-genap maupun nomor awal-
akhir), yang satu belah/kelompok diberi kode X sedangkan belahan/kelompok yang lain
diberi kode Y, kemudian antara keduanya dikorelasikan satu dengan lain sehingga
diperoleh harga rxy . Untuk mencari korelasi antara kelompok X dan Y dapat digunakan
korelasi product moment. Karena indeks korelasi yang diperoleh baru menunjukkan
hubungan antara dua belahan instrumen, maka untuk memperoleh indeks realibilitas
instrumen masih harus menggunakan rumus Spearmen-Brown, yaitu:

₁⁄₂₁⁄₂
r11 =
( ₁⁄₂₁⁄₂)

Keterangan:

r1/21/2 = korelasi antara dua belahan instrumen

r11 = indeks realibilitas instrumen

104
Contoh instrumen dengan 6 butir soal objektif diujicobakan pada 10 siswa dengan
hasil sebagai berikut:

Tabel

Persiapan Perhitungan Realibilitas Instrumen

No Nama Nomor Butir X Y X2 Y2 XY


1 2 3 4 5 6 No.1,2,3 No.4,5,6
1 Rini 1 1 0 1 0 1 2 2 4 4 4
2 Riri 1 1 1 0 1 0 3 1 9 1 3
3 Amel 0 0 1 0 1 0 1 1 1 1 1
4 Jonam 1 1 1 0 1 1 3 2 9 4 6
5 Wedi 0 0 1 1 0 1 1 2 1 4 2
6 Sepri 1 1 0 1 1 0 2 2 4 4 4
7 Apri 1 1 1 1 1 0 3 2 9 4 6
8 Winda 1 1 1 1 0 1 3 2 9 4 6
9 Nova 1 1 0 1 0 1 2 2 4 4 4
10 Yeye 0 1 1 0 1 1 2 2 4 4 4

Jumlah 22 18 54 34 40

Keterangan:

X = belahan awal, nomor butir 1,2, dan 3


Y = belahan akhir, nomor butir 4,5, dan 6

Dimasukkan ke dalam rumus product moment angka kasar :

( )( )
rxy =
² ( )² ² ( )²

( ) ( )
rxy =
( ) ( )

=
( ) ( )

= =
√ √

105
=
,

rxy = 0,134
Oleh karena indeks korelasi yang diperoleh baru menunjukkan hubungan antara
dua belahan instrumen, maka untuk memperoleh indeks realibilitas dihitung dengan
rumus Spearmen-Brown, yaitu:

₁⁄₂₁⁄₂
r11 =
( ₁⁄₂₁⁄₂)

Keterangan:

r11 = reliabilitas instrumen

r1/21/2 = rxy yang disebutkan sebagai indeks korelasi antara dua belah instrumen

2 ₁⁄₂₁⁄₂
(1+ ₁⁄₂₁⁄₂)
Jadi, r11 =

,
r11 =
( , )

,
r11 =
,

r11 = 0,236
Setelah diperoleh indeks angka reliabilitas, langkah selanjutnya adalah
mengonsultasikan angka tersebut dengan tabel r product moment dengan jumlah N yang
sama pada taraf signifikasi 1% atau 5%. Apabila r hitung lebih besar atau sama dengan r
tabel (rh ≥ rt) diartikan ada korelasi yang signifikan, instrument dianggap reliabel.
Sebaliknya apabila r hitung lebih kecil dari r tabel (rh˂ rt) diartikan tidak ada korelasi
yang signifikan, kesimpulan instrmen dianggap tidak reliabel.
Dari tabel harga kritik r product moment diperoleh harga r untuk jumlah responden
(N) =10 dengan taraf signifikasi 5% diperoleh harga rtabel = 0,632. Dalam contoh kasus
diatas karena rhitung lebih kecil dari rtabel ( 0,235 ˂ 0,632) dapat diartikan tidak ada korelsi
yang signifikan, dan disimpulkan bahwa instrumen tersebut tidak reliabel. Perhitungan

106
reliabilitas dengan metode belah dua ini selain dilakukan secara manual dapat juga
dengan menggunakan komputer program SPSS for windows.

a. Instrumen Skor Non Diskrit

Instrumen non diskrit adalah instrumen pengukuran yang dalam sistem skoringnya
bukan 1 dan 0 (satu dan nol), tetapi bersifat gradual, yaitu ada penjenjangan skor, mulai
dari skor tertinggi sampai skor terendah. Hal ini biasanya terdapat pada instrumen tes
bentuk uraian, angket dengan skala Likert dan skala bertingkat (rating scale). Interval
skor dapat mulai dari 1 sampai 4; 1 sampai 5; maupun 1 sampai 8 dan sebagainya. Untuk
instrumen skor non diskrit ini analisis realibilitasnya menggunakan rumus Alpha

Rumus Alpha adalah:

$ (
r11 = #
$
% &1 − )
+
(
*

(-.)²
²
, =
2 /

Keterangan:

r11 = realiabilitas instrumen


k = banyaknya butir pertanyaan atau banyaknya soal
2
0, = jumlah varians butir
1
2
, = varians total
@
X = skor total

Contoh:

Sebagai contoh perhitungan berikut ini disajikan tabel analisis data 5 butir
pertanyaan atau butir soal essay dari 10 orang responden.

107
Tabel
Analisis Butir Soal Bentuk Uraian dari 10 Orang Responden

Nama Skor Butir Skor Kuadrat


No 1 2 3 4 5 Total Skor Total
1 Rini 10 8 9 10 8 45 2.025
2 Riri 8 7 8 9 7 39 1.521
3 Amel 6 5 6 8 7 32 1.024
4 Jonam 5 4 3 0 2 14 196
5 Wedi 9 10 8 7 6 40 1.600
6 Sepri 7 5 3 4 7 26 676
7 Apri 3 4 4 5 6 22 484
8 Winda 4 3 5 5 5 22 484
9 Nova 6 2 2 2 3 15 225
10 Yeye 7 6 1 5 4 23 529

Jumlah 65 54 49 55 55 278 8.764


Jumlah Kuadrat 456 344 309 389 337 1.844

Untuk memperoleh jumlah varians butir dicari dulu varians setiap butir, kemudian
dijumlahkan.

(-.)²
²
, =
2 /

DE²
2 , ,
, = FG
= = = 4,25
1
EJ²
2 , ,
, = FG
= = = 5,24
2
JL²
2 , ,
, = FG
= = = 6,89
3
EE²
2 , ,
, = FG
= = = 8,65
4

108
EE²
2 P P , ,
, = FG
= = = 3,45
5
2
0 , = 4,25 + 5,24 +6,89 + 8,65 +3,45 = 28,48
5
(UV)²
2 ST² W
Jadi, , =
@ X
YLZ²
2 P P PP ,
FG
, = =
@
,
= = 103,56

Kemudian dimasukkan ke dalam rumus Alpha:

$ (
r11 = #
$
% &1 − )
+
(
*

,
=# % #1 − ,
%

= (1 − 0,275)

= 1,25 x 0,725 = 0,90625 dibulatkan menjadi 0,91


Untuk mengetahui apakah instrumen tersebut reliabel atau tidak, langkah selanjutnya
adalah mengonsultasikan dengan harga kritik atau standar reliabilitas. Harga kritik untuk
indeks reliabilitas instrumen adalah 0,7. Artinya suatu instrumen dikatakan reliabel jika
mempunyai nilai koefisien Alpha sekurang-kurangnya 0,7 (Kaplan, 1982:106). Dalam
contoh kasus di atas instrumen dikatakan reliabel karena memiliki nilai koefisien Alpha
lebih besar dari harga kritik sebagai standar minimal (0,91˃0,7). Perhitungan reliabilitas
menggunakan rumus Alpha ini selain dilakukan dengan cara manual dapat juga dengan
menggunakan komputer program SPSS for windows.

109
B. Faktor-faktor yang Mempengaruhi Realibilitas

Beberapa hal yang sedikit banyak mempengaruhi hasil tes banyak sekali.
Namun secara garis besar dapat dikelompokkan menjadi 3 hal, yaitu :

1. Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-
butir soalnya. Tes yang terdiri dari banyak butir, tentu saja lebih valid
dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi
rendahnya validitas merupakan tinggi rendahnya reliabilitas tes. Dengan demikian
maka semakin panjang tes maka reliabilitasnya semakin tinggi.
2. Hal yang berhubungan dengan tercoba. Suatu tes dicobakan kepada kelompok
yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang
menggambarkan besar kecilnya reliabilitas tes-tes yangdicobakan bukan kepada
kelompok tidak terpilih, akan menunjukkan reliabilitas yang lebih besar
daripada yang dicobakan pada kelompok tertentu yang diambil secara dipilih.
3. Hal yang berhubungan dengan penyelenggaraan tes sudah di sebutkan bahwa
factor penyelenggaraan tes yang bersifat administratif, sangat menentukan hasil tes.
Contoh :
a. Petunjuk yang diberikan sebelum tes dimulai, maka memberikan
keterangan kepada para tes-tes dalam mengerjakan tes, dan dalam
penyelenggaraan tidak akan banyak terdapat pertanyaan. Ketenangan ini tentu
saja akan berpengaruh terhadap hasil tes.
b. Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa
terhadap tes bagi siswa-siswa tertentu adalah pengawasan yang terlalu ketat
menyebabkan rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes.
c . Suasana lingkungan dan tempat tes (duduk tidak diatur, suasana
disekelilingnya ramai, dan sebagainya) akan mempengaruhi hasil tes.

Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung akan
mempengaruhi reliabilitas tes. Koefisien reliabilitas dapat dipengaruhi diantaranya oleh
waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau

110
terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor yang lain yang juga
mempengaruhi reliabilitas instrument evaluasi diantaranya sebagai berikut:

1. Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item
materi pembelajaran diukur. Ini menunjukkan dua kemungkinan yaitu:

a. Tes semakin mendekati kebenaran

b. Dalam mengikuti tes semakin kecil siswa menebak bearti akan semakin
tinggi nilai koefisien reliabilitasnya.

2. Penyebaran skor, koefisien reliabilitas secara langsung dipengaruhi oleh bentuk


sebaran skor dalam kelompok siswa yang diukur. Semakin tinggi sebaran, semakin
tinggi estimasi koefisien reliabilitas. Hal ini terjadi karena posisi skor siswa secara
individual mempunyai kedudukan sama pada tes-retes lain, sebagai acuan.5

3. Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa,
cenderung menghasilkan skor reliabilitas rendah. Fenomena tersebut
akan menghasilkan sebaran skor yang cenderung terbatas pada salah satu sisi.
Untuk tes yang terlalu mudah skor jawaban siswa akan mengumpul pada sisi atas,
misalnya 9 atau 10. Untuk tes yang terlalu sulit, skor jawaban siswa akan cenderung
mengumpul pada ujung sebaliknya, atau rendah. Dua gejala tersebut mempunyai
kesamaan yaitu bahwa perbedaan diantara individu adalah kecil dan cenderung tidak
relevan.

4. Objektivitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan
kompetensi sama, mencapai hasil sama. Ketika prosedur tes evaluasi memiliki
objektifitas tinggi, maka reliabilitas hasil tes tidak dipengaruhi oleh prosedur teknik
penskoran. Item tes skor objektif yang dihasilkan tidak dipengaruhi petim

111

Anda mungkin juga menyukai