Anda di halaman 1dari 22

BAB 1

PENDAHULUAN
A. Latar Belakang
Salah satu aspek positif kemajuan dari dunia penelitian yang ada di
Indonesia, adalah muncul banyaknya para peneliti-peneliti muda yang kini
lebih kritis lagi dalam meneliti objek-objek yang ada. Agar kajian kita bisa
bersifat riel maka kita sebagai seorang peneliti harus menguji terlebih dahulu
hasil penelitian kita yang disebut dengan uji reabilitas.
Kebanyakan dari kita mengira bahwa jika kita mempunyai
kesimpulan dari hasil penelitian kita terhadap kejadian-kejadian yang
terbatas, maka kesimpulan itu berlaku dengan sempurna untuk seluruh
kejadian yang sejenis. Perkiraan semacam itu belum tentu benar, untuk
menghindari hal-hal yang semacam itu maka kita harus melakukan
reliabilitas, yang berguna untuk menunjukkaan kevalidan data dari hasil
sebuah penelitian yang kita lakukan.
Reliabilitas mampu menunjukkan tingkat kepercayaan terhadap skor
atau tingkat kecocokan skor dengan skor sesungguhnya. Reliabilitas ini bisa
dicapai melalui tingkat kecocokan di antara skor pada lebih dari sekali
pengukuran. Jika makin cocok dengan skor sesungguhnya maka makin tinggi
tingkat reliabilitasnya. Kalaupun ada ketidakcocokan itu merupakan
kekeliruan yang acak. Jadi kemungkinan munculnya kesalahan masih tetap
ada, namun kemungkinan itu sangatlah kecit sekali dan tidak akan banyak
berpengaruh terhadap hasil akhir dari sebuah pengujian.
B. Rumusan Masalah
1. Apa pengertian reliabilitas ?
2. Apa saja jenis-jenis dari reliabilitas ?
3. Apa saja faktor-faktor yang mempengaruhi reliabilitas?
C. Tujuan
1. Agar mahasiswa mengetahui pengertian reliabilitas.
2. Agar mahasiswa dapat mengetahui jenis-jenis dari reliabilitas.
3. Agar mahasiswa dapat mengetahui faktor-faktor yang mempengaruhi
reliabilitas.

Page 1
BAB 2
PEMBAHASAN

A. Pengertian Reliabilitas
Menurut Sugiono (2005) Pengertian Reliabilitas adalah serangkaian
pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran
yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reliabilitas tes
adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat
dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun
diteskan pada situasi yang berbeda-beda. Menurut Sukadji (2000) reliabilitas suatu
tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur.
Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien
tinggi berarti reliabilitas tinggi. Menurut Nursalam (2003) Reliabilitas adalah
kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi
diukur atau diamati berkali – kali dalam waktu yang berlainan. Alat dan cara
mengukur atau mengamati sama – sama memegang peranan penting dalam waktu
yang bersamaan.
Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka
dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk
mengukur atau mengamati sesuatu yang menjadi objek ukur. Suatu tes dapat
dikatakan mempunyai reliabilitas yang tinggi jka tes tersebut dapat memberikan hsil
yang tetap sama (konsisten, ajeg). Hasil pengukuran itu harus tetap sama (relative
sama) jika pengukurannya diberikan pada subjek yang sama meskipun dilakukan
oleh orang yang berbeda, waktu yang berbeda, dan tempat yang berbeda pula. Alat
ukur yang reliabilitasnya tinggi disebut alat ukur yang reliable.
Berkaitan dengan penilaian, suatu alat penilaian disebut reliabel jika hasil
penilaian tersebut relative tetap jika digunakan untuk subjek yang sama. Yang sering
ditangkap kurang tepat adalah adanya pendapat bahwa “ajeg” atau “tetap” diartikan
sebagai “sama”. Dalam pembicaraan penilaian ini tidak demikian. Ajeg atau tetap
tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan Si A
mula – mula berada lebih rendah dibanding dengan si B, maka jika diadakan
pengukuran ulang, si A juga berada lebih rendah dari B. itulah yang dikatakan ajeg
atau tetap, yaitu sama dalam kedudukan siswa di antara anggota kelompok yang lain.

Page 2
Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukkan
tingginya reliabilitas instrumen.
Sehubungan dengan reliabilitas ini, Scarvia . Anderson dan kawan-kawan
menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini sangat
penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena
menyongkong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid.
Sebalinya, sebuah tes yang valid biasanya reliabel.

Apa yang dimaksud reliabilitas instrumen riset?


Reliabilitas suatu instrumen pengukuran adalah tingkatan konsistensi yang
mengukur apakah ini merupakan ukuran. Kualitas ini adalah penting dalam jenis
pengukuran. Seseorang yang mempergunakan instrumen pengukuran semacam itu
harus mengidentifikasi dan mempergunakan teknik-teknik yang akan membantunya
menentukan apa perluasan instrumen pengukurannya yang sesuai dan reliabel.
Sebagaimana sebuah cara membedakan konsep reliabilitas dari konsep
validitas, hal yang berguna adalah mengidentifikasi kesalahan acak pengukuran.
Kesalahan acak adalah kesalahan yang merupakan suatu hasil perubahan yang
murni. Kesalahan acak pengukuran mungkin menekan skor subyek dalam persoalan
yang tak dapat diprediksi. Reliabilitas adalah mengenai pengaruh kesalahan acak
pengukuran dalam konsistensi skor. Namun beberapa kesalahan yang dicakup dalam
pengukuran dapat diprediksi atau sistematis.
Kegunaan dari reabilitas data adalah untuk mengetahui atau menunjukkan
keajekan suatu tes dalam mengukur gejala yang sama pada waktu dan kesempatan
yang berbeda.
Fungsi Reliabilitas
Pada konstruksi alat ukur

• Perhitungan reliabilitas berguna untuk, jika perlu,


melakukan perbaikan pada alat ukur yang dikonstruksi

• Perbaikan alat ukur dilakukan melalui analisis butir


untuk mengetahui butir mana yang perlu diperbaiki

Page 3
Pada pengukuran sesungguhnya

• Perhitungan reliabilitas untuk memberi informasi


tentang kualitas sekor hasil ukur kepada mereka yang
memerlukannya

Bagaimana Hubungan Antara Validitas Dan Reliabilitas ?


Validitas adalah sebuah evaluasi terhadap ketepatan interpretasi dan
penggunaan hasil asesmen. Validitas mempunyai arti sejauh mana ketepatan dan
kecermatan alat ukur mampu melakukan fungsi ukurnya. Selain validitas, alat ukur
yang baik juga harus reliabel. Oleh karena itu, alat ukur yang baik adalah alat ukur
yang valid dan reliabel.
Ketetapan hasil pengukuran (reliabilitas) sangat diperlukan untuk
memperoleh alat ukur yang dapat memberikan hasil pengukuran yang tepat (valid).
Walaupun demikian alat ukur yang mempunyai reliabilitas yang tinggi belum tentu
secara otomatis mempunyai validitas yang tinggi. Karena tingginya reliabilitas yang
dihasilkan oleh suatu alat ukur jika tidak dibarengi dengan tingginya validitas dapat
memberikan informasi yang salah tentang apa yang ingi anda ukur. Sebagai ilustrasi
berikut ini disajikan hasil perlombaan memanah yang diikuti oleh Aldi, Reni dan
Fano. Dari 10 anak panah yang telah mereka lepaskan diperoleh hasil sebagai
berikut :

Hasil bidikan siapakah yang tidak valid dan tidak reliabel? Hasil bidikan
siapakah yang tidak valid tetapi reliabel? Dan hasil bidikan siapakah yang valid dan
reliabel? Dengan menggunakan pengertian validitas dan reliabilitas yang telah
dijelaskan di depan, maka anda akan dapat menjawab ketiga pertanyaan tersebut.
Hasil bidikan Reno adalah hasil bidikan yang tidak valid dan tidak reliabel.

Page 4
Mengapa? Hal ini disebabkan karena dari 10 anak panah yang dilepaskan Reni selalu
mengenai sasaran yang berbeda.
Bagaimana hasil bidikan Fano? Kalau anda perhatikan hasil bidikan Fano
ternyata dari 10 anak panah yang dilepaskan tidak satu pun anak panah yang tepat
mengenai sasaran. Walaupun ke 10 anak panah yang dilepaskan tidak tepat pada
sasaran yang di tentukan, tetpai hasil bidikan Fano selalu mengenai sasaran yang
relative sama. Kalau kita menggunakan konsep validitas dan reliabilitas yang telah
dijelaskan didepan maka dapat dikatakan bahwa hasil bidikan Fano adalah tidak
valid tetapi reliabel. Hasil bidikan Aldi lah yang dikatakan valid dan reliabel.
Mengapa ? Hal ini disebabkan karena ke 10 hasil bidikan Aldi tepat dan tetap
mengenai sasaran yang ditentukan.

B. Pelaksanaan Tes Untuk Menentukan Reliabilitas


Untuk mengestimasi reliabilitas suatu alat penilaian (tes dan non tes) ada tiga
cara yang paling banyak dipergunakan, yaitu tes tunggal (single test), tes ulang (test
re-test), dan tes ekuivalen (alternate test).
1. Tes Tunggal (single Test)
Tes tunggal adalah tes yang terdiri dari satu perangkat (satu set) yang
diberikan terhadap sekelompok subyek dalam satu kali pelaksanaan. Dengan
demikian hasil tes ini hanya terdapat satu kelompok data berupa skor hasil tes.
Ada bermacam – macam teknik yang bisa digunakan untuk menentukan
reliabilitas jenis tes tunggal ini.
2. Tes Ulang (test re-test)
Tes ulang adalah tes yang terdiri dari seperangkat tes yang diberikan kepada
sekelompok subyek dua kali. Reliabilitasnya dihitung dengan cara
mengkorelasikan hasil tes pertama dengan tes kedua. (Metode tes ulang adalah
penggunaan tes yang sama dua kali pada sejumlah peserta tes yang sama).
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes.
Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri
tes tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua
kali, maka metode ini dapat disebut dengan single-test-double-trial method.
Kemudian hasil dari kedua tes tersebut dihitung korelasinya.

3. Tes Ekuivalen (alternate test)

Page 5
Tes ekuivalen adalah tes yang terdiri dari dua perangkat dimana soal – soal
pada perangkat pertama ekuivalen dengan soal – soal pada perangkat kedua.
Pengertian ekuivalen disini adalah soal – soal yang memuat konsep yang sama,
tetapi soal tersebut tidak persis sama. Selain memuat konsep yang sama, tingkat
kesukarannya pun harus sama. Misalkan untuk soal pemfaktoran suku tiga
bentuk 𝑥 2 − 5𝑥 + 6 ekuivalen dengan bentuk 𝑥 2 − 6𝑥 + 8 , tetapi tidak
ekuivalen dengan bentuk 5𝑥 2 + 7𝑥 − 4 sebab meskipun konsep suku tiga dan
pemfaktoranya sama tetapi tingkat kesukarannya berbeda. Untuk menentukan
reliabilitasnya dihitung dengan cara mengkorelasikan hasil tes untuk soal
perangkat pertama dengan hasil tes dari perangkat kedua.
Tes parallel atau tes ekuivalen bisa juga adalah dua buah tes yang
mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir
soalnya berbeda. Dalam istilah bahasa inggris disebut alternate-forms method
(parallel forms). Dengan metode bentuk parallel ini, dua buah tes yang paralel,
misalnya Matematika Seri A yang akan dicari reliailitasnya dan Seri B di teskan
pada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien
korelasi dari kedua hasil tes inilah yang menunjukan koefisien reliabilitas tes
Seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat
digunakan sebagai alat pengetes yang terandalkan. Dalam menggunakan metode
paralel ini pengetes harus menyiapkan dua buah tes, dan masing-masing
dicobakan pada kelompok siswa yang sama.

C. Jenis – Jenis Reliabilitas


Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur
reliabilitas, yaitu :
1. Reliabilitas Stabilitas.
Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap
orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini
menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur
pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk
dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah
sama atau hampir sama.

Page 6
2. Reliabilitas Terwakili
Mengacu pada keterandalan masing-masing grup. Menguji apakah
penyampaian indikator sama jawabannya saat diterapkan ke kelompok yang
berbeda-beda.
3. Reliabilitas Seimbang (equivqlence reliability)
Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran
yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama
tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional,
peralatan pengumpulan data, dan / atau pengamat-pengamat.
Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama
bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-
tengah.
Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan
yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-
pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau
pengubahan sering digunakan untuk teknik belah tengah ini). Hasil masing-
masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing
bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing
bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah
reliabilitas belah tengah.
Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik
pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan
pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor
yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang
tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila
tekanan darahnya yang diukur.

D. Faktor – Faktor Yang Mempengaruhi Reliabilitas


1. Jumlah butir soal
Banyaknya soal pada suatu instrumen ikut mempengaruhi derajat
reliabilitasnya. Semakin banyaknya soal-soal maka tes yang bersangkutan
cenderung semakin menjadi reliabel.

Page 7
2. Homogenitas Soal Tes
Soal yang memiliki homogenitas tinggi cenderung mengarah pada tingginya
tingkat realibilitas. Dua buah tes yang sama jumlah butir-butirnya akan tetapi
berbeda isinya, misalnya yang satu mengukur tentang pengetahuan kebahasaan
dan yang satunya tentang kemampuan fisika akan menghasilkan tingkat
reliabilitas yang berbeda. Tes fisikan cenderung menghasilkan tingkat reliabilitas
yang lebih tinggi daripada tes kebahasaan karena dari segi isi kemampuan
menyelesaikan soal fisika lebih homogen daripada pengetahuan kebahasaan.
3. Waktu Yang diperlukan untuk menyelesaikan Tes
Semakin terbatasnya waktu dalam pengerjaan tes maka akan mendorong tes
untuk memiliki reliabilitas yang tinggi.
4. Keseragaman Kondisi Pada Saat Tes Diberikan
Kondisi pelaksanaan tes yang semakin seraga akan memunculkan reliabilitas
yang makin tinggi
5. Kecocokan Tingkat Kesukaran Terhadap Peserta Tes
Bahwa soal-soal dengan tingkat kesukaran sedang cenderung lebih reliabel
dibandingkan dengan soal-soal yang sangat sukar atau sangat mudah
6. Heterogenitas Kelompok
Semakin heterogen suatu kelompok dalam pengerjaan suatu tes maka tes
tersebut cenderung untuk menunjukkan tingkat reliabilitas yang tinggi
7. Motivasi Individu
Motivasi masing-masing individu dalam mengerjakan suatu instrumen akan
mampu mempengaruhi realibilitas. Perbedaan motiviasi antar individu dalam
kelompok akan menimbulkan kesalahan acak pada pengukurannya karena
individu yang tidak memiliki motivasi tidak akan mengerjakan instrumen tersebut
dengan sungguh-sungguh sehingga jawaban yang diberikan tidak akan
mencerminkan kenyataan yang sebenarnya.
8. Variabilitas Skor
Instrumen yang menghasilkan rentangan skor yang lebh luas atau lebih
tinggi variabilitasnya, akan memiliki tingkat reliabilitas yang lebih tinggi daripada
menghasilkan rentangan skor yang lebih sempit , seperti bentuk pilihan ganda
cenderung menghasilkan tingkat reliabilitas yang lebih tinggi daripada bentuk
benar – salah

Page 8
Faktor – Faktor Yang Mempengaruhi Reliabilitas Instrumen
Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh
waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau
terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga
mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::
1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item
materi pembelajaran diukur.
2) Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk
sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran,
semakin tinggi estimasi koefisien reliable.
3) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa,
cenderung menghasilkan skor reliabilitas rendah.
4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan
kompetensi sama, mencapai hasil yang sama.

E. Cara – cara Mencari Besarnya Reliabilitas


1. Pendekatan Tes Tunggal
Analisis data untuk pendekatan tes tunggal bisa dibagi ke dalam 2 (dua) macam
teknik, yaitu Teknik Belah Dua (Spilt-Half Technique) danTeknik Non Belah Dua
(Non Spilt-Half Techique).
a. Teknik Belah Dua
Dalam menentukan reliabilitas suatu tes dengan menggunakan teknik belah
dua, dilakukan dengan cara membelah tes tersebut menjadi dua bagian yang
sama (relative sama), sehingga masing – masing peserta tes memiliki dua macam
skor. Kedua macam skor itu adalah skor untuk bagian (belahan) pertama dan
kelompok skor untuk belahan kedua dari tes tadi. Dengan demikian ada dua
kelompok skor untuk sekelompok peserta tes.
Karena kedua belahan harus sama, maka salah satu syarat yang harus
dipenuhi untuk teknik belah dua ini adalah banyaknya butir soal dalam tes
tersebut harus genap, supaya kedua bagian itu banyaknya butir soal sama.
Ada dua cara untuk membelah banyaknya butir soal tes, yaitu :
1. Membelah atas item – item (butir – butir) genap dan item – item (butir –
butir) ganjil yang selanjutnya disebut belahan ganjil genap.

Page 9
2. Membelah atas item – item (butir – butir) awal dan item – item (butir –
butir) akhir yaitu separoh junlah pada nomor-nomor awal dan separo pada
nomor – nomor akhir yang selanjutnya disebut belahan awal-akhir.

Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan


hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada
seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili
reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat
digunakan untuk mengoreksi koefisien yang didapat.

Seperti halnya koefisien validitas yang telah dibahas pada bab terdahulu,
untuk koefisien reliabilitas yang menyatakan tingkat keterandalan tes,
dinyatakan dengan r11 . Tolak ukur menginterprestasikan tingkat reliabilitas tes
dapat digunakan tolak ukur yang dibuat oleh Guilford (1956) sebagai berikut :
0,80 < r11 ≤ 1,00 reliabilitas sangat tinggi
0,60 < r11 ≤ 0,80 reliabilitas tinggi
0,40 < r11 ≤ 0,60 reliabilitas sedang
0,20 < r11 ≤ 0,40 reliabilitas rendah
r11 ≤ 0,20 reliabilitas sangat rendah

Untuk menentukan koefisien reliabilitas suatu tes dengan teknik belah dua,
ada tiga macam teknik perhitungan, yaitu formula Spearman – Brown, Formula
Flanagan, dan formula Rulon.

Formula Spearman – Brown


Prinsip penggunaan formula Spearman – Brown adalah menghitung koefisien
korelasi di antara kedua belahan sebagai koefisien reliabilitas bagian (setengah)
dari tes tersebut, yang dinotasikan dengan (r ½ ½) . Untuk menghitung (r ½ ½)

bisa digunakan rumus product moment dengan angka kasar dari karl Pearson,
yaitu :

𝑁 ∑ 𝑋𝑌−(∑ 𝑋).(∑ 𝑌)
r ½½ =
√{𝑁 ∑ 𝑋 2 −(∑ 𝑋)2 }−{𝑁 ∑ 𝑌 2 −(∑ 𝑌)2 }

N = banyaknya subyek
X = Kelompok data belahan pertama
Y = Kelompok data belahan kedua

Page 10
Untuk menghitung koefisien reliabilitas suatu tes keseluruhan, Spearman –
Brown mengemukakan rumus :

Dengan r11 : reliabilitas Instrumen


r ½ ½ : Indeks Korelasi antara dua belahan Instrumen

Syarat yang harus dipenuhi dalam menggunakan rumus di atas adalah


butir soal pada kedua belahan harus setara, yaitu banyaknya butir soal harus
sama, memiliki rata – rata nilai sama, mempunyai variabilitas yang sama, dan
bentuk distribusi frekuensi yang sama pula. Untuk mendekati kondisi tersebut
soal harus disusun sedemikian rupa sehingga butir soal pada belahan pertama
dengan pasangannya pada belahan kedua memuat konsep yang sama, dengan
indikator yang sama pula. Sehingga setiap butir berpasangan kesetaraannya
pada kedua belahan itu.

Contoh perhitungan reliabilitas dengan Formula Spearman – Brown :


No. Subyek Skor Item
1 2 3 4 5 6 7 8 9 10
1 A 3 4 3 4 4 3 3 3 3 3
2 B 4 3 3 4 3 3 3 3 3 3
3 C 2 2 1 3 2 2 3 1 2 3
4 D 3 4 4 3 3 3 4 3 3 4
5 E 3 4 3 3 3 4 3 4 4 3
6 F 3 2 4 4 3 4 4 3 4 4
7 G 2 3 3 4 4 4 3 4 3 2
8 H 1 2 2 1 2 2 1 3 4 3
9 I 4 2 3 3 4 2 1 1 4 4
10 J 3 3 3 4 4 4 4 4 3 3
11 K 4 4 3 4 4 3 4 4 4 2
12 L 3 2 1 2 3 1 1 2 3 3
13 M 4 3 4 3 3 4 3 3 3 4
14 N 2 3 3 4 4 4 3 2 3 4
15 O 3 4 3 2 3 2 4 3 3 3

Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil – genap adalah
sebagai berikut

Page 11
Subyek Skor Skor X.Y
Item Ganjil Item Genap
(X) (Y)
A 16 17 272
B 16 16 256
C 10 11 110
D 17 17 289
E 16 18 288
F 18 17 306
G 15 17 255
H 10 11 110
I 16 12 192
J 17 18 306
K 19 17 323
L 11 10 110
M 17 17 289
N 15 17 255
O 16 14 224

∑ X = 229 ∑ Y = 229 ∑ X. Y = 3585


∑ X 2 = 3603 ∑ Y 2 = 3609

𝑁 ∑ 𝑋𝑌 − (∑ 𝑋). (∑ 𝑌)
r =
√{𝑁 ∑ 𝑋 2 − (∑ 𝑋)2 } − {𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 }
15 𝑥 3585 − 229 𝑥 229
=
√(15 𝑥 3603 − 52441)(15 𝑥 3609 − 52441)
1334
=
√1604 ∶ 1694
1334
= = 0,809
1648,386

Setelah dihitung dengan rumus korelasi product moment dengan angka


kasar diperoleh bahwa rxy = 0,809. Harga tersebut baru menunjukkan reliabilitas
separo tes. Sehingga r ½ ½ = 0,809. Untuk mencari reliabilitas seluruh tes
digunakan rumus formulasi Spearman – Brown sebagai berikut :
2 r1⁄ 1 2 𝑥 0,809 1,618
2 ⁄2
r11 = = = = 0,895
1 + r1⁄ 1 1 + 0,809 1,809
2 ⁄2

Page 12
Jika dihitung dengan teknik belah dua metode awal – akhir, akan diperoleh dua
kelompok data seperti tabel di bawah ini :
Subyek Skor Skor X.Y
Bagian Awal Bagian Akhir
(X) (Y)
A 18 15 270
B 17 15 255
C 10 11 110
D 17 17 289
E 16 18 288
F 16 19 304
G 16 16 256
H 8 13 104
I 16 12 192
J 17 18 306
K 19 17 323
L 11 10 110
M 17 17 289
N 16 16 256
O 15 15 225

∑ X = 229 ∑ Y = 229 ∑ X. Y = 3577


∑ X 2 = 3631 ∑ Y 2 = 3597

𝑁 ∑ 𝑋𝑌 − (∑ 𝑋). (∑ 𝑌)
r =
√{𝑁 ∑ 𝑋 2 − (∑ 𝑋)2 } − {𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 }
15 𝑥 3577 − 229 𝑥 229
=
√(15 𝑥 3631 − 52441)(15 𝑥 3597 − 52441)
1214
=
√2024 ∶ 1514
1214
= = 0,6935
1750,48
Setelah dihitung dengan rumus korelasi product moment dengan angka
kasar diperoleh bahwa rxy = 0,6935. Harga tersebut baru menunjukkan reliabilitas
separo tes. Sehingga r ½ ½ = 0,6935. Untuk mencari reliabilitas seluruh tes
digunakan rumus formulasi Spearman – Brown sebagai berikut :
2 r1⁄1 2 𝑥 0,6935 1,387
2 ⁄2
r11 = = = = 0,819
1 + r1⁄ 1 1 + 0,6935 1,6935
2 ⁄2

Dari kedua contoh perhitungan diatas ternyata hasilnya ada perbedaan, tetapi jika
dirujuk pada tolak ukur reliabilitas, keduanya menunjukkan tingkat reliabilitas
yang sama, yaitu tergolong tinggi. Jadi reliabilitas tes soal tersebut adalah tinggi
atau baik.

Page 13
Formula Flanagan
Menghitung reliabilitas tes dengan menggunakan rumus formula Flanagan
tidak didasarkan atas nilai korelasi antara kedua belahan tes, melainkan
didasarkan atas varians masing – masing belahan dan varians totalnya. Untuk
menghitung koefisien reliabilitas tes, Flanagan mengemukakan formula :
S12 + S22
r11 = 2 (1 − )
St2
Keterangan :
r11 = koefisien reliabilitas seluruh tes
S12 = varians belahan pertama
S22 = varians belahan kedua
St2 = varians skor total

Untuk menghitung varians digunakan rumus sebagai berikut :


(∑ X)2
∑ X2 −
S2 = N
N

Sebagai contoh dalam menggunakan formulasi Flanagan ini akan dihitung


koefisien reliabilitas untuk tes dengan data seperti di atas dengan menggunakan
metode ganjil – genap.

Subyek Skor Skor Skor


Item Ganjil Item Genap Total
(X) (Y) (Xt)
A 16 17 33
B 16 16 32
C 10 11 21
D 17 17 34
E 16 18 34
F 18 17 35
G 15 17 32
H 10 11 21
I 16 12 28
J 17 18 35
K 19 17 36
L 11 10 21
M 17 17 34
N 15 17 32
O 16 14 30

Page 14
∑ X = 229 ∑ Y = 229 ∑ X𝑡 = 458
∑ X 2 = 3603 ∑ Y 2 = 3609 ∑ X𝑡2 = 14382
S𝑥2 = 7,1287 S𝑌2 = 7,5287 S𝑡2 = 26,5153

Setelah diperoleh nilai – nilai varians dari data belahan 1, belahan 2, dan varians
total kemudian dimasukkan ke dalam rumus.
S12 + S22
r11 = 2 (1 − )
St2
7,1287 + 7,5287
r11 = 2 (1 − )
26,5153
146,574
r11 = 2 (1 − ) = 0,9
26,5153
Jika dirujuk pada tolak ukur reliabilitas tergolong tinggi.

Formula Rulon
Formula Rulon didasarkan atas konsep perbedaan antara skor subyek pada
belahan pertama dan kedua, yang dapat dipandang sebagai kekeliruan (error) dari
proses penilaian. Dengan demikian varians yang diperhitungkan adalah varians
perbedaan skor antara kedua belahan itu, yaitu varians kekeliruan. Rumus Rulon
sebagai berikut :
Sd2
r11 = 1 −
St2
Keterangan :
Sd2 = Varians selisih skor subyek pada kedua belahan
St2 = Varians skor total
Untuk penggunaan rumus tersebut, kita menggunakan kembali data hasil tes
di atas dengan metode awal – akhir. Data yang harus dipersiapkan disusun dalam
bentuk tabel seperti dibawah ini.

Subyek Skor Skor d = |X − Y|


Bagian Awal Bagian Akhir X𝑡
(X) (Y)
A 18 15 3 33
B 17 15 2 32
C 10 11 -1 21
D 17 17 0 34
E 16 18 -2 34
F 16 19 -3 35
G 16 16 0 32
H 8 13 -5 21
I 16 12 4 28

Page 15
J 17 18 -1 35
K 19 17 2 36
L 11 10 1 21
M 17 17 0 34
N 16 16 0 32
O 15 15 0 30

S𝑑 = 2,22 St = 5,15
S𝑑2 = 4,93 S𝑡2 = 26,51

Selanjutnya dimasukkan ke dalam rumus :


Sd2
r11 = 1 −
St2
4,93
r11 = 1 − = 0,81
26,51
Jika dirujuk pada tolak ukur reliabilitas, tergolong sangat tinggi.

b. Teknik Non Belah Dua


Pakar yang mengemukakan teknik non belah dua adalah Kuder dan
Richardson. Mereka berpendapat bahwa teknik belah dua kurang baik dalam
mencari koefisien reliabilitas, sebab bisa dilakukan dengan cara yang berbeda
sehingga menghasilkan yang berbeda pula. Disamping itu dalam
pelaksanaannya, teknik belah dua sulit sekali memperoleh dua belahan yang
setara satu sama lain. Untuk menghindari hal tersebut, Kuder dan Richardson
mengemukkan cara untuk menghitung koefisien reliabilitas tanpa membelah tes
menjadi dua bagian, tetapi membagi tes menurut banyak nya butir soal yang
disajikan, yaitu dengan menganalisis masing – masing butir soal tersebut. Rumus
yang digunakan untuk menghitung koefisien reliabilitas tes tanpa membelah tes
menjadi bagian adalah rumus KR-20 dan KR-21.

Rumus KR-20
n St2 − ∑ pi q i
r11 = [ ][ ]
n−1 st2

Keterangan :
n = banyaknya butir soal
pi = proporsi banyak subyek yang menjawab benar pada butir soal ke - i
q i = proporsi banyak subyek yang menjawab salah pada butir soal ke - i

Page 16
St2 = vaarians skor total
r11 = koefisien reliabilitas

Sebagai contoh kita gunakan hasil tes matematika yang terdiri dari 15 butir
soal yang diikuti 10 subyek siswa seperti yang digunakan sebelumnya. Tabel di
bawah ini adalah tabel persiapan untuk menghitung koefisien reliabilitas dengan
KR-20.

Tabel persiapan penggunaan rumus KR-20.


No Nama Nomor soal Total
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 Aan N. Efendi 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 10
2 Arif Kristanto 0 1 1 1 1 0 0 0 0 0 0 1 0 1 0 6
3 Bayu Inggar 0 1 1 0 1 1 0 0 1 1 1 1 1 0 0 9
4 Aulia 0 1 1 1 1 1 0 0 1 1 1 0 0 0 1 9
5 Novita 1 1 1 0 1 0 0 0 0 1 0 0 0 0 1 6
6 Septian Hadi 0 1 1 1 1 0 0 0 1 1 0 1 0 1 0 8
7 Riska Maulana 1 1 0 1 1 1 1 0 1 1 1 1 1 1 1 13
8 Adi Susianto 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 14
9 Meydin Kartika 1 1 0 1 1 1 0 0 1 1 0 1 0 1 1 10
10 Riswanda 1 1 0 0 1 1 1 0 1 1 1 0 1 0 1 10
np 6 10 6 6 10 7 3 0 8 8 6 7 5 6 7 ∑ X𝑡 =
95
nq 4 0 4 4 0 3 7 10 2 2 4 3 5 4 3
∑ X𝑡2 =
pi .6 1 .6 .6 1 .7 .3 0 .8 .8 .6 .7 .5 .6 .7 963
qi .4 0 .4 .4 0 .3 .7 1 .2 .2 .4 .3 .5 .4 .3 ∑ p q =
𝑖 𝑖
2,61
pi qi .24 0 .24 .24 0 .21 .21 0 .16 .16 .24 .21 .25 .24 .21

Keterangan : Untuk menyingkat tulisan 0,6 ditulis .6, 0,24 ditulis .24 dan
seterusnya.
Selanjutnya hasil perhitungan diatas dimasuk kan ke dalam rum,us KR-20
sebagai berikut:
n St2 − ∑ pi q i
r11 =[ ][ ]
n−1 st2
15 6,05 − 2,61
r11 = [ ][ ]
15 − 1 6,05
r11 = 1,07 x 0,56 = 0,5992

Jika dirujuk pada tolak ukur reliabilitas, tergolong sedang.

Page 17
Rumus KR-21

n Xt (n − Xt )
r11 = ( ) (1 − )
n−1 n St2
Keterangan :
n = banyaknya butir soal
Xt = rata – rata skor total
St2 = varians skor total
r11 = koefisien reliabilitas
Keuntungan yang dapat diperoleh dari penggunaan rumus KR-21 adalah
kemudahan dalam membuat tabel persiapan karena data nilai yang dibutuhkan
hanyalah rata – rata dan varians skor total. Dengan menggunakan kalkulator akan
diperoleh :
X𝑡 = 9,5 dan S𝑡2 = 6,05

Dimasukkan ke dalam rumus KR-21 di atas


n Xt (n − Xt )
r11 = ( ) (1 − )
n−1 n St2
15 9,5(15 − 9,5)
r11 = ( ) (1 − )
15 − 1 15(6,05)
r11 = 1,07 x 0,43 = 0,4601
Yang termasuk ke dalam kategori reliabilitas sedang.

F. Mencari Koefisien Reliabilitas Tes bentuk Uraian


Untuk mencari koefisien reliabilitas tes bentuk uraian tidak bisa dilakukan
seperti di atas karena penilaian tidak hanya diberikan pada hasil akhir, melainkan
dilakukan pula terhadap proses pengerjaannya. Oleh karena itu skor yang diperoleh
karena setiap soal tidak dikotomi (dua kategori benar atau salah). Skor yang
diperoleh untuk hasil pekerjaan siswa dinilai setiap soal dan setiap langkah
pengerjaan. Jadi skornya bisa berlainan tergantung dari setiap bobot soal. Rumus
yang digunakan untuk mencari koefisien reliabilitas tes bentuk uraian dikenal
dengan rumus alpha seperti debawah ini.

Page 18
Rumus Alpha
n ∑ Si2
r11 =( ) (1 − 2 )
n−1 St

Keterangan :
n = banyaknya butir soal
∑ Si2 = jumlah varians skor setiap butir soal
St2 = varians skor total
r11 =koefisien reliabilitas

Subyek Nomor Soal Skor


1 2 3 4 5 6 7 8 9 10 Total
(X𝑡 )
A 10 10 9 10 4 10 10 6 10 4 83
B 10 10 8 6 7 8 10 10 8 6 83
C 10 8 10 10 6 10 5 6 4 9 78
D 10 8 10 10 4 10 8 10 6 10 86
E 10 10 10 8 10 7 8 7 9 8 87
F 10 8 10 10 4 8 10 8 6 8 82
G 10 10 6 10 4 7 10 10 10 10 87
H 10 7 10 10 6 10 7 7 8 6 81
I 10 10 10 10 10 10 10 9 10 9 98
J 10 10 7 10 4 5 8 10 9 6 79
X𝑖 100 91 90 94 59 85 86 83 80 76 844
Xi2 1000 841 830 900 401 751 766 715 678 614 71526
S𝑖 30 1,14 1,41 1,282 2,3 1,69 1,62 1,61 1,95 1,91 5,41
Si2 0 1,29 2 1,64 5,29 2,85 2,64 2,61 3,8 3,64 29,24

Dari data pada tabel di atas diperoleh


𝑛 = 10

∑ Si2 = 0 + 1,29 + 2 + 1,64 + 5,29 + 2,85 + 2,64 + 2,61 + 3,8 + 3,64

= 25,76
St2 = 29,24
Dimasukkan ke dalam rumus alpha
n ∑ Si2
r11 = ( ) (1 − 2 )
n−1 St
10 25,76
r11 = ( ) (1 − )
10 − 1 29,24
r11 = (1,11)(0,12) = 0,13
Koefisien reliabilitas tersebut menyatakan bahwa soal yang dibuat reliabilitasnya
sangat rendah.

Page 19
G. ANCAMAN TERHADAP RELIABILITAS
Semua jenis instrumen tes atau nontes tidak terlepas kesalahan. Hal ini
berlaku untuk instrumen tes dalam ilmu-ilmu eksakta dan dalam ilmu-ilmu psikologi
dan pendidikan. Misalnya, dalam mengukur panjang dengan suatu penggaris,
mungkin ada kesalahan sistematis berhubungan dengan di mana titik nol dicetak
pada penggaris dan kesalahan acak berhubungan dengan kemampuan mata dalam
membaca tanda-tanda dan memperhitungkan tanda-tanda tersebut. Juga
memungkinkan bahwa panjang obyek dapat berubah dari waktu ke waktu dan pada
lingkungan yang berbeda (misalnya perubahan temperatur). Salah satu tujuan
penilaian adalah untuk mengurangi kesalahan tersebut hingga ke tingkatan yang
sesuai dengan tujuan tes. Tes yang beresiko tinggi (high-stakes tes), seperti ujian
untuk mendapatkan SIM, harus mempunyai kesalahan yang sangat kecil. Tes di
kelas dapat mentolerir kesalahan yang lebih tinggi secara wajar kesalahan tersebut
mudah dikoreksi sepanjang proses pengujian. Reliabilitas hanya mengacu pada
derajat tingkat kesalahan yang tidak sistematis, yang disebut kesalahan acak.
Ada tiga sumber kesalahan utama, yaitu: faktor dalam tes itu sendiri, faktor
siswa yang dites, dan faktor penskoran. Umumnya tes berisi suatu koleksi butir yang
mengukur keterampilan tertentu. Adakalanya guru secara khas menggeneralisasikan
masing-masing butir tes ke semua materi yang diukur oleh tes itu. Sebagai contoh,
jika seorang siswa dapat memecahkan beberapa permasalahan seperti 7x8, maka
mungkin akan disamaratakan kemampuannya dalam mengalikan angka tunggal
bilangan bulat. Juga mungkin akan menyamaratakan suatu kumpulan materi kepada
suatu domein yang lebih luas. Jika siswa dapat menyelesaikan penjumlahan,
pengurangan, perkalian, dan pembagian, maka mungkin akan disimpulkan bahwa
siswa tersebut mampu menyelesaikan operasi pecahan.
Kesalahan dapat pula disebabkan oleh pemilihan butir untuk mengukur
domein dan keterampilan tertentu. Materi yang tercakup dalam tes berbeda menurut
format masing-masing tes, kesalahan pensampelan, pembatasan butir tes, dan karena
menyamaratakan ke data yang tidak diamati, yakni, kemampuan siswa terhadap
keseluruhan butir yang mungkin terdapat dalam tes. Ketika keterampilan dan domain
yang diukur menjadi lebih rumit, mungkin akan terjadi lebih banyak kesalahan yang
disebabkan oleh pensampelan materi. Sumber lain kesalahan tes adalah

Page 20
ketidakefektifan pengecoh dalam tes pilihan ganda, seperti jawaban benar yang lebih
banyak, dan tingkat kesukaran butir tes.
Sebagai manusia, para siswa tidaklah selalu konsisten dan juga tidak terlepas
dari kesalahan dalam menyelesaikan tes. Apakah tes itu dimaksudkan untuk
mengukur kemampuan khusus atau kemampuan siswa secara optimal, perubahan
dalam berbagai hal seperti sikap siswa, kesehatan, dan rasa kantuk dapat
mempengaruhi kualitas usaha dan konsistensi siswa dalam menyelesaikan tes.
Sebagai contoh, peserta tes mungkin membuat kesalahan karena teledor, salah
menafsirkan petunjuk tes, melupakan instruksi tes, melupakan beberapa butir tes,
atau salah baca butir tes.
Kesalahan penskoran merupakan sumber sepertiga dari kesalahan potensial.
Pada bentuk tes objektif, penskoran bersifat mekanik, dan kesalahan penskoran harus
diperkecil. Pada tes uraian, sumber kesalahan meliputi ketidakjelasan rubrik
penskoran, ketidakjelasan apa yang diharapkan dari siswa, dan beberapa kesalahan
yang bersumber dari penilai. Para penilai tidaklah selalu konsisten, kadang-kadang
merubah ukuran-ukuran mereka selagi menskor, dan terkadang terpengaruh oleh hal-
hal yang tidak berhubungan dengan skor tes seperti efek halo, latar belakang siswa,
perbedaan persepsi, kebaikan hati atau kepelikan, dan kesalahan dalam penskalaan.

Page 21
BAB 3
PENUTUP

Sumber : https://www.scribd.com/doc/252564322/Makalah-Reliabilitas
https://mihwanuddin.wordpress.com/2011/01/13/makalah-reliabilitas/

Page 22

Anda mungkin juga menyukai