Diajukan Untuk Memenuhi Salah Satu Tugas Mata Kuliah Pengembangan Evaluasi
Pendidikan PAI
Dosen Pengampu: Dr. Hj. Nurjanah, S.Ag., S.Sy., M.SI.,
Disusun Oleh :
ISMAWATI
NIM: 2011000865
PROGRAM PASCASARJANA
PENDIDIKAN AGAMA
ISLAM
INSTITUT AGAMA ISLAM DARUSSALAM (IAID)
i
CIAMIS 2021
i
KATA PENGANTAR
Dengan menyebut nama Allah SWT yang Maha Pengasih lagi Maha Penyayang,
Kami panjatkan puja dan puji syukur atas kehadirat-Nya ,yang telah melimpahkan rahmat,
hidayah,dan inayah-Nya kepada kami, sehingga kami dapat menyelesaikan makalah
Pengembangan Evaluasi Pembelajaran PAI dengan Judul RELIABILITAS TES
Sholawat serta salamnya senantiasa tercurah limpahkan kepada junjungan kita Nabi
Muhammad Sholallohu ‘Alaihi Wasallam, semoga kita selalu diakui sebagai ummatnya dan
berhaq mendapat syafa’atnya nanti. Aamiin.
Dalam penulisan makalah ini kami berterima kasih kepada :
1. Ibu Dr. Hj. Nurjanah, S.Ag., S.Sy., M.SI., selaku dosen pengampu mata kuliah
Pengembangan Evaluasi Pembelajaran PAI Program Magister pendidikan agama
Islam PPS IAID Ciamis.
2. Kepada teman-teman program Magister pendidikan agama Islam,yang telah
membantu dalam hal sarana prasarana juga dukungan motivasi dalam menyelesaikan
tugas ini.
Kami menyadari dalam setiap penulisan tiada kata sempurna, kami mohon kritik dan
saran dalam hasil karya ini agar kami dapat lebih baik lagi menulis karya ilmiah
kedepannnnya.
Penulis
2
DAFTAR ISI
KATA PENGANTAR........................................................................................................2
DAFTAR ISI.......................................................................................................................3
BAB 1 PENDAHULUAN..................................................................................................4
A. Latar Belakang Masalah..........................................................................................5
B. Rumusan
Masalah...................................................................................................................5
C. Tujuan......................................................................................................................5
BAB II PEMBAHASAN.....................................................................................................6
A. Pengertian Reliabilitas..............................................................................................6
B. Cara Mengetahui
Reliabilitas.................................................................................................................8
BAB III
KESIMPULAN.....................................................................................................................12
DAFTAR
PUSTAKA............................................................................................................................13
3
BAB I
PENDAHULUAN
A. Latar Belakang
Sebuah tes dapat dikatakan memiliki tingkat kepercayaan yang tinggi jika tes tersebut
dapat memberikan hasil yang tetap apabila diujikan berulang kali. Sehingga dapat dikatakan
bahwa reliabilitas berkaitan dengan ketetapan hasil tes. Seandainya hasilnya berubah,
perubahan yang terjadi dapat dikatan tidak berarti.
4
Dalam evaluasi pendidikan, yang disebut “ajeg” atau “tetap” tidak selalu harus sama,
tetapi mengikuti perubahan secara tetap. Sebagai contoh, jika keadaan si A mula-mula berada
lebih tinggi dari pada si B, maka jika dilakukan pengukuran ulang, si A juga berada lebih
tinggi dari B. Itulah yang disebut ajeg atau tetap, yaitu memiliki kedudukan yang sama.
Tentunya tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukkan tingginya
reabilitas instrumen. Maka dari itu ingin membahas apa dan bagaimana reabilitas tes itu
karena keberadaanya penting adanya dalam evaluasi pembelajaran.
B. Rumusan Masalah
1. Apa pengertian Reliabilitas?
2. Bagaimana cara mengetahui Reliabilitas Tes?
C. Tujuan
1. Untuk mengetahui pengertian Reliabilitas.
2. Untuk mengetahui cara Reliabilitas Tes
5
BAB II
RELIABILITAS TES
A. PENGERTIAN RELIABILITAS
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu pengukuran
dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subyek yang sama, diperoleh hasil
pengukuran yang relatif sama, selama aspek yang diukur dalam diri subyek memang
belum berubah. Nur (1987: 47) menyatakan bahwa reliabilitas ukuran menyangkut
seberapa jauh skor deviasi individu, atau skor-z, relatif konsisten apabila dilakukan
pengulangan pengadministrasian dengan tes yang sama atau tes yang ekivalen.
Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan salah-satu ciri atau
karakter utama instrumen pengukuran yang baik. Konsep reliabilitas dalam arti reliabilitas
alat ukur berkaitan erat dengan masalah kekeliruan pengukuran. Kekeliruan pengukuran
sendiri menunjukkan sejauh mana inkonsistensi hasil pengukuran terjadi apabila
dilakukan pengukuran ulang terhadap kelompok subyek yang sama. Sedangkan konsep
reliabilitas dalam arti reliabilitas hasil ukur berkaitan erat dengan kekeliruan dalam
pengambilan sampel yang mengacu pada inkonsistensi hasil ukur apabila pengukuran
dilakukan ulang pada kelompok yang berbeda. Sudjana (2004: 16) menyatakan bahwa
reliabilitas alat penilaian adalah ketepatan atau keajegan alat tersebut dalam menilai apa
yang dinilainya. Artinya, kapanpun alat penilaian tersebut digunakan akan memberikan
hasil yang relatif sama.
Djaali (2000: 81) menyatakan bahwa reliabilitas dibedakan atas dua macam, yaitu
reliabilitas konsistensi tanggapan, dan reliabilitas. konsistensi gabungan butir.
Reliabilitas konsistensi tanggapan responden mempersoalkan apakah tanggapan
responden atau obyek ukur terhadap tes atau instrumen tersebut sudah baik atau konsisten.
Dalam hal ini apabila suatu tes atau instrumen digunakan untuk melakukan pengukuran
terhadap obyek ukur kemudian dilakukan pengukuran kembali terhadap obyek ukur yang
sama, apakah hasilnya masih tetap sama dengan pengukuran sebelumnya. Jika hasil
pengukuran kedua menunjukkan ketidakkonsistenan maka jelas hasil pengukuran itu tidak
mencerminkan keadaan obyek ukur yang sesungguhnya.
Untuk mengetahui apakah tanggapan terhadap tes atau instrumen itu mantap,
konsisten atau tidak plin-plan, dapat dilakukan dengan cara memberikan tes yang sama
secara berulang kali (dua kali) kepada obyek ukur atau responden yang sama. Pengetesan
6
dua kali merupakan syarat minimal untuk mengetahui apakah tanggapan obyek ukur
terhadap tes tersebut konsisten atau tidak.
Dalam pelaksanaan pengetesan dua kali ini dapat ditempupuh berbagai cara yaitu
kita melakukan pengetesan dua kali dengan tes sama terhadap obyek ukur yang sama, atau
dengan melakukan pengetesan sekali dengan menggunakan dua tes yang butir-butirnya
setara. Jika kita menggunakan pengetesan sekali maka kesamaan atau kesetaraan tes yang
digunakan merupakan syarat mutlak yang harus dipenuhi, karena kemantapan atau
konsistensi tanggapan terhadap butir-butir yang akan diperiksa.
Pada teknik belah dua ini pengukuran dilakukan dengan dua kelompok butir yang
setara pada saat yang sama. Karena setiap kelompok butir merupakan separuh dari seluruh
tes, maka biasanya kelompok butir pertama diambil dari butir-butir tes yang bernomor
ganjil, sedangkan kelompok butir yang kedua diambil dari butir-butir tes yang bernomor
genap. Perlu diketahui bahwa reliabilitas dengan teknik ini sangat relatif, karena
reliabilitas akan tergantung pada cara penomoran dan pengelompokan butir yang diambil.
Di sini pengukuran dilakukan dengan menggunakan dua tes yang dibuat setara kemudian
diberikan kepada responden atau obyek tes dalam waktu yang bersamaan. Skor dari kedua
kelompok butir tes tersebut dikorelasikan untuk mendapatkan reliabilitas tes.
Djaali (2000: 81) menyatakan bahwa reliabilitas konsistensi gabungan butir
berkaitan dengan kemantapan antara butir suatu tes. Hal ini dapat diungkapkan dengan
pertanyaan, apakah terhadap obyek. ukur yang sama, butir yang satu menunjukkan hasil
ukur yang sama dengan butir yang lainnya? Dengan kata lain bahwa terhadap bagian
obyek ukur yang sama, apakah hasil ukur butir yang satu tidak kontradiksi dengan hasil
ukur butir yang lain.
Jika terhadap bagian obyek ukur yang sama, hasil ukur melalui butir yang satu
kontradiksi atau tidak konsisten dengan hasil ukur melalui butir yang lain maka
pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya.
Dengan kata lain tidak reliabel dan tidak dapat digunakan untuk mengungkap ciri atau
keadaan yang sesungguhnya dari obyek ukur. Kalau hasil pengukuran pada bagian obyek
ukur yang sama antara butir yang satu dengan butir yang lain saling kontradiksi atau tidak
konsisten maka kita jangan menyalahkan obyek ukur, melainkan alat ukur (tes) yang
dipersalah- kan dengan mengatakan bahwa tes tersebut tidak reliabel terhadap obyek yang
diukur.
Koefisien reliabilitas konsistensi gabungan butir untuk skor butir dikotomi dapat
dihitung dengan menggunakan rumus Kuder-Richardson yang dikenal dengan nama KR-
7
20 (Djaali, 2000: 77)
ukur yang sama, butir yang satu menunjukkan hasil ukur yang sama dengan butir yang
lainnya? Dengan kata lain bahwa terhadap bagian obyek ukur yang sama, apakah hasil
ukur butir yang satu tidak kontradiksi dengan hasil ukur butir yang lain.
Jika terhadap bagian obyek ukur yang sama, hasil ukur melalui butir yang satu
kontradiksi atau tidak konsisten dengan hasil ukur melalui butir yang lain maka
pengukuran dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya.
Dengan kata lain tidak reliabel dan tidak dapat digunakan untuk mengungkap ciri atau
keadaan yang sesungguhnya dari obyek ukur. Kalau hasil pengukuran pada bagian obyek
ukur yang sama antara butir yang satu dengan butiryang lain saling kontradiksi atau tidak
konsisten maka kita jangan menyalahkan obyek ukur, melainkan alat ukur (tes) yang
dipersalah- kan dengan mengatakan bahwa tes tersebut tidak reliabel terhadap obyek yang
diukur.
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempuyai kesamaan
tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda.
Dua buah tes yang paralel, misalnya Bahasa Inggris seri A yang akan dicari
realibilitasnya dan tes seri B diteskan kepada sekelompok siswa yang sama. Setelah itu,
hasil keduanya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang
menunjukkan koefisien reabilitas tes seri A. Jika koefisiennya tinggi maka tes tersebut
dapat dikatakan reliabel.
Dalam menggunakan metode ini, pengetes hanya memiliki satu seri tes, tetapi
dicobakan dua kali. Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya.
Pada umumnya hasil tes kedua cenderung lebih baik dari pada hasil tes pertama. Hal
ini tidak jadi masalah karena pengetes harus menyadari akan adanya practice effect dan
carry over effect. Yang penting adanya kesejajaran hasil. Sebagai contoh:
8
Tes Pertama Tes Kedua
Siswa
Skor Ranking Skor Ranking
A 75 3 80 3
B 60 5 65 5
C 80 2 85 2
D 88 1 95 1
E 65 4 72 4
Walaupun tampak skornya naik, namun kenaikannya dialami semua siswa. Metode ini
juga dikenal sebagai korelasi diri sendiri (self-correlation method) karena
mengkorelasikan hasil dari tes yang sama.
Membelah item-item genap dan item-item ganjil yang selanjutnya disebut belahan
ganjil-genap.
Membelah item-item awal dan item-item akhir yaitu separuh jumlah pada nomor-
nomor awal dan separuh jumlah nomor-nomor akhir.
Contoh
Sk 1,3,5 2,4,6,8 1,2,3,4 5,6,
Nomor Item or ,7
N 7,8
Nama To
o 1 2 3 4 5 6 7 8 Gan Genap Awal Akh
tal
jil ir
1 Fatih 1 1 0 1 0 0 1 1 5 2 3 3 2
2 Adity 1 1 1 1 1 1 1 0 7 4 3 4 3
a
3 Zahra 1 1 0 0 1 0 1 0 4 3 1 2 2
4 Abbas 1 0 0 1 1 0 1 1 5 3 2 2 3
5 Adela 1 1 1 0 1 1 1 0 6 4 2 3 3
9
Pembelahannya hanya memilih salah satu saja, kemudian dihitung dengan korelasi product
moment.
a. Pembelahan ganjil-genap.
1,3,5,7 2,4,6,8 1,3,5, 2,4,6,
7 8
No Nama Ʃxy
Ganjil (x) Genap Ganji Gena
(y) l (x2) p (y2)
1 Fatih 2 3 6 4 9
2 Aditya 4 3 12 16 9
3 Zahra 3 1 3 9 1
4 Abbas 3 2 6 9 4
5 Adela 4 2 8 16 4
Ʃ 16 11 35 53 27
r11 = 2 rxy
1+ rxy
b. Pembelahan awal-akhir.
1
Untuk semua varians rumusnya adalah:
(ƩX)2
= ƩX2 - N
N
Dengan menggunakan tabel analisis butir yang disajikan untuk perhitungan dengan rumus
Spearman-Brown diketahui harga:
V1 = 3,6399
V2 = 4,8099
V3 = 7, 4899
4,8099)
7, 4899
= 2 (1 - -1,1109 = 2 (1 – (-0,1483)
7, 4899
= 2 x 1,1483
= 0,2966
Apabilah harga r11 ini dikonsultasikan dengan tabel product moment ternyata hasilnya lebih
kecil dari harga rt yang diharapkan, maka dapat disimpulkan bahwa instrumen tersebut tidak
reliabel.
1
BAB III
KESIMPULAN
1
DAFTAR PUSTAKA
Arikunto, Suharsimi, Dasar-dasar Evaluasi Pendidikan Ed. 2, Jakarta: Bumi Aksara, 2012
-------------------------, Prosedur Penelitian Edisi Revisi 2010, Jakarta: Rieneka Cipta, 2010
Azwar, Saifuddin. Sikap Manusia Teori dan Pengukurannya. Liberty:Yogyakarta, 1988.
Azwar, Saifudidin. Sikap Manusia Terori dan Pengukurannya.
Yokyakarta: Pustaka Pelajar, 2003.
Djaali., dkk. Pengukuran Dalam Pendidikan. Jakarta: ProgramPascasarjana, 2000.
Nur, Mohamad. Teori Tes. Surabaya: IKIP Surabaya, 1987.
Sudjana, Nana, Penilaian Hasil Proses Belajar Mengajar, Bandung:Remaja
Rosdakarya, 2004.