Anda di halaman 1dari 15

MAKALAH

PENGEMBANGAN EVALUASI PENDIDIKAN AGAMA ISLAM

Tentang:

Teknik Pengujian Reliabilitas Tes Hasil Belajar

Disusun Oleh :

Fadhlillah Aulia Wulandari


NIM. 2020010023

Dosen Pembimbing:

Dr. Hadeli, M.A, M. Pd

PRODI PENDIDIKAN AGAMA ISLAM (PAI-B)

PASCASARJANA

UNIVERSITAS ISLAM NEGERI (UIN)

IMAM BONJOL PADANG

1442 H / 2021 M
I. PENDAHULUAN

A. Latar Belakang

Evaluasi pendidikan melibatkan banyak kegiatan teknis dalam menentukan


metode dan format penilaian yang dapat digunakan untuk mendapatkan informasi
yang dibutuhkan. Informasi tersebut diperlukan dalam menafsirkan dan
menetapkan keputusan untuk kepentingan pendidikan. Penilai membutuhkan
keterampilan dalam mengidentifikasi dan memahami berbagai macam perspektif
penilaian, baik penilaian kontekstual dan proses maupun penilaian hasil. Karena
penilaian merupakan pusat kontrol keberhasilan program pendidikan, maka
terdapat dua syarat utama yang harus dipenuhi oleh suatu instrumen penilaian,
yaitu validitas dan reabilitas.
Validitas mengacu kepada kebenaran, kemanfataan dan kesesuaian skor tes.
Sedangkan reabilitas berarti konsistensi adalah ciri umum dari suatu instrumen
pengukuran dan penilaian pendidikan. Konsistensi tinggi skor instrumen dari
suatu pengukuran ke pengukuran berikutnya merupakan ciri terpenting dari
instrumen yang berkualitas tinggi.

B. Rumusan Masalah

a. Pengertian Reliabilitas Tes Hasil Belajar


b. Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Uraian
c. Teknik Pengujian Reliabilitas Tes Hasil Belajar Bentuk Objektif

C. Tujuan Penulisan
a. Untuk mengetahui pengertian reliabilitas tes hasil belajar
b. Agar memahami teknik pengujian reliabilitas tes hasil belajar bentuk
uraian
c. Memahami teknik pengujian reliabilitas tes hasil belajar bentuk objektif

1
II. PEMBAHASAN

A. Pengertian Reliabilitas Tes Hasil Belajar


Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam bahasa
Inggris yang berasal dari kata asal reliable yang memiliki arti dapat dipercaya. Seperti
halnya istilah validitas dan valid. Lebih lanjut yang dimaksud reliabilitas adalah sebagai
berikut :

 Sejauh mana hasil pengukuran dapat dipercaya


 Sejauh mana hasil pengukuran dapat dipercaya bila dilakukan pengukuran
pada waktu yang berbeda pada kelompok subjek yang sama diperoleh
hasil yang relatif sama asalkan aspekyang diukur dalam diri subjek
memang belum berubah
 Tinggi/ rendahnya reliabilitas secara empirik ditunjukkan oleh suatu angka
yang disebut nilai koefisien reliabilitas
 Reliabilitas yang tinggi ditunjukkan dengan nilai 1.00, reliabilitas yang
dianggap sudah cukup memuaskan atau tinggi adalah > 0,70. 1

Dalam pembicaraan tentang reliabilitas, tidak lagi dipertanyakan tentang


ketepatan pengukuran, tetapi tentang konsisten dan ketelitian dalam mengukur serta apa
yang seharusnya diukur. Apakah skor-skor yang didapat melalui pengukuran tersebut
konsisten? Tidakkah skornya akan berubah, kalau dilakukan pengukuran ulang terhadap
objek yang sama pada waktu yang berlainan?. Reliabilitas tes berhubungan dengan
masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang
tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka reliabilitas tes
berhubungan dengan dengan masalah ketetapan hasil tes.2

Wingston mengemukakan bahwa “Reliability is commonly defined as an


estimate of degree of consistency or constancy among repeated measurements of
individuals with the same instument”. Sejalan dengan itu, Gronlund menyatakan
“Reliability refers to the consistency of measurement results from one measurement to
another”. Adapun Friedenberg mengemukakan tentang reliability sebagai berikut “The

1
Doni,Sindu, BG Phalguna, Yogi, Evaluasi Pendidikan, ( Beta), h. 82-83

2
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan, (Yogyakarta: Bina Aksara, 1986), h.
75

2
extent to which a instrument measure stable characteristic of instrument takes and
therefore is free from random measurement random error. A reliable instrument
provides a relatively consistent measure of instrument taker characteristic theoretically
dafined as ratio og true score variance to instrument score variance”.3

Menurut Nunaly, Allen, Yen dan Anastasi bahwa reliabilitas adalah kestabilan
skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang sama pada
situasi yang berbeda atau dari satu pengukuran ke pengukuran yang lainnya. Jadi
realibilitas dapat dinyatakan sebagai tingkat keajegan atau kemantapan hasil dari hasil
dua pengukuran terhadap hal yang sama.4
Cara-cara mencari besarnya reliabilitas

Reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subyek yang sama.
Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Kriteria yang
digunakan untuk mengetahui ketetapan ada yang berada di luar tes (consistencyexternal)
dan pada tes itu sendiri(consistency internal).

1. Metode bentuk Paralel (equivalen)

Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah
bahasa inggris disebut alternate-forms method (paralel form).

2. Metode tes ulang (tes-retest method)

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes.
Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi
dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode
ini dapat disebut dengan single-test-double-trial method. Kemudian hasil dari kedua tes
tersebut dihitung korelasinya.

Kelemahan penggunaan metode dua tes dua kali percobaan dan satu tes dua kali
percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan
metode ini pengetes hanya menggunakan sebuah tes yang dicobakan satu kali. Maka,
disebut juga single-test-single-trial method.

3
Muri Yusuf, Asesment dan Evaluasi Pendidikan, (Jakarta: Kencana, 2015), h. 73-74
4
Gito Supriadi, Reliabilitas Tes Hasil Belajar dan Aplikasinya dalam Evaluasi Pembelajaran,
(Jurnal Himmah, Vol VII No 18 Januari-April 2006), h. 51-52

3
Oleh sebab itu, reliabilitas suatu instrumen merujuk kepada kadar stabilitas dan
konsisten instrumen tersebut. Tujuan utama menghitung reliabilitas skor tes adalah
untuk mengetahui tingkat ketepatan (precision) dan keajegan (consistency) skor tes.
Suatu instrument atau tes dikatakan memiliki nilai reliabilitas yang tinggi apabila tes
yang dibuat memiliki hasil yang konsisten dalam mengukur yang hendak diukur. Tes
yang memiliki reliabilitas tinggi adalah akurat, reproducible dan generalized terhadap
kesempatan testing dan instrumen tes lainnya. Secara rinci faktor yang dapat
mempengaruhi reliabilitas sebuah tes diantaranya:

a) Semakin banyak jumlah butir soal, semakin ajeg suatu tes

b) Semakin lama waktu tes, semakin ajeg

c) Semakin sempit range kesukaran butir soal, semakin besar keajegan

d) Soal-soal yang saling berhubungan akan mengurangi keajegan

e) Semakin objektif pemberian skor, semakin besar keajegan

f) Ketidaktepatan pemberian skor

g) Menjawab besar soal dengan cara menebak

h) Jarak antara tes pertama dengan tes kedua

i) Posisi individu dalam belajar

j) Kondisi fisik peserta tes 5

Secara konseptual, reliabilitas mengandung arti:


a. Reliabilitas merupakan degree/kadar stabilitas yang diperoleh dengan
instrumen evaluasi

b.Perkiraan reliabilitas itu sendiri merujuk kepada konsisten dari skor


instrumen

c. Reliabilitas itu penting tetapi tidak cukup untuk menjamin validitas suatu
instrumen. Ia hanya menyediakan kenyataan tentang konsisten, bukan
mengukur instrumen.

d. Reliabilitas dinyatakan dalam “coefisient reliability” dan atau dengan

5
Abdul Kadir, Menyusun dan Menganalisis Tes Hasil Belajar, (Jurnal Al-Ta’dib, Vol. 8 No. 2,
2015), h. 73

4
standar error measurement.6

Jadi suatu alat ukur dikatakan reliable apabila alat ukur itu diujikan kepada objek
atau subyek yang sama secara berulang-ulang, hasilnya akan tetap sama, konsisten,
stabil atau relatif sama.

B. Teknik Pengujian Realiabilitas Tes Hasil Belajar

1. Teknik Pengujian Realiabilitas Tes Hasil Belajar Bentuk Uraian

Dalam rangka menentukan apakah tes hasil belajar bentuk uraian yang disusun
oleh seorang staf pengajar telah memiliki daya keajegan mengukur atau reliabilitas yang
tinggi ataukah belum, pada umumnya orang menggunakan sebuah rumus yang dikenal
dengan nama Rumus Alpha. Adapun rumus alpha yang dimaksud adalah :7

2. Teknik Pengujian Realiabilitas Tes Hasil Belajar Bentuk Obyektif

Dalam tes hasil belajar bentuk obyektif untuk menentukan reliabilitas tes,
dapat dilakukan dengan tiga macam pendekatan, yaitu:

1)Pengujian Reliabilitas Tes Hasil Belajar Bentuk Obyektif dengan


menggunakan Pendekatan Single Tes-Single Trial

Dalam rangka menentukan reliabilitas tes hasil belajar bentuk obyektif

6
Muri Yusuf, op.cit., h. 74
7
Anas Sudijono, Pengantar Evaluasi Pendidikan, (Jakarta: Raja Grafindo Persada, 2006), h. 207-
208

5
dengan menggunakan pendekatan single tes-single trial, maka penentuan
reliabilitas tes tersebut dilakukan dengan jalan melakukan pengukuran
terhadap sekelompok subyek, di mana pengukuran itu dilakukan dengan
hanya menggunakan satu jenis alat pengukur dan bahwa pelaksanaan
pengukuran itu hanya dilakukan sebanyak satu kali saja. Dengan kata lain
pendekatan single test-single trial adalah pendekatan serba single atau
pendekatan serba satu, yaitu kelompok subyek, satu jenis alat pengukur, dan
satu kali pengukuran atau sekelompok testee, satu jenis dan satu kali testing

Dengan menggunakan pendekatan single test-single trial, maka tinggi


rendahnya reabilitas tes hasil belajar bentuk obyektif dapat diketahui dengan
melihat besar kecilnya koefisien reliabilitas tes, seperti halnya pada tes
uraian dilambangkan dengan r11 atau rtt dapat dilakukan dengan lima
langkah, yaitu: 8

a. Pendekatan single test-single trial dengan menggunakan formula spearman-


brown

Penentuan reabilitas dengan menggunakan formula spearman brown, dikenal


dengan istilah teknik belah dua (split half technique). disebut dengan teknik belah
dua sebab dalam penentuan reabilitas tes, penganalisisannya dilakukan dengan jalan
membelah dua butir-butir soal tes menjadi dua bagian yang sama, sehingga masing-
masing testee memiliki dua macam skor. Salah satu skor merupakan bagian peratama
atau belahan pertama dari tes, sedangkan skor yang satunya lagi merupakan bagian
kedua atau belahan kedua dari tes hasil belajar bentuk obyektif tersebut.

Dengan demikian penerapan formula spearman broen akan menghasilkan dua


buah distribusi skor dan bahwa korelasi antara distribusi skor belahan pertama dengan
distributor skor belahan kedua itu dipandang sebagai bentuk obyektif tersebut,
sedangkan untuk mengetahui reliabilitas tes secara keseluruhan spearmen-brown
menciptakan formula sebagai berikut:

8
Ibid., h. 213-218

6
a). Pendekatan single test single trial dengan menggunakan formula spearmen brown
model gasal genap. Adapun langkah- langkah yang perlu ditempuh yaitu:

 Menjumlahkan skor-skor dari butir-butir item yang yang bernomor gasal yang
dimiliki oleh nasing-masing, individu testee

 Menjumlahkan skor-skor dari butir-butir item yang bernomor genap yang


dimiliki oleh masing-masing individu testee
 Mencari (menghitung) koefisien korelasi “e” product moment ( rxy = rhh = 11
).
Dalam hal ini jumlah skor-skor dan butir-butir item yang bernomor gasal kita
r
22

anggap sebagai variabel X, sedangkan jumlah skor-skor dari butir-butir item


yang bernomor genap kita anggap sebagai variabel Y, dengan menggunakan
rumus
 Mencari (menghitung) koefisien reliabilitas tes (r 11 = rtt)
 Memberikan interpretasi terhadap r11

b). Pendekatan single test-single trial dengan menggunakan formula spearman-


brown model belahan kiri dan kanan
Langkah-langkah yang perlu ditempuh dalam penentuan reliabilitas tes dengan
pendekatan single test-single trial di mana digunakan formula spearmen-brown
model belahan kiri dan kanan adalah sebagai berikut:

Langkah 1, menjumlahkan skor-skor dari butir-butir item yang terletak di separoh


bagian kiri tes, yang dimiliki masing- masing individu siswa, yaitu butir-butir item
dengan nomor 1,2,3,4,5,6,7,8,9,10,11, dan 12.

Langkah 2, menjumlahkan skor-skor dari butir-butir item yang terletak di separoh


bagian kanan tes, yang dimiliki oleh masing-masing individu siswa, yaitu butir-butir
item dengan nomor 13,14,15,16,17,18,19,20,21,22,23 dan 24.

Langkah 3, mencari (menghitung) angka indeks korelasi “r” product moment,

7
antara variabel X (separoh sebelah) dengan variabel Y (separoh belahan kanan)
yaitu r xy atau rhh .

Langkah 4, mencari (menghitung) koefisien reliabilitas tes (r tt


atau r11)

Langkah 5, memberikan interpretasi terhadap r11 8

c). Kelemahan-kelemahan formula spearman-brown

 Dalam belahan gasal-genap dan belahan kiri-kananharuslah sebanding. Ini


merupakan suatu hal yang sulit diwujudkan kecuali hanya kebetulan saja

 Jumlah butir-butir item yang akan diuji haruslah merupakan bilangan genap

 Dengan dua buah model perhitungan (model kiri-kanan dan genap-ganjil). dapat
terjadi bahwa koefisin reliabilitas tes menunjukkan bilangan yang tidak sama.

d). Ketepatan penggunaan formula spearman brown

Penggunaan formula spearman brown baru akan memperlihatkan ketepatannya,


apabila:

 Disamping jumlah skor belahan I dan belahan II harus seimbang/mendekati dan


jumlah item harus bilangan genap, juga jumlah item yang diajukan dalam tes
tersebut hendaknya cukup banyak
 Jenis item yang dikemukakan dalam tes hendaknya berupa item-item yang
mempunyai derajat kesukaran yang tinggi; artinya butir-butir item itu termasuk
kategori item yang sukar
 Materi hendaknya bersifat komprehensif, sehingga memungkinkan bagi
penyusun tes untuk membuat dua butir item untuk satu permasalahan yang sama
atau identik.

b. Pendekatan single tesr-single trial dengan menggunakan formula flanagan

Berdasarkan kelemahan-kelemahan yang dimiliki oleh formula spearman-brown,


flanagan memiliki formula dimana persyaratan- persyaratan yang di tuntut oleh
spearman-brown tidak harus dipenuhi. Berbeda dengan formula spearman-brown, maka
pada formula flanagan, reliabilitas tes tidak didasarkan pada ada tidaknya korelasi

8
antara belahan I dengan belahan II, melainkan mendasarkan diri pada jumlah kuadrat
deviasi pada tes belahan I, jumlah kuadrat deviasi pada tes belahan II, dan jumlah
kuadrat total (belahan I + belahan II). Adapun formula yang diajukan oleh flanagan
adalah:

c. Pendekatan single test-single trial dengan menggunakan formula Rulon

Rulon merumuskan suatu formula untuk mengestimasi reliabilitas dengan belah dua
tanpa perlu berasumsi bahwa kedua belahan mempunyai varians yang sama. Menurut
Rulon perbedaan skor subyek pada kedua belahan instrumen akan membentuk distribusi
perbedaan skor dengan varians yang besarnya ditentukan oleh varians error masing-
masing belahan menetukan varians error keseluruhan instrumen, maka varians error
instrumen ini dapat diestimasi lewat besarnya varians perbedaaan skor diantara kedua
belahan. Dalam melakukan estimasi reliabilitas skor instrumen, varians perbedaan skor
diperhitungkan sebagai sumber error. Untuk melakukan estimasi reliabilitas instrumen
dengan rumus Rulon, peneliti juga harus menghitung dahulu varians selisih belahan
pertama dan kedua varians total. Formula Rulon untuk mengestimasi reliabilitas
sebagai berikut: 9

Keterangan:

r11 = koefisien tes

9
Heri Retnawati, Reliabilitas Instrumen Penelitian, (Bukittinggi, 2017), h. 3

9
1 = bilangan konstan

Sd2 = varian perbedaan antar skor yang dicapai oleh testee pada belahan I
dengan skor yang dicapai oleh testee pada belahan II

St2 = varian total

d. Pendekatan single test-single trial dengan menggunakan formula kuder


Richardson 10

Ada banyak cara untuk memilih tes yang terdiri dari n butir menjadi dua bagian
yang masing-masing terdiri dari n/2 butir, salah satunya adalah pemilihan berdasarkan
butir nomor ganjil dan butir nomor genap. Tidak puas dengan metode belah dua, Kuder
dan Richardson mengembangkan metode baru untuk mengestimasi reliabilitas tes
berdasarkan statistik butir. Kuder dan Richardson memilih tes yang terdiri dari n butir
menjadi n bagian yang masing- masing terdiri dari satu butir. Kuder dan Richardson
mengasumsikan bahwa butir-butir tes memiliki satu faktoe persekutuan. Dengan kata
lain, butir-butir tes hasus paralel. Formula dasar dari reabilitas Kuder dan Richardson
populer dengan sebutan formula atau rumus KR-20. K-R singkatan dari Kuder dan
Richardson, sedangkan 20 merupakan catatan bilangan yang menemukan banyak
replikasi perhitungan sampai penemuan rumus tersebut. Formula KR-20 adalah seperti
di bawah ini:

10
Universitas Pendidikan Ganesha, Pascasarjana, Reliabilitas Instrumen, h. 5

10
e. Pendekatan single tes-single trial dengan menggunakan formula C
Hoyt

Berbeda dengan spearman-brown, flanagan, Rulon maupun Kuder-Richardson,


maka menurut C. Hoyt dalam menentukan reliabilitas tes hendaknya kita menganggap
bahwa data yang berupa skor-skor hasil tes itu kita anggap sebagai data hasil
eksperimen, dimana faktor pertama atau klasifikasi I-nya adalah subyek, sedangkan
faktor kedua atau klasifikasi II adalah item. Masing- masing sel di sini terdiri atas 1
subyek. Selanjutnya kita cari interaksi antara subyek dengan item. Teknik analisis
seperti inilah yang dikenal dengan nama teknik analisis varian (=ANAVA) dan
penggunaan teknik analisis varian dalam rangka menentukan reliabilitas tes adalah
merupakan perkembangan baru dalam dunia evaluasi pendidikan.

Pendekatan formula ini dapat diperoleh dengan menggunakan rumus: 11

11
Anas Sudijono, op.cit., h. 259-260
III. PENUTUP

1. Kesimpulan

Reliabilitas adalah kestabilan skor yang diperoleh orang yang sama ketika diuji
ulang dengan tes yang sama pada situasi yang berbeda atau dari satu pengukuran ke
pengukuran yang lainnya. Jadi realibilitas dapat dinyatakan sebagai tingkat keajegan
atau keamntapan hasil dari hasil dua pengukuran terhadap hal yang sama. Suatu alat
ukur dikatakan reliable apabila alat ukur itu diujikan kepada objek atau subyek yang
sama secara berulang-ulang, hasilnya akan tetap sama, konsisten, stabil atau relatif
sama.
Ada dua teknik yang digunakan dalam menguji kerealibilitasan suatu tes,

yaitu:

1. Teknik Pengujian Realiabilitas Tes Hasil Belajar Bentuk Uraian,


dengan menggunakan rumus Alpha
2. Teknik Pengujian Realiabilitas Tes Hasil Belajar Bentuk Obyektif,
dengan menggunakan tiga pendekatan, lima pendekatan yaitu:

a. Pendekatan single test-single trial dengan menggunakan formula


spearman-brown

b. Pendekatan single tesr-single trial dengan menggunakan formula flanagan

c. Pendekatan single test-single trial dengan menggunakan formula Rulon

d. Pendekatan single test-single trial dengan menggunakan formula kuder


Richardson

e. Pendekatan single tes-single trial dengan menggunakan formula C. Hoyt

12
2. Kritik dan Saran
Penulis menyadari bahwa makalah ini jauh dari kata sempurna, oleh
sebab itu, penulis berharap adanya kritik dan saran agar makalah ini lebih baik lagi.
DAFTAR KEPUSTAKAAN

Gito Supriadi, Gito. 2006. Reliabilitas Tes Hasil Belajar dan Apalikasinya Dalam
Evaluasi Pembelajaran. Jurnal Himmah, Vol VII No 18 Januari-April

Kadir, Abdul. 2015. Menyusun dan Menganalisis Tes Hsil Belajar. Jurnal Al-
Ta’dib, Vol. 8 No. 2, Juli-Desember

Retnawati, Heri. 2017. Reliabilitas Instrumen Penelitian. Bukittinggi

Sugiono, Anas. 2006. Pengantar Evaluasi Pendidikan. Jakarta: RajaGrafindo


Persada

Suharsimi Arikunto, Suharsimi. 1989. Dasar-Dasar Evaluasi Pendidikan.

Yogyakarta: Bina Aksara

Yogi, Doni, Shindu, dkk. Evaluasi Pendidikan. ( Beta)

Universitas Pendidikan Ganesha, Pascasarjana, Reliabilitas Instrumen.

Yusuf, Muri. 2015. Asesment Dan Evaluasi Pendidikan. Jakarta: KENCANA

14

Anda mungkin juga menyukai