Ditujukan untuk memenuhi salah satu tugas mata kuliah Evaluasi Pendidikan
yang diampu oleh :
Dr. Endang Sri Andayani, S.E., M.Si., Ak
S1 PENDIDIKAN AKUNTANSI
FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS NEGERI MALANG
MEI 2021
KATA PENGANTAR
Rasa syukur yang dalam kami sampaikan kehadirat Allah SWT, karena berkat
rahmat-Nya makalah ini dapat kami selesaikan sesuai dengan yang diharapkan. Kami juga
bersyukur atas rizky dan kesehatan yang telah diberikan oleh-Nya sehingga kami dapat
menyusun makalah yang “Validitas dan Reliabilitas Tes Hasil Belajar”.
Makalah ini disusun untuk diajukan sebagai salah satu tugas mata kuliah Evaluasi
Pendidikan. Kami mengakui bahwa dalam menyusun makalah ini tidak dapat diselesaikan
tanpa adanya bantuan dari berbagai pihak. Pada kesempatan ini, kami mengucapkan terima
kasih kepada:
1. Ibu Dr. Endang Sri Andayani, SE, M.Sc., Ak. selaku dosen mata kuliah Evaluasi
Pendidikan.
Kami menyadari masih banyak kekurangan yang terdapat dalam makalah ini. Untuk
itu penulis sangat mengharapkan adanya kritik dan saran dari semua pihak. Semoga makalah
ini memberikan informasi bagi pembaca dan bermanfaat untuk pengembangan ilmu
pengetahuan bagi kita semua.
Penyusun
1
DAFTAR ISI
HALAMAN JUDUL
KATA PENGANTAR..............................................................................................1
DAFTAR ISI.............................................................................................................2
BAB I PENDAHULUAN
1.1 Latar Belakang..................................................................................................3
BAB II PEMBAHASAN
2.1 Karakteristik Tes Hasil Belajar..........................................................................5
2.2 Pengertian Validitas Tes....................................................................................7
2.3 Faktor yang Mempengaruhi Validitas 9
2.4 Cara Uji Validitas Suatu Tes 10
2.5 Pengertian Reliabilitas Tes 13
2.6 Faktor yang Mempengaruhi Reliabilitas 18
2.7 Cara Uji Reliabilitas Suatu Tes 18
DAFTAR PUSTAKA...............................................................................................26
2
BAB I
PENDAHULUAN
A. Latar Belakang
Bidang pendidikan tidak akan terlepas dari evaluasi, baik pada tingkat pendidikan
terendah hingga tingkat pendidikan yang tertinggi sekalipun. Adanya peran evaluasi
dalam dunia pendidikan dapat meningkatkan kualitas sumber daya manusia suatu negara
karena dengan adanya evaluasi kemampuan peserta didik dapat diukur dan diketahui
melalui tes hasil belajar peserta didik. Tanpa adanya evaluasi, kemampuan peserta didik
yang sesungguhnya tidak dapat diukur dan diketahui. Padahal informasi terkait
kemampuan peserta didik perlu diketahui guna mewujudkan adanya peserta didik
sebagai generasi yang berguna bagi nusa dan bangsa karena memiliki tingkat kualitas
sumber daya manusia yang tinggi.
Melalui evaluasi dapat diketahui apakah pendidikan dalam waktu tertentu yang telah
dilalui setiap peserta didik berhasil atau tidak, baik atau buruk, dan lulus atau tidak lulus.
Adanya evaluasi sebagai alat untuk mengetahui seberapa jauh peserta didik mampu
menguasai materi. Hal ini dapat diketahui dari hasil evaluasi. Namun, tidak semua hasil
evaluasi layak untuk dijadikan acuan dalam pengambilan keputusan dalam pendidikan
karena hasil evaluasi itu bisa saja belum sesuai dengan maksud dan tujuan yang telah
direncanakan, sehingga menyebabkan adanya ketidaksesuaian dalam proses dan hasil
yang diharapkan. Untuk itu suatu evaluasi harus direncanakan dan dilakukan sebaik
mungkin agar proses dan hasil pengujian yang dilakukan kepada peserta didik
menyatakan hasil yang sebenarnya. Evaluasi yang baik memiliki validitas dan reliabilitas
yang tinggi. Oleh karena itu, penulis penyusun makalah yang “Validitas dan Reliabilitas
Tes Hasil Belajar” untuk menambah wawasan pembaca terkait dengan pengetahuan
tentang validitas dan reliabilitas suatu tes hasil belajar peserta didik.
B. Rumusan Masalah
1. Bagaimana karakteristik tes hasil belajar dengan baik?
2. Apakah yang dimaksud dengan Validitas tes hasil belajar?
3. Apa saja faktor yang mempengaruhi validitas tes hasil belajar?
4. Apakah yang dimaksud dengan Reliabilitas tes hasil belajar?
5. Apa saja faktor yang mempengaruhi Reliabilitas tes hasil belajar ?
3
6. Bagaimana cara menguji validitas dan reliabilitas suatu tes?
C. Tujuan
1. Untuk mengetahui karakteristik tes hasil belajar yang baik
2. Untuk mengetahui yang dimaksud dengan Validitas tes hasil belajar
3. Untuk mengetahui faktor yang mempengaruhi validitas tes hasil belajar
4. Untuk mengetahui yang dimaksud dengan Reliabilitas tes hasil belajar
5. Untuk mengetahui faktor yang mempengaruhi Reliabilitas tes hasil belajar
6. Untuk mengetahui uji validitas dan reliabilitas suatu tes
4
BAB II
PEMBAHASAN
5
Maya 7 8
Tabel diatas menunjukkan nilai hasil tes pertama dan kedua yang diperoleh oleh
peserta didik yang mana nilai peserta didik mengalami kenaikan tetapi posisi
rankingnya tetap. Ini menunjukkan bahwa alat ukur atau tes yang digunakan sudah
reliable atau dapat dipercaya.
c. Objektif
Dikatakan objektif jika tes hasil belajar disusun dan dilaksanakan apa adanya. Tes
hasil belajar yang objektif akan disusun berdasarkan materi dan bahan ajar yang
diajarkan. Dalam penilaian terhadap tes hasil belajar juga dilakukan secara objektif
tanpa adanya unsur subjektif. Menurut Ngabidin (2013) objektivitas menekankan
pada ketetapan (consistency) dalam sistem penilaian yang objektif, sedangkan
reliabilitas menekankan ketetapan pada hasil tes. Sidijono (2006) mengatakan bahwa
tes yang objektif adalah tes yang dilakukan apa adanya. Jika dilihat dari segi isi atau
materi yang menjadi acuan pembuatan tes, maka yang dimaksud dengan apa adanya
adalah tes tersebut dibuat sesuai dengan materi atau bahan pelajaran yang telah
diajarkan kepada peserta didik yang telah disesuaikan dengan tujuan pembelajaran.
Jika dilihat dari segi penilaian atau pemberian skor atas tes hasil belajar peserta didik,
maka yang dimaksud dengan apa adanya adalah penilaian harus dilakukan secara
objektif dan terhindar dari subyektivitas. Misalnya memberikan pengurangan nilai
pada peserta didik yang memiliki tulisan tangan yang jelek tapi.
d. Praktis
Menurut Sudijono (2006) tes hasil belajar dikatakan praktis jika tes tersebut
dilaksanakan dengan mudah karena sifatnya yang sederhana, dengan kata lain untuk
melaksanakan tes tersebut peserta didik tidak memerlukan peralatan uang banyak dan
sulit didapatkan. Praktis disini juga mencangkup kelengkapan tes yang meliputi
lengkapnya petunjuk cara mengerjakan tes, kunci jawaban yang dirahasiakan dari
peserta didik, serta tidak memerlukan waktu yang lama, tenaga dan biaya yang besar
untuk melaksanakan tes tersebut. Arikunto (2003) juga menyatakan hal yang sama,
bahwa tes yang praktis adalah tes yang udah dilaksanakan, mudah pemeriksaannya
karena memiliki kunci jawaban ataupun pedoman penilaian, adanya petunjuk yang
jelas baik petunjuk mengerjakan ataupun petunjuk bagi pengawas ketika peserta didik
melaksanakan tes tersebut. Dan ekonomis yang berarti pelaksanaan tes hasil belajar
tidak memakan waktu, tenaga dan biaya yang banyak.
6
2.2 Pengertian Validitas Tes
Validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes. Suatu
tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki
validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran
antara tes dan kriteria (Arikunto, 1999: 65). Singkatnya dapat kita ketahui bahwa validitas
tes itu merupakan instrument yang digunakan untuk mengukur suatu tes. Untuk menguji
validitas setiap butir soal maka skor-skor yang ada pada butir yang dimaksud
dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatakan skor X dan skor total
dinyatakan sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat
diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks validitasnya
(Arikunto, 1999: 78). Untuk menguji validitas instrumen digunakan rumus korelasi
product moment seperti pada gambar berikut;
dengan rxy merupakan koefisien korelasi antara variabel X dan variabel Y, sedangkan N
merupakan jumlah siswa uji coba, X adalah skor-skor tiap butir soal untuk setiap individu
atau siswa uji coba, dan Y adalah skor total tiap siswa uji coba.
Validitas tes atau juga dikenal dengan istilah validitas alat ukur secara umum
memiliki makna bahwa “sejauh mana tes itu mengukur apa yang dimaksudkan untuk
diukur”. Dengan demikian, validitas tes pada dasarnya telah merujuk pada derajat fungsi
pengukuran suatu tes, atau derajat kemampuan/kecermatan ukurnya suatu tes. Dalam
mengkaji validitas tes atau validitas alat ukur adalah sejauh mana alat ukur itu mampu
mengukur apa yang dimaksudkan untuk diukur. Secara umum validasi tes dapat dipandang
dari tiga arah yakni isi yang di ukur, rekaan teoritis atribut yang diukur, dan kriteria yang
diukur, ketiga hal tersebut secara langsung menjadi jenis-jenis dari validitas tes yang akan
kami jelaskan lebih terperinci sebagai berikut;
1. Validitas Isi
Validitas isi atau yang sering juga disebut validitas kurikulum merupakan
suatu alat ukur yang dipandang valid apabila sesuai dengan isi kurikulum yang
hendak diukur (Syarif & Syamsurizal, 2019). Validitas isi tes lebih mengarah
kepada kedalaman tes, yang merupakan soal-soal, dilihat dari isinya mengandung
sesuatu yang memang harus diukur. Salah satu cara yang dapat dilakukan untuk
7
mengukur validitas adalah dengan mengkaji isi tes itu. Sebuah tes dikatakan
memiliki isi jika pengukuran sesuai dengan domain dan tujuan khusus tertentu
yang sama dengan isi pelajaran yang telah dipeajari di kelas. Jadi ketika kita
hendak mengukur kemampuan peserta didik, maka kita harus mengukur terlebih
dahulu atribut atau karakteristik apa yang berkaitan dengan hal yang ingin diukur
dari peserta didik. Misalnya, sebuah tes dirancang untuk mengukur kemampuan
peserta didik dalam menguasai materi rekonsiliasi fiscal pada mata pelajaran
akuntansi perpajakan, maka atribut atau karakteristik khusus yang harus diukur
adalah berkaitan dengan pemahaman peserta didik mengenai konsep rekonsiliasi,
kemampuan menghitung peserta didik, kemampuan menjurnal transaksi, dan lain-
lain.
2. Validitas Konstruk
Validitas konstruk mengandung arti bahwa suatu alat ukur dikatakan valid
apabila telah cocok dengan kontruksi teoritik di mana tes itu dibuat. Sebuah tes
dikatakan memiliki validitas konstruksi apabila soal-soalnya mengukur setiap
aspek berpikir seperti yang diuraikan dalam standar kompetensi, kompetensi dasar,
maupun indikator yang terdapat dalam kurikulum. Konstuksi yang dimaksud pada
validitas ini bukanlah merupakan konstruksi seperti bangunan atau susunan, tetapi
berupa rekaan psikologis yang berkaitan dengan aspek-aspek ingatan, pemahaman,
aplikasi, analisis, sintesis, dan evaluasi.
3. Validitas Berdasarkan Kriteria
Dalam validitas berdasar kriteria, validitas tes itu dilihat dari besarnya hasil
pengukuran dengan alat yang dipersoalkan itu sama atau mirip dengan hasil
pengukuran alat lain yang dijadikan kriteria. Kriteria itu umumnya adalah hasil
pengukuran atribut yang sama dengan alat lain yang diakui merupakan alat ukur
yang baik (memenuhi persyaratan akademik dan profesional tertentu). Validitas ini
dibedakan menjadi dua macam, yaitu;
a) Validitas prediksi: menunjukkan kepada hubungan antara tes skor yang
diperoleh peserta didik dengan keadaan yang akan terjadi diwaktu yang akan
datang. Sebuah tes dikatakan memiliki validitas prediksi apabila mempunyai
kemampuan untuk memprediksikan apa yang akan terjadi di masa yang akan
datang. Misalnya, peserta didik lulusan SMA mengikuti seleksi masuk
perguruan tinngi dan memperoleh nilai tes yang bagus sehingga dia diterima
dan diperkirakan akan berhasil dan semakin berkembang di perguruan tinggi
8
tersebut, jika hal ini benar terjadi maka tes masuk perguruan tinggi tersebut
dikatakan memiliki validitas yang bagus. Sebaliknya, apabila peserta didik
tidak mengalami perkembangan di perguruan tinggi tempat ia lulus, maka tes
seleksi yang sebelumnya dilakukan itu tidak memiliki validitas yang bagus.
b) Validitas konkruen: menunjuk pada hubungan antara tes skor yang dicapai
dengan keadaan sekarang. Validitas ini dikenal sebagai validitas empiris.
Sebuah tes dikatakan memiliki concurent validity apabila hasilnya sesuai
dengan pengalaman atau hal yang sudah dipelajari.
2.3 Faktor yang Mempengaruhi Validitas Suatu Tes
Dalam buku Pengantar Evaluasi Pendidikan, Sukardi menyatakan bahwa ada 3 faktor
yang dapat mempengaruhi hasil tes evaluasi sehingga menjadi tidak valid. 3 faktor
tersebut adalah faktor eksternal tes, faktor internal tes dan faktor yang berasal dari objek
tes atau peserta didik yang bersangkutan.
a. Faktor internal tes
Faktor internal tes juga disebut sebagai faktor yang berasal dari dalam tes, faktor
internal ini meliputi;
1) Petunjuk atau pedoman pengerjaan tes yang tidak jelas atau memiliki makna
yang ambigu sehingga mengurangi validitas tes.
2) Penggunaan diksi dalam penyusunan struktur instrumen evaluasi yang terlalu
sulit dipahami.
3) Penyusunan item soal yang di susun dengan jelek.
4) Tingkat kesulitan tes yang tidak sesuai dengan tujuan pembelajaran atau
materinya.
5) Alokasi waktu pengerjaan yang tidak tepat.
6) Jawaban atas soal yang diberikan dapat di tebak dengan mudah oleh peserta
didik.
b. Faktor eksternal tes
1) Peserta didik tidak dapat menyelesaikan tes sesuai dengan alokasi waktu yang
diberikan.
2) Penggunaan teknik penilaian atau pemberian skor yang tidak konsisten.
3) Terdapat pihak luar yang memberikan bocoran kunci jawaban kepada peserta
didik.
c. Faktor yang berasal dari objek tes
9
Faktor yang berasal dari objek tes dapat disebabkan oleh adanya gangguan
psikologis yang dialami oleh peserta didik atau juga bisa disebabkan karena suasana
dan kondisi lingkungan kelas yang tidak kondusif dan tidak nyaman sehingga
menyebabkan peserta didik tidak dapat berkonsentrasi mengerjakan tes.
No Nama Peserta
X Y
. Didik x y x^2 y^2 xy
1 Angga 6,5 6,3 0 -0,08 0 0,0064 0
2 Maya 7 6,8 0,5 0,42 0,25 0,1764 0,21
3 Anisa 7,5 7,2 1 0,82 1 0,6724 0,82
4 Angga 7 6,8 0,5 0,42 0,25 0,1764 0,21
5 Rana 6 7 -0,5 0,62 0,25 0,3844 -0,31
6 Rina 6 6,2 -0,5 -0,18 0,25 0,0324 0,09
7 Meyli 5,5 5,1 -1 -1,28 1 1,6384 1,28
8 Zidan 6,5 6 0 -0,38 0 0,1444 0
9 Syalfa 7 6,5 0,5 0,12 0,25 0,0144 0,06
10 Hanna 6 5,9 -0,5 -0,48 0,25 0,2304 0,24
Jumlah 65 63,8 3,5 3,476 2,6
10
x́=
∑ X = 65 =6,5
n 10
ý=
∑ y = 63,8 =6,38=6,4(dibulatkan)
n 10
r xy =
∑ xy
√( ∑ x 2 )( ∑ y 2 )
2,6 2,6 2,6
r xy = = = =0,745
√ ( 3,5 )( 3,476 ) √ 12,166 3,487
Menurut Arikunto (2012) untuk menafsirkan koefisien korelasi dapat menggunakan
kriteria dibawah ini.
0.81-1.00 = sangat tinggi
0.61-0.80 = tinggi
0.41-0.60 = cukup
0.21-0.40 = rendah
0.00-0.20 = sangat rendah
Berdasarkan hasil perhitungan diatas diperoleh angka sebesar 0.745 yang berada di
antara 0.61-0.80 yang berarti tingkat koefisien korelasi nya tinggi, maka tes hasil
belajar peserta didik tergolong valid.
Keterangan:
r xy =¿ koefisien korelasi antara variable X dan variabel Y, 2 variabel yang
dikorelasikan.
Contoh:
Terdapat 10 peserta didik dari kelas XII SMA yang memperoleh nilai pada pelajaran
Matematika dan Akuntansi sebagai berikut;
Table I
11
No Nama Peserta
x y
. Didik
1 Angga 5 6
2 Maya 7 8
3 Anisa 8 7
4 Angga 5 5
5 Rana 6 7
6 Rina 7 7
7 Meyli 4 5
8 Zidan 5 7
9 Syalfa 8 8
10 Hanna 6 6
Jumlah 61 66
Dengan menggunakan rumus korelasi product moment dengan angka kasar, maka
harus dicari dulu nilai x dan y kuadrat serta x di kali y, seperti yang ditunjukkan pada
tabel 2 dibawah ini.
Tabel 2
No Nama Peserta
x y
. Didik x^2 y^2 Xy
1 Angga 5 6 25 36 30
2 Maya 7 8 49 64 56
3 Anisa 8 7 64 49 56
4 Angga 5 5 25 25 25
5 Rana 6 7 36 49 42
6 Rina 7 7 49 49 49
7 Meyli 4 5 16 25 20
8 Zidan 5 7 25 49 35
9 Syalfa 8 8 64 64 64
10 Hanna 6 6 36 36 36
Jumlah 61 66 389 446 413
N ∑ xy−( ∑ X )( ∑ Y )
r xy =
2 2
√( N ∑ X −(∑ x ) )( N ∑ X −(∑ x ) )
2 2
(10 ) {413− ( 61 )( 66 ) }
r xy =
√ {( 10 ) ( 389 )−( 61 )2 }{( 10 ) ( 446 )−( 66 )2 }
4130−4020 104
r xy = = =0.784
√ ( 3890−3721 ) ( 4460−4356 ) √ 17576
12
Menurut Arikunto (2012) untuk menafsirkan koefisien korelasi dapat menggunakan
kriteria dibawah ini.
0.81-1.00 = sangat tinggi
0.61-0.80 = tinggi
0.41-0.60 = cukup
0.21-0.40 = rendah
0.00-0.20 = sangat rendah
Berdasarkan hasil perhitungan diatas diperoleh angka sebesar 0.784 yang berada di
antara 0.61-0.80 yang berarti tingkat koefisien korelasi nya tinggi, maka tes hasil
belajar peserta didik tergolong valid.
13
masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang
terjadi dapat dikatakan tidak berati.
Jenis-jenis Pengujian Reliabilitas
Dalam pengujiannya tes reliabilitas memiliki beberapa jenis pengujian, yaitu sebagai
berikut:
14
l) Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan
dengan teknik pengukuran (Sukardi, 2008).
Rumus KR-20
k = banyak item
Rumus KR-21
Keterangan
15
obyektif tersebut. Dengan demikian, penerapan formula Spearman-Brown akan
menghasilkan dua buah distribusi skor belahan pertama drngan distribusi skor belahan
keduan itu dipandang sebagai reabilitas bagian butir-butir soal tes hasil belajar bentuk
obyektif tersebut. Berikut adalah Langkah-langkah pengujian reliabilitas
menggunakan tes belah dua:
a. Lakukan pengetesan item-item yang telah dibuat pada subjek sasaran
b. Bagi tets yang ada menjadi dua jumlah dasar item yang paling umum dengan
membagi item dengan nomor gajil dan genap pada kelompok tersebut
c. Hitung skor subyek pada kedua belah kelompok penerima item yang genap dn
item ganjil
d. korelasikan kedua skor tersebut, mengunakan formula korelasi yang relevan
dengan teknuk pengukuran
sedangkan untuk mengetahui reabilitas tes secara keseluruhan Spearman-Brown
menciptakan formula sebagai berikut:
Rtt = 2. Rhh
1+ rhh
Keterangan:
Rtt = Koefisien reabilitas tes secara total (tt = total tes)
rhh = Koefisien korelasi product moment antara separoh (bagian pertama) tes,
dengan separuh (bagian kedua) dari tes tersebut (hh = half-half)
1&2 = Bilangan Konstantan
Metode ini didasarkan pada konsistensi respons terhadap semua butir soal
dalam tes. Konsistensi antar soal ini dipengaruhi oleh dua sumber varians
kesalahan:
16
Dari berbagai rumus yang diturunkan dalam artikel aslinya, rumus yang paling
luas diterapkan, umumnya dikenal sebagai “rumus 20 Kuder-Richardson”, adalah
sebagai berikut:
Rumus KR-20
k = banyak item
Reliabilitas pemberi skor dapat ditentukan dengan memiliki sampel lembaran tes yang
diskor secara terpisah oleh dua penguji. Dengan demikian dua skor yang didapatkan
oleh masing-masing peserta tes ini kemudian dikorelasikan dengan cara biasa, dan
koefisien korelasi yang dihasilkannya adalah ukuran reliabilitas pemberi skor. Jenis
reliabilitas ini umumnya dihitung ketika instrumen-instrumen yang diskor secara
subjektif digunakan dalam riset.
17
Semakin panjang tes atau semakin banyak jumlah butir soal yang disajikan
dalam soal, maka akan semakin banyak jumlah item materi pembelajaran yang
perlu diukur. Hal ini menunjukkan dua kemungkinan, pertama tes yang
dilakuakan akan semakin mendekati kebenaran oleh peserta didik, dan yang kedua
adalah dalam tes peserta didik akan semakin kecil dalam menebak jawaban yang
menunjukkan semakin tinggi koefisien reliabilitas.
2. Penyebaran Skor
Secara langsung penyebaran skor korfisien reliabilitas akan dipengaruhi oleh
bentuk sebaran skor dalam kelompok peserta didik yang diukur. Semakin tinggi
sebaran maka akan semakin tinggi pula estimasi koefisien reliabilitas
3. Kesulitan Tes
Soal tes yang dibuat jika terlalu mudah atau terlalu sulit untuk dikerjakan oleh
peserta didik maka akan cenderung menghasilakan reliabilitas rendah. Hal
tersebut akan membuat sebaran skor yang cenderung terbatas. Untuk soal yang
terlalu mudah skor jawaban peserta didik akan mengumpul ada sisi atas, untuk tes
terlalu sulit skor jawaban siswa akan cenderung mengumpul pada ujung bawah.
Dua kejadian tersebut mempunyai kesamaan yaitu bahwa perbedaan di antara
individu adalah kecil dan cenderung tidak relevan.
4. Objektivitas
Yang dimaksud dengan objekif yaitu derajat dimana siswa dengan kompetensi
sama mencapai hasil sama. Ketika prosedur test evaluasi memiliki objektivitas
tinggi, maka reliabilitas test tidak dipengaruhi oleh prosedur teknik penskoran.
Item test objektif yang dihasilkan tidak dipengaruhi pertimbangan atau opini
seorang evaluator.
2.7 Cara Uji Reliabilitas Suatu Tes
1. Menggunakan rumus KR-20
Rumus
Dimana :
18
p = proporsi subjek menjawab dengan benar
n = banyaknya item
Dalam buku-buku lain n (n kecil) ini sering diganti dengan huruf k (k kecil), yang
juga melambangkan banyaknya item. Demikian juga huruf S sebagai lambang standar
deviasi, ditulaskan SB sebagai singkatan dari kata “simpangan Baku”. Maka rumus
K-R. 20 menjadi :
Penggunaan huruf k ini juga berlaku bagi rumus-rumus lain yang melibatkan
banyaknya item tes, misalnya K-R.21 dan rumus alpha.
Untuk memberikan contoh perhitungan mencari reliabilitas yang menggunakan rumus
K-R.20 ini akan dibuatkan table analisis item yang lain.
19
Dimasukan ke dalam rumus K-R.20
1,85−1,31
= 1,17x s dapat dicari dengan menarik akar varians
1,85
0,54
= 1, 17x s = 1,36 (dicari dengan kalkulator)
1,85
Jika dibandingkan reliabilitas yang dihitung dengan K-R. 20 dan K-R. 21, maka hasil
perhitungan dengan rumus KR-20 lebih besar namun membutuhkan pekerjaan
perhitungan yang lebih rumit.
20
Suatu butir soal urain menghendaki gradualisasi penilaian. Barangkali butir soal
nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi
hanya 5, dan butir soal nomor 3 sampai 10 dan sebagainya.
Untuk keperluan reliabilitas saol keseluruhan perlu juga dilakukan analisis butir soal
seperti halnya soal bentuk objektif. Skor untuk masing-masing butir soal dicantumkan
pada kolom item menurut apa adanya. Rumus yang digunakan adalah rumus Alpha
sebabgai berikut :
n ∑ σ 2i
r11 = ( )(
n−1
1− 2
σt )
Dimana :
σ 2t =varians total
Kuadrat
Skor
Nomor Item skor
NO Nama Total
total
1 2 3 4 5 6
1 A 10 6 8 8 10 10 52 2704
2 B 6 4 4 6 6 5 31 961
3 C 8 2 6 8 7 8 39 1521
4 D 7 3 7 7 6 6 36 1296
5 E 0 5 3 2 4 4 18 324
6 F 2 4 2 8 6 8 30 900
7 G 4 3 6 6 6 6 31 961
8 H 5 5 5 7 7 7 36 1296
9 I 5 5 4 6 8 5 33 1089
10 J 3 6 3 4 6 6 28 784
Jumlah 50 43 48 62 66 65 334 11836
Jumlah Kuadrat 328 201 264 418 458 451 2120
21
2120 = jumlah dari jumlah kuadrat setiap skor
Dengan data yang tertera dalam table, dicari varians tiap-tiap item dahulu,
baru dijumlahkan
Perlu diingat kembali rumus varians yang sudah kita kenal, yaitu :
(∑ X ) 2
2 ∑ X 2− ∑ X 2t ( ∑ X t ) 2
σ = N atau σt = −
N N
N
502 328−250 78
328−
σ2(1) = 10 = = =7,8
10 10
10
432
2 201−
σ (2) = 10 201−184,9 16,1
= = =1,61
10 10 10
482
264−
σ2(3) = 10 264−230,4 33,6
= = =3,36
10 10 10
622
2 418−
σ (4) = 10 418−435,6 33,6
= = =3,36
10 10 10
66
451−
2
σ (5) = 10 458−435,6 22,4
= = =2,24
10 10 10
65 2
458−
σ2(6) = 10 451−422,5 28,5
= = =2,85
10 10 10
334 2
11836−
Varians total = 10
10
22
11836−11155,6
=
10
680,4
=
10
= 68,04
6
r11 = x¿ )
6−1
6
= x ¿ 1-0,312)
5
6
= x 0,688
5
Dengan diperolehnya koefisien korelasi, yakni r11 sebenarnya baru diketahui tinggi
rendahnya koefisien tersebut.Laebih sempurnanya perhitungan reliabilitas sampai
pada kesimpulan, sebaiknya hasil dtersebut dikonsultasikan dengan table r product
moment.
23
BAB III
PENUTUP
3.1 Kesimpulan
Menurut Anas Sudijono (2006) evaluasi dikatakan baik jika memenuhi 4
karakteristik yaitu validitas, reliabilitas, objektif dan praktis.
Validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes.
Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes
memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti
memiliki kesejajaran antara tes dan kriteria. Terdapat tiga jenis validitas diantaranya;
1. Validitas Isi: Validitas isi tes lebih mengarah kepada kedalaman tes, yang
merupakan soal-soal, dilihat dari isinya mengandung sesuatu yang memang
harus diukur.
2. Validitas Konstruk: Validitas konstruk mengandung arti bahwa suatu alat ukur
dikatakan valid apabila telah cocok dengan kontruksi teoritik di mana tes itu
dibuat.
3. Validitas Berdasarkan Kriteria: Validitas tes itu dilihat dari besarnya hasil
pengukuran dengan alat yang dipersoalkan itu sama atau mirip dengan hasil
pengukuran alat lain yang dijadikan kriteria. Terbagi menjadi dua yaitu validitas
prediksi dan validitas konkruen.
Menurut Sukardi terdapat 3 faktor yang menyebabkan hasil tes evaluasi
menjadi tidak valid. Yaitu faktor eksternal tes, faktor internal tes dan faktor yang
berasal dari objek tes atau peserta didik yang bersangkutan. Menurut Suharsimi
Arikunto (2012) untuk menguji validasi suatu tes dapat diketahui dengan
menggunakan 2 rumus, yaitu korelasi product moment dengan simpangan dan
korelasi product moment dengan angka besar.
Terdapat banyak factor yang dapat mempengaruhi reliabilitas sebagai suatu
instrument atau tes, diantaranya sebagai berikut;
1. Panjang Tes: Semakin panjang tes maka akan semakin banyak jumlah item
materi pembelajaran yang perlu diukur.
2. Penyebaran Skor: Semakin tinggi sebaran maka akan semakin tinggi pula
estimasi koefisien reliabilitas
24
3. Kesulitan Tes: Soal tes yang dibuat jika terlalu mudah atau terlalu sulit untuk
dikerjakan oleh peserta didik maka akan cenderung menghasilkan reliabilitas
rendah.
4. Objektivitas: Yang dimaksud dengan objektif yaitu derajat dimana siswa
dengan kompetensi sama mencapai hasil sama.
Menurut Ellen, suatu tes dikatakan reliabel jika skor observasi nilai awal
berhubungan dengan skor yang sebenarnya. Sedangkan menurut (Rbel, 1986:71)
suatu tes dikatakan reliabel jika syarat-syarat yang digunakan untuk menggambarkan
salah satu sifat yang paling signifikan dari satu nilai uji dengan cara yang konsisten.
Jadi dapat disimpulkan dari beberapa pendapat para ahli diatas bahwa reliabilitas
adalah jika skor observasi atau nilai responden (peserta didik) menghasilkan hasil
yang konsisten (tetap).
Dalam reliabilitas tes terdapat beberapa jenis pengujian, yaitu sebagai berikut:
1. Pengujian reliabilitas dengan tes re-test
2. Pengujian reliabilitas dengan Teknik belah dua
3. Pengujian reliabilitas dengan rumus Kuder-Richardson dan Koefisien Alpha
4. Pengujian reliabilitas dengan pemberi skor
3.2 Saran
Penulis menyadari bahwa dalam makalah ini masih memiliki banyak
kekurangan, baik itu dalam penulisan, kerapian penyajian materi, dan lain-lain. Oleh
karena itu, kritik dan saran dari pembaca sangat dibutuhkan agar dalam penulisan
selanjutnya penulis bisa menyajikan makalah lebih baik dari pada makalah sekarang
ini. Makalah ini kami sajikan sebaik mungkin agar pembaca bisa memperoleh ilmu
dari makalah yang kami sajikan. Semoga makalah ini berguna bagi kita semua.
Terima kasih.
25
DAFTAR PUSTAKA
Arikunto, S. 1998. Prosedur Penelitian: Suatu Pendekatan Praktek. Edisi Revisi IV. Jakarta:
Penebit Rineka Cipta
Arikunto, Suharsimi. 2013. Dasar-dasar Evaluasi Pendidikan. Edisi 3. Jakarta: Bumi Aksara.
Pratmasari. sisqa. 2017. Ciri-Ciri Tes Hasil Belajar yang Baik dan Prinsip-Prinsip Dasar
Dalam Penyusunan Tes hasil Belajar
(http://pratmasari.blogspot.com/2017/12/normal-0-false-false-false-en-us-x-
none.html), diakses 3 Mei 2021.
Syarif, E. A., & Syamsurizal, S. (2019). Analyzed Quality of Senior High School Biology
Olympiad Questions at West Sumatera, Riau, Jambi, and Bengkulu in 2018.
Bioeducation Journal, 3(2), 142–150
H.M Sukardi, EVALUASI PENDIDIKAN Prinsip & Operasionalnya, Jakarta, PT Bumi
Aksara, 2008.
Kadir, A. (2015). Menyusun dan menganalisis tes hasil belajar. Al-TA'DIB: Jurnal Kajian
Ilmu Kependidikan, 8(2), 70-81.
26
Khafidin, Z. (2014). Analisis Validitas dan Reliabilitas tes Mata Pelajaran Pendidikan Agama
Islam tingkat SMA. Edukasia: Jurnal Penelitian Pendidikan Islam, 9(2).
27