Anda di halaman 1dari 28

MAKALAH

VALIDITAS DAN RELIABILITAS TES HASIL BELAJAR

Ditujukan untuk memenuhi salah satu tugas mata kuliah Evaluasi Pendidikan
yang diampu oleh :
Dr. Endang Sri Andayani, S.E., M.Si., Ak

Disusun Oleh Kelompok 5 Offering E :

1. Achmad Rifal Turmuji (190421628842)


2. Ali Fausan Tanal (190421628824)
3. Anisa Fitri Amalia (190421628802)

S1 PENDIDIKAN AKUNTANSI
FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS NEGERI MALANG
MEI 2021
KATA PENGANTAR

Rasa syukur yang dalam kami sampaikan kehadirat Allah SWT, karena berkat
rahmat-Nya makalah ini dapat kami selesaikan sesuai dengan yang diharapkan. Kami juga
bersyukur atas rizky dan kesehatan yang telah diberikan oleh-Nya sehingga kami dapat
menyusun makalah yang “Validitas dan Reliabilitas Tes Hasil Belajar”.

Makalah ini disusun untuk diajukan sebagai salah satu tugas mata kuliah Evaluasi
Pendidikan. Kami mengakui bahwa dalam menyusun makalah ini tidak dapat diselesaikan
tanpa adanya bantuan dari berbagai pihak. Pada kesempatan ini, kami mengucapkan terima
kasih kepada:

1. Ibu Dr. Endang Sri Andayani, SE, M.Sc., Ak. selaku dosen mata kuliah Evaluasi
Pendidikan.

2. Rekan-rekan dan keluarga.

Kami menyadari masih banyak kekurangan yang terdapat dalam makalah ini. Untuk
itu penulis sangat mengharapkan adanya kritik dan saran dari semua pihak. Semoga makalah
ini memberikan informasi bagi pembaca dan bermanfaat untuk pengembangan ilmu
pengetahuan bagi kita semua.

Malang, 4 Mei 2021

Penyusun

1
DAFTAR ISI

HALAMAN JUDUL
KATA PENGANTAR..............................................................................................1
DAFTAR ISI.............................................................................................................2

BAB I PENDAHULUAN
1.1 Latar Belakang..................................................................................................3

1.2 Rumusan Masalah.............................................................................................3

1.3 Tujuan Penulisan..............................................................................................4

BAB II PEMBAHASAN
2.1 Karakteristik Tes Hasil Belajar..........................................................................5
2.2 Pengertian Validitas Tes....................................................................................7
2.3 Faktor yang Mempengaruhi Validitas 9
2.4 Cara Uji Validitas Suatu Tes 10
2.5 Pengertian Reliabilitas Tes 13
2.6 Faktor yang Mempengaruhi Reliabilitas 18
2.7 Cara Uji Reliabilitas Suatu Tes 18

BAB III PENUTUP


3.1 Kesimpulan........................................................................................................24
3.2 Saran..................................................................................................................25

DAFTAR PUSTAKA...............................................................................................26

2
BAB I

PENDAHULUAN

A. Latar Belakang
Bidang pendidikan tidak akan terlepas dari evaluasi, baik pada tingkat pendidikan
terendah hingga tingkat pendidikan yang tertinggi sekalipun. Adanya peran evaluasi
dalam dunia pendidikan dapat meningkatkan kualitas sumber daya manusia suatu negara
karena dengan adanya evaluasi kemampuan peserta didik dapat diukur dan diketahui
melalui tes hasil belajar peserta didik. Tanpa adanya evaluasi, kemampuan peserta didik
yang sesungguhnya tidak dapat diukur dan diketahui. Padahal informasi terkait
kemampuan peserta didik perlu diketahui guna mewujudkan adanya peserta didik
sebagai generasi yang berguna bagi nusa dan bangsa karena memiliki tingkat kualitas
sumber daya manusia yang tinggi.
Melalui evaluasi dapat diketahui apakah pendidikan dalam waktu tertentu yang telah
dilalui setiap peserta didik berhasil atau tidak, baik atau buruk, dan lulus atau tidak lulus.
Adanya evaluasi sebagai alat untuk mengetahui seberapa jauh peserta didik mampu
menguasai materi. Hal ini dapat diketahui dari hasil evaluasi. Namun, tidak semua hasil
evaluasi layak untuk dijadikan acuan dalam pengambilan keputusan dalam pendidikan
karena hasil evaluasi itu bisa saja belum sesuai dengan maksud dan tujuan yang telah
direncanakan, sehingga menyebabkan adanya ketidaksesuaian dalam proses dan hasil
yang diharapkan. Untuk itu suatu evaluasi harus direncanakan dan dilakukan sebaik
mungkin agar proses dan hasil pengujian yang dilakukan kepada peserta didik
menyatakan hasil yang sebenarnya. Evaluasi yang baik memiliki validitas dan reliabilitas
yang tinggi. Oleh karena itu, penulis penyusun makalah yang “Validitas dan Reliabilitas
Tes Hasil Belajar” untuk menambah wawasan pembaca terkait dengan pengetahuan
tentang validitas dan reliabilitas suatu tes hasil belajar peserta didik.

B. Rumusan Masalah
1. Bagaimana karakteristik tes hasil belajar dengan baik?
2. Apakah yang dimaksud dengan Validitas tes hasil belajar?
3. Apa saja faktor yang mempengaruhi validitas tes hasil belajar?
4. Apakah yang dimaksud dengan Reliabilitas tes hasil belajar?
5. Apa saja faktor yang mempengaruhi Reliabilitas tes hasil belajar ?

3
6. Bagaimana cara menguji validitas dan reliabilitas suatu tes?

C. Tujuan
1. Untuk mengetahui karakteristik tes hasil belajar yang baik
2. Untuk mengetahui yang dimaksud dengan Validitas tes hasil belajar
3. Untuk mengetahui faktor yang mempengaruhi validitas tes hasil belajar
4. Untuk mengetahui yang dimaksud dengan Reliabilitas tes hasil belajar
5. Untuk mengetahui faktor yang mempengaruhi Reliabilitas tes hasil belajar
6. Untuk mengetahui uji validitas dan reliabilitas suatu tes

4
BAB II

PEMBAHASAN

2.1 Karakteristik Tes Hasil Belajar


Berdasarkan penyataan Anas Sudijono (2006) hasil belajar peserta didik dapat
diketahui jika diukur dengan alat pengukur yang baik. Anas Sudijono (2006) menyatakan
bahwa suatu tes hasil belajar dikatakan baik jika memenuhi karakteristik tertentu.
Karakteristik tersebut yaitu;
a. Validitas
Suatu tes dapat memiliki validitas jika tes tersebut dengan tepat mengukur apa
yang ingin diukur. Dengan kata lain, tes tersebut disiapkan sebagai alat ukur yang
dapat mengukur kemampuan peserta didik apakah peserta didik telah mencapai tujuan
pembelajaran yang telah ditetapkan sebelumnya. Dikatakan valid jika tes hasil belajar
peserta didik dibuat secara tepat, benar dan mengukur apa yang seharusnya diukur.
b. Reliabilitas
Suatu tes dikatakan memiliki reliabilitas jika tes hasil belajar tersebut andal dan
dapat dipercaya. Ngalim Purwanto mengatakan bahwa tes yang andal (reliability)
adalah tes hasil belajar yang dapat dipercaya, konsisten dan stabil. Sama halnya
dengan pernyataan Ismail (2015), reliabilitas berarti suatu kemantapan (consistency)
dan keajegan (stability). Suatu tes hasil belajar dikatakan baik jika pengukuran yang
dilakukan secara berulang dengan menggunakan tes atau alat ukur yang sama pada
peserta didik yang sama menunjukkan hasil yang tetap sama dan sifatnya stabil. Yang
dimaksud dengan stabil disini adalah peserta didik memiliki posisi urutan rangking
yang tetap meskipun ada perubahan sedikit, perubahan ini dianggap tidak berarti. Jadi
yang ditekankan adalah posisi urutan nilai atau rankingnya bukan pada nilai yang
diperoleh karena nilai pada hasil tes kedua bisa saja mengalami kenaikan disebabkan
peserta didik memiliki pengelaman yang sama waktu mengerjakan tes pertama.
Contoh tabel nilai tes pertama dan kedua;

Nama Nilai Tes Nilai Tes


Siswa Pertama Kedua
Aisya 5.5 6.6
Hazel 6 7
Angga 8 9
Nila 5 6
Sari 6 7

5
Maya 7 8
Tabel diatas menunjukkan nilai hasil tes pertama dan kedua yang diperoleh oleh
peserta didik yang mana nilai peserta didik mengalami kenaikan tetapi posisi
rankingnya tetap. Ini menunjukkan bahwa alat ukur atau tes yang digunakan sudah
reliable atau dapat dipercaya.

c. Objektif
Dikatakan objektif jika tes hasil belajar disusun dan dilaksanakan apa adanya. Tes
hasil belajar yang objektif akan disusun berdasarkan materi dan bahan ajar yang
diajarkan. Dalam penilaian terhadap tes hasil belajar juga dilakukan secara objektif
tanpa adanya unsur subjektif. Menurut Ngabidin (2013) objektivitas menekankan
pada ketetapan (consistency) dalam sistem penilaian yang objektif, sedangkan
reliabilitas menekankan ketetapan pada hasil tes. Sidijono (2006) mengatakan bahwa
tes yang objektif adalah tes yang dilakukan apa adanya. Jika dilihat dari segi isi atau
materi yang menjadi acuan pembuatan tes, maka yang dimaksud dengan apa adanya
adalah tes tersebut dibuat sesuai dengan materi atau bahan pelajaran yang telah
diajarkan kepada peserta didik yang telah disesuaikan dengan tujuan pembelajaran.
Jika dilihat dari segi penilaian atau pemberian skor atas tes hasil belajar peserta didik,
maka yang dimaksud dengan apa adanya adalah penilaian harus dilakukan secara
objektif dan terhindar dari subyektivitas. Misalnya memberikan pengurangan nilai
pada peserta didik yang memiliki tulisan tangan yang jelek tapi.
d. Praktis
Menurut Sudijono (2006) tes hasil belajar dikatakan praktis jika tes tersebut
dilaksanakan dengan mudah karena sifatnya yang sederhana, dengan kata lain untuk
melaksanakan tes tersebut peserta didik tidak memerlukan peralatan uang banyak dan
sulit didapatkan. Praktis disini juga mencangkup kelengkapan tes yang meliputi
lengkapnya petunjuk cara mengerjakan tes, kunci jawaban yang dirahasiakan dari
peserta didik, serta tidak memerlukan waktu yang lama, tenaga dan biaya yang besar
untuk melaksanakan tes tersebut. Arikunto (2003) juga menyatakan hal yang sama,
bahwa tes yang praktis adalah tes yang udah dilaksanakan, mudah pemeriksaannya
karena memiliki kunci jawaban ataupun pedoman penilaian, adanya petunjuk yang
jelas baik petunjuk mengerjakan ataupun petunjuk bagi pengawas ketika peserta didik
melaksanakan tes tersebut. Dan ekonomis yang berarti pelaksanaan tes hasil belajar
tidak memakan waktu, tenaga dan biaya yang banyak.

6
2.2 Pengertian Validitas Tes
Validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes. Suatu
tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki
validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran
antara tes dan kriteria (Arikunto, 1999: 65). Singkatnya dapat kita ketahui bahwa validitas
tes itu merupakan instrument yang digunakan untuk mengukur suatu tes. Untuk menguji
validitas setiap butir soal maka skor-skor yang ada pada butir yang dimaksud
dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatakan skor X dan skor total
dinyatakan sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat
diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks validitasnya
(Arikunto, 1999: 78). Untuk menguji validitas instrumen digunakan rumus korelasi
product moment seperti pada gambar berikut;

dengan rxy merupakan koefisien korelasi antara variabel X dan variabel Y, sedangkan N
merupakan jumlah siswa uji coba, X adalah skor-skor tiap butir soal untuk setiap individu
atau siswa uji coba, dan Y adalah skor total tiap siswa uji coba.
Validitas tes atau juga dikenal dengan istilah validitas alat ukur secara umum
memiliki makna bahwa “sejauh mana tes itu mengukur apa yang dimaksudkan untuk
diukur”. Dengan demikian, validitas tes pada dasarnya telah merujuk pada derajat fungsi
pengukuran suatu tes, atau derajat kemampuan/kecermatan ukurnya suatu tes. Dalam
mengkaji validitas tes atau validitas alat ukur adalah sejauh mana alat ukur itu mampu
mengukur apa yang dimaksudkan untuk diukur. Secara umum validasi tes dapat dipandang
dari tiga arah yakni isi yang di ukur, rekaan teoritis atribut yang diukur, dan kriteria yang
diukur, ketiga hal tersebut secara langsung menjadi jenis-jenis dari validitas tes yang akan
kami jelaskan lebih terperinci sebagai berikut;
1. Validitas Isi
Validitas isi atau yang sering juga disebut validitas kurikulum merupakan
suatu alat ukur yang dipandang valid apabila sesuai dengan isi kurikulum yang
hendak diukur (Syarif & Syamsurizal, 2019). Validitas isi tes lebih mengarah
kepada kedalaman tes, yang merupakan soal-soal, dilihat dari isinya mengandung
sesuatu yang memang harus diukur. Salah satu cara yang dapat dilakukan untuk

7
mengukur validitas adalah dengan mengkaji isi tes itu. Sebuah tes dikatakan
memiliki isi jika pengukuran sesuai dengan domain dan tujuan khusus tertentu
yang sama dengan isi pelajaran yang telah dipeajari di kelas. Jadi ketika kita
hendak mengukur kemampuan peserta didik, maka kita harus mengukur terlebih
dahulu atribut atau karakteristik apa yang berkaitan dengan hal yang ingin diukur
dari peserta didik. Misalnya, sebuah tes dirancang untuk mengukur kemampuan
peserta didik dalam menguasai materi rekonsiliasi fiscal pada mata pelajaran
akuntansi perpajakan, maka atribut atau karakteristik khusus yang harus diukur
adalah berkaitan dengan pemahaman peserta didik mengenai konsep rekonsiliasi,
kemampuan menghitung peserta didik, kemampuan menjurnal transaksi, dan lain-
lain.
2. Validitas Konstruk
Validitas konstruk mengandung arti bahwa suatu alat ukur dikatakan valid
apabila telah cocok dengan kontruksi teoritik di mana tes itu dibuat. Sebuah tes
dikatakan memiliki validitas konstruksi apabila soal-soalnya mengukur setiap
aspek berpikir seperti yang diuraikan dalam standar kompetensi, kompetensi dasar,
maupun indikator yang terdapat dalam kurikulum. Konstuksi yang dimaksud pada
validitas ini bukanlah merupakan konstruksi seperti bangunan atau susunan, tetapi
berupa rekaan psikologis yang berkaitan dengan aspek-aspek ingatan, pemahaman,
aplikasi, analisis, sintesis, dan evaluasi.
3. Validitas Berdasarkan Kriteria
Dalam validitas berdasar kriteria, validitas tes itu dilihat dari besarnya hasil
pengukuran dengan alat yang dipersoalkan itu sama atau mirip dengan hasil
pengukuran alat lain yang dijadikan kriteria. Kriteria itu umumnya adalah hasil
pengukuran atribut yang sama dengan alat lain yang diakui merupakan alat ukur
yang baik (memenuhi persyaratan akademik dan profesional tertentu). Validitas ini
dibedakan menjadi dua macam, yaitu;
a) Validitas prediksi: menunjukkan kepada hubungan antara tes skor yang
diperoleh peserta didik dengan keadaan yang akan terjadi diwaktu yang akan
datang. Sebuah tes dikatakan memiliki validitas prediksi apabila mempunyai
kemampuan untuk memprediksikan apa yang akan terjadi di masa yang akan
datang. Misalnya, peserta didik lulusan SMA mengikuti seleksi masuk
perguruan tinngi dan memperoleh nilai tes yang bagus sehingga dia diterima
dan diperkirakan akan berhasil dan semakin berkembang di perguruan tinggi

8
tersebut, jika hal ini benar terjadi maka tes masuk perguruan tinggi tersebut
dikatakan memiliki validitas yang bagus. Sebaliknya, apabila peserta didik
tidak mengalami perkembangan di perguruan tinggi tempat ia lulus, maka tes
seleksi yang sebelumnya dilakukan itu tidak memiliki validitas yang bagus.
b) Validitas konkruen: menunjuk pada hubungan antara tes skor yang dicapai
dengan keadaan sekarang. Validitas ini dikenal sebagai validitas empiris.
Sebuah tes dikatakan memiliki concurent validity apabila hasilnya sesuai
dengan pengalaman atau hal yang sudah dipelajari.
2.3 Faktor yang Mempengaruhi Validitas Suatu Tes
Dalam buku Pengantar Evaluasi Pendidikan, Sukardi menyatakan bahwa ada 3 faktor
yang dapat mempengaruhi hasil tes evaluasi sehingga menjadi tidak valid. 3 faktor
tersebut adalah faktor eksternal tes, faktor internal tes dan faktor yang berasal dari objek
tes atau peserta didik yang bersangkutan.
a. Faktor internal tes
Faktor internal tes juga disebut sebagai faktor yang berasal dari dalam tes, faktor
internal ini meliputi;
1) Petunjuk atau pedoman pengerjaan tes yang tidak jelas atau memiliki makna
yang ambigu sehingga mengurangi validitas tes.
2) Penggunaan diksi dalam penyusunan struktur instrumen evaluasi yang terlalu
sulit dipahami.
3) Penyusunan item soal yang di susun dengan jelek.
4) Tingkat kesulitan tes yang tidak sesuai dengan tujuan pembelajaran atau
materinya.
5) Alokasi waktu pengerjaan yang tidak tepat.
6) Jawaban atas soal yang diberikan dapat di tebak dengan mudah oleh peserta
didik.
b. Faktor eksternal tes
1) Peserta didik tidak dapat menyelesaikan tes sesuai dengan alokasi waktu yang
diberikan.
2) Penggunaan teknik penilaian atau pemberian skor yang tidak konsisten.
3) Terdapat pihak luar yang memberikan bocoran kunci jawaban kepada peserta
didik.
c. Faktor yang berasal dari objek tes

9
Faktor yang berasal dari objek tes dapat disebabkan oleh adanya gangguan
psikologis yang dialami oleh peserta didik atau juga bisa disebabkan karena suasana
dan kondisi lingkungan kelas yang tidak kondusif dan tidak nyaman sehingga
menyebabkan peserta didik tidak dapat berkonsentrasi mengerjakan tes.

2.4 Cara Uji Validitas Suatu Tes


Menurut Pearson untuk menguji validitas suatu tes dapat dilakukan dengan teknik
korelasi product moment. Menurut Suharsimi Arikunto (2012) dalam buku yang berjudul
Dasar-dasar Evaluasi Pendidikan terdapat 2 rumus korelasi product moment yaitu, korelasi
product moment dengan simpangan dan korelasi product moment dengan angka besar.
a. Korelasi product moment dengan simpangan
∑ xy
Rumus nya adalah r xy =
√( ∑ x 2 )( ∑ y 2 )
Keterangan;
rxy = koefisien korelasi antara variable X dan variabel Y, 2 variabel yang
dikorelasikan ( x= X− X́ ) dan ( y =Y −Ý )

∑ xy =¿Jumlah perkalian x dan y


∑ x 2=¿Jumlah kuadrat x
∑ y2 =¿Jumlah kuadrat y
Contoh:
Tabel korelasi product moment dengan simpangan

No Nama Peserta
X Y
. Didik x y x^2 y^2 xy
1 Angga 6,5 6,3 0 -0,08 0 0,0064 0
2 Maya 7 6,8 0,5 0,42 0,25 0,1764 0,21
3 Anisa 7,5 7,2 1 0,82 1 0,6724 0,82
4 Angga 7 6,8 0,5 0,42 0,25 0,1764 0,21
5 Rana 6 7 -0,5 0,62 0,25 0,3844 -0,31
6 Rina 6 6,2 -0,5 -0,18 0,25 0,0324 0,09
7 Meyli 5,5 5,1 -1 -1,28 1 1,6384 1,28
8 Zidan 6,5 6 0 -0,38 0 0,1444 0
9 Syalfa 7 6,5 0,5 0,12 0,25 0,0144 0,06
10 Hanna 6 5,9 -0,5 -0,48 0,25 0,2304 0,24
Jumlah 65 63,8     3,5 3,476 2,6

10
x́=
∑ X = 65 =6,5
n 10

ý=
∑ y = 63,8 =6,38=6,4(dibulatkan)
n 10

r xy =
∑ xy
√( ∑ x 2 )( ∑ y 2 )
2,6 2,6 2,6
r xy = = = =0,745
√ ( 3,5 )( 3,476 ) √ 12,166 3,487
Menurut Arikunto (2012) untuk menafsirkan koefisien korelasi dapat menggunakan
kriteria dibawah ini.
0.81-1.00 = sangat tinggi
0.61-0.80 = tinggi
0.41-0.60 = cukup
0.21-0.40 = rendah
0.00-0.20 = sangat rendah

Berdasarkan hasil perhitungan diatas diperoleh angka sebesar 0.745 yang berada di
antara 0.61-0.80 yang berarti tingkat koefisien korelasi nya tinggi, maka tes hasil
belajar peserta didik tergolong valid.

b. Korelasi product moment dengan angka kasar


N ∑ xy−( ∑ X )( ∑ Y )
r xy =
2 2
√( N ∑ X −(∑ x ) )( N ∑ X −(∑ x ) )
2 2

Keterangan:
r xy =¿ koefisien korelasi antara variable X dan variabel Y, 2 variabel yang
dikorelasikan.

Contoh:
Terdapat 10 peserta didik dari kelas XII SMA yang memperoleh nilai pada pelajaran
Matematika dan Akuntansi sebagai berikut;

Table I

11
No Nama Peserta
x y
. Didik
1 Angga 5 6
2 Maya 7 8
3 Anisa 8 7
4 Angga 5 5
5 Rana 6 7
6 Rina 7 7
7 Meyli 4 5
8 Zidan 5 7
9 Syalfa 8 8
10 Hanna 6 6
Jumlah 61 66

Dengan menggunakan rumus korelasi product moment dengan angka kasar, maka
harus dicari dulu nilai x dan y kuadrat serta x di kali y, seperti yang ditunjukkan pada
tabel 2 dibawah ini.
Tabel 2

No Nama Peserta
x y
. Didik x^2 y^2 Xy
1 Angga 5 6 25 36 30
2 Maya 7 8 49 64 56
3 Anisa 8 7 64 49 56
4 Angga 5 5 25 25 25
5 Rana 6 7 36 49 42
6 Rina 7 7 49 49 49
7 Meyli 4 5 16 25 20
8 Zidan 5 7 25 49 35
9 Syalfa 8 8 64 64 64
10 Hanna 6 6 36 36 36
Jumlah 61 66 389 446 413

N ∑ xy−( ∑ X )( ∑ Y )
r xy =
2 2
√( N ∑ X −(∑ x ) )( N ∑ X −(∑ x ) )
2 2

(10 ) {413− ( 61 )( 66 ) }
r xy =
√ {( 10 ) ( 389 )−( 61 )2 }{( 10 ) ( 446 )−( 66 )2 }
4130−4020 104
r xy = = =0.784
√ ( 3890−3721 ) ( 4460−4356 ) √ 17576

12
Menurut Arikunto (2012) untuk menafsirkan koefisien korelasi dapat menggunakan
kriteria dibawah ini.
0.81-1.00 = sangat tinggi
0.61-0.80 = tinggi
0.41-0.60 = cukup
0.21-0.40 = rendah
0.00-0.20 = sangat rendah

Berdasarkan hasil perhitungan diatas diperoleh angka sebesar 0.784 yang berada di
antara 0.61-0.80 yang berarti tingkat koefisien korelasi nya tinggi, maka tes hasil
belajar peserta didik tergolong valid.

2.5 Pengertian Reliabilitas Tes


Reliabilitas adalah sejauh mana hasil ujian peserta didik tetap atau konsisten dari
prosedur penilaian (Nitko, 2007). Menurut Ellen, suatu tes dikatakan reliabel jika skor
observasi nilai awal berhubungan dengan skor yang sebenarnya. Sedangkan menurut
(Rbel, 1986:71) suatu tes dikatakan reliabel jika syarat-syarat yang digunakan untuk
menggambarkan salah satu sifat yang paling signifikan dari satu nilai uji dengan cara yang
konsisten. Jadi dapat disimpulkan dari beberapa pendapat para ahli diatas bahwa
reliabilitas adalah jika skor observasi atau nilai responden (peserta didik) menghasilkan
hasil yang konsisten (tetap).
Reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes.
reliabilitas menunjukkan sejauh mana hasil pengukuran dengan alat tersebut dapat
dipercaya. Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi
dan kemantapan, hasil penilaian peserta didik sama jika:
a. Peserta didik menyelesaikan tugas yang sama pada waktu yang berbeda.
b. Dua atau lebih guru menandai kenerja peserta didik pada tugas yang sama.
c. Peserta didik menyelesaikan tugas yang berbeda pada waktu yang sama atau
pada waktu yang berbeda.
Dalam pelaksanaannya tes reliabilitas berhubungan dengan masalah kepercayaan.
Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat
memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan

13
masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang
terjadi dapat dikatakan tidak berati.
Jenis-jenis Pengujian Reliabilitas

Dalam pengujiannya tes reliabilitas memiliki beberapa jenis pengujian, yaitu sebagai
berikut:

1. Pengujian reliabilitas dengan test re-test


Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besar derajat skor tes
konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan
antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu
yang berbeda. Metode tes ulang dilakukan orang untuk menghindari penyusunan dua
seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu
seri tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali,
maka metode ini dapat disebut dengansingle-test-double-trial method. Kemudian hasil
dari kedua kali tes tersebut dihitung korelasinya.
Berikut adalah Langkah-langkah pengujian reliabilitas menggunakan tes re-test:
a) Selenggarakan tes pada suatu kelompok yang tepat sesuai dengan rencana.
b) Setelah selang waktu tertentu, misalnya satu minggu atau dua minggu, lakukan
kembali tes yang sama dengan kelompok yang sama tersebut.
c) Korelasikan kedua hasil tes tersebut.
d) Jika hasil koefisien menunjukkan tinggi, berarti reliabilias tes adalah bagus.
e) Jika korelasi rendah, berarti tes tersebut mempunyai konsistensi rendah (Sukardi,
2008).
f) Reliabilitas Bentuk Alternatif (Alternate-forms method (parallel forms).
g) Adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan
susunan, tetapi butir-butirnya berbeda. Arikunto (1997:)
h) Langkah-Langkah Reliabilitas Dengan Bentuk Belah Dua
i) Lakukan pengetesan item-item yang telah dibuat kepada subjek sasaran.
j) Bagi tes yang ada menjadi dua atas dasar dua item, yang paling umum dengan
membagi item dengan nomor ganjil dengan item dengan nomor genap pada
kelompok tersebut.
k) Hitung skor subjek pada kedua belah kelompok penerima item genap dan item
ganjil.

14
l) Korelasikan kedua skor tersebut, menggunakan formula korelasi yang relevan
dengan teknik pengukuran (Sukardi, 2008).

Reliabilitas ini diukur menggunakan Kuder-Richardson, biasanya Formula-20


(KR-20) atau Formula-21 (KR-21). Kedua rumus ini hanya dapat dipakai untuk tes
yang aitem-aitemnya diskor dikotomi, yaitu benar atau salah, 0 atau 1.

Rumus KR-20

R11 = reliabilitas instrumen

P = proposi subjek yang menjawab item dengan benar

q = proposi subjek yang menjawab item dengansalah (q=1- p)

pq = jumlah hasil perkalian antara p dan q

k = banyak item

s = standar deviasi dari tes

Rumus KR-21

Keterangan

R11 = reliabilitas instrumen

M = mean atau rerata skor total

2. Pengujian reliabilitas dengan teknik belah dua


Penentuan reabilitas tes hasil belajar bentuk obyektif dengan menggunakan formula
Spearman-Brown dikenal dengan istilah: teknik belah dua (split half technique).
Disebut “belah dua”, sebab dalam penentuan reabilitas tes, penganalisisannya
dilakukan dengan jalan membelah dua butir-butir soal tes menjadi dua bagian yang
sama, sehingga masing-masing testee memiliki dua macam skor. Salah satu skor
merupakan bagian pertama atau belahan pertama dari tes, sedangkan skor yang
satunya lagi merupakan bagian kedua atau belahan kedua dari tes hasil belajar bentuk

15
obyektif tersebut. Dengan demikian, penerapan formula Spearman-Brown akan
menghasilkan dua buah distribusi skor belahan pertama drngan distribusi skor belahan
keduan itu dipandang sebagai reabilitas bagian butir-butir soal tes hasil belajar bentuk
obyektif tersebut. Berikut adalah Langkah-langkah pengujian reliabilitas
menggunakan tes belah dua:
a. Lakukan pengetesan item-item yang telah dibuat pada subjek sasaran
b. Bagi tets yang ada menjadi dua jumlah dasar item yang paling umum dengan
membagi item dengan nomor gajil dan genap pada kelompok tersebut
c. Hitung skor subyek pada kedua belah kelompok penerima item yang genap dn
item ganjil
d. korelasikan kedua skor tersebut, mengunakan formula korelasi yang relevan
dengan teknuk pengukuran
sedangkan untuk mengetahui reabilitas tes secara keseluruhan Spearman-Brown
menciptakan formula sebagai berikut:

Rtt = 2. Rhh
1+ rhh

Keterangan:
Rtt = Koefisien reabilitas tes secara total (tt = total tes)
rhh = Koefisien korelasi product moment antara separoh (bagian pertama) tes,
dengan separuh (bagian kedua) dari tes tersebut (hh = half-half)
1&2 = Bilangan Konstantan

3. Pengujian reliabilitas dengan rumus Kuder-Richardson dan Koefisien Alpha

Metode ini didasarkan pada konsistensi respons terhadap semua butir soal
dalam tes. Konsistensi antar soal ini dipengaruhi oleh dua sumber varians
kesalahan:

a) pencuplikan isi (sebagaimana dalam bentuk alternatif dan reliabilitas belah


separuh) ; dan
b) heterogenitas dari domain yang disampelkan. Semakin homogen domainnya,
semakin tinggilah konsistensi antar soal.

16
Dari berbagai rumus yang diturunkan dalam artikel aslinya, rumus yang paling
luas diterapkan, umumnya dikenal sebagai “rumus 20 Kuder-Richardson”, adalah
sebagai berikut:

Rumus KR-20

R11 = reliabilitas instrumen

P = proposi subjek yang menjawab item dengan benar

q = proposi subjek yang menjawab item dengansalah (q=1- p)

pq = jumlah hasil perkalian antara p dan q

k = banyak item

δ = standar deviasi dari tes

Rumus Kuder-Richardson dapat diterapkan pada tes-tes yang soal-soalnya diskor


benar atau salah, atau tergantung pada suatu sistem all or none (semua atau tidak
sama sekali) lainnya.

4. Pengujian reliabilitas dengan pemberi skor

Reliabilitas pemberi skor dapat ditentukan dengan memiliki sampel lembaran tes yang
diskor secara terpisah oleh dua penguji. Dengan demikian dua skor yang didapatkan
oleh masing-masing peserta tes ini kemudian dikorelasikan dengan cara biasa, dan
koefisien korelasi yang dihasilkannya adalah ukuran reliabilitas pemberi skor. Jenis
reliabilitas ini umumnya dihitung ketika instrumen-instrumen yang diskor secara
subjektif digunakan dalam riset.

2.6 Faktor yang Mempengaruhi Reliabilitas Suatu Tes


Terdapat banyak factor yang dapat mempengaruhi reliabilitas sebagai suatu
instrument atau tes, diantaranya sebagai berikut;
1. Panjang Tes

17
Semakin panjang tes atau semakin banyak jumlah butir soal yang disajikan
dalam soal, maka akan semakin banyak jumlah item materi pembelajaran yang
perlu diukur. Hal ini menunjukkan dua kemungkinan, pertama tes yang
dilakuakan akan semakin mendekati kebenaran oleh peserta didik, dan yang kedua
adalah dalam tes peserta didik akan semakin kecil dalam menebak jawaban yang
menunjukkan semakin tinggi koefisien reliabilitas.
2. Penyebaran Skor
Secara langsung penyebaran skor korfisien reliabilitas akan dipengaruhi oleh
bentuk sebaran skor dalam kelompok peserta didik yang diukur. Semakin tinggi
sebaran maka akan semakin tinggi pula estimasi koefisien reliabilitas
3. Kesulitan Tes
Soal tes yang dibuat jika terlalu mudah atau terlalu sulit untuk dikerjakan oleh
peserta didik maka akan cenderung menghasilakan reliabilitas rendah. Hal
tersebut akan membuat sebaran skor yang cenderung terbatas. Untuk soal yang
terlalu mudah skor jawaban peserta didik akan mengumpul ada sisi atas, untuk tes
terlalu sulit skor jawaban siswa akan cenderung mengumpul pada ujung bawah.
Dua kejadian tersebut mempunyai kesamaan yaitu bahwa perbedaan di antara
individu adalah kecil dan cenderung tidak relevan.
4. Objektivitas
Yang dimaksud dengan objekif yaitu derajat dimana siswa dengan kompetensi
sama mencapai hasil sama. Ketika prosedur test evaluasi memiliki objektivitas
tinggi, maka reliabilitas test tidak dipengaruhi oleh prosedur teknik penskoran.
Item test objektif yang dihasilkan tidak dipengaruhi pertimbangan atau opini
seorang evaluator.
2.7 Cara Uji Reliabilitas Suatu Tes
1. Menggunakan rumus KR-20
Rumus

Dimana :

r1 = reliabilita tes keseluruhan

18
p = proporsi subjek menjawab dengan benar

q = proposi subjek menjawab dengan salah yang (q=1-p)

∑pq = jumlah hasi kali antara p

n = banyaknya item

s = standar deviasi dari tes (standar deviasi adalah akar)

Dalam buku-buku lain n (n kecil) ini sering diganti dengan huruf k (k kecil), yang
juga melambangkan banyaknya item. Demikian juga huruf S sebagai lambang standar
deviasi, ditulaskan SB sebagai singkatan dari kata “simpangan Baku”. Maka rumus
K-R. 20 menjadi :

Penggunaan huruf k ini juga berlaku bagi rumus-rumus lain yang melibatkan
banyaknya item tes, misalnya K-R.21 dan rumus alpha.
Untuk memberikan contoh perhitungan mencari reliabilitas yang menggunakan rumus
K-R.20 ini akan dibuatkan table analisis item yang lain.

TABEL PERHITUNGAN MENCARI REALIBILITAS TES DENGAN RUMUS KR. 20

Nomor item Skor


NO 1 2 3 4 5 6 7 total
1.
. Wardoyo 1 0 1 1 1 0 5
2. Benny 0 1 1 0 1 1 5
3. Hanafi 0 0 0 0 0 1 2
4. Rahmad 0 1 1 1 1 1 6
5. Tanti 1 0 0 0 0 0 2
6. Nadia 0 1 1 1 0 0 4
7. Tini 0 0 0 1 1 0 3
8. Budi 0 1 0 1 0 0 3
9. Daron 0 1 0 1 0 0 3
10. Yakob 0 0 0 1 0 0 2
Np 2 5 4 7 10 4 3 35
P 0,2 0,5 0,4 0,7 1 0,4 0,3
Q 0,8 0,5 0,6 0,3 0 0,6 0,7
Pq 0,16 0,25 0,24 0,21 0 0,24 0,21 1,31
£pq)

19
Dimasukan ke dalam rumus K-R.20

S = 1,56 (dicari dengan kalkulator)

1,85−1,31
= 1,17x s dapat dicari dengan menarik akar varians
1,85

0,54
= 1, 17x s = 1,36 (dicari dengan kalkulator)
1,85

= 1,17x0,29 = 0,3415 dibulatkan 0,342

2. Menggunakan rumus KR-21


Rumus :

Ket : M = mean atau rerata skor total

Jika dibandingkan reliabilitas yang dihitung dengan K-R. 20 dan K-R. 21, maka hasil
perhitungan dengan rumus KR-20 lebih besar namun membutuhkan pekerjaan
perhitungan yang lebih rumit.

3. Mencari reliabilitas tes bentuk uraian

20
Suatu butir soal urain menghendaki gradualisasi penilaian. Barangkali butir soal
nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi
hanya 5, dan butir soal nomor 3 sampai 10 dan sebagainya.

Untuk keperluan reliabilitas saol keseluruhan perlu juga dilakukan analisis butir soal
seperti halnya soal bentuk objektif. Skor untuk masing-masing butir soal dicantumkan
pada kolom item menurut apa adanya. Rumus yang digunakan adalah rumus Alpha
sebabgai berikut :

n ∑ σ 2i
r11 = ( )(
n−1
1− 2
σt )
Dimana :

r11 = realibilitas yang dicari

∑ σ 2i = jumlah varians skor tiap-tiap iem

σ 2t =varians total

Contoh perhitungan mencari reliabilitas

TABEL ANALISIS ITEM

Kuadrat
Skor
Nomor Item skor
NO Nama Total
total
1 2 3 4 5 6
1 A 10 6 8 8 10 10 52 2704
2 B 6 4 4 6 6 5 31 961
3 C 8 2 6 8 7 8 39 1521
4 D 7 3 7 7 6 6 36 1296
5 E 0 5 3 2 4 4 18 324
6 F 2 4 2 8 6 8 30 900
7 G 4 3 6 6 6 6 31 961
8 H 5 5 5 7 7 7 36 1296
9 I 5 5 4 6 8 5 33 1089
10 J 3 6 3 4 6 6 28 784
Jumlah 50 43 48 62 66 65 334 11836
Jumlah Kuadrat 328 201 264 418 458 451 2120

21
2120 = jumlah dari jumlah kuadrat setiap skor

11836 = jumlah kuadrat skor total

Dengan data yang tertera dalam table, dicari varians tiap-tiap item dahulu,
baru dijumlahkan

Perlu diingat kembali rumus varians yang sudah kita kenal, yaitu :

(∑ X ) 2
2 ∑ X 2− ∑ X 2t ( ∑ X t ) 2
σ = N atau σt = −
N N
N

502 328−250 78
328−
σ2(1) = 10 = = =7,8
10 10
10

432
2 201−
σ (2) = 10 201−184,9 16,1
= = =1,61
10 10 10

482
264−
σ2(3) = 10 264−230,4 33,6
= = =3,36
10 10 10

622
2 418−
σ (4) = 10 418−435,6 33,6
= = =3,36
10 10 10

66
451−
2
σ (5) = 10 458−435,6 22,4
= = =2,24
10 10 10

65 2
458−
σ2(6) = 10 451−422,5 28,5
= = =2,85
10 10 10

Jumlah varians semua item ∑ σ 2i =7,8+1,61+3,36+2,24+ 2,85 = 21,22

334 2
11836−
Varians total = 10
10

22
11836−11155,6
=
10

680,4
=
10

= 68,04

Dimasukkan ke rumus alpha

6
r11 = x¿ )
6−1

6
= x ¿ 1-0,312)
5

6
= x 0,688
5

= 0,8256 dibulatkan 0,826

Dengan diperolehnya koefisien korelasi, yakni r11 sebenarnya baru diketahui tinggi
rendahnya koefisien tersebut.Laebih sempurnanya perhitungan reliabilitas sampai
pada kesimpulan, sebaiknya hasil dtersebut dikonsultasikan dengan table r product
moment.

23
BAB III

PENUTUP

3.1 Kesimpulan
Menurut Anas Sudijono (2006) evaluasi dikatakan baik jika memenuhi 4
karakteristik yaitu validitas, reliabilitas, objektif dan praktis.
Validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes.
Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes
memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti
memiliki kesejajaran antara tes dan kriteria. Terdapat tiga jenis validitas diantaranya;
1. Validitas Isi: Validitas isi tes lebih mengarah kepada kedalaman tes, yang
merupakan soal-soal, dilihat dari isinya mengandung sesuatu yang memang
harus diukur.
2. Validitas Konstruk: Validitas konstruk mengandung arti bahwa suatu alat ukur
dikatakan valid apabila telah cocok dengan kontruksi teoritik di mana tes itu
dibuat.
3. Validitas Berdasarkan Kriteria: Validitas tes itu dilihat dari besarnya hasil
pengukuran dengan alat yang dipersoalkan itu sama atau mirip dengan hasil
pengukuran alat lain yang dijadikan kriteria. Terbagi menjadi dua yaitu validitas
prediksi dan validitas konkruen.
Menurut Sukardi terdapat 3 faktor yang menyebabkan hasil tes evaluasi
menjadi tidak valid. Yaitu faktor eksternal tes, faktor internal tes dan faktor yang
berasal dari objek tes atau peserta didik yang bersangkutan. Menurut Suharsimi
Arikunto (2012) untuk menguji validasi suatu tes dapat diketahui dengan
menggunakan 2 rumus, yaitu korelasi product moment dengan simpangan dan
korelasi product moment dengan angka besar.
Terdapat banyak factor yang dapat mempengaruhi reliabilitas sebagai suatu
instrument atau tes, diantaranya sebagai berikut;
1. Panjang Tes: Semakin panjang tes maka akan semakin banyak jumlah item
materi pembelajaran yang perlu diukur.
2. Penyebaran Skor: Semakin tinggi sebaran maka akan semakin tinggi pula
estimasi koefisien reliabilitas

24
3. Kesulitan Tes: Soal tes yang dibuat jika terlalu mudah atau terlalu sulit untuk
dikerjakan oleh peserta didik maka akan cenderung menghasilkan reliabilitas
rendah.
4. Objektivitas: Yang dimaksud dengan objektif yaitu derajat dimana siswa
dengan kompetensi sama mencapai hasil sama.
Menurut Ellen, suatu tes dikatakan reliabel jika skor observasi nilai awal
berhubungan dengan skor yang sebenarnya. Sedangkan menurut (Rbel, 1986:71)
suatu tes dikatakan reliabel jika syarat-syarat yang digunakan untuk menggambarkan
salah satu sifat yang paling signifikan dari satu nilai uji dengan cara yang konsisten.
Jadi dapat disimpulkan dari beberapa pendapat para ahli diatas bahwa reliabilitas
adalah jika skor observasi atau nilai responden (peserta didik) menghasilkan hasil
yang konsisten (tetap).
Dalam reliabilitas tes terdapat beberapa jenis pengujian, yaitu sebagai berikut:
1. Pengujian reliabilitas dengan tes re-test
2. Pengujian reliabilitas dengan Teknik belah dua
3. Pengujian reliabilitas dengan rumus Kuder-Richardson dan Koefisien Alpha
4. Pengujian reliabilitas dengan pemberi skor

3.2 Saran
Penulis menyadari bahwa dalam makalah ini masih memiliki banyak
kekurangan, baik itu dalam penulisan, kerapian penyajian materi, dan lain-lain. Oleh
karena itu, kritik dan saran dari pembaca sangat dibutuhkan agar dalam penulisan
selanjutnya penulis bisa menyajikan makalah lebih baik dari pada makalah sekarang
ini. Makalah ini kami sajikan sebaik mungkin agar pembaca bisa memperoleh ilmu
dari makalah yang kami sajikan. Semoga makalah ini berguna bagi kita semua.
Terima kasih.

25
DAFTAR PUSTAKA

Arikunto, S. 1998. Prosedur Penelitian: Suatu Pendekatan Praktek. Edisi Revisi IV. Jakarta:
Penebit Rineka Cipta
Arikunto, Suharsimi. 2013. Dasar-dasar Evaluasi Pendidikan. Edisi 3. Jakarta: Bumi Aksara.

Latif. Syamroni. 2014. Validasi Tes (https://www.slideshare.net/bunfaris/validitas-tes-


34241726), diakses 3 Mei 2021.

Ismail. Moh. 2018. Pengujian Validitas Tes Assessment Pembelajaran


(http://makalahpendidikanislamlengkap.blogspot.com/2015/06/pengujian-validitas-
tes-assesmen.html), diakses 3 Mei 2021.

Akhyar. Ahmad. 2014. Ciri Tes Hasil Belajar (https://www.slideshare.net/akhyar25a/ciri-tes-


hasil-belajar), diakses 3 Mei 2021.

Pratmasari. sisqa. 2017. Ciri-Ciri Tes Hasil Belajar yang Baik dan Prinsip-Prinsip Dasar
Dalam Penyusunan Tes hasil Belajar
(http://pratmasari.blogspot.com/2017/12/normal-0-false-false-false-en-us-x-
none.html), diakses 3 Mei 2021.

Fatorrasik. 2016. Validitas dan Reliabilitas Tes


(https://www.kompasiana.com/fathorrasik1/57a0a5e2ae7e611b19e1a4a2/validitas-
dan-reliabilitas-tes?page=2), diakses 3 Mei 2021.

Syarif, E. A., & Syamsurizal, S. (2019). Analyzed Quality of Senior High School Biology
Olympiad Questions at West Sumatera, Riau, Jambi, and Bengkulu in 2018.
Bioeducation Journal, 3(2), 142–150
H.M Sukardi, EVALUASI PENDIDIKAN Prinsip & Operasionalnya, Jakarta, PT Bumi
Aksara, 2008.
Kadir, A. (2015). Menyusun dan menganalisis tes hasil belajar. Al-TA'DIB: Jurnal Kajian
Ilmu Kependidikan, 8(2), 70-81.

Matondang, Z. (2009). Validitas dan reliabilitas suatu instrumen penelitian. Jurnal


Tabularasa, 6(1), 87-97.

Validitas, U. (2013). Reliabilitas. Hasil Uji Validitas dan Reliabilitas Variabel X, 2.

26
Khafidin, Z. (2014). Analisis Validitas dan Reliabilitas tes Mata Pelajaran Pendidikan Agama
Islam tingkat SMA. Edukasia: Jurnal Penelitian Pendidikan Islam, 9(2).

27

Anda mungkin juga menyukai