MAKALAH VALIDITAS 4 New 1

VALIDITAS DAN RELIABILITAS
Untuk memenuhi nilai tugas mata kuliah Evaluasi Pembelajaran

Matematika yang diampu oleh Margaretha Madha Melissa M.Pd.
Oleh:
Monica Flaviyana 151414080
Priska Godeliva 151414093
Dionisius Angga Kurniawan 151414098
Laurent Simangunsong 151414100
Geovani Debby Setyani 151414104
Program Studi Pendidikan Matematika

Jurusan Pendidikan Matematika dan Ilmu Pengetahuan Alam
Fakultas Keguruan dan Ilmu Pendidikan
Universitas Sanata Dharma
Yogyakarta
2017
DAFTAR ISI
BAB I PENDAHULUAN ......................................................................................................... 3
A. Latar Belakang ........................................................................................................ 3
B. Rumusan Masalah ................................................................................................... 3
C. Tujuan ..................................................................................................................... 3
BAB II PEMBAHASAN........................................................................................................... 4
A. Pengertian Validitas ................................................................................................ 4
B. Macam-Macam Validitas ........................................................................................ 5
C. Cara Mengetahui Validitas Alat Ukur .................................................................... 9
D. Validitas Butir Soal atau Validitas Item ............................................................... 14
E. Menentukan Bukti Validitas Soal Uraian ............................................................. 18
F. Tes Terstandar sebagai Kriterium dalam Menentukan Validitas .......................... 20
G. Validitas Faktor ..................................................................................................... 21
H. Menghitung Validitas Menggunakan Excel .......................................................... 24
I. Menghitung Validitas Menggunakan SPSS .......................................................... 25
J. Pengertian Reliabilitas (dalam suatu tes) .............................................................. 28
J. Cara-Cara Mencari Besarnya Reliabilitas ............................................................. 31
L. Menggunakan SPSS untuk Menghitung Reliabilitas ............................................ 50
BAB III KESIMPULAN.......................................................................................................... 54
DAFTAR PUSTAKA ............................................................................................................. 55
2
BAB I
PENDAHULUAN
A. Latar Belakang
Dalam suatu proses pembelajaran, hal yang tidak kalah penting adalah
proses evaluasi pembelajaran. mengevaluasi dapat diumpamakan sebagi
pekerjaan memotret. Gambar potret atau foto dikatakan baik apabila sesuai
dengan aslinya. Gambar pemotretan hasil evaluasi tersebut di dalam kegiatan
evaluasi dikenal dengan data evaluasi. Data evaluasi yang baik sesuai dengan
kenyataan disebut data yang valid. Agar dapat diperoleh data yang valid,
instrumen atau alat untuk mengevaluasinya harus valid pula. Jika pernyataan
tersebut valid, instrumen evaluasi dituntut untuk valid karena diinginkan dapat
diperoleh data yang valid. Dengan kata lain, instrumen evaluasi dipersyaratkan
valid agar hasil yang diperoleh dari kegiatan evaluasi valid. Dengan kata lain,
instrumen evaluasi dipersyaratkan valid agar hasil yang diperoleh dari kegiatan
evaluasi valid. Selain tes tersebut harus valid, syarat dari sebuah tes adalah dapat
menghasilkan hasil yang tetap atau bisa disebut dengan reliabilitas. Pada
makalah ini akan dibahas mengenai Validitas dan Reliabilitas.
B. Rumusan Masalah
1. Apa yang dimaksud dengan validitas dan reliabilitas?
2. Apa saja macam-macam validitas?
3. Bagaimana cara menentukan validitas?
4. Bagaimana cara menentukan reliabilitas?
5. Bagaimana cara menggunakan EXCEL dan SPSS untuk menghitung
validitas dan reliabilitas?
C. Tujuan
1. Mengetahui pengertian validitas dan reliabilitas.
2. Mengetahui macam-macam validitas.
3. Mengaplikasikan cara menentukan validitas pada sebuah tes.
4. Mengaplikasikan cara menentukan reliabilitas pada sebuah tes.
5. Mengaplikasikan cara menggunakan EXCEL dan SPSS untuk
menghitung validitas dan reliabilitas.
3
BAB II
PEMBAHASAN
A. Pengertian Validitas
Dalam Hamzah (2014) validitas berasal dari kata validity yang mempunyai
arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya.
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas
yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau
memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran
tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data
yang tidak relevan dengan tujuan pengukuran.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Terkandung di sini pengertian bahwa ketepatan validitas pada suatu
alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan
pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk
mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai
variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes
yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai
variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas
rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel
A’ atau B (Azwar 1986).
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran.
Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan
tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut.
Cermat berarti bahwa pengukuran itu dapat memberikan gambran mengenai
perbedaan yang sekecil-kecilnya mengenai perbedaan yang satu dengan yang lain.
Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui
berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas
agar hasil penimbangannya valid, yaitu tepat dan cermat. Sebuah alat penimbang
badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna
4
menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat
emas itu tidak akan terlihat pada alat ukur berat badan.
Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek
tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan
menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat
kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai
angka yang sebenarnya atau angka yang mendekati keadaan yang sebenarnya
(Azwar 1986).
Validitas suatu instrumen berkaitan dengan kemampuan instrument itu
untuk mengukur atu mengungkap karakteristik dari variabel yang dimaksudkan
untuk diukur. Instrumen yang dimaksudkan untuk mengukur sikap konsumen
terhadap suatu iklan, misalnya, harus dapat menghasilkan skor sikap yang memang
menunjukkan sikap konsumen terhadap iklan tersebut. Jadi, jangan sampai hasil
yang diperoleh adalah skor yang menunjukkan minat konsumen terhadap iklan itu.
Validitas suatu instrumen banyak dijelaskan dalam konteks penelitian
sosial yang variabelnya tidak dapat diamati secara langsung, seperti sikap, minat,
persepsi, motivasi, dan lain sebagainya. Untuk mengukur variabel yang demikian
sulit, untuk mengembangkan instrumen yang memiliki validitas yang tinggi karena
karakteristik yang akan diukur dari variabel yang demikian tidak dapat diobservasi
secara langsung, tetapi hanya melalui indikator (petunjuk tak langsung) tertentu.
(Aritonang R. 2007).
B. Macam-Macam Validitas
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Hal yang pertama akan diperoleh validitas logis (logical validity) dan
hal yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah yang
dijadikan dasar pengelompokan validitas tes.
Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas
empiris.
a. Validitas Logis
Istilah “validitas logis” mengandung kata “logis” yang berasal dari
kata “logika” , yang berarti penalaran. Dengan makna demikian, maka
5
validitas logis untuk sebuah instrumen evaluasi menunjukkan pada kondisi
bagi sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil
penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen
yang bersangkutan sudah dirancang secara baik, mengikuti teori dan
ketentuan yang ada.Sebagaimana pelaksanaan tugas lain misalnya membuat
sebuah karangan, jika penulis sudah mengikuti aturan mengarang, tentu
secara logis karangannya sudah baik.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen, yaitu validitas isi dan validitas konstrak (construct validity).
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah
instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi.
Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi
sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek kejiwaan
yang seharusnya dievaluasi.
1. Validitas Isi
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan
khusus tertentu yang sejajar dengan materi atau isi pelajaran yang
diberikan. Menurut Hamzah (2014), validitas isi suatu tes
mempermasalahkan seberapa jauh suatu tes mengukur tingkat
penguasaan terhadap isi suatu materi tertentu yang seharusnya dikuasai
sesuai dengan tujuan pengajaran. Oleh karena materi yang diajarkan
tertera dalam kurikulum, maka validitas isi ini sering juga disebut
validitas kurikuler. Validitas isi dapat diusahakan tercapainya sejak saat
penyusunan dengan cara merinci materi kurikulum, buku pelajaran.
Validitas isi dapat diukur dengan membandingkan antara isi instrument
dengan materi pelajaran yang telah ditetapkan.
2. Validitas Konstruksi
Menurut Hamzah (2014), validitas konstruk adalah validitas yang
mempermasalahkan seberapa jauh item-item tes mampu mengukur apa
yang hendak benar-benar hendak diukur sesuai dengan konsep khusus
atau definisi konseptual yang telah ditetapkan.
6
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir
soal yang membangun tes tersebut mengukur setiap aspek berpikir
seperti yang disebutkan dalam tujuan instruksional khusus (indikator).
Dengan kata lain, jika butir-butir soal mengukur aspek berpikir tersebut
sudah sesuai dengan aspek berpikir yang menjadi tujuan instruksional
(indikator). Sebagai contoh, jika rumusan tujuan instruksional khusus :
“Siswa dapat membandingkan antara efek biologis dan efek
psikologis”, maka butir soal pada tes merupakan perintah agar siswa
membedakan antara dua efek tersebut.
Kosntruksi dalam pengertian ini bukanlah “susunan” seperti yang
sering dijumpai dalam teknik, tetapi merupakan rekaan psikologis,
yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang dengan
suatu cara tertentu “memerinci” isi jiwa atas beberapa aspek seperti
ingatan (pengetahuan), pemahaman, aplikasi dan seterusnya. Dalam hal
ini, mereka menganggap seolah-olah jiwa dapat dibagi-bagi, tetapi
sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan
sementara untuk mempermudah mempelajari.
Untuk menguji validitas konstruksi, maka dapat digunakan pendapat
dari ahli (judgment expert).
b. Validitas Empiris
Istilah validitas empiris memuat kata “empiris” yang artinya
pengalaman. Sebuah instrumen dapat dikatakan memiliki validitas empiris
apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari, seseorang
dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan
bahwa orang tersebut memang jujur. Contoh lain, seseorang dapat dikatakan
kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut sudah
banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang
sudah ada. Dari penjelasan dan contoh-contoh tersebut, diketahui bahwa
validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan
melalui pengalaman.
7
Ada dua macam validitas empiris, yakni ada dua cara yang dapat
dilakukan untuk menguji bahwa sebuah instrumen memang valid.
Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen
yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang
digunakan sebagai pembanding kondisi instrumen dimaksud ada dua, yaitu
yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu yang
akan datang. Bagi instrumen yang kondisinya sesuai dengan kriterium yang
sudah tersedia, yang sudah ada, disebut memiliki validitas “ada sekarang”.
Selanjutnya, instrumen yang kondisinya sesuai dengan kriterium yang
diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas
prediksi.
1. Validitas “ada sekarang” (Konkuren)
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes
dikatakan memiliki validitas empiris, jika hasilnya sesuai dengan
pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang
dipasangkan. Dalam hal ini, hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau
sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang).
Dalam hal membandingkan hasil sebuah tes, maka diperlukan suatu
kriterium atau alat banding. Contoh : Seorang guru ingin mengetahui
apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini
diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki.
Misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.
2. Validitas Prediksi
Menurut Hamzah (2014), validitas prediksi adalah tes yang mempunyai
kemampuan meramalkan apa yang akan terjadi pada masa yang akan
datang. Sebuah tes dikatakan memiliki validitas prediksi apabila
mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada
masa yang akan datang. Misalnya tes masuk perguruan tinggi adalah
sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta
tes dalam mengikuti kuliah di masa yang akan datang. Calon yang
tersaring berdasarkan hasil tes, diharapkan mencerminkan tinggi
8
rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu
menjamin keberhasilannya kelak sebaliknya, seorang calon dikatakan
tidak lulus tes karena memiliki nilai tes yang rendah, jadi diperkirakan
akan tidak mampu mengikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh setelah peserta tes mengikuti pelajaran di perguruan tinggi.
Jika ternyata, siapa yang memiliki nilai tes yang lebih tinggi gagal
dalam ujian semester satu dibandingkan dengan yang dahulu nilai
tesnya lebih rendah, maka tes masuk yang dimaksud tidak memiliki
validitas prediksi.
C. Cara Mengetahui Validitas Alat Ukur

Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium,
dalam arti memiliki kesejajaran antara hasil tes dengan kriterium. Teknik yang
digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment
yang dikemukakan oleh Pearson.
Rumus korelasi product moment ada dua macam, yaitu:
a. Korelasi product moment dengan simpangan
b. Korelasi product moment dengan angka kasar
Rumus korelasi product moment dengan simpangan :
∑𝑥𝑦
𝑟𝑥𝑦 =
√(∑2𝑥)(∑2𝑥)
rxy = koefisien korelasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan (𝑥 = 𝑋 − 𝑋̅ dan 𝑦 = 𝑌 − 𝑌̅)
∑𝑥𝑦 = jumlah perkaliam x dan y
x2 = kuadrat dari x
y2 = kuadrat dari y
Contoh perhitungan:
Misalnya akan menghitung validitas tes prestasi belajar matematika. Sebagai
kriterium diambil rata-rata ulangan yang akan dicari validitasnya. Diberi kode X
dan rata-rata nilai harian diberi kode Y. Kemudian dibuat tabel persiapan sebagai
berikut.
9
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS TES PRESTASI
MATEMATIKA
No. Nama X Y x y x2 y2 Xy
1 Nikodemus 6,5 6,3 0 -0,1 0,0 0,01 0,0
2 Rangga 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
3 Song 7,5 7,2 +1,0 +0,8 1,0 0,64 +0,8
4 Joko 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
5 Monic 6 7 -0,5 +0,6 0,25 0,36 -0,3
6 Rere 6 6,2 -0,5 -0,2 0,25 0,04 +0,1
7 Dewa 5,5 5,1 -1,0 -1,3 1,0 1,69 +1,3
8 Yosep 6,5 6 0 -0,4 0,0 0,16 0,0
9 Kadek 7 6,5 +0,5 +0,1 0,25 0,01 +0,05
10 Priska 6 5,9 -0,5 -0,6 0,25 0,36 +0,3
Jumlah 65,0 63,8 3.5 3,59 2,66
∑𝑋 65
𝑋̅ = = = 6,5
𝑁 10
∑𝑌 63,8
𝑌̅ = = = 6,38 dibulatkan 6,4
𝑁 10
𝑥 = 𝑋 − 𝑋̅
𝑦 = 𝑌 − 𝑌̅
Dimasukan ke rumus
∑𝑥𝑦
𝑟𝑥𝑦 =
√(∑2𝑥)(∑2𝑥)
2,65 2,65
= =
√3,5×3,59 √12,565
2,65
=
3,545
Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.
10
Rumus korelasi product moment dengan angka kasar:
𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
𝑟𝑥𝑦 =
√{𝑁 ∑ 𝑋 2 − {𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 }
Di mana 𝑟𝑥𝑦 = koefisien korelasi antara variabel X dan variabel Y, dua variabel
yang dikorelasikan
Dengan menggunakan data hasil tes prestasi matematika di atas kini
dihitung dengan rumus korelasi product moment dengan angka kasar tabel
persiapannya sebagai berikut.
No. Nama X Y X2 Y2 XY
1 Nikodemus 6,2 6,3 42,25 39,69 40,95
2 Rangga 7 6,8 49 46,24 47,6

3 Song 7,5 7,2 56,25 51,84 54,0
4 Joko 7 6,8 49 46,24 47,6
5 Monic 6 7 36 49 42
6 Rere 6 6,2 36 38,84 37,2
7 Dewi 5,5 5,1 30,25 26,01 28,05
8 Jose 6,5 6 42,25 45,5 39
9 Kadek 7 6,5 49 36 45,5
10 Priska 6 5,9 36 34,81 35,4
Jumlah 65,0 63,8 426,0 410,52 417,3
Dimasukkan ke dalam rumus:

𝑁 ∑ 𝑋𝑌−(∑ 𝑋)(∑ 𝑌)
rxy =
√{𝑁 ∑ 𝑋 2 −(∑ 𝑋)2 }{𝑁 ∑ 𝑌 2 −(∑ 𝑌)2 }
10×417,3−(65×63,8)
rxy =
√(10×425−4225)(10×410,52−4070,44)
4173−4147
rxy =
√(4260−4225)(410,2−4070,44)
26 26
rxy = =
√35×34,76 √1216,6
26
rxy =
34,8797
rxy = 0,745
11
Jika perbandingan dengan validitas soal yang dihitung dengan rumus simpangan,
ternyata terdapat perbedaan sebesar 0,003, lebih besar yang dihitung dengan rumus
simpangan. Hal ini wajar karena dalam mengerjakan perkalian atau penjumlahan
jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan keatas.
Perbedaan ini sangat kecil sehingga dapat diabaikan.
Rumus korelasi product moment dengan angka kasar dapat digunakan untuk
menghitung semua jenis instrumen tes, seperti pilihan ganda, uraian, benar-salah,
serta angket.
Untuk memperjelas pengertian tersebut, dapat disampaikan keterangan sebagai
berikut.
- Korelasi positif menunjukkan adanya hubungan sejajar antara dua hal.
Misal:
Hal pertama nilainya naik, hal kedua ikut naik. Sebaliknya jika hal pertama
turun, yang kedua ikut turun. Contoh korelasi positif antara nilai IPA dan
Matematika.
IPA : 2, 3, 5, 7, 4, 3, 2
Matematika : 4, 5, 6, 8, 5, 4, 3
Kondisi nilai Matematika sejajar dengan IPA karena naik dan turunnya nilai
IPA.
- Korelasi negatif menunjukkan adanya hubungan kebalikan antara dua hal.
Misal: hal pertama nilainya naik, justru yang kedua turun. Sebaliknya yang
pertama turun yang kedua naik.
Contoh korelasi negatif antara nilai Bahasa Indonesia dengan Matematika.
Bahasa Indonesia : 5, 6, 8, 4, 3, 2
Matematika : 8, 7, 5, 1, 2, 3
Keadaan hubungan antara dua hal yang kita jumpai dalam kehidupan
sehari-hari tidak selalu hanya positif atau negatif saja, tetapi mungkin 0
(nol). Besarnya korelasi pun tidak menentu. Untuk mengetahui bagaimana
hubungan antara dua nilai mata pelajaran A dan B dapat dicermati hal
berikut ini.
Contoh korelasi tidak tertentu.
Nilai A : 5, 6, 4, 7, 3, 8, 7
12
Nilai B : 4, 4, 3, 7, 4, 9, 4
Keadaan kedua nilai tersebut jika dihitung dengan rumus korelasi mungkin
positif mungkin juga negatif.
Koefisien korelasi selalu terdapat antara -1,00 sampai +1,00. Namun
karena dalam menghitung sering dilakukan pembulatan angka-angka,
sangat mungkin diperoleh koefisien lebih dari 1,00. Koefisien negatif
menunjukkan hubungan kebalikan sedangkan koefisien positif
menunjukkan adanya kesejajaran untuk mengadakan interpretasi mengenai
besarnya koefisien korelasi adalah sebagai berikut:
Angka korelasi Klasifikasi

0.800-1.000 Sangat tinggi
0.600-0.800 Tinggi
0.400-0.600 Cukup
0.200-0.400 Rendah
0.000-0.200 Sangat rendah
Penafsiran angka koefisien korelasi ada dua cara, yaitu:

1. Dengan melihat angka r dan diinterpretasikan misalnya korelasi tinggi,
cukup, dan sebagainya
2. Dengan berkonsultasi ke tabel kritik r product moment sehingga dapat
diketahui signifikan tidaknya korelasi tersebut. Jika harga r lebih kecil
dari harga kritik tabel, maka korelasi tersebut tidak signifikan, begitu
pula sebaliknya.
13
Menggunakan Tabel R
Untuk tahu bagaimana cara menggunakan tabel r dapat menggunakan contoh

berikut: Kita dapat meneliti dengan menggunakan sampel untuk uji kuisioner
sebanyak 25 orang responden dengan signifikansi 5%, dari sini di dapat nilai df=25-
2=23. Cara membaca tabel r nya, lihat tabel r product moment pada signifikasi 5%,
didapatkan angka r tabel = 0,3961. Selanjutnya, hitung dan bandingkan nilai r yang
didapat dari tabel r dengan r hasil perhitungan. Jika r ditabel r < r hasil hitungan,
maka pernyataan itu valid.
D. Validitas Butir Soal atau Validitas Item

Jika seorang guru peneliti atau guru mengetahui bahwa validitas soal tes
misalnya terlalu rendah atau rendah saja, maka selanjutnya ingin mengetahui butir-
butir tes manakah yang menyebabkan soal secara keseluruhan tersebut jelek karena
validitas rendah. Oleh sebab itu, diperlukannya mencari validitas butir soal atau
validitas item.
Pengertian umum dari validitas butir soal atau validitas item adalah
demikian sebuah butir soal atau item dikatakan valid apabila mempunyai dukungan
yang bersar terhadap skor total. Skor pada butir soal atau item menyebabkan skor
total tinggi atau rendah. Dengan kata lain dapat dikemukakan di sini bahwa sebuah
item memiliki validitas yang tinggi jika skor pada butir soal atau item memiliki
14
validitas yang tinggi jika skor pada butir soal atau item mempunyai kesejajaran
dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk
mengetahui validitas butir soal atau item digunakan rumus korelasi seperti yang
sudah dijelaskan.
Untuk soal-soal bentuk objektif skor untuk butir soal atau item biasa
diberikan dengan 1 (bagi butir soal atau item yang dijawab benar) dan 0 (butir soal
atau item yang dijawab salah), sedangkan skor total selanjutnya merupakan jumlah
dari skor untuk semua butir soal atau item yang membangun soal tersebut.
Contoh perhitungan:
Butir soal/item
No Nama 1 2 3 4 5 6 7 8 9 10 Skor Total
1 Dian 1 0 1 0 1 1 1 1 1 1 8
2 Dion 0 0 1 0 1 0 0 1 1 1 5
3 Laurent 0 1 0 0 0 1 0 1 0 1 4
4 Ocha 1 1 0 0 1 1 0 0 1 0 5
5 Icha 1 1 1 1 1 1 0 0 0 0 6
6 Mentari 1 0 1 0 1 0 1 0 0 0 4
7 Tina 1 1 1 1 1 1 1 0 0 0 7
8 Putri 0 1 0 1 1 1 1 1 1 1 8
Misalnya, akan dihitung validitas butir soal atau item nomor 6, maka skor butir soal
atau item nomor 6 tersebut disebut sebagai variabel X dan skor total disebut variabel
Y. selanjutnya perhitungan dilakukan dengan menggunakan rumus korelasi product
moment, baik dengan rumus simpangan maupun rumus angka dasar.
Penggunaan kedua rumus tersebut masing-masing ada keuntungannya.
Menggunakan rumus simpangan angkanya kecil-kecil, tetapi kadang-kadang
pecahannya rumit. Jika skor rata-ratanya (mean) pecahan, simpangannya cenderung
banyak pecahan. Mengalikan pecahan persepuluhan ditambah dengan tanda-tanda
plus (+) dan minus (-) kadang-kadang bisa menyesatkan. Penggunaan rumus angka
kasar bilangannya besar-besar tetapi bulat. Jika ada kalkulator statistik disarankan
menggunakan rumus angka kasar saja. Yang dibutuhkan hanyalah:
∑ 𝑋, ∑ 𝑌, ∑ 𝑋 2 , ∑ 𝑌 2 , dan ∑ 𝑋𝑌, tidak perlu membuat tabel seutuhnya.
15
Contoh perhitungan mencari validitas item
Untuk menghitung validitas item nomor 6, dibuat terlebih dahulu tabel
persiapannya sebagai berikut:
TABEL PERSIAPAN UNTUK MENGHITUNG VALIDITAS ITEM NOMOR 6
No Nama X Y
1 Dian 1 8
2 Dion 0 5
3 Laurent 1 3
4 Ocha 1 5
5 Icha 1 6
6 Mentari 0 4
7 Tina 1 7
8 Putri 1 8
Keterangan:
X = skor item nomor 6
Y = skor total
Dari perhitungan kalkulator diperoleh data sebagai berikut:
∑𝑋 = 6 ∑ 𝑋2 = 6
∑ 𝑌= 46 ∑ 𝑌 2 = 288
6
∑ 𝑋𝑌 = 37 p = 8 = 37
2
𝑋̅𝑡 = 5,57 q = 8 = 5,57
Sesudah diketahui ∑ 𝑋,∑ 𝑋 2 ∑ 𝑌, ∑ 𝑌 2 , dan ∑ 𝑋𝑌 tinggal memasukkan bilangan-

bilangan tersebut ke dalam rumus korelasi product moment dengan rumus angka
kasar.
Data di atas dimasukkan ke dalam rumus korelasi product moment dengan angka
kasar sebagai berikut.
𝑁 ∑ 𝑋𝑌−(∑ 𝑋)(∑ 𝑌) 20 20
rxy = rxy = =
√{𝑁 ∑ 𝑋 2 −(∑ 𝑋)2 }{𝑁 ∑ 𝑌 2 −(∑ 𝑌)2 } √48×188 √2556
8×37−(6×46) 20
rxy = rxy =
√(8×6−62 )(8×288−462 ) 47,497
296−276 rxy = 0,42

rxy =
√(48−36)(2304−2116)
16
Koefisien validitas item nomor 6 adalah 0,421. Dilihat secara sepintas nilangan ini
memang sesuai dengan kenyataannya. Hal ini dapat diketahui dari skor-skor yang
tertera baik pada item mauoun skor total. Laurent yang hanya memiliki skor total 3
dapat memperoleh skor I pada item, sedangkan Dion dan Ocha yang mempunyai
skor total sama, yaitu 5 skor pada item tidak sama. Validitas item tersebut kurang
meyakinkan. Tentu saja validitasnya tidak tinggi.
Masih ada cara-cara lain untuk menghitung validitas item. Salah satu cara yang
terkenal adalah menggunakan rumus 𝑦𝑝𝑏 ; yang rumus lengkapnya adalah sebagai
berikut:
𝑀𝑝 − 𝑀1 𝑝
𝛾𝑝𝑏𝑖 = √
𝑆𝑡 𝑞
Keterangan:
𝛾𝑝𝑏𝑖 = koefisien korelasi biserial
𝑀𝑝 = rerata skor dari subjek yang menjawab betul bagi item yang dicari
validitasnya
𝑀𝑡 = rerata skor total
𝑆𝑡 = standar deviasi dari skor total proporsi
p = proporsi siswa yang menjawab benar
𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑠𝑖𝑠𝑤𝑎 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟
𝑃=
𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑠𝑖𝑠𝑖𝑤𝑎
q = proporsi siswa yang menjawab salah (q=1-p)
Apabila item 6 tersebut dicari tersebut dicari validitasnya dengan rumus ini maka
perhitungannya melalui langkah sebagai berikut:
8+3+5+6+7+8 37
1. Mencari 𝑀𝑝 = = = 6,17
6 6
8+5+3+5+6+4+7+8 46
2. Mencari 𝑀𝑡 = = = 5,75
8 8
3. Dari kalkulator diperoleh harga standar deviasi, yaitu

𝜎𝑛 = 1,7139 atau
𝜎𝑛−1 = 1,8323. Untuk n kecil, diambil standar deviasi yang 𝜎𝑛 = 1,7139
6
4. Menentukan harga p, yaitu = 0,75
8
17
2
5. Menentukan harga q, yaitu 8 𝑎𝑡𝑎𝑢 1 − 0,75 = 0,25
6. Memasukkan ke rumus
𝑀𝑝 − 𝑀𝑡 𝑝
𝛾𝑝𝑏𝑖 = √
𝑆𝑡 𝑞
6,17 − 5,75 0,75

= √
1,7139 0,25
0,42
= × 1,732
1,7139
= 0,4244
Dari perhitungan validitas item 6 dengan dua cara ternyata hasilnya berbeda tetapi
sangat kecil yaitu 0,0034. Mungkin hal ini disebabkan karena adanya pembulatan
angka. Rumus 𝛾𝑝𝑏𝑖 (koefisien korelasi biserial) ini dapat digunakan untuk jenis
instrumen tes pilihan ganda serta benar-salah.
E. Menentukan Bukti Validitas Soal Uraian

Tabel Analisis Item Uraian
No Nama Nomor item Skor Kuadrat skor
1 2 3 4 5 6 total total
1 A 10 6 8 8 10 10 52 2704
2 B 6 4 4 6 6 5 31 961
3 C 8 2 6 8 7 8 39 1521
4 D 7 3 7 7 6 6 36 1296
5 E 0 5 3 2 4 4 18 324
6 F 2 4 2 8 6 8 30 900
7 G 4 3 6 6 6 6 31 961
8 H 5 5 5 7 7 7 36 1296
9 I 5 5 4 6 8 5 33 1089
10 J 3 6 3 4 6 6 28 784
Jumlah 50 43 48 62 66 65 334 11836
18
Tabel untuk menghitung korelasi product moment antara butir 1 (X1) dengan skor
total semua jawaban siswa ( Y ):
No X1 X12 Y Y2 X1Y
1 10 100 52 2704 520
2 6 36 31 961 186
3 8 64 39 1521 312
4 7 49 36 1296 252
5 0 0 18 324 0
6 2 4 30 900 60
7 4 16 31 961 124
8 5 25 36 1296 180
9 5 25 33 1089 165
10 3 9 28 784 84
∑ 𝑋1 = ∑ 𝑋12 ∑𝑌 ∑ 𝑌12
N = 10 ∑ 𝑋1 𝑌=1883
50 = 328 = 334 = 11836
𝑁 ∑ 𝑋𝑌−(∑ 𝑋)(∑ 𝑌)
rxy=
√{𝑁 ∑ 𝑥 2 −(∑ 𝑋)2 }{𝑁 ∑ 𝑦 2 −(∑ 𝑦)2 }
10𝑥1883−50𝑥334
rxy=
√(10𝑥328−2500)(10𝑥11836−111556)
18830−16700
rxy=
√780𝑥6804
2130
rxy=
√5307120
2130
rxy=
2303.718
rxy= 0,924
Keterangan:
Makin tinggi koefisien korelasi yang dimiliki makin valid butir instrumen
tersebut. Secara umum, jika koefisien korelasi sudah lebih besar dari 0,3 maka
butir instrumen tersebut sudah dikategorikan valid.
19
F. Tes Terstandar sebagai Kriterium dalam Menentukan Validitas
Tes terstandar adalah tes yang telah dicobakan berkali-kali sehingga dapat
dijamin kebaikannya. Di negara-negara berkembang biasa tersedia tes ini, yang
dikenal dengan nama standardized test.
Sebuah tes terstandar biasanya memiliki identitas, yaitu :
1. Sudah dicobakan berapa kali dan di mana
2. Berapa keofisien validitas
3. Reabilitas
4. Taraf kesukaran
5. Daya pembeda
6. Dan lainnya yang dianggap perlu
Cara menentukan validitas soal yang menggunakan tes terstandar sebagai
kriterium dilakukan dengan mengalikan koefisien validitas yang diperoleh dengan
koefisien validitas tes terstandar tersebut.
Contoh perhitungan:
No Peserta tes X Y X2 Y2 XY
1 Ros 8 7 64 49 56
2 Mawar 8 5 64 25 40
3 Melati 9 7 81 49 63
4 Cempaka 8 7 64 49 56
5 Dahlia 7 5 49 25 35
Jumlah 40 31 322 197 250
Keterangan:
X = hasil tes matematika yang dicari validitasnya
Y = hasil tes standar
Dimasukkan ke dalam rumus korelasi product moment dengan angka kasar
sebagai berikut :
𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
𝑟𝑥𝑦 =
√[𝑁 ∑ 𝑋 2 − (∑ 𝑋)2 ][𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 ]
(5 × 250) − (40 × 31)
𝑟𝑥𝑦 =
√[(5 × 322) − (40)2 ][(5 × 197) − (31)2 ]
20
10
𝑟𝑥𝑦 =
√[10][24]
10
𝑟𝑥𝑦 =
15,492
𝑟𝑥𝑦 = 0,645
Jika dari tes terstandar diketahui bahwa validitasnya 0,89 maka bilangan 0,645 ini
belum merupakan validitas soal matematika yang dicari. Validitas tersebut harus
dikalikan dengan 0,89 yang hasilnya 0,645 × 0,89 = 0,574
G. Validitas Faktor
Faktor-faktor atau bagian keseluruhan materi merupakan hal yang perlu diketahui
dalam validtas. Setiap keseluruhan nateri pelajaran terdiri dari pokok-pokok
pembahasan atau mungkin sekelompok pokok bahasan yang merupakan satu-
kesatuan.
Contoh:
Guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahasan, yaitu:
Bunyi, Cahaya, dan Listrik. Untuk keperluan ini guru tersebut membuat 30 butir
soal, untuk Bunyi 8 butir, untuk cahaya 12 butir, dan untuk Listrik 10 butir.
Apabila guru ingin mengetahui validitas faktor, maka ada 3 faktor dalam
soal ini. Seperti halnya pengertian validitas butir, pengertian validitas faktor adalah
sebagai berikut: butir-butir faktor dikatakan valid apabila mempunyai dukungan
yang besar terhadap soal-soal secara keseluruhan. Sebagai tanda bahwa butir-butir
faktor tersebut mempunyai dukungan yang besar terhadap seluruh soal, yakni
apabila jumlah skor unutk butir-butir faktor tersebut menunjukkan adanya
kesejajaran dengan skor total.
21
CONTOH TABEL ANALISIS BUTIR UNTUK MENGHITUNG VALIDITAS BUTIR DAN VALIDITAS FAKTOR
Skor Skor Skor
1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 Skor
Butir 1 2 3 4 5 6 7 8 faktor 9 faktor faktor
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 total
1 2 3
Amir 1 0 1 1 1 1 0 1 6 1 0 1 0 1 0 1 0 1 0 1 0 6 1 0 1 1 1 0 1 1 1 0 7 19
Hasan 1 1 1 1 1 1 1 0 7 1 1 1 1 0 1 1 1 1 0 0 1 9 1 1 1 1 1 1 1 1 1 0 9 25
Ninda 1 0 1 0 1 0 1 0 7 1 1 0 0 0 0 1 1 0 1 1 0 6 1 0 1 1 0 1 1 0 1 1 7 17
Warih 0 1 1 0 0 0 0 0 4 0 0 0 1 1 0 1 0 1 0 0 0 4 1 0 0 0 1 0 0 1 1 1 5 12
Irzal 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 1 1 0 1 1 11 1 1 1 1 1 1 1 1 1 1 10 29
Gandi 1 1 0 1 1 0 1 1 6 1 0 1 1 1 1 1 1 0 1 1 0 9 1 1 1 1 1 0 0 1 1 1 8 23
Santo 1 0 1 0 1 1 0 1 5 1 0 0 0 1 1 1 0 1 1 1 0 7 1 1 1 1 0 0 0 1 1 1 7 19
Tini 1 1 1 1 1 0 1 1 7 1 1 1 1 1 0 1 1 1 1 0 1 10 1 1 1 1 1 1 1 1 1 0 9 26
Yanti 1 1 1 0 0 0 1 1 6 1 0 1 1 0 0 0 0 1 1 1 0 6 1 1 0 1 1 0 0 1 0 0 5 12
Hamid 1 0 1 0 1 0 1 0 4 1 0 0 0 0 0 0 1 1 1 0 1 5 1 1 0 1 1 0 0 0 1 1 5 15
Dedi 1 1 1 1 1 1 1 0 7 1 1 1 1 1 1 1 1 1 1 0 0 10 1 1 1 1 1 1 1 0 1 1 9 26
Desi 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 1 1 1 12 1 1 1 1 1 1 1 1 1 1 10 30
Wahyu 1 0 0 0 1 1 1 1 5 1 1 0 1 1 0 1 1 0 1 1 0 8 1 1 0 0 0 1 1 1 1 1 7 20
22
Sudah dijelaskan bahwa butir-butir soal faktor dikatakan valid apabila menunjuk
kesejajaran skor dengan skor total. Cara mengetahui kesejajaran tersebut digunakan
juga rumus korelasi product moment. Misalnya kita akan mengetahui validitas
faktor 1, yakni soal-soal untuk materi Bunyi, kita membuat daftar untuk
menyejajarkan kedua skor tersebut sebagai berikut.
TABEL UNTUK MENGHITUNG KESEJAJARAN SKOR FAKTOR 1
DENGAN SKOR TOTAL
Skor faktor 1
Nama Subjek Skor total (Y) X2 Y2 XY
(X)
Amir 6 19 36 361 114
Hasan 7 25 49 625 175
Inda 7 17 49 289 119
Warih 4 12 16 144 48
Irzal 3 29 9 841 87
Gandi 6 23 36 529 138
Santo 5 19 25 361 95
Tini 7 26 49 676 182
Yanti 6 16 36 256 72
Hamid 4 15 16 225 60
Dedi 7 26 49 676 182
Desi 8 30 64 900 240
Wahyu 5 20 25 400 100
Jumlah ... ... ... ... ...
Data yang tertera di dalam tabel tersebut digunakan untum menentukan besarnya
validitas faktor 1. Langkah selanjutnya adalah menjumlahkan setiap kolom,
kemudian dimasukkan ke dalam rumus korelasi product moment. Harga r yang
diperoleh menunjukkan indeks validitas faktor 1. Untuk faktor 2 dan faktor 3
caranya sama, hanya skor faktornya saja yang diganti.
23
H. Menghitung Validitas Menggunakan Excel
1. Input data
2. Pada kolom paling bawah pertanyaan ke 1 ketik =correl(blok dari

B3:B20;kemudian blok dari H3:H20
Kemudian tekan F4 dan tutup kurung.
Kemudian klik enter.

3. Maka hasil nilai r hitung untuk item Q1 adalah 0,691
24
I. Menghitung Validitas Menggunakan SPSS
1. Buka program spss
2. Copy dan pastekan data yang terlebih dahulu diketik pada excel
3. Setelah selesai di input, kemudian klik variabel view, pada kolom label beri
nama, misalnya "x1, x2, x3, x4, x5, x6, total x "
25
4. Klik menu analyze => correlate => bivariate
Akan keluar jendela bivariate correlation
5. Blok semua item dan masukan ke dalam kolom sebelah kanan, centang pada
"pearson" dan "two-tailed" kemudian klik ok
26
6. Maka outputnya sebagai berikut
Untuk melihat validitas X1, dapat dilihat pada baris X1 kolom TOTAL. Sehingga
vaiditas item 1 adalah 0,925.
27
J. Pengertian Reliabilitas (dalam suatu tes)
Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan
dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan
yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian
reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau seandainya
hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti. Konsep
tentang reliabilitas ini tidak akan sulit dimengerti apabila pembaca telah memahami
konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan
diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas ini
tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek yang
tidak lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data
tersebut benar, maka konsep reliabilitas terkait dengan pemotretan berkali-kali.
Instrumen yang baik adalah instrumen yang dapat dengan ajeg memberikan data yang
sesuai dengan kenyataan. Yang sering ditangkap kurang tepat bagi pembaca adalah
adanya pendapat bahwa "ajeg" atau "tetap" diartikan sebagai “sama". Dalam
pembicaraan evaluasi ini tidak demikian. Ajeg atau tetap tidak selalu harus sama,
tetapi mengikuti perubahan secara ajeg. Jika keadaan si A mula-mula berada lebih
rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang, si A juga
berada lebih rendah dari B. Itulah yang dikatakan ajeg atau tetap, yaitu sama dalam
kedudukan siswa di antara anggota kelompok yang Iain. Tentu saja tidak dituntut
semuanya tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas
instrumen. Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan
menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini penting.
Dalam hal ini, validitas lebih penting, dan reliabilitas ini perlu, karena menyokong
terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid. Sebaliknya,
sebuah tes yang valid biasanya reliabel. “A reliable measure in one that provides
consistent and stable indication of the characteristic being investigated.”
Untuk dapat memperoleh gambaran yang ajeg memang sulit karena unsur
kejiwaan manusia itu sendiri tidak ajeg. Misalnya, kemampuan, kecakapan, sikap, dan
sebagainya, berubah-ubah dari waktu ke waktu. Beberapa hal yang sedikit banyak
memengaruhi hasil tes banyak sekali. Namun, secara garis besar dapat dikelompokkan
menjadi 3 (tiga) hal berikut:
28
a. Hal yang Berhubungan dengan Tes Itu Sendiri, yaitu Panjang Tes dan
Kualitas Butir-Butir Soalnya
Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan
dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya
validitas menunjukkan tinggi rendahnya reliabilitas tes. Dengan demikian
maka semakin panjang tes, maka reliabilitasnya semakin tinggi. Dalam
menghitung besarnya reliabilitas berhubung dengan penambahan
banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh
Spearman dan Brown sehingga terkenal dengan rumus Spearman-Brown.
𝑛𝑟
𝑟𝑛𝑛 =
1 + (𝑛 − 1)𝑟
Di mana:
𝑟𝑛𝑛 : besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir-
butir soal baru
n : berapa kali butir-butir soal itu ditambah
r : besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah
Contoh:
Suatu tes terdiri atas 40 butir soal, mempunyai koefisien realibilitas 0,70.
Kemudian butir-butir soal itu ditambah menjadi 60 butir soal. Maka
koefisien realibilitas baru adalah:
𝑛𝑟
𝑟𝑛𝑛 =
1 + (𝑛 − 1)𝑟
1,5 x 0,7
𝑟𝑛𝑛 =
1 + (1,5 − 1)0,7
1,05
𝑟𝑛𝑛 =
1,35
𝑟𝑛𝑛 = 0,79
Demikian maka penambahan sebanyak 20 butir soal dari 40 butir,

memperbesar koefisien reliabilitas sebesar 0,09. Akan tetapi, penambahan
butir-butir soal tes adakalanya tidak berarti, bahkan merugikan. Hal ini
disebabkan karena:
29
1) Sampai pada suatu batas tertentu, penambahan banyaknya butir sudah
tidak menambah tinggi reliabilitas tes. Remmers dan Gage
menggambarkan hubungan antara penambahan butir soal reliabilitas
sebagai berikut.
2) Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan

waktu, biaya, dan tenaga yang dikeluarkan untuk itu. Misalnya guru
sudah cukup membuat 100 soal bentuk objektif dan 10 soal bentuk esai
sudah cukup mempunyai validitas isi dan tingkah laku. Guru tersebut
ingin menambah butir-butir soal sehingga menjadi 200 dan 20 dengan
menambähkan soal-soal yang paralel. Tentu saja hal ini hanya akan
menambah waktu, biaya, dan tenaga saja tanpa ada keuntungan apa-
apa. Kualitas butir-butir soa! ditentukan oleh:
a) Jelas tidaknya rumusan soal.
b) Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak
menimbulkan salah jawab.
c) Petunjuknya jelas sehingga mudah dan cepat dikerjakan.
30
b. Hal yang Berhubungan dengan Tercoba (Testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa
akan mencerminkan keragaman hasil yang menggambarkan besar- kecilnya
reliabilitas tes. Tes yang dicobakan kepada bukan kelompok terpilih, akan
menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada
kelompok tertentu yang diambil secara dipilih.
c. Hal yang Berhubungan dengan Penyelenggaraan Tes

Sudah disebutkan bahwa faktor penyelenggaraan tes yang bersifat
administratif, sangat menentukan hasil tes.
Contoh:
1) Petunjuk yang diberikan sebelum tes dimulai, akan memberikan
ketenangan kepada para tes-tes dalam mengerjakan tes, dan dalam
penyelenggaraan tidak akan banyak terdapat pertanyaan. Ketenangan
ini tentu saja akan berpengaruh terhadap hasil tes.
2) Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh
siswa terhadap tes. Bagi siswa-siswa tertentu adanya pengawasan
yang terlalu ketat menyebabkan rasa jengkel dan tidak dapat dengan
leluasa mengerjakan tes.
3) Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana di
sekelilingnya ramai, dan sebagainya) akan memengaruhi hasil tes.
Adanya hal-hal yang memengaruhi hasil tes ini semua, secara tidak
langsung akan memengaruhi reliabilitas soal tes.
J. Cara-Cara Mencari Besarnya Reliabilitas
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada
subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat
kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus
korelasi product moment untuk mengetahui validitas, kesejajaran kriterium
yang digunakan untuk mengetahui ketetapan ada yang berada di luar tes
(consistency external) dan pada tes itu sendiri (consistency internal).
31
a. Metode Bentuk Paralel (Equivalent)
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya
berbeda. Dalam istilah bahasa Inggris disebut alternate forms method
(parallel forms). Dengan metode bentuk paralel ini, dua buah tes yang
paralel, misalya tes Matematika Seri A yang akan dicari reliabilitasnya dan
tes Seri B diteskan kepada sekelompok siswa yang sama, kemudian hasilnya
dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang
menunjukkan koefisien reliabilitas tes Seri A. Jika koefisiennya tinggi maka
tes tersebut sudah reliabel dan dapat digunakan sebagai alat pengetes yang
terandalkan. Dalam menggunakan metode tes paralel ini pengetes harus
menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok
siswa yang sama. Oleh karena itu, ada orang menyebutkan sebagai double
test-double-trial method. Penggunaan metode ini baik karena siswa
dihadapkan kepada dua macam tes sehingga tidak ada faktor "masih ingat
soalnya" yang dalam evaluasi disebut adanya practice-effect dan carry-over
effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah
mengerjakan soal tersebut. Kelemahan dari metode ini adalah bahwa
pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula
harus tersedia waktu yang lama untuk mencobakan dua kali tes.
b. Metode Tes Ulang (Test-retest Method)

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua
seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya
memiliki satu seri tes, tetapi dicobakan dua kali. Oleh karena tesnya
hanya satu dan dicobakan dua kali, maka metode ini dapat disebut
dengan single-test-double-trial method. Kemudian hasil dari kedua kali
tes tersebut dihitung korelasinya.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan
pemahaman, cara ini kurang mengena karena tercoba akan masih
ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu amara
pemberian tes pertarna dengan kedua menjadi permasalahan tersendiri.
32
Jika tenggang waktu terlalu sempit, siswa masih banyak ingat materi.
Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor atau
kondisi tes sudah akan berbeda, dan siswa sendiri barangkali sudah
mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula
terhadap reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada
hasil tes pertama. Hal ini tidak mengapa karena pengetes harus sadar
akan adanya practice effect dan carry over effect. Yang penting adalah
adanya kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh
koefisien korelasi yang tinggi.
Contoh:
Tes Pertama Tes Kedua
Siswa
Skor Ranking Skor Ranking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4
Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh

semua siswa. Metode ini juga disebut korelasi diri sendiri (self-correlation
method) karena mengkorelasikan hasil dari tes yang sama.
c. Metode Belah Dua atau Sp1it-ha1f Method

Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes dua
kali percobaan diatasi dengan metode ketiga ini, yaitu metode belah dua.
Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes
dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-trial
method.
Berbeda dengan metode pertama dan kedua yang setelah ditentukannya
koefisien korelasi langsung ditafsirkan itulah koefisien realibilitas, maka
dengan metode ketiga ini tidak dapat demikian. Pada waktu membelah dua
33
dan mengkorelasi dua belahan, baru diketahui realibilitas separo tes. Untuk
mengetahui realibiltas selruh tes harus digunakan rumus Spearman-Brown
sebagai berikut:
2𝑟1/2 1/2
𝑟11 =
(1 + 𝑟1/2 1/2 )
Di mana:
𝑟1/2 1/2 = korelasi antara skor-skor setiap belahan tes
𝑟11 = koefisien reabilitas yang sudah disesuaikan
Contoh:
Korelasi antara belahan tes = 0,60
2×0,60 1,20
Maka, realibilitas tes = = = 0,75
1+0,60 1,60
Banyak pemakaian metode ini salah membelah hasil tes pada waktu,
menganalisis. Yang lakukan adalah mengelompokan hasil separo subjek
peserta tes dan separo yang lain kemdian hasil kedua sekelompok ini
dikorelasikan. Yang benar adalah membelah item atau btir soal. Tidak akan
keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir
soal harus genap agar dapat dibelah
Ada dua cara membelah butir soal ini, yaitu:
1) membelah atas item-item genap dan item-item ganjil yang selajutnya
disebut belahan ganjil-genap.
2) membelah atas item-item awal dan item-item akhir yaitu separo jumlah
pada nomor-nomorakhir yang selanjutnya disebut belahan awal-akhir.
Contoh perhitungan reliabilitas dengan metode belah dua

Langkah pertama yang harus dilakukan adalah mengadakan analisis butir soal
yang lebih terkenal dengan nama analisis item. Item yang dapat dijawab
dengan benar diberi skor dan bagi yang salah diberi skor 0. Skor-skor untuk
seluruh subjek dan seluruh item ini diterakan dalam tabel analisis sebagai
berikut:
34
TABEL ANALISIS ITEM TES MATEMATIKA
2, 4,
1, 3, 1, 2, 6, 7,
Nomor Item skor 6, 8,
No Nama 5, 7, 9 3, 4, 5 8, 9, 10
total 10
1 2 3 4 5 6 7 8 9 10 Ganjil Genap Awal Akhir
1 Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5
2 Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3
3 Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3
4 Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2
5 Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1
6 Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1
7 Susana 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2
8 Helen 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5
Kertas yang digunting bergigi seperti di sebelah ini dapat digunakan sebagai
alat bantu dalam menentukan jumlah skor pada item ganjil dan jumlah skor
pada item genap. Bagian berlekuk dapat dipaskan pada item-item genap
ataupun item-item ganjil. Jika sudah diketahui jumlah skor pada item ganjil,
otomatis diketahui jumlah skor.
Pada item genap karena skor totalnya sudah diketahui terlebih dahulu. Kertas
bergigi ini ditempelkan tepat mulai skor siswa pertama, kemudian digeser ke
bawah hingga siswa terakhir.
Penyajian contoh membelah di atas berarti bahwa perhitungan reliabilitas
dilakukan dengan membelah dengan dua cara. Pembelahannya hanya memilih
salah satu saja, untuk selanjutnya dihitung dengan korelasi product moment.
35
1) Pembelahan ganjil-genap
Tabel persiapan perhitungan reabilitas dengan belah dua ganjil-genap
adalah sebagai berikut:
Item ganjil Item genap

No. Nama (1,3,5,7,9) (2,4,6,8,10)
(X) (Y)
1. Hartati 5 3
2. Yoyok 3 2
3. Oktaf 0 4
4. Wendi 3 2
5. Diana 3 3
6. Paul 4 0
7. Susana 4 3
8. Helen 3 5
Kelanjutan dari tabel ini adalah menghitung dengan rumus korelasi
product moment.
Dengan menggunakan kalkulator diketahui dengan bahwa:
∑ 𝑋 = 25 ∑ 𝑋 2 = 93
∑ 𝑌 = 22 ∑ 𝑌 2 = 76
∑ 𝑋𝑌 = 63
Setelah dihitung dengan rumus korelasi product moment dengan angka
kasar diketahui bahwa rxy = -0,3786. Harga tersebut baru menunjukkan
reliabilitas separo tes. Oleh karena itu, rxy untuk belahan ini disebt
dengan istilah r1/21/2 atau rgg singkatan dari rganjil-genap*. Untuk mencari
reliabiliti seluruh tesnya dignakan rumus Spearman-Brown yang
rumusnya telah dikemukakan didepan. Jika koefisien reliabilitas separo
tes ini dimasukan kedalam rumus hitungannya:
2𝑟1/2 1/2 −0,7572
𝑟11 = =
(1 + 𝑟1/2 1/2 ) 1,3786
2 × −0,3786 = −0,5493
=
1 + (−0,3786)
*) Pengurangan merupakan bilangan dengan harga mutlak, jadi tidak mengenal negatif.
36
2) Pembelahan awal-akhir
Dengan data yang tertera pada Tabel analisis item tes Matematika
diketahui jumlah skor belahan awal-akhir sebagai berikut:
Item ganjil Item genap

No. Nama (1,3,5,7,9) (2,4,6,8,10)
(X) (Y)
1. Hartati 3 5
2. Yoyok 2 3
3. Oktaf 1 3
4. Wendi 3 2
5. Diana 5 1
6. Paul 3 1
7. Susana 5 2
8. Helen 3 5
Seperti halnya pada waktu menghitung dengan belahan ganjil genap

maka kelanjutannya adalah menghitung dengan rumus korelasi product
moment.
Dengan menggunakan kalkulator
∑ 𝑋 = 25 ∑ 𝑋 2 = 93
∑ 𝑌 = 22 ∑ 𝑌 2 = 76
∑ 𝑋𝑌 = 63
Setelah dihitung ke dalam rumus korelasi product moment dengan
angka kasar diperoleh r1/2 1/2 = -0,3831. Dengan rumus Spearman-
Brown diperoleh r11 = -0,5538.
Selain menggunakan rumus korelasi product moment, dua orang ahli
mengajukan rumus lain. Seorang bernama Flanangan menemukan
rumus yang perhitungannya menggunakan belah dua ganjil-genap, dan
seorang lagi bernama Rulon yang rumusnya diterapkan pada data
belahan awal-akhir.
37
3) Penggunaan rumus Flanangan
Rumus
𝑆12 + 𝑆22
𝑟11 = 2 (1 − )
𝑆𝑡2
Di mana:
𝑟11 = reliabilitas tes
𝑆12 = variansi belahan pertama (1) yang dalam hal ini varians skor
item ganjil
𝑆22 = variansi belahan kedua (2), yaitu varians skor item genap
𝑆𝑡2 = variansi total yaitu varians skor total
Sekarang sederhana dapat dipahami bahwa variansi adalah standar
deviasi kuadrat. Dengan demikian bagi peminat yang menghitung
dengan kalkulator statistik varians ini diperoleh dengan
mengkuadratkan standar deviasi. Untk mereka yang tidak
menggunakan kalkulator statistik maka varians dapat dicari dengan
rumus sebagai berikut:
2
(∑ 𝑋)
2
∑𝑋 −
𝑆2 = 𝑁
𝑁
Standar Deviasi (SD) dapat disebut dengan istilah Indonesia
Simpangan Baku (SB). Namun huruf S (B besar) juga dapat
dikatakan sudah menyebutkan standar deviasi. Dalam kalkulator
tertera dengan simbol a. Bagi yang berminat mencari S dulu untuk
mencari varians, dapat menggunakan rumus S, yaitu:
√∑ 𝑋 2
𝑆=
𝑁
Di mana:
S = Standar deviasi
X = Simpangan X dan 𝑋̅, yang dicari dari X-𝑋̅
S2 = Varians, setelah dituliskan dalam bentuk kuadrat, karena standar
deviasi kuadrat
N = Banyaknya subjek pengikut tes
38
Berdasarkan data tabel belahan ganjil-genap perhitungannya adalah
sebagai berikut:
252
93 − 8
𝑆12 =
8
93 − 78,125
=
8
= 1,859
222
76 − 8
𝑆22 =
8
76 − 60,5
=
8
= 1,937
472
295 − 8
𝑆𝑡2 = (Diambil dari tabel yang ada skor total)
8
295 − 276,13
=
8
= 2,36
Dimasukan ke dalam rumus diperoleh demikian

1,859 + 1,937
𝑟11 = 2 (1 − )
2,359
= (2 − 1,609)
= −1,218
4) Penggunaan rumus Rulon
Rumus
𝑆𝑑2
𝑟11 = 1 −
𝑆𝑡2
Di mana:
𝑆𝑑2 = varians beda (varians different)
D = difference, adalah perbedaan antara skor belahan pertama (awal)
dengan skor belahan kedua (akhir)
39
Untuk memperjelas keterangan, maka tabel belahan awal-akhir dikutip
disini lagi
No. Nama Awal Akhir D
1. Hartati 3 5 -2
2. Yoyok 2 3 -1
3. Oktaf 1 3 -2
4. Wendi 3 2 1
5. Diana 5 1 4
6. Paul 3 1 2
7. Susana 5 2 3
8. Helen 3 5 -2
Dengan kalkulator atau hitungan biasanya diketahui bahwa:

∑𝑑 = 3
∑ 𝑑2 = 43
Dari perhitngan terdahulu diketahui varians total = 2,75
2
(∑ 𝑑)
∑ 𝑑2 −
𝑆𝑑2 = 𝑁
𝑁
32
43 − 8
=
8
43 − 1,125
=
8
= 5,234
Dimasukkan ke dalam rumus Rulon
5,234
𝑟11 = 1 −
2,36
= 1 −2,218
=-1,218
40
Dari perhitungan dengan rumus Flanagan maupun Rulon ternyata
hasilnya sama, keduanya lebih besar dari 1,00. Secara teoretik koefisien
ini salah tetapi karena pembulatan-pembulatan dalam perhitungan,
seperti dijelaskan di depan, hasil seperti ini dapat saja terjadi.
Telah disinggung di bagian depan bahwa salah satu syarat untuk dapat
menggunakan metode belah dua adalah bahwa banyaknya item harus
genap agar dapat dibelah. Syarat yang kedua, item yang membentuk
soal tes harus homogen atau paling tidak setelah dibelah terdapat
keseimbangan antara belahan pertama dengan belahan kedua.
Untuk mengatasi kesulitan memenuhi persyaratan ini maka reliabilitas
dapat dicari dengan rumus yang diketemukan oleh Kuder dan
Richardson. Kedua orang ahli ini menemukan banyak rumus yang
diberi nomor. Rumus yang digunakan untuk mencari reliabilitas dan
banyak digunakan orang ada dua rumus, yaitu rumus K-R. 20 dan
rumus K-R. 20
5) Penggunaan rumus K-R 20
𝑛 𝑆 2 − ∑ 𝑝𝑞
𝑟11 =( )( )
𝑛−1 𝑆2
Dimana:
𝑟11 = reliabilitas tes secara keseluruhan
𝑝= proporsi sbjek yang menjawab item dengan benar
𝑞= proporsi sbjek yang menjawab item dengan salah (q = 1-p)
∑ 𝑝𝑞= jmlah hasil perkalian anatara p dan q
𝑛 = banyaknya item
𝑆= standar deviasi dari tes (standar deviasi adalah akar varians)
41
TABEL PERHITUNGAN MENCARI RELIABILITAS
TES DENGAN RUMUS K-R.20
Nomor Item
No Nama Skor Total
1 2 3 4 5 6 7
1 Wardayo 1 0 1 1 1 1 0 5
2 Benny 0 1 1 0 1 1 1 5
3 Hanafi 0 0 0 0 1 0 1 2
4 Rahmad 0 1 1 1 1 1 1 6
5 Tanti 1 0 0 0 1 0 0 2
6 Nadia 0 1 1 1 1 0 0 4
7 Tini 0 0 0 1 1 1 0 3
8 Budi 0 1 0 1 1 0 0 3
9 Daron 0 1 0 1 1 0 0 3
10 Yakob 0 0 0 1 1 0 0 2
Np 2 5 4 7 10 4 3 35
P 0,2 0,5 0,4 0,7 1 0,4 0,3
Q 0,8 0,5 0,6 0,3 0 0,6 0,7
Pq 0 1,31(∑ 𝑝𝑞)
Dimasukkan ke dalam rumus K-R. 20

𝑛 𝑆 2 − ∑ 𝑝𝑞 7 0,54
𝑟11 = ( )( ) = ×
𝑛−1 𝑆2 6 1,85
7 1,362 − 1,31 = 1,17 × 0,29
= ×
6 1,36 = 0,3415 ≈ 0,342
42
6) Penggunaan rumus K-R.21
Rumus K-R. 21:
𝑛 𝑀(𝑛 − 𝑀)
𝑟11 = ( ) (1 − )
𝑛−1 𝑛𝑆𝑡2
Keterangan:
M = Mean atau rerata skor total
7 3,5(7 − 3,5)
𝑟11 = (1 − )
7−1 7 × 1,85
3,5 × 3,5
= 1,17 (1 − )
12,95
12,25
= 1,17 (1 − )
12,95
= 1,17(1 − 0,946)
= 1,17 × 0,0541
= 0,06329 ≈ 0,0633
Jika dibandingkan reliabilitas yang dihitung dengan K-R. 20 dan K-R.
21 lebih besar yang pertama. Memang menggunakan rumus K-R. 20
cenderung memberikan hasil yang lebih tinggi, tetapi pekerjaannya
lebih rumit.
7) Penggunaan rumus Hoyt
𝑉 𝑉2 −𝑉𝑠
Rumus: 𝑟11 = 1 − 𝑉𝑠 atau 𝑟11 =
𝑟 𝑉𝑟
Keterangan:
𝑟11 = Reliabilitas seluruh soal
𝑉𝑟 = Varians responden
𝑉𝑠 = Varians sisa
Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-
langkah sebagai berikut:
Langkah 1. Mencari jumlah kuadrat responden dengan rumus:
∑ 𝑋𝑡2 (∑ 𝑋𝑡 )2
𝐽𝐾(𝑟) = −
𝑘 𝑘×𝑁
Keterangan:
𝐽𝐾(𝑟) =jumlah kuadrat responden
𝑋𝑡 =Skor total tiap responden
43
K =Banyaknya item
N =banyaknya responden atau subjek
Langkah 2. Mencari jumlah kuadrat item dengan rumus.
∑ 𝐵 2 (∑ 𝑋𝑡 )2
𝐽𝐾(𝑖) = −
𝑁 𝑘×𝑁
𝐽𝐾(𝑖) =jumlah kuadrat responden
∑ 𝐵2 =Skor total tiap responden
(∑ 𝑋𝑡 )2 =Kuadrat dari jumlah skor total
Langkah 3. Mencari jumlah kuadrat total dengan rumus.
(∑ 𝐵)(∑ 𝑆)
𝐽𝐾(𝑡) =
∑ 𝐵) + (∑ 𝑆)
𝐽𝐾(𝑡) =jumlah kuadrat total
∑𝐵 =jumlah jawab benar seluruh item
∑𝑆 = jumlah jawab salah seluruh item
Langkah 4. Mencari jumlah kuadrat sisa, dengan rumus.
𝐽𝐾(𝑡) = 𝐽𝐾(𝑡) − 𝐽𝐾(𝑟) − 𝐽(𝑖)
Langkah 5. Mencari Varians responden dan varians sisa dengan tabel
F
Dalam mencari Varians ini diperlukan d.b (derajat kebebasan) dari
masing-masing sumber varians kemudian d.b ini digunakan sebagai
penyebut terhadap setiap jumlah kadrat untuk memperoleh variasi.
d.b = banyaknya N setiap smber variansi dikran 1.
𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡
𝑣𝑎𝑟𝑖𝑎𝑛𝑠𝑖 =
𝑑. 𝑏
Langkah 6. Memasukkan ke dalam rumus r11
Contoh perhitungan:
Dengan menggnakan tael analisis item yang dignakan ntuk mencari
reliabiliti tes dengan rmus K-R.20 dapat dicari reliabiliti dengan rumus
Hoyt.
Namun karena bilangan-bilangan yang diperlukan dalam tabel tersebut
belum lengkap, kiranya lebih baik jika dikutipkan sekali lagi dalam abel
berikutnya:
44
TABEL ANALISIS ITEM UNTUK MENCARI RELIABILITAS DENGAN
RUMUS HOYT
Kuadrat
Skor
skor
Nomor Item Total
No Nama total
(X)
(X2)
1 2 3 4 5 6 7
1 Wardoyo 1 0 1 1 1 1 0 5 25
2 Benny 0 1 1 0 1 1 1 5 25
3 Hanafi 0 0 0 0 1 0 1 2 4
4 Rahmad 0 1 1 1 1 1 1 6 36
5 Tanti 1 0 0 0 1 0 0 2 4
6 Nadia 0 1 1 1 1 0 0 4 16
7 Tini 0 0 0 1 1 1 0 3 9
8 Budi 0 1 0 1 1 0 0 3 9
9 Daron 0 1 0 1 1 0 0 3 9
10 Yakob 0 0 0 1 1 0 0 2 4
jumlah
2 5 4 7 10 4 3 35 141
jawab benar
kuadrat
jumlah 4 25 16 49 100 16 9
jawab benar
jumlah
kuadrat 219
jawab benar
Jumlah
8 5 6 3 0 6 7 35
jawab salah
45
Berdasarkan tabel ini dapat dicari reliabilitas soal dengan rumus Hoyt melalui
langkah-langkah sebagai berikut :
1. Mencari jumlah kuadrat responden

∑ 𝑋𝑡2 (∑ 𝑋𝑡 )2
𝐽𝑘(𝑟) = −
𝑘 𝑘𝑁
141 352
𝐽𝑘(𝑟) = −
7 7 × 10
𝐽𝑘(𝑟) = 20,143 − 17,5
𝐽𝑘(𝑟) = 2,643
2. Mencari jumlah kuadrat item

∑ 𝐵 2 (∑ 𝑋𝑡 )2
𝐽𝑘(𝑖) = −
𝑁 𝑘𝑁
219 352
𝐽𝑘(𝑖) = −
10 7 × 10
𝐽𝑘(𝑖) = 21,9 − 17,5
𝐽𝑘(𝑖) = 4,4
3. Mencari kumlah kuadrat total

(∑ 𝐵)(∑ 𝑆)
𝐽𝑘(𝑡) =
(∑ 𝐵) + (∑ 𝑆)
(35)(35)
𝐽𝑘(𝑡) =
(35) + (35)
1225
𝐽𝑘(𝑡) =
70
𝐽𝑘(𝑡) = 17,5
4. Mencari jumlah kuadrat sisa

𝐽𝑘(𝑠) = 𝐽𝑘(𝑡) − 𝐽𝑘(𝑟) − 𝐽𝑘(𝑖)
𝐽𝑘(𝑠) = 17,5 − 2,643 − 4,4
𝐽𝑘(𝑠) = 10,457
5. Mencari Varians respondendan Varians sisa dengan tabel F
46
Sumber Variansi Jumlah Kuadrat d.b Varians
9 2,643
Responden 2,643 = 0,294
9
(10-1)
6 4,4
Item 4,4 = 0,733
6
(7-1)
54 10,457
Sisa 10,457 = 0,1936
(69-9-6) 54
69
Total 17,5
(70-1)
Untuk mencari d.b sisa, harus dicari d.b total dahulu baru dikurangi d.b
responden dan d.b item
 d.b total = 𝑘 × 𝑁 − 1 × 10 − 1 = 70 − 1 = 69
 d.b responden = 𝑁 − 1 = 10 − 1 = 9
 d.b item =𝑘−1=7−1=6
 d.b sisa = d.b total – d.b responden – d.b item
= 69 – 9 – 6 = 54
6. Memasukkan ke dalam rumus

𝑉𝑠
𝑟11 = 1 −
𝑉𝑟
0,1936
𝑟11 =1−
0,294
𝑟11 = 1 − 0,658 = 0,342
K. Mencari reliabilitas tes bentuk uraian
Sesuatu butir soal uraian menghendaki gradualisasi penilaian. Barangkali butir
soal nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai
tertinggi hanya 5, dan butir soal nomor 3 sampai 10, dan sebagainya.
Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan
analisis butir soal seperti halnya soal bentuk objektif. Skor untuk masing-
masing butir soal dicantumkan pada kolom item menurut apa adanya. Rumus
yabf digunakan adalah rumus Alpha sebagai berikut:
47
𝑛 ∑ 𝜎𝑖2
𝑟11 = ( ) (1 − 2 )
𝑛−1 𝜎𝑡
Keterangan:
r11 = reliabilitas yang dicari
∑ 𝜎𝑖2 = jumlaah varians skor tiap-tiap item
𝜎𝑡2 = varians total
Contoh perhitungan mencari reliabilitas
Skor
Kuadrat skor
Nomor Item Total
No Nama total (X2)
(X)
1 2 3 4 5 6
1 A 10 6 8 8 10 10 52 2704
2 B 6 4 4 6 6 5 31 961
3 C 8 2 6 8 7 8 39 1521
4 D 7 3 7 7 6 6 36 1296
5 E 0 5 3 2 4 4 18 324
6 F 2 4 2 8 6 8 30 900
7 G 4 3 6 6 6 6 31 961
8 H 5 5 5 7 7 7 36 1296
9 I 5 5 4 6 8 5 33 1089
10 J 3 6 3 4 6 6 28 784
jumlah 50 43 48 62 66 65 334 11836
jumlah
328 201 264 418 458 451 2120
kuadrat
2120 = jumlah dari jumlah kuadrat setiap soal

11836 = jumlah kuadrat skor total
Dengan data yang tertera dalam tabel, dicari varians tiap-tiap item dahulu,
baru dijumlahkan.
48
Perlu diingat lagi rumus varians yang sudah dikenal sebelumnya, yaitu:
(∑ 𝑋)2
∑ 𝑋2 −
𝜎2 = 𝑁
𝑁
atau
2
∑ 𝑋𝑡2 (∑ 𝑋𝑡 )2
𝜎 = −
𝑁 𝑁
502
328 −
2
𝜎(1)∗ = 10 = 328 − 250 = 78 = 7,8
10 10 10
432
201 −
2
𝜎(2)∗ = 10 = 201 − 184,9 = 16,1 = 1,61
10 10 10
482
264 −
2
𝜎(3)∗ = 10 = 328 − 250 = 33,6 = 3,36
10 10 10
622
418 −
2
𝜎(4)∗ = 10 = 418 − 435,6 = 33,6 = 3,36
10 10 10
662
458 −
2
𝜎(5)∗ = 10 = 458 − 435,6 = 22,4 = 2,24
10 10 10
652
451 −
2
𝜎(6)∗ = 10 = 451 − 422,5 = 28,5 = 2,85
10 10 10
Jumlah varians semua item ∑ 𝜎𝑖2 = 7,8 + 1,61 + 3,36 + 2,24 + 2,85 = 21,22
(∑ 𝑋)2
∑ 𝑋2−
𝑁
Varian total = 𝑁
3342 680,4
11836 − =
= 10 10
10
= 68,04
11836 − 11155,6
=
10
*)dalam tanda kurung menunjukan nomor item
49
Dimasukkan ke dalam rumus alpha
6 21,22
𝑟11 = ×1
6−1 68,04
6
= × (1 − 0,312)
5
6
= × 0,688
5
= 0,8256 ≈ 0,8826
Dengan diperolehnya koefisien korelasi, yakni r11 sebenarnya baru

diketahui tinggi-rendahnya koefisien tersebut. Lebih sempurnanya
perhitungan reliabilitas sampai pada kesimpulan, sebaiknya penghitungan
reliabilitas sampai pada kesimpulan, sebaiknya hasil tersebut
dikonsultasikan dengan tabel r product moment.
L. Menggunakan SPSS untuk Menghitung Reliabilitas

a. Deskripsi
Sebagai contoh : sebuah kuesioner yang terdiri dari 6 butir pertanyaan
(item) yang telah dijawab oleh 10 orang responden. Jawaban 1 berarti
sangat setuju, 2 = setuju, 3 = biasa, 4 = tidak setuju, 5 = sangat tidak setuju.
Data yang diperoleh adalah :
Item Item Item Item Item Item

Resp. 6
1 2 3 4 5
1 2 3 1 3 4 2
2 1 2 1 1 3 1
3 4 3 4 5 3 3
4 5 3 2 4 3 2
5 2 1 2 2 1 1
6 3 3 1 3 3 1
50
7 4 5 2 3 4 2
8 2 1 2 2 1 1
9 2 2 2 2 2 2
10 3 4 2 5 4 2
b. Prosedur
Reliabilitas kuesioner dapat dihitung dengan menggunakan faktor analisis
dengan langkah-langkah sebagai berikut.
1) Aktifkan SPSS
2) Pilih View Data dan ketik skor siswa sehingga diperoleh data seperti
pada gambar berikut:
3) Pilih Item1 sampai dengan Item6 untuk dimasukkan ke dalam

“variable” seperti pada gabar berikut:
51
4) Selanjutnya pilih Analyze  Scale  Reliability seperti pada gambar
berikut:
5) Pilih salah satu metode : Alpha, Split-half, Guttman, Parallel, atau

Strictly Parallel
6) Kilk “OK” untuk memulai analisis.
c. Hasil
Hasil yang diperoleh dari analisis di atas adalah sebagai berikut:
1) Alpha
52
2) Split-half
3) Parallel
d. Interpretasi Hasil
Berdasarkan output SPSS di atas, tampak bahwa reliabilitas
kuesioner menurut metode Alpha Cronbach sebesar 0.858, menurut
metode Split-Half sebesar 0.910, sedangkan berdasarkan metode
Parallel adalah 0.890. tampak bahwa ketiga metode menghasilkan
nilai reliabilitas yang hampir sama. Dengan demikian, kita memiliki
kebebasan untuk memilih salah satu metode.
53
BAB III
KESIMPULAN
Berdasarkan isi dari pembahasan di atas maka dapat disimpulkan bahwa:

a. Suatu alat penilaian dikatakan mempunyai kualitas yang baik apabila alat
tersebut memiliki atau memenuhi yakni ketepatan atau validitasnya.
b. Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep yang
dinilai sehingga betul-betul menilai apa yang yang seharusnya dinilai. Penilaian
tersebut tidak tepat (valid). Alat penilaian yang telah valid untuk suatu tujuan
tertentu belum otomatis akan valid untuk tujuan yang lain.
c. Validitas terkait dengan ketepatan objek yang tidak lain adalah tidak
menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka
konsep reliabilitas terkait dengan pemotretan berkali-kali.
54
DAFTAR PUSTAKA
Arikunto, Suharsimi. 2012. Dasar-Dasar Evaluasi Pendidikan. Jakarta : Bumi

Aksara.
Azwar, S. 1986. Reliabilitas dan Validitas : Interpretasi dan Komputasi.
Yogyakarta : Liberty.
Hamzah, Ali. 2014. Evaluasi Pembelajaran Matematika. Jakarta : Rajawali Pers.
55

MAKALAH VALIDITAS 4 New 1

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

MAKALAH VALIDITAS 4 New 1

Diunggah oleh

Hak Cipta:

Format Tersedia

VALIDITAS DAN RELIABILITAS

Untuk memenuhi nilai tugas mata kuliah Evaluasi Pembelajaran

Program Studi Pendidikan Matematika

C. Cara Mengetahui Validitas Alat Ukur

2 Rangga 7 6,8 49 46,24 47,6

Dimasukkan ke dalam rumus:

Angka korelasi Klasifikasi

Penafsiran angka koefisien korelasi ada dua cara, yaitu:

Untuk tahu bagaimana cara menggunakan tabel r dapat menggunakan contoh

D. Validitas Butir Soal atau Validitas Item

Sesudah diketahui ∑ 𝑋,∑ 𝑋 2 ∑ 𝑌, ∑ 𝑌 2 , dan ∑ 𝑋𝑌 tinggal memasukkan bilangan-

296−276 rxy = 0,42

3. Dari kalkulator diperoleh harga standar deviasi, yaitu

6,17 − 5,75 0,75

instrumen tes pilihan ganda serta benar-salah.

E. Menentukan Bukti Validitas Soal Uraian

2. Pada kolom paling bawah pertanyaan ke 1 ketik =correl(blok dari

Kemudian tekan F4 dan tutup kurung.

Kemudian klik enter.

Demikian maka penambahan sebanyak 20 butir soal dari 40 butir,

2) Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan

c. Hal yang Berhubungan dengan Penyelenggaraan Tes

b. Metode Tes Ulang (Test-retest Method)

Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh

c. Metode Belah Dua atau Sp1it-ha1f Method

Contoh perhitungan reliabilitas dengan metode belah dua

Item ganjil Item genap

Item ganjil Item genap

Seperti halnya pada waktu menghitung dengan belahan ganjil genap

Dimasukan ke dalam rumus diperoleh demikian

Dengan kalkulator atau hitungan biasanya diketahui bahwa:

Dimasukkan ke dalam rumus Rulon

P 0,2 0,5 0,4 0,7 1 0,4 0,3

Q 0,8 0,5 0,6 0,3 0 0,6 0,7

Dimasukkan ke dalam rumus K-R. 20

1. Mencari jumlah kuadrat responden

2. Mencari jumlah kuadrat item

3. Mencari kumlah kuadrat total

4. Mencari jumlah kuadrat sisa

5. Mencari Varians respondendan Varians sisa dengan tabel F

6. Memasukkan ke dalam rumus

Contoh perhitungan mencari reliabilitas

2120 = jumlah dari jumlah kuadrat setiap soal

*)dalam tanda kurung menunjukan nomor item

Dengan diperolehnya koefisien korelasi, yakni r11 sebenarnya baru

L. Menggunakan SPSS untuk Menghitung Reliabilitas

Item Item Item Item Item Item

3) Pilih Item1 sampai dengan Item6 untuk dimasukkan ke dalam

5) Pilih salah satu metode : Alpha, Split-half, Guttman, Parallel, atau

6) Kilk “OK” untuk memulai analisis.

Berdasarkan isi dari pembahasan di atas maka dapat disimpulkan bahwa:

Arikunto, Suharsimi. 2012. Dasar-Dasar Evaluasi Pendidikan. Jakarta : Bumi

Anda mungkin juga menyukai