MAKALAH VALIDITAS 4 New 1
MAKALAH VALIDITAS 4 New 1
Oleh:
Monica Flaviyana 151414080
Priska Godeliva 151414093
Dionisius Angga Kurniawan 151414098
Laurent Simangunsong 151414100
Geovani Debby Setyani 151414104
2
BAB I
PENDAHULUAN
A. Latar Belakang
Dalam suatu proses pembelajaran, hal yang tidak kalah penting adalah
proses evaluasi pembelajaran. mengevaluasi dapat diumpamakan sebagi
pekerjaan memotret. Gambar potret atau foto dikatakan baik apabila sesuai
dengan aslinya. Gambar pemotretan hasil evaluasi tersebut di dalam kegiatan
evaluasi dikenal dengan data evaluasi. Data evaluasi yang baik sesuai dengan
kenyataan disebut data yang valid. Agar dapat diperoleh data yang valid,
instrumen atau alat untuk mengevaluasinya harus valid pula. Jika pernyataan
tersebut valid, instrumen evaluasi dituntut untuk valid karena diinginkan dapat
diperoleh data yang valid. Dengan kata lain, instrumen evaluasi dipersyaratkan
valid agar hasil yang diperoleh dari kegiatan evaluasi valid. Dengan kata lain,
instrumen evaluasi dipersyaratkan valid agar hasil yang diperoleh dari kegiatan
evaluasi valid. Selain tes tersebut harus valid, syarat dari sebuah tes adalah dapat
menghasilkan hasil yang tetap atau bisa disebut dengan reliabilitas. Pada
makalah ini akan dibahas mengenai Validitas dan Reliabilitas.
B. Rumusan Masalah
1. Apa yang dimaksud dengan validitas dan reliabilitas?
2. Apa saja macam-macam validitas?
3. Bagaimana cara menentukan validitas?
4. Bagaimana cara menentukan reliabilitas?
5. Bagaimana cara menggunakan EXCEL dan SPSS untuk menghitung
validitas dan reliabilitas?
C. Tujuan
1. Mengetahui pengertian validitas dan reliabilitas.
2. Mengetahui macam-macam validitas.
3. Mengaplikasikan cara menentukan validitas pada sebuah tes.
4. Mengaplikasikan cara menentukan reliabilitas pada sebuah tes.
5. Mengaplikasikan cara menggunakan EXCEL dan SPSS untuk
menghitung validitas dan reliabilitas.
3
BAB II
PEMBAHASAN
A. Pengertian Validitas
Dalam Hamzah (2014) validitas berasal dari kata validity yang mempunyai
arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya.
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas
yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau
memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran
tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data
yang tidak relevan dengan tujuan pengukuran.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Terkandung di sini pengertian bahwa ketepatan validitas pada suatu
alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan
pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk
mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai
variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes
yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai
variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas
rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel
A’ atau B (Azwar 1986).
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran.
Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan
tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut.
Cermat berarti bahwa pengukuran itu dapat memberikan gambran mengenai
perbedaan yang sekecil-kecilnya mengenai perbedaan yang satu dengan yang lain.
Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui
berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas
agar hasil penimbangannya valid, yaitu tepat dan cermat. Sebuah alat penimbang
badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna
4
menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat
emas itu tidak akan terlihat pada alat ukur berat badan.
Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek
tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan
menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat
kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai
angka yang sebenarnya atau angka yang mendekati keadaan yang sebenarnya
(Azwar 1986).
Validitas suatu instrumen berkaitan dengan kemampuan instrument itu
untuk mengukur atu mengungkap karakteristik dari variabel yang dimaksudkan
untuk diukur. Instrumen yang dimaksudkan untuk mengukur sikap konsumen
terhadap suatu iklan, misalnya, harus dapat menghasilkan skor sikap yang memang
menunjukkan sikap konsumen terhadap iklan tersebut. Jadi, jangan sampai hasil
yang diperoleh adalah skor yang menunjukkan minat konsumen terhadap iklan itu.
Validitas suatu instrumen banyak dijelaskan dalam konteks penelitian
sosial yang variabelnya tidak dapat diamati secara langsung, seperti sikap, minat,
persepsi, motivasi, dan lain sebagainya. Untuk mengukur variabel yang demikian
sulit, untuk mengembangkan instrumen yang memiliki validitas yang tinggi karena
karakteristik yang akan diukur dari variabel yang demikian tidak dapat diobservasi
secara langsung, tetapi hanya melalui indikator (petunjuk tak langsung) tertentu.
(Aritonang R. 2007).
B. Macam-Macam Validitas
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Hal yang pertama akan diperoleh validitas logis (logical validity) dan
hal yang kedua diperoleh validitas empiris (empirical validity). Dua hal inilah yang
dijadikan dasar pengelompokan validitas tes.
Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas
empiris.
a. Validitas Logis
Istilah “validitas logis” mengandung kata “logis” yang berasal dari
kata “logika” , yang berarti penalaran. Dengan makna demikian, maka
5
validitas logis untuk sebuah instrumen evaluasi menunjukkan pada kondisi
bagi sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil
penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrumen
yang bersangkutan sudah dirancang secara baik, mengikuti teori dan
ketentuan yang ada.Sebagaimana pelaksanaan tugas lain misalnya membuat
sebuah karangan, jika penulis sudah mengikuti aturan mengarang, tentu
secara logis karangannya sudah baik.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen, yaitu validitas isi dan validitas konstrak (construct validity).
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah
instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi.
Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi
sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek kejiwaan
yang seharusnya dievaluasi.
1. Validitas Isi
Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan
khusus tertentu yang sejajar dengan materi atau isi pelajaran yang
diberikan. Menurut Hamzah (2014), validitas isi suatu tes
mempermasalahkan seberapa jauh suatu tes mengukur tingkat
penguasaan terhadap isi suatu materi tertentu yang seharusnya dikuasai
sesuai dengan tujuan pengajaran. Oleh karena materi yang diajarkan
tertera dalam kurikulum, maka validitas isi ini sering juga disebut
validitas kurikuler. Validitas isi dapat diusahakan tercapainya sejak saat
penyusunan dengan cara merinci materi kurikulum, buku pelajaran.
Validitas isi dapat diukur dengan membandingkan antara isi instrument
dengan materi pelajaran yang telah ditetapkan.
2. Validitas Konstruksi
Menurut Hamzah (2014), validitas konstruk adalah validitas yang
mempermasalahkan seberapa jauh item-item tes mampu mengukur apa
yang hendak benar-benar hendak diukur sesuai dengan konsep khusus
atau definisi konseptual yang telah ditetapkan.
6
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir
soal yang membangun tes tersebut mengukur setiap aspek berpikir
seperti yang disebutkan dalam tujuan instruksional khusus (indikator).
Dengan kata lain, jika butir-butir soal mengukur aspek berpikir tersebut
sudah sesuai dengan aspek berpikir yang menjadi tujuan instruksional
(indikator). Sebagai contoh, jika rumusan tujuan instruksional khusus :
“Siswa dapat membandingkan antara efek biologis dan efek
psikologis”, maka butir soal pada tes merupakan perintah agar siswa
membedakan antara dua efek tersebut.
Kosntruksi dalam pengertian ini bukanlah “susunan” seperti yang
sering dijumpai dalam teknik, tetapi merupakan rekaan psikologis,
yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang dengan
suatu cara tertentu “memerinci” isi jiwa atas beberapa aspek seperti
ingatan (pengetahuan), pemahaman, aplikasi dan seterusnya. Dalam hal
ini, mereka menganggap seolah-olah jiwa dapat dibagi-bagi, tetapi
sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan
sementara untuk mempermudah mempelajari.
Untuk menguji validitas konstruksi, maka dapat digunakan pendapat
dari ahli (judgment expert).
b. Validitas Empiris
Istilah validitas empiris memuat kata “empiris” yang artinya
pengalaman. Sebuah instrumen dapat dikatakan memiliki validitas empiris
apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari, seseorang
dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan
bahwa orang tersebut memang jujur. Contoh lain, seseorang dapat dikatakan
kreatif apabila dari pengalaman dibuktikan bahwa orang tersebut sudah
banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang
sudah ada. Dari penjelasan dan contoh-contoh tersebut, diketahui bahwa
validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen
berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan
melalui pengalaman.
7
Ada dua macam validitas empiris, yakni ada dua cara yang dapat
dilakukan untuk menguji bahwa sebuah instrumen memang valid.
Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen
yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang
digunakan sebagai pembanding kondisi instrumen dimaksud ada dua, yaitu
yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu yang
akan datang. Bagi instrumen yang kondisinya sesuai dengan kriterium yang
sudah tersedia, yang sudah ada, disebut memiliki validitas “ada sekarang”.
Selanjutnya, instrumen yang kondisinya sesuai dengan kriterium yang
diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas
prediksi.
1. Validitas “ada sekarang” (Konkuren)
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes
dikatakan memiliki validitas empiris, jika hasilnya sesuai dengan
pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang
dipasangkan. Dalam hal ini, hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau
sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang).
Dalam hal membandingkan hasil sebuah tes, maka diperlukan suatu
kriterium atau alat banding. Contoh : Seorang guru ingin mengetahui
apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini
diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki.
Misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.
2. Validitas Prediksi
Menurut Hamzah (2014), validitas prediksi adalah tes yang mempunyai
kemampuan meramalkan apa yang akan terjadi pada masa yang akan
datang. Sebuah tes dikatakan memiliki validitas prediksi apabila
mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada
masa yang akan datang. Misalnya tes masuk perguruan tinggi adalah
sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta
tes dalam mengikuti kuliah di masa yang akan datang. Calon yang
tersaring berdasarkan hasil tes, diharapkan mencerminkan tinggi
8
rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu
menjamin keberhasilannya kelak sebaliknya, seorang calon dikatakan
tidak lulus tes karena memiliki nilai tes yang rendah, jadi diperkirakan
akan tidak mampu mengikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh setelah peserta tes mengikuti pelajaran di perguruan tinggi.
Jika ternyata, siapa yang memiliki nilai tes yang lebih tinggi gagal
dalam ujian semester satu dibandingkan dengan yang dahulu nilai
tesnya lebih rendah, maka tes masuk yang dimaksud tidak memiliki
validitas prediksi.
9
TABEL PERSIAPAN UNTUK MENCARI VALIDITAS TES PRESTASI
MATEMATIKA
No. Nama X Y x y x2 y2 Xy
1 Nikodemus 6,5 6,3 0 -0,1 0,0 0,01 0,0
2 Rangga 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
3 Song 7,5 7,2 +1,0 +0,8 1,0 0,64 +0,8
4 Joko 7 6,8 +0,5 +0,4 0,25 0,16 +0,2
5 Monic 6 7 -0,5 +0,6 0,25 0,36 -0,3
6 Rere 6 6,2 -0,5 -0,2 0,25 0,04 +0,1
7 Dewa 5,5 5,1 -1,0 -1,3 1,0 1,69 +1,3
8 Yosep 6,5 6 0 -0,4 0,0 0,16 0,0
9 Kadek 7 6,5 +0,5 +0,1 0,25 0,01 +0,05
10 Priska 6 5,9 -0,5 -0,6 0,25 0,36 +0,3
Jumlah 65,0 63,8 3.5 3,59 2,66
∑𝑋 65
𝑋̅ = = = 6,5
𝑁 10
∑𝑌 63,8
𝑌̅ = = = 6,38 dibulatkan 6,4
𝑁 10
𝑥 = 𝑋 − 𝑋̅
𝑦 = 𝑌 − 𝑌̅
Dimasukan ke rumus
∑𝑥𝑦
𝑟𝑥𝑦 =
√(∑2𝑥)(∑2𝑥)
2,65 2,65
= =
√3,5×3,59 √12,565
2,65
=
3,545
Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.
10
Rumus korelasi product moment dengan angka kasar:
𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
𝑟𝑥𝑦 =
√{𝑁 ∑ 𝑋 2 − {𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 }
Di mana 𝑟𝑥𝑦 = koefisien korelasi antara variabel X dan variabel Y, dua variabel
yang dikorelasikan
Dengan menggunakan data hasil tes prestasi matematika di atas kini
dihitung dengan rumus korelasi product moment dengan angka kasar tabel
persiapannya sebagai berikut.
No. Nama X Y X2 Y2 XY
1 Nikodemus 6,2 6,3 42,25 39,69 40,95
rxy = 0,745
11
Jika perbandingan dengan validitas soal yang dihitung dengan rumus simpangan,
ternyata terdapat perbedaan sebesar 0,003, lebih besar yang dihitung dengan rumus
simpangan. Hal ini wajar karena dalam mengerjakan perkalian atau penjumlahan
jika diperoleh 3 atau angka di belakang koma dilakukan pembulatan keatas.
Perbedaan ini sangat kecil sehingga dapat diabaikan.
Rumus korelasi product moment dengan angka kasar dapat digunakan untuk
menghitung semua jenis instrumen tes, seperti pilihan ganda, uraian, benar-salah,
serta angket.
Untuk memperjelas pengertian tersebut, dapat disampaikan keterangan sebagai
berikut.
- Korelasi positif menunjukkan adanya hubungan sejajar antara dua hal.
Misal:
Hal pertama nilainya naik, hal kedua ikut naik. Sebaliknya jika hal pertama
turun, yang kedua ikut turun. Contoh korelasi positif antara nilai IPA dan
Matematika.
IPA : 2, 3, 5, 7, 4, 3, 2
Matematika : 4, 5, 6, 8, 5, 4, 3
Kondisi nilai Matematika sejajar dengan IPA karena naik dan turunnya nilai
IPA.
- Korelasi negatif menunjukkan adanya hubungan kebalikan antara dua hal.
Misal: hal pertama nilainya naik, justru yang kedua turun. Sebaliknya yang
pertama turun yang kedua naik.
Contoh korelasi negatif antara nilai Bahasa Indonesia dengan Matematika.
Bahasa Indonesia : 5, 6, 8, 4, 3, 2
Matematika : 8, 7, 5, 1, 2, 3
Keadaan hubungan antara dua hal yang kita jumpai dalam kehidupan
sehari-hari tidak selalu hanya positif atau negatif saja, tetapi mungkin 0
(nol). Besarnya korelasi pun tidak menentu. Untuk mengetahui bagaimana
hubungan antara dua nilai mata pelajaran A dan B dapat dicermati hal
berikut ini.
Contoh korelasi tidak tertentu.
Nilai A : 5, 6, 4, 7, 3, 8, 7
12
Nilai B : 4, 4, 3, 7, 4, 9, 4
Keadaan kedua nilai tersebut jika dihitung dengan rumus korelasi mungkin
positif mungkin juga negatif.
Koefisien korelasi selalu terdapat antara -1,00 sampai +1,00. Namun
karena dalam menghitung sering dilakukan pembulatan angka-angka,
sangat mungkin diperoleh koefisien lebih dari 1,00. Koefisien negatif
menunjukkan hubungan kebalikan sedangkan koefisien positif
menunjukkan adanya kesejajaran untuk mengadakan interpretasi mengenai
besarnya koefisien korelasi adalah sebagai berikut:
13
Menggunakan Tabel R
14
validitas yang tinggi jika skor pada butir soal atau item mempunyai kesejajaran
dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk
mengetahui validitas butir soal atau item digunakan rumus korelasi seperti yang
sudah dijelaskan.
Untuk soal-soal bentuk objektif skor untuk butir soal atau item biasa
diberikan dengan 1 (bagi butir soal atau item yang dijawab benar) dan 0 (butir soal
atau item yang dijawab salah), sedangkan skor total selanjutnya merupakan jumlah
dari skor untuk semua butir soal atau item yang membangun soal tersebut.
Contoh perhitungan:
Butir soal/item
No Nama 1 2 3 4 5 6 7 8 9 10 Skor Total
1 Dian 1 0 1 0 1 1 1 1 1 1 8
2 Dion 0 0 1 0 1 0 0 1 1 1 5
3 Laurent 0 1 0 0 0 1 0 1 0 1 4
4 Ocha 1 1 0 0 1 1 0 0 1 0 5
5 Icha 1 1 1 1 1 1 0 0 0 0 6
6 Mentari 1 0 1 0 1 0 1 0 0 0 4
7 Tina 1 1 1 1 1 1 1 0 0 0 7
8 Putri 0 1 0 1 1 1 1 1 1 1 8
Misalnya, akan dihitung validitas butir soal atau item nomor 6, maka skor butir soal
atau item nomor 6 tersebut disebut sebagai variabel X dan skor total disebut variabel
Y. selanjutnya perhitungan dilakukan dengan menggunakan rumus korelasi product
moment, baik dengan rumus simpangan maupun rumus angka dasar.
Penggunaan kedua rumus tersebut masing-masing ada keuntungannya.
Menggunakan rumus simpangan angkanya kecil-kecil, tetapi kadang-kadang
pecahannya rumit. Jika skor rata-ratanya (mean) pecahan, simpangannya cenderung
banyak pecahan. Mengalikan pecahan persepuluhan ditambah dengan tanda-tanda
plus (+) dan minus (-) kadang-kadang bisa menyesatkan. Penggunaan rumus angka
kasar bilangannya besar-besar tetapi bulat. Jika ada kalkulator statistik disarankan
menggunakan rumus angka kasar saja. Yang dibutuhkan hanyalah:
∑ 𝑋, ∑ 𝑌, ∑ 𝑋 2 , ∑ 𝑌 2 , dan ∑ 𝑋𝑌, tidak perlu membuat tabel seutuhnya.
15
Contoh perhitungan mencari validitas item
Untuk menghitung validitas item nomor 6, dibuat terlebih dahulu tabel
persiapannya sebagai berikut:
TABEL PERSIAPAN UNTUK MENGHITUNG VALIDITAS ITEM NOMOR 6
No Nama X Y
1 Dian 1 8
2 Dion 0 5
3 Laurent 1 3
4 Ocha 1 5
5 Icha 1 6
6 Mentari 0 4
7 Tina 1 7
8 Putri 1 8
Keterangan:
X = skor item nomor 6
Y = skor total
Dari perhitungan kalkulator diperoleh data sebagai berikut:
∑𝑋 = 6 ∑ 𝑋2 = 6
∑ 𝑌= 46 ∑ 𝑌 2 = 288
6
∑ 𝑋𝑌 = 37 p = 8 = 37
2
𝑋̅𝑡 = 5,57 q = 8 = 5,57
8×37−(6×46) 20
rxy = rxy =
√(8×6−62 )(8×288−462 ) 47,497
16
Koefisien validitas item nomor 6 adalah 0,421. Dilihat secara sepintas nilangan ini
memang sesuai dengan kenyataannya. Hal ini dapat diketahui dari skor-skor yang
tertera baik pada item mauoun skor total. Laurent yang hanya memiliki skor total 3
dapat memperoleh skor I pada item, sedangkan Dion dan Ocha yang mempunyai
skor total sama, yaitu 5 skor pada item tidak sama. Validitas item tersebut kurang
meyakinkan. Tentu saja validitasnya tidak tinggi.
Masih ada cara-cara lain untuk menghitung validitas item. Salah satu cara yang
terkenal adalah menggunakan rumus 𝑦𝑝𝑏 ; yang rumus lengkapnya adalah sebagai
berikut:
𝑀𝑝 − 𝑀1 𝑝
𝛾𝑝𝑏𝑖 = √
𝑆𝑡 𝑞
Keterangan:
𝛾𝑝𝑏𝑖 = koefisien korelasi biserial
𝑀𝑝 = rerata skor dari subjek yang menjawab betul bagi item yang dicari
validitasnya
𝑀𝑡 = rerata skor total
𝑆𝑡 = standar deviasi dari skor total proporsi
p = proporsi siswa yang menjawab benar
𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑠𝑖𝑠𝑤𝑎 𝑦𝑎𝑛𝑔 𝑏𝑒𝑛𝑎𝑟
𝑃=
𝑗𝑢𝑚𝑙𝑎ℎ 𝑠𝑒𝑙𝑢𝑟𝑢ℎ 𝑠𝑖𝑠𝑖𝑤𝑎
q = proporsi siswa yang menjawab salah (q=1-p)
Apabila item 6 tersebut dicari tersebut dicari validitasnya dengan rumus ini maka
perhitungannya melalui langkah sebagai berikut:
8+3+5+6+7+8 37
1. Mencari 𝑀𝑝 = = = 6,17
6 6
8+5+3+5+6+4+7+8 46
2. Mencari 𝑀𝑡 = = = 5,75
8 8
17
2
5. Menentukan harga q, yaitu 8 𝑎𝑡𝑎𝑢 1 − 0,75 = 0,25
6. Memasukkan ke rumus
𝑀𝑝 − 𝑀𝑡 𝑝
𝛾𝑝𝑏𝑖 = √
𝑆𝑡 𝑞
0,42
= × 1,732
1,7139
= 0,4244
Dari perhitungan validitas item 6 dengan dua cara ternyata hasilnya berbeda tetapi
sangat kecil yaitu 0,0034. Mungkin hal ini disebabkan karena adanya pembulatan
angka. Rumus 𝛾𝑝𝑏𝑖 (koefisien korelasi biserial) ini dapat digunakan untuk jenis
18
Tabel untuk menghitung korelasi product moment antara butir 1 (X1) dengan skor
total semua jawaban siswa ( Y ):
No X1 X12 Y Y2 X1Y
1 10 100 52 2704 520
2 6 36 31 961 186
3 8 64 39 1521 312
4 7 49 36 1296 252
5 0 0 18 324 0
6 2 4 30 900 60
7 4 16 31 961 124
8 5 25 36 1296 180
9 5 25 33 1089 165
10 3 9 28 784 84
∑ 𝑋1 = ∑ 𝑋12 ∑𝑌 ∑ 𝑌12
N = 10 ∑ 𝑋1 𝑌=1883
50 = 328 = 334 = 11836
𝑁 ∑ 𝑋𝑌−(∑ 𝑋)(∑ 𝑌)
rxy=
√{𝑁 ∑ 𝑥 2 −(∑ 𝑋)2 }{𝑁 ∑ 𝑦 2 −(∑ 𝑦)2 }
10𝑥1883−50𝑥334
rxy=
√(10𝑥328−2500)(10𝑥11836−111556)
18830−16700
rxy=
√780𝑥6804
2130
rxy=
√5307120
2130
rxy=
2303.718
rxy= 0,924
Keterangan:
Makin tinggi koefisien korelasi yang dimiliki makin valid butir instrumen
tersebut. Secara umum, jika koefisien korelasi sudah lebih besar dari 0,3 maka
butir instrumen tersebut sudah dikategorikan valid.
19
F. Tes Terstandar sebagai Kriterium dalam Menentukan Validitas
Tes terstandar adalah tes yang telah dicobakan berkali-kali sehingga dapat
dijamin kebaikannya. Di negara-negara berkembang biasa tersedia tes ini, yang
dikenal dengan nama standardized test.
Sebuah tes terstandar biasanya memiliki identitas, yaitu :
1. Sudah dicobakan berapa kali dan di mana
2. Berapa keofisien validitas
3. Reabilitas
4. Taraf kesukaran
5. Daya pembeda
6. Dan lainnya yang dianggap perlu
Cara menentukan validitas soal yang menggunakan tes terstandar sebagai
kriterium dilakukan dengan mengalikan koefisien validitas yang diperoleh dengan
koefisien validitas tes terstandar tersebut.
Contoh perhitungan:
No Peserta tes X Y X2 Y2 XY
1 Ros 8 7 64 49 56
2 Mawar 8 5 64 25 40
3 Melati 9 7 81 49 63
4 Cempaka 8 7 64 49 56
5 Dahlia 7 5 49 25 35
Jumlah 40 31 322 197 250
Keterangan:
X = hasil tes matematika yang dicari validitasnya
Y = hasil tes standar
Dimasukkan ke dalam rumus korelasi product moment dengan angka kasar
sebagai berikut :
𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
𝑟𝑥𝑦 =
√[𝑁 ∑ 𝑋 2 − (∑ 𝑋)2 ][𝑁 ∑ 𝑌 2 − (∑ 𝑌)2 ]
(5 × 250) − (40 × 31)
𝑟𝑥𝑦 =
√[(5 × 322) − (40)2 ][(5 × 197) − (31)2 ]
20
10
𝑟𝑥𝑦 =
√[10][24]
10
𝑟𝑥𝑦 =
15,492
𝑟𝑥𝑦 = 0,645
Jika dari tes terstandar diketahui bahwa validitasnya 0,89 maka bilangan 0,645 ini
belum merupakan validitas soal matematika yang dicari. Validitas tersebut harus
dikalikan dengan 0,89 yang hasilnya 0,645 × 0,89 = 0,574
G. Validitas Faktor
Faktor-faktor atau bagian keseluruhan materi merupakan hal yang perlu diketahui
dalam validtas. Setiap keseluruhan nateri pelajaran terdiri dari pokok-pokok
pembahasan atau mungkin sekelompok pokok bahasan yang merupakan satu-
kesatuan.
Contoh:
Guru akan mengevaluasi penguasaan siswa untuk tiga pokok bahasan, yaitu:
Bunyi, Cahaya, dan Listrik. Untuk keperluan ini guru tersebut membuat 30 butir
soal, untuk Bunyi 8 butir, untuk cahaya 12 butir, dan untuk Listrik 10 butir.
Apabila guru ingin mengetahui validitas faktor, maka ada 3 faktor dalam
soal ini. Seperti halnya pengertian validitas butir, pengertian validitas faktor adalah
sebagai berikut: butir-butir faktor dikatakan valid apabila mempunyai dukungan
yang besar terhadap soal-soal secara keseluruhan. Sebagai tanda bahwa butir-butir
faktor tersebut mempunyai dukungan yang besar terhadap seluruh soal, yakni
apabila jumlah skor unutk butir-butir faktor tersebut menunjukkan adanya
kesejajaran dengan skor total.
21
CONTOH TABEL ANALISIS BUTIR UNTUK MENGHITUNG VALIDITAS BUTIR DAN VALIDITAS FAKTOR
Skor Skor Skor
1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 Skor
Butir 1 2 3 4 5 6 7 8 faktor 9 faktor faktor
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 total
1 2 3
Amir 1 0 1 1 1 1 0 1 6 1 0 1 0 1 0 1 0 1 0 1 0 6 1 0 1 1 1 0 1 1 1 0 7 19
Hasan 1 1 1 1 1 1 1 0 7 1 1 1 1 0 1 1 1 1 0 0 1 9 1 1 1 1 1 1 1 1 1 0 9 25
Ninda 1 0 1 0 1 0 1 0 7 1 1 0 0 0 0 1 1 0 1 1 0 6 1 0 1 1 0 1 1 0 1 1 7 17
Warih 0 1 1 0 0 0 0 0 4 0 0 0 1 1 0 1 0 1 0 0 0 4 1 0 0 0 1 0 0 1 1 1 5 12
Irzal 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 1 1 0 1 1 11 1 1 1 1 1 1 1 1 1 1 10 29
Gandi 1 1 0 1 1 0 1 1 6 1 0 1 1 1 1 1 1 0 1 1 0 9 1 1 1 1 1 0 0 1 1 1 8 23
Santo 1 0 1 0 1 1 0 1 5 1 0 0 0 1 1 1 0 1 1 1 0 7 1 1 1 1 0 0 0 1 1 1 7 19
Tini 1 1 1 1 1 0 1 1 7 1 1 1 1 1 0 1 1 1 1 0 1 10 1 1 1 1 1 1 1 1 1 0 9 26
Yanti 1 1 1 0 0 0 1 1 6 1 0 1 1 0 0 0 0 1 1 1 0 6 1 1 0 1 1 0 0 1 0 0 5 12
Hamid 1 0 1 0 1 0 1 0 4 1 0 0 0 0 0 0 1 1 1 0 1 5 1 1 0 1 1 0 0 0 1 1 5 15
Dedi 1 1 1 1 1 1 1 0 7 1 1 1 1 1 1 1 1 1 1 0 0 10 1 1 1 1 1 1 1 0 1 1 9 26
Desi 1 1 1 1 1 1 1 1 8 1 1 1 1 1 1 1 1 1 1 1 1 12 1 1 1 1 1 1 1 1 1 1 10 30
Wahyu 1 0 0 0 1 1 1 1 5 1 1 0 1 1 0 1 1 0 1 1 0 8 1 1 0 0 0 1 1 1 1 1 7 20
22
Sudah dijelaskan bahwa butir-butir soal faktor dikatakan valid apabila menunjuk
kesejajaran skor dengan skor total. Cara mengetahui kesejajaran tersebut digunakan
juga rumus korelasi product moment. Misalnya kita akan mengetahui validitas
faktor 1, yakni soal-soal untuk materi Bunyi, kita membuat daftar untuk
menyejajarkan kedua skor tersebut sebagai berikut.
TABEL UNTUK MENGHITUNG KESEJAJARAN SKOR FAKTOR 1
DENGAN SKOR TOTAL
Skor faktor 1
Nama Subjek Skor total (Y) X2 Y2 XY
(X)
Amir 6 19 36 361 114
Hasan 7 25 49 625 175
Inda 7 17 49 289 119
Warih 4 12 16 144 48
Irzal 3 29 9 841 87
Gandi 6 23 36 529 138
Santo 5 19 25 361 95
Tini 7 26 49 676 182
Yanti 6 16 36 256 72
Hamid 4 15 16 225 60
Dedi 7 26 49 676 182
Desi 8 30 64 900 240
Wahyu 5 20 25 400 100
Jumlah ... ... ... ... ...
Data yang tertera di dalam tabel tersebut digunakan untum menentukan besarnya
validitas faktor 1. Langkah selanjutnya adalah menjumlahkan setiap kolom,
kemudian dimasukkan ke dalam rumus korelasi product moment. Harga r yang
diperoleh menunjukkan indeks validitas faktor 1. Untuk faktor 2 dan faktor 3
caranya sama, hanya skor faktornya saja yang diganti.
23
H. Menghitung Validitas Menggunakan Excel
1. Input data
24
I. Menghitung Validitas Menggunakan SPSS
1. Buka program spss
2. Copy dan pastekan data yang terlebih dahulu diketik pada excel
3. Setelah selesai di input, kemudian klik variabel view, pada kolom label beri
nama, misalnya "x1, x2, x3, x4, x5, x6, total x "
25
4. Klik menu analyze => correlate => bivariate
Akan keluar jendela bivariate correlation
5. Blok semua item dan masukan ke dalam kolom sebelah kanan, centang pada
"pearson" dan "two-tailed" kemudian klik ok
26
6. Maka outputnya sebagai berikut
Untuk melihat validitas X1, dapat dilihat pada baris X1 kolom TOTAL. Sehingga
vaiditas item 1 adalah 0,925.
27
J. Pengertian Reliabilitas (dalam suatu tes)
Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan
dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan
yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian
reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau seandainya
hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti. Konsep
tentang reliabilitas ini tidak akan sulit dimengerti apabila pembaca telah memahami
konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan
diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas ini
tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek yang
tidak lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data
tersebut benar, maka konsep reliabilitas terkait dengan pemotretan berkali-kali.
Instrumen yang baik adalah instrumen yang dapat dengan ajeg memberikan data yang
sesuai dengan kenyataan. Yang sering ditangkap kurang tepat bagi pembaca adalah
adanya pendapat bahwa "ajeg" atau "tetap" diartikan sebagai “sama". Dalam
pembicaraan evaluasi ini tidak demikian. Ajeg atau tetap tidak selalu harus sama,
tetapi mengikuti perubahan secara ajeg. Jika keadaan si A mula-mula berada lebih
rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang, si A juga
berada lebih rendah dari B. Itulah yang dikatakan ajeg atau tetap, yaitu sama dalam
kedudukan siswa di antara anggota kelompok yang Iain. Tentu saja tidak dituntut
semuanya tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas
instrumen. Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan
menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini penting.
Dalam hal ini, validitas lebih penting, dan reliabilitas ini perlu, karena menyokong
terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid. Sebaliknya,
sebuah tes yang valid biasanya reliabel. “A reliable measure in one that provides
consistent and stable indication of the characteristic being investigated.”
Untuk dapat memperoleh gambaran yang ajeg memang sulit karena unsur
kejiwaan manusia itu sendiri tidak ajeg. Misalnya, kemampuan, kecakapan, sikap, dan
sebagainya, berubah-ubah dari waktu ke waktu. Beberapa hal yang sedikit banyak
memengaruhi hasil tes banyak sekali. Namun, secara garis besar dapat dikelompokkan
menjadi 3 (tiga) hal berikut:
28
a. Hal yang Berhubungan dengan Tes Itu Sendiri, yaitu Panjang Tes dan
Kualitas Butir-Butir Soalnya
Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan
dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya
validitas menunjukkan tinggi rendahnya reliabilitas tes. Dengan demikian
maka semakin panjang tes, maka reliabilitasnya semakin tinggi. Dalam
menghitung besarnya reliabilitas berhubung dengan penambahan
banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh
Spearman dan Brown sehingga terkenal dengan rumus Spearman-Brown.
𝑛𝑟
𝑟𝑛𝑛 =
1 + (𝑛 − 1)𝑟
Di mana:
𝑟𝑛𝑛 : besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir-
butir soal baru
n : berapa kali butir-butir soal itu ditambah
r : besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah
Contoh:
Suatu tes terdiri atas 40 butir soal, mempunyai koefisien realibilitas 0,70.
Kemudian butir-butir soal itu ditambah menjadi 60 butir soal. Maka
koefisien realibilitas baru adalah:
𝑛𝑟
𝑟𝑛𝑛 =
1 + (𝑛 − 1)𝑟
1,5 x 0,7
𝑟𝑛𝑛 =
1 + (1,5 − 1)0,7
1,05
𝑟𝑛𝑛 =
1,35
𝑟𝑛𝑛 = 0,79
29
1) Sampai pada suatu batas tertentu, penambahan banyaknya butir sudah
tidak menambah tinggi reliabilitas tes. Remmers dan Gage
menggambarkan hubungan antara penambahan butir soal reliabilitas
sebagai berikut.
30
b. Hal yang Berhubungan dengan Tercoba (Testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa
akan mencerminkan keragaman hasil yang menggambarkan besar- kecilnya
reliabilitas tes. Tes yang dicobakan kepada bukan kelompok terpilih, akan
menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada
kelompok tertentu yang diambil secara dipilih.
31
a. Metode Bentuk Paralel (Equivalent)
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya
berbeda. Dalam istilah bahasa Inggris disebut alternate forms method
(parallel forms). Dengan metode bentuk paralel ini, dua buah tes yang
paralel, misalya tes Matematika Seri A yang akan dicari reliabilitasnya dan
tes Seri B diteskan kepada sekelompok siswa yang sama, kemudian hasilnya
dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang
menunjukkan koefisien reliabilitas tes Seri A. Jika koefisiennya tinggi maka
tes tersebut sudah reliabel dan dapat digunakan sebagai alat pengetes yang
terandalkan. Dalam menggunakan metode tes paralel ini pengetes harus
menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok
siswa yang sama. Oleh karena itu, ada orang menyebutkan sebagai double
test-double-trial method. Penggunaan metode ini baik karena siswa
dihadapkan kepada dua macam tes sehingga tidak ada faktor "masih ingat
soalnya" yang dalam evaluasi disebut adanya practice-effect dan carry-over
effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah
mengerjakan soal tersebut. Kelemahan dari metode ini adalah bahwa
pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula
harus tersedia waktu yang lama untuk mencobakan dua kali tes.
32
Jika tenggang waktu terlalu sempit, siswa masih banyak ingat materi.
Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor atau
kondisi tes sudah akan berbeda, dan siswa sendiri barangkali sudah
mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula
terhadap reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada
hasil tes pertama. Hal ini tidak mengapa karena pengetes harus sadar
akan adanya practice effect dan carry over effect. Yang penting adalah
adanya kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh
koefisien korelasi yang tinggi.
Contoh:
Tes Pertama Tes Kedua
Siswa
Skor Ranking Skor Ranking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4
33
dan mengkorelasi dua belahan, baru diketahui realibilitas separo tes. Untuk
mengetahui realibiltas selruh tes harus digunakan rumus Spearman-Brown
sebagai berikut:
2𝑟1/2 1/2
𝑟11 =
(1 + 𝑟1/2 1/2 )
Di mana:
𝑟1/2 1/2 = korelasi antara skor-skor setiap belahan tes
𝑟11 = koefisien reabilitas yang sudah disesuaikan
Contoh:
Korelasi antara belahan tes = 0,60
2×0,60 1,20
Maka, realibilitas tes = = = 0,75
1+0,60 1,60
Banyak pemakaian metode ini salah membelah hasil tes pada waktu,
menganalisis. Yang lakukan adalah mengelompokan hasil separo subjek
peserta tes dan separo yang lain kemdian hasil kedua sekelompok ini
dikorelasikan. Yang benar adalah membelah item atau btir soal. Tidak akan
keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir
soal harus genap agar dapat dibelah
Ada dua cara membelah butir soal ini, yaitu:
1) membelah atas item-item genap dan item-item ganjil yang selajutnya
disebut belahan ganjil-genap.
2) membelah atas item-item awal dan item-item akhir yaitu separo jumlah
pada nomor-nomorakhir yang selanjutnya disebut belahan awal-akhir.
34
TABEL ANALISIS ITEM TES MATEMATIKA
2, 4,
1, 3, 1, 2, 6, 7,
Nomor Item skor 6, 8,
No Nama 5, 7, 9 3, 4, 5 8, 9, 10
total 10
1 2 3 4 5 6 7 8 9 10 Ganjil Genap Awal Akhir
1 Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5
2 Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3
3 Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3
4 Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2
5 Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1
6 Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1
7 Susana 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2
8 Helen 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5
Kertas yang digunting bergigi seperti di sebelah ini dapat digunakan sebagai
alat bantu dalam menentukan jumlah skor pada item ganjil dan jumlah skor
pada item genap. Bagian berlekuk dapat dipaskan pada item-item genap
ataupun item-item ganjil. Jika sudah diketahui jumlah skor pada item ganjil,
otomatis diketahui jumlah skor.
Pada item genap karena skor totalnya sudah diketahui terlebih dahulu. Kertas
bergigi ini ditempelkan tepat mulai skor siswa pertama, kemudian digeser ke
bawah hingga siswa terakhir.
Penyajian contoh membelah di atas berarti bahwa perhitungan reliabilitas
dilakukan dengan membelah dengan dua cara. Pembelahannya hanya memilih
salah satu saja, untuk selanjutnya dihitung dengan korelasi product moment.
35
1) Pembelahan ganjil-genap
Tabel persiapan perhitungan reabilitas dengan belah dua ganjil-genap
adalah sebagai berikut:
1. Hartati 5 3
2. Yoyok 3 2
3. Oktaf 0 4
4. Wendi 3 2
5. Diana 3 3
6. Paul 4 0
7. Susana 4 3
8. Helen 3 5
Kelanjutan dari tabel ini adalah menghitung dengan rumus korelasi
product moment.
Dengan menggunakan kalkulator diketahui dengan bahwa:
∑ 𝑋 = 25 ∑ 𝑋 2 = 93
∑ 𝑌 = 22 ∑ 𝑌 2 = 76
∑ 𝑋𝑌 = 63
Setelah dihitung dengan rumus korelasi product moment dengan angka
kasar diketahui bahwa rxy = -0,3786. Harga tersebut baru menunjukkan
reliabilitas separo tes. Oleh karena itu, rxy untuk belahan ini disebt
dengan istilah r1/21/2 atau rgg singkatan dari rganjil-genap*. Untuk mencari
reliabiliti seluruh tesnya dignakan rumus Spearman-Brown yang
rumusnya telah dikemukakan didepan. Jika koefisien reliabilitas separo
tes ini dimasukan kedalam rumus hitungannya:
2𝑟1/2 1/2 −0,7572
𝑟11 = =
(1 + 𝑟1/2 1/2 ) 1,3786
2 × −0,3786 = −0,5493
=
1 + (−0,3786)
*) Pengurangan merupakan bilangan dengan harga mutlak, jadi tidak mengenal negatif.
36
2) Pembelahan awal-akhir
Dengan data yang tertera pada Tabel analisis item tes Matematika
diketahui jumlah skor belahan awal-akhir sebagai berikut:
37
3) Penggunaan rumus Flanangan
Rumus
𝑆12 + 𝑆22
𝑟11 = 2 (1 − )
𝑆𝑡2
Di mana:
𝑟11 = reliabilitas tes
𝑆12 = variansi belahan pertama (1) yang dalam hal ini varians skor
item ganjil
𝑆22 = variansi belahan kedua (2), yaitu varians skor item genap
𝑆𝑡2 = variansi total yaitu varians skor total
Sekarang sederhana dapat dipahami bahwa variansi adalah standar
deviasi kuadrat. Dengan demikian bagi peminat yang menghitung
dengan kalkulator statistik varians ini diperoleh dengan
mengkuadratkan standar deviasi. Untk mereka yang tidak
menggunakan kalkulator statistik maka varians dapat dicari dengan
rumus sebagai berikut:
2
(∑ 𝑋)
2
∑𝑋 −
𝑆2 = 𝑁
𝑁
Standar Deviasi (SD) dapat disebut dengan istilah Indonesia
Simpangan Baku (SB). Namun huruf S (B besar) juga dapat
dikatakan sudah menyebutkan standar deviasi. Dalam kalkulator
tertera dengan simbol a. Bagi yang berminat mencari S dulu untuk
mencari varians, dapat menggunakan rumus S, yaitu:
√∑ 𝑋 2
𝑆=
𝑁
Di mana:
S = Standar deviasi
X = Simpangan X dan 𝑋̅, yang dicari dari X-𝑋̅
S2 = Varians, setelah dituliskan dalam bentuk kuadrat, karena standar
deviasi kuadrat
N = Banyaknya subjek pengikut tes
38
Berdasarkan data tabel belahan ganjil-genap perhitungannya adalah
sebagai berikut:
252
93 − 8
𝑆12 =
8
93 − 78,125
=
8
= 1,859
222
76 − 8
𝑆22 =
8
76 − 60,5
=
8
= 1,937
472
295 − 8
𝑆𝑡2 = (Diambil dari tabel yang ada skor total)
8
295 − 276,13
=
8
= 2,36
39
Untuk memperjelas keterangan, maka tabel belahan awal-akhir dikutip
disini lagi
No. Nama Awal Akhir D
1. Hartati 3 5 -2
2. Yoyok 2 3 -1
3. Oktaf 1 3 -2
4. Wendi 3 2 1
5. Diana 5 1 4
6. Paul 3 1 2
7. Susana 5 2 3
8. Helen 3 5 -2
2
(∑ 𝑑)
∑ 𝑑2 −
𝑆𝑑2 = 𝑁
𝑁
32
43 − 8
=
8
43 − 1,125
=
8
= 5,234
5,234
𝑟11 = 1 −
2,36
= 1 −2,218
=-1,218
40
Dari perhitungan dengan rumus Flanagan maupun Rulon ternyata
hasilnya sama, keduanya lebih besar dari 1,00. Secara teoretik koefisien
ini salah tetapi karena pembulatan-pembulatan dalam perhitungan,
seperti dijelaskan di depan, hasil seperti ini dapat saja terjadi.
Telah disinggung di bagian depan bahwa salah satu syarat untuk dapat
menggunakan metode belah dua adalah bahwa banyaknya item harus
genap agar dapat dibelah. Syarat yang kedua, item yang membentuk
soal tes harus homogen atau paling tidak setelah dibelah terdapat
keseimbangan antara belahan pertama dengan belahan kedua.
Untuk mengatasi kesulitan memenuhi persyaratan ini maka reliabilitas
dapat dicari dengan rumus yang diketemukan oleh Kuder dan
Richardson. Kedua orang ahli ini menemukan banyak rumus yang
diberi nomor. Rumus yang digunakan untuk mencari reliabilitas dan
banyak digunakan orang ada dua rumus, yaitu rumus K-R. 20 dan
rumus K-R. 20
5) Penggunaan rumus K-R 20
𝑛 𝑆 2 − ∑ 𝑝𝑞
𝑟11 =( )( )
𝑛−1 𝑆2
Dimana:
𝑟11 = reliabilitas tes secara keseluruhan
𝑝= proporsi sbjek yang menjawab item dengan benar
𝑞= proporsi sbjek yang menjawab item dengan salah (q = 1-p)
∑ 𝑝𝑞= jmlah hasil perkalian anatara p dan q
𝑛 = banyaknya item
𝑆= standar deviasi dari tes (standar deviasi adalah akar varians)
41
TABEL PERHITUNGAN MENCARI RELIABILITAS
TES DENGAN RUMUS K-R.20
Nomor Item
No Nama Skor Total
1 2 3 4 5 6 7
1 Wardayo 1 0 1 1 1 1 0 5
2 Benny 0 1 1 0 1 1 1 5
3 Hanafi 0 0 0 0 1 0 1 2
4 Rahmad 0 1 1 1 1 1 1 6
5 Tanti 1 0 0 0 1 0 0 2
6 Nadia 0 1 1 1 1 0 0 4
7 Tini 0 0 0 1 1 1 0 3
8 Budi 0 1 0 1 1 0 0 3
9 Daron 0 1 0 1 1 0 0 3
10 Yakob 0 0 0 1 1 0 0 2
Np 2 5 4 7 10 4 3 35
Pq 0 1,31(∑ 𝑝𝑞)
42
6) Penggunaan rumus K-R.21
Rumus K-R. 21:
𝑛 𝑀(𝑛 − 𝑀)
𝑟11 = ( ) (1 − )
𝑛−1 𝑛𝑆𝑡2
Keterangan:
M = Mean atau rerata skor total
7 3,5(7 − 3,5)
𝑟11 = (1 − )
7−1 7 × 1,85
3,5 × 3,5
= 1,17 (1 − )
12,95
12,25
= 1,17 (1 − )
12,95
= 1,17(1 − 0,946)
= 1,17 × 0,0541
= 0,06329 ≈ 0,0633
Jika dibandingkan reliabilitas yang dihitung dengan K-R. 20 dan K-R.
21 lebih besar yang pertama. Memang menggunakan rumus K-R. 20
cenderung memberikan hasil yang lebih tinggi, tetapi pekerjaannya
lebih rumit.
7) Penggunaan rumus Hoyt
𝑉 𝑉2 −𝑉𝑠
Rumus: 𝑟11 = 1 − 𝑉𝑠 atau 𝑟11 =
𝑟 𝑉𝑟
Keterangan:
𝑟11 = Reliabilitas seluruh soal
𝑉𝑟 = Varians responden
𝑉𝑠 = Varians sisa
Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-
langkah sebagai berikut:
Langkah 1. Mencari jumlah kuadrat responden dengan rumus:
∑ 𝑋𝑡2 (∑ 𝑋𝑡 )2
𝐽𝐾(𝑟) = −
𝑘 𝑘×𝑁
Keterangan:
𝐽𝐾(𝑟) =jumlah kuadrat responden
𝑋𝑡 =Skor total tiap responden
43
K =Banyaknya item
N =banyaknya responden atau subjek
Langkah 2. Mencari jumlah kuadrat item dengan rumus.
∑ 𝐵 2 (∑ 𝑋𝑡 )2
𝐽𝐾(𝑖) = −
𝑁 𝑘×𝑁
𝐽𝐾(𝑖) =jumlah kuadrat responden
∑ 𝐵2 =Skor total tiap responden
(∑ 𝑋𝑡 )2 =Kuadrat dari jumlah skor total
Langkah 3. Mencari jumlah kuadrat total dengan rumus.
(∑ 𝐵)(∑ 𝑆)
𝐽𝐾(𝑡) =
∑ 𝐵) + (∑ 𝑆)
𝐽𝐾(𝑡) =jumlah kuadrat total
∑𝐵 =jumlah jawab benar seluruh item
∑𝑆 = jumlah jawab salah seluruh item
Langkah 4. Mencari jumlah kuadrat sisa, dengan rumus.
𝐽𝐾(𝑡) = 𝐽𝐾(𝑡) − 𝐽𝐾(𝑟) − 𝐽(𝑖)
Langkah 5. Mencari Varians responden dan varians sisa dengan tabel
F
Dalam mencari Varians ini diperlukan d.b (derajat kebebasan) dari
masing-masing sumber varians kemudian d.b ini digunakan sebagai
penyebut terhadap setiap jumlah kadrat untuk memperoleh variasi.
d.b = banyaknya N setiap smber variansi dikran 1.
𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑢𝑎𝑑𝑟𝑎𝑡
𝑣𝑎𝑟𝑖𝑎𝑛𝑠𝑖 =
𝑑. 𝑏
Langkah 6. Memasukkan ke dalam rumus r11
Contoh perhitungan:
Dengan menggnakan tael analisis item yang dignakan ntuk mencari
reliabiliti tes dengan rmus K-R.20 dapat dicari reliabiliti dengan rumus
Hoyt.
Namun karena bilangan-bilangan yang diperlukan dalam tabel tersebut
belum lengkap, kiranya lebih baik jika dikutipkan sekali lagi dalam abel
berikutnya:
44
TABEL ANALISIS ITEM UNTUK MENCARI RELIABILITAS DENGAN
RUMUS HOYT
Kuadrat
Skor
skor
Nomor Item Total
No Nama total
(X)
(X2)
1 2 3 4 5 6 7
1 Wardoyo 1 0 1 1 1 1 0 5 25
2 Benny 0 1 1 0 1 1 1 5 25
3 Hanafi 0 0 0 0 1 0 1 2 4
4 Rahmad 0 1 1 1 1 1 1 6 36
5 Tanti 1 0 0 0 1 0 0 2 4
6 Nadia 0 1 1 1 1 0 0 4 16
7 Tini 0 0 0 1 1 1 0 3 9
8 Budi 0 1 0 1 1 0 0 3 9
9 Daron 0 1 0 1 1 0 0 3 9
10 Yakob 0 0 0 1 1 0 0 2 4
jumlah
2 5 4 7 10 4 3 35 141
jawab benar
kuadrat
jumlah 4 25 16 49 100 16 9
jawab benar
jumlah
kuadrat 219
jawab benar
Jumlah
8 5 6 3 0 6 7 35
jawab salah
45
Berdasarkan tabel ini dapat dicari reliabilitas soal dengan rumus Hoyt melalui
langkah-langkah sebagai berikut :
46
Sumber Variansi Jumlah Kuadrat d.b Varians
9 2,643
Responden 2,643 = 0,294
9
(10-1)
6 4,4
Item 4,4 = 0,733
6
(7-1)
54 10,457
Sisa 10,457 = 0,1936
(69-9-6) 54
69
Total 17,5
(70-1)
Untuk mencari d.b sisa, harus dicari d.b total dahulu baru dikurangi d.b
responden dan d.b item
d.b total = 𝑘 × 𝑁 − 1 × 10 − 1 = 70 − 1 = 69
d.b responden = 𝑁 − 1 = 10 − 1 = 9
d.b item =𝑘−1=7−1=6
d.b sisa = d.b total – d.b responden – d.b item
= 69 – 9 – 6 = 54
47
𝑛 ∑ 𝜎𝑖2
𝑟11 = ( ) (1 − 2 )
𝑛−1 𝜎𝑡
Keterangan:
r11 = reliabilitas yang dicari
∑ 𝜎𝑖2 = jumlaah varians skor tiap-tiap item
𝜎𝑡2 = varians total
Skor
Kuadrat skor
Nomor Item Total
No Nama total (X2)
(X)
1 2 3 4 5 6
1 A 10 6 8 8 10 10 52 2704
2 B 6 4 4 6 6 5 31 961
3 C 8 2 6 8 7 8 39 1521
4 D 7 3 7 7 6 6 36 1296
5 E 0 5 3 2 4 4 18 324
6 F 2 4 2 8 6 8 30 900
7 G 4 3 6 6 6 6 31 961
8 H 5 5 5 7 7 7 36 1296
9 I 5 5 4 6 8 5 33 1089
10 J 3 6 3 4 6 6 28 784
jumlah 50 43 48 62 66 65 334 11836
jumlah
328 201 264 418 458 451 2120
kuadrat
48
Perlu diingat lagi rumus varians yang sudah dikenal sebelumnya, yaitu:
(∑ 𝑋)2
∑ 𝑋2 −
𝜎2 = 𝑁
𝑁
atau
2
∑ 𝑋𝑡2 (∑ 𝑋𝑡 )2
𝜎 = −
𝑁 𝑁
502
328 −
2
𝜎(1)∗ = 10 = 328 − 250 = 78 = 7,8
10 10 10
432
201 −
2
𝜎(2)∗ = 10 = 201 − 184,9 = 16,1 = 1,61
10 10 10
482
264 −
2
𝜎(3)∗ = 10 = 328 − 250 = 33,6 = 3,36
10 10 10
622
418 −
2
𝜎(4)∗ = 10 = 418 − 435,6 = 33,6 = 3,36
10 10 10
662
458 −
2
𝜎(5)∗ = 10 = 458 − 435,6 = 22,4 = 2,24
10 10 10
652
451 −
2
𝜎(6)∗ = 10 = 451 − 422,5 = 28,5 = 2,85
10 10 10
Jumlah varians semua item ∑ 𝜎𝑖2 = 7,8 + 1,61 + 3,36 + 2,24 + 2,85 = 21,22
(∑ 𝑋)2
∑ 𝑋2−
𝑁
Varian total = 𝑁
3342 680,4
11836 − =
= 10 10
10
= 68,04
11836 − 11155,6
=
10
49
Dimasukkan ke dalam rumus alpha
6 21,22
𝑟11 = ×1
6−1 68,04
6
= × (1 − 0,312)
5
6
= × 0,688
5
= 0,8256 ≈ 0,8826
1 2 3 1 3 4 2
2 1 2 1 1 3 1
3 4 3 4 5 3 3
4 5 3 2 4 3 2
5 2 1 2 2 1 1
6 3 3 1 3 3 1
50
7 4 5 2 3 4 2
8 2 1 2 2 1 1
9 2 2 2 2 2 2
10 3 4 2 5 4 2
b. Prosedur
Reliabilitas kuesioner dapat dihitung dengan menggunakan faktor analisis
dengan langkah-langkah sebagai berikut.
1) Aktifkan SPSS
2) Pilih View Data dan ketik skor siswa sehingga diperoleh data seperti
pada gambar berikut:
51
4) Selanjutnya pilih Analyze Scale Reliability seperti pada gambar
berikut:
c. Hasil
Hasil yang diperoleh dari analisis di atas adalah sebagai berikut:
1) Alpha
52
2) Split-half
3) Parallel
d. Interpretasi Hasil
Berdasarkan output SPSS di atas, tampak bahwa reliabilitas
kuesioner menurut metode Alpha Cronbach sebesar 0.858, menurut
metode Split-Half sebesar 0.910, sedangkan berdasarkan metode
Parallel adalah 0.890. tampak bahwa ketiga metode menghasilkan
nilai reliabilitas yang hampir sama. Dengan demikian, kita memiliki
kebebasan untuk memilih salah satu metode.
53
BAB III
KESIMPULAN
54
DAFTAR PUSTAKA
55