1
Dalam hubungannya dengan kesahihan atau ketepatan sebuah insrumen, validitas
diartikan sebagai:
Menurut Djaali (2008) validitas adalah seberapa jauh suatu tes mampu
mengungkapkan dengan tepat ciri atau keadaan yang sesungguhnya dari objek ukur.
Menurut Andersson (dalam Arikunto,1999) sebuah tes dikatakan valid apabila tes
tersebut mampu mengukur apa yang hendak diukur.
Sedangkan uji validitas itu sendiri adalah:
Menurut Sugiyono (2006) uji validitas merupakan suatu langkah pengujian yang
dilakukan terhadap isi (content) dari suatu instumen, dengan tujuan untuk mengukur
ketepatan instrumen yang digunakan dalam suatu penelitian (Adri. M, dkk. 2008).
2
Uji reliabilitas (Husaini, 2003), adalah proses pengukuran terhadap ketepatan
(konsisten) dari suatu instrumen. Pengujian ini dimaksudkan untuk menjamin
instrumen yang digunakan merupakan sebuah instrumen yang handal, konsistensi,
stabil dan dependibalitas, sehingga bila digunakan berkali-kali akan menghasilkan
data yang sama. (Adri. M, dkk. 2008).
Dari devinisi tersebut dapat ditarik kesimpulan bahwa validitas dan reabilitas
merupakan prasyarat yang harus dipenuhi oleh sebuah alat ukur untuk mengumpulkan atau
mengukur objek yang diukur sehingga mendapatkan suatu hasil pengukuran yang benar
adanya. Selain itu, validitas dan reabilitas juga berhubungan dengan kebenaran dan
konsintensinya suatu data yang diperoleh dari suatu pengukuran. Bila kita teliti lebih jauh,
dua kalimat diatas merujuk pada dua hal yaitu validitas dan reabilitas dari suatu alat ukur
(instrument) dan yang kedua adalah validitas dan reabilitas terhadap hasil pengukuran
dalam hal ini disebut data.
Menurut Kurnia (2009), perbedaan arah yang dimaksudkan dalam validitas dan
reabilitas tersebut salah satunya karena jenis penelitian yang melakukan validasi dan
reabilitsas kadangkala berbeda. Sebenarnya terdapat perbedaan yang mendasar mengenai
validitas dan reliabilitas dalam penelitian kuantitatif dan penelitian kualitatif. Dalam
penelitian kuantitatif untuk mendapatkan data yang valid dan reliabel yang diuji validitas dan
reliabilitasnya adalah instrumen penelitiannnya. Sedangkan dalam penelitian kualitatif yang
diuji adalah datanya. Dalam penelitian kualitatif, temuan atau data dapat dinyatakan valid
apabila tidak ada perbedaan antara yang dilaporkan peneliti dengan apa yang sesungguhnya
terjadi pada obyek yang diteliti.
Selanjutnya perlu dibedakan pula antara hasil penelitian yang valid dengan instrumen
yang valid. Hasil penelitian yang valid berarti terdapat kesamaan antara data yang terkumpul
dengan data yang sesungguhnya terjadi pada objek yang diteliti. Sedangkan instrumen yang
valid berarti alat ukur yang digunakan untuk mendapatkan data itu valid. Valid berarti
instrumen tersebut dapat digunakan untuk mengukur apa yang seharusnya diukur. Jadi
instrumen yang valid menjadi syarat mutlak untuk menghasilkan hasil penelitian yang valid.
3
Namun demikian hal ini masih dipengaruhi oleh kondisi objek yang diteliti dan kemampuan
orang yang menggunakan instrumen itu.
Validitas dalam penelitian kualitatif menunjukkan sejauhmana tingkat interpretasi dan
konsep-konsep yang diperoleh memiliki makna yang sesuai antara peneliti dan partisipan.
Dengan kata lain, partisipan dan peneliti memiliki kesesuaian dalam mendeskripsikan suatu
peristiwa terutama dalam memaknai peristiwa tersebut. Dalam penelitian kualitatif tidak
digunakan instrumen yang standar tetapi peneliti bertindak sebagai instrumen.
Sedangkan dalam penelitian kuantitatif, validasi dalam memperoleh data yang sesuai
dengan keadaan yang diharapkan adalah bergantung pada instrumen (tes dan non tes) yang
digunakan sebagai alat ukur.
Pengertian reliabilitas dalam penelitian kuantitatif dan kualitatif pun berbeda. Dalam
penelitian kualitatif suatu reliabilitas itu bersifat majemuk/ganda, dinamis/selalu berubah,
sehingga tidak ada yang konsisten, dan berulang seperti semula. Situasi senantiasa berubah
demikian juga perilaku manusia yang terlibat didalamnya.
Pelaporan penelitian kualitatif pun bersifat individu, atau berbeda antara peneliti satu
dengan peneliti lainnya. Bahkan untuk obyek yang sama, apabila ada 5 peneliti dengan latar
belakang yang berbeda, akan diperoleh 5 laporan penelitian yang berbeda pula. Peneliti
yang berlatar belakang pendidikan tentu akan menemukan dan melaporkan hasil penelitian
yang berbeda dengan peneliti yang berlatarbelakang sosiologi.
Sedangkan reabilitas dalam penelitian kuantitatif berkenaan dengan derajat konsistensi
dan stabilitas data atau temuan. Suatu data dikatakan reliabel bila diteliti oleh peneliti yang
berbeda diperoleh data yang sama, begitu juga bila dilakukan dalam waktu yang tidak sama
didapat data yang sama, tentunya berkenaan pada sampel yang sama.
Dalam tulisan ini, focus kita bukanlah pada validitas dan reabilitas pada suatu jenis
penelitian tertentu. Akan tetapi dalam hal ini kita akan membahas tentang sejauh mana
kontribusi validitas dan reabilitas terhadap data maupun alat ukur (instrument).
4
II. Bagaimana Hubungan Validitas dengan Reliabilitas?
Ketetapan hasil pengukuran (reliabilitas) sangat diperlukan untuk memperoleh alat ukur
(tes dan non tes) yang dapat memberikan hasil pengukuran yang tepat (valid). Walaupun
demikian alat ukur yang mempunyai reliabilitas yang tinggi belum tentu secara otomatis
mempunyai validitas yang tinggi. Tingginya reliabilitas yang dihasilkan oleh suatu alat ukur
jika tidak dibarengi dengan tingginya validitas dapat memberikan informasi yang salah
tentang apa yang kita ukur.
Sehubungan dengan itu, hal yang sama juga disebutkan oleh Anderson, dkk (dalam
Arikunto, 1999) yang menyatakan bahwa persyaratan yang sangat penting bagi sebuah tes
adalah validitas dan reabilitas. Dalam hal ini validitas lebih penting, dan reabilitas ini perlu,
karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable tetapi tidak valid.
Sebaliknya, sebuah tes yang valid biasanya reliable.
5
3. Face Validity.
4. Factorial Validity
5. Empirical Validity
6. Intrinsic
7. Predictive Validity
8. Content Validity
9. Curricular Validity
Sementara itu, Kerlinger (dalam Daryanto, 2005) membagi validitas menjadi tiga yaitu
content validity (validitas isi), construct validity (validitas konstruk), dan criterion-related
validity (validitas berdasar kriteria).
Namun, secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas
empiris (Arikunto,1999) .
1. Validitas Logis
Validitas logis untuk sebuah instrumen evaluasi atau penelitian manunjukkan pada
kondisi sebuah inrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran
(Arikunto, 1999). Kondisi valid tersebut dipandang terpenuhi karena instrumen yang
bersangkuatan sudah dirancang secara baik sesuai dengan teori penyusunan instrumen,
mengikuti teori dan ketentuan yang ada. Sehingga secara logis intrumen tersebut sudah
valid.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah intrumen yaitu (Azwar,
1986; Arikunto, 1999; Djaali, 2008 ):
a. Validitas Isi (content validity))
Validasi bagi sebuah intrumen menunjukkan suatu kondisi sebuah intrumen
yang disusun berdasarkan isi materi palajaran yang dievaluasi (Arikunto,1999).
Selanjutnya Djaali (2008) juga menyebutkan bahwasanya validasi suatu tes
mempermasalahkan seberapa jauh suatu tes mengukur tingkat penguasaan terhadap
isi suatu materi tertentu yang seharusnya dikuasai sesuai dengan tujuan
pembelajaran. Sealain itu, Gregory (2000) menyatakan bahwasanya validasi isi
menunjukkan sejauh mana pertanyaan, tugas atau butir dalam suatu tes atau suatu
6
instrumen mampu mewakili secara keseluruhan dan proporsional perilaku sampel
yang dikenai tes tersebut.
Untuk mengetahui apakah suatu instrumen sudah valid atau tidak harus
dilakukan penelaahan kisi-kisi instrumen tersebut untuk memastikan bahwa soal-soal
atau pernyataan-pernyataan tersebut sudah mewakili atau mencerminkan
keseluruhan konten atau materi yang seharusnya dikuasai. Oleh karena itu, validitas
isi suatu instrumen tidak mempuyai besaran tertentu yang dihitung melalui
perhitungan statistika, tetapi dipahami bahwasanya intrumen ini sudah valid
berdasarkan telaah kisi-kisi tes.
Untuk memperbaiki validitas isi dari suatu tes, maka isi suatu tes harus
diusahakan agar mencakup semua pokok atau sub-pokok bahasan yang hendak
diukur sesuai dengan kurikulum atau GBPP. Oleh sebab itu validasi isi juga sering
disebut dengan istilah validasi kurikulum.
Selain itu, penentuan validasi isi juga dapat juga dilakukan dengan didasarkan
pendapat (judgement) para ahli dalam bidang yang bersangkutan (Djaali, 2008). Hal
yang sama juga disampaikan oleh Menurut Guion dalam Surapranata (2005), validitas
isi hanya dapat ditentukan berdasarkan judgement para ahli. Prosedur yang dapat
digunakan antara lain: Pendefinisikan domain yang hendak diukur, menentukan
domain yang akan diukur oleh masing-masing soal, dan membandingkan masing-
masing soal dengan domain yang udah ditetapkan. Domain yang disebut dini sama
halnya dengan kisi-kisi.
Untuk memudahkan proses validasi isi, kartu telaah intrumen sebaiknya perlu
disiapkan, akar proses validasi dapat dilakukan dengan baik. (contoh kartu telaah
intrumen tes dan non tes dapat dilihat dilampiran).
7
konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap
suatu trait atau konstruk teoritis yang hendak diukurnya (Allen & Yen, dalam
Daryanto,2005).
Sebuah tes dikatakan memiliki validasi kontruksi apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek yang disebutkan dalam Tujuan
Instruksional Khusus (TIK). Dengan kata lain, tes dikatakan validitas konstruksi apabila
soal-soalnya mengukur setiap aspek berpikir, seperti yang diuraikan dalam standar
kompetensi, kompetensi dasar, maupun indikator yang terdapat dalam kurikulum.
Seperti halnya validitas isi, validitas kontuksi dapat diketahui dengan cara
merinci dan memasangkan setiap butir soal atau pernyataan dengan dengan setiap
aspek dalam TIK atau dimensi-dimensi tertentu sesuai dengan landasan teori yang
membangunnya. Pengerjaannya dilakukan berdasarkan logika, bukan pengalaman
(Arikunto, 1999).
Ada beberapa hal yang harus diperhatikan dalam melakukan validitas
kuntruksi yaitu:
- Seberapa jauh indikator tersebut berhubungan dengan indikator-indikator
yang telah disusun.
- Indikator-indikator yang telah disusun haruslah homogen, konsisten, dan
konvergen untuk mengukur apa yang hendak diukur.
- Indikator-indikator yang telah disusun haruslah lengkap untuk mengukur
objek ukur secara utuh seperti yang diharapkan.
Walaupun pengujian validitas konstruk biasanya memerlukan teknik analisis
statistik yang lebih kompleks daripada teknik yang dipakai pada pengujian validitas
empiris lainnya, akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk
koefisien validitas tunggal.
Menyimak serangkaian proses yang teoritis tersebut, maka proses validasi
kontruksi sebuah instrumen harus juga dilakukan melalui penelaahan atau justifikasi
pakar atau melalui penilaian sekelompok panel yang terdiri dari orang-orang yang
menguasai substansi atau variabel yang hendak diukur.
8
2. Validitas Empiris
Istilah “validitas empiris” memuat kata-kata empiris yang berarti
“pengalaman”. Sebuah intrumen dapat dikatakan memiliki validitas empiris apabila
sudah diuji dari pengalaman. Djaali (2008) menyebutkan istilah lain validitas empiris
adalah validitas kriteria yang berarti bahwa validitas ditentukan berdasarkan kriteria,
baik kriteria internal maupun kriteria eksternal. Maksud dari kriteria internal adalah tes
atau instrumen itu sendiri yang menjadi kriteria, sedangkan kriteria ekternal adalah
hasil ukur instrumen atau tes lain diluar intrumen itu sendiri yang menjadi kriteria.
Ukuran lain yang sudah diangggap baku atau dapat dipercaya dapat pula dijadikan
sebagai kriteria eksternal.
Berdasarkan hal tersebut, validitas empiris digolongkan menjadi dua bagian
yaitu:
a. Validitas Internal (Validitas Butir/Validitas Item)
Validitas Internal adalah validitas yang ditentukan berdasarkan kriteria
internal. Validitas ini termasuk kedalam kelompok validitas kriteria yang merupakan
validitas yang diukur dengan besaran yang menggunakan instrumen sebagai suatu
kesatuan (keseluruhan butir sebagai kriteria untuk menentukan veliditas item atau
butir dari instrumen itu. Dengan demikian validitas internal mempermasalahkan
validitas butir atau suatu intrumen dengan menggunakan hasil ukur istrumen tersebut
sebagai suatu kesatuan dan sebagai kriteria, sehingga bisa juga disebut dengan
validitas butir (Djaali, 2008).
Validitas internal (validitas butir) diperlihatkan oleh seberapa jauh hasil ukur
butit tersebut konsisten dengan hasil ukur instrumen secara keseluruhan. Dengan kata
lain, validitas butir ini tercermin pada besaran koefisien korelasi antara skor butir
dengan skor total instrumen. Adapun kriteria kevaliditannya adalah jika koefisien
korelasi antara skor butir dengan skor total instrumen positif dan signifikan, maka butir
soal atau pernyataan tersebut dianggap valid berdasarkan ukuran validitas internal.
9
Untuk menghitung koefisien korelasi antara skor butir dengan skor total
isntrumen digunakan rumus statistika yang sesuai dengan jenis skor butir dari
instrumen tersebut. khusus untuk intrumen tes yang terdiri dari dua jenis tes yaitu tes
uraian dan tes pilihan ganda, maka rumu syang digunakan juga berbeda yaitu:
r xy =
∑ xy … … … … … … ..(i)
∑ (∑ x )(∑ y )
2 2
dimana:
rxy = koefisien korelasi antara variable X dan Y (dua variabel yang
dikorelasikan),
x=X −X dan y=Y −Y
∑xy = jumlah perkalian x dan y
x2 = kuadrat dari x
y2 = kuadrat dari y
10
Jika instrumen tes tersebut berupa tes objektif atau pilihan ganda (dengan skor
butir soal 0 atau 1) maka kita menggunakan rumus koefisien korelasi biserial
(sebagian juga menghitung dengan menggunakan rumus koefisien korelasi (i) dan
(ii)) , yaitu:
√
M P−M t p
γ pbi = … … … … … … …(iii )
St q
Keterangan:
γ pbi =¿. Koefisien korelasi biserial
Mp = rerata skor dari subjek yang menjawab betul bagi item yang dicari
validasinya
Mt = rerata skor total
St = standar deviasi dari skor total
p = proporsi siswa yang menjawab benar
¿
Kooefisien korelasi selalu terdapat antara -1,00 sampai +1,00. Namun karena dalam
menghitung sering dilakukan pembulatan angka-angka, sangat mungkin diperoleh koefisien
lebih dari 1,00. Koefisien negatif menunjukkan hubungan kebalikan sedangkan kooefisien
positif menunjukkan adanya kesejajaran. Untuk mengadakan interpretasi mengenai
besarnya koefisien korelasi adalah sebagai berikut:
0,800 ≤ rxy/γpbi ≤ 1,00 = sangat tinggi
0,600 ≤ rxy/γpbi <0,800 = tinggi
0,400 ≤ rxy/γpbi < 0,600 = cukup
0,200 ≤ rxy/γpbi < 0,400 = rendah
0,00 ≤ rxy/γpbi < 0,200 = sangat rendah
Penafsiran harga koefisien korelasi ada dua cara:
11
- Dengan melihat harga r dan interpretasikan ke dalam kriteria yang telah ditetapkan yaitu
tinggi, cukup dan sebagainya.
- Dengan berkonsultasi ke tabel harga kritik r product moment sehingga dapat diketahui
signifikan tidaknya korelasi tersebut. jika harga r lebih kecil dari harga kritik dalam tabel,
maka korelasi tersebut tidak signifikan, begitu juga sebaliknya (Arikunto, 1999). (tabel r
dan perhitungannya terlampir). Dengan kata lain, rxy dikatakan valid jika rhit > rtabel,
baik pada taraf 5% atau 1%.
b. Validitas Ekternal
Validitas ekternal adalah validitas yang ditentukan berdasarkan kriteria
eksternal. Sebagaimana telah disebutkan sebelumnya, kriteria ekternal itu dapat
berupa hasil ukur instrumen baku atau instrumen yang dianggap baku, dapat pula
berupa hasil ukur lain yang sudah tersedia dan dapat dipercaya sebagai ukuran dari
suatu konsep atau variabel yang hendak diukur. Salah satu contohnya adalah tes
standar (standardized test). Ciri-ciri dari sebuah tes standar adalah:
- Sudah dicobakan beberapa kali dan di beberapa tempat
- Sudah diketahui nilai koefisien validitas dan reabilitasnya, taraf kesukaran dan
daya pembedanya dan keterangan yang lainnya yang dianggap perlu.
Cara melakukan validitas ini adalah dengan cara mengalikan koefisien korelasi
yang diperoleh dari data tersebut dengan koefisien korelasi dari tes standar tersebut.
Sehingga validitas eksternal ini juga diperlihatkan oleh suatu besaran yang merupakan
hasil perhitungan statistika.
Adapun rumus yang digunakan dalam melakukan validitas external masih
sama halnya dengan validitas internal yaitu dengan menggunakan rumus Pearson.
Makin tinggi koefisien korelasi yang didapat, maka validitas instrumen yang
dikembangkan tersebut juga makin baik. Kriteria yang digunakan untuk menguji
validitas eksternal adalah nilai tabel r (r-tabel).
Jika koefisien korelasi antara skor hasil ukur instrumen yang dikembangkan
dengan skor hasil ukur instrumen baku lebih besar daripada r-tabel, maka instrumen
12
yang dikembangkan dapat valid berdasarkan kriteria eksternal yang dipilih (hasil ukur
instrumen baku). Jadi keputusan uji validitas dalam hal ini adalah mengenai valid atau
tidaknya instrumen sebagai suatu kesatuan, bukan valid atau tidaknya butir instrumen
seperti pada validitas internal.
Validitas eksternal dapat dibedakan menjadi dua macam yaitu:
(1). Validitas Kongkuren (concurrent validity)
Validitas konkuren adalah validitas yang apabila kriteria ekternal yang digunakan
adalah ukuran atau penampilan yang ada pada saat iini atau saat yang bersamaan
dengan pelaksanaan pengukuran.
Contoh dari validitas kongkuren ini adalah: misalnya seorang guru ingin mengetahui
apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini diperlukan sebuah
kriterium masa lalu yang sekarang datanya dimilki. Misalnya nilai ulangan harian atau
nilai sumatif yang lalu.
B. Validitas Faktor
Selain dua macam validitas (logis dan empiris) seperti yang telah dijelaskan diatas, dalam
menvalidasi data sering juga dikenal dengan validitas faktor. Jika dua validitas sebelumnya
membahas tentang validitas butir atau item tes, maka masih ada hal lain lagi yang mesti
diketahui validitasnya yaitu faktor-faktor atau bagian keseluruhan materi. Hal tersebut dapat
dilakukan validitasnya dengan menguji validitas faktor.
13
Misalnya : seorang guru akan mengevaluasi penguasaan siswa untuk tiga pokok
bahasan yaitu: penjumlahan, perkalian, dan pembagian. Untuk keperluan ini, guru
mempunyai 30 butir soal yang dibagi menjadi tiga bagian yaitu 8 soal untuk penjumlahan, 12
soal untuk perkalian, dan 10 soal untuk pembagian.
Dari soal tersebut ada tiga faktor yang memberi kontribusi terhadap set tes tersebut.
seperti halnya pengertian validitas butir, pengertian validitas faktor adalah butir-butir soal
dalam faktor dikatan valid apabila mempunyai dukungan yang besar terhadap soal-soal
secara keseluruhan.
Suatu kriteria yang menunjukkan bahwa butir-butir soal dalam setiap faktor tersebut
mempunyai dukungan yang besar terhadap seluruh soal apabila jumlah skor untuk butir-
butir faktor tersebut menunjukkan adanya kesejajaran dengan skor total. Cara melakukan uji
validitas faktor adalah dengan menghitung koefisien korelasi setiap faktor tersebut dengan
skor keseluruhan tes. Rumus yang digunakan juga msih menggunakan rumus korelasi
Pearson (i) atau (ii).
Bila kita melihat dari kriteria yang digunakan yaitu tes atau instrumen itu sendiri,
maka validitas faktor dapat kita golongkan ke dalam validitas internal.
14
- Menyusun lembar penelaah butir soal atau pernyataan untuk dinilai oleh penilai
atau pakar.
2. Proses uji validasi kontruk terhadap instrumen tes dan non tes.
Proses validasi kontruk ini sebagaimana dijelaskan pada pembahasan sebelumnya
salah satunya dapat juga dilakukan dengan pendapat pakar seperti yang kita lakukan
pada validasi isi. Namun perhitungan statistika yang dilakukan disini terbilang cukup
rumit. Menanggapi hal tersebut, kita akan membahas sekilas bagaimana melakukan
proses uji validasi kontruk ini. Uji validasi kontruk dapat dilakukan dengan dua cara
yaitu: (Djaali, 2008)
a. Proses validasi konsep melalui Panel (uji pakar)
Butir yang sudah dibuat diberikan kepada sekelompok panel untuk dinilai dengan
tetap mengacu pada tolak ukur kisi-kisi yang telah dibuat. Metode yang
digunakan dalam hal ini dapat dilakukan dengan beberapa cara, misalnya dengan
metode Thurstone dan Pair Comparison (Djaali, 2008).
b. Proses Validasi Kontruk Menggunakan Analisis Faktor
3. Proses Uji Validasi Empiris Melalui Uji Coba
Pada pembahasan sebelumnya telah dibahas bahwasanya validitas empiris di
golongkan ke dalam dua macam yaitu validitas internal dan validitas ekternal,
sehingga proses melakukan uji validasinya pun dapat dilakukan dengan dua cara
tersebut. Pada bagian ini kita akan membahas tentang uji validasi dengan
menggunakan kedua validasi tersebut secara lebih jelas, karena validasi jenis ini
sering kali digunakan dalam memvalidasi data maupun intrumen yang digunakan.
Namun sebelumnya perhatiakanlah langkah-langkah berikut:
- Setelah suatu intrumen dianggap valid secara konseptual, maka langkah
berikutnya adalah intrumen tersebut dicobakan pada sekelompok responden
yang merupakan sampel ujicoba.
- Dari jawaban responden tersebut diperoleh data yang selanjutnya akan dianalisis
bail secara internal maupun ekternal.
15
a. Proses Uji Validasi Internal (Validitas Butir/Validitas Item)
Sesuai dengan pengertiannya maka kriteria yang digunakan dalam pengujian ini
adalah data dari intrumen itu sendiri. Rumus yang digunakan disini adalah telah
dijelaskan sebelumnya yaitu koefisien korelasi product moment (r) yang
dikemukan oleh Pearson (i dan ii) dan juga koefisien korelasi biserial (iii).
Berikut ini disajikan sebuah contoh uji validasi internal untuk tes yang berupa
pilihan ganda dengan skala nilai 1 = benar, dan 0 = salah:
Tabel analisis item untuk perhitungan validitas item
16
Terlebih dahulu dibuat tabel persiapan sebagai berikut:
No Nama X Y X2 Y2 XY
1. A 1 9 1 81 9
2. B 1 9 1 81 9
3. C 1 7 1 49 7
4. D 1 8 1 64 8
5. E 0 7 0 49 0
6. F 0 7 0 49 0
7. G 1 7 1 49 7
8. H 0 3 0 9 0
jumlah 5 57 5 431 40
Diperoleh koefisien validitas item nomor 6 adalah 0,64. Dilihat secara sepintas bilangan
sangat besar dan bila dibandingkan dengan kriteria yang telah ditetapkan, koefisien
terhadap butir nomor ini tergolong dalam kategori tinggi artinya sangat meyakinkan.
Tentu saja validitasnya adalah tinggi.
17
Bila kita menggunakan nilai r pada tabel product moment, kita mendapatkan nilai rtabel =
0,63, artinya jika r soal>r tabel maka soal tersebut adalah valid. Oleh sebab itu, soal
nomot 6 cocok untuk diambil, karena r soal> r tabel (memenuhi).
Dengan cara yang sama kita dapat menentukan nilai validasi untuk butir soal yang
lainnya. Hal tersebut ditunjukkan dalam tabel berikut:
soal 1 2 3 4 5 6 7 8 9 10
Validitas 0,88 0,70 0,64 -0,29 0,04 0,64 0,70 -0,12 0,70 0,21
Ket ambil ambil ambil drop drop ambil ambil drop ambil drop
Dari tabel tersebut menunjukkan bahwa soal yang dapat diambil untuk selanjutnya di
uji reabilitas adalah soal nomor yang diberi tanda “ambil”.
Contoh validasi butir untuk pernyataan pada angket (mis: angket sikap).
Validitas butir kuesioner sikap ini dipertimbangkan juga berdasarkan koefisien
korelasi antara skor total dengan skor item. Mengingat kuesioner ini adalah salah
satu non tes, maka statistik korelasi yang digunakan adalah statistik korelasi product
moment (ii atau iii) (Guilford, 1973:85).
Angket yang diberikan kepada 8 orang siswa misalnya dengan menggunakan skala:
SS : Sangat setuju. (skor 4)
S : Setuju. (skor 3)
TS : Tidak setuju (skor 2)
STS : Sangat tidak setuju (skor 1)
Diperoleh hasil sebagai berikut:
2. B 4 3 1 4 2 3 3 1 2 5
3
3. C 3 4 3 1 4 2 2 4 1 2 4
4. D 1 3 3 2 3 4 3 4 2 3 5
5. E 3 3 4 2 3 3 3 3 2 4 6
18
6. F 4 4 4 1 3 4 1 3 3 2 4
7. G 4 3 4 2 3 3 1 4 4 1 7
8. H 3 3 4 1 4 1 2 1 4 2 8
No Nama X Y X2 Y2 XY
1. A 3 32 9 1024 96
2. B 2 26 4 676 52
3. C 2 26 4 676 52
4. D 3 28 9 784 84
5. E 4 30 16 900 120
6. F 2 29 4 841 58
7. G 1 29 1 841 29
8. H 2 25 4 625 50
jumlah 19 225 51 6367 541
Keterangan: X = skor item nomor 10
Y = skor total
Dengan menentukan koefisien korelasinya menggunakan rumus (ii), kita peroleh:
r XY =N ∑ XY −( ∑ X ¿)¿ ¿ ¿
53
r XY =
√ 47 x 311
r XY =0,438
Berdasarkan kooefisien validasi tersebut bila kita merujuk kepada kriteria yang
telah ditetapkan maka menunjukkan tingkat validasi masih rendah atau tergolong
cukup dan belum meyakinkan dan membutuhkan revisi. Sedangkan bila melihat
daftar tabel r dengan menggunakan taraf 0,05, dengan banyaknya item = 10
19
pernyataan diperoleh r tabel = 0,632. Sehingga bila kita membandingkan
koefisien korelasi butir/item pernyataan ke 10 dengan r tabel yang diperoleh,
maka kesimpulannya adalah butir tersedut harus di drop karena tidak signifikan.
A. Jenis-Jenis Reabilitas
Reabilitas dibagi kedalam dua macam, yaitu: (Djaali, 2008)
1. Reabilitas Konsistensi Tanggapan
Reabilitas Konsistensi tanggapan responden mempersoalkan apakah tanggapan
responden atau objek terhadap tes tersebut sudah baik atau konsisten. Maksudnya adalah
20
apabila kita melakukan suatu pengukuran terhadap suatu objek kemudian dilakukan
pengukuran kembali terhadap objek yang sama maka apakah hasilnya masih tetap sama
dengan hasil yang diperoleh dari pengukuran sebelumnya.
Jika item-item dalam dua kali pengukuran itu tidak sama atau tidak setara, maka
tidak akan menemukan konsistensi tanggapan terhadap dua hal yang jelas berbeda. Dan
bukanlah merupakan tujuan atau tugas pemeriksaan reabilitas.
Ada tiga mekanisme untuk memeriksa atau menentukan reabilitas tanggapan respon
terhadap tes yaitu:
a. Tehnik test – retest.
Test-retest adalah pengetesan dua kali dengan menggunakan suatu test yang sama
pada waktu yang berbeda. Test seperti ini juga dikenal dengan istilah lain yaitu
single-test-double-trial method. Kemudian hasil dari kedua kali tes tersebut
dihitung korelasinya, nilai tersebut adalah reabilitas dari tes tersebut.
b. Tehnik bentuk equivalent
Tes paralel atau tes equivalen adalah dua buah tes yang mempunyai kesamaan
tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam
menggunakan motode tes ini, pembuat tes harus menyiapkan dua buah tes dan
masing-masing dicobakan pada kelompok siswa yang sama.
Skor dari kedua kelompok tes tersebut dikorelasikan untuk mendapatkan reabilitas
tes.
21
- Dengan memberah item tes menjadi dua bagian dari awal dan akhir, dikenal
dengan istilah belahan awal dan akhir.
Oleh sebab itu jika menggunakan metode ini item banyaknya butir atau item tes
haruslah genap agar dapat dibelah dengan mudah.
Rumus yang digunakan dalam hal ini adalah rumus Spearman-Brown (Arikunto,
1999):
2r1 1
.
2 2
r 11=
(1+r 1 1 )
.
2 2
Dimana:
r 1 1 . =korelasi antara skor-skor setiap belahan tes (ditentukan dengan rumus
.
2 2
product moment).
r 11. = koefisien reabilitas yang sudah disesuaikan
Selain rumus tersebut yang menggunakan rumus product momen, ada beberapa
rumus lain yang dapat digunakan untuk menghitung nilai reabilitas suatu tes atau
instrumen dengan metode belah dua, yaitu:
Penggunaan rumus Flanaga (untuk belahan ganjil genap)
r 11=2¿
dengan S=
√∑ x 2
N
Dimana:
r11 = reabilitas tes
2
S1 = varian belahan pertama (varian skor item ganjil)
2
S2 = varian belahan dua (varian skor item genap)
2
St = varian total (varian skor total)
S = standar deviasi
22
x = dicari dengan X −X
N = banyaknya subjek pengikut tes.
Dimana:
2
Sd = varian beda
d = perbedaan skor antara belahanpertama dengan skor belahan kedua
Namun bila banyaknya butir soal atau item tidaklah genap, reabilitas masih dapat
ditentukan dengan menggunakan rumus Kuder dan Richardos, yang sering dikenal
deng rumus K-R 20 dan K-R 21. Kedua rumus ini banyak digunakan oleh orang-orang
dalam menentukan reablitas dari suatu tes atau instrumen.
Rumus K-R 20
Rumusnya:
S −∑ pq
2
( )
r 11=
n
n−1
(
S
2
)
dimana :
r11 = reabilitas tes secara keseluruhan
p= proporsi subjek yang menjawab item dengan benar
q= proporsi subjek yang menjawab item dengan salah
(q = 1- p)
∑pq = jumlah perkalian p dan q
n = banyak butir\
S = standar deviasi dari tes
Rumus K-R 21
Rumusnya:
23
r 11= ( )
n
n−1
(1−
M (n−M )
2
nS t
)
Dimana:
M = rata-rata skor total
2. Reabilitas Konsistensi Gabungan
Reabilitas konsistensi gabungan item berkaitan dengan kemantapan atau
konsistensi antara-antara suatu item. Hal ini dapat diungkapkan pakah terhadap
objek ukur yang sama, item yang satu menunjukkan hasil ukur yang sama dengan
hasil ukur yang lain?.
Koefisien reabilitas konsistensi gabungan dapat dihitung dengan rumus K-R 20
dan K-R 21, Hoyt dan Alpha Cronbach
dimana σ
❑
=
√∑ x 2
N
Dimana:
r11 = reabilitas yang dicari
dengan kriteria
24
- Kriterian skala
0,800 ≤ r11 ≤ 1,000: reliabilitas sangat tinggi
Berikut ini disajikan sebuah contoh uji reabilitas untuk tes yang berupa pilihan
ganda dengan skala nilai 1 = benar, dan 0 = salah:
Tabel analisis item untuk perhitungan reabilitas item
No Nama Butir soal/item Skor
25
1 2 3 6 7 9 total
1. A 1 1 1 1 1 1 6
2. B 1 1 1 1 1 1 6
3. C 1 1 0 1 1 0 4
4. D 1 1 1 1 1 1 6
5. E 1 1 1 0 0 1 4
6. F 1 1 1 0 1 1 5
7. G 1 0 0 1 1 1 4
8. H 0 0 0 0 0 0 0
Berdasarkan tabel di atas maka kita peroleh:
Perhitungan Reabilitas Butir Soal (PG)
x y
Butir soal/item Skor
No Nama
1 2 3 6 7 9 total y-y* (y-y*)2
1. A 1 1 1 1 1 1 6 1,62 2,6244
2. B 1 1 1 1 1 1 6 1,62 2,6244
3. C 1 1 0 1 1 0 4 -0,38 0,1444
4. D 1 1 1 1 1 1 6 1,62 2,6244
5. E 1 1 1 0 0 1 4 -0,38 0,1444
6. F 1 1 1 0 1 1 5 0,62 0,3844
7. G 1 0 0 1 1 1 4 -0,38 0,1444
8. H 0 0 0 0 0 0 0 -4,38 19,1844
Np 7 6 5 5 6 6 35 0,0 27,8752
p 0,88 0,75 0,63 0,6 0,8 0,75
q 0,13 0,25 0,38 0,4 0,3 0,25
pq 0,11 0,19 0,23 0,2 0,2 0,188 1,1406
6 1 , 9−1, 14
r 11= x ( )
5 1,9
r 11=0 , 81
Berdasarkan kriteria yang telah ditetapkan, kriteria dari 6 soal tersebut adalah
sangat tinggi.
26
Daftar Pustaka
Adri. M, dkk. 2008. Uji Validitas dan Reabilitas Paket Multimedia Interaktif.
http://elektronika.unp.ac.id/wp-content/uploads/2008/03/
nelda_adri_makasemnas2008.pdf
Azwar, Saifuddin. (1986). Seri Pengukuran Psikologi: Reliabilitas dan Validitas Interpretasi
dan Komputasi. Yogyakarta: Liberty
Djaali & Pudji M. 2008. Pengukuran dalam Bidang Pendidikan. Jakarta: Grasindo.
Kurnia Ahmad. 2009. Validitas dan Reabilitas Penelitian Kualitatif dan Kuantitatif.
(http://skripsimahasiswa.blogspot.com/2009/11/validitas-dan-reabilitas-
penelitian.html)
Sugiyono. 2007. Metode Penelitian Pendidikan (Pendekatan Kuantitatif, kualitatif, dan R&D).
Bandung: Alfabeta
(http://skripsimahasiswa.blogspot.com/2009/11/validitas-dan-reliabilitas-
penelitian.html)
27
Surapranata, Sumarna. (2005). Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil
Tes: Implementasi Kurikulum 2004. Bandung: Remaja Rosdakarya.
(Dalam Bab IV Tehnik Analisis Butir Soal)
28
PENGERTIAN
VALIDITAS
DAN RELIABILITAS
29