Anda di halaman 1dari 10

VALIDITAS DAN REABILITAS

A. VALIDITAS
1) Pengertian Validitas
Azwar (1987: 173) menyatakan bahwa validitas berasal dari kata validity yang
mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam
melakukan fungsi ukurnya. Suatu tes dikatakan memiliki validitas yang tinggi apabila alat
tersebut menjalankan fungsi ukur secara tepat atau memberikan hasil ukur yang sesuai
dengan maksud dilakukannya pengukuran tersebut. Artinya hasil ukur dari pengukuran
tersebut merupakan besaran yang mencerminkan secara tepat fakta atau keadaan
sesungguhnya dari apa yang diukur.
Suryabrata (2000: 41) menyatakan bahwa validitas tes pada dasarnya menunjuk
kepada derajat fungsi pengukurnya suatu tes, atau derajat kecermatan ukurnya sesuatu tes.
Validitas suatu tes mempermasalahkan apakah tes tersebut benar-benar mengukur apa yang
hendak diukur. Maksudnya adalah seberapa jauh suatu tes mampu mengungkapkan dengan
tepat ciri atau keadaan yang sesungguhnya dari obyek ukur, akan tergantung dari tingkat
validitas tes yang bersangkutan. Sudjana (2004: 12) menyatakan bahwa validitas berkenaan
dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai
apa yang seharusnya dinilai.

2) Urgensi Validitas
Urgensi dari validitas isi adalah sejauh mana suatu tes mengukur tingkat penguasaan
terhadap isi / materi tertentu yang seharusnya dikuasai, validitas konstruk berkaitan dengan
seberpa jauh butir-butir dalam instrument mampu mengukur apa yang hndak diukur sesuai
dengan definisi konseptual yang telah ditetapkan, sedangkan validitas kriteria ditentukan
berdasarkan kriteria, baik internal maupun eksternal.

3) Prinsip-Prinsip Penelitian
Terdapat empat prinsip dalam melakukan uji validitas, yaitu sebagai berikut:
1. Interpretasi (interpretation) yang kita berikan terhadap asesmenT hanya valid terhadap
derajat yang kita arahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya.
2. Kegunaan (use) yang bisa kita buat dari hasil asesment hanya valid terhadap derajat yang
kita arahkan ke suatu bukti yang mendukung kecocokan dan kebenarannya.
3. Interpretasi dan kegunaan dari hasil asesment hanya valid ketika nilai (values) yang
dihasilkan sesuai.
4. Interpretasi dan kegunaan dari hasil asesment hanya valid ketika konsekuensi
(consequences) dari interpretasi dan kegunaan ini konsisten dengan nilai kecocokan.

4) Jenis-jenis Validitas
Konsep validitas tes dapat dibedakan atas tiga macam yaitu validitas isi (content validity),
validitas konstruk (construct validity), dan validitas empiris atau validitas kriteria.
1. Validitas isi menunjukkan sejauhmana pertanyaan, tugas atau butir dalam suatu tes
atau instrumen mampu mewakili secara keseluruhan dan proporsional perilaku sampel
yang dikenai tes tersebut. kan melalui penelaahan kisi-kisi tes untuk memastikan
bahwa soal-soal tes itu sudah mewakili atau mencerminkan keseluruhan konten atau
materi yang seharusnya dikuasai secara proporsional. Oleh karena itu validitas isi
suatu tes tidak mempunyai besaran tertentu yang dihitung secara statistika tetapi
dipahami bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes. Oleh karena itu,
validitas isi sebenarnya mendasarkan pada analisis logika, tidak merupakan suatu
koefisien validitas yang dihitung secara statistika.
2. Validitas konstruk (construct validity) adalah validitas yang mempermasalahkan
seberapa jauh butir-butir tes mampu mengukur apa yang benar-benar hendak diukur
sesuai dengan konsep khusus atau definisi konseptual yang telah ditetapkan. Validitas
konstruk biasa digunakan untuk instrumen yang dimaksudkan mengukur variabel
konsep, baik yang sifatnya performansi tipikal seperti instrumen untuk mengukur
sikap, minat konsep diri, lokus kontrol, gaya kepemimpinan, motivasi berprestasi, dan
lain-lain, maupun yang sifatnya performansi maksimum seperti instrumen untuk
mengukur bakat (tes bakat), inteligansi (kecerdasan intelektual), kecerdasan,
emosional dan lain-lain.
3. Validitas empiris sama dengan validitas kriteria yang berarti bahwa validitas
ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal.
Validitas empiris diperoleh melalui hasil uji coba tes kepada responden yang setara
dengan responden yang akan dievaluasi atau diteliti. Kriteria internal adalah tes atau
instrumen itu sendiri yang menjadi kriteria, sedang kriteria eksternal adalah hasil ukur
instrumen atau tes lain di luar instrumen itu sendiri yang menjadi kriteria. Ukuran lain
yang sudah dianggap baku atau dapat dipercaya dapat pula dijadikan sebagai kriteria
eksternal. Validitas yang ditentukan berdasarkan kriteria internal disebut validitas
internal sedangkan validitas yang ditentukan berdasarkan kriteria eksternal disebut
validitas eksternal.
5) Uji ValiditasD. FAKTOR-FAKTOR YANG MEMPENGARUHI VALIDITAS
Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid. Beberapa faktor
tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes,
faktor eksternal tes, dan faktor yang berasal dari responden yang bersangkutan (Sukardi,
2008). Dan faktor – faktor tersebut yaitu :
1. Faktor yang berasal dari dalam tes, sebagai berikut:
a) Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi validitas
tes.
b) Kata-kata yang digunakan dalam struktur instrument evaluasi, tidak terlalu sulit.
c) Item tes dikonstruksi dengan jelas.
d) Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
e) Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau
terlalu longgar.
f) Jumlah item terlalu sedikit sehingga tidak mewakili sampel.
g) Jawaban masing-masing item evaluasi bisa diprediksi responden

2. Faktor yang berasal dari administrasi dan skor tes, sebagai berikut:
a) Waktu pengerjaan tidak cukup sehingga responden dalam memberikan jawaban dalam
situasi tergesa-gesa.
b) Adanya kecurangan dalam tes.
c) Pemberian petunjuk dari dari pengawas yang tidak dapat dilakukan pada semua responden.
d) Teknik pemberian skor yang tidak konsisten.
e) Responden tidak dapat memngikuti arahan yang diberikan dalam tes baku.
f) Adanya joki (orang lain bukan siswa) yang masuk dalam menjawab item tes yang
diberikan.

3. Faktor yang berasal dari jawaban responden


Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi tidak valid, karena
dipengaruhi oleh jawaban responden dari pada interpretasi item-item pada tes
evaluasi.Kegunaan validitas menurut Arikunto (2002) adalah:
1. Untuk menghindari pertanyaan yang kurang jelas.
2. Untuk meniadakan kata-kata yang terlalu asing atau kata-kata yang menimbulkan
kecurigaan.
3. Untuk memperbaiki pertanyaan-pertanyaan yang kurang jelas.
4. Untuk menambah item yang diperlukan atau meniadakan item yang dianggap tidak
relevan.
5. Untuk mengetahui validitas kuesioner tersebut.

6) Validias Item dan Validitas Faktor


Validitas faktor diukur bila item yang disusun menggunakan lebih dari satu faktor
(antara faktor satu dengan yang lain ada kesamaan). Pengukuran validitas faktor ini dengan
cara mengkorelasikan antara skor faktor (penjumlahan item dalam satu faktor) dengan skor
total faktor (total keseluruhan faktor).
Validitas item ditunjukkan dengan adanya korelasi atau dukungan terhadap item total
(skor total), perhitungan dilakukan dengan cara mengkorelasikan antara skor item dengan
skor total item. Bila kita menggunakan lebih dari satu faktor berarti pengujian validitas item
dengan cara mengkorelasikan antara skor item dengan skor faktor, kemudian dilanjutkan
mengkorelasikan antara skor item dengan skor total faktor (penjumlahan dari beberapa
faktor)

7) Cara Menghitung Validitas


Untuk menguji validitas setiap butir soal maka skor-skor yang ada pada butir yang
dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatakan skor X dan skor
total dinyatakan sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat
diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks validitasnya
(Arikunto, 1999:78). Tentukan koefisien korelasi antara skor hasil tes yang akan diuji
validitasnya dengan hasil tes yang terstandar yang dimiliki oleh orang yang sama dengan
menggunakan rumus korelasi produk momen di bawah ini:

Rumus korelasi produk momen


Hitung koefisien validitas instrumen yang diuji (r-hitung), yang nilainya sama dengan
korelasi korelasi hasil langkah sebelumnya dikali koefisien validitas instrumen terstandar.
Bandingkan nilai koefisien validitas dengan nilai koefisien korelasi Pearson / tabel Pearson
(r-tabel) pada taraf signifikansi a (biasanya dipilih 0,05) dan n = banyaknya data yang sesuai.
Kriterianya adalah :
• Instrumen valid, jika r-hitung = r-tabel
• Instrumen tidak valid, jika r-hitung < r-tabel
Tentukan kategori dari validitas instrument yang mengacu pada pengklasifikasian validitas
yang dikemukakan oleh Guilford (1956:145) sebagai berikut:

0,80 < rxy 1,00 : Validitas Sangat Tinggi (Sangat Baik)

0,60 < rxy 0,80 : Validitas Tinggi (Baik)

0,40 < rxy 0,60 : Validitas Sedang (Cukup)

0,20 < rxy 0,40 : Validitas Rendah (Kurang)

0,00 < rxy 0,20 : Validitas Sangat Rendah (Jelek)

rxy 0,00 : Tidak Valid

B. REABILITAS
a). Pengertian Reabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu pengukuran dapat
dipercaya. Suatu hasil pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan
pengukuran terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif
sama, selama aspek yang diukur dalam diri subyek memang belum berubah. Nur (1987: 47)
menyatakan bahwa reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu, atau
skor-z, relatif konsisten apabila dilakukan pengulangan pengadministrasian dengan tes yang
sama atau tes yang ekivalen. Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan
salah-satu ciri atau karakter utama instrumen pengukuran yang baik. Arifin (1991: 122)
menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila
diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.
Memperhatikan pendapat di atas, maka reliabilitas adalah merupakan koefisien yang
menunjukkan sejauh mana suatu instrumen/alat pengukur dapat dipercaya, artinya apabila
suatu instrumen digunakan berulang-ulang untuk mengukur sesuatu yang sama, maka
hasilnya relatif stabil atau konsisten. Secara empiris tinggi rendahnya reliabilitas ditunjukkan
oleh suatu angka yang disebut koefisien reliabilitas, besarnya koefisien reliabiltas berkisar
antara 0 sampai dengan 1, dimana semakin tinggi angka reliabilitas berarti semakin konsisten
hasil pengukuran, akan tetapi secara empiris koefisien reliabilitas yang mencapai angka 1
jarang dijumpai.

Menurut Allen dan Yen (1979: 75) koefisien reliabilitas besarnya ditentukan oleh satu
dikurangi dengan perbandingan varians kesalahan pengukuran dan varians skor tampak. Atas
dasar yang demikian semakin kecil varians kesalahan pengukuran, maka akan semakin tinggi
koefisien reliabilitas, sehingga varians tampak dapat digunakan sebagai atribut koefisien
reliabilitas yang sesungguhnya. Tujan adanya realibilitas adalah mengkonsep satu variabel
dengan jelas. Setiap pengukuran harus merujuk pada satu dan hanya satu konsep/variabel.
Sebuah variabel harus spesifik agar dapat menguragi intervensi informasi dari variabel lain.
b). Jenis-Jenis Reabilitas
Djaali (2000: 81) menyatakan bahwa reliabilitas dibedakan atas dua macam, yaitu
reliabilitas konsistensi tanggapan, dan reliabilitas konsistensi gabungan butir.
1. Reliabilitas konsistensi tanggapan responden mempersoalkan apakah tanggapan
responden atau obyek ukur terhadap tes atau instrumen tersebut sudah baik atau
konsisten. Dalam hal ini apabila suatu tes atau instrumen digunakan untuk melakukan
pengukuran terhadap obyek ukur kemudian dilakukan pengukuran kembali terhadap
obyek ukur yang sama, apakah hasilnya masih tetap sama dengan pengukuran
sebelumnya. Jika hasil pengukuran kedua menunjukkan ketidakkonsistenan maka
jelas hasil pengukuran itu tidak mencerminkan keadaan obyek ukur yang
sesungguhnya.
2. Djaali (2000: 81) menyatakan bahwa reliabilitas konsistensi gabungan butir berkaitan
dengan kemantapan antara butir suatu tes. Hal ini dapat diungkapkan dengan
pertanyaan, apakah terhadap obyek ukur yang sama, butir yang satu menunjukkan
hasil ukur yang sama dengan butir yang lainnya? Dengan kata lain bahwa terhadap
bagian obyek ukur yang sama, apakah hasil ukur butir yang satu tidak kontradiksi
dengan hasil ukur butir yang lain. Jika terhadap bagian obyek ukur yang sama, hasil
ukur melalui butir yang satu kontradiksi atau tidak konsisten dengan hasil ukur
melalui butir yang lain maka pengukuran dengan tes (alat ukur) sebagai suatu
kesatuan itu tidak dapat dipercaya. Dengan kata lain tidak reliabel dan tidak dapat
digunakan untuk mengungkap ciri atau keadaan yang sesungguhnya dari obyek ukur.
Kalau hasil pengukuran pada bagian obyek ukur yang sama antara butir yang satu
dengan butir yang lain saling kontradiksi atau tidak konsisten maka kita jangan
menyalahkan obyek ukur, melainkan alat ukur (tes) yang dipersalahkan dengan
mengatakan bahwa tes tersebut tidak reliabel terhadap obyek yang diukur.

d). Uji Reabilitas


Reliabilitas instrumen dapat diuji dengan beberapa uji reliabilitas. Beberapa
uji reliabilitas suatu instrumen yang bisa digunakan antara lain:
a. Test-Retest
Pengujian reliabilias dengan testretest dilakukan dengan cara mencobakan
satu jenis instrumen beberapa kali pada subjek (responden) yang sama.
Reliabilitas instrumen diukur dari koefisien korelasi antara percobaan pertama
dengan percobaan selanjutnya. Instrumen dinyatakan reliabel jika koefisien
korelasi positif dan signifikan. Korelasi antara hasil uji pertama dengan hasil
uji selanjutnya diuji dengan korelasi Product Moment untuk mencari koefisien
korelasinya.
b. Equivalent
Pengujian reliabilias dengan uji equivalent dilakukan dengan cara mencobakan
instrumen yang berbeda tetapi ekuivalen (sebanding/sepadan). Percobaan
dilakukan satu kali saja pada responden yang sama. Reliabilitas instrumen
diukur dari koefisien korelasi antara percobaan instrumen satu dengan
percobaan instrumen yang lainnya. Instrumen dinyatakan reliabel jika koefisien
korelasi positif dan signifikan. Pengujian koefisien korelasi dan signifikansinya
dilakukan seperti pada uji test-retest menggunakan rumus korelasi Product
Moment dan diuji signifikansinya menggunakan r tabel atau uji t.
c. Internal Consistency
Pengujian reliabilias dengan uji internal consistency, dilakukan dengan cara
mencobakan instrumen sekali saja pada subjek penelitian. Pengujian ini dapat
dilakukan dengan teknik belah dua (split half) dari Spearman Brown, KR 20,
KR 21, atau dengan teknik Alfa Cronbach. Hasil pengujian tersebut kemudian
dianalisis dengan teknik tertentu tergantung jenis instrumennya.

c). Estimasi Reabilitas


Allen & Yen (1979) menyatakan bahwa tes dikatakan reliabel jika skor amatan
mempunyai korelasi yang tinggi dengan skor yang sebenarnya. Selanjutnya dinyatakan
bahwa koefisien reliabilitas merupakan koefisien korelasi antara dua skor amatan yang
diperoleh dari hasil pengukuran menggunakan tes yang paralel. Dengan demikian, pengertian
yang dapat diperoleh dari pernyatan tersebut adalah suatu tes itu reliabel jika hasil
pengukuran mendekati keadaan peserta tes yang sebenarnya. Reliabilitas () suatu tes pada
umumnya diekspresikan secara numerik dalam bentuk koefisien yang besarnya -1,00   
+1,00. Koefisien tinggi menunjukkan reliabilitas tinggi. Sebaliknya, jika koefisien suatu skor
tes rendah maka reliabilitas tes rendah. Jika suatu reliabilitas sempurna, berarti koefisien
reliabilitas tersebut +1,00. Harapannya, koefisien reliabilitas bersifat positif.
Proses penghitungan reliabilitas disebut dengan estimasi. Estimasi reliabilitas tes yang
dapat dilakukan dengan beberapa cara, konsistensi eksternal, konsistensi internal, reliabilitas
komposit, reliabilitas konstruk, reliabilitas interrater, dan estimasi reliabilitas dengan teori
generalisabilitas (Generalizability theory).
 Estimasi Konsistensi Eksternal
Estimasi reliabilitas eksternal diperoleh dengan menggunakan skor hasil pengukuran yang
berbeda, baik dari instrumen yang berbeda maupun yang sama. Ada dua cara untuk
mengestimasi reliabilitas eksternal suatu instrumen yaitu dengan teknik pengukuran ulang
(test-retest-method) dan teknik paralel.
 Konsistensi Internal
Dengan teknik konsistensi internal ini, hanya dengan melakukan satu kali pengumpulan
data, reliabilitas skor perangkat pengukuran dapat diestimasi. Pada pembuktian instrumen
dengan cara ini ada beberapa cara, yang masing-masing dapat memerlukan persyaratan-
persyaratan atau asumsi tertentu yang harus dipenuhi oleh peneliti. Beberapa cara yang
dapat digunakan untuk mengestimasi reliabilitas dengan konsistensi internal diantaranya
sebagai berikut. 1. Metode Belah Dua (Split Half Method)
 Reliabilitas komposit
Pada suatu instrumen, sering peneliti menggunakan instrumen yang terdiri dari banyak
butir. Jika butir-butir ini merupakan butir yang berbeda-beda namun membangun suatu
konstruk yang sama, maka analisis untuk mengestimasi reliabilitas dapat digunakan
rumus reliabilitas komposit. Komposit yang dimaksudkan yakni skor akhir merupakan
gabungan dari skor butir-butir penyusun instrumen. Ada 3 formula yang dapat digunakan
untuk mengestimasi reliabilitas dengan cara ini, yaitu dengan menghitung koefisien 
dari Cronbach, koefisien KR-20, dan koefisien KR-21.
 Reliabilitas Konstruk
Cara keempat untuk mengestimasi reliabilitas adalah dengan mengestimasi reliabilitas
konstruk. Reliabilitas konstruk ini dapat diestimasi setelah peneliti membuktikan validitas
konstruk dengan analisis faktor konfirmatori sampai memeroleh model yang cocok
(model yang fit). Dengan analisis faktor ini, peneliti dapat memeroleh muatan faktor
(factor loading) tiap indikator yang menyusun instrumen () dan indeks kesalahan unik
dari tiap indikator (). Sebagai contoh pada pembuktian validitas konstruk kemampuan
akademik, diperoleh model yang fit.
 Reliabilitas Inter-rater
jika dalam suatu instrumen penskoran butir dilakukan dengan memanfaatkan dua orang
rater, peneliti dapat mengestimasi reliabilitas dengan inter-rater agreement. Hasil estimasi
reliabilitas dengan cara ini disebut dengan reliabilitas inter-rater. Adapun cara
mengestimasinya dengan menghitung terlebih dahulu banyaknya butir atau kasus yang
cocok atau butir atau kasus yang diskor sama oleh kedua rater. Banyaknya butir yang
cocok ini kemudian dibandingkan dengan butir total, kemudian disajikan dalam
persentase. Estimasi reliabilitas skor dengan inter-rater dapat disajikan dengan formula
sebagai berikut.
Inter-rater agreement = 𝑩𝒂𝒏𝒚𝒂𝒌𝒏𝒚𝒂 𝒌𝒂𝒔𝒖𝒔 𝒚𝒂𝒏𝒈 𝒅𝒊𝒔𝒌𝒐𝒓 𝒔𝒂𝒎𝒂 𝒐𝒍𝒆𝒉 𝒌𝒆𝒅𝒖𝒂 𝒓𝒂𝒕𝒆𝒓
𝑩𝒂𝒏𝒚𝒂𝒌𝒏𝒚𝒂 𝒌𝒂𝒔𝒖𝒔 𝒙 𝟏𝟎𝟎
 Reliabilitas dengan Teori Generalizabilitas
Teori generalisabilitas (Generalizability Theory) terkait dengan 2 hal, generalizability (G)
study dan decision (D) study. Peneliti yang melakukan G-Study mengutamakan
generalisasi dari suatu sampel pengukuran ke keseluruhan pengukuran. Studi tentang
stabilitas respons antarwaktu, equivalensi skor dari 2 atau lebih instrumen yang berbeda,
hubungan antara skor sub-kemampuan dengan skor butir terkait dengan Gstudy. Pada D-
study, data dikumpulkan untuk tujuan khusus terkait dengan membuat keputusan. Studi
ini menyediakan data mendeskripsikan peserta tes, baik seleksi atau penempatan, maupun
menyelidiki hubungan 2 variabel atau lebih (Crocker & Algina, 2008).
Daftar Pustaka
Khumaedi, Muhammad. 2012. Reabilitas Instrumen Penelitian Pendidikan. Jurnal
Pendidikan Teknik Mesin. Vol. 12(1)
Matondang, Zulkifli. Validitas dan Reabilitas Suatu Instrumen Penelitian. 2009.
Jurnal Tabularasa pps UNIMED. Vol 6(1)
Pramuaji. K. & Lobby Loekmono. 2018. Uji Validitas Dan Reliabilitas Alat Ukur
Penelitian : Questionnaire Empathy. Jurnal Ilmiah Bimbingan Konseling Undiksha. 9(2):
74 – 78.
Retnawati , Heri. 2017. Reliabilitas Instrumen Penelitian. Makalah disajikan pada
kegiatan Workshop Teknik Analisis Data Fakultas Ekonomi dan Bisnis IAIN
Batusangkar di Rocky Hotel Bukittinggi.
Sutha, D., W. 2019. Biostatistika. Media Nusa Creative: Malang.
Yusup, Febrianawati. 2018. Validitas dan Reliabilitas Instrumen Penelitian
Kuantitatif. Jurnal Ilmiah Kependidikan. 7(1): 17-23.

Anda mungkin juga menyukai