Validitas Tes
Nurul Mukhlisa
Universitas Negeri Makassar, Indonesia
Email: nurullmukhlisaa@unm.ac.id
Abstrak: penelitian ini bertujuan untuk (1) mengetahui pengertian validitas dan (2)
mengetahui jeni-jenis validitas. Penelitian ini termasuk studi kepustakaan dengan
pendekatan kualitatif. Pengumpulan data dilakukan melalui pengumpulan kajian
teori dari berbagai buku. Kemudian setiap hasil kajian teori dalam buku tersebut
direview dan dianalisis secara seksama. Berdasarkan hasil penelitian, maka disim-
pulkan bahwa suatu tes dikatakan valid jika mengukur apa yang hendak diukur.
Dengan kata lain suatu tes dikatakan valid jika sesuai dengan tujuan tes tersebut
diadakan. Validitas terbagi tiga, yaitu validitas isi, validitas kriteria, dan validitas
konstruk. Validasi dilakukan sebelum dan setelah tes diujicobakan. Sebelum diu-
jicobakan, kita dapat mengetahui validitas isi tes berdasarkan hasil validasi oleh
pakar. Validitas kriteria dan validitas konstruk dapat diketahui setelah tes diu-
jicobakan.
142
Juara SD: Jurnal Pendidikan Dan Pembelajaran Sekolah Dasar
kemampuan, karakteristik, atau tingkah laku tingkat validitasnya. Demikianlah istilah va-
yang diukur melalui alat ukur yang tepat liditas yang dikaitkan dengan pengukuran,
(Susetyo, 2015). Jadi, validitas menunjukkan sedangkan validitas butir hanya berbicara
ketepatan suatu instrumen dalam mengukur. tentang hubungan di antara skor satuan pada
Validitas adalah dukungan bukti dan teori butir dengan skor responden (Susetyo, 2015).
bahwa penafsiran skor tes sesuai dengan Pemeriksaan validitas pengukuran dil-
tujuan penggunaan tes. Oleh karena itu, va- akukan sebelum alat ukur digunakan untuk
liditas adalah fundamen paling dasar dalam sesungguhnya. Pemeriksaan validitas pen-
mengembangkan suatu tes. Proses validasi gukuran dapat dilakukan setelah alat ukur
mencakup pengumpulan bukti-bukti untuk baru dibuat atau disusun. Pemeriksaan va-
menunjukkan dasar ilmiah penafsiran skor liditas pengukuran juga dapat dilakukan pada
seperti yang telah direncanakan (Mardapi, saat uji coba alat ukur. Apabila hasil
2008). pemeriksaan menunjukkan tingkat validitas
Apabila kita ingin mengukur berat sebuah rendah, maka alat ukur dapat diperbaiki.
kalung emas, maka kita harus menggunakan Pemeriksaan validitas dan perbaikan alat
timbangan emas agar hasil ukur tersebut val- ukur dilakukan berulang kali sampai alat
id. Sebuah timbangan beras memang men- ukur mencapai validitas pengukuran yang
gukur “berat”, tetapi tidak cukup cermat un- cukup tinggi (Arafah, 2017).
tuk mengukur berat emas. Oleh karena itu, Sebenarnya validitas pengukuran meru-
sebuah timbangan beras tidak valid untuk pakan satu kesatuan kecocokan antara pen-
mengukur berat emas. Demikian pula, apa- gukuran dan sasaran ukur. Berdasarkan sifat
bila kita ingin menghitung waktu tempuh pencocokan, validitas dapat dibagi ke dalam
yang kita perlukan dari suatu kota ke kota beberapa jenis. Pada sejarahnya, nomen-
lainnya dengan mengendarai mobil, sebuah klatur jenis validitas pengukuran mengalami
jam tangan adalah valid untuk digunakan. beberapa kali perubahan. Pada saat ini, no-
Akan tetapi, jam tangan yang sama tidak menklatur jenis validitas pengukuran yang
cukup valid untuk mengukur waktu yang kita gunakan adalah validitas isi, validitas
diperlukan seorang atlet pelari cepat dalam kriteria, dan validitas konstruk (Arafah,
menempuh jarak 100 m karena diperlukan 2017).
unit waktu terkecil sampai pada Validitas isi diliat dari kisi-kisi tes, yaitu
pecahan-detik (Mardapi, 2008). matriks yang menunjukkan bahan tes serta
Istilah validitas banyak dipakai dalam level kognitif yang terlibat dalam
penelitian, yaitu validitas eksperimen, va- mengerjakan tes, validitas ini ditelaah sebe-
liditas pengukuran, dan validitas butir. Oleh lum tes digunakan. Validitas konstrak di-
karena itu, kita perlu hati-hati mem- peroleh dari hasil analisis faktor, yaitu
pergunakan istilah validitas yang memung- jumlah faktor yang diukur suatu tes. Bukti
kinkan terjadinya perbedaan makna pada validitas konstrak diperoleh dari hasil
istilah tersebut. Sebelum digunakan sebagai penggunaan tes, yaitu data empirik. Validitas
alat pengumpul data, instrumen tes diujico- prediktif juga memerlukan data empirik
bakan terlebih dahulu sampai memenuhi untuk dapat dihitung (Mardapi, 2008).
persyaratan yakni salah satunya, yaitu valid.
Suatu tes dinyatakan valid jika perangkat tes METODE PENELITIAN
butir-butirnya benar-benar mengukur tujuan Penelitian ini merupakan studi
tes berupa kemampuan dalam hal tertentu, kepustakaan dengan pendekatan kualitatif.
bukan kemampuan yang lainnya. Validitas Pengumpulan data dilakukan melalui
suatu tes menggunakan indeks angka yang pengumpulan kajian teori dari berbagai buku.
menunjukkan sejauh mana hasil pengukuran Kemudian setiap hasil kajian teori dalam
dapat mencerminkan secara cermat kemam- buku tersebut direview dan dianalisis secara
puan seseorang yang diperoleh dari berbagai seksama.
proses. Validitas pengukuran memiliki nilai
dari yang tinggi sampai rendah, jika semakin
tinggi nilai validitas, maka semakin baik pula
143
Vol, 2. No, 1. Tahun 2023
144
Juara SD: Jurnal Pendidikan Dan Pembelajaran Sekolah Dasar
perhitungan validitas yang ada, seperti CVR besaran lain (Arafah, 2017).
oleh Lawshe, indeks validitas oleh Aiken, Pada pengujian validitas konkuren, data
dan validitas isi oleh Gregory. Butir tes yang yang mencerminkan pengalaman yang di-
tidak valid dapat direvisi atau dibuang. peroleh pada masa lalu yang telah valid,
dibandingkan dengan data hasil tes yang di-
Validitas Kriteria peroleh sekarang ini. Jika hasil tes yang ada
Fungsi validitas kriteria adalah untuk sekarang ini mempunyai hubungan searah
memperbaiki alat ukur melalui uji coba alat dengan hasil tes berdasar pengalaman yang
ukur. Terdapat dua sasaran ukur, yakni sasa- lalu, maka tes yang memiliki karakteristik
ran ukur prediktor (menghasilkan skor pred- seperti itu dapat dikatakan telah memiliki
iktor) dan sasaran ukur kriteria (menghsail- validitas konkuren (Sudijono, 2012).
kan skor kriteria). Misalnya, sasaran ukur Membandingkan hasil sebuah tes maka
prediktor adalah ujian penerimaan karyawan diperlukan suatu kriteria atau alat banding.
baru atau mahasiswa baru dan sasaran ukur Maka hasil tes merupakan sesuatu yang
kriteria adalah keberhasilan mereka sebagai dibandingkan. Misalnya seorang guru ingin
karyawan atau sebagai mahasiswa (Arafah, mengetahui apakah tes sumatif yang disusun
2017). sudah valid atau belum, jadi diperlukan se-
Validitas kriteria merupakan kecocokan di buah kriteria masa lalu yang sekarang datan-
antara prediktor (skor prediktor) dengan ya dimiliki. Misalnya nilai ulangan sumatif
kriteria (skor kriteria). Validitas kriteria di- yang telah lalu (Arikunto, 2011).
tujukan kepada baik atau tidak baiknya Hubungan antara dua alat ukur sebagai
prediktor (skor prediktor). Jika validitas dasar perhitungan, satu alat ukur prediktor
kriteria baik, maka alat ukur prediktor (skor merupakan alat ukur baru dan alat ukur
prediktor) dapat digunakan untuk berbagai lainnya sebagai kriteria, yaitu alat ukur yang
keperluan sejenis. Jenis validitas kriteria, biasa dipakai. Perangkat ukur baru diberikan
yaitu validitas serentak yakni kriteria ter- secara bersama-sama dengan alat ukur yang
dapat pada saat yang sama dengan prediktor biasa digunakan. Contoh perangkat ukur TPA
dan validitas prediksi yakni kriteria terdapat yang baru dibuat untuk mengganti atau ca-
kemudian setelah prediktor (Arafah, 2017). dangan alat ukur TPA yang biasa dipakai.
Analisis hubungan skor tes dengan varia- Soal ujian cadangan untuk menggantikan
bel eksternal dilakukan untuk melengkapi soal ujian yang biasa dipakai. TPA melalui
bukti validitas. Variabel eksternal bisa berupa komputer untuk menggantikan TPA melalui
kriteria bahwa tes diharapkan memprediksi, pensil dan kertas. Penentuan validitas seren-
seperti hubungan dengan tes lain yang men- tak berdasarkan kecocokan antara alat ukur
gukur kostrak yang sama dan tes lain yang baru dan alat ukur yang biasa digunakan
mengukur hal yang berbeda. Kriteria lain dengan menggunakan perhitungan korelasi
seperti kriteria performans, sering digunakan (Susetyo, 2015).
untuk keperluan seleksi atau penempatan Beberapa contoh yang lain, yaitu TOEFL
pegawai atau karyawan. Bukti validitas ber- melalui komputer untuk menggantikan atau
dasarkan hubungan dengan variabel lain ser- mendampingi TOEFL melalui pinsil dan
ing disebut dengan validitas kriteria (Mardapi, kertas, alat uji olahraga cara baru di dalam
2008). ruangan untuk menggantikan atau men-
Prediktor dan kriteria terjadi pada waktu dampingi alat uji olahraga lari satu kilometer
yang bersamaan dan menggunakan skor di luar ruangan, soal ujian cadangan untuk
prediktor untuk mengetahui kriteria. Pada menggantikan soal ujian jika terjadi ke-
kriteria terdapat alat ukur yang sudah biasa bocoran sebelum ujian, dan simulasi menye-
dipakai dan memberikan hasil yang baik. tir mobil di layar komputer untuk men-
Prediktornya adalah alat ukur rakitan baru dampingi menyetir mobil sesungguhnya
untuk mengganti atau mendampingi alat ukur (Arafah, 2017).
yang biasa dipakai, alat ukur rakitan baru Validitas prediktif, yaitu kriteria terjadi
yang lebih sederhana, atau alat ukur rakitan kemudian setelah prediktor dan
baru yang menggunakan cara ukur atau menggunakan skor prediktor untuk menge-
145
Vol, 2. No, 1. Tahun 2023
tahui kriteria. Alat ukur yang dipakai untuk hal ini performasi kerja merupakan kriteria
mengetahui kriteria, misalnya ujian pen- untuk melihat validitas prediktif tes bakat
erimaan karyawan untuk menyeleksi calon (Mardapi, 2008).
karyawan atau ujian penerimaan mahasiswa Korelasi antara dua alat ukur sebagai
untuk menyeleksi calon mahasiswa. Sasaran dasar perhitungan yang mana satu alat ukur
terjadi kemudian. Biasanya tidak mudah un- digunakan sebagai prediksi dan alat ukur
tuk ditentukan secara tepat. Sukar menen- lainnya digunakan sebagai kriteria. Perangkat
tukan kriteria karyawan yang baik atau ma- ukur prediksi diberikan terlebih dahulu,
hasiswa yang berhasil (Arafah, 2017). kemudian nantinya digunakan untuk menge-
Setiap kali kita menyebutkan istilah ra- tahui kriteria yang diinginkan. Penentuan
malan, maka di dalamnya akan mengandung validitas prediktif berdasarkan kecocokan di
pengertian mengenai sesuatu yang bakal ter- antara prediksi dengan kriteria yang dil-
jadi di masa mendatang atau sesuatu yang akukan melalui penghitungan koefisien ko-
sekarang belum terjadi dan baru akan terjadi relasi (Susetyo, 2015).
pada waktu yang akan datang. Apabila istilah
ramalan itu dikaitkan dengan validitas tes, Validitas Konstruk
maka yang dimaksud dengan validitas pred- Validitas konstruk mengacu pada sejauh
iksi dari suatu tes adalah suatu kondisi yang mana suatu tes mengukur konsep dari suatu
menunjukkan seberapa jauh sebuah tes teori, yaitu yang menjadi dasar penyusunan
dengan tepat menunjukkan kemampuannya tes. Pengumpulan bukti validitas konstruk
untuk meramalkan yang akan terjadi pada merupakan proses yang terus berlanjut se-
masa yang akan datang (Sudijono, 2012). jalan dengan perkembangan konsep
Contohnya tes masuk Perguruan Tinggi mengenai trait yang diukur (Mardapi, 2008).
adalah sebuah tes yang diperkirakan mampu Syarat validasi, yaitu ada referensi yang
meramalkan keberhasilan peserta tes dalam telah diketahui untuk digunakan pada pem-
mengikuti kuliah di masa yang akan datang. bandingan dengan konstruk dan ada referensi
Calon yang tersaring berdasarkan hasil tes yang layak dijadikan pembanding untuk
diharapkan mencerminkan tinggi-rendahnya digunakan pada pembandingan dengan kon-
kemampuan mengikuti kuliah. Jika nilai struk. Jenis referensi, yaitu referensi cocok
tesnya tinggi akan menjamin keberhasilannya yakni referensi yang cocok dengan konstruk
kelak. Sebaliknya seorang calon dikatakan dan referensi beda yakni referensi yang beda
tidak lulus tes karena memiliki nilai tes yang dengan konstruk (Arafah, 2017).
rendah jadi diperkirakan akan tidak mampu Terdapat dua metode pencocokan, yaitu
mengikuti perkuliahan yang akan datang secara konvergen dan diskriminan. Penco-
(Arikunto, 2011). cokan secara konvergen adalah pencocokan
Validitas prediktif diperoleh apabila konstruk yang terdapat dalam perangkat ukur
pengambilan skor kriteria tidak bersamaan dengan rujukan yang cocok. Suatu perangkat
dengan pengambilan skor tes. Setelah subjek ukur tergolong tinggi validitas konstruknya
dikenai tes yang akan dicari validitas pred- jika terdapat kecocokan butir tes yang dibuat
iktifnya, lalu diberikan tenggang waktu ter- dengan perangkat ukur butir tes yang telah
tentu sebelum skor kriteria diambil dari valid menurut prosedur validitas konstruk.
subjek yang sama. Umpamanya, untuk Adapun pencocokan diskriminan merupakan
melihat validitas prediktif tes masuk pen- pencocokan dengan rujukan yang berbeda
didikan tinggi, maka skor kriterianya dapat atau kontras dengan konstruk dalam suatu
diambil dari indeks prestasi yang dicapai perangkat ukur. Suatu perangkat ukur tergo-
setelah beberapa semester atau beberapa ta- long tinggivaliditas konstruknya jika terdapat
hun kemudian. Koefisien korelasi antara skor ketidakcocokan butir-butir tes yang dibuat
tes masuk pendidikan tinggi dan indeks pres- dengan perangkat ukur yang butir-butir tes
tasi tersebut merupakan koefisien validitas berbeda dan telah memenuhi validitas kon-
prediktif tes masuk. Contoh lain adalah bila struk. Prosedur perhitungan validitas kon-
kita mengkorelasikan suatu tes bakat untuk struk, baik konvergen maupun diskriminan
penempatan karyawan dengan performasi menggunakan teknik korelasi atau analisis
kerjanya setelah satu atau dua tahun. Dalam faktor (Susetyo, 2015).
146
Juara SD: Jurnal Pendidikan Dan Pembelajaran Sekolah Dasar
DAFTAR RUJUKAN
Allen, Mary J. ( 1979). Introduction to
Measurement Theory. California:
147