Anda di halaman 1dari 13

VALIDITAS

Meskipun reliabilitas adalah ciri yang harus dipunyai oleh suatu alat ukur
yang dipergunakan dalam suatu pengukuran, tetapi reliabilitas bukanlah
karakteristik utama. Di dalam dunia pendidikan dan psikologi, pertanyaan yang
paling “utama” diajukan berkaitan dengan alat ukur adalah “ seberapa valid alat
ukur ini?”. Dengan pertanyaan tersebut, akan diungkap apakah alat ukur yang
dipergunakan sudah menjalankan fungsinya mengukur apa yang seharusnya
diukur, sesuai dengan kecocokan, makna, dan kemanfaatan dari inferensi yang
dibuat dari skor alat ukur. Dengan demikian, validitas tidak mempunyai
pengertian yang mutlak (absolut), dalam arti suatu alat ukur valid untuk suatu
tujuan atau kemanfaatan tertentu, tetapi tidak untuk yang lain (Thorndike, 1997).
Di dalam psikologi, kata validitas digunakan sekurangnya dalam tiga
konteks, yaitu validitas penelitian (research validity), validitas soal (item validity),
dan validitas alat ukur atau tes (test validity) (Suryabrata, 2000).
Validitas penelitian mempersoalkan sejauh mana hasil penelitian
mencerminkan keadaan yang sebenarnya. Validitas penelitian mengandung dua
sisi, yaitu validitas internal yang mempersoalkan kesesuaian data penelitian
dengan keadaan sebenarnya, dan validitas eksternal yang mempersoalkan derajad
kesesuaian antara generalisasi hasil penelitian dengan keadaan sebenarnya.
Validitas soal adalah derajad kesesuaian antara suatu soal dengan
perangkat soal-soal yang lain dari suatu alat ukur. Ukuran validitas soal adalah
korelasi antara skor pada suatu soal tersebut dengan skor pada perangkat soal
secara keseluruhan (item-total correlation). Isi validitas soal adalah daya pembeda
soal (item discriminating power) dan bukanlah suatu validitas tes.
Korelasi item-total digunakan sebagai ukuran validitas soal karena korelasi
item-total ini menunjukkan apakah item-item tersebut mempunyai kecenderungan
terhadap tes ataukah tidak. Item-item yang mempunyai korelasi  0.30 dianggap
mempunyai kecenderungan terhadap tes secara keseluruhan, sehingga item-item
disebut homogen. Item-item yang homogen sangat mendukung daya validitas tes

1
karena pada dasarnya validitas ingin mencari homogenitas perilaku dalam tes
(Loevinger, 1957).

A. Definisi Validitas Alat Ukur


Tahun 1949, Cronbach menyatakan bahwa definisi validitas adalah sejauh
mana sebuah tes mengukur apa yang seharusnya diukur, “A test is valid to the
degree that we know what it measures or predicts (Cronbach, 1955). Pendapat
yang terus dipakai juga diberikan oleh Anastasi & Urbani (1997), validitas adalah
apa yang tes ukur dan seberapa baik dia melakukannya dan diakui secara luas.
Pendefinisian validitas alat ukur dapat diawali dengan melihat secara
etimologi, bahwa validitas berasal dari kata validity yang mempunyai arti sejauh
mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya
(Azwar, 2000). Senada dengan Azwar, Hadi (1997) mengatakan bahwa validitas
memiliki pengertian a) seberapa jauh alat ukur dapat mengungkapkan dengan jitu,
tepat mengenai sasaran, dan b)seberapa jauh alat ukur dapat memberikan reading
yang teliti, seksama, cermat, dapat menunjukkan dengan sebenarnya status atau
besar kecilnya, dan ada tidaknya gejala yang akan diukur. Suatu tes atau
instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila alat
tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai
dengan maksud dilakukannya pengukuran tersebut. Tes yang menghasilkan data
yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki
validitas yang rendah.
Masih menurut Azwar (2000), dalam teori skor-murni klasikal, pengertian
validitas dapat dinyatakan sebagai sejauhmana skor tampak atau skor perolehan
mendekati besar skor murni. Skor tampak tidak akan sama dengan skor murni
kecuali apabila alat ukur yang bersangkutan mempunyai validitas yang sempurna.
Semakin skor perolehan mendekati skor murni maka semakin tinggi validitasnya,
dan sebaliknya semakin rendah validitas maka semakin besar perbedaan skor
perolehan dan skor murni.
B. Tipe Validitas Alat Ukur
Pada 1950-an berbagai tipe validitas telah dimunculkan misalnya faktorial,
intrinsik, empiris, logis, dan banyak yang lain (lihat Anastasi, 1954). Tipe-tipe itu
kemudian diringkas menjadi dua bentuk dasar, yaitu validitas logis dan validitas
empiris (Cronbach, 1949). Termasuk dalam validitas logik adalah validitas muka.
Validitas muka adalah tipe validitas yang paling rendah signifikansinya
karena hanya didasarkan pada penilaian terhadap format penampilan
(appearance) tes. Apabila penampilan tes telah meyakinkan dan memberikan
kesan mampu mengungkap atribut yang hendak diukur maka dapat dikatakan
bahwa validitas muka telah terpenuhi. Namun demikian, validitas muka tetap
penting artinya guna membangun kredibilitas tes dan selanjutnya meningkatkan
motivasi individu untuk menjawab tes, terutama pada tes yang dimaksudkan
untuk mengukur performansi maksimal. Tanpa adanya validitas muka, tes tidak
akan memperoleh apresiasi yang layak dari responden dan akibatnya lebih lanjut
adalah berkurangnya kesungguhan responden dalam menghadapi tes.
Validitas logik disebut juga sebagai validitas samping (sampling validity).
Validitas logik berkaitan dengan alat ukur yang lain yang berupa bahan lunak
(makna dari tulisan-tulisan yang ada didalam alat ukur. Validitas tipe ini
menunjukkan pada sejauh mana isi tes merupakan wakil dari ciri-ciri atribut yang
hendak diukur sebagaimana telah ditetapkan dalam domain (kawasan) ukurnya.
Cara pencapaiannya dengan professional judgment. Validitas isi penentuannya
bersifat kualitatif karena statistik tidak terlibat dalam validitas isi.
Validitas empiris meletakkan perhatiannya pada penggunaan analisis
faktor (misalnya validitas faktorial Guillford, 1954), dan khususnya tentang
korelasi-korelasi antara skor tes (Anastasi, 1954). Sebuah komite dalam psikologi
Amerika telah menetapkan empat kategori validitas: isi, konstruk, prediktif, dan
konkuren (APA, 1954), kemudian ada revisi bahwa validitas prediktif dan
konkuren digabung jadi satu yang disebut validitas kriteria (APA, 1966),
kemudian diikuti dengan publikasi Cronbach (1955) mengenai validitas konstruk.
Campbel dan Fiske (1959) mengenalkan pendekatan multitrait-multimethods
untuk menganalisis validitas konstruk.
Secara umum validitas tes terbagi kedalam tiga jenis yaitu validitas isi
(content validity), validitas konstruk (construct validity), dan validitas berdasar
kriteria (criterion-related validity), (Singh, 1986; Thorndike, 1997; Azwar, 2000;
Suryabrata, 2000).
1. Validitas isi
Validitas isi suatu tes akan menunjuk kepada sejauh mana tes tersebut
yang terdiri dari seperangkat aitem mencerminkan atribut psikologis yang hendak
diukurnya. Validitas isi ini akan diestimasi untuk mengukur derajad keterwakilan
atribut psikologis oleh aitem yang terdapat dalam suatu alat ukur, dengan
menggunakan analisis rasional terhadap soal atau aitem alat ukur atau yang biasa
disebut sebagai professional judgement.
Banyak definisi yang dimunculkan, namun dapat diambil sebuah definisi
yaitu “the degree to which elements of an assessment instrument are relevant to
and representative of the targeted construct for a particular assessment purpose”.
Artinya sejauh mana elemen-elemen instrumen pengukuran itu relevan dan sesuai
dengan konstruk yang ditentukan oleh tujuan pengukuran tertentu (Heyness &
Richard, 1995).
Validitas isi adalah syarat bagi validitas konstruk. Validitas konstruk
menjadi tidak berarti jika validitas isi tidak memenuhi syarat. Validitas isi dapat
diterapkan oleh segala metode pengukuran karena menekankan pada data yang
diperoleh. Metode validitas isi adalah : (a) definisi dan evaluasi kuantitatif secara
hati-hati dari konstruk yang ditargetkan, (b) pendekatan multi elemen, (c)
penggunaan populasi dan penyampelan dalam pengembangan item awal, (d)
evaluasi kuantitatif dari para ahli dan responden yang berkompeten, (e) evaluasi
item, (f) pelaporan hasil-hasil validitas isi secara detail, dan (g) relevansi untuk
validitas isi analisis psikometrik selanjutnya (Heyness & Richard, 1995).

2. Validitas konstruk
Validitas konstruk merujuk kepada suatu kualitas alat ukur yang
dipergunakan apakah sudah benar-benar menggambarkan konstruk teoritis yang
digunakan sebagai dasar operasionalisasi ataukah belum. Secara singkat, validitas
konstruk adalah penilaian tentang seberapa baik seorang peneliti menerjemahkan
teori yang dipergunakan ke dalam suatu alat ukur.
Validitas konstruk adalah tipe validitas yang menunjukkan sejauh mana
tes mengungkap suatu trait atau konstruk teoritis yang hendak diukur (Allen &
Yen, 1979, Azwar ,2000). Validitas konstruk menggunakan dua analisis validitas,
isi dan kriteria. Shepard (1993) dan Anastasi (1986) menyatakan bahwa validitas
konstruk mencakup analisis empiris dan logis yang ada dalam validitas isi dan
kriteria. Mungkin tipe validitas ini adalah yang paling sulit untuk dipahami. Ini
karena berhubungan dengan sejauh mana pemahaman terhadap hubungan antara
skor-skor tes dengan model teoritis. Sebuah tes, bisa jadi memiliki derajat
validitas prediktif yang tinggi dalam sebuah domain khusus tapi apabila tidak
mempunyai atau hanya punya sedikit penghitungan teoritis untuk menjelaskan
hubungannya maka tes tidak memiliki derajat validitas konstruk yang tinggi.
Validasi terhadap alat ukur yang berdasarkan konstruksi teoritis ini
merupakan proses yang kompleks, yang memerlukan analisis logis dan dukungan
data empirik. Prosedur pengujian validitas konstruk biasanya berangkat dari hasil
komputasi interkorelasi diantara berbagai hasil tes dan kemudian diikuti oleh
analisis lebih lanjut terhadap matriks korelasi yang diperoleh, melalui berbagai
metode.
Konsep validitas konstrak sangat berguna pada tes yang mengukur trait
yang tidak memiliki kriteria eksternal. Untuk itu prosedur validasi konstrak
diawali dari suatu identifikasi dan batasan mengenai variable yang hendak diukur
yang dinyatakan sebagai suatu bentuk konstrak logis berdasarkan teori mengenai
variable tersebut. Dari teori tersebut kemudian ditarik semacam konsekuensi
praktis mengenai hasil tes pada kondisi terttentu. Konsekuensi inilah yang
kemudian diuji. Apabila hasilnya sesuia dengan harapan maka tes yang
bersangkutan dianggap memiliki validitas konstrak yang baik.
Dukungan terhadap adanya validitas konstrak menurut Magnusson (1967)
dapat dicapai melalui beberapa cara, antara lain :
1. Studi mengenai perbedaan diantara kelompok-kelompok yang menurut teori
harus bebeda.
Apabila teori mengatakan bahwa antara suatu kelompok dengan kelompok
lainnya harus memiliki skor yang bebeda maka kenyataannya dapat diuji
melalui pengumpulan data yang kemudian dianalisis dengan teknik statistika
tertentu.
2. Studi mengenao pengaruh perubahan yang terjadi
dalam diri individu dan lingkungannya terhadap hasil tes.
Apabila teori mengatakan bahwa hasil tes dipengaruhi oleh kondisi subjek
dikarenakan factor kematangan, misalnya, maka pertambahan usia harus
mengubah skor subjek pada aspek yang dipengaruhi itu dan bukan pada aspek
lain yang tidak terpengaruh oleh kematangan.
3. Studi mengenai korelasi diantara berbagai variable yang menurut teori
mengukur aspek yang sama.
Studi ini dapat diperluas dengan mengikutsertakan pula koefisien korelasi
diantara berbagai skor tes yang mengukur aspek yang berbeda. Prosedur
termaksud akan menghasilkan validitas konvergen dan validitas diskriminan
yang merupakan kesimpulan dari pendekatan validasi multitrait-multimethod.
4. Studi mengenai korelasi antaraitem atau antar bagian
tes.
Interkorelasi yang tinggi diantara belahan dari suatu tes dapat dianggap
sebagai bukti bahwa tes tersebut mengukur satu variable satuan (unitary
variable).
Menurut Suryabrata (2000), sampai sekarang terdapat dua metode yang
telah diakui di bidang pengukuran, yaitu pertama sifat-jamak-metode-jamak
(multi trait multi method) dan yang kedua analisis faktor. Rust dan Golombok
(1989) dan Kerlinger dan Lee (2000), juga menyatakan bahwa salah satu
pendekatan yang sering digunakan dalam pengujian validitas konstruk adalah
analisis faktor.
Validitas kontrak dengan pendekatan validasi multitrait-multimethod
menghasilkan estimasi terhadap validitas konvergen yang ditunjukkan oleh
tingginya koefisien korelasi diantara skor skala-skala yang mengujur trait yang
sama, dan validitas diskriminan yang diperlihatkan oleh rendahnya korelasi
diantara skor skala-skala yang mengukur trait yang berbeda.
Prosedur validasi konstrak juga dapat ditempuh melalui teknik analisis
factor. Analisis factor merupakan sekumpulan prosedur matematik yang kompleks
guna menganalisis saling hubungan diantara variable-variabel dan menjelaskan
saling hubungan tersebut dalam bentuk kelompok variable yang terbatas yang
disebut factor. Oleh karena itu validitas yang ditegakkan melalui prosedur analisis
factor tersebut sebgai validitas factorial (factorial validity).
Prosedur validasi factorial yang lebih lengkap menghendaki disertakannya
satu rangkaian tes yang telah terbukti berfungsi dalam mengukur factor yang
bersangkutan. Rangkaian tes ini disebut sebagai marker test dan akan berfungsi
sebagai criteria bagi layak tidaknya validitas tes yang sedang diuji. Tes yang diuji
akan dikatakan sebagai memiliki validitas factorial yang memuaskan apabila
menunjukkan muatan factor yang relative tinggi sebagaimana muatan pada marker
test. Adanya validitas factorial yang baik juga diperlihatkan oleh rendahnya
muatan factor bagi tes yang diuji pada factor yang tidak diungkap oleh marker
test. Pengertian ini dapat dianalogikan dengan konsep validitas konvergen dan
validitas diskriminan.
Definisi validitas konstruk dipusatkan kepada sebaik apa variabel yang
dipilih peneliti untuk mengungkapkan konstruk hipotetik, benar-benar mencakup
esensi dari konstruk hipotetik itu dan tentunya harus dibuktikan oleh data
(Stapleton, 1997). Sebuah konstruk adalah ide ilmiah dan informatif yang
dikembangkan atau dikonstruksi untuk menggambarkan atau menjelaskan
perilaku (Cohen, Swedlik, & Phillips, 1996). Gregory (2000) mencatat ada enam
pendekatan untuk validitas konstruk, yaitu:
1. analisis untuk menentukan apakah item-item tes atau subtes adalah
homogen dan maka dari itu mengukur sebuah konstruk tunggal.
2. mencari perubahan-perubahan yang berkembang untuk menentukan
apakah mereka konsisten dengan teori konstruk.
3. mencari tahu apakah berbagai perbedaan skor tes adalah konsisten
dengan teori.
4. analisis untuk menentukan apakah pengaruh-pengaruh intervensi skor
tes adalah konsisten dengan teori.
5. korelasi tes dengan tes-tes dan pengukuran lain yang berkaitan maupun
tidak.
6. analisis faktor terhadap skor tes dalam hubungannya dengan sumber-
sumber informasi lain.
Selain itu yang perlu diperhatikan dalam menganalisis validitas konstruk
yang optimal adalah struktur data yang bisa dilihat dari korelasi antar item.
Korelasi antar item yang tinggi akan sangat menguatkan analisis validitas
konstruk. Setidaknya korelasi antar item adalah tengah-tengah yaitu 0,20 dan
apabila korelasi antar item rendah atau sedang maka bisa diambil korelasi antar
item yang tertinggi dan memiliki indeks kesukaran mendekati 50% (Loevinger,
1957).
Brogden (1946) juga telah membuktikan bahwa jumlah item, indeks
kesukaran item, dan interkorelasi antar item sangat mempengaruhi hasil validitas.
Misalnya item-item yang berinterkorelasi rata-rata 0,2 dengan indeks kesukaran
rata-rata 30% menghasilkan validitas tes sebesar 0,425, sementara dengan rata-
rata indeks kesukaran 50% menghasilkan validitas tes sebesar 0,725, dan dengan
rata-rata indeks kesukaran 65% menghasilkan validitas sebesar 0,562. Analisis
Brogden menunjukkan bahwa semakin rata-rata indeks kesukaran mendekati 50%
maka semakin besar validitas tes.
Satu lagi cara untuk menyeleksi item untuk validitas konstruk yaitu lewat
analisis faktor pada faktor pertama. Semua item dalam setiap sub tes dianalisis
faktor, kemudian dilihat muatan faktor hanya pada faktor pertama dan apabila
muatan faktornya besar yaitu minimal 0,40 dengan metode principal component
analysis (Rust & Golombok, 1989; Clark & Watson, 1995).
Berikut adalah contoh pengujian validitas konstruk dengan menggunakan
multi trait dan multi method.
Multitrait method mendasarkan pada teknik korelasi. Kita yakin apabila
ada korelasi, berarti ada varians bersama antar 2 variabel. Bila tidak ada
korelasi/korelasi rendah berarti antar 2 variabel adalah independent/tidak saling
terkait.

Bila kita uji dengan :


a. Monotrait Multimethod  korelasi tinggi
b. Monotrait Monomethod  korelasi lebih tinggi
c. Multitrait Monomethod  korelasi rendah
d. Multitrait Multimethod  korelasi lebih rendah/ada korelasi
Sehingga (a) > (b) dan (c) > (d)
A1 B1 A2 B2
A1 1,00 0,34 0,87 0,26
B1 1,00 0,26 0,82
A2 1,00 0,31
B2 1,00

Dimana :
A1 dan A1 : monotrait monomethod
A1 dan B1 : multitrait monomethod
A1 dan B2 : multitrait multimethod
B2 dan B2 : monotrait monomethod
A1 A2 : korelasi tinggi
: convergent validity
: korelasi terhadap trait yang sama meskipun metode berbeda
A 1 B1 : korelasi rendah
: discriminan validity
: membuktikan bahwa tidak ada korelasi dengan alat ukur yang
mengukur trait berbeda
Misal. Jika kita mengkorelasikan antara kestabilan emosi dan aritmatik,
ternyata korelasinya rendah jadi tidak ada overlap antara kestabilan emosi dan
aritmatika.
A1 B1 : discriminant validity  A1 B1 > A1 B2
Jika kita melakukan A1 - A2 (traitnya sama)

(tunggal/criterion related validity)
Criterion related validity : jika kita hanya mengukur A1 dan A2 saja, tapi kalau
kita juga mengukur A1 B1 maka A1 A2 disebut convergent validity, karena
hasil pengukuran A1 A2 itu akan dibandingkan dengan hasil pengukuran A1 B1.

3. Validitas berdasar atas kriteria


Validitas berdasar atas kriteria adalah derajad yang menunjukkan sejauh
mana suatu alat tes menunjukkan hasil pengukuran yang sama dengan alat tes lain
yang dijadikan kriteria, baik yang pengukurannya dilakukan pada saat yang relatif
bersamaan (concurent validity) maupun ketika alat tes diberikan dalam waktu
yang berbeda (predictive validity).
Validitas ini ada dua jenis, validitas prediktif dan validitas konkuren. Pola
validitas ini seorang peneliti pada dasarnya tertarik dengan beberapa kriteria yang
ingin dia prediksi. Dia melakukan tes, dan memperoleh sebuah kriteria
independen yang mengukur subyek yang sama, dan menghitung korelasi. Jika
kriteria diperoleh beberapa kali setelah tes diberikan, dia meneliti validitas
prediktif. Jika skor tes dan skor kriteria ditentukan pada waktu yang sama, dia
sedang meneliti validitas konkuren. Validitas konkuren diteliti ketika satu tes
diajukan sebagai pengganti bagi yang lain (Cronbach & Meehl, 1955), misalnya,
sebuah tes self concept yang lama dikorelasikan dengan tes self concept baru
seperti TSCS (Tennessee Self- Concet Scale) (Azwar, 2000).
Prosedur pendekatan validitas berdasar criteria menghendaki tersedianya
criteria eksternal yang dapat dijadikan dasar pengujian skor tes atau beruap suatu
ukuran lain yang relevan.
Tingginya validitas berdasar criteria (ρxy) diestimasi melalui komputasi
koefisien korelasi antara skor tes dengan skor criteria (r xy). Prosedur validasi
berdasar criteria menghasilkan dua macam validitas, yakni validitas prediktif
(predictive validity) dan validitas konkruen (concurrent validity)
a. Validitas Prediktif
Validitas ini diestimasi bila tes dimaksudkan untuk berfungsi sebagai
prediktor bagi performansi yang hendak diprediksikan itu disebut seebagai
criteria validasi. Beberapa contoh situasi yang menghendaki adanya prediksi
performansi ini adalah kasus bimbingn karir, ujian guna seleksi mahasiswa
baru, klasifikasi dan penempatan para karyawan sesuai dengan
kompetensinya, dan semacamnya.
b. Validitas Konkruen
Apabila skor tes dan skor criteria validasinya dapat diperoleh dalam waktu
yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien
validitas konkruen. Validitas konkruen merupakan indikasi validitas yang
layak ditegakkan apabila tes tidak digunakan sebagai suatu prediktor dan
merupakan validitas yang sangat penting dalam situasi diagnostik. Bila tes
dimaksudkan sebagai prediktor bagi performansi, maka validitas konkruen
tidak cukup memuaskan dan validitas prediktif merupakan suatu keharusan.
Baik pada prosedur pengujian, validitas prediktif maupun prosedur
pengujian validitas konkuren, problem utamanya adalah masalah menemukan
kriteria validasi yang tepat. Tidak selalu kriteria itu dapat ditentukan dengan
mudah oleh karena konsepsi mengenai trait yang diukur oleh tes dan oleh
kriterianya sering kali tidak sama walaupun namanya tampak sama.
Berikut adalah gambaran dan contoh dari validitas prediktif dan validitas
konkuren. Validitas prediktif terutama ada pada skala yang memprediksi
performansi di masa yang akan datang, misalnya
 Tes Finger Dextivity menjadi prediktor terhadap
kecepatan magnetik. Jika korelasi keduanya tinggi maka tes tersebut
mempunyai nilai prediktor yang tinggi.
 UMPTN merupakan prediktor bagi penguasaan
materi diperguruan tinggi. Jika korelasi antara keduanya tinggi maka
UMPTN mempunyai nilai prediktor yang tinggi terhadap penguasaan
materi perguruan tinggi.
 TPA (Tes Potensial Akademik). Jika validitas
prediktif TPA baik maka yang lulus adalah yang memiliki kemampuan
akademik yang tinggi.
Validitas konkuren dilakukan dengan mengkorelasikan suatu alat ukur
dengan alat ukur lain yang sudah terstandar. Jika korelasi tinggi maka suatu alat
ukur itu dapat dikatakan mempunyai validitas konkuren. Misalnya.
I : alat ukur yang diuji validitasnya
II : alat ukur lain yang mengukur atribut yang sama
I dan II dikenakan pada sekelompok subjek lalu dikorelasikan. Jika
korelasi tinggi berarti alat ukur I memiliki validitas konkurent.
Kelemahan :
 Jika ada alat ukur yang telah baku buat apa disusun
alat ukur baru. Karena biasanya : lebih singkat, lebih mudah/sederhana
dan dipakai spesifik.
 Jika dikorelasikan dengan alat ukur baku sudah
mengandung error sehingga korelasi antara alat ukur baru dengan alat
ukur baku menjadi dobel error.
Terkait dengan validitas prediktif yang seringkali rendah, ada beberapa
faktor yang menyebabkan validitas prediktif rendah yaitu: 1) pembatasan range,
yaitu pengurangan range dalam variabel. Hal ini hampir selalu terjadi dalam tes
ujian masuk yang dijadikan prediktor prestasi belajar. Tes ujian masuk memilih
peserta tes yang mempunyai skor tertinggi dari jumlah peserta yang besar, dengan
demikian range skor yang sangat panjang itu dipotong. Pemotongan range ini
mengakibatkan penurunan varian dan seterusnya menyebabkan rendahnya
koefisien korelasi (Powers, 2001). 2) ketidak reliabelan kriteria. Ketidak adaan
jaminan bahwa kriteria yang digunakan adalah reliabel, menjadi sangat
melemahkan hasil prediksi keberhasilan prestasi belajar, dalam hal ini indeks
prestasi mahasiswa. 3) seleksi kompensatori. Apabila hasil tes menunjukkan
sebuah status yang lebih dari satu individu dengan individu yang lain,
kemungkinan besar seleksi kompensatori akan terjadi. Status yang lebih rendah
(skor yang lebih rendah) itu bisa menyebabkan individu memaksimalkan
kemampuan psikologis lain yang dimilikinya misalnya motivasi, atau
kedewasaan. Keberhasilan individu dalam belajar di perguruan tinggi yang
banyak sekali dipengaruhi oleh faktor-faktor non kognitif menyebabkan
rendahnya prediksi tes ujian masuk terhadap prestasi belajar di perguruan tinggi.
Akibat dari rendahnya rata-rata korelasi ujian masuk dengan hasil belajar maka
diajukan sebuah pedoman bahwa korelasi validitas prediktif tinggi : > 0,39,
sedang : 0,25 – 0,39, dan rendah: < 0,25 (Walker, dkk. 2002)

C. Hubungan Reliabilitas dan Validitas


Reliabilitas menjadi penting karena mempunyai keterkaitan dengan
validitas. Reliabilitas adalah mengenai konsistensi pengukuran, sedangkan
validitas adalah seputar relevansi dan ketepatan apa yang diukur. Mungkin sebuah
tes itu reliabel, mengukur hal yang sama secara konsisten tapi bisa jadi
pengukuran itu tidak berguna atau invalid (Huitt,1999). Sebuah tes sudah pasti
reliabel jika tes itu valid, tapi belum tentu valid jika tes itu reliabel. Artinya
sebuah tes yang valid harus mempunyai reliabilitas yang tinggi, namun reliabilitas
yang tinggi belumlah cukup untuk menunjang validitas tes.
Suatu hasil koefisien korelasi dalam validitas prediktif menjadi rendah jika
prediktor atau kriterianya tidak reliabel. Semakin tinggi koefisien reliabilitas
prediktor dan kriteria semakin tinggi pula hasil korelasi antara keduanya.
Misalnya tes prediktor yang mempunyai koefisien reliabilitas 0,70 berkorelasi
dengan kriteria sebesar 0,30. Jika reliabilitas prediktor ini ditingkatkan menjadi
0,90 maka validitas prediktif akan meningkat dari 0,30 sampai 0,34 (Nunnally,
1972).
Pemilihan item juga mempengaruhi reliabilitas dan validitas. Pemilihan
item dengan metode korelasi item-total akan meningkatkan reliabilitas namun
akan menurunkan validitas (Azwar,2000).

Anda mungkin juga menyukai