Oleh
Endang Retno W
Pendahuluan
Validitas dan reliabilitas merupakan suatu aturan yang menunjukkan bahwa suatu
instrumen itu tepat dan sahih. Prinsip validitas adalah pengukuran atau pengamatan yang berarti
prinsip ketepatan instrumen dalam mengumpulkan data. Instrumen harus dapat mengukur apa
yang seharusnya diukur. Jadi validitas lebih menekankan pada alat pengukuran atau pengamatan.
Reliabilitas instrumen adalah ketetapan hasil pengukuran atau pengamatan bila pada peserta
didik yang sama diukur atau diamati berkali–kali dalam waktu yang berlainan. Alat dan cara
mengukur atau mengamati berperan penting dalam waktu yang bersamaan.
Validitas dan reliabilitas menjadi penting dalam membahas tentang pengukuran dalam
penelitian pendidikan. Keduanya berfokus bagaimana menciptakan pengukuran dengan konstruk
yang bagus. Validitas dan reliabilitas instrumen menjadi hal yang sangat penting pada teori-teori
sosial yang kadang-kadang kurang jelas, membingungkan dan tidak dapat secara langsung
teramati. Semua peneliti social dan juga pendidikan menghendaki pengukuran yang dilakukan
memiliki validitas dan reliabilitas yang baik, kemudian pertanyaannya adalah apa yang dimaksud
dengan validitas dan reliabilitas? Bagaimana cara menentukan validitas dan reliabilitas? Berikut
adalah pembahasan tentang validitas dan reliabilitas beserta contoh perhitungannya.
Setelah anda mempelajari modul 8 ini, diharapkan dapat memahami validitas dan
reliabilitas instrumen, secara khusus diharapkan dapat:
1. memahami pengertian validitas;
2. menentukan validitas instrumen;
3. memahami pengertia reliabilitas;
4. menentukan reliabilitas instrumen.
Kegiatan Belajar 1
Validitas
Alat ukur yang berupa tes baik tes berbentuk objektif maupun tes berbentuk uraian yang
telah disusun selanjutnya perlu divalidasi untuk mengetahui seberapa cermat tes tersebut
melakukan fungsi ukurnya. Menggunakan alat ukur yang memang berfungsi mengukur suatu
aspek tetapi tidak dapat menghasilkan hasil ukur yang teliti akan menimbulkan adanya varians
kesalahan. Suatu alat ukur yang validitasnya tinggi akan mempunyai varians kesalahan yang
kecil sehingga dapat dipercaya bahwa koeisien yang dihasilkannya merupakan koefisien yang
sebenarnya. Apabila informasi yang diberikan tidak benar dengan sadar atau tidak akan
digunakan sebagai dasar pertimbangan dalam pengambilan suatu keputusan, maka keputusan itu
tentu bukan merupakan suatu keputusan yang tepat. Dalam berbagai studi dan penelitian tidak
jarang dipergunakan alat ukur untuk mengetahui keadaan atau status psikologis sekelompok
individu tertentu. Oleh karena itu berikut ini akan dibahas antara lain adalah pengertian validitas,
tipe-tipe umum pengukuran validitas, dan perhitungan dalam menentukan validitas.
A. Pengertian Validitas
Menurut Azwar (2008) validitas didefinisikan sebagai ukuran seberapa cermat suatu tes
melakukan fungsi ukurnya, sedangkan menurut Allen & Yen (1981) tes memiliki validitas jika
mengukur apa yang dimaksudkan untuk diukur. Tes hanya dapat melakukan fungsi ukurnya
dengan cermat apabila ada yang diukurnya. Suatu tes dikatakan valid, tes tersebut harus
mengukur sesuatu dan dilakukan dengan cermat dan tepat.
Suatu instrumen dapat dikatakan mempunyai validitas yang tinggi apabila instrumen
tersebut telah menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan
maksud dilakukannya pengukuran tersebut. Adapun tes yang memiliki validitas rendah akan
menghasilkan data yang tidak relevan dengan tujuan pengukuran. Sebagai contoh tes yang
digunakan untuk seleksi pelamar kerja dari suatu instansi adalah valid jika nilainya sangat terkait
dengan kinerja masa depan peserta tes di tempat kerja. Tes kecerdasan yang valid dapat
membedakan peserta yang bervariasi dalam hal kecerdasan. Tes kepribadian yang valid
menghasilkan skor yang dapat mencerminkan perbedaan kepribadian yang bermakna antara satu
peserta tes dengan yang lainnya. Baik pengembang tes maupun pengguna tes memiliki tanggung
jawab untuk memastikan bahwa tes yang digunakan adalah tes yang valid. Keabsahan dapat
dilihat dalam beberapa cara, tergantung pada tes dan penggunaan dari tes tersebut.
Pengertian valid untuk satu tes belum tentu berlaku untuk semua tujuan ukur. Sebuah tes
pada umumnya hanya menghasilkan ukuran yang valid untuk satu tujuan tertentu saja. Oleh
karena itu suatu tes dikatakan valid harus diikuti keterangan yang menunjuk pada tujuan,
misalnya valid untuk mengukur apa, valid untuk siapa. Dengan demikian suatu tes yang valid
untuk mengambil suatu keputusan mungkin saja tidak berguna dalam mengambil keputusan
untuk tujuan yang lain.
Ketika memilih tes untuk tujuan tertentu, pengguna tes memiliki tanggung jawab yang
jelas untuk memastikan bahwa tes tersebut memiliki bukti validasi yang sesuai dengan tujuan
penggunaan dalam situasi lokal. Butir-butir tes yang telah ditulis dengan hati-hati berdasarkan
berbagai pertimbangan tidak bisa begitu saja dipandang sebagai butir-butir yang baik. Butir butir
itu masih perlu diuji melalui penelaahan secara teori. Ketika tidak ada bukti validasi yang sesuai
yang disajikan oleh penerbit uji tetapi pengguna tes percaya bahwa tes ini berpotensi berguna,
studi validasi lokal dapat dirancang dan dilakukan oleh pengguna tes. Juga, berbagai jenis studi
validasi mendukung berbagai jenis kesimpulan dan karenanya tidak boleh dianggap dapat
dipertukarkan. Akhirnya, untuk membenarkan beberapa kesimpulan yang telah diperoleh,
melakukan validasi instrumen dengan cara lebih dari satu jenis studi validasi dalam hal ini
mungkin perlu dilakukan.
Menurut Allen & Yen (1981) dan Algina (2008) ada tiga jenis validitas adalah validitas isi
(content validity), validitas yang berhubungan dengan kriteria(criterion-related validity), dan
validitas konstruk (construct validity).
V=
∑s
n(c−1)
Keterangan.
V adalah indeks kesepakatan rater.
s adalah skor yang ditetapkan setiap rater dikurangi skor terendah dalam kategori
penskoran.
n adalah banyaknya rater
c adalah banyaknya kategori yang dipilih rater.
Kriteria
0 – 0,40 validitasnya kurang.
0,41 – 0,80 validitasnya sedang
0,81 – 1,00 sangat valid
c. Contoh Validasi Butir Tes dengan Validitas Isi.
1. Telah dikembangkan butir-butir tes yang bertujuan untuk mengukur keberhasilan
peserta didik pada mata pelajaran matemtika kelas 8 SMP Sukamaju Semarang. Tes
berbentuk uraian sebanyak 6 butir dari 3 indikator. Masing-masing indikator dibuat
dua butir tes
2. Para ahli menganalisis secara kualitatif (a) dari segi bidang studi yang diujikan; (b)
dari segi format dan pertimbangan teknis penulisan tes, dan (c) dari segi
penerjemahan gagasan ke dalam bahasa (pembahasaan gagasan).
3. Setelah para ahli menganalisis secara kualitatif tentang ketiga hal tersebut,
pengembang butir-butir tes sudah dapat mulai merevisi instrumennya berdasarkan
hasil analisis para ahli tersebut.
4. Gunakan format penilaian seperti pada Tabel 8.1 berikut ini yang perlu diisi oleh 3
ahli atau lebih untuk mengetahui kesesuaian butir dengan indikator dan contoh hasil
penilaian dari 3 orang ahli disajikan pada Tabel 8.2.
Tabel 8.1
Format Penilaian Instrumen Tes
Skor Relevansi butir dengan Indikator
Tidak Kurang Cukup Relevan Sangat
No Butir
Relevan relevan relevan relevan
1 2 3 4 5
1
2
3
4
5
6
7
Tabel 8.2
Contoh Hasil Penilaian dari 3 Orang Ahli
No Butir Ahli 1 Ahli 2 Ahli 3
1 5 4 4
2 2 2 3
3 4 4 3
4 5 5 4
5 4 4 5
6 2 3 2
V=
∑s
n(c−1)
Untuk membantu menghitung indeks kesepakatan antar ahli dapat dilihat pada Tabel
8.3.
Tabel 8.3
Tabel untuk Membantu Menghitung Indeks Kesepakatan antar Ahli
1 5 4 4 4 3 3 10 0,83 tinggi
2 2 2 3 1 1 2 4 0,33 rendah
3 4 4 3 3 3 2 8 0,67 Sedang
4 5 5 4 4 4 3 11 0,92 Tinggi
5 4 4 5 3 3 4 10 0,83 Tinggi
6 2 3 2 1 2 1 4 0,33 Rendah
Perhatikan Indeks kesepakatan antar ahli, berdasarkan kriteria yang telah ditetapkan butir
1,4, 5 pada kriteria tinggi, butir 2 pada kriteria sedang, ada dua butir 2 dan 6 pada kriteria
rendah. Untuk membuat suatu keputusan seperti memperbaiki butir, membuang butir,
menggunakan butir tersebut sangat tergantung dari indikator yang telah disusun sebelumnya,
dengan harapan setiap indikator ada butir soal yang digunakan.
2. Validitas yang berhubungan dengan kriteria (criterion related validity)
a. Pengertian validitas yang berhubungan dengan kriteria.
Validitas yang berhubungan dengan kriteria untuk situasi di mana pengguna tes ingin
membuat kesimpulan dari skor tes peserta tes untuk kinerja pada beberapa variabel perilaku
nyata dari kepentingan praktis. Prosedur yang digunakan untuk mencapai criterion-related
validity menghendaki adanya kriteria eksternal yang dapat dihubungkan dengan skor tes
yang diuji validitasnya. Kriteria adalah variabel yang akan diprediksi oleh skor tes.
Koefisien korelasi antara skor tes dengan skor kriteria merupakan koefisien validitas.
Koeisien ini dapat diperoleh melalui dua prosedur yang berbeda dari segi waktu
pengambilan data kriterianya, masing-masing akan menghasilkan predictive validity dan
concurrent validity.
Validitas empiris adalah nama lain dari validitas external. Validitas internal
berdasarkan pada kriteria yang ada pada instrumen itu sendiri, sedangkan pada validitas
eksternal, kriteria validitas didasarkan pada kriteria yang ada di luar instrumen yaitu
berdasarkan data empiris atau pengalaman. Kriteria yang dapat digunakan sebagai
pembanding instrumen ada dua, yaitu: yang sudah tersedia dan belum tersedia akan tetapi
terjadi di waktu yang akan datang.
Pada instrumen yang sesuai dengan kriteria yang sudah tersedia, atau sudah ada lebih
dikenal dengan validitas “kesejajaran” (concurrent validity), sedangkan instrumen yang
sesuai dengan kriteria yang diduga akan terjadi dikenal dengan validitas ramalan atau
validitas prediksi (predictive validity). Berdasarkan hal tersebut maka validitas eksternal
dapat dibedakan menjadi dua, yaitu:
a. Concurrent Validity (Validitas Kesejajaran)
Sebuah instrumen dikatakan memiliki validitas kesejajaran apabila hasilnya sesuai
dengan kriteria yang sudah ditetapkan, dalam arti memiliki kesejajaran dengan kriteria yang
sudah ada. Instrumen lain yang mengukur hal yang sama yang sudah ada dapat menjadi
kriterianya, karena sudah diakui validitasnya misal dengan tes terstandar yang sudah ada.
b. Predictif Validity (Validitas prediksi)
Validitas prediktif sangat penting artinya apabila alat ukur yang dimaksud berfungsi
sebagai prediktor bagi kinerja di masa yang akan datang. Contoh situasi yang menghendaki
adanya prediksi kinerja di masa yang akan datang ini antara lain adalah dalam hasil tes dari
seleksi mahasiswa baru, dapat digunakan untuk memprediksi Indeks Prestasi Kumulatif
(IPK) pada saat sudah diterima sebagai mahasiswa di suatu Perguruan Tinggi.
Koefisien korelasi antara skor dari alat ukur dan kriteria merupakan petunjuk
mengenai adanya hubungan antara skor alat ukur dengan skor kriteria dan merupakan
koefisien validitas prediktif. Apabila koefisien ini diperoleh dari sekelompok individu yang
merupakan sampel yang representatif, maka alat ukur yang telah teruji validitasnya akan
mempunyai fungsi prediksi yang sangat berguna dalam prosedur alat ukur di masa yang
akan datang.
Prosedur dalam memvalidasi instrumen dengan validitas prediktif pada umumnya
memerlukan waktu yang lama dan mungkin pula biaya yang tidak sedikit dikarenakan
prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai setelah melakukan satu
kali tes, melainkan lebih merupakan kontinuitas dalam proses pengembangan alat ukur.
Seperti prosedur validasi pada umumnya, validasi prediktif pada setiap tahapnya harus
diikuti oleh usaha dalam peningkatan kualitas butir alat ukur dalam bentuk revisi,
modifikasi, dan penyusunan butir-butir baru agar prosedur yang dilakukan itu mempunyai
arti yang lebih dan bukan sekedar pengujian secara deskriptif saja.
c. Contoh validasi dengan validitas kriteria.
Untuk memvalidasi instrumen dengan validitas kriteria dapat dilakukan dengan
menentukan koefisien korelasi antara skor pada instrumen yang dikembangkan dengan
dengan skor tes sebagai kriteria(misal tes yang sejenis yang sudah terstandar).
Diketahui skor pada tes X yang akan di validasi dan tes Y sebagai kriteria yang
disajikan pada Tabel 8.4.
Tabel 8.4
Skor pada Tes X dan Tes Y
No Siswa X Y
1 33 23
2 43 33
3 48 40
4 36 30
5 38 30
6 47 40
7 36 34
8 45 38
9 49 40
10 47 37
Korelasi antara X dan Y (rXY) dengan bantuan program Excel menggunakan formula
CORREL diperoleh rXY = 0,91 sebagai berikut.
Diperoleh rXY = 0,91, korelasi ini tergolong sangat tinggi, sehingga dapat dikatakan
bahwa validasi dengan validitas kriteria adalah valid. Selain dengan bantuan Excel dapat
juga dilakukan dengan bantuan program SPSS sebagai berikut.
Diperoleh rXY = 0,91, sama seperti dalam perhitungan menggunakan program Excel
korelasi ini tergolong sangat tinggi, sehingga dapat dikatakan bahwa validasi dengan
validitas kriteria adalah valid.
Keterangan:
A1 dan A2 adalah dua metode yang berbeda yang mengukur satu macam trait yang sama
yaitu A.
A1 dan B1 adalah dua macam trait yang berbeda yang diukur oleh satu metode yang sama
yaitu metode 1.
T adalah tinggi.
R adalah rendah.
Berdasarkan gambar tersebut dapat ditunjukkan dua tipe validitas yaitu
convergent validity dan discriminant validity. Adanya convergent validity ditunjukkan oleh
adanya korelasi-korelasi yang tinggi antara skor tes yang mengukur trait yang sama dengan
metode yang berbeda, dalam hal ini adalah rA1A2 dan r B1B2. Adanya discriminant validity
ditunjukkan oleh korelasi-korelasi yang rendah antara skor tes yang mengukur trait yang
berbeda yaitu rA1B1, rA1B1, r A2B2 , dan r B1A2 , terutama bila trait yang berbeda itu diukur oleh
metode yang sama (rA1B1 dan r A2B2). Koefisien korelasi yang rendah ini menunjukkan bahwa
memang tes-tes tersebut memiliki daya pembeda yang baik danmengukur trait yang spesifik.
Tipe lain dari validitas konstruk adalah validitas faktorial, suatu faktor adalah variabel
hipotesis yang mempengaruhi skor pada satu atau lebih variabel yang tampak. Validitas
faktorial dihitung melalui prosedur statistika yang disebut analisis faktor.
Analisis faktor adalah sebuah metode statistik yang digunakan untuk menggambarkan
variabilitas diantara variabel-variabel yang secara potensial dapat mengelompok menjadi
jumlah kelompok yang disebut dengan faktor. Software yang paling sering belakangan ini
untuk menghitung analisis faktor konfirmatori adalah SPSS, Lisrel atau Amos. Sebagai
contoh misalnya kita memiliki 20 set indikator atau item pertanyaan. 20 set item pertanyaan
tersebut dapat dikelompokkan menjadi kelompok yang lebih sedikit misalnya menjadi 4
kelompok.
Memang analisis faktor sangat berguna bagi permasalahan penelitian di mana kita
dihadapkan kepada banyak set indikator/ pertanyaan/ variabel. Untuk menghadapi kondisi
tersebut maka analisis faktor sangat membantu. Terlebih analisis faktor pun dapat
mengkonfirmasi apakah item-item yang masuk ke dalam faktor sudah cocok dengan model
teoritis atau tidak.
Analisis faktor juga dapat digunakan untuk menguji validitas dan reliabilitas item-item
pertanyaan yang dibuat oleh peneliti. Setiap item pertanyaan akan diketahui berapa faktor
loading-nya dan apakah item tersebut sudah cocok dikelompokkan ke dalam latent variabel
yang sama. Analisis faktor konfirmatori akan mencocokan model indikator terhadap model
laten dari sebuah model laten. Oleh sebab itu, analisis faktor konfirmatori biasanya
digunakan terlebih dahulu sebelum dilakukan analisis model struktural (Structural Equation
Modelling). Kemampuannya dalam memproduksi nilai skor untuk variabel laten membuat
analisis faktor konfirmatori banyak digunakan untuk membantu analisis regresi yang
memiliki beberapa indikator. Misalkan dalam variabel pengeluaran atau konsumsi, kita
dihadapkan pada lebih dari satu indikator.Bagaimana mereduksi berbagai macam variabel
ini tanpa mengurangi informasi yang ada, maka analisis faktor konfirmatori solusinya.
Bagaimana mekanisme analisis faktor konfirmatori mengelompokkan sekian set item
menjadi kelompok yang lebih kecil? Hal itu dilakukan berdasarkan variabilitas antar item itu
sendiri. Secara matematis, hubungan antara item dalam satu faktor dimodelkan dalam
bentuk fungsi persamaan linier. Secara perhitungan, tekniknya adalah dengan menggunakan
matrik kemiripan nilai varians. Sekali lagi, analisis faktor konfirmatori bertujuan untuk
mereduksi jumlah set pertanyaan yang banyak menjadi kelompok yang lebih sedikit dengan
tanpa kehilangan kandungan informasinya.
Proses analisis faktor mencoba menemukan hubungan (interrelationship) antar sejumlah
variabel-variabel yang saling independen satu dengan yang lain, sehingga bisa dibuat satu
atau beberapa kumpulan variabel yang lebih sedikit dibandingkan dengan jumlah variabel
awal tanpa kehilangan sebagian besar informasi penting yang terkandung didalamnya.
Sebagai contoh, jika ada 16 variabel yang independen satu dengan yang lain, dengan analisis
faktor mungkin bisa diringkas hanya menjadi 3 kumpulan variabel baru yang disebut faktor,
di mana faktor tersebut tetap mencerminkan variabel-variabel aslinya.
Analisis faktor konfirmatori memiliki kemiripan dengan beberapa teknik analisis
statistik lain diantaranya adalah Analisis Komponen Utama (principal component analysis),
Analisis Klaster (claster analysis) dan Analisis Regresi (regression analysis). Dibandingkan
dengan analisis Komponen Utama, analisis faktor konfirmatori memiliki kesamaan dalam
hal mereduksi sekian set item indikator/pertanyaan menjadi beberapa kelompok/faktor.
Perbedaan keduanya terletak pada analisis komponen utama adalah analisis deskriptif,
outcome nya hanya berupa skor dari beberapa kelompok tanpa melakukan
konfirmasi.sementara analisisi faktor konfirmatori bersifat statistik inferensial, yaitu
melakukan konfirmasi apakah kelompok yang terbentuk sudah sesuai dengan laten variabel
atau tidak. Lebih jauh lagi menjelaskan berapa gap/error diantara keduanya. Analisis faktor
konfirmatori dibandingkan dengan analisis klaster memiliki kemiripan dalam hal
mengelompokkan sekian banyak observasi menjadi beberapa klaster/kelompok observasi.
Perbedaannya yang dikelompokkan adalah subjek penelitian/unit
analisis/responden.Bukan item pertanyaan/indikator/varibel.Analisis faktor konfirmatori
dibandingkan dengan analisis regresi memiliki kemiripan dalam hal penggunaan model
persamaan linier.keduanya sama-sama menggunakan funsi persamaan linier untuk
menjelaskan hubungan antara indikator/pertanyaan/variabel.Perbedaannya terletak pada
Jumlah modelnya. Analisis faktor akan menghasilkan beberapa model tergantung kepada
jumlah faktor yang terbentuk. Sementara analisis faktor konfirmatori hanya akan
menghasilkan satu model yang akan diuji kelayakannya.
Rangkuman
1. Validitas didefinisikan sebagai ukuran seberapa cermat suatu tes melakukan fungsi
ukurnya
2. Tipe-tipe Umum Validitas
a) Validitas Isi (content validity)
1) Validitas Permukaan (face validity).
Face validity tercapai apabila pemeriksaan terhadap butir-butir tes tersebut
mengukur aspek yang relevan.
2) Validitas Logis (logical validity).
Validitas ini terpenuhi dapat dilihat butir-butir tes merupakan sampel yang
representatif dari seluruh butir yang mungkin dibuat dan tidak meninggalkan hal-
hal yang seharusnya menjadi isi tes.
b) Validitas Kriteria (criterion-related validity)
1) Validitas prediksi (predictive validity).
Validitas ini diperoleh apabila pengambilan skor kriteria tidak bersamaan dengan
pengambilan skor tes, tetapi ada tenggang waktu.
2) Validitas konkuren (concurrent validity)
Validitas ini diperoleh apabila pengambilan skor kriteria tidak relatif sama dengan
pengambilan skor tes.
c) Validitas Konstruk (Construct Validity).
Validitas konstruk menunjuk pada sejauh mana suatu tes megukur konstruk teoretis
yang menjadi dasar penyusunan tes tersebut.
Daftar Pustaka
Allen, Mary. Yen., & Yen, Wendy. M. (1981). Introduction to Measurement Theory. Berkeley,
California: Brooks/Cole Publishing Company.
Crocker, L & Algina, J. (2008). Introduction to Classical and Modern Test Theory. New York:
Holt, Rinehart and Winston.
Retnawati, H. 2015. Validitas Reabilitas dan Karakter Butir . Yogyakarta: Parama Publishing.