Anda di halaman 1dari 10

PERTEMUAN KE-10

Validitas dan Reabilitas Alat Ukur

A. Introduction Psikometri
Psikometri atau lebih tepatnya Psikometrika, dari asal katanya, Psikometrika terdiri
atas dua kata yakni ‘psiko’ atau ‘psyche’ dalam bahasa Inggris yang berarti jiwa dan
‘metrika’ atau ‘metrics’ dalam bahasa Inggris yang berarti ilmu tentang pengukuran. Jadi
Psikometri atau Psikometrika adalah sebuah ilmu yang mempelajari pengukuran tentang
jiwa. Pengukuran masalah kejiwaan merupakan hal tidak mudah dilakukan, namun sangat
penting peranannya dalam keilmuan. Sebagai ujung tombak pengukuran masalah psikis
individu, psikometrika paling umum berkutat dengan alat tes terhadap atribut psikologis.
Oleh karena itu sebagian ahli menjelaskan bahwa Psikometrika memusatkan
perhatiannya pada jenis data skor yang diperoleh oleh hasil tes, reliabilitas, dan validitas
data yang dihasilkan (Furr & Bacharach, 2008).
Pengukuran dapat diartikan sebagai cara atau prosedur kuantifikasi terhadap suatu
atribut atau variabel di sepanjang suatu kontinum (Azwar, 2015). Furr dan Bacharach
(2008) menjelaskan bahwa psikometrika sebagai sebuah ilmu lebih berfokus pada
konseptual dan hubungan antara ide dan realita dalam pengukuran, bukan pada hitungan
matematika dan aritmatika. Meskpiun demikian, dalam prosedur pengukuran,
psikometrika tidak akan bisa lepas dari ilmu lain yang terkait seperti matematika dan
statistika. Hal ini terkait dengan beberapa estimasi dalam menentukan validitas maupun
reliabilitas dalam pengembangan alat ukur yang memerlukan pemahaman dasar formula
matematika dan statistika. Begitu juga dua pendekatan yang digunakan, yakni pendekatan
Teori Tes Klasik dan Teori Respon Butir (Pada Pertemuan-9) juga merupakan turunan
dari formula matematika yang diaplikasikan dalam pengukuran psikologi.
Azwar (2016) menjelaskan bahwa dalam bidang Psikologi, atribut yang menjadi
objek pengukuran itu dapat dibagi menjadi dua, yakni atribut yang bersifat kemampuan
maupun atribut yang bersifat non-kemampuan. Atribut yang bersifat kemampuan
menunjukkan kapasitas intelektual individu oleh karena itu sering juga disebut
kemampuan kognitif. Atribut kemampuan ini dapat dibagi menjadi dua, yakni
kemampuan aktual dan kemampuan potensial. Kemampuan aktual merupakan
performansi nyata yang dimiliki individu saat ini pada satu bidang tertentu, misalnya nilai

1
pelajaran Kimia di kelas. Sedangkan kemampuan potensial merupakan modal dasar yang
dimiliki individu untuk mencapai performansi yang optimal. Kenyataannya, performansi
yang ditampilkan tidak selalu menggambarkan kemampuan potensi yang dimiliki. Ada
individu yang memiliki potensi namun tidak mampu memperlihatkan performansi
maksimal. Tingkat performansi dalam hal ini merpakan perpaduan dari potensi dan usaha
seseorang. Atribut psikologi lainnya yaitu atribut non-kemampuan atau sering disebut
juga sebagai kepribadian atau atribut afektif.
Pengukuran kedua macam ini juga berbeda. Dalam istilah umum, penyebutan alat
ukur atribut kemampuan disebut sebagai tes, sedangkan penyebutan alat ukur untuk
atribut non-kemampuan disebut skala. Tes terdiri atas tes pretasi (untuk mengukur
kemampuan aktual) serta tes inteligensi dan tes bakat (untuk mengukur kemampuan
potensi). Valid tidaknya hasil tes yang diperoleh bergantung pada apakah individu
tersebut bear-benar mengerjakan tes dengan usaha maksimal atau tidak. Sedangkan valid
tidaknya hasil yang diperoleh pada skala bergantung pada kejujuran individu dalam
menjawab. Perbedaan lainnya antara tes dan skala adalah pada item dan responnya. Pada
tes kognitif, subjek daat tahu arah dari pertanyaan serta respon dapat dibagi menjadi
respon yang benar dan salah. Sedangkan pada skala, subjek tidak tahu arah pertanyaannya
dan setiap respon bisa dianggap benar jika subjek menjawab dengan jujur. Secara
sederhana penjelasan tentang psikometrika dapat dilihat di mind map di bawah.

2
B. Validitas Penyusunan Alat Ukur
Validitas dalam riset sosial merupakan masalah yang sangat penting karena
menyangkut ketepatan alat ukur yang digunakan. Hal ini dapat dimaknakan bahwa
instrument yang tidak tepat/tidak sesuai, maka akan berimplikasi pada validitas hasil riset
itu sendiri. Dalam praktiknya, para ahli-ahli psikometrika telah mengembangkan berbagai
cara, teknik maupun metode untuk meningkatkan validitas instrumen ini, dan salah
satunya adalah melalui validitas isi sebagai langkah awal untuk menilai kesesuaian item
skala yang digunakan.
Validitas adalah sejauh alat ukur (tes) benar-benar menggambarkan apa yang
hendak diukur. Menetapkan validitas sebuah test atau instrument test sangat sulit,
terutama karena variabel-variabel psikologi biasanya adalah konsep-konsep abstrak,
seperti inteligensi, kecemasan, dan kepribadian.
Validitas menyangkut apa yang diukur tes dan seberapa baik tes tersebut bisa
mengukur (Anastasi & Urbina, 1997). Suatu tes yang dinyatakan reliabel, namun belum
tentu tes tersebut valid. Sedangkan jika tes tersebut dinyatakan valid, maka tes tersebut
akan reliabel. Pengujian reliabilitas tidak memberikan kesimpulan tentang apa yang
diukur tes, melainkan hanya memberi informasi bahwa hasil pengukuran tes tersebut
konsisten (Crocker & Algina, 1986). Sebuah tes tidak akan dinyatakan valid, jika tes
tersebut tidak reliabel. Cohen dan Swerdlik (2005) bahkan juga berpendapat serupa
bahwa reliablitas itu memang penting, namun reliabilitas tidaklah cukup untuk suatu tes
yang baik, karena tes haruslah valid. Lebih lanjut kemudian, validitas dipahami sebagai
bagian dari karakteristik skor tes, bukan karakteristik tes.
Menurut pandangan teori klasik, validitas mengunjukkan seberapa dekat besaran
skor tampak dengan skor murni. Semakin dekat skor tampak dengan skor murni, berarti
eror pengukurannya semakin kecil, yang itu artinya semakin valid pengukuran tersebut.
Secara umum, ada tiga prosedur validasi dalam sudut pandang teori klasik yaitu prosedur
validitas isi (content validity), validitas kriteria (criterion-related validity) dan validitas
konstruk (construct validity).
1) Validitas isi
Validitas isi terkait dengan kelayakan item-item dalam tes guna mewakili
komponen dari kawasan isi materi yang diukur atau sejauh mana item tersebut sesuai
dengan indikator keperilakuan dari atribut yang diukur. Validitas isi harus dilakukan sejak

3
awal pengembangan tes. Prosedur ini terkait dengan domain perilaku yang hendak diukur,
di mana analisis terhadap domain perilaku ini dilakukan sejak awal atau sejak dimulainya
prosedur pengembangan tes dan bukan setelah tes dipersiapkan. Layak tidaknya suatu
item disipulkan dari hasil penilaian (judgement) yang dilakukan oleh ahli berdasarkan
logic. Judgement ini dapat ditingkatkan objektivitasnya jika dilakukan oleh banyak orang.
Hasil penilaian ini dapat dinyatakan dalam bentuk indeks validitas isi seperti yang
dinyatakan oleh Lawshe dengan CVR dan Aiken dengan indeks Aiken’s V. Koefisien
validitas Aiken’s V didasarkan pada hasil penilaian panel ahli sebanyak n orang terhadap
suatu item mengenai sejauh mana item tersebut mewakili konstrak. Formula untuk
menghitung koefisien validitas Aiken’s V adalah (Aiken, 1985)
S
V =∑ .........................................................................................................1)
 n ( c − 1) 

lo = angka penilaian validitas terendah

c = angka penilaian validitas tertinggi

r = angka yang diberikan penilai

S = r – lo

Contoh Kasus
Sebuah skala yang terdiri dari lima item dalam tes dinilai oleh 7 (tujuh) orang ahli
mengenai relevansinya. Rentang nilai yang diberikan adalah 1 (terendah) dan 5
(tertinggi), sehingga n = 7, lo = 1 dan c = 5.
Tabel 1. Contoh Validitas Isi Aiken’s V
Item 1 Item 2 Item 3 Item 4 Item 5
Penilai
Skor s Skor s Skor s Skor s Skor s
A 4 3 2 1 4 3 4 3 4 3
B 3 2 4 3 4 3 4 3 4 3
C 4 3 4 3 2 1 4 3 2 1
D 3 2 3 2 4 3 3 2 4 3
E 2 1 2 1 2 1 2 1 2 1
F 4 3 4 3 4 3 4 3 4 3
G 2 1 4 3 4 3 4 3 4 3
∑s 15 16 17 18 17
V 0.536 0.571 0.607 0.643 0.607
Nilai V untuk item 1 diperoleh dari V= 15 / (7 (5-1)) = 0.536, begitu pula dengan item 2
yaitu V= 16 / (7 (5-1)) = 0.571 dan seterusnya untuk item 3, 4 dan 5. Nilai koefisien
Aiken’s V berkisar antara 0 – 1. Koefisien sebesar 0.536 (item 1), 0.571 (item 2), 0.607

4
(item 3), 0.643 (item4) dan 0.607 (item 5) ini sudah dapat dianggap memiliki validitas isi
yang memadai.

2) Validitas Konstrak
Validitas konstrak mengungkap kesesuaian antara stuktur konstrak yang diteorikan
dengan data hasil tes. Validitas kontstrak merupakan proses yang berlanjut terus seiring
dengan perkembangan konsep/teori mengenai trait yang diukur (Azwar, 2015). Dalam
Anastasi dan Urbina (1997) juga dilanjutkan dengan pemaparan teknik atau cara untuk
mengidentifikasi konstruk yang digunakan dalam prosedur validasi ini, di antaranya:
faktor perubahan perkembangan, korelasi dengan tes lain, analisis faktor, konsistensi
internal, validasi konvergen dan diskriminan, intervensi eksperimental, Structural
Equation Modelling, dan kontribusi psikologi kognitif.
Salah satu studi yang dilakukan untuk mengidentifikasi validitas konstrak adalah
dengan pendekatan multitrait-multimethod. Metode yang dilakukan dengan
pendekatan multitrait-multimethod adalah dengan mengadmistrasikan alat tes yang
mengukur trait yang sama namun dengan metode yang berbeda serta mengadmistrasikan
trait yang berbeda dengan metode yang sama maupun yang berbeda. Dengan metode ini
dapat disimpulkan adanya validitas konvergen, yakni tingginya koefisien korelasi pada
tes yang mengukur trait yang sama meskipun dengan metode yang berbeda, dan validitas
diskriminan yaitu rendahnya koefisien korelasi ada tes yangmengukur trait yang berbeda
meskipun dengan metode yang sama.
Validitas konstrak juga dapat dilakukan melalui prosedur analisis faktor
konfirmatori (Confirmatory Factor Analysis). Analisis faktor merupakan sekumpulan
prosedur matematika yang komplek guna menganalisis saling hubungan di antara variabel
serta menjelaskan saling hubungan tersebut dalam bentuk kelompok variabel yang
terbatas yang disebut faktor (Azwar, 2015). Prosedur analisis faktor dapat dilakukan
dengan menambahkan tes yang bukan mengukur trait apa yang ingin kita validasi, yang
kemudian disebut marker test. Adanya validitas kontrak ditunjukkan dengan
rendahnya loading factor pada tes pada faktor yang tidak diungkap. Pengertian ini hampir
mirip dengan validitas konvergen dan diskriminan.
3) Validitas Kriteria
Anastasi dan Urbina (1997) menjelaskan bahwa prosedur validitas kriteria
(criterion validity) menunjukkan efektifitas tes yang digunakan untuk memprediksi

5
performa seseorang. Kriteria yang dijadikan tolak ukur validasi skor tes bisa diperoleh
pada saat yang hampir bersamaan atau setelah dalam rentang waktu tertentu. Terdapat
dua jenis validitas kriteria yang keduanya dibedakan berdasarkan waktu antara tes dengan
kriteria, yaitu concurrent validity (validitas konkuren) dan predictive validity (validitas
prediktif).
Validitas prediktif misalnya digunakan untuk seleksi, baik itu seleksi masuk
perguruan tinggi atau seleksi kerja. Dalam validitas ini terdapat rentang waktu yang cukup
lama antara hasil tes dengan membandingkannya pada kriteria. Tes dikatakan valid
apabila orang-orang yang memperoleh skor tinggi pada saat seleksi menunjukkan
performa yang memuaskan saat kuliah atau saat kerja.
Validitas konkuren tidak memerlukan rentang waktu lama untuk membandingkan
hasil tes dengan kriterianya, misal bisa dibandingkan dengan Indeks Prestasi Kumulatif
(IPK) pada saat pengetesan terjadi, atau skor performa karyawan dengan skor kesuksesan
bekerja saat itu (Anastasi & Urbina, 1997). Pada dasarnya penentuan validitas apa yang
dipakai ditentukan dari tujuannya. Jika tujuan dari tes adalah untuk melakukan diagnosis
maka digunakanlah pengujian validitas konkuren. Sedangkan jika tes digunakan untuk
memprediksi hasil-hasil di masa depan maka digunakan pengujian validitas prediktif.

C. Reliabilitas Penyusunan Alat Ukur


Reliabilitas mengacu pada konsistensi skor yang diperoleh dari orang yang sama
ketika ia dites kembali dengan tes yang sama pada situasi yang berbeda atau dites dengan
tes yang berbeda namun item-item tes tersebut bersifat ekuivalen atau setara (Anastasi &
Urbina, 1997). Berkaitan dengan asumsi di atas, dirumuskan pula mengenai konsep tes
paralel. Menurut teori ini, dua bentuk tes diseut paralel apabila skor murni dari setiap
subjek adalah sama pada kedua tes (T1=T2), dan bagi setiap populasi yang dikenai tes
tersebut varians erornya adalah sama besar σ e2 = σ e2 . Batasan tersebut mengandung arti
bahwa mean dan varians skor tampak yang setara serta keduanya memiliki korelasi skor
tampak dengan yang setara pula. Batasan lain yang dirumuskan adalah mengenai
konsep essentially tau-equivalent. Kedua tes memiliki sifat tau-equivalent apabila
besarnya perbedaan skor murni setiap individu pada kedua tes selalu sama. Itu artinya T1
= T2 + C, dimana C suatu bilangan konstan. Tes yang paralel sudah pasti tau-equivalent.
1) Koefisien Reliabilitas

6
a. Interpretasi 1: ρ XX '

Korelasi skor tampak antara dua tes yang paralel. Koefisien reliablitas adalah
sejauhmana distribusi skor tampak pada dua tes yang paralel berkorelasi.
b. Interpretasi 2: ρ 2XX '

Besarnya proporsi varians X yang dijelaskan oleh hubungan liniernya dengan X'.
Kuadrat koefisien reliabilitas adalah sama dengan besarnya proporsi varians X yang
dijelaskan oleh hubungan liniernya dengan X’.
c. Interpretasi 3: ρxx' = σt2/σx2
Koefisien reliabilitas adalah perbandingan varians skor murni dan varian skor
tampak pada hasil ukur suatu tes
d. Interpretasi 4: ρxx' = ρ2xt
Koefisien reliabilitas adalah kuadrat koefisien korelasi antara skor tampak dan skor
murni.
e. Interpretasi 5: ρxx' = 1 - ρ2xe
Koefisien reliabilitas adalah sama dengan satu dikurangi oleh kuadrat koefisien
korelasi skor tampat dan eror pengukuran
f. Interpretasi 6: ρxx' = 1 – σe2/σx2
Koefisien reliabilitas adalah satu dikurangi besarnya proporsi varians eror yang
terkandung dalam varians skor tampak.
2) Interval Kepercayaan
Sekalipun skor murni individu dalam tes tidak dapat diketahui secara pasti, namun
masih dapat dilakukan semacam estimasi untuk menentukan taraf estimasi dari skor
murni.
Ƭ = X + SE(Zα/2)
Estimasi skor murni juga dapat dilakukan dengan melihat koefisien reliabilitas dan
mean nya.
Ƭ = ρxx' (x - μx) + μx

3) Pendekatan Reliabilitas
Secara umum, perhitungan terhadap reliabilitas dapat dilakukan dengan tiga
pendekatan, yakni tes-ulang (test-retest), pendekatan estimasi reliabiltas bentuk
paralel (parallel-form), dan pendekatan penyajian tunggai (single trial

7
administration), atau yang lebih dikenal dengan istilah konsistensi internal. Berikut
penjelasan ketiga pendekatan tersebut.
a. Test-retest
Metode pengujian reliabilitas test-retest digunakan pada saat ingin diketahui
seberapa konsisten respon dari seorang peserta tes di waktu yang berbeda. Koefisien
reliabilitas yang diperoleh dengan metode pengujian test-retest ini disebut sebagai
koefisien stabilitas (Crocker & Algina, 1986). Metode pengujian ini dilakukan dengan
menggunakan satu form tes dengan 2 kali sesi pengujian. Hasil pengujian dari kedua tes
tersebut nantinya akan menghasilkan 2 distribusi skor tes yaitu skor tes dari sesi pengujian
yang pertama dan skor tes dari tes yang sama namun dari sesi pengujian yang kedua.
Koefisien reliabilitas diperoleh dengan cara melakukan perhitungan korelasi antar kedua
distribusi skor tersebut, sehingga nantinya akan diperoleh suatu nilai korelasi yang dalam
metode pengujian test-retest ini disebut sebagai koefisien stabilitas. Penyebutan koefisien
stabilitas sebagai koefisien reliabilitas pada metode ini dimaksudkan pada kestabilan hasil
pengukuran tes pada peserta tes yang sama antara hasil pengukuran tes yang pertama
dengan tes yang kedua (Stability over time).

b. Parallel-form
Dalam metode test-retest, efek pengetahuan sebelumnya terhadap tes yang sama
terutama ketika peserta tes masih dapat mengingat item-item tes yang dikerjakannya atau
masih mengingat bagaimana cara mengerjakannya, menjadi permasalahan yang mungkin
terjadi. Untuk mengatasi hal tersebut, digunakanlah metode pengujian reliabilitas lain
yang serupa dengan metode test-retest, di mana peserta tes diuji dengan dua kali sesi
pengerjaan tes namun dengan dua form test yang itemnya berbeda tapi memiliki sifat
ekuivalen antar keduanya. Metode pengujian reliabilitas ini juga memiliki koefisien
reliabilitas yang merupakan hasil korelasi antara skor tes pertama dan skor tes kedua.
Koefisien reliabilitas dalam metode parallel-form mengukur dua hal yaitu kestabilitasan
hasil pengukuran antar waktu dan konsistensi respon peserta tes terhadap item-item tes
yang berbeda atau dua form tes yang berbeda (Anastasi & Urbina, 1997).

c. Konsistensi internal

8
Dalam pelaksanaannya, metode test-retest dan parallel-form memiliki beberapa
kekurangan. Utuk test-retest kendala yang dihadapi adalah bagaimana menentukan
interval waktu yang pas antara tes pertama dan kedua, sehingga tidak terjadi carry over
effect (efek bawaan) yang mempengaruhi besaran koefisien yang dihasilkan. Sedangkan
kendala utama bentuk parallel-form adalah sulitnya menciptakan dua tes yang benar-
benar paralel. Selain itu kedua metode tersebut juga kurang praktis karena harus disajikan
dua kali. Dengan alasan yan dikemukakan di atas, metode penyajian tunggal yang
menghasilkan koefisien konsistensi internal banyak digunakan karena memiliki nilai
praktis yang lebih tinggi.
Komputasi koefisien konsistensi internal diawali dengan pembelahan tes menjadi
beberapa bagian. Dalam pembelahan, apabila memungkinkan sebisa mungkin bentuk
belahannya paralel, sehingga estimasi reliabilitas yang dihasilkan lebih akurat. Berikut
adalah beberapa metode dalam pembelahan tes. Secara umum, untuk dilakukan
pembelahan dua bagian ada beberapa asumsi yang harus dipenuhi yaitu mean belah
pertama dan kedua setara, varians belah pertama dan kedua setara, serta koefiesn korelasi
belah pertama dan kedua tinggi. Ada beberapa metode yang adapat digunakan untuk
estimasi reliabilitas belah dua.

d. Spearman-Brown
ρxx' = 2ρyy' / 1+ ρyy'
Dengan y adalah hasil belahan pertama dan y’ adalah hasil belahan kedua. Syarat
untuk metode spearman-brown adalah kedua belahan harus parlalel. Apabila syarat ini
tidak terpenuhi maka hasil estimasi reliabilitasnya tidak benar.
e. Rulon
ρxx' = 1 – σd2/σx2
Dengan d sama dengan eror yaitu nilai belahan pertama dikurangi belahan kedua.
Syarat yang harus dipenuhi oleh metode Rulon ini adalah kedua belahan jumlah itemnya
harus sama.
f. Alpha-Cronbach

9
Formula ini sama dengan formula Gutman, untuk kasus belah dua. Syarat yang
harus dipenuhi oleh metode ini adalah kedua belahan harus tau ekuivalen dan berarti
varians kedua belahan juga setara. Pelanggaran syarat ini berakibat hasil estimasi yang
underestimate. Alpha cronbach tidak hanya bisa digunakan untuk belah dua saja, tapi juga
bisa digunakan untuk belah berapapun. Berikut adalah formula umum Alpha Cronbach
dengan tes dibelah sejumlah k belahan.

Formula umum alpha cronbach:

g. Kuder-Richardson

Kuder Richradson 20 (KR-20) adalah metode estimasi reliabilitas yang sama


dengan Alpha, namun hanya digunakan untuk item-item yang dikotomi (skor 1 dan 0).
KR-21 merupakan pengembangan dari KR-20 yang lebih tahan terhadap perbedaan
varians antar item.
Apabila pembelahan dilakukan menjadi tiga bagian yang tidak sama panjang dapat
diesmitasi dengan metode Krustoff, yakni
rxx' = st2/sx2

Referensi
Azwar, S. (2015). Dasar-dasar Psikometri. Yogyakarta: Pustaka Pelajar
Azwar, S. (2016). Konstruksi Tes Kemampuan Kognitif. Yogyakarta: Pustaka Pelajar
Furr, R. M., & Bacharach, V. R. (2008). Psychometrics: An introduction. Thousand Oaks,
CA: Sage.
Anastasi, A. & Urbina, S. (1997). Psychological Testing. 7th edition. New Jersey:
Prentice-Hall.
Aiken, L. R. (1985). Three Coefficients for Analyzing the Reliability and Validity of
Ratings.
Cohen, R,J. & Swerdlik, M.E. (2005). Psychological Testing and Assessment. 6th edition.
New York: McGraw-Hill Companies, Inc.
Crocker, L. & Algina, J. (1986). Introduction to classical and modern test theory. Fort
Worth : Harcourt Brace Jovanovich College Publishers.

10

Anda mungkin juga menyukai