Anda di halaman 1dari 14

PROCEEDING

Seminar Nasional Psikometri

PENGEMBANGAN PENGUJIAN VALIDITAS ISI DAN VALIDITAS KONSTRAK:


INTERPRETASI HASIL PENGUJIAN VALIDITAS

Miftahun Ni’mah Suseno


Program Studi Psikologi Fakultas Ilmu Sosial dan Humaniora
UIN Sunan Kalijga Yogyakarta
Jl. Marsda Adisucipto Sleman Yogyakarta
miftahsuseno@gmail.com

Abstract. Validitas bukan merupakan bagian dari instrumen pengukuran, namun lebih
melekat pada interpretasi serta penggunaan skor yang dihasilkan tes pada subjek yang
relevan. Dapat juga dikatakan bahwa validitas dibuktikan dengan diperolehnya kecocokan
empirik antara interpretasi skor dan penggunaannya, serta terkait pula dengan dasar teoritik
atribut tujuan ukur sebagai rasionalisasi. Pengukuran merupakan kegiatan yang lazim,
bahkan rutin dilakukan dalam dunia psikologi dan pendidikan. Banyak penelitian yang
menggunakan validitas aitem sebagai justifikasi valid tidaknya skor yang dihasilkan oleh
alat ukur yang digunakan dalam penelitian dalam bentuk korelasi aitem-total atau korelasi
aitem-total terkoreksi (corrected item-total correlation). Namun persoalan validitas tidak
sesederhana itu, namun proses validasinya dilakukan terhadap hasil ukur sehingga bisa
membuktikan konstrak yang dikembangkan betul-betul berlaku pada subjek yang menjadi
tujuan ukur. Proses pengujian validitas isi salah satunya dapat dilakukan dengan
menggunakan Content Validity Ratio (CVR) dan pengujian validitas konstrak dapat
dianalisis dengan metode Explanatory Factor Analysis (EFA) dan Confirmatory Factor
Analysis (CFA). Namun hal yang lebih penting bukanlah proses pengujian validitas tetapi
lebih kepada interpretasi skor hasil validitas. Validitas adalah ringkasan evaluatif baik
dalam bentuk bukti atau konsekuensi interpretasi dan penggunaan skor hasil tes. Pada saat
ini yang lebih diutamakan adalah interpretasi skor hasil tes berdasarkan hasil pengujian
validitas.

Kata kunci: validitas isi, validitas konstrak, interpretasi hasil pengujian validitas

A. Pendahuluan pertanyaan ”Apakah tes tersebut mampu


Dalam penelitian sosial dengan mengungkap atribut yang menjadi tujuan
pendekatan kuatitatif ataupun evaluasi ukur?”.
pendidikan seringkali kita mengandalkan Hal ini didasarkan apakah suatu
proses pengukuran dalam proses instrumen atau alat ukur sesuai dengan apa
pengumpulan data maupun melakukan yang mau diukur. Banyak individu atau
evaluasi terhadap proses pembelajaran. kelompok serampangan melakukan tes,
Pengukuran bukan berarti berdiri sendiri padahal belum tentu tes itu tepat dengan
begitu saja, tetapi ada bagian yang sangat apa yang dikehendaki. Validitas memiliki
penting mendahuluinya yaitu tersedianya makna sejauh mana ketepatan ukur atau
instrumen atau alat ukur atau alat tes. kecermatan alat ukur dalam mengukur
Instrumen atau tes ini yang akan atribut yang menjadi tujuan ukurnya.
memberikan gambaran sejauh mana tingkat Pemahaman yang selama ini
hasil pengukuran. berkembang mengenai validitas sering
Sebelum melakukan pengukuran, hal dipahami sebagai suatu ukuran valid atau
yang perlu diperhatikan dan diketahui tidaknya instrumen pengukuran, padahal
terlebih dulu adalah tingkat validitas dan sebenarnya validitas bukan merupakan
reliabilitas intrumen. Validitas atau derajat bagian dari instrumen pengukuran tetapi
kesahihan sangat penting untuk didalami. lebih melekat pada interpretasi serta
Evaluasi terhadap validitas terkait dengan penggunaan skor yang dihasilkan oleh suatu

70
PROCEEDING
Seminar Nasional Psikometri

alat ukur pada subjek yang relevan. Perlu Hal tersebut diatas sesuai dengan
adanya terobosan pengembangan pendapat Azwar (2013) yang menyatakan
pemahaman pada para peneliti atau bahwa validitas berasal dari kata validity
penyusun alat ukur tentang konsepsi yang mempunyai arti sejauhmana akurasi
validitas. suatu tes atau skala dalam menjalankan
Implementasi konsepsi validitas fungsi pengukurannya. Pengukuran
bukanlah persoalan sederhana. Sejak dikatakan mempunyai validitas yang tinggi
munculnya konsepsi validitas oleh apabila menghasilkan data yang secara
Cronbach dan Meehl (1955), penelitian- akurat memberikan gambaran mengenai
penelitian yang memfokuskan pada proses variable yang diukur seperti yang
validasi terhadap alat ukur di bidang dikehendaki oleh tujuan pengukuran
pendidikan dan psikologi terus tersebut, sedangkan pengukuran yang
berkembang. memiliki validitas rendah adalah apabila
Proses validasi yang banyak dilakukan suatu tes menghasilkan data yang tidak
oleh peneliti adalah pengujian validitas isi relevan dengan tujuan pengukuran.
dan validitas konstrak. Pengujian validitas
isi dengan menggunakan pendekatan Validitas sangat berkaitan dengan
Lawshe’s CVR (Content Validity Ratio) tujuan pengukuran. Validitas tidak berlaku
atau Aiken’s V, sedangkan pengujian secara umum bagi semua pengukuran.
validitas konstrak dapat dilakukan dengan Suatu tes mempunyai hasil ukuran yang
pendekatan multitrait-multimethod atau valid untuk suatu tujuan tertentu yang
pendekatan analisis faktor dengan spesifik tetapi tidak valid untuk tujuan yang
menggunakan metode Explanatory Factor lain atau bahkan untuk tujuan yang sama
Analysis (EFA) dan Confirmatory Factor pada kelompok yang lain. Untuk
Analysis (CFA). Namun hal yang lebih mengetahui alat ukur apakah valid atau
penting bukanlah proses pengujian validitas tidak maka perlu dipelajari dan diukur
tetapi lebih kepada interpretasi skor hasil terlebih dahulu.
validitas.
Pada akhirnya 40 tahun kemudian Selanjutnya Azwar (2013) juga
muncul pendapat Messick (1995) yang menjelaskan bahwa validitas adalah
mendefinisikan validitas sebagai satu pertimbangan yang paling utama dalam
kesatuan, tidak terbagi-bagi sebagaimana mengevaluasi kualitas tes sebagai
menurut Cronbach dan Meehl. Messick instrument ukur. Konsep validitas mengacu
(1995) menulis bahwa validitas adalah kepada kelayakan, kebermaknaan dan
ringkasan evaluatif baik dalam bentuk bukti kebermanfaatan inferensi tertentu yang
atau konsekuensi interpretasi dan dapat dibuat berdasarkan skor hasil tes yang
penggunaan skor hasil tes. Pada saat ini bersangkutan. Validasi merupakan proses
yang lebih diutamakan adalah interpretasi pengumpulan bukti-bukti yang dapat
skor hasil tes berdasarkan hasil pengujian mendukung inferensi yang dimaksud,
validitas. dengan kata lain validasi bukan untuk
memvalidasi tes melainkan memvalidasi
inferensi mengenai penggunaan hasil ukur
B. Kajian Pustaka secara spesifik.
1. Pengertian Validitas
Validitas berasal dari bahasa Inggris Pada awalnya konsep validitas
dari kata validity yang berarti keabsahan dianggap sebagai suatu karakteristik yang
atau kebenaran. Dalam konteks alat ukur dimiliki oleh tes, dan saat ini konsep
atau instrumen asesmen, validitas berarti validitas telah mengalami pergeseran dari
sejauh mana kecermatan atau ketepatan alat makna validitas tes menjadi validitas
ukur dalam melakukan fungsi ukurnya. interpretasi skor tes. Validitas lebih
Sebuah instrumen yang valid akan diartikan sebagai suatu karakteristik
menghasilkan data yang tepat seperti yang inteprestasi skor tes, bukan karakteristik tes
diinginkan. ataupun karakateristik skor tes.

71
PROCEEDING
Seminar Nasional Psikometri

Hal tersebut sesuai dengan pengertian a. Validitas menyatakan ketepatan


validitas yang disampaikan dalam dokumen interpretasi hasil bukan pada
AERA, APA & NCME (1999) tentang prosedurnya.
artikel Standards for educational and b. Validitas merupakan persoalan yang
psychological tests and manuals yang berkaitan dengan derajat (tingkatan),
diterbitkan oleh American Psychological 
 sebagai konsekuensinya kita harus
Association (APA), American Educational menghindari pemikiran hasil asesmen
Research Association (AERA), dan National sebagai valid atau tidak valid. Oleh
Council on Measurement in Education karena validitas adalah persoalan
(NCME) yang merumuskan konsep derajad maka sebuah instrumen dapat
validitas adalah sebagai berikut: dikategorikan mempunyai derajad
validitas tinggi, sedang, dan rendah.
a. Validitas bukanlah karakteristik atau c. Validitas selalu bersifat khusus untuk
kualitas yang melekat pada tes penggunaan atau interpretasi tertentu.
melainkan kualitas konsekuensi sosial Tidak ada asesmen yang valid untuk
yang ditimbulkan oleh penafsiran hasil semua tujuan. Sebagai contoh, hasil tes
tes sesuai tujuan penggunaan tes. aritmatika mungkin mempunyai tingkat
Dengan kata lain, validitas dipahami validitas yang tinggi untuk kemampuan
sebagai taraf sejauhmana bukti bukti hitung, validitas yang rendah untuk
empiris maupun teoritis mendukung alasan-alasan aritmatika, dan
atau membenarkan cara mempunyai derajat validitas sedang
menginterpretasi skor tes sesuai dengan untuk memprediksi kesuksesan prestasi
tujuan penggunaan tes. Pengujian matematika yang akan datang.
validitas yang dilakukan adalah untuk d. Validitas merupakan kesatuan konsep.
mengevaluasi kualitas interpretasi skor Hakikat konsep validitas dipandang
tes sesuai dengan tujuan penggunaan sebagai sebuah kesatuan konsep
tes, bukan tesnya sendiri. berdasarkan berbagai macam bagian
b. Validitas sebagai konsep tunggal. dari fakta.
Beberapa bukti yang digunakan untuk e. Validitas melibatkan sebuah keputusan
mengevaluasi kualitas interpretasi skor evaluatif yang menyeluruh.
tes sesuai tujuan penggunaan tes Perubahan pemahaman konsep
memang mampu menunjukkan aspek- validitas dari pemahaman awal bahwa
aspek validitas namun tidak mewakili validitas itu melekat pada tes bergeser
jenis-jenis validitas yang berbeda. Hal menjadi validitas interpretasi skor tes tentu
ini mengandung makna bahwa validitas saja membawa perubahan cara pandang
merupakan konsep tunggal, yaitu taraf terdapat validitas. Hal ini merupakan proses
sejauhmana seluruh bukti yang berhasil pengembangan konsepsi terhadap validitas
dikumpulkan mendukung interpretasi itu sendiri, dan perubahan konsepsi ini juga
skor tes sesuai yang dimaksudkan oleh mempengaruhi proses pengumpulan bukti-
tujuan penggunaan tes. bukti empiris pada proses validasi suatu alat
c. Terdapat 5 (lima) jenis bukti yang perlu ukur atau suatu tes. Tentu saja perubahan
dikumpulkan untuk memeriksa validitas konsepsi validitas ini menjadi langkah awal
interpretasi skor sesuai tujuan pengembangan dalam pengujian atau
penggunaan tes yaitu (1) bukti terkait pemeriksaan validitas alat ukur atau alat tes.
isi tes, (2) bukti terkait proses respon
yang diberikan subjek, (3) bukti terkait
struktur internal tes, (4) bukti terkait
hubungannya dengan variabel lain, dan 2. Metode Estimasi Validitas
(5) bukti terkait konsekuensi Dari metode estimasi yang disesuaikan
pengetesan. dengan sifat dan fungsi setiap tes, tipe
Selanjutnya, Linn & Gronlund (2000) validitas secara tradisional dapat dibedakan
mengemukakan hakikat validitas adalah menjadi 3 macam yaitu validitas isi (content
sebagai berikut: validity), validitas konstrak (construct

72
PROCEEDING
Seminar Nasional Psikometri

validity), dan validitas berdasar kriteria dituliskan dalam rumus sebagai


(criterion related validity) yang terbagi berikut:
menjadi dua macam yaitu, validitas V = ∑ s / [n (c – 1) ]
konkuren (concurent validity) dan validitas
prediktif (predictive validity). Azwar (2013) (1)
memberikan penjelasan mengenai 3 (tiga)
validitas adalah sebagai berikut: Keterangan:

a. Validitas Isi (Content Validity) s=r–l


(1) Validitas isi erat kaitannya dengan
materi yang akan diukur dalam tes. V memiliki kemungkinan nilai 0
Tentu saja materi yang dimaksud s.d. 1 yang menunjukkan derajat
adalah materi yang terdapat dalam validitas aitem. Sebuah aitem
kurikulum. Validitas isi dianggap valid manakala memiliki
mencerminkan sejauh mana butir- V sebesar 0.5 atau lebih.
butir dalam tes mencerminkan (4) Pengujian validitas isi secara
materi yang disajikan dalam statistik yang kedua adalah
kurikulum. Sebuah tes dikatakan menurut Lawshe (1975) yang
memiliki validitas isi jika butir - dikenal dengan rasio validitas isi
butir tes bersifat representatif atau content validity ratio (CVR).
terhadap isi materi dalam Pendekatan yang dilakukan adalah
kurikulum tersebut. dengan melibatkan subject matter
(2) Cara yang praktis untuk melakukan expert (SME) diminta untuk
analisis validitas isi adalah dengan menyatakan apakah aitem dalam
melihat apakah butir-butir tes telah tes sifatnya esensial bagi
disusun sesuai dengan blue-print operasional konstrak teoritik tes
(kisi-kisi) yang sudah dirancang yang bersangkutan. Formula
sebelumnya. Blue print menjadi persamaannya adalah:
acuan dalam menuangkan domain
atau ranah dan indikator yang akan
diukur dalam tes. CVR = (2 ne / n) – 1
(3) Pengujian validitas isi secara
statistik dapat dilakukan dengan (2)
menggunakan formula yang
diusulkan oleh Aiken (1985) untuk Keterangan:
menghitung koefisien validitas isi
yang didasarkan pada hasil Ne : banyaknya SME yang menilai
penilaian dari panel ahli sebanyak suatu aitem esensial
n orang terhadap suatu aitem dari
N : banyaknya SME yang
segi sejauhmana aitem tersebut
melakukan penilaian.
mewakili konstrak yang diukur.
Penilaian dilakukan dengan cara Perhitungan formula tersebut akan
memberikan angka antara 1 (sangat menghasilkan skor CVR yang
tidak mewakili/sangat tidak terentang dari -1 s.d. 1. Bila
relevan) sampai dengan 5 (sangat setengah dari panelis menyatakan
mewakili/sangat relevan). Bila sebuah aitem bersifat esensial, CVR
terdapat sebanyak n panelis yang = 0, berarti aitem tersebut valid.
menilai sebuah aitem melalui rating
(r) dengan pilihan 1 (sangat tidak b. Validitas Konstrak (Construct
relevan) sampai dengan sangat Validity)

relevan (5), berarti kategori (1) Validitas konstrak adalah validitas
tertinggi (c) adalah 5 dan kategori yang menyangkut bangunan
terendah (l) adalah 1, maka dapat

73
PROCEEDING
Seminar Nasional Psikometri

teoretik variabel yang akan diukur. yang sama. Validitas konvergen


Sebuah tes dikatakan mempunyai ditunjukkan oleh tingginya korelasi
validitas konstrak apabila butir- skor tes-tes yang mengukur trait
butir soal yang disusun dalam tes yang sama dengan menggunakan
mengukur setiap aspek berpikir metode yang berbeda.
dari sebuah variabel yang akan c. Validitas Berdasarkan Kriteria
diukur melalui tes tersebut. (1) Validitas kriteria ini didasarkan
(2) Seperti halnya validitas isi, untuk pada kriteria tertentu. Dengan
mempertinggi validitas konstrak demikian bukti adanya validitas
dapat dilakukan dengan cara ditunjukkan adanya hubungan
merinci dan memasangkan setiap korelasional skor pada tes yang
butir soal dengan setiap aspek. bersangkutan dengan skor suatu
Pengujian validitas konstrak kriteria.
diperlukan analisis statistik yang (2) Pengujian validitas ini bersifat
kompleks seperti prosedur analisis empirik, artinya pengujian hanya
faktor. Dalam analisis faktor dapa t dilakukan setelah
dikenal dua macam prosedur yang mendapatkan data di lapangan.
dilandasi oleh dasar pemikiran Apabila berdasarkan hasil analisis
yang berbeda yaitu exploratory yang dilakukan terhadap data hasil
factor analysis (EFA) yang akan pengamatan di lapangan terbukti
membantu penyusun tes untuk bahwa tes hasil belajar dapat
mengenali dan mengidentifikasi mengukur hasil belajar yang
bebrbagai faktor yang membentuk seharusnya diungkap secara tepat
suatu konstrak dengan cara maka berarti alat tes tersebut
menemukan varians skor terbesar mempunyai validitas empirik.
dengan jumlah faktor yang paling Untuk keperluan pengujian
sedikit yang dinyatakan dalam validitas kriteria dapat dilakukan
bentuk eigenvalue > 0,1 dan dengan dua cara yaitu dari segi
confirmatory factor analysis (CFA) ketepatan meramalkan (predictive
yang biasanya dilakukan sebagai validity) dan ketepatan
tindaklanjut dari hasil EFA dengan bandingannya (concurrent validity).
menyertakan dasar teori yang (3) Perbedaan utama antara validitas
melandasi bangunan tes yan ramalan dengan validitas bandingan
bersangkutan agar lebih lanjut adalah ketersediaan pembanding
dapat menguji validitas (kriterium). Pada validitas ramalan,
konstraknya. kriterium diperoleh pada waktu
(3) Salah satu prosedur pengujian yang akan datang setelah dilakukan
validitas konstrak yang tidak terlalu tes yang akan diukur validitasnya
kompleks dapat dilakukan dengan tersebut. Sedangkan pada validitas
pendekatan multitrait-multimethod. bandingan, kriterium sudah ada
Dua atau lebih trait yang diukur atau dapat diperoleh pada saat yang
melalui dua atau lebih metode sama dengan waktu untuk
dapat diuji secara serentak dengan memperoleh data tentang tes yang
pendekatan ini, sehingga akan akan diukur validitasnya tersebut
diperoleh adanya bukti adanya tanpa harus menunggu masa yang
validitas diskriminan dan validitas akan datang.

konvergen. (4) Validitas ramalan (predictive
(4) Validitas diskriminan ditunjukkan validity). Sebagai ilustrasi adalah
oleh rendahnya korelasi antara adanya tes masuk Perguruan Tinggi
faktor skala atau tes yang Negeri. Setelah melalui serangkaian
mengukur trait yang berbeda tes maka hanya calon mahasiswa
terutama bila digunakan metode yang mempunyai skor tinggi yang

74
PROCEEDING
Seminar Nasional Psikometri

diterima oleh panitia seleksi hal ini pengalaman digunakan


mahasiswa baru. Sesungguhnya sebagai kriterium. Guna
keputusan panitia seleksi yang menentukan validitas bandingan ini
hanya menerima mahasiswa yang tidak perlu menunggu waktu untuk
mempunyai skor tinggi saja berarti membuktikannya. Dalam validitas
sudah memprediksikan bahwa bandingan ini menunjukkan bahwa
calon mahasiswa dengan skor yang berfungsi sebagai kriterium
tinggi tersebut kelak yang akan adalah data hasil pengalaman.
lebih berhasil dalam studinya. Apabila data dari tes yang ada
Sedangkan para calon mahasiswa sekarang mempunyai hubungan
yang mempunyai skor sedang yang searah dengan data hasil
apalagi rendah diprediksikan akan pengalaman maka dikatakan telah
banyak menemui kendala dalam mempunyai validitas bandingan.
studinya. Oleh karena itu tes yang Pemahaman yang baru tentang
digunakan dalam seleksi calon validitas beserta metode estimasinya,
mahasiwa baru tersebut akan khususnya setelah terbitnya artikel AERA,
mempunyai tingkat validitas APA & NCME tahun 1999 yang lebih
prediktif yang tinggi apabila secara menekankan sejauhmana interpretasi skor
empirik terbukti bahwa prestasi tes sebagaimana dimaksud oleh tes yang
belajar mereka juga baik. Dengan bersangkutan sungguh-sungguh dapat
demikian antara skor tes masuk dipertanggungjawabkan. Berdasarkan
dengan prestasi belajar harus konsep validitas sebagai interpretasi skor
mempunyai korelasi yang positif. tes maka diperlukan 5 (lima) jenis bukti
Pada kasus tersebut, yang yang dikumpulkan dalam memeriksa
dipermasalahkan validitasnya validitas interpretasi skor tes atau hasil
adalah tes masuk. Oleh karena itu pengukuran suatu tes sesuai dengan tujuan
hasil belajar pada masa perkuliahan penyusunan tes tersebut.
digunakan sebagai tolok ukur
(kriterium). Adanya kesejajaran, AERA, APA & NCME (1999) dan
kesesuaian, kesamaan arah antara Goodwin & Leech (2003) menjelaskan
tes seleksi masuk dengan hasil kelima bukti yang perlu dikumpulkan
belajar mempunyai korelasi yang adalah sebagai berikut:
positif.
(5) Validitas bandingan (Concurent a. Bukti terkait isi tes
Validity). Validitas ini sering pula Bukti tentang kesesuaian isi dan
disebut sebagai validitas ada konstrak yang diukur oleh suatu tes
sekarang (konkuren), validitas sama dapt diperoleh melalui analisis logis
saat, validitas pengalaman, dan atau empiris terhadap seberapa
validitas empiris. Disebut sebagai memadai isi tes mewakili ranah isi serta
validitas ada sekarang karena seberapa relevan ranah isi tersebut
pengujiannya berdasarkan sesuai dengan interpretasi skor tes yang
pengalaman yang saat ini sudah ada dimaksudkan. Isi tes mengacu pada
di tangan. Disebut sebagai validitas tema-tema, pilihan kata, serta format
sama saat karena validitas ini atau bentuk aitem, tugas atau
segera dapat kita peroleh pertanyaan yang digunakan dalam tes.
informasinya pada saat yang sama Bukti terkait isi diperoleh melalui
dengan waktu diperolehnya data penilaian pakar atau ahli terhadap
hasil tes yang diukur validitasnya kesesuaian anatara bagian-bagian tes
tersebut. Disebut validitas dan konstrak yang diukur. Aspek-aspek
pengalaman (empiris) karena isi tes yang perlu dievaluasi meliputi;
validitas ini dikaitkan dengan
pengalaman yang sudah ada. Dalam (1) Sufficiency atau kecukupan yaitu

75
PROCEEDING
Seminar Nasional Psikometri

apakah isi tes tersebut mencukupi pertanyaan dalam tes.


atau memadai/mewakili ranah isi
spesifik yang hendak diukur. c. Bukti terkait struktur internal tes
(2) Clarity atau kejelasan yaitu apakah Bukti ini didasarkan pada penilaian
isi tes tersebut mencerminkan sejauhmana aitem-aitem dan
secara jelas ranah isi spesifik yang komponen-komponen dalam tes saling
hendak diukur, misalnya tidak berhubungan sedemiian rupa sesuai
mencampuradukkan dengan ranah dengan konstrak yang diukur. Hal ini
isi spesifik yang lain. terkait dengan konsistensi internal atau
(3) Relevance atau relevansi yaitu homogenitas tes. Langkah yang dapat
apakah isi tes tersebut memiliki dilakukan untuk memeriksa struktur
kesesuaian dengan ranah isi internal tes adalah analisis faktor
spesifik yang hendak diukur. konfirmatori dan differential item
(4) Kesesuaian antara aitem-aitem dan function (DIF) untuk memeriksa
tugas-tugas yang dipakai sebagai kemungkinan terjadinya bias aitem.
stimulus dalam tes tersebut denan
definisi tentang konstrak yang d. Bukti terkait hubungan antara tes
hendak diukur. dengan tes lain
(5) Ada tidaknya bias berupa Bukti ini didapatkan dengan
keberpihakan isi tes pada gender, menganalisis hubungan antara skor tes
budaya, umur atau faktor dan variabel-variabel lain di luar tes itu
pengelompokkan sosial lainnya. sendiri. Metode pertama yang dapat
(6) Kemungkinan terjadinya varians dilakukan adalah analisis hubungan
yang tidak relevan dengan konstrak antara skor tes dan skor kriteria yang
yang hendak diukur diprediksikan oleh tes yang
Hal-hal yang perlu dilakukan untuk bersangkutan, yang kedua adalah
memperhatikan validitas yang terkait melakukan analisis hubungan antara
dengan isi adalah menyusun kisi-kisi skor tes dan skor tes-tes lain yang
atau tabel spesifikasi, langkah kedua dimaksudkan untuk mengukur konstrak
yaitu melakukan eksplikasi konstrak yang sama seperti yang diukur oleh tes
dengan cara perumusan definisi yang bersangkutan dan analisis
konseptual konstruk dan merumuskan hubungan antara skor tes dan skor tes-
definisi operasional konstrak, dan tes lain yang dimaksudkan untuk
langkah ketiga adalah melakukan mengukur konstrak yang berbeda dari
analisis tugas, jika terkait dengan yang diukur oleh tes yang
pengukuran yang kompeks dan bersangkutan. Langkah ini akan
diperlukan adanya job analysis untuk memberikan bukti konvergen dan
membantu membuat komponen dan diskriminan. Langkah ketiga adalah
uraian perilaku yang lebih spesifik analisis perbedaan kinerja dalam tes
sesuai dengan komponen tugas. yang sama antara dua atau lebih
kelompok subjek yang diprediksikan
b. Bukti terkait proses respon subjek memang akan berbeda berkat hubungan
Bukti ini didasarkan pada penilaian antara konstrak yang diukur oleh tes
terhadap kesesuaian antara respon yang dan variabel yang mendasari
diberikan oleh subjek dalam rangka pembagian subjek dalam kelompok-
mengerjakan tes dengan konstrak yang kelompok.
diukur oleh tes. Strategi untuk
mengumpulkan bukti ini adalah e. Bukti terkait konsekuensi pengetesan
melakukan observasi terhadap subjek Bukti ini terkait dengan konsekuensi,
saat tes berlangsung atau dampak atau akibat dari proses
mewawancarai subjek untuk administrasi tes terhadap kinerja atau
mengetahui alasan memberikan perilaku subjek. Konsekuensi
jawaban tertentu terhadap pertanyaan- pengetesan ini dibedakan dalam dua

76
PROCEEDING
Seminar Nasional Psikometri

kategori yaitu konsekuensi yang (5) Penekanan yang berlebihan terhadap


direncanakan dan konsekuensi yang aspek tertentu, sehingga terlalu mudah
tidak direncanakan. ditebak kecenderungan dari jawaban
akan menyebabkan menurunnya
tingkat validitas soal.
(6) Kualitas butir tes yang tidak memadai
3. Faktor-faktor yang mempengaruhi untuk mengukur hasil belajar. Kualitas
validitas yang tidak memadai misalnya tes
Faktor-faktor yang mempengaruhi dimaksudkan untuk megukur
validitas suatu alat ukur atau alat tes dapat kemampuan berpikir tingkat tinggi
bersumber pada alat tes itu sendiri dan (higher order thinking) jelas tidak
faktor dari luar. Faktor-faktor yang cukup hanya digunakan tes yang
mempengaruhi validitas antara lain: bersifat untuk mengungkap
a. Faktor dari dalam tes itu sendiri pengetahuan faktual saja.
Pengujian terhadap aitem dalam tes (7) Susunan tes yang jelek.
secara hati-hati akan menunjukkan apakah (8) Tes terlalu pendek.
tes yang digunakan untuk mengukur isi (9) Penyusunan butir tes yang tidak runtut.
materi atau fungsi-fungsi mental yang akan (10) Pola jawaban yang mudah ditebak,
diukur oleh penyusun tes. Bagaimanapun misalnya pada soal pilihan ganda
juga, beberapa faktor berikut dapat menjaga 
 jawabannya adalah A semua, atau B
aitem tes dari fungsi yang dikehendaki dan semua atau menunjukkan pola tertentu
dengan demikian juga terjaga dari misalnya D, C, B, A, D, C, B, A, dan
rendahnya validitas. Berikut hal-hal yang sebagainya.
terkait dengan faktor yang bersumber dari b. Faktor administrasi dan penskoran.
dalam tes itu sendiri: Pemberian skor terhadap jawaban 

subjek (testee) harus dilakukan secara hati-
(1) Petunjuk yang tidak jelas. Petunjuk hati jangan sampai salah tulis atau
yang tidak jelas menyebabkan subjek meremehkan selisih angka walaupun hanya
kehilangan waktu untuk sekedar sedikit. Hal ini akan menyebabkan hasil
memahami petunjuk pengerjaan atau pengujian terhadap validitas akan
bahkan tidak dapat melakukan apa memberikan makna yang berbeda.
yang seharusnya dilakukan. c. Faktor tanggapan subjek.
(2) Penggunaan kosa kata dan struktur Tanggapan subjek yang tidak serius
kalimat yang sulit. Penggunaan kosa biasanya dijumpai pada saat subjek diminta
kata atau struktur kalimat yang sulit untuk mengisi sebuah angket atau skala.
dapat menyebabkan subjek terjebak Hal ini akan menyebabkan subjek mengisi
untuk pemahaman terhadap angket atau skala secara sembarangan
pemahaman maksud dari sebuah karena merasa tidak penting maupun
pertanyaan bukan untuk menyelesaikan alasan-alasan yang lain. Oleh karena itu
pertanyaan itu sendiri. berikan angket/skala pada waktu dan
(3) Ambiguitas yaitu adanya kemungkinan kondisi yang tepat .
multi tafsir juga menyebabkan d. Hakikat kelompok dan kriteria.
menurunnya validitas. Seperti sudah dijelaskan di atas bahwa
(4) Alokasi waktu yang tidak cukup. validitas bersifat spesifik. Sebuah asesmen
Idealnya sebuah tes disediakan waktu atau instrumen alat ukur mungkin hanya
yang cukup untuk mengerjakan seluruh valid untuk kelompok tertentu saja dan
butir tes yang ada. Kekurangan waktu tidak valid untuk kelompok yang lain.
dalam menyelesaikan sebuah tes bisa Sebagai contoh misalnya sebuah tes
jadi bukan karena subjek tidak mampu diujicobakan pada sekelompok subjek pada
untuk menyelesaikan tesnya tetapi sebuah sekolah dengan kualitas biasa-biasa
karena keterbatasan kesempatan untuk saja tentu akan berbeda hasilnya jika tes
mengerjakannya. yang sama diberikan pada sekelompok

77
PROCEEDING
Seminar Nasional Psikometri

subjek pada sekolah yang favorit. seleksi ke dalam bank soal.


Hasil dan kesimpulan analisis terhadap
instrument ISHA adalah sebagai berikut;
C. Implementasi Pengujian Validitas Isi
dan Validitas Kontrak dalam 1. Dimensi Pengalaman Spiritual
Konteks Validitas Interpretasi Skor.
a. Berdasarkan kriteria unidimensi dengan
menggunakan eigen value: (1) Eig-1
Dalam naskah ini, contoh implementasi dibagi total eig > 20% dan (2) Eig-1
pengujian validitas isi dan konstrak dalam dibagi eig 2 >4. Terlihat bahwa 60 item
konteks sebagai validitas interpresasi skor pertama tidak dapat dikatakan sebagai
menggunakan instrumen Indonesia Spiritual unidimensi. Satu common factor utama
Health Assessment (ISHA) yang hanya mampu menjelaskan 11.18% dari
dikembangkan oleh Centre for total variance. Di samping itu eig-1
Neuroscience, Health, and Spirituality (C- dibagi dengan eig-2 nilainya kurang dari
NET) UIN Sunan Kalijaga Yogyakarta. 4.
ISHA disusun berdasarkan 5 dimensi yaitu b. Jika disesuaikan dengan desain yang
(1) pengalaman spiritual, (2) emosi positif, memiliki 6 subdimensi, maka dari EFA
(3) makna hidup, (4) ritual dan (5) terlihat bahwa variance yang mampu
dominansi otak. dijelaskan ada 25.59% Berdasarkan hasil
EFA 6 subdimensi pengalaman spiritual,
Penelitian yang dilakukan melibatkan 60 aitem menjadi 59 (aitem nomoe 25
1000 responden yang terdiri dari 10 kota drop)
besar yang ada di Indonesia yaitu Jakarta, c. Berdasarkan distribusi aitem pada
Bandung, Surabaya, Semarang, rotated component matrix, maka
Yogyakarta, Manado, Manokwari, dilakukan pembentukan variabel baru
Banjarmasin, Pontianak, dan Palembang. berupa sub dimensi pengalaman spiritual
Analisis statistik yang dilakukan adalah 1 sampai 6. Setiap sub dimensi
sebagai berikut; merupakan jumlahan dari response
aitem-aitem yang membentuk sub
1. Exploratory Factor Analysis dan dimensi tersebut.
Confirmatory Factor Analysis d. Selanjutnya dilakukan EFA pada 6
menggunakan SPSS dan Lisrel dengan variabel sub dimensi, dengan hasil
tujuan untuk memperoleh informasi tampak bahwa komponen pertama
tentang uni-dimensionality instrument, mampu menjelaskan 42% variance
kecocokan (fitness) dari model dengan hasil analisis CFA adalah
pengukuran dan rekomendasi model sebagai berikut:
pengukuran yang fit.
2. Analisis butir aitem dengan pendekatan
teori tes klasik dengan menggunakan
Iteman, untuk memperoleh karakteristik
setiap aitem, statistic tes untuk setiap
dimensi, konsistensi internal (alpha
Cronbach) setiap dimensi dan
rekomendasi dalam seleksi aitem.
3. Analisis butir dengan pendekatan
model RASCH dengan software
Winsteps. Analisis dilakukan untuk
memperoleh data distribusi aitem-
responden dalam skala yang sama,
kecocokan aitem dan responden
terhadap model (fitness), skala baku e. Dari hasil analisis CFA di atas tampak
setiap aitem dan rekomendasi dalam bahwa model fit unidimensi diperoleh
jika pengelompokan item pada setiap

78
PROCEEDING
Seminar Nasional Psikometri

subdimensi mengikuti hasil EFA, a. Menyusun 5 variabel baru yang


dengan melakukan korelasi antara error merupakan komposit dari soal-soal yag
subdimensi PS_4 dengan PS_6. menyusun subdimensi ritual yaitu: (1)
melakukan sembahyang, (2) berdoa, (3)
mengunjungi tempat ibadah, (4)
2. Dimensi Emosi Positif bersedekah, dan (5) terlibat dalam
aktivitas/komunitas keagamaan. |
a. Hasil EFA dan CFA dimensi Emosi
Positif adalah sebagai berikut: b. Dari hasil EFA tampak bahwa kelima
subdimensi tersebut bersifat
unidimensi. Selanjutnya analisis CFA
dengan memberikan hasil sebagai
berikut:

b. Berdasarkan hasil CFA tampak bahwa


respons terhadap 60 item yang
menyusun dimensi emosi positif tidak
cocok dengan model satu dimensi,
meskipun setiap subdimensi memiliki c. Hasil CFA menunjukkan bahwa data
factor loading yang baik. FIT bersifat unidimensi jika error
subdimensi melakukan RITUAL_1
(sembahyang) berkorelasi dengan error
3. Dimensi Makna Hidup sub dimensi RITUAL_2 (berdoa) dan
subdimensi RITUAL_5 (terlibat dalam
a. Hasil EFA dan CFA dengan komunitas). Selain itu error sub dimensi
menggunakan 5 faktor: RITUAL_2 (berdoa) juga dikorelasikan
dengan error sub dimensi RITUAL_5
(terlibat dalam komunitas).

4. Dominansi Otak
a. Dari analisis EFA diperoleh component
matrix yang menunjukkan dimensi
dominansi otak terdiri dari 5
komponen. Berdasarkan
pengelompokan item pada EFA,
disusun 5 variabel komposit baru.
b. Kesimpulan: Dimensi makna hidup b. Hasil analisis menggunakan CFA
akan bersifat unidimensi jika error adalahs ebagai berikut:
variance dari MH-1 dan MH-4
dikorelasikan begitu juga dengan error
variance MH-4 dan MH-5

4. Dimensi Ritual

79
PROCEEDING
Seminar Nasional Psikometri

dengan error dimensi OTAK_2, serta


error dimensi OTAK_1 dikorelasikan
dengan error dimensi OTAK_5.

5. Hasil second order CFA menunjukkan


5 dimensi ISHA yaitu pengalaman
spiritual, emosi positif, makna hidup,
ritual dan dominansi otak tidak bersifat
unidimensi, sehingga disarankan hasil
tes ISHA dilaporkan daam 5 sub skor
yang mewakili masing-masing dimensi
Pengalaman Spiritual, Emosi Positif,
Makna Hidup, Ritual dan Dominansi
c. Kesimpulannya adalah model Otak.
pengukuran akan FIT unidimensi jika
error dimensi OTAK_1 dikorelasikan

6. Hasil analisis aitem dengan menggunakan iteman adalah sebagai berikut:

80
PROCEEDING
Seminar Nasional Psikometri

Berdasarkan hasil analisis


menggunakan Iteman, dapat
disimpulkan bahwa terdapat 4 aitem
yang ditolak (gugur) pada dimensi
pengalaman spiritual dan terdapat
catatan untuk melihat kesesuaian kunci
jawaban karena adanya kecurigaan
permasalahan isi dari aitem. Pada
dimensi emosi positif terdapat 4 aitem
yang gugur dan pada dimensi makna
hidup gugur 1 aitem, sedangkan pada
dimensi ritual terdapat 16 aitem yang
gugur dan pada aitem nomor 22 perlu
dilakukan pengecekan kesesuaian kunci
jawaban dan pada dimensi dominansi
otak hanya 1 aitem yang gugur dengan
adanya kecurigaan terhadap kesesuaian b. Dimensi Emosi Positif
kunci jawaban. Jumlah aitem yang
gugur adalah 26 dan jumlah aitem yang
diterima sebanyak 277 dari 303 aitem
yang dibuat.

7. Hasil analisis aitem dengan


menggunakan model RASCH adalah
sebagai berikut:
a. Dimensi Pengalaman Spiritual

c. Dimensi Makna Hidup

81
PROCEEDING
Seminar Nasional Psikometri

e. Dimensi Dominansi Otak

d. Dimensi Ritual

Hasil analisis aitem dengan menggunakan model RASCH adalah sebagi berikut:

Berdasarkan hasil analisis aitem terdapat 2 aitem yang misfit pada


dengan menggunakan pendekatan dimensi ritual yaitu aitem nomor 7 dan
RASCH, dapat disimpulkan bahwa 22, sedangkan pada dimensi

82
PROCEEDING
Seminar Nasional Psikometri

pengalaman spiritual, emosi positif, 4. Hasil pengujian validitas konstrak


makna hidup dan dimensi dominansi dengan menggunakan model
otak semua aitem mempunyai model fit RASCH menunjukkan bahwa
dengan model pengukuran yang ITEM Measure (skala aitem)
disusun. Dari sisi responden diketahui berlaku sebagai karakteristik aitem
terdapat beberapa responden yang yang menjadi dasar dalam estimasi
misfit, hal ini menunjukkan adanya bias PERSON Measure
pada responden.

Daftar Pustaka

D. Simpulan
Berdasarkan hasil analisis
pengujian validitas interpretasi skor tes American Educational Research
yang dihasilkan maka simpulan yang Association, American Psychological
dapat diambil terkait dengan Association, & National Council on
penggunaan ISHA sebagai alat ukur Measurement in Education. (1999).
yang bertujuan untuk mengukur Standards for educational and
kesehatan spiritualitas adalah sebagai psychological testing. Washington,
berikut; DC: Author

1. Dari sisi validitas isi dan konstrak Azwar, S (2013). Reliabilitas dan validitas-
menunjukkan bahwa isi dan edisi 4. Yogyakarta: Pustaka Pelajar
konstrak penyusunan ISHA sesuai
dengan konseptualisasi teori yang Cronbach, L. J., & Meehl, P. E. (1955).
digunakan dan definisi Construct validity in psychological
operasionalnya yaitu dengan model tests. Psychological Bulletin, 52, 281-
5 dimensi dan bersifat multidimensi 302.
artinya penggunaan hasil tes ISHA Goodwin, L.D. & Leech, N.L. (2003). The
tidak dalam bentuk skor total tetapi meaning of validity in the new
mengacu pada masing-masing standards for educational and
dimensi sehingga fungsi psychological testing: Implications for
pengukuran ISHA tepat sebagai measurement courses. Measurement
salah satu alat ukur yang akan and Evaluation in Counselin and
menghasilkan profil kesehatan Development, 36, 181-191.
spiritual seseorang.
2. Penyusun alat ukur perlu Linn, R.L, Grondlund, N.E. (2000).
melakukan check terhadap Measurement and assessment in
beberapa aitem berdasarkan teaching. Eighth edition. New Jersey:
informasi hasil analisis Merril an imprint of Prentice Hall.
pemeriksaan analisis aitem.
3. Seleksi aitem berdasarkan output Messick, S. J. (1995). Validity of
Iteman maupun model RASCH psychological assessment: Validation
menunjukkan aitem-aitem yang of inferences from persons' responses
berkualitas dari sisi indek daya and performances as scientific inquiry
beda yang memenuhi syarat untuk into score meaning. American
dimasukkan ke dalam bank soal Psychologist, 50(9), 741-749.

83

Anda mungkin juga menyukai