Anda di halaman 1dari 3

Validitas

Validitas merupakan pertimbangan terpenting dalam mengembangkan dan mengevaluasi alat


ukur. Secara historis, validitas didefinisikan sebagai sejauh mana suatu instrumen mengukur
apa yang diklaimnya diukur. Fokus pandangan terkini tentang validitas bukan pada instrumen
itu sendiri tetapi pada interpretasi dan makna skor yang diperoleh dari instrumen tersebut.
American Educational Research Association, the National Council on Measurement in
Education, dan American Psychological Association, mendefinisikan validitas sebagai
“sejauh mana bukti dan teori mendukung interpretasi skor tes yang disyaratkan oleh
penggunaan tes yang diusulkan”. Validitas tidak berjalan dengan instrumen. Sebuah tes
mungkin valid untuk
digunakan dengan satu populasi tetapi tidak dengan yang lain. Menilai validitas interpretasi
berbasis skor penting bagi peneliti karena sebagian besar instrumen yang digunakan dalam
penyelidikan pendidikan dan psikologis dirancang untuk mengukur konstruksi hipotetis.

Validasi
Proses pengumpulan bukti untuk mendukung (atau gagal mendukung) interpretasi tertentu
dari nilai tes disebut sebagai validasi. Kami membutuhkan bukti untuk menetapkan bahwa
kesimpulan, yang dibuat berdasarkan hasil tes, adalah tepat. Sejumlah penelitian mungkin
diperlukan untuk membangun bukti tentang validitas interpretasi berbasis skor ini. Standards
for Educational and Psychological Testing mendaftarkan tiga kategori bukti yang digunakan
untuk menetapkan validitas interpretasi berbasis skor, yaitu: : (1) evidence based on content,
(2) evidence based on relations to a criterion, dan (3) construct-related evidence of
validity. Menggunakan kategori-kategori ini tidak berarti bahwa ada jenis validitas yang
berbeda tetapi, sebaliknya, bahwa berbagai jenis bukti dapat dikumpulkan untuk mendukung
tujuan penggunaan tes. Kategori-kategori ini saling melengkapi dan semua sangat penting
untuk konsep kesatuan validitas.
1. Evidence Based on Test Content
Bukti berdasarkan konten tes, melibatkan isi tes dan hubungannya dengan konstruk
yang ingin diukur. peneliti harus mencari bukti bahwa tes yang akan digunakan
mewakili sampel yang seimbang dan memadai dari semua pengetahuan, keterampilan,
dan dimensi yang relevan yang membentuk domain konten. Validasi tes prestasi,
misalnya, akan mempertimbangkan kesesuaian konten tes dengan total area konten
yang akan diukur serta seberapa memadai sampel uji domain total. Seseorang tidak
akan mencoba mengukur pengetahuan siswa kimia tentang oksidasi, misalnya, hanya
dengan dua pertanyaan.

2. Evidence Based on Relations to a Criterion


Bukti validitas terkait kriteria, mengacu pada sejauh mana skor tes secara sistematis
terkait dengan satu atau lebih kriteria hasil. Penekanannya adalah pada kriteria karena
seseorang akan menggunakan skor tes untuk menyimpulkan kinerja pada kriteria
tersebut. Secara historis, dua jenis bukti validitas terkait kriteria telah dibedakan:
concurrent (bersamaan) dan predictive (prediktif). Perbedaan dibuat berdasarkan
waktu pengumpulan data kriteria.

3. Construct-Related Evidence of Validity


Bukti validitas terkait konstruksi, berfokus pada skor tes sebagai ukuran konstruksi
psikologis. Sejauh mana skor tes mencerminkan teori di balik konstruksi psikologis
yang diukur? Ingatlah bahwa konstruksi psikologis seperti kecerdasan, motivasi,
kecemasan, atau pemikiran kritis adalah kualitas atau karakteristik hipotetis yang
telah "dibangun" untuk menjelaskan perilaku yang diamati. Prosesnya dimulai dengan
pendefinisian konstruk berdasarkan teori dan penelitian sebelumnya. Pengembang tes
kemudian menentukan aspek konstruk yang akan diukur dalam tes dan
mengembangkan item yang membutuhkan peserta tes untuk menunjukkan perilaku
yang mendefinisikan konstruk. Bukti terkait konstruksi lebih komprehensif daripada
bukti terkait konten dan kriteria dan menggolongkan jenis lainnya. Secara umum,
setiap informasi yang menjelaskan konstruksi yang diukur adalah relevan.

Reliabilitas

Reliabilitas dari suatu alat ukur adalah derajat konsistensi dengan apa alat itu mengukur
apapun yang diukurnya. Kualitas ini sangat penting dalam setiap jenis pengukuran. Pada
tingkat teoretis, reliabilitas berkaitan dengan pengaruh kesalahan pada konsistensi
skor. Di dunia ini pengukuran selalu melibatkan beberapa kesalahan. Ada dua jenis
kesalahan:
kesalahan pengukuran acak dan kesalahan sistematis pengukuran. Kesalahan acak adalah
kesalahan yang disebabkan oleh kebetulan murni. Kesalahan pengukuran acak dapat
meningkatkan atau menekan skor mata pelajaran apa pun dengan cara yang tidak terduga.
Kesalahan sistematis, di sisi lain, meningkatkan atau menekan skor kelompok yang dapat
diidentifikasi dengan cara yang dapat diprediksi. Kesalahan sistematis adalah akar dari
masalah validitas; kesalahan acak adalah akar dari masalah reabilitas.

Sumber kesalahan random (acak) reliabilitas


Peluang atau kesalahan acak yang menyebabkan inkonsistensi dalam skor dapat berasal dari
tiga sumber:
1. The individual being measured may be a source of error (individu yang diukur dapat
menjadi sumber kesalahan).
2. The administration of the measuring instrument may introduce error (administrasi
alat ukur dapat menimbulkan kesalahan).
3. The instrument may be a source of error (instrumen mungkin menjadi sumber
kesalahan).

Jika sebuah tes terlalu mudah dan semua orang tahu sebagian besar jawabannya, skor relatif
siswa sekali lagi hanya bergantung pada beberapa pertanyaan dan keberuntungan merupakan
faktor utama. Jika pertanyaannya ambigu, peserta ujian yang "beruntung" merespons dengan
cara yang diinginkan oleh penguji, sedangkan subjek yang "tidak beruntung" menjawab
dengan cara lain yang sama benarnya, tetapi jawaban mereka dinilai salah.

Anda mungkin juga menyukai