Anda di halaman 1dari 8

VALIDITAS

Suatu alat evaluasi disebut valid (abash atau sahih) apabila alat tersebut
mampu mengevaluasi apa yang seharusnya dievaluasi. Oleh karena itu keabsahannya
tergantung pada sejauh mana ketetapan alat evaluasi itu dalam melaksananakan
fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika ia dapat
mengevaluasi dengan tepat sesuatu yang dievaluasi.
Macam-macam validitas
Alat evaluasi yang valid untuk satu tujuan tertentu belum tentu valid untuk
tujuan (karakteristik) lain. Dengan kata lain validitas (keabsahan, ketepatan) dari
suatu alat evaluasi harus ditinjau dari karakteristik tertentu. Oleh karena itu untuk
menentukan validitas suatu alat evaluasi hendaklah dilihat dari berbagai aspek,
diantaranya validitas muka (face calidity), validitas konstruksi (construct validity),
validitas ramal (predictive validity), dan validitas banding (concurrent validity),
semua macam validitas di atas dapat dikelompokan ke dalam dua jenis berdasarkan
pelaksanaannya, yaitu validitas logic (teoritik) dan validitas emperik.
Secara diagram dapat digambarkan sebagai berikut

Validitas

Validitas Teoritik Validitas


(logic) Empirik
Kriterium

Validitas
Validitas isi Validitas Validitas
Konstruksi
Banding Ramal

Validitas
Muka
1. Validitas Teoritik
Validitas teoritik atau validitas logic adalah validitas alat evaluasi yang dilakukan
berdasarkan pertimbangan (judgement) teoritik atau logika. Hal ini dimaksudkan
bahwa untuk mempertimbangkan suatu alat evaluasi berdasarkan alat evaluator. Agar
hasil pertimbangan tersebut memadai sebaiknya dilakukan olaeh para ahli atau orang
yang dianggap ahli untuk hal itu, minimal orang yang berpengalaman dibidangnya.
Hal yang dipertimbangkan adalah dalam rangka menjawab pertanyaan-pertanyaan
seperti apakah konsep-konsep atau materi yang terkandung dalam soal itu sudah
benar? Apakah sudah sesuai dengn TIK, GBPP atau buku sumber? Apakah
penggunaan bahasa dan susunan kalimat dalam soal itu dapat dipahami oleh peserta
uji (testi), sehingga tidak menimbulkan salah tafsir, apakah aspek psikologik yang
terdapat dalam soal tersebut tidak mengganggu emosi si teruji sehingga jawaban
menjadi bias? Jika pertanyaan-pertanyaan diatas sudah terjawab dengan baik dan
terpenuhi, maka validitas teoritik alat evaluasi tersebut bisa dikatakan baik. macam-
macam validitas teoritik

a. Validitas isi (content validity)


Validitas ini suatu alat evaluasi artinya ketepatan alat tersebut ditinjau
dari segi materi yang dievaluasikan, yaitu materi atau (bahan) yang dipakai
sebagai alat evaluasi tersebut juga merupakan sampel representative dari
pengetahuan yang harus dikuasai.
Suatu tes matematika dikatakan memiliki validitas isi apabila dapat mengukur
TIK yang telah dirumuskan. ini berarti bahan tersebut sesuai dengan TIU-nya,
GBPP dan buku sumber serta kegiatan belajar mengajar yang telah
dilaksanakan. Kebenaran konsep dari materi yang disajikan dalam soal tes
termasuk pula hal yang dipehatikan dalam mempertimbangkan validitas isi
ini. Oleh karena itu validitas isi suatu alat evaluasi (dalam hal ini tes) disebut
pula validitas kurikuler.
Pembuktian kisi-kisi (blue print) yang berisi pokok dan sub pokok
bahasan, jenjang kognitif, tingkat kesukaran, serta pembuatan format
penulisan soal yang merupakan matriks yang menyatakan kaitan antara
pokok/sub pokok bahasan, jenjang kognitif,TIK dan butir soal dimaksudkan
agar validitas isi alat evaluasi yang disusun dapat terjamin.
Deengan menggunakan kisi-kisi dan format penulisan soal, keseluruhan soal
yang disajikan dalam alat evaluasi tersebut akan merupakan sampel yang
representative dari pengetahuan siswa yang akan diuji. Di samping itu akan
dijamin pula sampel yang berlapis dari populasinya, yaitu sampel yang
diambil dari berbagai bagian bahan pelajaran. Sampel tersebut mewakili unt
aljabar, unit Geometri, Unit Aritmatika, atau unit lainnya yang tidak
bertumpuk, p0ada satu unit saja. Apabila soal evaluasi tersebut tersusun dari
bahan-bahan di luar materi yang diajarkan, maka soal tersebut tidak valid
menurut validitas isi.
Agar soal yang memiliki validitas isi yang baik, haruslah memperhatikan hal-
hal berikut ini.
1. Bahan evaluasi merupakan sampel representative untuk mengukur
seberapa jauh tujuan (TIK dan TIU) dapat tercapai, baik ditinjau dari
materi yang diajarkan maupun dari segi tingkat proses belajar.
2. Titik berat bahan yang diujikan harus berimbang dengan titik berat bahan
dalam kurikulum (GBPP), sesuai dengan alokasi waktu yang disediakan
untuk menyajikan dalam kegatan belajar-mengajar.
3. Untuk mengerjakan evaluasi trersebut tidak diperlukan pengetahuan lain
yang tidak relevan atau bahan yang belum diajarkan.

b. Validitas muka (face validity)


Validitas muka suatu alat evaluasi disebut pula validitas bentuk soal
(pertanyaan – pernyataan suruhan )atau validitas tampilan ,yaitu keabsahan
susunan kalimat atau kata – kata dalam soal sehingga jelas pengertiannya atau
tidak menimbulkan tafsiran lain .apabila suatu soal tidak dapat atau sulit
dipahami maksudnya sehingga testi tidak bisa menjawabnya dengan baik ,ini
berarti validitas mukanya tidak baik , disini ia bukan tidak bisa menjawab soal
tersebut dengan baik namun soalnya yang kurang dapat dipahami dengan baik
.selain itu soal tes kurang bersih tulisan terlalu berdesakan ,tanda baca atau
notasi lain mengenai hasil uji kurang jelas atau salah ,akan mengurangi
validitas muka alat evaluasi .Jadi validitas muka suatu alat evaluasi
menyangkut keabsahan(kebaikan) penyajian alat evaluasi tersebut berkenaan
dengan tampilan (kulit luar - wajah)-nya .belum sampai menyangkut materi
bahan uji itu sendiri .ibarat seseorang melihat lawan jenisnya yang tampak
cakep (ganteng – cantik ),kulitnya mulus dan bersih ,pakaiannya bersih
sehingga menarik perhatian dan pendapat bahwa orang itu baik.padahal isi
(jiwa ,karakter,perilaku) dari orang itu belum diketahui.
Pada umumnya alat evaluasi yang mempunyai validitas isi yang baik
,validitas mukanya pun baik pula ,tetapi tidak sebaliknya
c. Validitas konstruksi psikologik (constract validity)
Istilah kontruksi (constract) dalam pengertian ini bukan berarti
susunan seperti yang sering dijumpai dalam bidang konstruksi ,tetapi
berkenaan dengan aspek psikologik. Pada umumnya alat evaluasi yang sering
menyangkut validitas konstruksi ini berkenaan dengan aspek sikap
,kepribadian ,motivasi ,minat ,bakat. Jadi berupa evaluasi non – tes
Alat evaluasi yang berkenaan dengan aspek – aspek diatas penyusunannya
(kalimat yang dikemukakan)sekali – kali jangan menyinggung emosi
responden atau orang lain yang ada kaitannya dengan evaluasi tersebut .selai
hasil evaluasi akan bias ,kemungkinan hal – hal yang tidak diinginkan akan
muncul
Berikut ini disajikan sebuah contoh butir evaluasi yang sebaikknya tidak
disajikan karena validitas konstruksinya kurang baik ,sehingga dapat
menyinggung emosi atau mental (psikologik )responden atau orang lain
Salah satu penyebab saya tidak berhasil dalam belajar matematika karena
tulisan gurunya jelek sehingga tidak dapat dipahami
a. Benar sekali
b. Ada benarnya
c. Tidak benar
d. Tidak benar sama sekali
Bila suatu evaluasi dimaksudkan untuk mengukur sifat – sifat atau
kemampuan psikologik seseorang maka evaluasi itu harus mempunyai
keabsahan konstruksi psikologik .hal – hal yang termasuk konstruksi
psikologik seperti kepribadian ,intelejensi ,bakat ,berpikir kritik ,kekuatan rasa
diri ,motivasi (Frans Susilo, 1982:44). Faktor – factor psikologik ini sukar
diukur secara langsung ,tetapi dapat diukur secara tidak langsung yaitu dengan
menganalisis arti dari hasil evaluasi itu melalui unsure- unsure psikologik
yang akan diukur .unsur – unsur konstruksi psikologik tadi sebagai kreteria
,biasanya diperoleh dari pengamatan empirik atau bahkan berdasarkan rekaan
dari sejumlah ahli psikologi (psikolog). Oleh karena itu validitas konstruksi
psikologik ini disebut juga dengan validitas rekaan . keabsahan konstruksi
psikologi ini hanya berlaku untuk unsure psikologik yang akan dievaluasi
,tidak berlaku unsure lainnya kecuali apabila unsure – unsure itu mempunyai
kolerasi yang tinggi
Misalnya seseorang ingin mengukur intelegensi. Langkah yang
ditempuh ialah dengan mengukur kecepatan reaksi atau daya ingatnya .ini
berarti bahwa reaksi atau daya ingat tersebut disepakati sebagai berhubungan
erat dengan tingakt intelegensi seseorang , dalam hal ini reaksi atau daya ingat
berfungsi sebagai indicator dari intelegensi atau rekaan untuk intelegensi
melalui kecepatan reaksi dan daya ingat .setelah diteliti lebih lanjut ,ternyata
bahwa rekaan tersebut tidak benar karena kedua hal tersebut tidak mempunyai
kolerasi yang cukup kuat .dengan demikian haruslah dicari indicator lain
sehingga hasil pengukurannya mencerminkan intelegensi seseorang .
Mengenai validitas konstruksi ini ada pendapat lain yaitu mengartikan
validitas susun .hal ini dimaksudkan bahwa alat evaluasi itu harus dapat
dengan cepat mengevaluasi karakteristiktertentu yang akan dievaluasi
itu.contohnya kalau kita akan membuat tes matematika untuk mahasiswa
fakultas ekonomi ,soal – soal matematika itu harus diusahakan memuat
masalah ekonomi .soal untuk calon pilot pesawat terbang harus memuat
masalah kedirgantaraan .soal matematika untuk calon dokter harus memuat
masalah kesehatan dan sebagainya sebaliknya jika soal matematika untuk
calon mahasiswa ekonomi banyak masalah teknik,pertanian ,atau kesehatan
maka soal tersebut validitas konstruksinya tidak baik,jadi validitas konstruksi
dapat dikatakan sebagai kesesuaian materi dlam alat evaluasi itu dengan
tujuan evaluasi yang bersangkutan
2. validitas kriterium (criterion related validity)
Validitas kriterium atau lengkapnya validitas berdasarkan criteria atau
validitas yang ditinjau dalam hubungannya dengan kriterium tertentu .validitas ini
diperoleh dengan melalui observasi atau pengalaman yang bersifat empiric ,kriterium
itu dipergunakan untuk menentukan tinggi – rendahnya koefisien validitas alat
evaluasi yang dibuat melalui perbandingan korelasi
Ada dua macam validitas yang termasuk kedalam validitas kreterium ini ,yaitu :
a). validitas banding (concurrent validity)
validitas banding sering disebut dengan validitas bersama atau
validitas yang ada sekarang .validitas ini kriteriumnya terdapat pada waktu
yang bersamaan dengan alat evaluasi yang diselidiki validitasnya atau hamper
bersamaan .biasanya dilakukan terhadap subjek yang sama .misalnya alat
evaluasi yang diselidiki validitasnya adalah tes matematika buatan guru ( kita
) dengan menggunakan kriterium nilai rata – rata harian atau tes sumatif yang
telah ada dengan asumsi hasil evaluasi yang digunakan untuk kriterium itu
telah mencerminkan kemampuan siswa sebenarnya .hal ini dilakukan
berhubung tes matematika yang telah dibakukan belum ada .kedua tes itu
diberikan kepada subjek (siswa) yang sama . apabila kedua nilai atau skor itu
berkolerasi tinggi .maka tes yang dibuat itu memiliki validitas yang tinggi
pula .sebaliknya apabila tidak terdapat kolerasi atau korelasinya rendah maka
tes yang dibuat mempunyai validitas yang jelek .
b). validitas ramal (predictive validity)
Memprediksi artinya meramalkan berkenaan dengan hal yang
akandatan berdasarkan kondisi yang sekarang
Sebuah alat evaluasi dikatakan memiliki validitas prediksi yang baik
jika ia mempunyai kemampuan untuk meramalakan hal – hal yang akan
terjadi di masa yan akan datang
Tes masuk perguruan tinggi negeri (UMPTN) dahulu lebih dikenal dengan
sebutan sipenmaru (seleksi penerimaan mahasiswa baru) adalah sebuah tes yang
diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti
perkuliahan di perguruan tinggi yang dimasukinya. Calon yang lulus tes tersebut
diharapkan mencerminkan tinggi rendahnya kemmpuan mengikuti perkuliahan jika
hasil tesnya tinggi akan dijamin keberhasilannya kelak setelah ia diterima
diperguruan tinggi tersebut demikian pula sebaliknya jika hasil tesnya rendah dan
tidak lulus maka akan diperkirakan ia tidak akan mampu mengikuti program
perkuliahan yang akan ditempuhnya .
Demikian pula pada tes penerimaan siswa baru di SLTP dan SLTA yang
menggunakan nilai ebtanas murni (NEM). Calon siswa yang memiliki NEM tinggi
diterima menjadi siswa SLTP atau SLTA yang bersangkutan .siswa tersebut
diramalkan mampu untuk mengikuti pelajaran dengan baik disekolah baru yang
diminatinya
Untuk menentukan validitas prediksi tersebut digunakan alat pembanding
berupa nilai – nilai yang diperoleh dari hasil perkuliahan .jika nilai tes masuk dan
nilai hasil perkuliahan berkorelasi tinggi ,berarti validitas prediksi tes masuk tersebut
tinggi ,sebaliknya jika berkolerasi rendah atau sama sekali tidak berkorelasi bahkan
berkorelasi negative .ini berarti validitas prediksi alat evaluasi tersebut jelek .begitu
pun dengan system NEM pada penerimaan siswa baru di SLTP dan SLTA jika hasil
belajar siswa disekolah bersangkutan berkolerasi tinggi dengan NEM –nya maka
ebtanas tersebut sebagai alat evaluasi atau tes mempunyai validitas prediksi yang baik
.sampai saat ini belum ada yang meneliti tentang baik tidaknya validitas ramal keduan
alat evaluasi tersebut ,sehingga kedua system penerimaan mahasiswa baru dan siswa
baru itu masih tetap dipakai .disamping itu belum ada pula sistem lain yang dapat
dipakai yang diperkirakan lebih baik

Anda mungkin juga menyukai