PENDAHULUAN
Validitas empiris dapat dibedakan lagi atas dua macam yaitu: (a) validitas
kongkuen (concurrent validity), dan (b) validitas prediktif (predictive
validity).
1) Validitas Isi
Validitas isi suatu tes mempermasalahkan seberapa jauh suatu tes
mengukur tingkat penguasaan terhadap isi suatu materi tertentu yang
seharusnya dikuasai sesuai dengan tujuan pengajaran.
Menurut Gregory. (2000) dalam Djaali, Mujiono. (2008: 50)
mengemukakan bahwa, validita isi menunjukkan sejauh mana
pertanyaan, tugas atau butir dalam suatu tes atau instrumen mampu
mewakili secara keseluruhan dan proporsional perilaku sampel yang
dikenai tes tersebut. Artinya tes mencerminkan keseluruhan konten atau
materi yang diujikan atau yang seharusnya dikuasai secara
proporsional.
Untuk mengetahui tes itu valid atau tidaak harus dilakukan melalui
penelaahan kisi-kisi tess untuk memastikan bahwa soal-soal tes itu
sudah mewakili atau mencerminkan keseluruhan konten atau materi
yang seharusnya dikuasai secara proposional. Oleh karena itu, validitas
isi atau tes tidak mempunyai besaran tertentu yang dihitung secara
statistika, tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah
kisi-kisi tes.
Wiersma dan Jurs. (1990) dalam Djaali, Mujiono. (2008:50).
Menyatakan bahwa validitas isi sebenarnya mendasarkan pada analisis
logika, jadi tidak merupakan suatu koefisien validitas yang dihitung
secara statistika.
2) Validitas Konstruk
Djaali, Mujiono. (2008:51). Menyatakan bahwa, validitas konstruk
(contruct validity) adalah validitas yang mempermasalahkan seberapa
jauh item-item tes dengan konsep khusus atau definisi konseptual yang
telah ditetapkan. Untuk menentukan validitas konstruk suatu instrumen
validitas konstruk suatu instrumen harus dilakukan proses penelaah
toritis dari suatu konsep dari variabel yang hendak diukur, mulai dari
perumusan konstruk, penentuan dimensi dan indikator, sampai kepada
penjabaran dan penulisan butir-butiritem instrumen.
Djaali, Mujiono. (2008:51-52). Mengemukakan bahwa dimensi
dan indikator dijabarkan dri konstruk yang telah dirumuskandengan
memperhatikan hal-hal sebagai berikut:
a. Seberapa jauh indikator dijaarkan dari konstruk yangg telah
dirumuskan.
b. Indikator-indikator tersebut harus lengkap untuk mengukur konstruk
dari varabel yang hendak diukur.
c. Indikator-indikator tersebut harus lengkap untuk mengukur suatu
konstruk secara utuh.
a. Koefisien Stabilitas
Koefisien stabilitas (coefficient of stability) adalam jenis reliabilitas
yang menggunakan teknik test dan retest, yaitu memberikan tes
kepada sekelompok individu, kemudian diadakan pengulangan tes
pada kelompok yang sama dengan waktu yang berbeda. Cara
memperoleh kofisien stabilitas adalah dengan mengorelesasikan
hasil tes pertama dengan hasil tes yang kedua dari kelompok yang
sama
b. Bentuk yang Ekuivalen
Tes ekuivalen itu biasa diselenggarakan, dan tiap cara akan
memunculkan suatu nilai reliabiilitas, yang semuannya mungkin saja
tidak sama. Dengan menggunakan tes ysng sama yang
diselenggarakan pada dua waktu berbeda, dengan metode tes- retes-
tepat hanya apabila bisa diasumsiikan bahwa terdapat sedikit saja
atau tidak ada bawaan dari suatu pengetesan satu lainnya. Para
peserta tes mungkin saja, disadari atau tidak, mengingat jawaban-
jawaban mereka untuk soal-oal dalam tes, karena ingatan yang akan
memberikan nilai tinggi yang keliru pada reliabilitas yang di ukur,
dan mungkin saja peserta tes belajar tentang soal-soal tertentu
diantara dua penyelenggaraan tes. Jenis pengukuran ini barangkali
lebih sesuai dalam assesment skill-skill motor dari pada dalam lahan
matematika.
c. Reliabilitas SPLIT-HALF
Menstmulasi efek ini dengan membagi tes yang diberikan ke dalam
dua bagian dan memperlakukan ini sebagai tes-tes ekuivalen. Salah
satu metode yang lebih lazim untuk melakukan ini yaitu
mengkorelasikan skor-skor pada soal-soal bernomor genap dengan
yang bernomor ganjil. Metode ganjil genap ini pada Reliabilitas
suatu ujian merupakan konsistensi tes itu dalam mendapatkan hasil-
hasilnya.semua pengukuran tunduk pada tingkat-tingkat galat (error)
yang tertentu. Pada pengukuran tinggi badan terdapat standart yang
di sepakati yang bisa dijadikan acuan untuk semua pengukuran,
dalam mengukur kemampuan-kemampuan tidak terdapat
kesepakatan seperti itu, diantara perkara-perkara saat ini berarti
bahwa membicarakan klaim reliabilitas yang tunggal dari suatu tes
adalah hal yang tidak bermakna. Apa yang bisa diukur adalah
reliabilitasnya saat diterapkan pada jenis siswa tertentu yang telah
dilatih dalam matematika dalam suatu cara yang tertentu.
Jadi dapat di simpulkan suatu upaya mempermudah
penyelenggaraan dan tidak semestinnya diambil jika mungkin
diberlakukan metode yang lain. Lebihlah pantas kita lakukan upaya
sadar yang diperlukan untuk memilah tes ke dalam dua bagian yang
akan diseimbangkan sebisa mungkin sehubungan dengan kemampuan-
kemampuan yang diuji, tingkat kesukaran soal-soal, serta cakupan
silabus.
d. Panjang Tes (length of test). Panjang tes berarti banyaknya soal tes.
Ada kecenderungan, semakin panjang suatu tes akan lebih tinggi
tingkat reliabilitas suatu tes, karena semakin banyak soal, maka akan
semakin banyak sampel yang diukur dan proporsi jawaban yang benar
semakin banyak, sehingga faktor tebakan (guessing) akan semakin
rendah.
e. Sebaran Skor (spread of scores). Besarna sebaran skor akan membuat
tingkat reliabilitas menjadi lebih tinggi, karena koefisien reliabilitas
yang lebih besar diperoleh ketika peserta didik tetap pada posisi yang
relatif sama dalam satu kelompok pengujian ke pengujian berikutnya.
Dengan kata lain, peluang selisih dari perubahan posisi dalam
kelompok dapat memperbesar koefisien reliabilitas.
f. Tigkat Kesukaran (difficulty indeks). Dalam penilaian yang
menggunakan pendekatan peniaian acuan norma. Baik untuk soal yang
mudah maupun yang sukar, cenderung menghasilkan tingkat
reliabilitas yang rendah. Hal ini disebabkan antara hasil tes yang
mudah dengan hasil tes yang sukar keduannya dalam satu sebaran skor
yang terbatas. Untuk tes yang mudah skor akan berada di atas dan
akhir dari skala penilaian. Bagi kedua tes (mudah dan sukar) perbedaan
antara peserta didik kecil sekali dan cenderung tidak dapat dipercaya.
Tingkat kesukaran soal yang ideal untuk meningkatkan koefisien
reliabilitas adalah soal yang menghasilkan sebaran skor berbentuk
genta atau kurva normal.
g. Objektivitas (obyektivity), objektivitas disini menunjukkan skor tes
kemampuan yang sama antara peserta didik yang satu dengan peserta
didik yang lainnya. Peserta didik memperoleh hasil yang sama dalam
mengerjakan suatu tes. Jika peserta didik memiliki tingkat kemampuan
yang sama, maka akan memperoleh hasil tes yang sama dalam
mengerjakan tes yang sama. Objektivitas prosedur tes yang tinggi akan
memperoleh reliabilitas hasil tes yang tidak dipengaruhi oleh prosedur
persekoran.
C. Analisis Pengecoh