Validitas Dan Reliabilitas

Anda mungkin juga menyukai

Anda di halaman 1dari 4

Kualitas Alat Evaluasi

Validitas
Validitas (kesahihan) adalah kualitas yang menunjukkan hubungan antara suatu pengukuran
dengan arti atau tujuan kriteria belajar atau tingkah langku. Beberapa kriteria dapat dipilih
untuk memperlihatkan keefektifan dalam mengukur performance yang akan datang (yang
akan terjadi), kriteria yang lain menunjukkan status yang muncul, kriteria yang lain untuk
menimbulkan sifat-siat yang representatif dari luasnya isi atau tingkah laku, dan kriteria yang
lain lagi untuk (melengkapi) penyediaan data untuk menunjang atau menolak beberapa teori
psikologis. Sehingga suatu teknik evaluasi dikatakan memiliki validitas yang tinggi jika
teknik evaluasi atau tes dapat mengukur apa yang sebenarnya akan diukur.
Jenis-jenis validitas:
1. Content validity
Suatu tes dikatakan memiliki content validity jika scope dan isi kurikulum sudah
diajarkan. Isi tes sesuai dengan atau mewakili sampel hasil-hasil belajar yang
seharusnya dicapai menurut tujuan kurikulum.
2. Construct validity
Untuk menentukan adanya construct validity, suatu tes dikorealsikan dengan suatu
konsepsi atau teori. Item dalam tes itu harus sesuai dengan ciri-ciri yang disebutkan
dalam konsepsi tadi, yaitu konsepsi tentang objek yang akan di tes dengan kata lain
hasil-hasil tes itu disesuaikan dengan tujuan atau ciri-ciri tingkah laku (domain) yang
hendak diukur.
3. Predictive validity
Suatu tes dikatakan predictive validity jika hasil korelasi tes itu dapat meramalkan
dengan tepat keberhasilan seseorang dengan masa mendatang didalam lapangan
tertentu.
4. Concurrent validity
Jika hasil suatu tes mempunyai korelasi yang tinggi dengan hasil suatu alat ukur lain
tehadap bidang yang sama pada waktu yang sama maka tes itu memiliki concurrent
validity.

Cara menentukan validitas


Ada dua macam tes dalam evaluasi, yaitu tes standar(tes baku) dan tes buatan guru. Soal-
soal tes standar memiliki kualitas baik, karena telah diuji coba, dianalisis, serta direvisi.
Sedangkan tes buatan guru umumnya tak diuji coba, dianalisis, maupun direvisi karena
beberapa alasan tertentu. Oleh karena itu dapat dilakukan uji validitas.
Untuk menentukan validitas dengan cara menguji validitas setiap butir soal maka skor-skor
yang ada pada butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal
dinyatakan skor X dan skor total dinyatakan sebagai skor Y, dengan diperolehnya indeks
validitas setiap butir soal, dapat diketahui butir-butir soal manakah yang memenuhi syarat
dilihat dari indeks validitasnya, maka dapat diketahui butir- butir soal yang valid maupun
tidak valid.
Adapun rumus untuk mencari validitas suatu soal, sebagai berikut :

Keterangan :
Rxy =  koefisien validitas butir soal
N = bnayaknya peserta
∑xy = jumlah (skor tiap soal * skor total) 
∑x2 = jumlah kuadrat tiap soal
∑x = jumlah skor tiap soal
∑y2 = jumlah kuadrat soal
∑y = jumlah skor total

Lalu menentukan Ttabel dengan menggunakan rumus berikut :


Ttabel = TINV (0,05(n-2) (menggunakan excel)

Bandingkan nilai koefisien validitas dengan nilai koefisien korelasi Pearson / tabel
Pearson (r-tabel) pada taraf signifikansi a (biasanya dipilih 0,05) dan n = banyaknya
data yang sesuai.

Kriterianya adalah :

 Instrumen valid, jika r-hitung ≥ r-tabel 


 Instrumen tidak valid, jika r-hitung < r-tabel

Hasil analisis data dalam menentukan koefisien validitasnya selanjutnya dicocokan


dengan kriteria validitas dari alat evaluasi tersebut, yaitu:

Koefisien validitas Kriteria


0,80 - 1,00 Sangat tinggi
0,60 - 0,80 Tinggi
0,40 - 0,60 Sedang
0,20 - 0,40 Rendah
0,00 - 0,20 Sangat rendah
< 0,00 Tidak valid
Tentukan kategori dari validitas instrument yang mengacu pada pengklasifikasian validitas
yang dikemukakan oleh Guilford (1956:145) sebagai berikut:

0,80 < rxy 1,00 validitas sangat tinggi (sangat baik)


0,60 < rxy 0,80 validitas tinggi (baik)
0,40 < rxy 0,60 validitas sedang (cukup)
0,20 < rxy 0,40 validitas rendah (kurang)
0,00 < rxy 0,20 validitas sangat rendah (jelek)
rxy 0,00 tidak valid

Hubungan antara Indeks soal dengan tindak lanjut yang dilakukan


Indeks Soal Tindak Lanjut
Sukar dan terlalu sukar (0,00-0,29) -Didrop(tidak digunakan pada tes mendatang)
-Dikaji ulang untuk menemukan penyebab
soal dianggap sukar (redaksi,
pertanyaan,dll)
-Digunakan untuk tes tingkat tinggi
Sedang (0,30-0,70) -Dicatat pada bank soal dan dikeluarkan lagi
pada tes di waktu yang akan datang
Mudah dan terlalu mudah (0,71-1,00) -Didrop (tidak digunakan pada tes mendatang)
-Dikaji ulang untuk menemukan penyebab
soal terlalu mudah dijawab
-Digunakan untuk tes yang tidak terlalu ketat

Daya Pembeda (Discriminating Power)


Daya pembeda soal adalah kemampuan item tes untuk memebedakan peserta pandai dan
peserta yang kurang pandai.
Klasifikasi Indeks diskriminasi item soal
Indeks D Klasiikasi Interprestasi
0,70-1,00 Excellent Memiliki daya pembeda yang
sangat baik
0,40-0,70 Good Memiliki daya pemeda yang
baik
0,20-0,40 Satisfacory Memiliki dya pembeda yang
cukup/sedang
Kurang dari 0,20 Poor Memiliki daya pembeda yang
lemah
Negatif - Kelompok atas banyak yang
menjawan salah

Rumus untuk menyadari daya pembeda adalah :


JKA−JKB
D=
1 /2(n)
Ket :
D = daya pembeda
KA =Jumlah Kelompok atas yang menjawab dengan benar
KB =Jumlah Kelompok bawah yang menjawab dengan benar
n =Jumlah seluruh peserta tes

Reliabilitas
Reliabilitas (keandalan/keajegan) adalah kualitas yang menunjukkan kemantapan
(consistency) ekuivalensi atau stabilitas suatu pengukuran yang dilakukan. Reliabilitas adalah
ketetapan seperangkat instrumen tes. Suatu perangkat instrumen tes dikatakan andal jika
dapat dipercaya, konsisten atau stabil dan produktif.Jadi, yang dipentingkan disini iyalah
sejauhmana te atau alat tersebut dapat dipercaya kebenarannya.
Keadalan suatu perangkat instrumen tes dinyatakan dengan coefficient of reliability (r), yaitu
dengan jalan mencari korelasi. Misalnya :
a. Dengan metode dua tes : dua tes yang pararel dan setara (ekuivalen) diberikan kepada
sekelompok anak. Hasil kedua e tersebut kemudian dicari korelasinya.
b. Dengan metode satu tes : sebuah tes diberikan dua kali kepada sekelompok murid
yang sama, tetapi dalam waktu yang berbeda. Kedua hasil tes itu kemudian dicari
korelasinya.
c. Metode “split-half” (masih dengan satu tes) : suatu tes dibagi menjadi dua bagian
yang sama tingkat kesukarannya, sama isi dan bentuknya. Kemudian dilihat skor
masing- masing bagian paruhan tes terseut dan dcari korelainya.
Faktor- faktor yang dapat mempengaruhi reliabilitas suatu perangkat instrumen tes, antara
lain :
a. Luas tidaknya sampling yang diambil
b. Perbedaan bakat dan kemampuan murid yang dites
c. Suasana dan kondisi testing
Keputusan Akhir
Setelah mengetahui tingkat kesukaran soal, daya pembeda, kualitas pengecoh soal validitas
dan reliabilitas, kita dapat menentukan apakah suatu soal dapat dikatakan baik ataukah tidak.
Tindak lanju atas hasil analisis tersebut adalah
a. Butir soal yang memiliki daya pembeda yang baik (satisactory, good dan excelent)
dapat langsung dicatat pada bank soal dan dikeluarkan lagi pada tes mendatang,
karena kualitasnya memadai.
b. Butir- butir soal yang daya pembedanya rendah (poor) ada dua kemungkinan :
1) Dikaji ulang dan diperbaiki, selanjutnya dianalisis lagi untuk mengetahui
apakah TK dan DP-nya semakin baik
2) Didrop atau dibuang artinya tidak digunakan lagi sebagai soal
c. Butir- butir soal yang bertanda (-) tidak perlu digunakan

Anda mungkin juga menyukai