Anda di halaman 1dari 9

BAB II

PEMBAHASAN

A. Pengertian Validitas

sebelum guru menggunakan suatu tes, hendaknya guru mengukur


terlebih dahulu validitasnya berdasarkan kriteria tertentu. Dengan kata lain,
untuk melihat apakah tes tersebut valid (sahih), kita harus membandingkan
skor peserta didik yang didapat dalam tes dengan skor yang dianggap sebagai
nilai baku. Misalnya, nilai ujian akhir semester peserta didik dalam salah satu
mata pelajaran dibandingkan dengan nilai ujian akhir semester pada mata
pelajaran yang lain. Makin mendekati kedua skor tersebut, maka semakin soal
ujian akhir tadi dapat dikatakan valid.

Validitas suatu tes erat kaitannya dengan tujuan penggunaan tes


tersebut. Namun, tidak ada validitas berlaku secara umum. Artinya, jika suatu
tes dapat memberikan informasi yang sesuai dan dapat digunakan untuk
mencapai tujuan tertentu, maka tes itu valid untuk tujuan tersebut.1

validitas berasal dari kata validity yang mempunyai arti sejauhmana


ketepatan dan kecermatan suatu instrumen pengukur (tes) dalam melakukan
fungsi ukurnya. Suatu tes dapat dikatakan mempunyai validitas yang tinggi
apabila tes tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur
yang tepat dan akurat sesuai dengan maksud.2

Ada dua unsur penting dalam validitas ini. Pertama, validitas


menunjukkan suatu derajat, ada yang sempurna, ada yang sedang, dan ada
pula yang rendah. Kedua, validitas selalu dihubungkan dengan suatu putusan
atau tujuan yang spesifik. Sebagaimana pendapat R.L. Thorndike dan H.P

1
Zainal Arifin, “Evaluasi Pembelajaran prinsip, Teknik, Prosedur”, (Bandung: PT Remaja
Rosdakarya, 2011), 247
2
Saifuddin Azwar, “Tes Prestasi, Fungsi Pengembangan Pengukuran Prestasi Belajar”,
(Yogyakarta: Pustaka Pelajar, 1998), 173
Hagen (1977) bahwa "validity is always in relation to a specific decision or
use"3

B. Faktor-faktor Yang Mempengaruhi Validitas

Gronlund (1985) mengemukan ada tiga faktor yang memengaruhi


validitas hasil tes, yaitu “faktor instrumen evaluasi, faktor administrasi
evaluasi dan penskoran, dan faktor dari jawaban peserta didik”.4

1. Faktor instrumen evaluasi

Mengembangkan instrumen evaluasi memang tidaklah mudah.


apalagi jika seorang evaluator tidak atau kurang memahami prosedur dan
teknik evaluasi itu sendiri. Jika instrumen evaluasi kurang baik, maka
dapat berakibat hasil evaluasi menjadi kurang baik. Untuk itu, dalam
mengembangkan instrumen evaluasi, seorang evaluator harus
memperhatikan hal-hal yang mempengaruhi validitas instrumen dan
berkaitan dengan prosedur penyusunan instrumen, seperti silabus, kisi-kisi
soal, petunjuk mengerjakan soal dan pengisian lembar jawaban,
penggunaan kalimat efektif alternatif jawaban, tingkat kesukaran, daya
pembeda dan sebagainya.

2. Faktor administrasi evaluasi dan penskoran

Dalam administrasi evaluasi dan penskoran banyak sekali terjadi


penyimpangan atau kekeliruan, seperti alokasi waktu untuk pengerjaan
soal yang tidak proporsional, memberikan bantuan kepada peserta didik
dengan berbagai cara, peserta didik saling menyontek ketika ujian,
kesalahan penskoran, termasuk kondisi fisik dan psikis peserta didik yang
kurang menguntungkan.

3. Faktor jawaban dari peserta didik

3
Zainal Arifin, “Evaluasi Pembelajaran prinsip, Teknik, Prosedur”, 247
4
Zainal Arifin, “Evaluasi Pembelajaran prinsip, Teknik, Prosedur”, 247-248
Dalam praktiknya, faktor jawaban peserta didik justru lebih
banyak berpengaruh daripada dua faktor sebelumnya. Faktor ini meliputi
kecenderungan peserta didik untuk menjawab secara cepat, tetapi tidak
tepat, keinginan melakukan coba-coba, dan penggunaan gaya bahasa
tertentu dalam menjawab soal bentuk uraian.

C. Kriteria dalam Validitas

Koefisien validitas, antara lain mengenai karakteristik sampel validitas,


prosedur-prosedur dalam pengukuran validitas, dan pola kriteria khusus yang
dikorelasikan dengan hasil tes itu. Sehubungan dengan kriteria khusus,
Anastasi dalam Conny Semiawan Stamboel (1986) mengemukakan ada
delapan kriteria sebagai bahan bandingan untuk merumuskan apa yang hendak
diselidiki oleh suatu tes, yaitu "diferensiasi umur, kemajuan akademis, kriteria
dalam pelaksanaan latihan khusus kriteria dalam pelaksanaan kerja, penilaian,
kelompok yang dipertentangkan, korelasi dengan tes lain, dan konsistensi
internal"5

a. Diferensiasi umur

Kriteria yang paling utama dalam validitas tes inteligensi adalah


umur. Kebanyakan tes inteligensi, baik yang dipakai di sekolah maupun
tes pra-sekolah, senantiasa dibandingkan dengan kronologis untuk
menentukan apakah angka bertambah dengan bertambahnya umur. Jika
suatu tes dianggap valid, maka nilai tes bagi peserta didik akan naik
dengan bertambahnya umur. Namun, anggapan ini tidak berlaku bagi
perkembangan semua fungsi dalam hubungannya dengan bertambahnya
umur secara konsisten (ini terbukti dari beberapa tes kepribadian). Suatu
hal yang juga perlu dicermati adalah corak kondisi lingkungan tempat tes
itu dibakukan. Kriteria peningkatan umur tidak bersifat universal, tetapi
tidak dapat juga dikatakan bahwa ini berlaku bagi corak masing-masing
kebudayaan.
5
Eko Putro Widoyoko, “Penilaian Hasil Pembelajaran di Sekolah”, ( Yogyakarta: Pustaka Pelajar,
2014), 250-251
b. Kemajuan akademis

Pada umumnya tes inteligensi divalidkan dengan kemajuan


akademis. Juga sering dikatakan bahwa makin lama seseorang belajar di
sekolah, makin tinggi pendidikannya, makin tinggi pula kemajuan
akademisnya. Padahal, setiap jenis dan jenjang pendidikan bersifat
selektif. Bagi peserta didik yang tak meneruskan, biasanya termasuk
dropout. Namun, banyak pula faktor non-intelektual yang ikut
memengaruhi keberhasilan pendidikan seorang peserta didik. Dengan kata
lain, berhasil tidaknya pendidikan seseorang tidak hanya dilihat dari faktor
intelektual, tetapi juga faktor nonintelektual. Untuk memperoleh gambaran
yang komprehensif dan holistik tentang hal ini perlu diadakan
penyelidikan yang lebih jauh.

c. Kriteria dalam pelaksanaan latihan khusus

Corak kriteria dalam pengembangan tes khusus didasarkan atas


prestasi dalam latihan tertentu secara khusus. Beberapa tes bakat profesi
(profesional aptitude test) telah divalidkan dengan tes hasil belajar dalam
bidang-bidang tersebut. Misalnya, tes untuk memasuki profesi kedokteran,
hukum, dan sebagainya. Ada beberapa tess untuk memasuki profesi
tertentu yang disebut tailor-made test, yaitu tes yang telah dibuat khusus
untuk keperluan tersebut, sepert tes penerbangan.

d. Kriteria dalam pelaksanaan kerja


Banyak tes dan tes digunakan kriteria yang didasarkan atas kinerja
dalam pelaksanaan kerja (on the job performance). Mengingat setiap
pekerjaan memiliki kekhasan sendiri dan bentuk, maupun coraknya, maka
untuk setiap pekerjaan diciptakan tes yang terkenal dengan istilah tailor-
made test
e. Penilaian

Pengertian penilaian di sini adalah teknik untuk memperoleh


informasi tentang kemajuan belajar peserta didik di sekolah. Selain itu,
juga mencakup pekerjaan yang memerlukan latihan khusus ataupun sukses
dalam penilaian pribadi oleh seorang pengamat terhadap berbagai fungsi
psikologis. Misalnya, kondisi-kondisi, orisinalitas, kepemimpinan, atau
kejujuran. Jika kondisi-kondisi pengenalan dalam situasi tempat
kemampuan yang khusus itu dinyatakan, maka perlu disertai skala
penilaian yang dipersiapkan secara teliti.

f. Kelompok yang dipertentangkan

Konsep validitas melalui kelompok yang dipertentangkan


menyelidiki pengaruh kehidupan sehari-hari yang tak disengaja. Kriteria
ini didasarkan atas kelebihan suatu kelompok tertentu dihadapkan pada
kelompok yang lain dalam mejalankan suatu tes tertentu. Misalnya, suatu
tes bakat musik dicobakan di sekolah musik maupun di sekolah umum.
Kriteria itu didasarkan atas faktor yang mencolok, yang diperoleh dari
hasil nilai kedua kelompok tersebut dalam menjalankan tes itu.

g. Korelasi dengan tes lain

Korelasi antara tes baru dengan tes lama merupakan perbandingan


kriteria dalam menyelidiki perilaku yang sama. Dalam hal ini suatu tes
verbal tertulis bisa dibandingkan dengan tes individual atau tes kelompok.
Untuk mengukur apakah suatu tes yang baru memiliki validitas dan bebas
dari pengaruh faktor lain, maka dipergunakan tes jenis lain dalam
membandingkannya. Jadi, kadang-kadang tes kepribadian dikorelasikan
dengan tes internal atau tes prestasi belajar

h. Konsistensi internal

Kriteria konsistensi internal adalah skor total yang diperoleh


peserta didik dalam suatu ini terutama digunakan dalam bidang tes
kepribadian. Kadang-kadang untuk keperluan ini juga digunakan
percobaan tes dengan dua kelompok, yaitu antara kelompok berhasil dan
kelompok kurang berhasil.6
6
Eko Putro Widoyoko, “Penilaian Hasil Pembelajaran di Sekolah”, 251
D. Macam-macam Validitas
1. Validitas logis

Istilah "validitas logi" mrngandung kata "logis" berasal dari kata


"logika", yang berarti penalaran. validitas logis untuk sebuah instrumen
evaluasi menunjuk pada kondisi bagi sebuah instrumen yang memenuhi
persyaratan valid berdasarkan hasil penalaran Kondisi valid tersebut
dipandang terpenuhi karena instrumen yang bersangkutan sudah dirancang
secara baik, mengikuti teori dan ketentuan yang ada.

Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen, yaitu: validitas isi dan validitas konstrak.

a. Validitas isi
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi
sebuah instrumen yang disusun berdasarkan isi materi pelajaran
yang dievaluasi. 7 Validitas isi dari suatu tes hasil belajar adalah
validitas yang diperoleh setelah dilakukan penganalisisan,
penelusuran atau pengujian terhadap isi yang terkandung da lam
tes hasil belajar tersebut. Validitas isi adalah validitas yang ditilik
dari segi isi tesitu sendiri sebagai alat pengukur hasil belajar yaitu:
sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar
peserta didik, isinya telah dapat akili secara representatif terhadap
keseluruhan materi atau bahan pelajaran yang seharusnya diteskan
(diujikan). Jadi, pembicaraan tentang validitas isi sebenarnya
identik dengan pembicaraan tentang populasi dan sampel.8
b. Validitas Konstrak
Validitas konstrak sebuah instrumen menunjuk suatu kondisi
sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek
kejiwaan yang seharusnya dievaluasi.9 Secara etimologis, kata
7
Sulistyorini, “Evaluasi Pendidikan, Dalam Meningkatkan Mutu Pendidikan”,
(Yogyakarta: Teras, 2009), 165
8
Anas Sudijono, “Pengantar Evaluasi Pendidikan”, (Jakarta: PT RajaGrafindo Persada,
2001), 165
9
Sulistyorini, “Evaluasi Pendidikan, Dalam Meningkatkan Mutu Pendidikan”, 165
"konstruksi" mengandung arti susunan, kerangka atau rekaan.
Kalimat seperti “gedung bertingkat itu menggunakan konstruksi
beton bertulang” misalnya, mengandung arti bahwa batang tubuh
dari bangunan berupa gedung bertingkat itu "tersusun" dari bahan-
bahan beton bertulang, atau “kerangka utamanya" adalah beton
bertulang, atau dirancang dengan "rekaan" beton bertulang.
Dengan demikian, validitas konstruksi dapat diartikan sebagai
validitas yang ditilik dari segi susunan, kerangka atau rekaannya.
Adapun secara terminologis, suatu tes hasil belajar dapat
dinyatakan sebagai tes yang telah memiliki validitas konstruksi,
apabila tes hasil belajar tersebut ditinjau dari segi susunan,
kerangka atau rekaannya telah dapat dengan secara tepat
mencerminkan suatu konstruksi dalam teori psikologis.10
2. validitas empiris

Istilah "validitas empiris" memuat kata "empiris" yang artinya


"pengalaman". Sebuah instrumen dapat dikatakan memiliki validitas
empiris apabila sudah diuji dari pengalaman. Validitas empiris tidak dapat
diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan
seperti halnya validitas logis, tetapi harus dibuktikan melalui pengalaman.

Ada dua macam validitas empiris, yakni ada dua cara yang dapat
dilakukkan untuk menguji bahwa sebuah instrumen memang valid.
Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen
yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang
digunakan sebagai pembanding kondisi instrumen dimaksud ada dua,
yaitu: yang sudah tersedia dan yang belum ada tetapi akan terjadi di
waktu yang akan datang. Bagi instrumen yang kondisinya sesuai dengan
kriterium yang sudah tersedia, yang sudah ada disebut memiliki validitas
"ada sekarang", yang dalam istilah bahasa Inggris disebut memiliki
concurrent validity. Selanjutnya instrumen yang kondisinya sesuai dengan

10
Anas Sudijono, “Pengantar Evaluasi Pendidikan”, 166
kriterium yang diramalkan akan terjadi, disebut memiliki validitas
ramalan atau validitas prediksi, yang dalam istilah bahasa Inggris disebut
memiliki perdictive validity.11

a. Validitas Bandingan (concurrent validity)

Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes
dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Dalam membandingkan hasil sebuah tes maka
diperlukan suatu alat pembanding, maka hasil tes merupakan sesuatu
yang dibandingkan.

b. Validitas Prediksi (predictive validity)

Menurut Arikunto sebuah tes dikatakan memiliki validitas prediksi


atau validitas ramalan apabila mempunyai kemampuan untuk
meramalkan apa yang terjadi pada masa yang akan datang. Untuk
mengetahui apakah validitas isi telah dipenuhi atau belum, maka
dilakukan telaah soal dengan cara menyesuaikan soal dengan kisi-kisi
yang diacu. Dalam hal ini, digunakan expert judgment untuk menilai
kesesuaian itu. Selain itu, untuk mengetahui validitasisi juga
digunakan kartu telaah butir soal yang mencakup bidang kriteria
penelaahan materi, konstruksi, dan bahasa. 12

E. Uji Validitas

Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan


kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan
kriterium. Instrumen yang valid berarti alat ukur yang digunakan untuk
mendapatkan data (mengukur) itu valid. Valid berarti instrumen tersebut dapat
digunakan untuk mengukur apa yang seharusnya diukur (ketepatan). Untuk
menguji validitas instrumen digunakan rumus korelasi product moment yang
dikemukakan oleh Pearson dengan rumus:
11
Sulistyorini, “Evaluasi Pendidikan, Dalam Meningkatkan Mutu Pendidikan”, 165-166
12
Suharsimi Arikuno, “Dasar-Dasar Evaluasi Pendidikan”, (Jakarta: Bumi Aksara, 2009)
68-69
Untuk mengintreprestasikan nilai koefesien korelasi r product moment
dapat dilihat pada Tabel 3.1.

Dengan kriteria pengujian jika korelasi antar butir dengan skor total lebih
dari 0,3 maka instrumen tersebut dinyatakan valid, atau sebaliknya jika korelasi
antar butir dengan skor total kurang dari 0,3 maka instrumen tersebut dinyatakan
tidak valid. Jika r hitung > r tabel dengan α = 0,05 maka koefisien korelasi
tersebut signifikan.

Item yang mempunyai korelasi positif dengan kriterium (skor total) serta korelasi
yang tinggi, menunjukkan bahwa item tersebut mempunyai validitas yang tinggi
pula. Biasanya syarat minimum untuk dianggap memenuhi syarat adalah kalau r
= 0,3.13

13
Sugiyono, “Metode Penilitian Kuantitatif, Kualitatif dan R&G”, (Bandung: AlfaBeta, 2009), 188

Anda mungkin juga menyukai