Anda di halaman 1dari 11

1

BAB I
PENDAHULUAN

A. Latar Belakang
Perkembangan konsep penilaian pendidikan yang ada pada saat ini menunjukkan arah
yang lebih luas. Penilaian program pendidikan menyangkut penilaian terhadap tujuan
pendidikan, isi program.
Strategi pelaksanaan program dan sarana pendidikan. Penilaian proses belajar mengajar
menyangkut penilaian terhadap kegiatan guru, kegiatan siswa, pola interaksi guru siswa dan
keterlaksanaan program belajar mengajar. Sedangkan penilaian hasil belajar menyangkut hasil
belajar jangka pendek dan hasil belajar jangka panjang.
Dengan demikian, inti penilaian adalah proses memberikan atau menentukan nilai kepada
objek tertentu berdasarkan suatu kriteria tertentu. Proses pemberian nilai tersebut berlangsung,
baik dalam bentuk validitas maupun reliabilitas. Keberhasilan mengungkapkan hasil dan proses
belajar siswa sebagaimana adanya (objektivitas hasil penilaian) sangat tergantung pada kualitas
alat penilaiannya di samping pada cara pelaksanaannya.
Standarisasi tes mengisyaratkan uji validitas tes. Tes yang sudah standar atau baku akan
memiliki nilai manfaat praktis karena hasil yang diperoleh dari penerapan tes itu akan diperoleh
skor yang sahih dan konsisten. Oleh karena itu guru sebelum menerapkan tes kepada siswa,
sebaiknya terlebih dahulu menguji validitas tes yang telah dibuat.
Berdasarkan hal tersebut, maka penulisan makalah ini akan difokuskan pada pembahasan
tentang “Validitas Tes” agar dapat lebih memahami apa itu sebenarnya validitas serta lebih
memahami bagaimana mengetahui suatu alat penilaian dikatakan mempunyai kualitas yang baik.

B. Rumusan Masalah
Adapun yang menjadi rumusan masalah dalam makalah ini, yaitu:
1. Bagaimana karakteristik tes hasil belajar yang baik ?
2. Apakah yang dimaksud dengan validitas tes hasil belajar ?
3. Teknik-teknik validitas tes?
4. Faktor yang mempengaruhih validitas tes?

1
2

BAB II
PEMBAHASAN

1.1 Pengertian Validitas


Validitas berasal dari kata ’’validity’’ yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur
dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi
ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran
tersebut. Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan
sebagai tes yang memiliki validitas rendah.1
Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi, jadi
jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa istrumen
tersebut valid, karena dapat memberikan gambaran tetang data secara benar sesuai dengan
kenyataan atau keadaan sesungguhnya jadi jika data yang dihasilkan oleh instrument benar atau
valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid.
Prinsip validitas adalah pengukuran atau pengamatan yang berarti prinsip keandalan instrumen
dalam mengumpulkan data. Instrumen harus dapat mengukur apa yang seharusnya diukur. Jadi
validitas lebih menekankan pada alat pengukuran atau pengamatan.
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi
apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai
dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas
rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung
pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat.
Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil
pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi.
Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai
variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk
mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A’ atau B

1
Arikunto, Suharsimi. 2007. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

2
3

1.2 Macam-macam Validitas


Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.

A. Validitas logis
istilah ’’validitas logis’’ mengandung kata ’’logis’’ berasal dari kata ’’logika’’ yang berarti
penalaran. Dengan makna demikian maka validitas logis untuk sebuah instrumen evaluasi
menunjuk pada kondisi bagi sebuah instrument yang memenuhi persyaratan valid berdasarkan
hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrument yang
bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana
pelaksanaan tugas lain misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan
mengarang, tentu secara logis karangannya sudah baik.
Dari penjelasan tersebut kita dapat memahami bahwa validitas logis dapat dicapai apabila
instrument disusun mengikuti ketentuan yang ada. Dengan demikian dapat disimpulkan bahwa
validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah instrument tersebut
selesai disusun. Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrument, yaitu:
validitas isi dan validitas konstrak.

B. Validitas Empiris
istilah validitas empiris memuat kata empiris yang artinya pengalaman. Sebuah instrumen
dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh
sehari-hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan
bahwa orang tersebut memang jujur.
Contoh lain, seseorang dikatakan kreatif apabila dari pengalaman dibuktikan bahwa orang
tersebut sudah banyak menghasilkan ide-ide baru yang diakui bebeda dari hal-hal yang sudah
ada. Dari penjelasan contoh-contoh tersebut diketahui bahwa validitas empiris dapat diperoleh
hanya dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi
harus dibuktikan melalui pengalaman. Ada dua macam validitas empiris, yakni validitas ada
sekarang dan validitas prediksi.

3
4

Dari uraiaan diatas ada dua jenis validitas, yakni validitas logis yang ada dua macam, dan
validitas empiris yang juga ada dua macam, maka secara keseluruhan kita mengenal adanya
empat validitas, yaitu:

1) Validitas Isi (Content Validity)


Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang
sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera
dalam kurikulum maka validitas isi ini sering juga disebut validitas kurikuler. Validitas isi dapat
diusahakan tercapainya sejak saat penyusunan dengan cara memerinci materi kurikulum atau
materi buku pelajaran.
Misalnya: tes bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut,
pengukuran motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan konsep
motivasi, dan demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin penentuan validitas
isi terutama berkaitan dengan proses analisis logis, dengan dasar ini dia berpendapat bahwa
validitas isi berbeda dengan validitas rupa yang kurang menggunakan analisis logis yang
sistematis, lebih lanjut dia menyatakan bahwa sebuah instrumen yang punya validitas isi
biasanya juga mempunyai validitas rupa, sedang keadaan sebaliknya belum tentu benar.

2) Validitas konstruksi (Construct Validity)


Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang
berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu konsep yang
diukurnya. Sebuah tes dikatakan memeiliki validitas konstruksi apabila butir-butir soal yang
membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam tujuan
instruksional khusus. Dengan kata lain jika butir-butir soal mengukur aspek berpikir tersebut
sudah sesuai dengan aspek berpikir yang menjadi tujuan instrusional.
Contoh: siswa dapat membandingkan antara efek biologis dan efek psikologis, maka butir
soal pada tes merupakan perintah agar siswa membedakan antara dua efek tersebut.
Konstruksi dalam pengertian ini bukanlah susunan seperti yang sering dijumpai dalam teknik,
tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa.
Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara memerinci dan

4
5

memasangkan setiap butir soal dengan setiap aspek dan tujuan instrusional khusus.
Pengajarannya berdasarkan logika, bukan pengalamannya.

3) Validitas bandingan/ ’’ada sekarang’’ (Concurrent Validity)


Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki
validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah ’’sesuai’’ tentu ada dua
hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman.
Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang
sudah ada (ada sekarang).
Contoh: seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau
belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Misal
nilai ulangan harian atau nilai sumatif yang lalu.

4) Validitas ramalan/ prediksi (Predictive validity)


Memprediksi artinya meramal, dengan meramal selalu menganai hal yang akan datang yang
belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila
mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang.
Misalanya tes masuk keperguruan tinggi adalah sebuah tes yang diperkirakan mampu
meramalkan keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon
yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan
mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin keberhsilannya kelak. Sebaliknya
seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan
akan tidak mampu mengikuti perkuliahan yang akan datang.2

1.3 Cara mengukur validitas


Pekerjaan untuk mencari validitas suatu alat ukur disebut validation. Prinsip dari validation
adalah membandingkan hasil-hasil dari pengukuran faktor dengan suatu kriterium, )suatu ukuran
yang telah dipandang valid untuk menunjukkan faktor yang dimaksud). Jadi misalnya suatu alat
pengukur hendak menyelidiki faktor ketelitian kerja, maka harus diambil lebih dahulu suatu
kriterium yang telah dipandang mencerminkan suatu ketelitian kerja. Melalui kriterium itulah

2
Amir Daien Indrakusuma. 1975. Evaluasi Pendididkan. Yogyakarta: Pustaka Pelajar.

5
6

kemudian hasil dari pengukuran faktor ketelitian kerja disoroti, Jika hasil pengukuran faktor
ketelitian kerja menunjukkan besarnya ketelitian kerja yang sesuai dengan kriterium, maka alat
pengukur itu dipandang valid.

Ada dua jenis kriterium yang digunakan untuk menguji kejituan alat pengukur, yaitu :
a. Kriterium luar (external criterion)
Yaitu suatu kriterium yang diambil dari luar (external) alat itu sendiri. Misalnya : suatu tes
tentang ketelitian kerja, diuji validitasnya dengan prestasi kerja yang sesungguhnya sebagaimana
ditunjukkan oleh catatan-catatan hasil kerja atau penilaian pimpinan unit.

b. Kriterium dalam alat (internal criterion)


Yaitu suatu kriterium yang diambil dari dalam (internal)alat itu sendiri. Biasanya diambil
hasil keseluruhan pengukuran atau total score sebagai kriteriumnya. Misalnya, kita ingin
mengukur intelegensi (yang terdiri dari faktor-faktorl; daya analisa, daya klarifikasi, daya
ingatan, daya pemahaman, daya kritik dan sebagainya), maka untuk menguji apakah sekelompk
item benar-benar mengukur daya analisa, misalnya, jawaban-jawaban terhadap item daya analisa
dicocokkan dengan hasil tes secara keseluruhan atau total score-nya. Antara nilai total harus
terdapat korelasi yang positif (tinggi dan cukup meyakinkan). Kecocokkan antara hasil-hasil dari
item yang disangka mengukur suatu faktor dengan suatu kriterium yang dipandang telah valid
disebut factorial validity atau validitas faktor, di mana besar kecilnya validitas faktor tergantung
kepada besar kecilnya kecocokan itu.
Validitas alat tes berkaitan dengan ketepatan dan kecermatan alat tes tersebut dalam
melakukan fungsi tes atau fungsi ukurnya. Menurut buku Standards, yang ditulis oleh Asosiasi
Psikolog Amerika (APA), validitas mengacu pada derajat dimana bukti dan teori menyokong
interpretasi dari skor tes dan mengacu pada tujuan tes. Validitas adalah hal yang paling mendasar
dalam pengembangan dan evaluasi tes. Proses validasi meliputi akumulasi, membuktikan tujuan
dari evaluasi tersebut, bukan terhadap test itu sendiri. Pada alat tes biasanya validitas akan
dihitung secara statistik dan dalam bentuk rumusan angka.3

3
Saifuddin azwar. 1997. Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar

6
7

1.4 Faktor-Faktor yang Mempengaruhi Validitas


Banyak faktor yang menyebabkan hasil asesmen tidak valid. Beberapa di antaranya tampak
jelas dan mudah untuk menghindarinya. Tidak ada guru yang akan berpikir untuk mengukur
pengetahuan biologi dengan asesmen matematika. Demikian pula juga tidak ada guru yang akan
mengukur kemampuan memecahkan masalah (problem solving) biologi kelas 7 SMP dengan
menggunakan asesmen yang didesain untuk kelas 12 SMA. Dalam dua contoh tersebut sudah
sangat jelas hasil asesmen akan menjadi tidak valid.

Faktor yang mempengaruhi validitas tes antara lain:


a. Faktor dari dalam tes itu sendiri
Pengujian terhadap butir tes secara hati-hati akan menunjukkan apakah tes yang digunakan
untuk mengukur isi materi atau fungsi -fungsi mental yang akan diakses oleh guru.
Bagaimanapun juga, beberapa faktor berikut dapat menjaga butir tes dari fungsi yang
dikehendaki dan dengan demikian juga terjaga dari rendahnya validitas hasil asesmen. Lima
faktor yang pertama dapat diterapkan sejajar dengan asesmen penampilan siswa secara luas serta
tes-tes tradisional. Lima faktor yang terakhir lebih diterapkan secara langsung terhadap tes
pilihan dan tes dengan jawaban singkat dengan jawaban benar atau salah.
1. Petunjuk yang tidak jelas. Petunjuk yang tidak jelas menyebabkan siswa kehilangan waktu
untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak dapat melakukan apa yang
seharusnya dilakukan.
2. Penggunaan kosa kata dan struktur kalimat yang sulit. Penggunaan kosa kata atau struktur
kalimat yang sulit dapat menyebabkan siswa terjebak untuk pemahaman terhadap pemahaman
maksud dari sebuah pertanyaan bukan untuk menyelesaikan pertanyaan itu sendiri.
3. Ambiguitas. Ambiguitas yaitu adanya kemungkinan multi tafsir juga menyebabkan
menurunnya validitas sebuah tes.
4. Alokasi waktu yang tidak cukup. Seyogyanya sebuah tes disediakan waktu yang cukup
untuk mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam menyelesaikan sebuah
tes bisa jadi bukan karena siswa tidak mampu untuk menyelesaikan tesnya tetapi karena
keterbatasan kesempatan untuk mengerjakannya.
5. Penekanan yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah ditebak
kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat validitas soal.

7
8

6. Kualitas butir tes yang tidak memadai untuk mengukur hasil belajar. Kualitas yang tidak
memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir tingkat tinggi (higher
order thinking) jelas tidak cukup hanya digunakan tes yang bersifat untuk mengungkap
pengetahuan faktual saja.
7. Susunan tes yang jelek.
8. Tes terlalu pendek.
9. Penyusunan butir tes yang tidak runtut .
10. Pola jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya adalah A
semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A, D, C, B, A, dan
sebagainya.

b. Faktor administrasi dan skor


Pemberian skor terhadap jawaban siswa (testee) harus dilakukan secara hati-hati jangan sampai
salah tulis atau meremehkan selisih angka walaupun hanya sedikit. Hal ini akan menyebabkan
hasil pengujian terhadap validitas akan memberikan makna yang berbeda.
Berikut beberapa contoh faktor yang sumbernya yang berasal dari proses administrasi dan skor.
a. Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban dalam situasi
yang tergesa – gesa.
b. Adanya kecurangan dalam tes sehingga tidak bisa membedakan siswa yang belajar dengan
yang melakukan kecurangan.
c. Pemberian petunjuk dari pengawas yang tidak dapat dilakukan semua siswa.
d. Teknik pemberian skor yang tidak konsisten, mislanya pada tes essay, juga dapat
mengurangi validitas tes evaluasi.
e. Siswa tidak dapat mengikuti arahan yang diberikan dalam tes baku.
f. Adanya orang lain yang bukan siswa yang termasuk dan menjawab item tes yang
diberikan.
c. Faktor tanggapan siswa
Seringkali terjadi bahwa interpretasi terhadap item – item tes evaluasi tidak valid, karna
dipengaruhi oleh jawab siswa dari interpretasi item – item pada tes evaluasi. Sebagai contoh,
sebuah tes para siswa menjadi tegang karena guru mata pelajaran tersebut “killer” galak dan
sebagainya. Sehingga siswa yang mengikuti tes tersebut banyak yang gagal. Contoh lain, ketika

8
9

siswa melakukan tes penampilan keterampilan, ruangan terlalu ramai atau gaduh sehingga siswa
tidak dapat berkonsentrasi dengan baik. Ini semua dapat mengurangi nilai validitas instrumen
evaluasi.
Tanggapan siswa yang tidak serius biasanya dijumpai pada saat siswa diminta untuk mengisi
sebuah angket. Hal ini akan menyebabkan siswa mengisi angket secara sembarangan karena
merasa tidak penting maupun alasan -alasan yang lain. Oleh karena itu berikan angket pada
waktu dan kondisi yang tepat .

d. Hakikat kelompok dan criteria


Seperti sudah dijelaskan di atas bahwa validitas bersifat spesifik. Sebuah asesmen atau
instrumen alat ukur mungkin hanya valid untuk kelompok tertentu saja dan tidak valid untuk
kelompok yang lain. Sebagai contoh misalnya sebuah tes diujicobakan pada sekelompok siswa
pada sebuah sekolah dengan kualitas biasa –biasa saja tentu akan berbeda hasilnya jika tes yang
sama diberikan pada sekelompok siswa pada sekolah yang favorit.

9
10

BAB III
PENUTUP
A. Kesimpulan
Validitas adalah suatu ukuran yang menunjukan tingkat-tingkat kevalidan atau kesahihan
suatu instrument. Sebuah tes dikatakan valid jika ia memang mengukur apa yang seharusnya
diukur.
Ada 4 (empat) macam validitas yang berasal dari dasar pembagian jenis di atas yaitu :
a. Validitas Logis.
1. Validitas Isi (content validity).
2. Validitas Konstruksi (construct validity).
b. Validitas Empiris .
1. Valditas” ada sekarang” (concurrent validity).
2. Validitas ramalan (predictive validity).
Cara mengukur validitas, Melalui kriterium itulah kemudian hasil dari pengukuran faktor
ketelitian kerja disoroti, Jika hasil pengukuran faktor ketelitian kerja menunjukkan besarnya
ketelitian kerja yang sesuai dengan kriterium, maka alat pengukur itu dipandang valid.
Ada dua jenis kriterium yang digunakan untuk menguji kejituan alat pengukur, yaitu :
Yaitu suatu kriterium yang diambil dari luar (external) alat itu sendiri. Misalnya : suatu tes
tentang ketelitian kerja, diuji validitasnya dengan prestasi kerja yang sesungguhnya sebagaimana
ditunjukkan oleh catatan-catatan hasil kerja atau penilaian pimpinan unit.
Yaitu suatu kriterium yang diambil dari dalam (internal)alat itu sendiri. Biasanya diambil
hasil keseluruhan pengukuran atau total score sebagai kriteriumnya.
Faktor yang mempengaruhi validitas tes antara lain:
a. Faktor dari dalam tes itu sendiri
b. Faktor administrasi dan skor
c. Faktor tanggapan siswa
d. Hakikat kelompok dan criteria

10
11

Daftar Pustaka

Arikunto, Suharsimi. 2007. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.


Amir Daien Indrakusuma. 1975. Evaluasi Pendididkan. Yogyakarta: Pustaka Pelajar.
Saifuddin azwar. 1997. Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar.

11

Anda mungkin juga menyukai