Anda di halaman 1dari 13

1.1.

Pengertian Validitas

Validitas berasal dari kata ’’validity’’ yang mempunyai arti sejauh mana
ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes
atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila
alat tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai
dengan maksud dilakukan pengukuran tersebut. Tes yang menghasilkan data yang
tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang memiliki
validitas rendah (Azwar, 1997).

Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau
evaluasi, jadi jika data yang dihasilkan dari sebuah instrument valid, maka dapat
dikatakan bahwa istrumen tersebut valid, karena dapat memberikan gambaran tetang
data secara benar sesuai dengan kenyataan atau keadaan sesungguhnya jadi jika data
yang dihasilkan oleh instrument benar atau valid, sesuai kenyataan, maka instrument
yang digunakan tersebut juga valid. prinsip validitas adalah pengukuran atau
pengamatan yang berarti prinsip keandalan instrumen dalam mengumpulkan data.
Instrumen harus dapat mengukur apa yang seharusnya diukur. Jadi validitas lebih
menekankan pada alat pengukuran atau pengamatan.

Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang
tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil
ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes
yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan
tujuan pengukuran. terkandung di sini pengertian bahwa ketepatan pada validitas
suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan
pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk
mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel
A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang
dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel
A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk
mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A’ atau B
(Azwar: 1997).

1.2 Macam-macam Validitas

Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas
empiris.

a. validitas logis
istilah ’’validitas logis’’ mengandung kata ’’logis’’ berasal dari kata ’’logika’’ yang
berarti penalaran. Dengan makna demikian maka validitas logis untuk sebuah
instrumen evaluasi menunjuk pada kondisi bagi sebuah instrument yang memenuhi
persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang
terpenuhi karena instrument yang bersangkutan sudah dirancang secara baik,
mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain
misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan mengarang,
tentu secara logis karangannya sudah baik. Dari penjelasan tersebut kita dapat
memahami bahwa validitas logis dapat dicapai apabila instrument disusun mengikuti
ketentuan yang ada. Dengan demikian dapat disimpulkan bahwa validitas logis tidak
perlu diuji kondisinya tetapi langsung diperoleh sesudah instrument tersebut selesai
disusun. Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrument,
yaitu: validitas isi dan validitas konstrak.

b. Validitas Empiris

istilah validitas empiris memuat kata empiris yang artinya pengalaman. Sebuah
instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari
pengalaman. Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh
masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut memang
jujur. Contoh lain, seseorang dikatakan kreatif apabila dari pengalaman dibuktikan
bahwa orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui bebeda
dari hal-hal yang sudah ada. Dari penjelasan contoh-contoh tersebut diketahui bahwa
validitas empiris dapat diperoleh hanya dengan menyusun instrumen berdasarkan
ketentuan seperti halnya validitas logis, tetapi harus dibuktikan melalui pengalaman.
Ada dua macam validitas empiris, yakni validitas ada sekarang dan validitas prediksi.

Dari uraiaan diatas ada dua jenis validitas, yakni validitas logis yang ada dua macam,
dan validitas empiris yang juga ada dua macam, maka secara keseluruhan kita
mengenal adanya empat validitas, yaitu:

1) Validitas Isi (Content Validity)

Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu
yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang
diajarkan tertera dalam kurikulum maka validitas isi ini sering juga disebut validitas
kurikuler. Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan
cara memerinci materi kurikulum atau materi buku pelajaran.

Misalnya: tes bidang studi IPS, harus mampu mengungkap isi bidang studi tersebut,
pengukuran motivasi harus mampu mengukur seluruh aspek yang berkaitan dengan
konsep motivasi, dan demikian juga untuk hal-hal lainnya. Menurut Kenneth Hopkin
penentuan validitas isi terutama berkaitan dengan proses analisis logis, dengan dasar
ini dia berpendapat bahwa validitas isi berbeda dengan validitas rupa yang kurang
menggunakan analisis logis yang sistematis, lebih lanjut dia menyatakan bahwa
sebuah instrumen yang punya validitas isi biasanya juga mempunyai validitas rupa,
sedang keadaan sebaliknya belum tentu benar.

2) Validitas konstruksi (Construct Validity)

Konstruk adalah kerangka dari suatu konsep, validitas konstruk adalah validitas yang
berkaitan dengan kesanggupan suatu alat ukur dalam mengukur pengertian suatu
konsep yang diukurnya. Sebuah tes dikatakan memeiliki validitas konstruksi apabila
butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir seperti
yang disebutkan dalam tujuan instruksional khusus. Dengan kata lain jika butir-butir
soal mengukur aspek berpikir tersebut sudah sesuai dengan aspek berpikir yang
menjadi tujuan instrusional.

Contoh: siswa dapat membandingkan antara efek biologis dan efek psikologis, maka
butir soal pada tes merupakan perintah agar siswa membedakan antara dua efek
tersebut.

Konstruksi dalam pengertian ini bukanlah susunan seperti yang sering dijumpai
dalam teknik, tetapi merupakan rekaan psikologis yaitu suatu rekaan yang dibuat oleh
para ahli ilmu jiwa. Seperti halnya validitas isi, validitas konstruksi dapat diketahui
dengan cara memerinci dan memasangkan setiap butir soal dengan setiap aspek dan
tujuan instrusional khusus. Pengajarannya berdasarkan logika, bukan pengalamannya.

3) Validitas bandingan/ ’’ada sekarang’’ (Concurrent Validity)

Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan
memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah
’’sesuai’’ tentu ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan
dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau
sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang).

Contoh: seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid
atau belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya
dimiliki. Misal nilai ulangan harian atau nilai sumatif yang lalu.

4) Validitas ramalan/ prediksi (Predictive validity)


Memprediksi artinya meramal, dengan meramal selalu menganai hal yang akan
datang yang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau
validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan
terjadi pada masa yang akan datang.

Misalanya tes masuk keperguruan tinggi adalah sebuah tes yang diperkirakan mampu
meramalkan keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan
datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi
rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin
keberhsilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena
memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu mengikuti
perkuliahan yang akan datang.

1.3 Cara mengukur validitas

Pekerjaan untuk mencari validitas suatu alat ukur disebut validation. Prinsip dari
validation adalah membandingkan hasil-hasil dari pengukuran faktor dengan suatu
kriterium, )suatu ukuran yang telah dipandang valid untuk menunjukkan faktor yang
dimaksud). Jadi misalnya suatu alat pengukur hendak menyelidiki faktor ketelitian
kerja, maka harus diambil lebih dahulu suatu kriterium yang telah dipandang
mencerminkan suatu ketelitian kerja. Melalui kriterium itulah kemudian hasil dari
pengukuran faktor ketelitian kerja disoroti, Jika hasil pengukuran faktor ketelitian
kerja menunjukkan besarnya ketelitian kerja yang sesuai dengan kriterium, maka alat
pengukur itu dipandang valid.

Ada dua jenis kriterium yang digunakan untuk menguji kejituan alat pengukur, yaitu :

a. Kriterium luar (external criterion)

Yaitu suatu kriterium yang diambil dari luar (external) alat itu sendiri. Misalnya :
suatu tes tentang ketelitian kerja, diuji validitasnya dengan prestasi kerja yang
sesungguhnya sebagaimana ditunjukkan oleh catatan-catatan hasil kerja atau
penilaian pimpinan unit.

b. Kriterium dalam alat (internal criterion)

Yaitu suatu kriterium yang diambil dari dalam (internal)alat itu sendiri. Biasanya
diambil hasil keseluruhan pengukuran atau total score sebagai kriteriumnya.
Misalnya, kita ingin mengukur intelegensi (yang terdiri dari faktor-faktorl; daya
analisa, daya klarifikasi, daya ingatan, daya pemahaman, daya kritik dan sebagainya),
maka untuk menguji apakah sekelompk item benar-benar mengukur daya analisa,
misalnya, jawaban-jawaban terhadap item daya analisa dicocokkan dengan hasil tes
secara keseluruhan atau total score-nya. Antara nilai total harus terdapat korelasi yang
positif (tinggi dan cukup meyakinkan). Kecocokkan antara hasil-hasil dari item yang
disangka mengukur suatu faktor dengan suatu kriterium yang dipandang telah valid
disebut factorial validity atau validitas faktor, di mana besar kecilnya validitas faktor
tergantung kepada besar kecilnya kecocokan itu.

Validitas alat tes berkaitan dengan ketepatan dan kecermatan alat tes tersebut dalam
melakukan fungsi tes atau fungsi ukurnya. Menurut buku Standards, yang ditulis oleh
Asosiasi Psikolog Amerika (APA), validitas mengacu pada derajat dimana bukti dan
teori menyokong interpretasi dari skor tes dan mengacu pada tujuan tes. Validitas
adalah hal yang paling mendasar dalam pengembangan dan evaluasi tes. Proses
validasi meliputi akumulasi, membuktikan tujuan dari evaluasi tersebut, bukan
terhadap test itu sendiri. Pada alat tes biasanya validitas akan dihitung secara statistik
dan dalam bentuk rumusan angka.

1.4 Faktor-Faktor yang Mempengaruhi Validitas

Banyak faktor yang menyebabkan hasil asesmen tidak valid. Beberapa di antaranya
tampak jelas dan mudah untuk menghindarinya. Tidak ada guru yang akan berpikir
untuk mengukur pengetahuan biologi dengan asesmen matematika. Demikian pula
juga tidak ada guru yang akan mengukur kemampuan memecahkan masalah (problem
solving) biologi kelas 7 SMP dengan menggunakan asesmen yang didesain untuk
kelas 12 SMA. Dalam dua contoh tersebut sudah sangat jelas hasil asesmen akan
menjadi tidak valid.

Faktor yang mempengaruhi validitas tes antara lain:

a. Faktor dari dalam tes itu sendiri

Pengujian terhadap butir tes secara hati-hati akan menunjukkan apakah tes yang
digunakan untuk mengukur isi materi atau fungsi -fungsi mental yang akan diakses
oleh guru. Bagaimanapun juga, beberapa faktor berikut dapat menjaga butir tes dari
fungsi yang dikehendaki dan dengan demikian juga terjaga dari rendahnya validitas
hasil asesmen. Lima faktor yang pertama dapat diterapkan sejajar dengan asesmen
penampilan siswa secara luas serta tes-tes tradisional. Lima faktor yang terakhir lebih
diterapkan secara langsung terhadap tes pilihan dan tes dengan jawaban singkat
dengan jawaban benar atau salah.

1. Petunjuk yang tidak jelas. Petunjuk yang tidak jelas menyebabkan siswa
kehilangan waktu untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak
dapat melakukan apa yang seharusnya dilakukan.
2. Penggunaan kosa kata dan struktur kalimat yang sulit. Penggunaan kosa kata
atau struktur kalimat yang sulit dapat menyebabkan siswa terjebak untuk pemahaman
terhadap pemahaman maksud dari sebuah pertanyaan bukan untuk menyelesaikan
pertanyaan itu sendiri.

3. Ambiguitas. Ambiguitas yaitu adanya kemungkinan multi tafsir juga


menyebabkan menurunnya validitas sebuah tes.

4. Alokasi waktu yang tidak cukup. Seyogyanya sebuah tes disediakan waktu yang
cukup untuk mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam
menyelesaikan sebuah tes bisa jadi bukan karena siswa tidak mampu untuk
menyelesaikan tesnya tetapi karena keterbatasan kesempatan untuk mengerjakannya.

5. Penekanan yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah


ditebak kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat
validitas soal.

6. Kualitas butir tes yang tidak memadai untuk mengukur hasil belajar. Kualitas
yang tidak memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir
tingkat tinggi (higher order thinking) jelas tidak cukup hanya digunakan tes yang
bersifat untuk mengungkap pengetahuan faktual saja.

7. Susunan tes yang jelek.

8. Tes terlalu pendek.

9. Penyusunan butir tes yang tidak runtut .

10. Pola jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya
adalah A semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A,
D, C, B, A, dan sebagainya.

b. Faktor administrasi dan skor

Pemberian skor terhadap jawaban siswa (testee) harus dilakukan secara hati-hati
jangan sampai salah tulis atau meremehkan selisih angka walaupun hanya sedikit. Hal
ini akan menyebabkan hasil pengujian terhadap validitas akan memberikan makna
yang berbeda.

Berikut beberapa contoh faktor yang sumbernya yang berasal dari proses administrasi
dan skor.
a. Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan jawaban
dalam situasi yang tergesa – gesa.

b. Adanya kecurangan dalam tes sehingga tidak bisa membedakan siswa yang
belajar dengan yang melakukan kecurangan.

c. Pemberian petunjuk dari pengawas yang tidak dapat dilakukan semua siswa.

d. Teknik pemberian skor yang tidak konsisten, mislanya pada tes essay, juga
dapat mengurangi validitas tes evaluasi.

e. Siswa tidak dapat mengikuti arahan yang diberikan dalam tes baku.

f. Adanya orang lain yang bukan siswa yang termasuk dan menjawab item tes
yang diberikan.

c. Faktor tanggapan siswa

Seringkali terjadi bahwa interpretasi terhadap item – item tes evaluasi tidak valid,
karna dipengaruhi oleh jawab siswa dari interpretasi item – item pada tes evaluasi.
Sebagai contoh, sebuah tes para siswa menjadi tegang karena guru mata pelajaran
tersebut “killer” galak dan sebagainya. Sehingga siswa yang mengikuti tes tersebut
banyak yang gagal. Contoh lain, ketika siswa melakukan tes penampilan
keterampilan, ruangan terlalu ramai atau gaduh sehingga siswa tidak dapat
berkonsentrasi dengan baik. Ini semua dapat mengurangi nilai validitas instrumen
evaluasi.

Tanggapan siswa yang tidak serius biasanya dijumpai pada saat siswa diminta untuk
mengisi sebuah angket. Hal ini akan menyebabkan siswa mengisi angket secara
sembarangan karena merasa tidak penting maupun alasan -alasan yang lain. Oleh
karena itu berikan angket pada waktu dan kondisi yang tepat .

d. Hakikat kelompok dan criteria

Seperti sudah dijelaskan di atas bahwa validitas bersifat spesifik. Sebuah asesmen
atau instrumen alat ukur mungkin hanya valid untuk kelompok tertentu saja dan tidak
valid untuk kelompok yang lain. Sebagai contoh misalnya sebuah tes diujicobakan
pada sekelompok siswa pada sebuah sekolah dengan kualitas biasa –biasa saja tentu
akan berbeda hasilnya jika tes yang sama diberikan pada sjekelompok siswa pada
sekolah yang favorit.

Analisis butir soal merupakan suatu proses untuk mengkaji kualitas pada setiap butir
soal. Analisis butir soal bertujuan untuk mengidentifikasi soal yang baik dan soal
yang jelek. Dari hasil observasi penulis di sekolah SMA Negeri 1 Remboken pada
kelas X ulangan harian yang dibuat guru biologi belum di uji analisis teoritik yang
melingkupi isi dan kaidah penulisan soal dan belum di uji aspek empirik yang
melingkupi daya pembeda, tingkat kesukaran, reliabilitas, validitas, distraktor/
pengecoh. Sehingga perlu adanya analisis kembali untuk mengetahui soal-soal yang
baik, kurang baik, dan tidak baik.

Analisis soal antara lain bertujuan untuk mengadakan identifikasi soal-soal yang baik,
kurang baik, dan tidak baik. Dengan analisis soal dapat diperoleh informasi tentang
baik dan tidak baiknya soal dan petunjuk untuk mengadakan perbaikan Arikunto
(2013). Tujuan dari evaluasi mengarah langsung pada siswa, karena dengan evaluasi
siswa dapat mengetahui bagaimanana kemampuan, perubahan dalam pribadi siswa
serta sejauh mana siswa telah berhasil mengikuti pelajaran yang diberikan oleh guru.
Seperti evaluasi adalah pengumpulan kenyataan terjadi perubahan dalam diri siswa
dan menetapkan sejauh mana tingkat perubahan dalam pribadi siswa dalam
taksonomi Bloom ranah kognitif memegang peranan yang penting dalam proses
belajar siswa disamping afektif dan psikomotorik. Ranah kognitif meliputi tujuan-
tujuan yang berhubungan dengan berpikir, mengetahui dan pemecahan masalah.
Ranah kognitif memiliki enam jenjang yaitu pengetahuan (C1), pemahaman (C2),
penerapan (C3), analisis (C4), sintesis (C5), dan evaluasi (C6). Susunan ranah
kognitif tersebut menunjukkan bahwa setiap jenjang berikutnya merupakan tingkatan
pengetahuan atau kecakapan intelektual yang lebih tinggi dibandingkan dengan
tingkatan sebelumnya.

Menurut Arikunto (2010), sebuah tes yang dapat dikatakan baik sebagai alat
pengukur harus memenuhi persyaratan tes, yaitu memiliki: a. validitas, b. reliabilitas
c.objektivitas, d. praktikabilitas, dan e.ekonomis. Sebuah tes disebut valid apabila tes
itu dapat tepat mengukur apa yang hendak diukur. Tes tersebut dikatakan dapat
dipercaya jika memberikan hasil yang tepat apabila diteskan berkali-kali. Sebuah tes
dikatakan memiliki objektivitas apabila dalam pelaksanaan tes itu tidak ada faktor
subjektif yang mempengaruhi. Sebuah tes dikatakan memiliki praktikabilitas yang
tinggi apabila tes tersebut bersifat praktis yaitu mudah dilaksanakan, mudah
pemeriksaannya dan dilengkapi dengan petunjuk-petunjuk yang jelas. Sedangkan
persyaratan ekonomis ialah pelaksanaan tes tersebut tidak membutuhkan ongkos atau
biaya yang mahal, tenaga yang banyak, dan waktu yang lama.

Evaluasi atau penilaian merupakan bagian dari pelaksanaan pendidikan dan secara
keseluruhan tidak dapat dipisahkan dari kegiatan mengajar. Evaluasi merupakan
kegiatan yang dilakukan untuk mengukur dan menilai tingkat pencapaian kurikulum,
serta dijadikan landasan untuk mengambil keputusan bahwa proses pembelajaran
sudah baik atau memerlukan penyempurnaan. Oleh sebab itu, di samping ketepatan
pengunaan kurikulum dan proses pembelajaran yang benar, juga perlu adanya sistem
evaluasi yang baik dan terencana. Sistem evaluasi dalam kurikulum tahun 2006
menggunakan gabungan antara penilaian berbasis kelas (PBK) dan penilaian berkala.
Penilaian berkala dilakukan oleh pendidik untuk mengukur pencapaian kompetensi
peserta didik di akhir semester.

Evaluasi proses bertujuan menilai keefektifan dan efisiensi kegiatan pembelajaran


sebagai bahan untuk perbaikan dan penyempurnaaan program pelaksanaannya.
Tujuan utama melakukan evaluasi belajar adalah untuk mendapatkan informasi yang
akurat mengenai tingkat pencapaian tujuan pembelajaran oleh siswa. Evaluasi yang
baik haruslah berdasarkan atas tujuan pembelajaran yang ditetapkan oleh guru yang
kemudian benar-benar diusahakan pencapaiannya oleh guru dan siswa. Evaluasi
belajar terkait pendidikan dengan tujuan pembelajaran, sekaligus tujuan pendidikan.
Evaluasi tidak dapat dipisahkan dari proses kegiatan belajar mengajar karena evaluasi
merupakan bagian dari proses kegiatan belajar mengajar.

Kaidah penulisan soal pilihan ganda yang benarAnalisis teoritik tentang kaidah
penulisan soal pilihan ganda yang benar oleh Surapranata, (2004) adalah sebagai
berikut:

1. Menyatakan/pokok soal harus dirumuskan jelas

2. Untuk setiap soal hanya ada satu jawaban benar/paling benar

3. Alternatif jawaban sebaiknya logis dan pengecoh harus berfungsi mirip betul
dengan jawaban yang benar sehingga diingat kesukaran tinggi

4. Apabila alternatif jawaban (option) bentuk angka, susunlah secara berurutan mulai
dari angka terkecil hingga terbesar

5. Diusahakan untuk mencegah pengunaan option yang terakhir berbunyi “semua


pilihan jawaban salah” atau “semua pilihan jawaban benar”

6. Jumlah pilihan jawaban untuk tiap soal dari satu perangkat tes hendaknya 4 atau 5
option

7. Jawaban yang benar hendaknya tersebar letaknya dan ditentukan secara random
(acak), jangan sampai menurut urutan atau aturan tertentu dan memperhatikan jumlah
option yang benar antara a-b-c-d-e hendaknya relatif sama.
8. Stem dan option hendaknya pernyataan yang diperlukan saja

9. Diusahakan jangan mengunakan perumusan yang bersifat negatif.

10. Cara memenggal atau memutus kalimat, menumbuhkan tanda-tanda, koma dan
sebagainya hendaknya ditulis secara benar, usahakan tidak terjadi kesalahan cetak
sehingga tidak mengganggu konsentrasi testee dalam memberikan jawaban soal.

Validitas

Validitas merupakan suatu ukuran yang menunjukan kevalidan suatu instrumen. Jadi
pengujian validitas itu mengacu pada sejauh mana suatu instrument dalam
menjalankan fungsi. Instrumen dikatakan valid jika instrumen tersebut dapat
digunakan untuk mengukur apa yang hendak diukur. (Menurut Sudijono (2006),
sebagai contoh, ingin mengukur kemampuan siswa dalam biologi. Kemudian
diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar
ditangkap maknanya. Akhirnya siswa tidak dapat menjawab, akibat tidak memahami
pertanyaannya.

Daya pembedaRumus yang dipakai untuk mencari indeks daya pembeda soal tes
adalah:

D = BA – BB = PA – PB

Keterangan:

J : Jumlah peserta tes

JA: Banyaknya peserta kelompok atas

JB: Banyaknya peserta kelompok bawah

BA: Banyaknya peserta kelompok atas yang menjawab soal dengan benar

BB: Banyaknya peserta kelompok bawah yang menjawab soal dengan benar

PA = BB: Proporsi peserta kelompok atasyang menjawab dengan benar

PB = BB: Proporsi peserta kelompok yang menjawab dengan benar

Analisis Validitas

Berdasarkan hasil analisis validitas butir soal ulangan harian buatan guru mata
pelajaran Biologi di SMA Negeri 1 Remboken Kelas XE, diperoleh 12 butir soal
(60%) yang valid artinya soal tersebut dapat mengukur kemampuan yang diharapkan
dan 8 butir soal (40%) yang tidak valid artinya soal tersebut tidak dapat mengukur
kemampuan yang diharapkan dan diperoleh rata-rata validitas 0,507 (r hitung > r
Tabel yaitu 0,507 > 0,413). Menurut Sugiyono (2013) bahwa instrument yang valid
berarti alat ukur yang digunakan untuk mendapatkan data (mengukur) itu valid.
Instrument tersebut dapat digunakan untuk mengukur apa yang hendak diukur.
Pengujian validitas dibuktikan dengan diperolehnya kecocokan empirik antara
interprestasi skor dan penggunaannya.

Cara manual validasi butir soal objektif

1.     Validitas instrumen adalah tingkat kemampaun suatu instrumen mengukur apa yang
seharusnya diukur, khususnya dalam proses pembelajaran
2.     Dari segi analisis validitas dibagi atas validitas rasional dan validitas empirik
3.     Validitas rasional terdiri atas validitas isi (content) dan validitas bangun (construct)
4.     Validitas empiris terdiri atas valditas ramalan (predictive) dan validitas bandingan
(concurrent )
5.     Validitas rasional dapat dianalisis secara rasio melalui GPPP dan panel, sedangkan
valitas empirik dianalisis secara statistik
6.     Validitas butir secara statistik dianalisis berdasakan jenis data yang terkumpul. Data
diskrit (misalnya hasil tes obyektif) dihitung dengan korelasi point biserial sedangkan
data kontinu (misalnya hasil tes uraian atau skala sikap) digunakan korelasi Pearson
product – moment.
DAFTAR PUSTAKA

Arikunto, Suharsimi. 2007. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

Amir Daien Indrakusuma. 1975. Evaluasi Pendididkan. Jilid I terbitan sendiri.

Saifuddin azwar. 1997. Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar.

Arikunto, S. (2010). Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Askara.

Aikunto, S. (2013). Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Askara.

Purwanto N. (2006), Prinsip dan Teknik Evaluasi Pengajaran. Bandung: Remaja


karya.
Scarvia B. Anderson, Samuel Ball, Richard T. Murphy, and Associates. (1975).
Encyclopedia of Educational Evaluation. San Fransisco: Yessey Bass, Inc Publishers.

Sudijono, A. (2006). Pengantar Evaluasi Pendidikan. Jakarta: Raja Grafindo Persada.

Sugiyono. (2013). Metode Penelitian Kuantitatif Kualitatif dan R & D. Bandung:


Alfabeta.

Surapranata, S. (2004). Analisis Validitas, Reabilitas,dan Interprestasi Hasil Tes.


Bandung: Remaja Rosdakarya

Anda mungkin juga menyukai