Anda di halaman 1dari 30

MAKALAH VALIDASI TES HASIL BELAJAR MATEMATIKA

PENILAIAN PEMBELAJARAN MATEMATIKA

DOSEN PENGAMPU:
Dra. Armis, M.Pd

DISUSUN OLEH:
KELOMPOK 7

Aghniya Syakira Mufidah 1905155511


Hayati Ramadhani Putri 1905155385
Putri Chairunisah 1905124704
Putri Widayanti 1905110885

PROGRAM STUDI PENDIDIKAN MATEMATIKA


FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS RIAU
PEKANBARU

2021
KATA PENGANTAR

Puji syukur kepada Allah SWT yang telah memberikan rahmat dan karunia-Nya sehingga
kita diberikan kesehatan jasmani dan rohani hingga saat ini dan telah memberikan kelancaran
serta kemudahan dalam merangkai kata demi kata dalam sebuah makalah Penilaian
Pembelajaran Matematika tentang Validasi Tes Hasil Belajar. Tujuan penulis menulis makalah
ini adalah untuk memenuhi tugas Mata Kuliah Penilaian Pembelajaran Matematika Materi
Validasi Tes Hasil Belajar.
Selanjutnya, penulis berterima kasih kepada orangtua yang senantiasa mendoakan kami
sehingga penulis berhasil menyelesaikan makalah ini. Tidak lupa pula kami ucapkan terima
kasih kepada dosen, Ibu Dra. Armis, M.Pd yang senantiasa membimbing penulis dalam proses
pembuatan makalah.
Penulis selaku insan biasa yang tidak luput dari kesalahan mohon maaf yang sebesar-
besarnya jika da kekurangan dalam penyampaian dan penyajian makalah ini. Penulis
mengharapkan kritik dan saran yang membangun dari pembaca agar penulis dapat memperbaiki
kekurangan di dalam makalah ini. Semoga makalah ini dapat bermanfaat.

Pekanbaru, 7 Juni 2021

Penulis

i
DAFTAR ISI

KATA PENGANTAR .................................................................................................................. i


DAFTAR ISI ................................................................................................................................ ii
BAB I PENDAHULUAN ............................................................................................................. 1
A. Latar Belakang ................................................................................................................. 1
B. Rumusan Masalah ........................................................................................................... 2
C. Tujuan Penulisan ............................................................................................................. 2
D. Manfaat Penulisan ........................................................................................................... 2
BAB II PEMBAHASAN .............................................................................................................. 4
A. Pengertian Validasi .......................................................................................................... 4
B. Validasi Teoritik .............................................................................................................. 4
1. Validasi Isi .................................................................................................................. 5
2. Validasi Muka ............................................................................................................ 6
3. Validasi Kontruksi Psikologik .................................................................................. 7
C. Validasi Kriterium ........................................................................................................... 9
1. Pengertian Validasi Kriterium ................................................................................. 9
2. Koefisien Validasi ...................................................................................................... 9
3. Reliabilitas ................................................................................................................ 10
4. Daya Pembeda .......................................................................................................... 11
5. Indeks Kesukaran .................................................................................................... 18
6. Efektifitas Option ..................................................................................................... 23
BAB III PENUTUP .................................................................................................................... 25
A. Kesimpulan ..................................................................................................................... 25
B. Saran ............................................................................................................................... 26
DAFTAR PUSTAKA ................................................................................................................. 27

ii
BAB I
PENDAHULUAN

A. Latar Belakang
Matematika adalah ilmu pengetahuan yang abstrak, sehingga kita membutuhkan
pemahaman dan keterampilan yang mendalam untuk bisa menguasainya. Di antara
keterampilan yang harus dimiliki adalah keterampilan berpikir dalam menyelesaikan soal.
Namun setelah diprediksi lebih lanjut, ternyata bukan hanya siswa yang harus memiliki
keterampilan dalam menyelesaikan soal, tetapi guru pun harus memiliki keterampilan
tersebut. Melihat posisinya sebagai seorang pendidik/pengajar, guru tidak hanya harus
mampu menyelesaikan soal sebagai gambaran keprofesionalan, akan tetapi juga harus
terampil dalam membuat soal dan mampu menyesuaikan soal tersebut sesuai dengan
tingkat perkembangan berpikir siswa.
Berdasarkan Peraturan Menteri Pendidikan dan Kebudayaan No. 66 tahun 2013
tentang penilaian hasil belajar oleh satuan pendidikan dan penilaian hasil belajar oleh
pemerintah, penilaian pendidikan diartikan sebagai proses pengumpulan dan pengolahan
informasi untuk mengukur pencapaian hasil belajar peserta didik mencakup penilaian
otentik, penilaian diri, penilaian berbasis portofolio, ulangan, ulangan harian, ujian
tengah semester, ulangan akhir semester, ujian tingkat kompetensi, ujian mutu tingkat
kompetensi, ujian nasional, dan ujian sekolah/madrasah. Hal tersebut, merupakan
landasan guru di sekolah dalam memberikan ulangan harian, ujian akhir semester, tes
tertulis dan tes lainnya sebagai wujud penjaminan mutu pendidikan.
Tes yang diberikan oleh guru kepada siswa merupakan bentuk evaluasi terhadap
pembelajaran yang telah berlangsung. Secara umum tes bertujuan untuk mengetahui
perkembangan pendidikan siswa. Sehingga, dalam memberikan soal yang akan diteskan,
guru harus mengetahui kelayakan soal tersebut digunakan sebagai alat evaluasi. Selain
itu, guru pun harus mengetahui bahwa jenis soal yang baik adalah soal-soal yang tidak
hanya terdiri dari soal yang mudah saja, atau yang sedang saja ataupun yang sukar saja,
akan tetapi ketiganya harus ada, tersusun secara terstruktur dan penuh pertimbangan.
Ketiganya saling identik dan saling mempengaruhi, karena masing-masing mempunyai

1
kelebihan-kelebihan tertentu berupa manfaat yang bagus terutama demi kepentingan
siswa.
Untuk menguji kelayakan soal yang digunakan sebagai alat evaluasi untuk
mengukur kemampuan siswa, maka guru perlu melakukan validasi terlebih dahulu. Hal
ini bertujuan agar tujuan dari evaluasi dapat tercapai sepenuhnya. Berdasarkan penjelasan
tersebut di atas, maka makalah ini akan membahas mengenai “Validasi Tes Hasil
Belajar”

B. Rumusan Masalah
Berdasarkan latar belakang yang telah dikemukakan di atas, maka yang menjadi
rumusan masalah dalam makalah ini adalah:
1. Apakah yang dimaksud dengan validasi?
2. Apakah yang dimaksud dengan validasi teoritik dan apa saja yang termasuk ke
dalam validasi teoritik?
3. Apakah yang dimaksud dengan validasi kriterium dan apa saja yang termasuk ke
dalam validasi kriterium?

C. Tujuan Penulisan
Tujuan dari penulisan makalah ini antara lain sebagai berikut:
1. Untuk memenuhi tugas mata kuliah Penilaian Pembelajaran Matematika.
2. Untuk mengetahui pengertian validasi.
3. Untuk mengetahui pengertian validasi teoritik dan jenis-jenisnya.
4. Untuk mengetahui pengertian validasi kriterium dan jenis-jenisnya.

D. Manfaat Penulisan
Hasil penulisan makalah ini diharapkan dapat bermanfaat bagi pengembangan
pembelajaran matematika antara lain, dapat meningkatkan keprofesionalan guru dalam
pembuatan soal, dan meningkatkan perhatian guru serta pihak kurikulum
sekolah/madrasah dalam proses pemilihan dan penggunaan soal yang cocok bagi siswa
disesuaikan dengan tingkat perkembangan pendidikan matematika siswa. Selain itu juga
dapat memberikan informasi sebagai upaya untuk meningkatkan pertumbuhan dan

2
pengembangan pendidikan khususnya matematika, dan yang terakhir, memberikan
rujukan dalam rangka menumbuhkembangkan pendidikan matematika.

3
BAB II
PEMBAHASAN

A. Pengertian Validasi
Validasi berasal dari kata validity yang berarti sejauh mana ketepatan dan
kecermatan suatu instrumen (tes) dalam melakukan fungsi ukurnya. Suatu tes
dikatakan memiliki validitas yang tinggi apabila instrumen tersebut menjalankan
fungsi ukur secara tepat atau memberikan hasil ukur yang sesuai dengan maksud
dilakukannya pengukuran tersebut.
Validasi tes pada dasarnya merujuk kepada derajat fungsi pengukuran suatu
tes, atau derajat kecermatan ukurnya suatu tes. Validitas suatu tes mempermasalahkan
apakah tes tersebut benar-benar mengukur apa yang hendak diukur. Artinya, untuk
mengukur seberapa jauh suatu tes mampu mengungkapkan dengan tepat ciri atau
keadaan yang sesungguhnya dari objek ukur, akan tergantung dari tingkat validasi tes
yang bersangkutan. Validasi berkenaan dengan ketepatan alat penilaian terhadap
konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai.
Suatu tes yang valid untuk tujuan tertentu atau pengambilan keputusan
tertentu, mungkin tidak valid untuk tujuan atau pengambilan keputusan lain. Jadi
validitas suatu tes, harus selalu dikaitkan dengan tujuan atau pengambilan keputusan
tertentu. Tes masuk di SMA misalnya harus selalu dikaitkan dengan seberapa jauh tes
masuk tersebut dapat mencerminkan prestasi atau hasil belajar para calon peserta
didik baru setelah belajar nanti.
Terdapat dua jenis validasi, yakni validasi teoritik dan validasi kriterium.
Validasi teoritik atau validasi logika adalah validasi yang ditentukan berdasarkan
pertimbangan pakar. Sementara itu validasi kriterium adalah validasi alat evaluasi
yang dihubungkan dengan kriteria tertentu.

B. Validasi Teoritik
Istilah validasi teoritik atau validasi logis mengandung kata logis yang berasal
dari kata logika yang berarti penalaran. Validasi teoritik yang biasa dikenal dengan
validasi logis atau validitas penalaran adalah sebuah instrumen yang memenuhi

4
persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang
terpenuhi karena instrumen bersangkutan sudah dirancang secara baik, mengikuti
teori dan ketentuan yang ada. Dengan kata lain, instrumen tersebut merupakan
instrumen yang kondisinya memenuhi persyaratan berdasarkan penalaran. Artinya,
validasi teoritik dapat dicapai jika suatu instrumen disusun berdasarkan ketentuan-
ketentuan yang ada. Dengan demikian dapat dikatakan bahwa validasi teoritik tidak
perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai
disusun. Terdapat tiga jenis validasi teoritik, yakni validasi isi, validasi muka, dan
validasi konstruksi psikologik.

1. Validasi Isi
Validasi isi bagi sebuah instrument menunjukan suatu kondisi yang
disusun berdasarkan isi materi pelajaran yang akan dievaluasi. Jadi sebuah
instrumen pada validitas isi harus divalidasi oleh orang yang ahli di bidangnya.
Orang yang memvalidasi disebut sebagai validator. Untuk mengetahui apakah
instrumen tes itu valid atau tidak, harus dilakukan melalui penelaahan kisi-kisi
instrumen untuk memastikan bahwa butir-butir instrumen itu sudah mewakili atau
mencerminkan keseluruhan konten atau materi yang seharusnya dikuasai secara
proporsional . Adapun validasi yang dinilai oleh validator antara lain:
a. Kesesuaian antara indikator dan butir soal.
b. Kejelasan bahasa atau gambar dalam soal.
c. Kesesuaian soal dengan tingkat kemampuan siswa.
d. Kebenaran materi atau konsep.
Sebuah tes dikatakan memiliki validasi isi apabila mengukur apa yang
menjadi domain dan tujuan khusus tertentu yang sama dengan isi pelajaran yang
telah diberikan di kelas. Validitas isi (content validity) sering pula dinamakan
validitas kurikulum yang mengandung arti bahwa suatu alat ukur dipandang valid
apabila sesuai dengan isi kurikulum yang hendak diukur. Sebagian ahli tes
berpendapat bahwa tidak ada satupun pendekatan statistik yang dapat digunakan
untuk menentukan validitas isi tes.

5
Validasi isi (Content Validity) menjabarkan sejauh mana pertanyaan,
tugas atau butir dalam suatu tes atau instrumen dapat mewakili secara keseluruhan
dan proporsional perilaku sampel yang dikenai tes. Validasi isi mengukur derajat
kemampuan tes dalam mengukur yang mencakup substansi elemen yang ingin
diukur. Validasi isi dipakai untuk mengukur kemampuan belajar, hasil belajar
atau prestasi belajar.
Prosedur yang dapat digunakan dalam menentukan validitas isi yaitu:
a. Mendefinisikan domain yang hendak diukur,
b. Menentukan domain yang akan diukur oleh masing-masing soal,
c. Membandingkan masing-masing soal dengan domain yang sudah
ditetapkan.
2. Validasi muka
Validitas muka adalah tipe validitas yang paling rendah signifikannya
karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila
isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat
dikatakn validitas muka telah terpenuhi. Validitas muka bisa dikatakan juga
sebagai validitas rendah dari validitas isi.
Untuk menguji validitas setiap butir soal maka skor-skor yang ada pada
butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal
dinyatakan skor X dan skor total dinyatakan sebagai skor Y, dengan diperolehnya
indeks validitas setiap butir soal, dapat diketahui butir-butir soal manakah yang
memenuhi syarat dilihat dari indeks validitasnya (Arikunto, 1999:78).
Tentukan koefisien korelasi antara skor hasil tes yang akan diuji
validitasnya dengan hasil tes yang terstandar yang dimiliki oleh orang yang sama
dengan menggunakan rumus korelasi produk momen di bawah ini:

6
Hitung koefisien validitas instrumen yang diuji (r-hitung), yang nilainya
sama dengan korelasi korelasi hasil langkah sebelumnya dikali koefisien validitas
instrumen terstandar.
Bandingkan nilai koefisien validitas dengan nilai koefisien korelasi Pearson /
tabel Pearson (r-tabel) pada taraf signifikansi a (biasanya dipilih 0,05) dan n =
banyaknya data yang sesuai.
Kriterianya adalah :
 Instrumen valid, jika r-hitung = r-tabel
 Instrumen tidak valid, jika r-hitung < r-tabel
Tentukan kategori dari validitas instrument yang mengacu pada
pengklasifikasian validitas yang dikemukakan oleh Guilford (1956:145) sebagai
berikut:
0,80 < rxy 1,00 validitas sangat tinggi (sangat baik)
0,60 < rxy 0,80 validitas tinggi (baik)
0,40 < rxy 0,60 validitas sedang (cukup)
0,20 < rxy 0,40 validitas rendah (kurang)
0,00 < rxy 0,20 validitas sangat rendah (jelek)
rxy 0,00 tidak valid

3. Validasi konstruksi psikologik


Menurut Scarvia B. Anderson, menyatakan bahwa sebuah instrumen
dikatakan valid jika instrumen tersebut tersebut dapat mengukur apa yang hendak
diukur. Adapun uji validitas perlu dilakukan guna mengukur sah atau tidaknya
suatu instrumen. Instrumen yang mempunyai validitas tinggi akan memiliki

7
kesalahan pengukuran yang kecil, yang berarti skor setiap subyek yang diperoleh
instrumen tersebut tidak jauh berbeda dari skor sesungguhnya.
Terkait dengan instrumen penilaian aspek non-kognitif yang berupa
angket, suatu angket dikatakan valid jika pertanyaan pada angket tersebut mampu
untuk mengungkapkan sesuatu yang akan diukur oleh angket tersebut. Validitas
akan merujuk kepada sejauh mana hasil pengukuran suatu instrumen dapat
ditafsirkan terhadap atribut yang diukur.
Validitas konstruk merupakan salah satu tipe validitas internal rasional
suatu instrumen yang menunjukkan sejauh mana instrumen tersebut mengungkap
suatu trait atau konstruk teoretik yang hendak diukurnya. Dalam hal ini konstruk
merupakan kerangka dari suatu konsep. Pengertian konstruk ini bersifat
terpendam dan abstrak sehingga berkaitan dengan banyak indikator perilaku
empiris yang menuntut adanya uji analisis seperti analisis faktor.
Menurut Suryabrata (2000), validitas konstruk (construct validity)
menyatakan sejauh mana skor-skor hasil pengukuran dengan suatu instrumen itu 6
merefleksikan konstruk teoretik yang mendasari penyusunan instrumen tersebut.
Sutrisno Hadi (2001) menyamakan construct validity dengan logical validity atau
validity by definition. Suatu instrumen non tes mempunyai validitas konstruk, jika
instrumen tersebut dapat digunakan untuk mengukur gejala sesuai dengan yang
didefinisikan. Misalnya untuk mengukur minat terhadap matematika, perlu
didefinisikan terlebih dahulu apa itu minat terhadap matematika, demikian juga
untuk mengukur kemandirian belajar siswa maka perlu terlebih dahulu
didefinisikan mengenai apa itu kemandirian belajar siswa. Setelah konsep atau
defenisi itu diperoleh selanjutnya disiapkan instrumen yang digunakan untuk
mengukur minat terhadap matematika sesuai definisi. Dalam hal ini, untuk
melahirkan definisi tentu saja diperlukan teori-teori. Sutrisno Hadi menyatakan
bahwa jika memang bangunan teorinya sudah benar, maka hasil pengukuran
dengan alat pengukur yang berbasis pada teori itu sudah dipandang sebagai hasil
yang valid. Namun demikian, walaupun secara teoritis dapat dikatakan sudah
valid, pengujian secara empiris terhadap suatu instrumen non-tes tetap diperlukan

8
untuk mengungkap seberapa jauh setiap variabel yang akan diukur dapat
dijelaskan oleh setiap dimensi dalam instrumen yang telah disusun.
Adapun langkah-langkah melakukan uji validitas konstruk dengan
menggunakan analisis faktor antara lain sebagaimana dikemukakan De Vaus
(1991) yakni: (1) memilih variabel yang akan dianalisis, (2) ekstraksi awal
seperangkat faktor, (3) ekstraksi akhir seperangkat faktor dengan rotasi, dan (4)
menyusun skala untuk digunakan analisis lanjut

C. Validasi Kriteria
1. Pengertian Validasi kriteria
Validasi kriteria Adalah validasi suatu instrumen dengan
membandingkannya dengan instrumen-pengukuran lainnya yang sudah valid dan
reliabel dengan cara mengkorelasikannya, bila korelasinya signifikan maka
instrumen tersebut mempunyai validitas kriteria. Terdapat dua bentuk Validitas
kriteria yaitu : Validitas konkuren (Concurrent validity), Validitas ramalan
(Predictive validity). Validitas konkuren adalah kemampuan suatu instrumen
pengukuran untuk mengukur gejala tertentu pada saat sekarang kemudian
dibandingkan dengan instrumen pengukuran lain untuk konstruk yang sama.
Validitas ramalan adalah kemampuan suatu instrumen pengukuran
memprediksi secara tepat dengan apa yang akan terjadi di masa datang.
Contohnya apakah test masuk sekolah mempunyai validitas ramalan atau tidak
ditentukan oleh kenyataan apakah terdapat korelasi yang signifikan antara hasil
test masuk dengan prestasi belajar sesudah menjadi siswa, bila ada, berarti test
tersebut mempunyai validitas ramalan

2. Koefisien Validasi
Validitas instrumen adalah ketepatan instrumen untuk mengukur apa yang
seharusnya diukur melalui item tes Menurut Popham terdapat tiga kategori
validitas, yaitu validitas isi (content validity), validitas berdasarkan kriteria
(criterion-related validity) dan validitas konstruk. Validitas konstruk adalah

9
validitas yang menunjukkan sejauh mana suatu tes mengukur trait atau konstruk
teoritik yang hendak diukur (Allen dan Yen, 1979: 108).
Ebel & Frisbie (1986: 96) menyatakan “The term construct refers to
psychological construct, each theoretical conceptualization about an aspect of
human behavior that cannot be measured or observed directly”. Ini berarti bahwa
validitas konstruk lebih banyak berkaitan dengan masalah psikologis yang tidak
dapat diukur atau diobservasi secara langsung misalnya bentuk intelegensi,
prestasi, motivasi, kecerdasan, dan lainlain. Berkaitan dengan karakteristik
psikologis, hasil pengukuran yang diperoleh sebenarnya diharapkan dapat
menggambarkan atau memberikan skor/ nilai suatu karakteristik lain yan menjadi
perhatian utama. Oleh karena itu uji validitas yang tepat untuk menganalisis
instrument nontes adalah validitas konstruk. Dalam hal ini analisis yang
digunakan adalah analisis faktor dengan menggunakan bantuan SPSS.
Nilai koefisien ini disebut sebagai koefisien validitas (Fraenkel, Wallen, &
Hyun, 2012). Nilai koefisien validitas berkisar antara +1,00 sampai -1,00. Nilai
koefisien +1,00 mengindikasikan bahwa individu pada uji instrumen maupun uji
kriteria, memiliki hasil yang relatif sama, sedangan jika koefisien validitas
bernilai 0 mengindikasikan bahwa tidak ada hubungan antara instrumen dengan
kriterianya. Semakin tinggi nilai koefisien validitas suatu instrumen, maka
semakin baik instrumen tersebut.

3. Reliabilitas
Reliabilitas berasal dari kata reliability berarti sejauh mana hasil suatu
pengukuran dapat dipercaya. Suatu hasil pengukuran dapat dipercaya apabila
dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang
sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang diukur
dalam diri subyek memang belum berubah. Nur (1987: 47) menyatakan bahwa
reliabilitas ukuran menyangkut seberapa jauh skor deviasi individu, atau skor-z,
relatif konsisten apabila dilakukan pengulangan pengadministrasian dengan tes
yang sama atau tes yang ekivalen.

10
Azwar (2003 : 176) menyatakan bahwa reliabilitas merupakan salah-satu
ciri atau karakter utama instrumen pengukuran yang baik. Arifin (1991: 122)
menyatakan bahwa suatu tes dikatakan reliabel jika selalu memberikan hasil yang
sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang
berbeda.
Karena instrumen menggunakan skala Likert, dimana datanya berupa data
interval, maka pengujian reliabilitas yang tepat adalah menggunakan Formula
Alpha (Ebel & Frisbie, 1986:79) dengan formula sebagai berikut:

𝑘 ∑ 𝑠𝑖2
𝑟= [1 − 2 ]
𝑘−1 𝑠𝑡

Keterangan :
k = banyak butir
𝑠𝑖2 = varians butir ke-i
∑ 𝑠𝑖2 = jumlah varians butir
𝑠𝑡2 = varians total
Pengujian reliabilitas dapat dilakukan dengan bantuan program SPSS dan Exel.

4. Daya Beda
Dali S. Naga (2002:67) mengatakan bahwa daya pembeda soal adalah
kemampuan soal dengan skornya dapat membedakan peserta tes dari kelompok
tinggi dan kelompok rendah. Dengan kata lain makin tinggi daya pembeda soal
makin banyak peserta dari kelompok tinggi yang dapat menjawab soal dengan
benar dan makin sedikit peserta tes dari kelompok rendah yang dapat menjawab
soal dengan benar. Agar dapat diterima maka nilai D (discrimination: daya
pembeda soal) adalah 0,30 atau lebih. Sedangkan untuk dapat dinyatakan cukup
memuaskan adalah 0,40 ke atas.
Daya beda item (item-discrimination index) adalah perbedaan antara
proporsi peserta tes kelompok atas yang menjawab benar pada kelompok atas dan
proporsi peserta tes yang menjawab benar pada kelompok bawah (Allen,

11
1979:122). Analogi dari pendapat di atas, daya beda untuk instrumen nontes
dalam hal ini sikap siswa SMP terhadap matematika adalah perbedaan proporsi
siswa yang bersikap positif terhadap matematika dan proporsi siswa yang bersikap
negatif terhadap matematika. Menurut Allen dan Yen (1979:122) indek
diskriminasi item dapat dihitung dengan menggunakan rumus :
𝑈𝑖 𝐿𝑖
𝑑𝑖 = −
𝑛𝑖𝑢 𝑛𝑖𝐿

Keterangan:
𝑈𝑖
= proporsi peserta tes pada kelompok atas yang menjawab benar butir tes ke-i
𝑛𝑖𝑢
𝐿𝑖
= proporsi peserta tes pada kelompok bawah yang menjawab benar butir tes
𝑛𝑖𝐿

ke-i
Apabila skor total tes terdistribusi normal, penentuan banyaknya kelompok atas
dan kelompok bawah adalah sebesar 27% dari seluruh peserta tes (Allen,
1979:122)

Selanjutnya Ebel & Frisbie (1986: 234) memberikan patokan indeks daya
beda dan langkah apa yang yang perlu dilakukan seperti pada tabel
Kriteria Indeks Diskriminasi
Indeks Daya Beda Evaluasi Butir
> 0,4 Butir yang baik
0,3 – 0,39 Secara rasional baik tetap
memungkinkan untuk diperbaiki
0,2 – 0,29 Butir memerlukan revisi
< 0,19 Butir harus dieliminasi
Daya beda dapat dihitung dengan menggunakan bantuan program
Microsoft Exel dan Iteman

12
Contoh Pengujian Validitas dan Realibilitas Instrumen
Misalnya kita akan menguji soal tes bidang studi matematika yang
berbentuk soal objektif, asumsikan bahwa instrument tes sudah di validasi oleh
para pakar dibidangnya. Selanjutnya soal tes di uji cobakan di sekolah, adapun
responden nya 10 orang siswa dan diperoleh data sebagai berikut:

Untuk mencari Standar Deviasi diperlukan nilai–nilai seperti pada tabel


berikut:

Untuk mendapatkan nilai pada kolom 2 menggunakan rumus xi -x yang


mana xi merupakan skor total butir, lihat pada tabel di atas yaitu Xi =3,6 dan x
merupakan skor tiap butir lihat pada kolom 1. Jadi untuk nilai pada baris 2 kolom
2 adalah xi -x=3,6-4=0,4 dan baris 2 kolom 3 dengan menguadratkan nilai
tersebut yakni (xi -x)2 =(0,4)2 =0,16. Untuk baris 3 kolom 2 xi -x=3,6-5=1,4 dan

13
baris 3 kolom 3 dengan menguadratkan nilai tersebut yakni (xi -x)2 =(1,4)2 =1,96
dan seterusnya.
Rumus yang diperlukan:

∑(𝑥1 − 𝑥)2
𝑠𝑡 = √
𝑛−1

Dari tabel diatas diperoleh∑(xi -x) 2 = 44,4 dengan n atau responden 10


orang sehingga kita dapatkan standar deviasi seperti berikut:

∑(𝑥1 − 𝑥)2 44,4


𝑠𝑡 = √ = √ = 2,221
𝑛−1 10 − 1

Setelah mendapatkan standar deviasi atau St = 2,221 kita akan menghitung


korelasi biserial untuk tiap butir soal objektif pada tabel dengan menggunakan
rumus dibawah ini:

𝑥1 − 𝑥̅𝑡 𝑝1
̅̅̅
𝑟𝑏𝑖𝑠(𝑡) = √
𝑆𝑡 𝑞1

Ket. rumus:
𝑥1 = rata – rata skor total responden yang menjawab butir nomor i.
̅̅̅
𝑥̅𝑡 = rata – rata skor total semua responden St = standar Deviasi skor total semua
responden p 𝑝𝑖 = proporsi jawaban yang benar untuk butir soal bernomor i
𝑞𝑖 = proporsi jawaban yang salah untuk butir soal bernomor i

Perhitungan korelasi biserial untuk butir 1 sampai 7 sebagai berikut:


1. Perhatikan tabel diatas dengan baris rata-rata pada skor total ̅̅̅
𝑥1 . Maka dipeoleh:
3
𝑥1 = 2 = 4,57.
̅̅̅ 𝑝1 kita dapatkan dari responden yang menjawab benar dari
7
seluruh responden, dari no soal 1 ada = 0,7 yang menjawab benar dan 𝑞1 =
10

1 − 0,7 = 0,3 menjawab salah, sehingga:

14
𝑥1 − 𝑥̅𝑡 𝑝1
̅̅̅ 4,57 − 3,6 0,7
𝑟𝑏𝑖𝑠(𝑡) = √ = √ = 0,667
𝑆𝑡 𝑞1 2,221 0,3

2. Perhatikan tabel diatas dengan baris rata-rata pada skor total ̅̅̅.
𝑥2 Maka dipeoleh
36
𝑥2 =
̅̅̅ = 4 kita dapatkan dari responden yang menjawab benar dari seluruh
9
9
responden, dari no soal 2 ada 10 = 0,9 yang menjawab benar dan 𝑞2 = 1 − 0,8 =

0,1 menjawab salah, sehingga:

𝑥2 − 𝑥̅𝑡 𝑝2
̅̅̅ 4 − 3,6 0,9
𝑟𝑏𝑖𝑠(𝑡) = √ = √ = 0,540
𝑆𝑡 𝑞2 2,221 0,1

3. Perhatikan tabel diatas dengan baris rata-rata pada skor total ̅̅̅.
𝑥3 Maka dipeoleh :
25
̅̅̅̅
𝑥3 = = 5 kita dapatkan dari responden yang menjawab benar dari seluruh
5
5
responden, dari no soal 3 ada = 0,5  yang menjawab benar dan 𝑞3 = 1 −
10

0,5 = 0,5 menjawab salah, sehingga:

𝑥3 − 𝑥̅𝑡 𝑝3
̅̅̅ 5 − 3,6 0,5
𝑟𝑏𝑖𝑠(𝑡) = √ = √ = 0,630
𝑆𝑡 𝑞3 2,221 0,5

4. Perhatikan tabel diatas dengan baris rata-rata pada skor total ̅̅̅.
𝑥4 Maka dipeoleh
30
̅̅̅̅
𝑥3 = = 5. 𝑝4 kita dapatkan dari responden yang menjawab benar dari seluruh
6
6
responden, dari no soal 4 ada 10 = 0,6 yang menjawab benar dan 𝑞4 = 1 − 0,6 =

0,4 menjawab salah, sehingga:

𝑥4 − 𝑥̅𝑡 𝑝4
̅̅̅ 5 − 3,6 0,6
𝑟𝑏𝑖𝑠(𝑡) = √ = √ = 0,772
𝑆𝑡 𝑞4 2,221 0,4

15
5. Perhatikan tabel diatas dengan baris rata-rata pada skor total ̅̅̅.
𝑥5 Maka dipeoleh
26
̅̅̅̅
𝑥5 = = 5,2. 𝑝5 kita dapatkan dari responden yang menjawab benar dari
5
5
seluruh responden, dari no soal 5 ada = 0,5 yang menjawab benar dan 𝑞5 =
10

1 − 0,5 = 0,5 menjawab salah, sehingga:

𝑥4 − 𝑥̅𝑡 𝑝5
̅̅̅ 5,2 − 3,6 0,5
𝑟𝑏𝑖𝑠(𝑡) = √ = √ = 0,747
𝑆𝑡 𝑞5 2,221 0,5

6. Perhatikan tabel diatas dengan baris rata-rata pada skor total ̅̅̅.
𝑥6 Maka dipeoleh
18
̅̅̅̅
𝑥6 = = 6. 6 kita dapatkan dari responden yang menjawab benar dari seluruh
3
3
responden, dari no soal 6 ada 10 = 0,3 yang menjawab benar dan 𝑞4 = 1 − 0,3 =

0,7 menjawab salah, sehingga:

𝑥6 − 𝑥̅𝑡 𝑝6
̅̅̅ 6 − 3,6 0,3
𝑟𝑏𝑖𝑠(𝑡) = √ = √ = 0,707
𝑆𝑡 𝑞6 2,221 0,7

7. Perhatikan tabel diatas dengan baris rata-rata pada skor total ̅̅̅.
𝑥7 Maka dipeoleh
7
̅̅̅̅
𝑥7 = = 7. 𝑝7 kita dapatkan dari responden yang menjawab benar dari seluruh
1
1
responden, dari no soal 7 ada 10 = 0,1 yang menjawab benar dan 𝑞4 = 1 − 0,1 =

0,9 menjawab salah, sehingga:

𝑥7 − 𝑥̅𝑡 𝑝7
̅̅̅ 7 − 3,6 0,1
𝑟𝑏𝑖𝑠(𝑡) = √ = √ = 0,510
𝑆𝑡 𝑞7 2,221 0,9

Dari penjabaran di atas kita rangkum menjadi berikut:

16
Untuk r tabel dengan n=10 dan alpha 5%
Realibitas untuk skor butir soal objektif dengan rumus KR-20:

𝑘 ∑ 𝑝1 𝑞1
𝑟𝑘𝑖𝑡 = [1 − ]
𝑘−1 𝑠12
Keterangan:
𝑟𝑘𝑖𝑡 = koefisien realibitas tes
𝑘 = cacah butir
𝑝1 𝑞1 = varians skor butir
𝑝1 = proporsi jawaban yang benar untuk bernomor i
𝑞1 = proporsi jawaban yang salah untuk butir bernomor i
𝑠12 = varians skor total
Dari penjabaran di atas, kita ambil setiap butir yang valid, sehingga dapat
dihitung reliabilitas instrumen seperti berikut:

17
Maka akan kita peroleh reliabilitas instrumen soal objektif dengan KR-20
sebagai berikut:

𝑘 ∑ 𝑝1 𝑞1 4 0,91
𝑟𝑘𝑖𝑡 = [1 − 2 ]= [1 − ] = 0,856
𝑘−1 𝑠1 4−1 2,54

5. Indeks Kesukaran
Analisis Kesukaran Soal
Asumsi yang digunakan untuk memperoleh kualitas soal yang baik,
disamping memenuhi validitas dan reliabilitas, adalah adanya keseimbangan dari
tingkat kesulitan soal tersebut. Keseimbangan yang dimaksudkan adalah adanya soal-
soal yang termasuk mudah, sedang dan sukar secara proporsional. Tingkat kesukaran
soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawabnya, bukan
dilihat dari sudut guru sebagai pembuat soal (Sulistyorini; Evaluasi Pendidikan
Dalam Meningkatkan Mutu Pendidikan).
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar.
Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha
memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa
menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar
kemampuannya (Suharsimi Arikunto; Dasar-Dasar Evaluasi Pendidikan)
Bermutu atau tidaknya butir-butir soal tes hasil belajar pertama-tama dapat
diketahui dari derajat kesukaran atau taraf kesulitan yang dimiliki oleh masing-
masing butir item tersebut. Butir-butir item dapat dikatakan baik apabila butir-butir
tersebut tidak terlalu sukar dan tidak pula terlalu mudah. Maka, apabila seluruh testee
tidak dapat menjawab soal dengan betul, (karena terlalu sukar) tidak dapat disebut
sebagai item yang baik. Pun apabila seluruh testee dapat menjawab dengan betul,
(karena soal terlalu mudah) juga tidak dapat dimasukkan dalam kategori yang baik.
Di dalam bukunya yang berjudul Psycological Education, Witherington
mengatakan, bahwa sudah atau belum memadainya derajat kesukaran item tes hasil
belajar diketahui dari besar kecilnya angka yang melambangkan tingkat kesulitan
dari item tersebut. Angka yang dapat memberikan petunjuk mengenai tingkat

18
kesukaran item tersebut dikenal dengan istilah difficulty index (angka indeks
kesukaran item), yang dalam dunia evaluasi hasil belajar umumnya dilambangkan
dengan huruf P yaitu Proportion. Suatu tes tidak boleh terlalu mudah, dan juga tidak
boleh terlalu sukar. Sebuah item yang terlalu mudah sehingga seluruh siswa dapat
menjawab dengan benar bukanlah item yang baik. Begitupula item yang terlalu sukar
sehingga tidak dapat dijawab oleh siswa juga tidak baik. Jadi, item yang baik adalah
item yang mempunyai derajat kesukaran tertentu.
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada
suatu tingkat kemampuan atau bisa dikatakan untuk mengetahui sebuah soal itu
tergolong mudah atau sukar.
a. Analisis Kesukaran Soal Pilihan Ganda
Seperti yang diketahui, bahwa jenis soal itu bermacam-macam di
antaranya soal pilihan ganda dan essay. Di sini akan dijelaskan analisis
kesukaran soal pada soal pilihan ganda.
Bilangan yang menunjukkan sukar dan mudahnya suatu soal disebut
indeks kesukaran (difficulty indeks). Besarnya indeks kesukaran antara 0,00 –
1,00. Indeks kesukaran ini menunjukan taraf kesukaran soal, sehingga soal
dengan indeks 0,00 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks
1,0 menunjukkan bahwa soalnya terlalu mudah. Dalam evaluasi, indeks
kesukaran ini diberi simbol P, singkatan dari “proporsa”. Angka indeks
kesukaran item dapat diperoleh dengan rumus yang dikemukakan oleh Du Bois,
yaitu:
𝑁𝑝
𝑃=
𝑁
Di mana :
P : Proporsi atau proporsa atau angka indeks kesukaram item
Np : Banyaknya testee yang dapat menjawab dengan betul terhadap butir item
N : Jumalah testee yang mengikuti tes hasil belajar.

19
Rumus lainnya adalah:
𝐵
𝑃=
𝐽𝑆
P : Indeks Kesukaran
B : Banyaknya siswa yang menjawab soal itu dengan benar.
JS : Jumlah seluruh siswa peserta tes.
Sedangkan kriteria yang digunakan adalah, makin kecil indeks yang
diperoleh, makin sulit soal tersebut. Sebaliknya, makin besar indeks yang
diperoleh, makin mudah soal tersebut. Kriteria Indeks kesulitan soal ditafsirkan
oleh Robert L. Thorndike dan Elizabeth Hagen sebagai berikut:
Besarnya P Interprestasi
Kurang dari 0,30 Terlalu sukar
0,30 - 0,70 Cukup (sedang)
Lebih dari 0,70 Terlalu mudah

Sedangkan menurut Whiterington dalam bukunya Psychological Education


sebagai berikut:
Besarnya P Interprestasi
Kurang dari 0,25 Terlalu sukar
0,25 - 0,75 Cukup (sedang)
Lebih dari 0,75 Terlalu mudah

Contoh analisis kesukaran soal:


Siswa Nomor Soal Skor
1 2 3 4 5
A 1 1 0 1 1 4
B 0 1 1 0 1 3
C 0 1 0 0 1 2
D 1 0 1 0 0 2
E 1 0 0 0 1 2
Jumlah 3 3 2 1 4

20
Ada 5 siswa yang mengikuti suatu ujian yang terdiri dari 5 soal. Dari 5
siswa tersebut terdapat 3 orang yang dapat menjawab soal nomor 1 dengan betul.
Maka indeks kesukarannya adalah:
𝐵 3
𝑃= = = 0,6 (𝑘𝑟𝑖𝑡𝑒𝑟𝑖𝑎 𝑠𝑒𝑑𝑎𝑛𝑔)
𝐽𝑆 5
Dari tabel yang disajikan di atas, dapat ditafsirkan bahwa:
1) Soal nomor 1 mempunyai taraf kesukaran 3/5 = 0,6 (kriteria sedang)
2) Soal nomor 3 adalah soal dengan taraf kesukaran 2/5 = 0,4 (kriteria sedang)
3) Soal nomor 4 adalah soal dengan taraf kesukaran 1/5 = 0,2 (kriteria sukar)
4) Soal nomor 5 adalah soal dengan taraf kesukaran 4/5= 0,8 (kriteria sedang)
Perlu diketahui bahwa soal-soal yang terlalu mudah atau terlalu sukar,
lalu tidak berarti tidak boleh digunakan. Hal ini tergantung dari penggunaanya.
Jika dari pengikut yang banyak, kita menghendaki yang lulus hanya sedikit, kita
ambil siswa yang paling top. Untuk itu lebih baik diambilkan soal-soal tes yang
sukar.
Sebaliknya, jika kekurangan pengikut ujian, kita pilihkan soal-soal yang
mudah. Selain itu, soal yang sukar akan menambah semangat belajar bagi siswa
yang pandai, sedangkan soal-soal yang terlalu mudah, akan membangkitkan
semangat siswa yang tidak pandai.
Maka dari itu, dalam menyusun suatu naskah ujian sebaiknya digunakan
butir soal yang mempunyai tingkat kesukaran berimbang. Yaitu: soal
berkategori sukar sebanyak 25%, kategori sedang 50% dan kategori mudah
25%.

b. Analisis Keskaran Soal Tes Uraian atau Essay


Tidak hanya pada soal pilihan ganda saja kita dapat menganalisis tingkat
kesukaran soal, begitupun pada soal uraian atau essay yang mana indeks tingkat
kesukaran ini umumnya dinyatakan dalam bentuk proporsi yang besarnya
kisaran 0,00- 1,00. Yang mana jika semakin besar indeks tingkat kesukaran yang
diperoleh, maka semakin mudah soal itu. Karena fungsi kesukaran soal biasanya
dikaitkan dengan tujuan tes. Misalnya untuk keperluan ujian semester digunakan

21
butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan seleksi
digunakan butir soal yang memiliki tingkat kesukaran tinggi, dan untuk
keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat
kesukaran rendah. Dan untuk mengetahui tingkat kesukaran soal bentuk uraian
digunakan rums berikut ini:
𝐽𝑢𝑚𝑙𝑎ℎ 𝑠𝑘𝑜𝑟 𝑠𝑖𝑠𝑤𝑎 𝑝𝑒𝑠𝑒𝑟𝑡𝑎 𝑡𝑒𝑠 𝑝𝑎𝑑𝑎 𝑏𝑢𝑡𝑖𝑟 𝑠𝑜𝑎𝑙 𝑡𝑒𝑟𝑡𝑒𝑛𝑡𝑢
𝑀𝑒𝑎𝑛 =
𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑠𝑖𝑠𝑤𝑎 𝑦𝑎𝑛𝑔 𝑚𝑒𝑛𝑔𝑖𝑘𝑢𝑡𝑖 𝑡𝑒𝑠
di atas menggambarkan tingkat kesukaran soal itu. Klasifikasi tingkat
kesukaran soal dapat dicontohkan seperti berikut:
0,00 – 0,30 : Soal tergolong sukar
0,31 – 0,70 : Soal tergolong sedang
0,71 – 1,00 : Soal tergolong mudah
Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi soal
tes. Untuk tes yang sangat sukar distribusinya berbentuk positif skewed,
sedangkan tes yang mudah distribusinya berbentuk nehatif skewed.
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu bagi guru dan
bagi pengujian dan pengajaran. Bagi guru, sebagai pengenalan konsep terhadap
pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar
mereka, memperoleh informasi tentang penekanan kurikulum atau mencurigai
terhaap butir soal yang bias. Adapun kegunaannya bagi pengujian dan pengajaran
yaitu, sebagai pengenalan konsep yang diperlukan untuk diajarkan ulang, tanda-
tanda terehadap kelebihan dan kelemahan kurikulum sekolah, memberi masukan
kepada siswa, tanda-tanda kemungkinan ada soal yang bisa dan merakit tes yang
memiliki ketepatan data soal.
Selain kegunaanya dalam konstruksi tes, tingkat kesukaran soal sangat
penting karena dapat mempengaruhi karakteristik distribusi skor yang mana
mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan korelasi
antarasoal, serta berhubungan dengan reliabilitas. Yang mana menurut koefisien
alfa clan KR-20, semakin tinggi korelasi antarsoal, semakin tinggi reliabilitasnya.
Dalam kaitannya dengan hasil analisis item dari segi kesukarannya, tindak
lanjut yang dilakukan adalah:

22
1) Untuk butir-butir item hasil analisis termasuk kategori baik dalam arti
derajat kesukarannya cukup atau sedang, sebaiknya cepat dicatat dalam
bank soal. Dan dapat dikeluarkan lagi dalam tes-tes berikutnya.
2) Untuk butir-butir item yang termasuk kategori terlalu sukar, ada 3
kemungkinan tindak lanjut yaitu, dibuang atau didrop dan tidak akan
dikeluarkan lagi dalam tes berikutnya, diteliti ulang untuk dapat diketahui
penyebab banyaknya siswa yang tidak bisa menjawab item tersebut, dan
bukannya soal yang sukar itu tidak ada manfaatnya. Dari soal yang sukar
bisa nantinya digunakan untuk tes seleksi yang ketat, yang mana
membutuhkan orang-orang yang kompeten. Maka soal yang sukar sangat
dibutuhkan untuk meluluskan orang-orang yang berkemampuan.
3) Untuk butir-butir item yang termasuk kategori terlalu mudah, juga ada
kemungkinan tindak lanjutnya yaitu, butir item tersebut dibuang atau didrop
dan tidak dikeluarkan lagi pada tes-tes berikutnya, diteliti dan dilacak
kenapa item soal sangat mudah sehingga semua testee dapat menjawab soal
dengan benar, sehingga adanya perbaikan yang dilakukan, seperti item butir
yang sukar, tidak semua item yang mudah tidak ada manfaatnya, item butir
soal yang mudah dapat digunakan pada tes-tes terutama tes seleksi yang
sifatnya longgar, yang mana kategori soal yang terlalu mudah hanya sebagai
formalitas saja di suatu tes.
Jadi, tidak ada salahnya jika memasukkan butir-butir item yang terlalu
sukar dan terlalu mudah, sebab sewaktu-waktu butir-butir seperti itulah yang
dibutuhkan.

6. Efektifitas Option
Option adalah kemungkinan jawaban yang disediakan pada butir soal (tes) tipe
obyektif bentuk pilihan ganda atau memasangkan untuk dipilih oleh peserta tes, sesuai
dengan petunjuk yang diberikan. Suatu option disebut efektif jika memenuhi fungsinya
atau tujuan disajikannya option tersebut tercapai. Hal ini berarti bahwa setiap option yang
disajikan masing-masing mempunyai kemungkinan yang sama untuk dipilih, jika testi
menjawab soal itu dengan menerka-nerka (spekulasi).

23
Option yang merupakan jawaban yang benar disebut option kunci, sedangkan
option lainnya disebut option pengecoh. Agar suatu option yang disajikan efektif harus
diusahakan homogen (serupa), baik dari segi isi (materi), notasi, maupun panjang-
pendeknya kalimat pada option tersebut.
Berdasarkan distribusi pilihan pada setiap optin untuk siswa kelompok atas dan
kelompok bawah, dapat ditentukan option yang berfungsi efektif atau tidak. Kriteria
option yang berfungsi efektif adalah:
1) Untuk option kunci
a. Jumlah pemilih kelompok atas harus lebih banyak daripada jumlah pemilih
kelompok bawah.
b. Jumlah pemilih kelompok atas dan kelompok bawah lebih dari 0,25 tetapi tidak
lebih dari 0,75 dari seluruh siswa kelompok atas dan kelompok bawah.
2) Untuk option pengecoh
a. Jumlah pemilih kelompok atas lebih sedikit daripada jumlah pemilih kelompok
bawah
b. Jumlah pemilih kelompok atas dan kelompok bawah minimal sebanyak 0,25 dari
seperdua jumlah option pengecoh kali jumlah kelompok atas dan kelompok
bawah.
c. Jika peserta tes mengabaikan semua option (tidak memilih) disebut omit. Option
disebut efektif jika omit ini jumlahnya tidak lebih dari 10% jumlah siswa pada
kelompok atas dan kelompok bawah.

24
BAB III
PENUTUP

A. Kesimpulan
Validitas dan reliabilitas merupakan syarat pokok bagi alat ukur untuk mengukur
variabel-variabel yang ingin diukur penelitian. Validitas digunakan untuk mengetahui
ketepatan dan kecermatan suatu instrumen tes/item pertanyaan yang diberikan. Item
yang valid adalah item yang dapat mengukur apa yang hendak diukur. Sedangkan .
Reliabilitas merujuk pada ketetapan/keajegan alat tersebut dalam menilai apa yang
diinginkan, artinya kemampuan alat tersebut digunakan akan memberikan hasil yang
relatif sama.
Validitas suatu dapat dilihat melalui penalaran (logis) maupun melalui fakta-fakta
empiris. Validitas logis dapat ditinjau dari isi dan susunan tes, dimana instrumen tes
harus linier dengan isi/pelajaran dan sesuai dengantujuan instruksional khusus yang telah
dirumuskan sebelumnya. Kemudian untuk membuat susunan butir-butir tes yang
dikatakan valid adalah mendasarkannya dengan susunan indikator-indikator yang telah
dirumuskan. Contoh dari validitas logis adalah validitas isi dan validitas konstruk.
Kemudian validitas empiris merupakan validitas yang dapat diuji secara empiris.
Instrumen diuji melalui metode statistika.
Validitas empiris dapat dibagi menjadi dua, yaitu validitas internal dan validitas
eksternal. Validitas internal memperlihatkan seberapa jauh hasil ukur setiap butir tes
konsisten dengan hasil ukur instrumen secara keseluruhan. Sedangkan validitas eksternal
adalah hasil ukur instrumen atau tes lain diluar instrumen itu sendiri yang menjadi
kriteria. Contoh dari validitas eksternal adalah validitas konkuren (bandingan) dan
validitas prediktif. Sedangkan reliabilitas dibagi menjadi dua, yaitu: reliabilitas
tanggapan(eksternal) dan reliabilitas konsistensi gabungan item. Reabilitas tanggapan
menekankan pada bagaimana proses penerapan dan penyampaian instrumen sedangkan
reabilitas konsistensi tanggapan item lebih pada pengolahan item bagai mana hasil yang
diperoleh instrumen. Instrumen yang valid dan reliabel merupakan syarat untuk
memperoleh data-data yang valid. Data-data ini yang kemudian dianalisis dalam rangka
mencari kesimpulan penelitian.

25
B. Saran
Saran dari kami yaitu kita harus benar-benar tahu tentang validasi. Karena
validasi ini merupakan salah satu bab tentang penghitungan data nilai siswa.

26
DAFTAR PUSTAKA

Mas'ud Zein, & Darto. (2012). Evaluasi Pembelajaran Matematika (1st ed.). Pekanbaru
: Daulat Riau.
Nuryadi, & Nanang Khuzaini. (2016). Evaluasi Hasil & Proses Pembelajaran
Matematika (1st ed.). Yogyakarta: LeutikaPrio.
Caturiyati, k. H. (2009). valditas konstruk dalam pengembangan instrumen penilaian
non-kognitif. Abstrak, 5-6.

Suharini, A. (2005). Dasar-dasar evaluasi pendidikan. Jakarta: Bumi Aksara.

Supranato, K. (2012). Pengukuran dan Penilaian Pendidikan. Yogyakarta: Graha


Ilmu.

27

Anda mungkin juga menyukai