Dibuat untuk memenuhi tugas Mata Kuliah Asesmen Pembelajaran Matematika Yang
diampu oleh Ibu Rini Nurhakiki
Oleh :
Offering B 2016
Maret 2018
KATA PENGANTAR
Puji syukur kami panjatkan kehadirat Allah SWT atas Rahmat dan Karunia-
Nya sehingga kami dapat menyelesaikan makalah ini yang membahas jenis tes, tes
menurut tujuannya, tipe dan bentuk tes.
Dan kami ucapkan terima kasih kepada Ibu Rini Nur Hakiki yang sudah
memberikan pengarahan, orang tua yang selalu mendukung, serta teman-teman kami
yang sudah membantu pembuatan makalah ini.
Kami merasa makalah ini kurang baik, maka kami mohon kritik dan sarannya
kepada para pembaca makalah kami dan terutama pada Bapak/Ibu dosen. Kritik dan
saran bisa disampaikan kepada kami di Universitas Negeri Malang, Prodi S1
Pendidikan Matematika Offering B - 2016.
Tim Penyusun
i
DAFTAR ISI
KATA PENGANTAR.............................................................................................................. i
DAFTAR ISI .............................................................................Error! Bookmark not defined.
BAB I........................................................................................................................................ 1
PENGERTIAN VALIDITAS................................................................................................. 1
1.1 Pengertian Validitas ............................................................................................... 1
1.2 Jenis Validitas ......................................................................................................... 3
BAB II ...................................................................................................................................... 9
RUMUS DAN CONTOH VALIDITAS ................................................................................ 9
2.1 Cara Mengukur Validitas ...................................................................................... 9
2.2 Cara Menentukan Validitas Tiap Butir Soal ..................................................... 17
DAFTAR RUJUKAN ........................................................................................................... 21
ii
iii
BAB I
PENGERTIAN VALIDITAS
1.1 Pengertian Validitas
1
which the instrument serves its purpose or the efficiency with which it measures what
it intends to measure. Pendapat yang lebih lengkap tentang validitas dikemukakan
Thorndike, dkk dalam Yusuf (2015: 61) sebagai berikut : The concept of validity refers
to the appropriateness, meaningfullness, and usefulness of specific inferences made
from Instrument score. Intrument validition is the process of accumulating evidence to
support such inferences....Thus, a instrument does not have “validity” in any absolute
sense. Rather, the instrumen score are valid for some uses and not valid for others.
Sehingga,dari pendapat-pendapat diatas, dapat disimpulkan bahwa konsep
validitas menunjuk kepada kesesuaian, kebermaknaan, dan kebergunaan kesimpulan-
kesimpulan yang dibuat berdasarkan skor instrumen. Makin tinggi validitas suatu alat
ukur, makin baik alat ukur itu untuk digunakan. Tetapi perlu diingat bahwa validitas
alat ukur itu tidak dapat dilepaskan dari kelompok yang dikenai alat ukur tersebut. oleh
karena itu berlakunya validitas hanya terbatas pada kelompok tersebut atau kelompok
lain yang kondisinya hampir sama dengan kelompok itu.
a. Validitas menunjuk pada suatu instrumen atau instrumen evaluasi untuk kelompok
atau individual, tidak untuk instrumen itu sendiri.
b. Validitas merupakan “degree” (derajat seperti: tinggi, sedang, dan kurang).
c. Validitas itu selalu spesifik penggunaannya.
2
1.2 Jenis Validitas
Validitas berkenaan dengan ketepatan alat ukur terhadap konsep yang diukur,
sehingga betul-betul mengukur apa yang seharusnya diukur. Sebagai contoh, ingin
mengukur kemampuan siswa dalam matematika. Kemudian diberikan soal dengan
kalimat yang panjang dan yang berbelit-belit sehingga sukar ditangkap maknanya.
Akhimya siswa tidak dapat menjawab, akibat tidak memahami pertanyaannya. Contoh
lain, peneliti ingin mengukur kemampuan berbicara, tapi ditanya mengenai tata bahasa
atau kesusastraan seperti puisi atau sajak. Pengukur tersebut tidak tepat (valid).
Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penelitian.
Instrumen yang telah valid untuk suatu tujuan tertentu belum otomatis akan valid untuk
tujuan yang lain.
Contoh variabel prestasi belajar dan motivasi bisa diukur oleh tes ataupun oleh
kuesioner. Caranya juga bisa berbeda, tes bisa dilaksanakan secara tertulis atau bisa
secara lisan. Ada beberapa jenis validitas yang sering digunakan dalam penyusunan
instrumen, yakni validitas isi, validitas bangun pengertian dan validitas ramalan dan
Validitas kesamaan (councurrent validity)
(a) Validitas isi
Validitas isi berkenaan dengan kesanggupan instrumen mengukur isi yang harus
diukur. Artinya, alat ukur tersebut mampu mengungkap isi suatu konsep atau variabel
yang hendak diukur. Misalnya tes hasil belajar bidang studi IPS, harus bisa
mengungkap isi bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun
tes yang bersumber dari kurikulum bidang studi yang hendak diukur. Di samping
kurikulum dapat juga diperkaya dengan melihat/mengkaji buku sumber. Sungguhpun
demikian tes hasil belajar tidak mungkin dapat mengungkap semua materi yang ada
dalam bidang studi tertentu sekalipun hanya untuk satu semester. Oleh sebab itu harus
diambil sebagian dari materi dalam bentuk sampel tes. Sebagai sampel maka harus
dapat mencerminkan materi yang terkandung dari seluruh materi bidang studi. Cara
Yang ditempuh dalam menetapkan sampel tes adalah memilih konsep-konsep yang
esensial dari materi yang di dalamnya. Misalnya menetapkan sejumlah konsep dari
3
setiap pokok bahasan yang ada. Dari setiap konsep dikembangkan beberapa pertanyaan
tes (lihat bagan). Di sinilah pentingnya peranan kisi-kisi sebagai alat untuk memenuhi
validitas isi.
Semester : ....................
Kelas : ....................
dan seterusnya
Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan
tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat meminta
4
bantuan ahli bidang studi untuk menelaah apakah konsep materi yang diajukan telah
memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi tidak
memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka-angka.
5
- kesediaan menerima stimulus objek sikap
- kemauan mereaksi stimulus objek sikap
- menilai stimulus objek sikap
- menyusun/mengorganisasi objek sikap
- internalisasi nilai yang ada dalam objek sikap.
Apabila hasil tes menunjukkan indikator-indikator tes yang tidak berhubungan secara
positif satu sama lain, berarti ukuran tersebut tidak memiliki validitas bangun
pengertian. Atas dasar itu indikatornya perlu ditinjau atau diperbaiki kembali. Cara lain
untuk menetapkan validitas bangun pengertian suatu alat ukur adalah menghubungkan
(korelasi) antara alat ukur yang dibuat dengan alat ukur yang sudah baku/standardized,
seandainya telah ada yang baku. Bila menunjukkan koefisien korelasi yang tinggi maka
alat ukur tersebut memenuhi validitasnya.
Validitas ramalan artinya dikaitkan dengan kriteria tertentu. Dalam validitas ini
yang diutamakan bukan isi tes tapi kriterianya, apakah alat ukur tersebut dapat
digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau kriteria tertentu yang
diinginkan. Misalnya alat ukur motivasi belajar, apakah dapat digunakan untuk
meramal prestasi belajar yang dicapai. Artinya terdapat hubungan yang positif antara
motivasi dengan prestasi. Dengan kata lain dalam validitas ini mengandung ciri adanya
relevansi dan keajegan atau ketetapan (reliability). Motivasi dapat digunakan meramal
prestasi bila skor-skor yang diperoleh dari ukuran motivasi berkorelasi positif dengan
skor prestasi. Validitas ramalan ini mengandung dua makna. Pertama validitas jangka
pendek dan kedua jangka panjang. Validitas jangka pendek, artinya daya ramal alat
ukur tersebut hanya untuk masa yang tidak lama. Artinya, skor tersebut berkorelasi
pada waktu yang sama. Misalnya, ketetapan (reliability) terjadi pada semester dua
artinya daya ramal berlaku pada semester dua, dan belum tentu terjadi pada semester
berikutnya. Sedangkan validitas jangka panjang mengandung makna skor tersebut akan
berkorelasi juga di kemudian hari. Mengingat validitas ini lebih menekankan pada
adanya korelasi, maka faktor yang berkenaan dongan persyaratan terjadinya korelasi
6
harus dipenuhi. Faktor tersebut antara lain hubungan dari konsep dan variabel dapat
dijelaskan berdasarkan pengetahuan ilmiah, minimal masuk akal sehat dan tidak
mengada-ada. Faktor lain adalah skor yang dikorelasikan memenuhi linieritas. Ketiga
validitas yang dijelaskan di atas idealnya dapat digunakan dalam menyusun instrumen
penelitian, minimal dua validitas, yakni validitas isi dan validitas bangun pengertian.
Validitas isi dan bangun pengertian mutlak diperlukan dan bisa diupayakan tanpa
melakukan pengujian secara statistika.
Validitas kesamaan suatu tes artinya membuat tes yang memiliki persa maan
dengan tes sejenis yang telah ada atau yang telah dibakukan. Kesa maan tes
terlingkupnya abilitas yang diukurnya, sasaran atau objek yang diukurnya, serta waktu
yang diperlukan. Validitas kesamaan suatu tes adalah melalui indeks korelasi
berdasarkan perhitungan korelasi. Apabila me nunjukkan indeks korelasi yang cukup
tinggi, yakni mendekati angka satu (korelasi sempurna), berarti tes yang disusun
tersebut memiliki validitas kesamaan. Untuk mudahnya kita bisa mengasumsikan soal-
soal Ebta atau Ebtanas dalam bidang studi tertentu sebagai tes baku sehingga da pat
digunakan sebagai acuan dalam penyusunan bidang studi yang sejenis. Dengan
demikian guru dapat membuat tes bidang studi tersebut yang memiliki kesamaan
dengan tes Ebta bidang studi yang sama melalui uji korelasi. Di lain pihak sekolah atau
guru dapat juga membuat tes baku dalam bidang-bidang studi tertentu. Melalui
beberapa kali uji coba ke mudian hasilnya dianalisis tingkat kesukaran dan daya
pembedanya di samping diuji validitas dan reliabilitasnya. Berdasarkan uji coba
tersebut item tes diperbaiki dan disempurnakan sehingga menghasilkan tes yang
mendekati kebakuan. Tes ini nantinya dapat digunakan sebagai acuan bagi penyusunan
tes sejenis melalui uji validitas kesamaan. Tes baku untuk bidang studi yang ada di
sekolah memang sangat lang ka. Kelangkaan ini disebabkan oleh sulitnya membuat tes
baku di samping memerlukan biaya yang mahal. Soal-soal yang dibuat untuk ke-
perluan Ebtanas merupakan satu-satunya tes yang dianggap baku. Oleh sebab itu,
membuat tes bidang studi yang diacukan kepada soal-soal Ebtanas melalui validitas
7
kesamaan merupakan salah satu upaya dalam menyediakan soal soal bidang studi yang
memadai. Melalui upaya ini sekolah dapat memiliki soal-soal bidang studi untuk
keperluan tes sumatif atau pun keperluan lainnya. Namun, Yusuf (2015:63)
mengelompokkan Predictive Validity dan Concurrent Validity kedalam Validitas
Patokan (Criterion Validity).
8
BAB II
9
f. Uji coba instrumen.
g. Analisis uji coba.
h. Revisi/penyempurnaan instrumen.
Uraian yang lengkap dan terperinci tentang tiap aspek di atas akan dibicarakan pada
bab tentang penyusunan instrumen yang baik.
Di samping jenis-jenis validitas seperti yang telah diutarakan, ada pula
klasifikasi lain tentang validitas, yaitu validitas internal dan validitas eksternal.
Validitas internal mengacu pada tersedianya informasi sesuai dengan yang diharapkan,
sedangkan validitas eksternal mengacu pada konsep generalisasi. Makin tinggi
validitas eksternal, makin baik pula generalisasi temuan di daerah lain.
Validitas instrumen dapat diketahui dengan jalan mencari korelasi instrumen itu
dengan kriterium, atau melakukan analisis butir (item). Untuk dapat menggunakan
formula yang tepat dalam menentukan validitas suatu instrumen maka perlu ditentukan
terlebih dahulu tipe data yang dikumpulkan melalui instrumen itu.
Apabila data yang didapat adalah data interval maka dapat digunakan rumus
Product Moment Correlation, sebagai berikut:
a. Rumus untuk skor kasar.
𝑁Σ𝑋𝑌 − (Σ𝑋)(Σ𝑌)
𝑟𝑥𝑦 =
√[𝑁Σ𝑋 2 − (Σ𝑋)2 ][(𝑁Σ𝑌 2 − (Σ𝑌)2 ]
Atau
(Σ𝑋)(Σ𝑌)
Σ𝑋𝑌 −
𝑟𝑥𝑦 = 𝑁
(Σ𝑋)2 2
2 − (Σ𝑌) ]
√[Σ𝑋 2 − ] [(Σ𝑌
𝑁 𝑁
Keterangan:
𝑟𝑥𝑦 = koefisien korelasi antara instrumen X dan intrumen Y.
𝑋 = Variabel X (instrumen X).
𝑌 = Variabel Y (instrumen Y).
𝑁 = Jumlah peserta
10
Bagaimana cara mencari harga 𝑟𝑥𝑦 ?
Suatu tim evaluasi menyusun instrumen kemampuan dasar untuk peserta didik SMA
(dalam contoh ini disebut instrumen X). mengetahui validitas instrumen tersebut,
digunakan instrumen lain yang telah diakui dan diketahui validitasnya. Dalam hal ini
digunakan instrumen Standard Progresive Matrice.
Kedua instrumen itu dilaksanakan pada sejumlah sampel yang sama dan hasilnya
sebagai berikut:
Tabel Persiapan
11
Selanjutnya masukkan ke dalam rumus:
𝑁Σ𝑋𝑌 − (Σ𝑋)(Σ𝑌)
𝑟𝑥𝑦 =
√[𝑁Σ𝑋 2 − (Σ𝑋)2 ][𝑁Σ𝑌 2 − (Σ𝑌)2 ]
10 × 83097 − (670)(1231)
𝑟𝑥𝑦 =
√[10 × 45384 − (670)2 ][10 × 153821 − (1231)2 ]
830970 − 824770
𝑟𝑥𝑦 =
√[453840 − 448900][1538210 − 1515361]
𝑟𝑥𝑦 ≈ 0,58
12
Penggunaan rumus:
670
Rata-rata X = = 67
10
1231
Rata-rata Y = = 123,1
10
Σ𝑥𝑦
𝑟𝑥𝑦 =
√(Σ𝑥 2 )(Σ𝑦 2 )
620
𝑟𝑥𝑦 =
√(494)(284,9)
620
𝑟𝑥𝑦 ≈
1062,422
𝑟𝑥𝑦 ≈ 0,58
Untuk menentukan apa arti koefisien korelasi yang diperoleh, dapat dilakukan dengan
cara:
13
Angka yang diperoleh lebih kecil dari rt 5%, ini berarti tidak terdapat hubungan yang
signifikan di antara kedua instrumen itu.
Apabila korelasi kedua instrumen itu dicari dengan rumus kedua, maka hasilnya
sebagai berikut:
𝑁Σ𝑋𝑌 − (Σ𝑋)(Σ𝑌)
𝑟𝑥𝑦 =
√[𝑁Σ𝑋 2 − (Σ𝑋)2 ][𝑁Σ𝑌 2 − (Σ𝑌)2 ]
(670)(1231)
83097 −
𝑟𝑥𝑦 = 10
(670)2 (1231)2
√[45384 − ] [153821 −
10 10 ]
830970 − 824770
𝑟𝑥𝑦 =
√[45384 − 44890][153821 − 151536,1]
𝑟𝑥𝑦 ≈ 0,58
Dengan demikian dapat dikatakan hubungan antara kedua instrumen tersebut "cukup".
Andai kata instrumen yang digunakan sebagai kriterium "baik", maka kata-kata
"cukup", boleh dikatakan belum memadai untuk digunakan. Ini berarti, bahwa
Instrumen Kemampuan Dasar yang disusun, belum valid serta belum mampu
membedakan antara kelompok peserta didik yang mempunyai kemampuan dasar tinggi
peserta didik yang mempunyai kemampuan dasar rendah. Tetapi perlu pula diingat,
14
jika jumlah sampel ujinya terbatas (< 30 orang), maka akan memengaruhi besarnya
koefisien korelasi.
Cara lain yaitu membandingkan korelasi yang didapat dengan r tabel Product Moment
Correlation, dengan degree of freedom (df)= n-1 dan tingkat kepercayaan 95% atau
𝛼 = 5%.
Apabila data yang dikumpulkan dari kedua instrumen dapat dijadikan data ordinal,
maka rumus yang digunakan adalah Spearman Rank Order Correlation. dengan rumus
sebagai berikut:
6Σ𝐷 2
Rho = 1 − 𝑁(𝑁2 −1)
Keterangan:
D = Deviasi/ pasangan urutan
N = Jumlahs
(www.scribd.com)
15
Tabel nilai Rho digunakan untuk menguji signifikansi korelasi dengan teknik korelasi
Rank Spearman. Jika sampel <= 30 maka nilai korelasi yang diperoleh dari hasil
perhitungan dapat langsung dibandingkan dengan rho tabel.
Parameter yang digunakan adalah jika rho hitung < r tabel maka Ho diterima, dan jika
rho hitung > rho tabel maka Ho ditolak (Ha diterima).
R = Rank (urutan)
6×79
Rho = 1 − 10(102 −1)
= 1 − 474/990
≈ 1 − 0,48
≈ 0,52
Selanjutnya bandingkan hasil tersebut dengan nilai r tabel Rho. Dengan n = 10, nilai rt
(5%) = 0,648.
Ini berarti, nilai yang didapat lebih kecil dari nilai r dalam tabel. Oleh karena itu, dapat
disimpulkan kedua instrumen tidak terdapat hubungan yang signifikan atau kurang
terdapat kesesuaian dan kesejajaran antara kedua instrumen tersebut.
Apabila instrumen yang digunakan
16
tidak dapat diskor, maka dalam mencari validitas instrumen gunakan "expert
judgement" atau penimbang ahli (judger) dan selanjutnya diolah dengan menggunakan
rumus psychometric lainnya, sesuai dengan bentuk/tipe instrumen yang disusun.
A 0 1 1 1 0 1 0 0 0 1 5
B 1 1 1 1 0 1 1 0 0 1 7
C 1 0 1 1 1 1 0 1 1 1 8
D 0 0 1 1 1 0 1 1 0 0 5
E 1 0 0 0 1 1 1 1 0 1 6
F 1 1 1 0 0 0 1 1 1 1 7
G 1 0 0 1 0 1 1 1 0 1 6
H 1 0 0 1 1 1 0 1 1 0 6
I 1 0 1 1 0 1 1 0 1 1 7
J 1 1 1 1 0 1 1 1 0 0 7
17
a. Buat tabel persiapan dengan skor butir soal masing-masing sebagai X
dan skor total sebagai Y, seperti berikut:
Sampel X Y X2 Y2 XY
A 0 5 0 25 0
B 1 7 1 49 7
C 1 8 1 64 8
D 0 5 0 25 0
E 1 6 1 36 6
F 1 7 1 49 7
G 1 6 1 36 6
H 1 6 1 36 6
I 1 7 1 49 7
J 1 7 1 49 7
ƩX = 8 ƩY = 64 ƩX2 = 8 ƩY = 418
2
ƩXY = 54
b. Selanjutnya masukkan ke dalam rumus
𝑁Σ𝑋𝑌 − (Σ𝑋)(Σ𝑌)
𝑟𝑥𝑦 =
√[𝑁Σ𝑋 2 − (Σ𝑋)2 ][(𝑁Σ𝑌 2 − (Σ𝑌)2 ]
10 × 54 − 8 × 64
𝑟𝑥𝑦 =
√[10 × 8 − 82 ][(10 × 418 − 642 ]
540 − 512
𝑟𝑥𝑦 =
√[80 − 64][4180 − 4096]
28
𝑟𝑥𝑦 =
√(16 × 84)
28
𝑟𝑥𝑦 =
36,66
𝑟𝑥𝑦 ≈ 0,76
𝑀𝑝 − 𝑀𝑡 𝑝
𝑟𝑝𝑏𝑖𝑠 = × √
𝑆𝐷𝑡 𝑞
Keterangan :
18
𝑟𝑝𝑏𝑖𝑠 = Koefisien korelasi biserial
𝑀𝑡 = Mean Total
𝑀𝑝 = Mean skor dari subjek yang menjawab benar butir soal yang dicari
𝑆𝐷𝑡 = Standar Deviasi skor total.
𝑝 = Proporsi peserta didik yang menjawab benar butir soal yang dicari
𝑞 = Proporsi peserta didik yang menjawab salah (𝑞 = 1 − 𝑝)
d. Jumlahkan skor total dari subjek yang menjawab benar dan kemudian
tentukan rata-ratanya.
7 + 8 + 6 + 7 + 6 + 6 + 7 + 7 54
𝑀𝑝 = = = 6,75
8 8
418 642
𝑆𝐷𝑡 = √( )−( )
10 10
19
𝑆𝐷𝑡 = √0,84
𝑆𝐷𝑡 = 0,916515139
f. Tentukan proporsi peserta didik yang menjawab butir soal tersebut
dengan benar dan yang salah.
8
𝑝= = 0,8
10
𝑞 = 1 − 0,8 = 0,2
g. Masukkan ke dalam rumus
𝑀𝑝 − 𝑀𝑡 𝑝
𝑟𝑝𝑏𝑖𝑠 = × √
𝑆𝐷𝑡 𝑞
Dengan cara yang sama, validitas semua butir soal dalam satu set instrumen dapat
diketahui, sehingga butir soal yang tidak baik harus dibuang.
20
DAFTAR RUJUKAN
Sudjana, N. 1990. Penilaian Hasil Proses Belajar Mengajar. Bandung : PT. Remaja
Rosdakarya
21