Makalah ini disusun untuk memenuhi mata kuliah Penilaian Hasil Pembelajaran
Matematika dengan Dosen Pembimbing
Bapak Dr. Teguh Wibowo, M. Pd.
Disusun oleh:
1. Ari Setyarini (182140077)
2. Muthia Daniyati (182140091)
3. Regina Aliyah Khairani (182140076)
Penulis
ii
DAFTAR ISI
Halaman Judul........................................................................................................i
KATA PENGANTAR............................................................................................ii
BAB I.......................................................................................................................1
A. Latar Belakang............................................................................................1
B. Rumusan Masalah.......................................................................................1
C. Tujuan Penulisan........................................................................................1
BAB II.....................................................................................................................3
A. Pengertian Validitas....................................................................................3
C. Jenis-jenis Validitas....................................................................................5
BAB III..................................................................................................................17
A. Kesimpulan................................................................................................17
DAFTAR PUSTAKA...........................................................................................18
iii
BAB I
PENDAHULUAN
A. Latar Belakang
Menurut Arikunto (2008: 57-62) dalam Widoyoko (2013: 98)
menyatakan bahwa suatu tes dapat dikatakan baik apabila memenuhi lima
persyaratan, yaitu: validitas, reabilitas, objektivitas, praktikabilitas, dan
ekonomis. Alat ukur dikatakan valid apabila alat ukur itu dapat dengan tepat
mengukur apa yang hendak diukur. Dengan kata lain validitas berkaitan
dengan “ketepatan” dengan alat ukur. Tes sebagai salah satu alat ukur hasil
belajar dapat dikatakan valid apabila tes itu dapat tepat mengukur hasil
belajar yang hendak diukur. Dengan tes yang valid akan menghasilkan data
belajar yang valid juga.
Sebelum guru menggunakan menggunakan suatu tes, hendaknya guru
mengukur terlebih dahulu derajat validitasnya berdasarkan kriteria tertentu.
Dengan kata lain, untuk melihat apakah tes tersebut valid, kita harus
membandingkan skor peserta didik yang didapat dalam tes dengan skor yang
dianggap sebagai nilai baku. Validitas suatu tes erat kaitannya dengan tujuan
penggunaan tes tersebut. Namun, tidak ada validitas yang berlaku secara
umum. Artinya jika suatu tes dapat memberikan informasi yang sesuai dan
dapat digunakan untuk mencapai tujuan tertentu maka tes itu valid untuk
tujuan tersebut (Arifin, 2017: 247)
B. Rumusan Masalah
1. Apa pengertian validitas?
2. Apa saja faktor-faktor yang mempengaruhi validitas hasil tes?
3. Apa saja jenis-jenis validitas?
4. Bagaimana cara menentukan validitas alat ukur?
5. Bagaimana cara menentukan validitas butir instrumen?
6. Bagaimana tes terstandar sebagai kriterium dalam menentukan validitas?
C. Tujuan Penulisan
1. Untuk mengetahui apa itu validitas.
2. Untuk mengetahui faktor-faktor yang mempengaruhi validitas hasil tes.
1
3. Untuk mengetahui jenis-jenis validitas.
4. Untuk mengetahui cara menentukan validitas alat ukur.
5. Untuk mengetahui cara menentukan validitas butir instrumen.
6. Untuk mengetahui tes terstandar sebagai kriterium dalam menentukan
validitas.
2
BAB II
PEMBAHASAN
A. Pengertian Validitas
Arikunto (2013:73) menjelaskan bahwa validitas adalah keadaan yang
menggambarkan tingkat instrumen bersangkutan yang mampu mengukur apa
yang akan diukur. Menurut Sudijono (2005: 163) validitas adalah salah satu
ciri yang menandai tes hasil belajar yang baik. Sedangkan menurut Purwanto
(2010) validitas merupakan syarat yang terpenting dalam suatu alat evaluasi.
Suatu teknik evaluasi dikatakan mempunyai validitas yang tinggi (disebut
valid) jika teknik evaluasi atau tes itu dapat mengukur apa yang sebenarnya
akan diukur. Validitas bukanlah suatu ciri atau sifat yang mutlak dari suatu
teknik evaluasi. Ia merupakan suatu ciri yang relatif terhadap tujuan yang
hendak dicapai oleh pembuat tes. Validitas adalah suatu ukuran yang
menunjukan tingkat kevalidan atau kesahihan suatu instrumen.
Prinsip validitas adalah pengukuran atau pengamatan yang berarti
prinsip keandalan instrumen dalam mengumpulkan data. Instrumen harus
dapat mengukur apa yang seharusnya diukur. Jadi validitas lebih menekankan
pada alat pengukuran atau pengamatan. Suatu skala atau instrumen pengukur
dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut
menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan
maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki
validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan
pengukuran.
B. Faktor-faktor yang Mempengaruhi Validitas Hasil Tes
Menurut Gronlund (1985) dalam Arifin (2017: 247) mengemukakan
ada tiga faktor yang mempengaruhi validitas hasil tes, yaitu “faktor instrumen
evaluasi, faktor administrasi evaluasi dan penskoran, dan faktor dari jawaban
peserta didik”.
1. Faktor Instrumen Evaluasi
Mengembangkan instrumen evaluasi memang tidaklah mudah,
apalagi jika seorang evaluator tidak atau kurang memahami prosedur dan
3
teknik evaluasi itu sendiri. Jika instriumen evaluasi kurang baik maka
dapat berakibat hasil evaluasi menjadi kurang baik. Untuk itu, dalam
mengembangakan instrumen evaluasi, seorang evaluator harus
memperhatikna hal-hal yang memengaruhi validitas instrumen dan
berkaitan dengan prosedur penyusunan instrument.
2. Faktor Administrasi Evaluasi dan Penskoran
Dalam administrasi evaluasi dan penskoran, banyak sekali terjadi
penyimpangan atau kekeliruan, seperti alokasi waktu untuk pengerjaan
soal yang tidak proporsional, memberikan bantuan kepada peserta didik
dengan berbagai cara, peserta didik saling menyontek ketika ujian,
kesalahan penskoran, termasuk kondisi fisik dan psikis peserta didik yang
kurang menguntungkan.
3. Faktor Jawaban dari Peserta Didik
Dalam praktiknya, faktor jawaban peserta didik justru lebih banyak
berpengaruh daripada dua faktor sebelumnya. Faktor ini meliputi
kecenderungan peserta didik untuk menjawab secara cepat, tetapi tidak
tepat, keinginan melakukan coba-coba, menggunakan bahasa tertentu
dalam menjawab soal bentuk uraian.
Selanjutnya, Kerlinger (1986) dalam Arifin (2017)
mengemukakan “validitas instrumen tidak cukup ditentukan oleh derajat
ketepatan instrumen untuk mengukur apa yang seharusnya diukur, tetapi
perlu juga dilihat dari tiga kriteria yang lain, yaitu appropriatness,
meaningfullness, dan usefullness”. Appropriatness menunjukkan
kelayakan dari tes sebagai suatu instrumen, yaitu seberapa jauh
instrumen dapat menjangkau keragaman aspek perilaku peserta didik.
Meaningfullness menunjukkan kemampuan instrumen dalam
memberikan keseimbangan soal-soal pengukurannya berdasar tingkat
kepentingan dari setiap fenomena. Usefullness to inferences
menunjukkan sensitif tidaknya instrumen dalam menangkap fenomena
perilaku dan tingkat ketelitian yang ditunjukkan dalam membuat
kesimpulan.
4
C. Jenis-jenis Validitas
Validitas secara garis besar dapat dibedakan menjadi dua (Widoyoko,
2017), yaitu validitas internal (internal validity) dan validitas eksternal
(external validity).
1. Validitas Internal
5
apabila materi tes tersebut menyimpang dari analisa rasional kita,
berarti tes tersebut tidak valid ditinjau dari validitas isinya. Suatu
instrumen dikatakan valid apabila sudah diuji dan dicek oleh validator.
2) Validitas konstruk
Menurut Arikunto (2013) sebuah tes dikatakan memiliki validitas
konstruks apabila butir-butir soal yang membangun tes tersebut
mengukur setiap aspek berpikir seperti yang disebutkan dalam tujuan
instruksional. Jadi jika butir-butir soal mengukur aspek berpikir tersebut
sudah sesuai dengan aspek berpikir yang menjadi tujuan
intsruksional. Misalnya kalau kita akan memberikan tes mata pelajaran
IPA, kita harus membuat soal yang ringkas dan jelas yang benar-benar
mengukur kecakapan IPA, bukan mengukur kemampuan bahasa karena
soal itu ditulis secara berkepanjangan dengan bahasa yang sukar
dimengerti.
Untuk menentukan validitas konstruk suatu instrumen harus
dilakukan proses penelaahan teoritis dari suatu konsep dari variabel
yang hendak diukur, mulai dari perumusan konstruk, penentuan
dimensi dan indikator, sampai kepada penjabaran dan penulisan butir-
butir item instrumen. Perumusan konstruk harus dilakukan berdasarkan
sintesis dari teori-teori mengenai konsep variabel yang hendak diukur
melalui proses analisis dan komparasi yang logik dan cermat. Suatu
instrumen dikatakan valid apabila sudah diuji dan dicek oleh validator.
2. Validitas Eksternal
Validitas eksternal atau sering disebut validitas empiris, istilah
validitas empiris memuat kata “empiris” yang artinya “pengalaman”.
Menurut Arikunto (2013) sebuah instrumen dapat dikatakan memiliki
validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh
sehari-hari seseorang dapat diakui jujur oleh masyarakat apabila dalam
pengalaman dapat dibuktikan bahwa orang tersebut jujur. Contoh lain,
seseorang dapat dikatakan kreatif apabila dari pengalaman dibuktikan
bahwa orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui
berbeda dari hal-hal yang sudah ada. Dari contoh diatas dapat diketahui
6
bahwa validitas empiris tidak dapat diperoleh hanya dengan menyusun
instrumen berdasarkan ketentuan seperti halnya validitas logis, akan tetapi
harus dibuktikan melalui pengalaman.
Ada dua macam validitas empiris yang dilakukan untuk menguji
bahwa sebuah instrument itu memang valid, yaitu:
1) Validitas “ada sekarang” (concurrent validity)/ validitas kesejajaran
Menurut Arikunto (2013) sebuah tes memiliki validitas empiris
jika hasilnya sesuai dengan pengalaman. Jika ada istilah “sesuai” tentu
ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan
dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah
lampau sehingga data pengalaman tersebut sekarang sudah ada (ada
sekarang). Misalnya seorang guru ingin mengetahui apakan tes sumatif
yang disusun sudah valid atau belum. Untuk ini diperlukan sebuah
kriterium masa lalu yang sekarang datanya dimiliki. Misalnya nilai
ulangan harian atau nilai ulangan sumatif yang lalu.
2) Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu mengenai
hal yang akan datang jadi sekarang belum terajadi. Arikunto (2013)
sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan
apabila mempunyai kemampuan untuk meramalkan apa yang akan
terjadi pada masa yang akan datang. Misalnya tes masuk perguruan
tinggi adalah sebuah tes yang diperkirakan mampu meramalkan
keberhasilan perserta tes dalam mengikuti kuliah dimasa yang akan
datang. Calon yang tersaing berdasarkan hasil tes diharapkan
mencerminkan tinggi rendahnya kemampuan mengikuti kuliah.. Jika
nilai tesnya tinggi tentu menjamin keberhasilan kelak. Sebaliknya
seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang
rendah jadi diperkirakan akan tidak mampu mengikuti perkuliahan
yang akan datang.
7
Tabel Skor Tes Masuk Dan Skor Uas
No Nama Skor tes Skor UAS x2 y2 XY
masuk (X) (Y)
1 Nadia 20 21 400 441 420
2 Susi 21 22 441 484 462
3 Cecep 19 18 361 324 342
4 Erna 20 19 400 361 380
5 Dian 19 22 361 484 418
6 Asmara 16 15 256 225 240
7 Siswoyo 21 22 441 484 462
8 Jihad 20 20 400 400 400
9 Yanna 16 17 256 289 272
10 Lina 21 19 441 361 399
Jumlah 193 195 3757 3853 3795
r xy =N ∑ XY −¿ ¿ ¿
8
Rumus korelasi product moment dengan simpangan:
∑ xy
r xy = 2 2
√ (∑ x ) (∑ y )
Dimana:
r xy = koefisien korelasi antara variabel X dan variabel Y, dua variabel yang
dikorelasikan (x = X − X́ dan y = Y −Ý )
X = Skor instrumen yang akan dicari validitasnya
Y = Skor instrumen yang dijadikan sebagai standar (kriteria)
∑ xy = Jumlah perkalian x dan y
x2 = kuadrat dari x
y2 = kuadrat dari y
Contoh perhitungan:
Misalkan akan menghitung validitas tes prestasi belajar matematika
diberi kode X sebagai kriterium diambil nilai rata-rata ulangan harian diberi
kode Y. (perhatikan tabel berikut).
Tabel Persiapan Untuk Mencari Validitas Tes Prestasi Matematika
No Nama X Y x y x2 y2 xy
1 Nadia 7 8 0 0 0 0 0
2 Susi 8 9 1 1 1 1 1
3 Cecep 5 7 -2 -1 4 1 2
4 Erna 8 9 1 1 1 1 1
5 Dian 7 8 0 0 0 0 0
6 Asmara 8 7 1 -1 1 1 -1
7 Siswoyo 6 8 -1 0 1 0 0
8 Jihad 7 9 0 1 0 1 0
9 Yanna 5 7 -2 -1 4 1 2
10 Lina 9 8 2 0 4 0 0
Jumlah 70 80 16 6 5
X́ =
∑ X = 70 =7
N 10
Ý =
∑ Y = 80 =8
N 10
9
x=X − X́
y=Y −Ý
Dimasukkan kerumus:
∑ xy
r xy = 2 2
√ (∑ x ) (∑ y )
5
¿
√16 × 6
5
¿
√ 96
5
¿
9,798
¿ 0,510
Indeks korelasi antara X dan Y inilah indeks validitas soal yang dicari.
Rumus korelasi product moment dengan angka kasar:
r xy =N ∑ XY −¿ ¿ ¿
Dimana:
r xy = Koefisien korelasi antara variabel X dan Y, dua variabel yang
dikorelasikan
X = Hasil tes matematika yang akan dicari validitasnya
Y = Tes yang dijadikan kriteria atau standar
N = Jumlah seluruh siswa
Dengan menggunakan data hasil tes prestasi matematika di atas kini
dihitung dengan rumus korelasi product moment dengan angka kasar yang
tabel persiapannya sebagai berikut.
Tabel Persiapan Untuk Mencari Validitas Tes Prestasi Matematika
No Nama X Y X2 Y2 XY
1 Nadia 7 8 49 64 56
2 Susi 8 9 64 81 72
3 Cecep 5 7 25 49 35
4 Erna 8 9 64 81 72
5 Dian 7 8 49 64 56
6 Asmara 8 7 64 49 56
10
7 Siswoyo 6 8 36 64 48
8 Jihad 7 9 49 81 63
9 Yanna 5 7 25 49 35
10 Lina 9 8 81 64 72
Jumlah 70 80 506 646 565
Dimasukkan kedalam rumus:
r xy =N ∑ XY −¿ ¿ ¿
10 ×565−(70 × 80)
r xy =
√(10 ×506−4900) ¿ ¿ ¿
5650−5600
¿
√(5060−4900)( 6460−¿ 6400) ¿
50
¿
√160 ×60
50
¿
√ 9600
50
¿
97,980
¿ 0,510
Interpretasi mengenai besarnya koefisien korelasi adalah sebagai berikut:
Koefisien validitas Kriteria
0,80 - 1,00 Sangat tinggi
0,60 - 0,80 Tinggi
0,40 - 0,60 Sedang
0,20 - 0,40 Rendah
0,00 - 0,20 Sangat rendah
< 0,00 Tidak valid
11
kecil dari harga kritik dalam tabel, maka korelasi tersebut tidak
signifikan. Begitu juga arti sebaliknya.
Korelasi perbedaan peringkat (rank differences correlation)
Rumus:
6 ∑ D2
r =1−
n ( n2−1 )
Keterangan:
r = koefisien korelasi
1 dan 6 = bilangan tetap
D = perbedaan antara dua peringkat (rank)
n = jumlah sampel
Contoh:
Langkah-langkah penyelesaiannya:
1) Cari peringkat dari tiap-tiap mata pelajaran dengan jalan mengurutkan
nilai-nilai dari yang terbesar sampai yang terkecil.
2) Jika terdapat nilai yang sama, misalnya ada dua nilai yang sama, maka
kita jumlahkan nilai peringkat pertama dengan nilai peringkat kedua,
kemudian dibagi dua. Dengan demikian, kedua orang tersebut
memperoleh peringkat yang sama. Semakin besar nilai yang diperoleh,
semakin tinggi kedudukan peringkat dalam kelompoknya.
3) Cari perbedaan peringkat dengan jalan mengurangkan peringkat mata
pelajaran Bahasa Arab dengan peringkat mata pelajaran Bahasa Inggris.
4) Perbedaan peringkat yang diperoleh kemudian dikuadratkan.
Berdasarkan langkah-langkah di atas, maka akan diperoleh per-hitungan
sebagai berikut:
Perhitungan Korelasi Perbedaan Peringkat
No. X Y Rx Ry D D2
1 5 6 8 7,5 0,5 0,25
2 7 8 3,5 1,5 2 4
3 8 7 1,5 4,5 -3 9
4 5 5 8 9,5 -1,5 2,25
5 6 7 5,5 4,5 1 1
6 7 7 3,5 4,5 -1 1
7 4 5 10 9,5 0,5 0,25
8 5 7 8 4,5 3,5 12,25
12
9 8 8 1,5 1,5 0 0
10 6 6 5,5 7,5 2 4
34
6 ∑ D2
r =1−
n(n2 −1)
6(34)
¿ 1−
10(102−1)
204
¿ 1−
990
¿ 1−0,206
¿ 0,79
13
6 Asmara 2 3 3 2 2 3 15
7 Siswoyo 3 3 4 5 4 3 22
8 Jihad 3 4 3 3 4 3 20
9 Yanna 2 2 3 3 2 2 14
10 Lina 4 4 3 3 2 3 19
Misalnya, akan dihitung validitas butir nomor 2, maka skor butir nomor
tersebut disebut variabel X dan skor total disebut variabel Y. Selanjutnya
perhitungan dilakukan dengan menggunakan rumus korelasi product moment
baik menggunakan rumus deviasi maupun rumus angka kasar. Berikut contoh
menghitung validasi butir nomor 2 dengan menggunakan rumus korelasi
product moment dengan rumus angka kasar.
Persiapan untuk Menghitung Validasi Butir Nomor 2
No Nama X Y X2 Y2 XY
1
Nadia 3 21 9 441 63
2
Susi 4 22 16 484 88
3
Cecep 3 18 9 324 54
4
Erna 2 19 4 361 38
5
Dian 4 22 16 484 88
6
Asmara 3 15 9 225 45
7
Siswoyo 3 22 9 484 66
8
Jihad 4 20 16 400 80
9
Yanna 2 14 4 196 28
10
Lina 4 19 16 361 76
Jumlah 32 192 108 3760 626
Dimasukkan ke dalam rumus:
r xy =N ∑ XY −¿ ¿ ¿
10 ×626−32 ×192
r xy =
√(10 ×108−322)(10 ×3760−1922)
6260−6144
r xy =
√(1080−1024)(37600−36864)
116
¿
√26496
116
¿
162,776
¿ 0 , 713
14
Penafsiran harga koefisien korelasi dilakukan dengan membandingkan
harga dengan r xykritik. Adapun harga kritik untuk validitas butir instrumen
adalah 0,3. Artinya apabila rxy lebih besar atau sama dengan 0,3, nomor butir
soal tersebut dapat dikatakan valid, dan sebaliknya. Untuk kasus contoh
perhitungan di atas, karena korelasinya lebih besar dari 0,3 ( 0,713 > 0,3 ),
maka dapat dikatakan bahwa nomor butir 2 di atas adalah valid.
No Nama X Y X² Y² XY Keterangan
1 Nining 5 7 25 49 35
2 Maruti 6 6 36 36 36 X= hasil tes
matematika
3 Bambang 5 6 25 36 30
yang di cari
4 Seno 6 7 36 49 42
validitasnya
5 Hartini 7 7 49 49 49 Y= tes
6 Heru 6 5 36 25 30 terstandar
Jumlah 35 38 207 244 222
Dimasukkan ke dalam rumus korelasi product moment dengan angka
kasar sebagai berikut:
r xy =N ∑ XY −¿ ¿ ¿
6 ×22−35× 38
r xy =
√(6 ×207−352 )(6 ×244−382 )
15
1332−1330
¿
√(1242−1225)(1464−1444)
2
¿
√340
2
¿
18,439
¿ 0,108
Jika seandainya dari tes terstandar diketahui bahwa validitasnya 0,89
maka bilangan 0,108 ini belum merupakan validitas soal Matematika yang
dicari. Validitas tersebut harus dikalikan dengan 0,89 yang hasilnya 0,108 x
0,89 = 0,096.
16
BAB III
PENUTUP
A. Kesimpulan
Validitas adalah suatu ukuran yang menunjukkan tingkat-tingkat
kevalidan atau kesahihan suatu instrumen. Suatu instrumen yang valid atau
sahih mempunyai validitas tinggi. Sebaliknya, instrumen yang kurang valid
bearti memiliki validitas rendah.Sebuah instrumen dikatakan valid apabila
mampu mengukur apa yang diinginkan. Tinggi rendahnya validitas instrumen
menunjukkan sejauh mana data yang terkumpul tidak menyimpang dari
gambaran tentang validitas yang dimaksud.
Untuk memperoleh instrumen yang valid, peneliti akan melakukan uji
validitas.Uji validitas adalah suatu langkah pengujian yang dilakukan terhadap
isi (content) dari suatu instrumen, dengan tujuan untuk mengukur ketepatan
instrumen yang digunakan dalam suatu penelitian. Dengan uji validitas, dapat
diperoleh instrumen yang memiliki validitas logis. Dikatakan validitas logis
karena validitas ini diperoleh dengan cara-cara yang benar sehingga menurut
logika akan dicapai suatu tingkat validitas yang dikehendaki.
Selain memperoleh validitas logis, peneliti juga menguji validitas
instrumen yang sudah disusun melalui pengalaman. Dengan mengujinya
melalui pengalaman akan diketahui tingkat validitas empiris atau validitas
berdasarkan pengalaman. Apabila data yang didapat dari suatu uji coba sudah
sesuai dengan yang seharusnya, maka berarti bahawa instrumenya sudah baik,
sudah valid. Untuk mengetahui ketepatan data ini diperlukan teknik uji
validitas. Ada dua macam validitas sesuai dengan cara pengujianya, yaitu
validitas eksternal dan intenal.
17
DAFTAR PUSTAKA
Arifin, Z. 2017. Evaluasi Pembelajaran. Bandung: PT. Remaja Rosdakarya.
Arikunto, S. 2012. Dasar-Dasar Evaluasi Pendidikan. Jakarta: PT. Bumi Aksara.
Purwanto, N. 2017. Prinsip-Prinsip dan Teknik Evaluasi Pengajaran. Bandung:
PT. Remaja Rosdakarya.
Sudijono, A. 2016. Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Pers.
Widoyoko, E.P. Evaluasi Program Pembelajaran. Yogyakarta: Pustaka Pelajar.
18