Anda di halaman 1dari 25

VALIDITAS

Dibuat untuk memenuhi tugas Mata Kuliah Asesmen Pembelajaran Matematika Yang
diampu oleh Ibu Rini Nurhakiki

Oleh :

1. Aprilianti Nur Sarfiah (160311604688)


2. Nurul Liya Sari (160311604670)
3. Piwy Ashila Amalia L. (160311604691)
4. Raqqasyi Rahmatullah M. (160311604633)

Offering B 2016

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM


JURUSAN MATEMATIKA
PROGRAM STUDI PENDIDIKAN MATEMATIKA

Maret 2018
KATA PENGANTAR

Puji syukur kami panjatkan kehadirat Allah SWT atas Rahmat dan Karunia-
Nya sehingga kami dapat menyelesaikan makalah ini yang membahas jenis tes, tes
menurut tujuannya, tipe dan bentuk tes.

Dan kami ucapkan terima kasih kepada Ibu Rini Nur Hakiki yang sudah
memberikan pengarahan, orang tua yang selalu mendukung, serta teman-teman kami
yang sudah membantu pembuatan makalah ini.

Kami merasa makalah ini kurang baik, maka kami mohon kritik dan sarannya
kepada para pembaca makalah kami dan terutama pada Bapak/Ibu dosen. Kritik dan
saran bisa disampaikan kepada kami di Universitas Negeri Malang, Prodi S1
Pendidikan Matematika Offering B - 2016.

Terimakasih dan semoga makalah ini bermanfaat bagi kita semua.

Malang, Maret 2018

Tim Penyusun

i
DAFTAR ISI

KATA PENGANTAR.............................................................................................................. i
DAFTAR ISI .............................................................................Error! Bookmark not defined.
BAB I........................................................................................................................................ 1
PENGERTIAN VALIDITAS................................................................................................. 1
1.1 Pengertian Validitas ............................................................................................... 1
1.2 Jenis Validitas ......................................................................................................... 3
BAB II ...................................................................................................................................... 9
RUMUS DAN CONTOH VALIDITAS ................................................................................ 9
2.1 Cara Mengukur Validitas ...................................................................................... 9
2.2 Cara Menentukan Validitas Tiap Butir Soal ..................................................... 17
DAFTAR RUJUKAN ........................................................................................................... 21

ii
iii
BAB I

PENGERTIAN VALIDITAS
1.1 Pengertian Validitas

Untuk mengukur suatu kemampuan dalam pembelajaran khususnya


matematika, diperlukan sebuah alat, salah satunya ialah tes atau soal. Untuk
mengetahui apakah tes atau soal tersebut baik, maka dibutuhkan sebuah instrument
penilaian. Yusuf (2015:59) mengatakan, apabila pendidik ingin menguji kemampuan
peserta didik dalam matematika, maka instrumen yang disusun hendaklah berdasarkan
spesifikasi yang disusun secara khusus, runtut dan sistematis. Instrumen yang
digunakan oleh pendidik hendaklah betul-betul mampu mengukur dan menilai apa
yang ingin diukur atau dinilai. Apabila instrumen tersebut mampu mengukur dan
menilai apa yang ingin diukur dengan sangat baik dan menghasilkan hasil ukur yang
sesuai, maka insturmen tersebut dikatakan memiliki validitas yang tinggi.
Azwar dalam Matondang (2009: 89) menyatakan bahwa validitas berasal dari
kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu
instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Sudjana (2004: 12)
menyatakan bahwa validitas berkenaan dengan ketepatan alat penilaian terhadap
konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai.
Suryabrata dalam Matondang (2009: 89) menyatakan bahwa validitas tes pada
dasarnya menunjuk kepada derajat fungsi pengukurnya suatu tes, atau derajat
kecermatan ukurnya sesuatu tes. Anastasi dalam Yusuf (2015: 60), menyatakan “the
validity of a instrumen concern what does the instrumen measure and how well it does
so”. Cronbach menyatakan bahwa Validity adalah: “How well a instrument or
evaluative technique does the job that it employed to do,” Thorndike dalam Yusuf
(2015: 60).
Pendapat yang hampir senada dengan pendapat-pendapat di atas dikemukakan
juga oleh Udinsky dalam Yusuf (2015: 61), yang menyatakan : Validity is simply, the
degree to which a scale measures what it is supposed to measure. Adapun Oriendo &
Antonio dalam Yusuf (2015: 61); menyatakan bahwa validity refers to the extent to

1
which the instrument serves its purpose or the efficiency with which it measures what
it intends to measure. Pendapat yang lebih lengkap tentang validitas dikemukakan
Thorndike, dkk dalam Yusuf (2015: 61) sebagai berikut : The concept of validity refers
to the appropriateness, meaningfullness, and usefulness of specific inferences made
from Instrument score. Intrument validition is the process of accumulating evidence to
support such inferences....Thus, a instrument does not have “validity” in any absolute
sense. Rather, the instrumen score are valid for some uses and not valid for others.
Sehingga,dari pendapat-pendapat diatas, dapat disimpulkan bahwa konsep
validitas menunjuk kepada kesesuaian, kebermaknaan, dan kebergunaan kesimpulan-
kesimpulan yang dibuat berdasarkan skor instrumen. Makin tinggi validitas suatu alat
ukur, makin baik alat ukur itu untuk digunakan. Tetapi perlu diingat bahwa validitas
alat ukur itu tidak dapat dilepaskan dari kelompok yang dikenai alat ukur tersebut. oleh
karena itu berlakunya validitas hanya terbatas pada kelompok tersebut atau kelompok
lain yang kondisinya hampir sama dengan kelompok itu.

Gronlund dalam Yusuf (2015: 61) mengemukakan, bahwa

a. Validitas menunjuk pada suatu instrumen atau instrumen evaluasi untuk kelompok
atau individual, tidak untuk instrumen itu sendiri.
b. Validitas merupakan “degree” (derajat seperti: tinggi, sedang, dan kurang).
c. Validitas itu selalu spesifik penggunaannya.

2
1.2 Jenis Validitas

Validitas berkenaan dengan ketepatan alat ukur terhadap konsep yang diukur,
sehingga betul-betul mengukur apa yang seharusnya diukur. Sebagai contoh, ingin
mengukur kemampuan siswa dalam matematika. Kemudian diberikan soal dengan
kalimat yang panjang dan yang berbelit-belit sehingga sukar ditangkap maknanya.
Akhimya siswa tidak dapat menjawab, akibat tidak memahami pertanyaannya. Contoh
lain, peneliti ingin mengukur kemampuan berbicara, tapi ditanya mengenai tata bahasa
atau kesusastraan seperti puisi atau sajak. Pengukur tersebut tidak tepat (valid).
Validitas tidak berlaku universal sebab bergantung pada situasi dan tujuan penelitian.
Instrumen yang telah valid untuk suatu tujuan tertentu belum otomatis akan valid untuk
tujuan yang lain.
Contoh variabel prestasi belajar dan motivasi bisa diukur oleh tes ataupun oleh
kuesioner. Caranya juga bisa berbeda, tes bisa dilaksanakan secara tertulis atau bisa
secara lisan. Ada beberapa jenis validitas yang sering digunakan dalam penyusunan
instrumen, yakni validitas isi, validitas bangun pengertian dan validitas ramalan dan
Validitas kesamaan (councurrent validity)
(a) Validitas isi

Validitas isi berkenaan dengan kesanggupan instrumen mengukur isi yang harus
diukur. Artinya, alat ukur tersebut mampu mengungkap isi suatu konsep atau variabel
yang hendak diukur. Misalnya tes hasil belajar bidang studi IPS, harus bisa
mengungkap isi bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun
tes yang bersumber dari kurikulum bidang studi yang hendak diukur. Di samping
kurikulum dapat juga diperkaya dengan melihat/mengkaji buku sumber. Sungguhpun
demikian tes hasil belajar tidak mungkin dapat mengungkap semua materi yang ada
dalam bidang studi tertentu sekalipun hanya untuk satu semester. Oleh sebab itu harus
diambil sebagian dari materi dalam bentuk sampel tes. Sebagai sampel maka harus
dapat mencerminkan materi yang terkandung dari seluruh materi bidang studi. Cara
Yang ditempuh dalam menetapkan sampel tes adalah memilih konsep-konsep yang
esensial dari materi yang di dalamnya. Misalnya menetapkan sejumlah konsep dari

3
setiap pokok bahasan yang ada. Dari setiap konsep dikembangkan beberapa pertanyaan
tes (lihat bagan). Di sinilah pentingnya peranan kisi-kisi sebagai alat untuk memenuhi
validitas isi.

TES HASIL BELAJAR

Bidang studi : ....................

Semester : ....................

Kelas : ....................

Pokok bahasan Konsep atau Jumlah Abilitas


untuk satu
materi perta- Jenis tes yang
semester sesuai
dengan kurikulum esensial nyaan diakui
Pokok bahasan 1 1.1 ……………… 10 soal pilihan Aplikasi
ganda

1.2 ……………… 10 soal Benar- Pemahaman+Ingat


Salah
an dst.

Pokok bahasan 2.1 ……………… 12 soal Pilihan


2 Ganda

2.2 ……………… 13 soal

Pokok bahasan 3.1 ……………… 13 soal Benar-


3 salah

3.2 ……………… 12 soal

dan seterusnya

Dalam hal tertentu tes yang telah disusun sesuai dengan kurikulum (materi dan
tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat meminta

4
bantuan ahli bidang studi untuk menelaah apakah konsep materi yang diajukan telah
memadai atau tidak, sebagai sampel tes. Dengan demikian validitas isi tidak
memerlukan uji coba dan analisis statistik atau dinyatakan dalam bentuk angka-angka.

(b) Validitas bangun pengertian (Construct validity)

Validitas bangun atau bangun pengertian (Construct validity) berkenaan


dengan kesanggupan alat ukur mengukur pengertian-pengertian yang terkandung
dalam materi yang diukurnya. Pengertian-pengertian yang terkandung dalam konsep
kemampuan, minat, sebagai variabel penelitian dalam berbagai bidang kajian harus
jelas apa yang hendak diukurnya. Konsep-konsep tersebut masih abstrak, memerlukan
penjabaran yang lebih spesifik, sehingga mudah diukur. Ini berarti setiap konsep harus
dikembangkan indikator-indikatomya. Dengan adanya indikator dari setiap konsep
maka bangun pengertian akan nampak dan memudahkan dalam menetapkan cara
pengukuran. Untuk variabel tertentu, dimungkinkan penggunaan alat ukur yang
beraneka ragam dengan cara mengukurnya yang berlainan.
Menetapkan indikator suatu konsep dapat dilakukan dalam dua cara, yakni (a)
menggunakan pemahaman atau logika berpikir atas dasar teori pengetahuan ilmiah dan
(b) menggunakan pengalaman empiris, yakni apa yang terjadi dalam kehidupan nyata.
Contoh: Konsep mengenai “Hubungan Sosial”, dilihat dari pengalaman,
indikatornya empiris adalah keterkaitan dari

- bisa bergaul dengan orang lain


- disenangi atau banyak teman-temannya
- menerima pendapat orang lain
- tidak memaksakan pendapatnya
- bisa bekerja sama dengan siapa pun
- dan lain-lain.
Mengukur indikator-indikator tersebut, berarti mengukur bangun pengertian yang
terdapat dalam konsep hubungan sosial. Contoh lain: Konsep sikap dapat dilihat dari
indikatornya secara teoretik (deduksi teori) antara lain keterkaitan dari

5
- kesediaan menerima stimulus objek sikap
- kemauan mereaksi stimulus objek sikap
- menilai stimulus objek sikap
- menyusun/mengorganisasi objek sikap
- internalisasi nilai yang ada dalam objek sikap.
Apabila hasil tes menunjukkan indikator-indikator tes yang tidak berhubungan secara
positif satu sama lain, berarti ukuran tersebut tidak memiliki validitas bangun
pengertian. Atas dasar itu indikatornya perlu ditinjau atau diperbaiki kembali. Cara lain
untuk menetapkan validitas bangun pengertian suatu alat ukur adalah menghubungkan
(korelasi) antara alat ukur yang dibuat dengan alat ukur yang sudah baku/standardized,
seandainya telah ada yang baku. Bila menunjukkan koefisien korelasi yang tinggi maka
alat ukur tersebut memenuhi validitasnya.

(c) Validitas ramalan (predictive validity)

Validitas ramalan artinya dikaitkan dengan kriteria tertentu. Dalam validitas ini
yang diutamakan bukan isi tes tapi kriterianya, apakah alat ukur tersebut dapat
digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau kriteria tertentu yang
diinginkan. Misalnya alat ukur motivasi belajar, apakah dapat digunakan untuk
meramal prestasi belajar yang dicapai. Artinya terdapat hubungan yang positif antara
motivasi dengan prestasi. Dengan kata lain dalam validitas ini mengandung ciri adanya
relevansi dan keajegan atau ketetapan (reliability). Motivasi dapat digunakan meramal
prestasi bila skor-skor yang diperoleh dari ukuran motivasi berkorelasi positif dengan
skor prestasi. Validitas ramalan ini mengandung dua makna. Pertama validitas jangka
pendek dan kedua jangka panjang. Validitas jangka pendek, artinya daya ramal alat
ukur tersebut hanya untuk masa yang tidak lama. Artinya, skor tersebut berkorelasi
pada waktu yang sama. Misalnya, ketetapan (reliability) terjadi pada semester dua
artinya daya ramal berlaku pada semester dua, dan belum tentu terjadi pada semester
berikutnya. Sedangkan validitas jangka panjang mengandung makna skor tersebut akan
berkorelasi juga di kemudian hari. Mengingat validitas ini lebih menekankan pada
adanya korelasi, maka faktor yang berkenaan dongan persyaratan terjadinya korelasi

6
harus dipenuhi. Faktor tersebut antara lain hubungan dari konsep dan variabel dapat
dijelaskan berdasarkan pengetahuan ilmiah, minimal masuk akal sehat dan tidak
mengada-ada. Faktor lain adalah skor yang dikorelasikan memenuhi linieritas. Ketiga
validitas yang dijelaskan di atas idealnya dapat digunakan dalam menyusun instrumen
penelitian, minimal dua validitas, yakni validitas isi dan validitas bangun pengertian.
Validitas isi dan bangun pengertian mutlak diperlukan dan bisa diupayakan tanpa
melakukan pengujian secara statistika.

(d) Validitas kesamaan (councurrent validity)

Validitas kesamaan suatu tes artinya membuat tes yang memiliki persa maan
dengan tes sejenis yang telah ada atau yang telah dibakukan. Kesa maan tes
terlingkupnya abilitas yang diukurnya, sasaran atau objek yang diukurnya, serta waktu
yang diperlukan. Validitas kesamaan suatu tes adalah melalui indeks korelasi
berdasarkan perhitungan korelasi. Apabila me nunjukkan indeks korelasi yang cukup
tinggi, yakni mendekati angka satu (korelasi sempurna), berarti tes yang disusun
tersebut memiliki validitas kesamaan. Untuk mudahnya kita bisa mengasumsikan soal-
soal Ebta atau Ebtanas dalam bidang studi tertentu sebagai tes baku sehingga da pat
digunakan sebagai acuan dalam penyusunan bidang studi yang sejenis. Dengan
demikian guru dapat membuat tes bidang studi tersebut yang memiliki kesamaan
dengan tes Ebta bidang studi yang sama melalui uji korelasi. Di lain pihak sekolah atau
guru dapat juga membuat tes baku dalam bidang-bidang studi tertentu. Melalui
beberapa kali uji coba ke mudian hasilnya dianalisis tingkat kesukaran dan daya
pembedanya di samping diuji validitas dan reliabilitasnya. Berdasarkan uji coba
tersebut item tes diperbaiki dan disempurnakan sehingga menghasilkan tes yang
mendekati kebakuan. Tes ini nantinya dapat digunakan sebagai acuan bagi penyusunan
tes sejenis melalui uji validitas kesamaan. Tes baku untuk bidang studi yang ada di
sekolah memang sangat lang ka. Kelangkaan ini disebabkan oleh sulitnya membuat tes
baku di samping memerlukan biaya yang mahal. Soal-soal yang dibuat untuk ke-
perluan Ebtanas merupakan satu-satunya tes yang dianggap baku. Oleh sebab itu,
membuat tes bidang studi yang diacukan kepada soal-soal Ebtanas melalui validitas

7
kesamaan merupakan salah satu upaya dalam menyediakan soal soal bidang studi yang
memadai. Melalui upaya ini sekolah dapat memiliki soal-soal bidang studi untuk
keperluan tes sumatif atau pun keperluan lainnya. Namun, Yusuf (2015:63)
mengelompokkan Predictive Validity dan Concurrent Validity kedalam Validitas
Patokan (Criterion Validity).

8
BAB II

RUMUS DAN CONTOH VALIDITAS


2.1 Cara Mengukur Validitas

Seperti telah disinggung pada uraian terdahulu, validitas suatu instrumen/alat


ukur merupakan tingkat kesesuaian alat ukur dengan kriterium. Suatu instrumen
dikatakan mempunyai validitas yang tinggi, atau suatu instrumen adalah valid/sahih,
apabila instrumen tersebut sesuai dengan kriterium.
Berhubung instrumen merupakan seperangkat soal yang terdiri dari bermacam
jenis dan aspek, maka awal kegiatan yang menentukan validitas itu bersumber dari
ketepatan dan kesesuaian apa yang ingin diukur. Karena itu, perencanaan instrumen
yang baik merupakan hal yang essensial untuk dapat memberikan gambaran yang tepat
dari instrumen tersebut.
Validitas instrumen mencakup validitas tiap item/butir soal dan validitas
keseluruhan instrumen. Untuk dapat menyusun instrumen yang valid, maka penyusun
instrumen harus sadar bahwa yang akan diketahui adalah sejumlah kemampuan,
keterampilan, nilai, sikap maupun kepribadian dan latar belakang lainnya, yang sesuai
dengan tujuan suatu kegiatan. Sementara, instrumen yang disusun hendaklah
"representative” (mewakili); baik dari aspek yang diukur, maupun besaran (magtitude)
untuk tiap-tiap aspek. Oleh karena itu, validitas isi dari setiap instrumen perlu sekali
mendapat perhatian.
Beberapa tahap yang dapat dilakukan untuk menyusun instrumen sebagai berikut:

a. Menyusun tujuan yang jelas.


b. Merumuskan spesifikasi yang terarah pada tujuan.
c. Membuat kisi-kisi (blueprint)
d. Menyusun instrumen.
e. Me-review instrumen.
(Dalam hal ini individu yang diundang adalah individu yang ahli dalam bidang yang
sesuai dengan kisi-kisi instrumen yang sedang disusun; dengan tujuan un- tuk menilai
ketepatan alat ukur yang disusun.)

9
f. Uji coba instrumen.
g. Analisis uji coba.
h. Revisi/penyempurnaan instrumen.

Uraian yang lengkap dan terperinci tentang tiap aspek di atas akan dibicarakan pada
bab tentang penyusunan instrumen yang baik.
Di samping jenis-jenis validitas seperti yang telah diutarakan, ada pula
klasifikasi lain tentang validitas, yaitu validitas internal dan validitas eksternal.
Validitas internal mengacu pada tersedianya informasi sesuai dengan yang diharapkan,
sedangkan validitas eksternal mengacu pada konsep generalisasi. Makin tinggi
validitas eksternal, makin baik pula generalisasi temuan di daerah lain.
Validitas instrumen dapat diketahui dengan jalan mencari korelasi instrumen itu
dengan kriterium, atau melakukan analisis butir (item). Untuk dapat menggunakan
formula yang tepat dalam menentukan validitas suatu instrumen maka perlu ditentukan
terlebih dahulu tipe data yang dikumpulkan melalui instrumen itu.
Apabila data yang didapat adalah data interval maka dapat digunakan rumus
Product Moment Correlation, sebagai berikut:
a. Rumus untuk skor kasar.
𝑁Σ𝑋𝑌 − (Σ𝑋)(Σ𝑌)
𝑟𝑥𝑦 =
√[𝑁Σ𝑋 2 − (Σ𝑋)2 ][(𝑁Σ𝑌 2 − (Σ𝑌)2 ]
Atau

(Σ𝑋)(Σ𝑌)
Σ𝑋𝑌 −
𝑟𝑥𝑦 = 𝑁
(Σ𝑋)2 2
2 − (Σ𝑌) ]
√[Σ𝑋 2 − ] [(Σ𝑌
𝑁 𝑁

Keterangan:
𝑟𝑥𝑦 = koefisien korelasi antara instrumen X dan intrumen Y.
𝑋 = Variabel X (instrumen X).
𝑌 = Variabel Y (instrumen Y).
𝑁 = Jumlah peserta

10
Bagaimana cara mencari harga 𝑟𝑥𝑦 ?

Perhatikan contoh berikut:

Suatu tim evaluasi menyusun instrumen kemampuan dasar untuk peserta didik SMA
(dalam contoh ini disebut instrumen X). mengetahui validitas instrumen tersebut,
digunakan instrumen lain yang telah diakui dan diketahui validitasnya. Dalam hal ini
digunakan instrumen Standard Progresive Matrice.

Kedua instrumen itu dilaksanakan pada sejumlah sampel yang sama dan hasilnya
sebagai berikut:

Data di atas dimasukkan ke dalam tabel persiapan sebagai berikut:

Tabel Persiapan

11
Selanjutnya masukkan ke dalam rumus:

𝑁Σ𝑋𝑌 − (Σ𝑋)(Σ𝑌)
𝑟𝑥𝑦 =
√[𝑁Σ𝑋 2 − (Σ𝑋)2 ][𝑁Σ𝑌 2 − (Σ𝑌)2 ]

10 × 83097 − (670)(1231)
𝑟𝑥𝑦 =
√[10 × 45384 − (670)2 ][10 × 153821 − (1231)2 ]

830970 − 824770
𝑟𝑥𝑦 =
√[453840 − 448900][1538210 − 1515361]

𝑟𝑥𝑦 ≈ 0,58

b. Rumus untuk skor deviasi


Σ𝑥𝑦
𝑟𝑥𝑦 =
√(Σ𝑥 2 )(Σ𝑦 2 )
Keterangan:
𝑟𝑥𝑦 = Koefisien korelasi instrumen X dan Y.
Σ𝑥𝑦 = Jumlah perkalian deviasi masing-masing skor X dan Y ( x= X – X dam y = Y –
Y)
Σ𝑥 2 = Jumlah kuadrat deviasi masing-masing skor X dari rata-rata X.
Σ𝑦 2 = Jumlah kuadrat deviasi masing-masing skor Y dari rata-rata Y.

12
Penggunaan rumus:

670
Rata-rata X = = 67
10
1231
Rata-rata Y = = 123,1
10
Σ𝑥𝑦
𝑟𝑥𝑦 =
√(Σ𝑥 2 )(Σ𝑦 2 )
620
𝑟𝑥𝑦 =
√(494)(284,9)
620
𝑟𝑥𝑦 ≈
1062,422
𝑟𝑥𝑦 ≈ 0,58

Untuk menentukan apa arti koefisien korelasi yang diperoleh, dapat dilakukan dengan
cara:

a. membandingkan koefisien tersebut dengan r tabel Product Moment Correlation.


Apabila angka yang didapat lebih besar daripada r dalam tabel dengan tingkat
signifikansi 5%, maka dikatakan hubungan kedua instrumen itu signifikan. Se-
andainya lebih besar dari r tabel pada tingkat signifikansi 1%, maka dikatakan
hubungan sangat signifikan.
Dengan N=10, didapatlah rt (5%) = 0,623 dan rt, (1%) = 0,765.

13
Angka yang diperoleh lebih kecil dari rt 5%, ini berarti tidak terdapat hubungan yang
signifikan di antara kedua instrumen itu.
Apabila korelasi kedua instrumen itu dicari dengan rumus kedua, maka hasilnya
sebagai berikut:

𝑁Σ𝑋𝑌 − (Σ𝑋)(Σ𝑌)
𝑟𝑥𝑦 =
√[𝑁Σ𝑋 2 − (Σ𝑋)2 ][𝑁Σ𝑌 2 − (Σ𝑌)2 ]

(670)(1231)
83097 −
𝑟𝑥𝑦 = 10
(670)2 (1231)2
√[45384 − ] [153821 −
10 10 ]

830970 − 824770
𝑟𝑥𝑦 =
√[45384 − 44890][153821 − 151536,1]

𝑟𝑥𝑦 ≈ 0,58

b. Membandingkan hasil tersebut dengan acuan. Salah satu di antaranya sebagai


berikut :
0,90 ≤ r ≤ 1,00 sangat tinggi
0,70 ≤ r ≤ 0,90 tinggi
0,40 ≤ r ≤ 0,700 cukup
0,20 ≤ r ≤ 0,40 rendah
r ≤ 0,20 sangat rendah

Dengan demikian dapat dikatakan hubungan antara kedua instrumen tersebut "cukup".
Andai kata instrumen yang digunakan sebagai kriterium "baik", maka kata-kata
"cukup", boleh dikatakan belum memadai untuk digunakan. Ini berarti, bahwa
Instrumen Kemampuan Dasar yang disusun, belum valid serta belum mampu
membedakan antara kelompok peserta didik yang mempunyai kemampuan dasar tinggi
peserta didik yang mempunyai kemampuan dasar rendah. Tetapi perlu pula diingat,

14
jika jumlah sampel ujinya terbatas (< 30 orang), maka akan memengaruhi besarnya
koefisien korelasi.
Cara lain yaitu membandingkan korelasi yang didapat dengan r tabel Product Moment
Correlation, dengan degree of freedom (df)= n-1 dan tingkat kepercayaan 95% atau
𝛼 = 5%.
Apabila data yang dikumpulkan dari kedua instrumen dapat dijadikan data ordinal,
maka rumus yang digunakan adalah Spearman Rank Order Correlation. dengan rumus
sebagai berikut:
6Σ𝐷 2
Rho = 1 − 𝑁(𝑁2 −1)

Keterangan:
D = Deviasi/ pasangan urutan
N = Jumlahs

TABEL NILAI-NILAI RHO

Taraf Signif Taraf Signif


N N
5% 1% 5% 1%

5 1.000 16 0.506 0.665

6 0.886 1.000 18 0.475 0.626

7 0.786 0.929 20 0.450 0.591

8 0.738 0.881 22 0.428 0.562

9 0.683 0.833 24 0.409 0.537

10 0.648 0.794 26 0.392 0.515

12 0.591 0.777 28 0.377 0.496

14 0.544 0.715 30 0.364 0.478

(www.scribd.com)

15
Tabel nilai Rho digunakan untuk menguji signifikansi korelasi dengan teknik korelasi
Rank Spearman. Jika sampel <= 30 maka nilai korelasi yang diperoleh dari hasil
perhitungan dapat langsung dibandingkan dengan rho tabel.

Parameter yang digunakan adalah jika rho hitung < r tabel maka Ho diterima, dan jika
rho hitung > rho tabel maka Ho ditolak (Ha diterima).

Penggunaan rumus sebagai berikut:


Tabel persiapan

R = Rank (urutan)
6×79
Rho = 1 − 10(102 −1)

= 1 − 474/990
≈ 1 − 0,48
≈ 0,52

Selanjutnya bandingkan hasil tersebut dengan nilai r tabel Rho. Dengan n = 10, nilai rt
(5%) = 0,648.
Ini berarti, nilai yang didapat lebih kecil dari nilai r dalam tabel. Oleh karena itu, dapat
disimpulkan kedua instrumen tidak terdapat hubungan yang signifikan atau kurang
terdapat kesesuaian dan kesejajaran antara kedua instrumen tersebut.
Apabila instrumen yang digunakan

16
tidak dapat diskor, maka dalam mencari validitas instrumen gunakan "expert
judgement" atau penimbang ahli (judger) dan selanjutnya diolah dengan menggunakan
rumus psychometric lainnya, sesuai dengan bentuk/tipe instrumen yang disusun.

2.2 Cara Menentukan Validitas Tiap Butir Soal

Tinggi rendahnya validitas soal secara keseluruhan berhubungan erat dengan


validitas tiap butri soal tersebut. Mengapa validitas soal rendah? Lihat validitas
masing-masing butir soal. Mungkin di antara soal yang dicari dalam hubungannya
dengan skor total tiap individu yang ikut serta dalam evaluasi.
Langkah yang ditempuh sebagai berikut:
a. Skor suatu instrument/ alat ukur dengan baik dan teliti
Untuk individu yang benar diberi angka 1, sedangkan yang salah diberi angka nol.
b. Jumlahkan skor total untuk tiap individu.
Perhatikan contoh berikut:
Peserta ujian 10 orang dengan jumlah soal 10 buah. Setelah diskor sebagai berikut:

Sampel Butir Soal Skor


total
1 2 3 4 5 6 7 8 9 10

A 0 1 1 1 0 1 0 0 0 1 5
B 1 1 1 1 0 1 1 0 0 1 7
C 1 0 1 1 1 1 0 1 1 1 8
D 0 0 1 1 1 0 1 1 0 0 5
E 1 0 0 0 1 1 1 1 0 1 6
F 1 1 1 0 0 0 1 1 1 1 7
G 1 0 0 1 0 1 1 1 0 1 6
H 1 0 0 1 1 1 0 1 1 0 6
I 1 0 1 1 0 1 1 0 1 1 7
J 1 1 1 1 0 1 1 1 0 0 7

c. Gunakan rumus Product Moment Correlation atau Korelasi Biserial


1) Penggunaan Product Moment Correlation

17
a. Buat tabel persiapan dengan skor butir soal masing-masing sebagai X
dan skor total sebagai Y, seperti berikut:

Sampel X Y X2 Y2 XY
A 0 5 0 25 0
B 1 7 1 49 7
C 1 8 1 64 8
D 0 5 0 25 0
E 1 6 1 36 6
F 1 7 1 49 7
G 1 6 1 36 6
H 1 6 1 36 6
I 1 7 1 49 7
J 1 7 1 49 7
ƩX = 8 ƩY = 64 ƩX2 = 8 ƩY = 418
2
ƩXY = 54
b. Selanjutnya masukkan ke dalam rumus
𝑁Σ𝑋𝑌 − (Σ𝑋)(Σ𝑌)
𝑟𝑥𝑦 =
√[𝑁Σ𝑋 2 − (Σ𝑋)2 ][(𝑁Σ𝑌 2 − (Σ𝑌)2 ]
10 × 54 − 8 × 64
𝑟𝑥𝑦 =
√[10 × 8 − 82 ][(10 × 418 − 642 ]
540 − 512
𝑟𝑥𝑦 =
√[80 − 64][4180 − 4096]
28
𝑟𝑥𝑦 =
√(16 × 84)
28
𝑟𝑥𝑦 =
36,66
𝑟𝑥𝑦 ≈ 0,76

Dengan memperhatikan koefisien korelasi yang didapat (0, 76) maka


dapat dikatakan soal nomor 1 mempunyai hubungan yang tinggi dengan
skor total. Ini dapat diartikan bahwa butir pertama mempunyai validitas
yang tinggi.
2) Penggunaan Korelasi Biserial
Rumus yang digunakan adalah :

𝑀𝑝 − 𝑀𝑡 𝑝
𝑟𝑝𝑏𝑖𝑠 = × √
𝑆𝐷𝑡 𝑞

Keterangan :

18
𝑟𝑝𝑏𝑖𝑠 = Koefisien korelasi biserial
𝑀𝑡 = Mean Total
𝑀𝑝 = Mean skor dari subjek yang menjawab benar butir soal yang dicari
𝑆𝐷𝑡 = Standar Deviasi skor total.
𝑝 = Proporsi peserta didik yang menjawab benar butir soal yang dicari
𝑞 = Proporsi peserta didik yang menjawab salah (𝑞 = 1 − 𝑝)

Langkah yang ditempih sebagai berikut:


a. Buat tabel persiapan
Butir Pertama
Sampel Skor Nomor Skor Total
1
A 0 5
B 1 7
C 1 8
D 0 5
E 1 6
F 1 7
G 1 6
H 1 6
I 1 7
J 1 7
b. Seleksi dari semua peserta, dan tentukan siapa yang menjawab butir
pertama dengan benar.
Dalam hal ini: B, C, E, F, G, H, I, J.
c. Jumlahkan skor total untuk butir itu dan kemudian cari rata-ratanya.
5 + 7 + 8 + 5 + 6 + 7 + 6 + 6 + 7 + 7 64
𝑀𝑡 = = = 6,4
10 10

d. Jumlahkan skor total dari subjek yang menjawab benar dan kemudian
tentukan rata-ratanya.
7 + 8 + 6 + 7 + 6 + 6 + 7 + 7 54
𝑀𝑝 = = = 6,75
8 8

e. Cari standar deviasi total


Σ𝑌 2 (Σ𝑌)2
𝑆𝐷𝑡 = √( )−( )
𝑁 𝑁

418 642
𝑆𝐷𝑡 = √( )−( )
10 10

19
𝑆𝐷𝑡 = √0,84
𝑆𝐷𝑡 = 0,916515139
f. Tentukan proporsi peserta didik yang menjawab butir soal tersebut
dengan benar dan yang salah.
8
𝑝= = 0,8
10
𝑞 = 1 − 0,8 = 0,2
g. Masukkan ke dalam rumus
𝑀𝑝 − 𝑀𝑡 𝑝
𝑟𝑝𝑏𝑖𝑠 = × √
𝑆𝐷𝑡 𝑞

6,75 − 6,4 0,8


𝑟𝑝𝑏𝑖𝑠 = × √
0,916515139 0,2
0,35
𝑟𝑝𝑏𝑖𝑠 = ×2
0,916515139
𝑟𝑝𝑏𝑖𝑠 = 0,76

Dengan cara yang sama, validitas semua butir soal dalam satu set instrumen dapat
diketahui, sehingga butir soal yang tidak baik harus dibuang.

20
DAFTAR RUJUKAN

Gunawan, M. 2018. Tabel Nilai Rho. (online),


https://www.scribd.com/document/369603156/tabel-nilai-rho-doc.
Diakses pada 18 Februari 2018
Matondang, Z. 2009. “Validitas dan Reliabilitas Suatu Instrumen Penilaian”. Jurnal
Tabularasa PPS UNIMED, Volume 1 (6).

Sudjana, N. 1990. Penilaian Hasil Proses Belajar Mengajar. Bandung : PT. Remaja
Rosdakarya

Yusuf, A. 2015. Asesemen dan Evaluasi Pendidikan. Jakarta : Prenadamedia Group

21

Anda mungkin juga menyukai