DISUSUN OLEH:
S1 PENDIDIKAN IPA
SINGARAJA
2019
KATA PENGANTAR
Puji syukur kami panjatkan ke hadirat Tuhan Yang Maha Esa, karena berkat rahmat Nya
kami dapat menyelesaikan makalah yang berjudul “Analisis Validitas Isi, Validitas Empiris dan
Realibilitas”. Makalah ini disusun guna memenuhi tugas matakuliah Asesmen dan Evaluasi
Pembelajaran Jurusan Fisika dan Pengajaran IPA di Fakultas Matematika dan Ilmu Pengetahuan
Alam. Kami menyadari bahwa dalam proses penyelesaian makalah ini tidak terlepas dari peran
serta dari berbagai pihak, khususnya penulis dan berbagai sumber referensi yang telah mendukung
dalam penyusunan makalah ini.
Maka itu dalam kesempatan ini, kami ingin menyampaikan terimakasih kepada semua
pihak yang telah membantu dan berkontribusi dalam menyelesaikan penulisan makalah ini. Dalam
penulisan makalah ini, kami menyadari bahwa masih terdapat banyak kekurangan dan jauh dari
kesempurnaan sehingga kritik dan saran yang membangun sangat kami harapkan. Kami berharap
Semoga tulisan ini dapat bermanfaat bagi para pembaca.
Penulis
DAFTAR ISI
DAFTAR PUSTAKA
BAB I
PENDAHULUAN
1.4 MANFAAT
Manfaat yang bisa diperoleh dari penulisan makalah ini, yaitu sebagai berikut:
1. Bagi Penulis
Penulisan makalah ini memberikan manfaat bagi penulis untuk dapat memahami
lebih banyak tentang validitas dan reabilitas serta analisis validitas isi, validitas empirsis
dan analisis reabilitas yang penulis miliki tersebut, sehingga penulis dapat menyampaikan
informasi yang lebih jelas mengenai materi tersebut kepada pembaca dan masyarakat
umum yang terkadang masih memiliki pengetahuan yang minim.
2. Bagi Pembaca
Penulisan makalah ini memberikan manfaat bagi pembaca yang membaca makalah ini untuk
dapat menambah wawasan mengenai tentang validitas dan reabilitas dalam pembelajaran, serta
analisis validitas isi, validitas empirsis dan analisis reabilitas. Selain itu, makalah ini juga dapat
digunakan sebagai referensi oleh pembaca dalam pembuatan makalah yang sejenis.
BAB II
PEMBAHASAN
Validitas berasal dari kata ’’validity’’ yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur
dapat dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi
ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran tersebut.
Tes yang menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes
yang memiliki validitas rendah (Azwar, 1997).
Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi, jadi
jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa istrumen
tersebut valid, karena dapat memberikan gambaran tetang data secara benar sesuai dengan
kenyataan atau keadaan sesungguhnya jadi jika data yang dihasilkan oleh instrument benar atau
valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid.
Prinsip validitas adalah pengukuran atau pengamatan yang berarti prinsip keandalan
instrumen dalam mengumpulkan data. Instrumen harus dapat mengukur apa yang seharusnya
diukur. Jadi validitas lebih menekankan pada alat pengukuran atau pengamatan.
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila
instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan
maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan
menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Terkandung di sini pengertian bahwa ketepatan pada validitas suatu alat ukur tergantung
pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat.
Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil
pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi.
Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai
variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk
mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A’ atau B (Azwar: 1997).
2.1.2 Macam-macam Validitas
Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
a. Validitas Logis
istilah ’’validitas logis’’ mengandung kata ’’logis’’ berasal dari kata ’’logika’’ yang berarti
penalaran. Dengan makna demikian maka validitas logis untuk sebuah instrumen evaluasi
menunjuk pada kondisi bagi sebuah instrument yang memenuhi persyaratan valid berdasarkan
hasil penalaran. Kondisi valid tersebut dipandang terpenuhi karena instrument yang bersangkutan
sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan
tugas lain misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan mengarang,
tentu secara logis karangannya sudah baik. Dari penjelasan tersebut kita dapat memahami bahwa
validitas logis dapat dicapai apabila instrument disusun mengikuti ketentuan yang ada. Dengan
demikian dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi langsung
diperoleh sesudah instrument tersebut selesai disusun. Ada dua macam validitas logis yang dapat
dicapai oleh sebuah instrument, yaitu: validitas isi dan validitas konstrak.
b. Validitas Empiris
istilah validitas empiris memuat kata empiris yang artinya pengalaman. Sebuah instrumen dapat
dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-
hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa
orang tersebut memang jujur. Contoh lain, seseorang dikatakan kreatif apabila dari pengalaman
dibuktikan bahwa orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui bebeda dari
hal-hal yang sudah ada. Dari penjelasan contoh-contoh tersebut diketahui bahwa validitas empiris
dapat diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas
logis, tetapi harus dibuktikan melalui pengalaman. Ada dua macam validitas empiris, yakni
validitas ada sekarang dan validitas prediksi.
Dari uraiaan diatas ada dua jenis validitas, yakni validitas logis yang ada dua macam, dan validitas
empiris yang juga ada dua macam, maka secara keseluruhan kita mengenal adanya empat validitas,
yaitu:
Menurut arti kata reliabel berarti dapat dipercaya. Berdasarkan arti kata tersebut, maka
instrumen yang reliabel adalah instrumen yang hasil pengukurannya dapat dipecaya. Salah satu
keriteria instrumen yang dapat dipercaya jika instrumen tersebut digunakan secara berulang-ulang,
hasil pengukurannya tetap. Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat
dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang
tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau
seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.
Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabilaa sudah memahami konsep
validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan diperolehnya data
yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas ini tuntutannya tidak jauh berbeda.
Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data
dari kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas terkait dengan
pemotretan berkali-kali. Instrumen yang baik adalah yang dapat dengan ajeg memberikan data
data yang sesuai dengan kenyataan. Yang sering dikatakan kurang tepat adalah adanya pendapat
bahwa “ajeg” atau “tetap” diartikan sebagai “sama”. Dalam evaluasi ini tidak demikian. Ajeg atau
tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan A mula-mula
berada lebih rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang, A juga berada
lebih rendah dari B. itulah yang dikatan ajeg atau tetap, yaitu sama dalam kedudukan siswa di
antara anggota kelompok yang lain. Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan
itulah menunjukkan tingginya reliabilitas instrumen.
Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan menyatakan bahwa
persyaratan bagi tes, yaitu vasiliditas dan reliabilitas ini penting. Dalam hal ini vasiliditas lebih
penting, dan reabilitas ini perlu, karena menyongkong terbentuknya vasiliditas. Sebuah tes
mungkin reliabel tetapi tidak valid. Sebaliknya, sebuah tes yang valid biasanya reliabel.
Beberapa hal yang mempengaruhi hasil tes banyak sekali. Namun secara garis besar dapat
dikelompokkan menjadi 3 hal, yaitu:
a. Hal yang berhubungan dengan tes itu sediri, yaitu panjang tes dan kualitas butir-butir
soalnya.
Tes yang terdiri dari banyaknya butir, tentu saja lebih vali dibantingkan dengan tes yang hanya
terdiri dari beberapa butir soal. Tinggi rendahnya validitas menunjukkan tinggi rendahnya
reliabilitas tes. Dengan demikian maka semakin panjang tes. Maka reliabilitas berhubung dengan
penambahan banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh Spearman
dan Brown sehingga terkenal dengan rumus Spearman-Brown. Rumusnya adalah:
nr
rnn =
1 + (n − 1)r
Dimana:
rnn = besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru
n = berapa kali butir-butir soal itu ditambah
r = besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah.
b. Hal yang berhubungan dengan tercoba (testee)
Suatu tes yang dicobakan dengan kepada kelompok yang terdiri dari banyak siswa akan
mencerminkan keragaman hasil yang menggambarkan besar-kecilnya reliabilitas tes. Tes yang
dicobakan bukan kelompok terpilih, akan menunjukkan reliabilitas yang lebih besar daripada yang
dicobakan pada kelompok tertentu yang diambil secara dipilih.
Faktor penyelenggaraan tes yang bersifat administratif, sangat menentukan hasil tes.
Contohnya yaitu:
1) Petunjuk yang diberikan sebelum tes mulai, akan memberikan ketenangan kepada para tes-
tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak terdapat
pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil tes.
2) Pengawas yang tertib akan mempengaruhi hasil diberikan oleh siswa terhadap tes. Bagi
siswa tertentu adanya pengawas yang terlalu ketat menyebabkan rasa jengkel dan tidak
dapat dengan leluasa mengerjakan tes.
3) Suasana lingkungan dan tempat tes ( duduk tidak teratur, suasana sekelilingnya ramai, dan
sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang mempengaruhi tes ini, secara tidak langsung akan mempengaruhi reliabilitas
soal tes.
Menurut Suharsini Arikunto (2013 : 82 ) sebuah tes dikatakan memiliki validitas isi apabila
mengkur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh
karena itu materi yang diajarkan tertera dalam kurikulum maka validitas isi sering disebut juga
validitas kurikuler.
Validitas isi dilakukan untuk memastikan apakah isi kuesioner sudah sesuai dan relevan dengan
tujuan study. Validitas isi menunjukkan isi yang mencerminkan rangkaian lengkap terkait dengan
atribut yang diteliti dan biasanya dilakukan oleh tujuh orang ahli atau lebih (DeVon et al
2007).Perkiraan validitas isi dari tes diperoleh dengan menyeluruh dan sistematis dalam
memeriksa item tes untuk menentukan sejauh mana mereka mencerminkan dan tidak
mencerminkan domain konten (Kowsalya, Venkat Lakshmi, dan Suresh, 2012)
Validitas isi terdiri dari dua bagian, yaitu validitas tampang dan validitas logis.
Validitas tampang/muka (face validity) merupakan validitas isi yang paling dasar dan sangat
minimum. Validitas isi menunjukkan bahwa aitem-aitem yang dimaksudkan untuk mengukur
sebuah konsep, memberikan kesan mampu mengungkap konsep yang hendak di ukur (Sekaran,
2006). Tidak berbeda dengan penjelasan sebelumnya, Groth-Marnat, (2009) menjelaskan bahwa
validitas isi (content validity) dengan validitas muka (face validity) memiliki perbedaan dan tidak
sinonim. Validitas isi menyangkut judgement yang dibuat oleh para ahli, sedangkan validitas
muka/tampang menyangkut judgement dari pengguna test. Sejalan dengan itu, Gregory (1992)
menjelaskan bahwa validitas tampang hanya sekedar tahap penerimaan orang pada umumnya
terhadap fungsi pengukuran tes, serta tidak berhubungan dengan statistic validitas seperti
koefisien atau indeks,
Analisis lanjutan setelah validitas tampang adalah melalui validitas logis yaitu prosedur
penilaian kelayakan isi item melalui penilaian yang bersifat kualitatif oleh panel ahli. Prosedur
ini selanjutnya menghasilkan validitas logis atau merupakan tinggi rendahnya kesepakatan di
antara para ahli yang menilai kelayakan suatu skala pengukuran (Azwar, 2012).
Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki validitas jika hasilnya sesuai
dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium.
Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik kolerasi product moment
yang dikemukakan oleh Pearson.
Reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk
mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik
juga menggunakan rumus kolerasi produk moment untuk mengetahui validitas, kesejajaran hasil
dalam reliabilitas tes.
Kriteria yang digunakan untuk mengetahui ketetapan ada yang beradda di luar tes (consistency
external) dan pada tes itu sendiri (consistency internal).
Tes paralel atau akuicalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat
kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa inggris disebut
alternate-forms method (parallel forms).
Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya tes Matematika Seri A
yang akan dicari reliabilitas dan Seri B diteskan kepada sekolompok siswa yang sama, hasilnya
dikorelasi. Koefisien korelasi dari kedua hasil tes inilah menunjukkan koefisien reliabilitas tes Seri
A. Jika koefisiennya tinggi maka tes tersebut sudah reliabel dan dapat digunakan sebagai alat
pengetes yang terandalkan.
Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan dua buah tes, dan
masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang yang
menyebutkan sebagai double test-double-trial method. Penggunaan metode ini baik karena siswa
dihadapkan kepada dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang dalam
evaluasi disebut dengan adanya practise-effect dan carry-over effect, artinya ada faktor yang
dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun
dua seri tes. Selain itu harus tersedia waktu yang harus untuk mencobakan dua kali tes.
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua
kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut denan
single-test-double-trial method. Kemudian hari dari kedua kali tes tersebut dihitung korelasinya.
Untuk tes yang banyak mengungkapkan pengetahuan (ingatan) dan pemahaman, cara ini
kurang, karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu
antara pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. Sebaliknya kalau
tenggang waktu terlalu sempit, siswa banyak mengingat materi. Sebaliknya kalau tenggang waktu
terlalu lama, maka faktor-faktor sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan ini
berpengaruh pula terhadap reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes pertama. Hal ini
tidak mengapa karena pengetes harus sadar akan adanya practice effect dan carry over effect. Yang
penting ditunjukkan oleh koefisien korelasi yang tinggi.
Contoh:
Siswa Tes Pertama Tes Kedua
Skor Ranking Skor Ranking
A 15 3 20 3
B 20 1 25 1
C 9 5 15 5
D 18 2 23 2
E 12 4 18 4
Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh semua siswa. Metode ini
juga disebut korelasi diri sendiri karena mengkorelasikan hasil dari tes yang sama.
Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes dua kali percobaan
diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes
hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-
single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah di kemukakan koefisien korelasi
langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat
demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui reliabilitas
separo tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown
sebagai berikut:
2 r11
22
rII =
1 + r11
22
Dimana:
r11 = korelasi antara skor-skor setiap belahan tes.
22
rII = koefisien reliabilitas yang sudah disesuaikan.
Contoh:
1 Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5
2 Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3
3 Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3
4 Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2
5 Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1
6 Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1
7 Susan 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2
a
8 Helen 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5
1. Pembelahan ganjil-genap
Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil-genap adalah sebagai berikut:
(X) (Y)
1 Hartati 5 3
2 Yoyok 3 2
3 Oktaf 0 4
4 Wendi 3 2
5 Diana 3 3
6 Paul 4 0
7 Susana 4 3
8 Helen 3 5
Kelanjutnya dari tabel ini adalah menhitung dengan rumus kolerasi product moment. Dengan
menggunakan kalkulator dikethui bahwa:
∑ 𝑋 = 25 ∑ 𝑋2 = 93 ∑ 𝑋𝑌 = 63
2
∑ 𝑋 = 22 ∑ 𝑌 = 76
Setelah dihitung dengan rumus kolerasi product moment dengan angka kasar diketahui bahwa
rxy = -0,3786. Harga tersebut baru menunjukkan reliabilitas separo tes. Oleh karena itu, rxy untuk
belahan ini disebut dengan istilah r1/2 ½ atau rgg singkatan dari rganjil-genap. Untuk mencari reliabilitas
seluruh tes digunakan rumus Spearman-Brown yang rumusnya telah dikemukakan di depan. Jika
koefisien reliabilitas separo tes ini dimasukkan ke dalam rumus hitungannya yaitu:
2 r11
22
RI I = 1+r11
22
2 𝑋−0,3786
= 1+(−0,3786)
−0,7572
= 1,3786
= -0,5493
2. Pembelahan awal-akhir
Dengan data yang tertera pada Tabel analisis item tes Matematika diketahui jumlah skor
belahan awal-akhir sebagai berikut.
(X) (Y)
1 Hartati 5 3
2 Yoyok 3 2
3 Oktaf 0 4
4 Wendi 3 2
5 Diana 3 3
6 Paul 4 0
7 Susana 4 3
8 Helen 3 5
Seperti hanya pada waktu menghitung dengan belahan ganjil-genap maka kelanjutannya adalah
menghitung dengan rumus korelasi product moment. Dengan menggunakan kalkulator diketahui:
∑ 𝑋 = 25 ∑ 𝑋2 = 91 ∑ 𝑋𝑌 = 63
∑ 𝑋 = 22 ∑ 𝑌2 = 78
Setelah dimasukkan ke dalam rumus korelasi product moment dengan kasar diperoleh r1/2 ½ = -
0,3831. Dengan rumus Spearman-Brown diperoleh rI I = -0,5538.
Selain menggunakan rumus korelasi product moment, dua orang ahli mengajukan rumus lain.
Seorang bernama Flanagan menemukan rumus yang perhitungannya menggunakan belah dua
ganjil-genap, dan seorang lagi bernama Rulon yang rumusnya diterapkan pada data belahan awal-
akhir.
3. Penggunaan rumus Flanagan
Rumus :
𝑆12 + 𝑆22
RI I = 2(1- )
𝑆𝑡2
Dimana:
RI I = reliabilitas
𝑆12 = varians belahan pertama (1) yang dalam hal ini varians skor item ganjil
𝑆22 = varians belahan kedua (2) yaitu varians skor item genap
𝑆𝑡2 = varians total yaitu varians skor total.
Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat. Dengan
demikian bagi peminat yang menghitung dengan kalkulator statistik varians ini diperoleh dengan
mengkuadratkan standar deviasi. Untuk mereka yang tidak menggunakan kalkulator statistik maka
varians dapat dicari dengn rumus sebagai berikut :
(∑ 𝑋)2
∑ 𝑋2 –
2 𝑁
S = 𝑁
Standar Deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB). Namun
huruf S (B besar) juga dapat dikatakan sudah menyebut standar deviasi. Bagi yang berminat
mencari S dulu untuk mencari varians, dapat menggunakan rumus S, yaitu:
√∑ 𝑋 2
S= 𝑁
S = standar deviasi
X = Simpangan X dari 𝑥̅ , yang dicari dari x-𝑥̅ ,
𝑆 2 = varians, selalu dituliskan dalam bentuk kuadrat, karena standar deviasi kuadrat
N = Banyak subjek pengikut tes
1,859+1,937
RI I = 2(1- )
2,359
= -2(1-1,609)
= - 1,218
Rumus :
𝑆2
RI I = 1- 𝑆𝑑2
𝑡
Dimana :
𝑆𝑑2 = varians beda
d = difference yaitu perbedaan antara skor belahan pertama (awal) dengan skor
belahan kedua (akhir)
2 Yoyok 2 3 -1
3 Oktaf 1 3 -2
4 Wendi 3 2 1
5 Diana 5 1 4
6 Paul 3 1 2
7 Susana 5 2 3
8 Helen 3 5 -2
∑𝑑 = 3
∑ 𝑑 2 = 43
𝟒𝟏,𝟖𝟕𝟓
= = 5, 234
𝟖
Dari perhitungan dengan rumus Flahan maupun Rulon ternyata hasil sama, keduanya lebih
besar dari 1,00. Secara teoretik koefisien ini salah tetapi karena pembulatan-pembulatan dalam
perhitungan.
Salah satu syarat untuk danat menggunakan metode belah dua adalah bahwa banyaknya item
harus genap agar dapat dibelah. Syarat yang kedua item-item yang membentuk soal tes harus
homogen atau paling tidak setelah dibelah terdapat keseimbangan antara belahan pertama dengan
belahan kedua.
Untuk mengatasi kesulitan memenuhi persyaratan ini maka reliabilitas dapat divari dengan
rumus yang diketemukan oleh Kuder dan Richardson. Kedua orang ahli ini menemukan banyak
rumus yang diberi nomor. Rumus yang digunakan untuk mencari reliabilitas dan banyak
digunakan orang ada dua rumus yaitu rumus K-R.20 dan rumus K-R.21.
Rumus :
Dimana :
rI I = reliabilitas tes secara keseluruhan
p = proporsi subjek yang menjawab item dengan benar
q = proporsi subjek yang menjawab item dengan salah (q=1-p)
∑ 𝑝𝑞 = jumlah hasil perkalian antara p dan q
n = banyaknya item
S = standar deviasi dari tes (standar deviasi adalah akar varians).
Dalam buku-buku lain n (n kecil) ini sering diganti dengan huruf k (k kecil), yang juga
melambangkan banyaknya item. Demikian juga haru S sebagai lambang standar deviasi, dituliskan
SB sebagai singkatan dari kata Simpangan Baku. Maka rumus K-R.20 menjadi:
Penggunaan huruf k ini juga berlaku bagi rumus-rumus lain yang melibatkan banyaknya item
tes, misalnya K-R.21 dan rumus Al-pha. Untuk memberikan contoh perhitungan mencari
reliabilitas yang menggunakan rumus K-R.20 ini akan dibuatkan tabel analisis item yang lain.
TABEL PERHITUNGAN MENCARI REALIBILITAS
TES DENGAN RUMUS K-R.20
1 Wardoyo 1 0 1 1 1 1 0 5
2 Benny 0 1 1 0 1 1 1 5
3 Hanafi 0 0 0 0 1 0 1 2
4 Rahmad 0 1 1 1 1 1 1 6
5 Tanti 1 0 0 0 1 0 0 2
6 Nadia 0 1 1 1 1 0 0 4
7 Tini 0 0 0 1 1 1 0 3
8 Budi 0 1 0 1 1 0 0 3
9 Daron 0 1 0 1 1 0 0 3
10 Yakob 0 0 0 1 1 0 0 2
Np 2 5 4 7 10 4 3 35
(𝑝𝑞)
𝑛 𝑆 2 − ∑ 𝑝𝑞
RI I = (𝑛−1)( )
𝑆2
7 2
1,36 – 1,31
=6 x 1,362
S = 1,56
1,85−1,31
= 1,17 x 1,85
0,54
= 1,17 x 1,85
= 1,17 x 0,29 = 0,3415, dibulatkan 0,342
Jika dibandingkan reliabilitas yang dihitung dengan K-R.20 dan K-R.21 lebih besar yang
ertama. Memang menggunakan rumus K-R.20 cenderung memberikan hasil yang lebih tinggi,
tetapi pekerjaannya lebih rumit.
𝑉𝑠 𝑉𝑟−𝑉𝑠
rI I = 1- atau rI I =
𝑉𝑟 𝑉𝑟
dimana :
rI I = reliabilitas seluruh soal
Vr = Varians responden
Vs = Varians sisa
Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah sebagai berikut:
Langkah 1. Mencari jumlah kuadrat responden dengan rumus :
2
∑ 𝑋𝑡 2 (∑ 𝑋𝑡)
Jk(r) = -
𝑘 𝑘𝑥𝑁
Dimana :
Jk(r) = jumlah kuadrat responden
𝑥𝑡) = skor total tiap responden
k = banyaknya item
N = banyaknya responden atau subjek
Dimana :
Jk(i) = jumlah kuadrat item
∑ 𝐵 2 = jumlah kuadrat jawab benar seluruhnya
(∑ 𝑋𝑡 )2 = kuadrat dari jumalh skor total
Dimana :
Jk(t) = jumlah kuadrat total
(∑ 𝐵) = jumlah jawab benar seluruh item
(∑ 𝑆) = jumlah jawab salah seluruh item
Dalam mencari varians ini diperlukan d.b (derajat kebebasan) dari masing-masing sumber
varians kemudian d.b ini digunakan sebagai penyebut terhadap setiap jumlah kuadrat untuk
memperoleh variansi.
d.b = banyaknya N setiap sumber variansi dikurangi 1
jumlah kuadrat
jadi Variansi =
d.b
Contoh perhitungan:
Dengan menggunakan tabel analisis item yang digunakan untuk mencari reliabilitas tes dengan
rumus K-R.20 dapat dicarikan reliabilitas dengan rumus Hoyt.
1 Wardoyo 1 0 1 1 1 1 0 5 25
2 Benny 0 1 1 0 1 1 1 5 25
3 Hanafi 0 0 0 0 1 0 1 2 4
4 Rahmad 0 1 1 1 1 1 1 6 36
5 Tanti 1 0 0 0 1 0 0 2 4
6 Nadia 0 1 1 1 1 0 0 4 16
7 Tini 0 0 0 1 1 1 0 3 9
8 Budi 0 1 0 1 1 0 0 3 9
9 Daron 0 1 0 1 1 0 0 3 9
10 Yakob 0 0 0 1 1 0 0 2 4
Jumlah 219
kuadrat
jumlah jawab
benar
Jumlah jawab 8 5 6 3 0 6 7 35
salah
Berdasarkan tabel ini dapat dicari reliabilitas soal dengan rumus Hoyt melalui langkah-langkah
sebagai berikut:
2
∑ 𝑋𝑡 2 (∑ 𝑋𝑡)
Jk(r) = -
𝑘 𝑘𝑥𝑁
141 352
= −
7 7 𝑥 10
= 20,143 – 17,5
= 2,643
Langkah 5. Mencari varians responden dan varians sisa dengan tabel F
Untuk mencari d.b sisa, harus dicari d.b total terlebih dahulu baru dikurangi d.b responden dan d.b
item.
d.b total = k xN -1 +7 x 10 – 1 = 70 -1 = 69
d.b responden = N – 1 = 10 – 1 = 9
d.b item =k–1=7–1=6
d.b sisa = d.b total – d.b responden – d.b item
= 69-9-6 = 54
Menilai soal bentuk uraian tidak dapat dilakukan dengan dinilai hanya benar dan saah. Sesuatu
butir soal uraian menghendaki gradualisasi penilaian. Bisa saja butir soal nomor 1 penilaian
terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya 5, dan butir soal nomor 3
sampai 10, dan sebagainya.
Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan analisis butir soal
seperti halnya soal bentuk objektif. Skor untuk masing- masing butir soal dicantumkan pada kolom
item menurut apa adanya. Rumusan yang digunakan adalah rumus Alpha sebagai berikut:
Dimana :
rI I = reliabilitas yang dicari
2
∑ 𝜎1 = jumlah varians skor tiap-tiap item
𝜎1 2 = varians total
BAB III
PENUTUP
1.1 KESIMPULAN
Validitas berasal dari kata ’’validity’’ yang mempunyai arti sejauh mana ketepatan dan kecermatan
suatu alat ukur dalam melakukan fungsi ukurnya. Suatu tes atau instrumen pengukur dapat
dikatakan mempunyai validitas yang tinggi apabila alat tersebut menjalankan fungsi ukurnya, atau
memberikan hasil ukur yang sesuai dengan maksud dilakukan pengukuran tersebut. Tes yang
menghasilkan data yang tidak relevan dengan tujuan pengukuran dikatakan sebagai tes yang
memiliki validitas rendah (Azwar, 1997).
Validitas adalah ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi, jadi
jika data yang dihasilkan dari sebuah instrument valid, maka dapat dikatakan bahwa istrumen
tersebut valid, karena dapat memberikan gambaran tetang data secara benar sesuai dengan
kenyataan atau keadaan sesungguhnya jadi jika data yang dihasilkan oleh instrument benar atau
valid, sesuai kenyataan, maka instrument yang digunakan tersebut juga valid.
Menurut arti kata reliabel berarti dapat dipercaya. Berdasarkan arti kata tersebut, maka instrumen
yang reliabel adalah instrumen yang hasil pengukurannya dapat dipecaya. Reliabilitas adalah
ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini
pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus
kolerasi produk moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.
Kriteria yang digunakan untuk mengetahui ketetapan ada yang beradda di luar tes (consistency
external) dan pada tes itu sendiri (consistency internal).
1.2 SARAN
Dalam penilaian validitas dan reabilitas hal utama yang harus diperhatikan yaitu
kejujuran dalam menilai pembelajaran. Karena dalam penilaian validitas dan reabilitas
akan mementukan kualitas sekolah dan memperlihatkan keberhasilan sekolah dalam
memenuhi standar siswa.
DAFTAR PUSTAKA
Arikunto, Suharsimi. 2005. Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi
Aksara.
Drs. Asrul, M.Si, dkk. 2015. Evaluasi Pembelajaran. Medan: Perdana Mulya Sarana.
https://www.statistikian.com/2012/08/uji-validitas.html/amp