Anda di halaman 1dari 29

VALIDITAS DAN RELIABILITAS

INSTRUMEN TES DAN NON TES

JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI SEMARANG
2019
PENGANTAR

Tes Hasil Belajar (THB) adalah alat ukur yang digunakan untuk melakukan
pengukuran guna pengumpulan data hasi belajar. Sebagai sebuah alat ukur maka THB
harus memenuhi syarat sebagai alat ukur yang baik. Alat ukur yang baik harus memenuhi
dua syarat yaitu validitas dan reliabilitas.
Suatu alat ukur yang tidak reliabel atau tidak valid akan memberikan informasi
yang keliru mengenai keadaan subjek atau individu yang dikenai tes itu. Apabila informasi
yang keliru itu dengan sadar atau tidak dengan sadar digunakan sebagai dasar
pertimbangan dalam pengambilan suatu keputusan, maka keputusan itu tentu bukan
merupakan suatu keputusan yang tepat.
Oleh karena itu, sebelum digunakan untuk mengumpulkan data, THB harus
terlebih dahulu diuji validitas dan reliabilitasnya. Dalam Modul ini akan dibahas
mengenai:
a. Validitas, validitas isi, dan reliabilitas.
b. Cara pengujian validitas isi menggunakan perhitungan korelasi dengan rumus
product moment.
c. Batasan reliabilitas dan koefisien reliabilitas.
d. Metode estimasi reliabilitas.
e. Reliabilitas tes berdasarkan bentuk soal.
KEGIATAN BELAJAR :

A. Validitas
Validitas berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu
yang diinginkan untuk diukur. Menurut Anastasi dan Urbina (1997:113)(dalam DR.
Purwanto, 2009), validitas berhubungan dengan apakah tes mengukur apa yang mesti
diukurnya dan seberapa baik dia melakukannya. Validitas merupakan derajat sejauh
mana tes mengukur apa yang ingin diukur (Borg dan Gall, 1983:275, Poppham,
1981:98)(dalam DR. Purwanto, 2009).
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan
dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Azwar 1986).
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang
tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil
ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes
yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan
tujuan pengukuran. Terkandung di sini pengertian bahwa ketepatan pada validitas
suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan
pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk
mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel
A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang
dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel
A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk
mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B
(Azwar 1986).
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu
alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi
juga harus memberikan gambaran yang cermat mengenai data tersebut. Cermat berarti
bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang
sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam
bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas
maka kita harus menggunakan alat penimbang berat emas agar hasil
penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan
memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat
cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan
terlihat pada alat ukur berat badan.
Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam
perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup
cermat dan karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi,
jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai
waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter
dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan
satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch.
Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu
akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan
menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat
kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai
angka yang sebenarnya atau angka yang mendekati keadaan sebenarnya (Azwar
1986).
Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh
karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran.
Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang
spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam "alat ukur ini
valid" adalah kurang lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan
yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta valid bagi
kelompok subjek yang mana?
THB yang valid adalah THB yang mengukur dengan tepat keadaan yang ingin
diukur. Sebaliknya, THB dikatakan tidak valid bila digunakan untuk mengukur suatu
keadaan yang tidak tepat diukur dengan THB tersebut. Misalnya: tes tertulis bukan
alat ukur yang valid untuk mengukur gaya keterampilan berenang, tes untuk
mengukur hasil belajar matematika tidak tepat untuk mengukur minat terhadap
matematika dan sebagainya.
Sebelum THB digunakan untuk mengumpulkan data, terlebih dahulu harus
diperiksa bahwa THB telah valid. Hal itu diperlukan untuk menjamin adanya
kesesuaian antara THB dengan hasil belajar yang ingin diukur. Pengumpulan data
menggunakan THB yang tidak valid menghasilkan data hasil belajar yang tidak valid.
Validitas yang berkaitan untuk siapa perlu diperhatikan, karena menyangkut
dengan membangun gambaran atau deskripsi terhadap suatu grup normal. Derajat
validitas hanya berlaku untuk suatu kelompok tertentu yang memang telah
direncanakan pemakaiannya oleh si peneliti. Contoh dalam tes pencapaian prestasi
anak yang direncanakan oleh orang dewasa, akan berbeda bentuk maupun
substansinya dengan tes prestasi untuk anak usia remaja.
Pengujian validitas dapat dilakukan menggunakan beberapa metode. Menurut
Nunally (1978:88)(dalam DR. Purwanto, 2009), pengukuran psikologis mempunyai
tiga fungsi utama yaitu membuat hubungan statistik dengan variabel tertentu,
menggambarkan wilayah isi tertentu dan mengukur atribut psikologis. Untuk itu
komite bersama antara The American Psycological Association, The American
Education Research Association, dan The National Council on Measurement used in
Education (Kerlinger, 1996:730-731)(dalam DR. Purwanto, 2009) mengelompokkan
metode pengujian validitas menjadi tiga macam, yaitu validitas isi, validitas kriteria,
dan validitas konstruk. Dalam pengujian validitas melibatkan perhitungan statistik
korelasi.
1. Validitas Isi (content validity)
Validitas Isi (content validity) adalah pengujian validitas dilakukan atas isinya
untuk memastikan apakah butir THB mengukur secara tepat keadaan yang ingin
diukur. Validitasn isi ini berhubungan dengan representativitas sampel butir dari
semesta populasi butir. Secara teoritik butir yang dapat dituliskan untuk mengukur
hasil belajar jumlahnya tidak terhingga.Butir-butir THB yang yang akan digunakan
untuk mengukur merupakan sebagian saja dari populasi butir yang tidak
terhingga.Pengujian validitas butir dilakukan untuk menjamin bahwa meski
penumpulan data hanya dilakukan menggunakan sebagian butir namun butir-butir
yang dipilih mewakili sifat populasi butirnya. Pengujian validitas isi dapat dilakukan
menggunakan satu dari tiga metode yaitu menelaah butir instrument,meminta
pertimbangan ahli dan analisis korelasi butir-total.
Untuk keperluan pengembangan butir-butir THB yang representatif maka
pengembangan buti-butir THB harus didasarkan pada perencanaan kisi-kisi.Pengujian
validitas isi yang dilakukan dengan menelaah butir dilakukan dengan mencermati
kesesuaian isi butir yang ditulis dengan perencanaan yang dituangkan dalam kisi-
kisi.Kriteria yang menjadi dasar pengujian valilditas isi adalah kisi-kisi yang
direncanakan. Review dilakukan untuk menjaga agar materi butir THB yang
dikembangkan tidak menyimpang dari kisi-kisi. Butir-butir THB dapat dinyatakan
valid (logically valid) apabila setelah mencermati isi butir-butir yang ditulis telah
menunjukkan kesesuaian dengan kisi-kisi.
Pengujian validitas isi dapat dilakukan dengan meminta pertimbangan ahli.
Orang yang memiliki kompetensi dalamdalam suatu bidang dapat dimintakan
pendapatnya untuk menilai ketepatan isi butir THB. Pertimbangan juga dapat
dimintakan kepada professional. Orang yang menekuni suatu bidang tertentu yang
sesuai dengan wilayah kajian THB, misalnya guru, mekanik, dokter, advokat,
koreografer dan sebagainya dapat dimintakan pendapatnya untuk menilai ketepatan isi
THB. Penilaian validitas isi juga dapat dimintakan pertimbangannya kepada beberap
orang yang memiliki kompetensi untuk memberikan penilaian. Pertimbangan yang
dimintakan kepada ahli, professional, atau rater menyangkut isi dari butir THB dan
kisi-kisinya. Pertimbangan menyangkut materi yang akan diukur menggunakan butir-
butir THB. Butir-butir yang mengukur materi sebagaimana dipahami dan disepakati
oleh ahli, professional atau penilai dapat dinyatakan sebagai butir-butir THB yang
valid. Pemberian pendapat dapat dilakukan dengan memberikan respon atas
kesesuaian butir yang ditulis dengan kisi-kisinya dalam hal materi. Respon
selanjutnya diskor deengan cara tertentu. Misalnya, dua orang ahli di minta menilai
kesesuaian materi butir degnan kisi-kisinya pada sepuluh butir THB. Penilaian
dilakukan dengan menentukan pilihan pada pilihan yang tersedia yaitu “ tidak sesuai”
“ragu” “sesuai”. Skoring dilakukan dengan memberikan skor -1 pada respon “tidak
sesuai”, 0 pada respon “ragu”, +1 pada respon “sesuai”. Hasil scoring respon dua
orang ahli atas sepuluh butir instrument diringkas sebagai berikut:
Butir Rater 1 Rater 2
1 1 1
2 1 0
3 1 1
4 1 1
5 1 1
6 0 0
7 1 1
8 1 1
9 1 1
10 1 1
Perhitungan korelasi dilakukan dengan rumus produk momen sebagai berikut

Keterangan
N= jumlah responden
X= skor yang diberikan oleh rater 1
Y = skor yang diberikan oleh rater 2
Perhitungan dilakukan berdasarkan tabel persiapan sebagai berikut:
No X Y X2 Y2 XY
1 1 1 1 1 1
2 1 0 1 0 0
3 1 1 1 1 1
4 1 1 1 1 1
5 1 1 1 1 1
6 0 0 0 0 0
7 1 1 1 1 1
8 1 1 1 1 1
9 1 1 1 1 1
10 1 1 1 1 1
9 8 9 8 8

Hasil korelasi skor kedua rater menunjukkan indeks korelasi itu sebesar 0,667.
Hasil konfirmasi table pada n = 10, a = 5% menunjukkan harga table sebesar 0,632.
Oleh Karen R hitung lebih dari R table maka kedua skor berkorelasi signifikan dan
kedua rater manila bahwa kedua THB mengukur hal yang sama sehingga dapat
dikatakan bahwa THB mangukur keadaan yang ingin diukurnya (valid).
Pengujian validitas isi dapat dilakukan dengan melihat korelasi butir dengan
total. Korelasi butir dengan total menunjukkan sumbangan butir terhadap totalnya.
Sebuah butir dinyatakan valid apabila dia berkorelasi tinggi dengan totalnya. Butir
yang berkorelasi tinggi dengan totalnya menunjukkan bahwa butir tersebut
merupakan isi dari instrument karena mempunyai sumbangan besar membentuk skor
total THB. kriteria untuk menilai apakah butir memberikan sumbangan signifikan
bagi total adalah apabila korelasi hitung butir dengan total R hitugn lebih dari R
tabel.
Contoh: dalam sebuah uji coba THB mata pelajaran Matematika atas 10 butir
THB yang diikuti oleh 10 peserta memberikan hasil sebagai berikut:
Responden Butir Total
1 2 3 4 5 6 7 8 9 10
1 4 3 1 5 2 2 2 3 5 2 29
2 5 4 2 4 3 1 1 4 5 3 32
3 3 2 1 4 2 2 1 3 4 2 24
4 4 2 1 3 2 3 2 3 4 2 26
5 5 1 2 4 2 2 2 4 5 2 29
6 3 2 3 5 1 1 1 3 5 3 27
7 4 3 2 5 2 2 1 3 4 3 29
8 5 2 1 4 3 2 1 3 4 2 27
9 2 1 1 3 2 1 2 3 5 1 21
10 3 2 2 4 2 1 1 4 5 3 27
rit 0,78 0,70 0,43 0,54 0,31 0,01 - 0,50 0,17 0.68
69 91 98 08 6 63 0,24 78 01 89
1
kriteria 0,63 0,63 0,63 0,63 0,63 0,63 0,63 0,63 0,63 0,63
2 2 2 2 2 2 2 2 2 2
keputusan valid valid tidak tidak tidak tidak tidak tidak tidak valid

Contoh perhitungan validitas butir 1


Tabel perhitungan untuk menghitung korelasi product moment adalah sebagai berikut:
No X Y X2 Y2 XY
1 4 29 16 841 116
2 5 32 25 1024 160
3 3 24 9 576 72
4 4 26 16 676 104
5 5 29 25 841 116
6 3 27 9 729 81
7 4 29 16 841 116
8 5 27 25 729 135
9 2 21 4 441 42
10 3 27 9 729 81
38 271 154 7427 1052

Keterangan
N = jumlah siswa
X = skor siswa pada butir 1
Y = skor total siswa
Dengan menghitung menggunakan korelasi menggunakan rumus product
moment diperoleh koefisien korelasi sebesar 0,787. oleh karena r hitung =0.787 r
tabel = 0,632 maka disimpulkan bahwa butir 1 berkorelasi signifikan dengan skor
total.Dengan kata lain butir 1 mengukur hal yang sama dengan yang diukur oleh skor
total.
2. Validitas Kriteria (criterion related validity)
Validitas Kriteria (criterion related validity) adalah penujian validitas yang
dilakukan dengan membandingkan THB dengan criteria tertentu di luar THB.

3. Validitas Konstruk (construct validity)


Validitas Konstruk (construct validity) adalah penguijan validitas yang
dilakukan dengan melihat kesesuaian konstruksi butir yang ditulis dengan kisi-
kisinya.
B. Reliabilitas
1. Pengertian
Realibitas merupakan penerjemahan dari kata reliability yang mempunyai asal
kata rely yang artinya percaya dan reliabel yang artinya dapat dipercaya.
Keterpercayaan berhubungan dengan ketepatan dan konsistensi.
Test Hasil Belajar dikatakan dapat dipercaya apabila memberikan hasil
pengukuran hasil belajar yang relatif tetap secara konsisten.
Beberapa ahli memberikan batasan reliabilitas.
 Menurut Thorndike dan Hagen (1977), reliabilitas berhubungan dengan
akurasi instrument dalam mengukur apa yang diukur,kecermatan hasil ukur
dan seberapa akurat seandainya silakukan pengukuran ulang.
 Hopkins dan Antes (1979:5) menyatakan reliabilitas sebagai konsistensi
pengamatan yang diperoleh dari pencatatan berulang baik pada satu subjek
maupun sejumlah subjek.
 Kerlinger memberikan batasan tentang reliabilitas yaitu :
a. Reliabilitas dicapai apabila kita mengukur himpunan objek yang sama
berulang kali dengan instrumen yang sama atau serupa akan memberikan
hasil yang sama atau serupa.
b. Reliabilitas dicapai apabila ukuran yang diperoleh dari suatu instrumen
pengukur adalah ukuran „‟ yang sebenarnya‟‟ untuk sifat yang diukur.
c. Keandalan dicapai dengan meminimalkan galat pengukuran yang terdapat
pada suatu instrumen pengukur.
Jadi, dari berbagai definisi reliabilitas dapat disimpulkan bahwa reliabilitas
berhubungan dengan kemampuan alat ukur untuk melakukan pengukuran secara
cermat. Reliabilitas merupakan akurasi dan presisi yang dihasilkan oleh alat ukur
dalam melakukan pengukuran.

2. Koefisien Reliabilitas
Secara empirik, tinggi rendahnya reliabilitas ditunjukkan oleh suatu angka yang
disebut koefisien reliabilitas. Pada awalnya tinggi rendahnya reliabilitas tes
dicerminkan oleh koefisien korelasi antara skor pada dua tes yang pararel, yang
dikenakan pada sekelompok individu yang sama.
Koefisien korelasi antara dua variabel dilambangkan oleh huruf r. Apabila skor
pada tes pertama diberi lambang X dan skor pada tes yang kedua diberi lambang X‟,
maka koefisien korelasi antara kedua tes tersebut adalah rxx‟. Simbol ini yang
digunakan sebagai simbol koefisien reliabilitas.
Secara teoritik besarnya koefisien reliabilitas berkisar mulai dari 0,0 sampai
dengan 1,0 akan tetapi kenyataanya koefisien sebesar 1,0 dan koefisien sekecil 0,0
tidak pernah dijimpai. Di samping itu, walaupun koefisien korelasi dapat saja bertanda
negatif, koefisien reliabilitas selalu mengacu pada angka positif karena angka yang
negative tidak ada artinya bagi interpretasi reliabilitas hasil ukur.

3. Metode Estimasi Reliabilitas


a. Pendekatan Tes Ulang
Pendekatan tes ulang dilakukan dengan menyajikan tes dua kali pada satu
kelompok subjek dengan tenggang waktu diantara kedua penyajian tersebut.
Asumsi yang menjadi dasar dalam cara ini adalah bahwa suatu tes yang relibel
tentu akan menghasilkan skor-tampak yang relatif sama apabila dikenakan dua
kali pada waktu berbeda. Semakin besar variasi perbedaan skor subjek antara
kedua pengenaan itu berarti semakin sulit untuk mempercayai bahwa tes itu
memberikan hasil ukur yang konsisten.
b. Pendekatan Bentuk Paralel
Dalam pendekatan bentuk parallel, tes yang akan diestimasi reliabilitasnya harus
ada paralelnya , yaitu tes lain yang sama tujuan ukurnya dan setara isi itemnya
baik secara kualitas maupun kuantitasnya. Dengan bahasa sederhana dapat
dikatakan bahwa kita harus punya dua tes yang kembar.
c. Pendekatan Konsistensi Internal
Pendekatan konsistensi internal dilakukan dengan menggunakan satu bentuk tes
yang dikenakan hanya sekali saja pada sekelompok subjek (single-trial
administration). Dengan menyajikan satu tes hanya satu kali, maka problem yang
mungkin timbul pada dua pendekatan reliabilitas terdahulu dapat dihindari.

4. Beberapa metode pengujian realiabilitas dikelompokkan menjadi :


a. Jumlah butir genap
 Metode belah dua
 Metode Flanagan
 Metode Rulon
b. Jumlah butir ganjil
 Metode Kuder dan Richardson
 Metode Hoyt
 Metode Alpha Cronbach
a. Jumlah butir genap
Metode pengujian reliabitas ini dilakukan atas THB (Test Hasil Belajar) yang
mempunyai jumlah butir genap sehingga butir dapat dibelah menjadi dua bagian yang
sama besar.
 Metode Belah Dua
Penggunaan rumus belah dua sebagai berikut.

Di mana:
= korelasi antara skor-skor setiap belahan tes

r11 = koefisien reliabilitas yang sudah disesuaikan.


 Penggunaan rumus Flanagan
S1  S 2
2 2

Rumus 2
)
St
Di mana :

S1  var ians belahan pertama (1) yang dalam hal ini varians skor item ganjil
2

S 2  var ians belahan kedua (2) yaitu varians skor item genap
2

S t  var ians total yaitu varians skor total


2

 Penggunaan rumus Rulon

Rumus

Di mana:
= Varians beda (varians difference)
d = difference yaitu perbedaan antara skor belahan pertama (awal) dengan skor
belahan kedua (akhir).
= Varians total
Untuk memperjelas keterangan maka table belahan awal-akhir dikutip disini lagi.
No. Nama Awal akhir d

1. Hartati 3 5 -2 4
2. Yoyok 2 3 -1 1
3. Oktaf 1 3 -2 4
4. Wendi 3 2 1 1
5. Diana 5 1 4 16
6. Paul 3 1 2 4
7. Susana 5 2 3 9
8. Helen 3 5 2 4

Dengan kalkulator atau hitungan biasa diketahui bahwa :

Varians total = 2,75

= = 5,234

Dimasukkan ke dalam rumus Rulon

Dari perhitungan dengan rumus Flanagan maupun Rulon ternyata hasilnya sama,
keduanya lebih besar dari 1,00. Secara teoretik koefisien ini salah tetapi karena
pembulatan-pembulatan dalam perhitungan, seperti dijelaskan di depan, hasil seperti
ini dapat saja terjadi.
b. Jumlah butir ganjil
Pengujian reliabilitas sebagai koefisien konsistensi internal di mana butir
instrumen berjumlah ganjil dapat dilakukan menggunakan metode Kuder –
Richardson, Hoyt atau Alpha Cronbach.
No. Nama Nomor item Skor Total
1 2 3 4 5 6 7

 Metode Kuder – Richardson


Metode pengujian reliabilitas Kuder-Richardson ditemukan oleh dua orang
yang diabadikan sebagai nama rumusnya yaitu Kuder dan Richardson. Di antara
sejumlah rumus yang diusulkannya, terdapat dua buah rumus yang banyak
digunakan yaitu KR-20 dan KR-21.
Perhitungan koefisien reliabilitas menggunakan metode KR-20 dilakukan
dengan rumus berikut :

Di mana :
= reliabilitas tes secara keseluruhan
= proporsi subjek yang menjawab item dengan benar
proporsi subjek yang menjawab item dengan salah (q= 1-p)
jumlah hasil perkalian antara p dan q
n = banyaknya item
S = standar deviasi dari tes ( standar deviasi adalah akar varians )
Contoh :
TABEL PERHITUNGAN MENCARI RELIABILITAS TES DENGAN RUMUS K-R 20
1. Wardoyo 1 0 1 1 1 1 0 5
2. Benny 0 1 1 0 1 1 1 5
3. Hanafi 0 0 0 0 1 0 1 2
4. Rahmad 0 1 1 1 1 1 1 6
5. Tanti 1 0 0 0 1 0 0 2
6. Nadia 0 1 1 1 1 0 0 4
7. Tini 0 0 0 1 1 1 0 3
8. Budi 0 1 0 1 1 0 0 3
9. Daron 0 1 0 1 1 0 0 3
10. Yakob 0 0 0 1 1 0 0 2

Np 2 5 4 7 10 4 3 35
p 0,2 0,5 0,4 0,7 1 0,4 0,3
q 0,8 0,5 0,6 0,3 0 0,6 0,7
pq 0,16 0,25 0,24 0,21 0 0,24 0,21 1,31
(

Dimasukkan ke dalam rumus K-R 20

S = 1,56 ( dicari dengan kalkulator )


S dapat dicari dengan menarik akar varians

= 1,71 S = 1,36 ( dicari dengan kalkulator )

= 1,71 x 029 = 0,3415 , dibulatkan 0,342

 Metode Hoyt
Rumusnya adalah :

atau
Keterangan :
= Reliabilitas seluruh soal
= Varians Responden
= Varians sisa

5. Reliabilitas Tes Berdasarkan Bentuk Soal


Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui tingkat
ketepatan (precision) dan keajegan (consistency) skor tes. Indeks reliabilitas berkisar
antara 0 – 1. Semakin tinggi koefisien reliabilitas suatu tes (mendekati 1), makin
tinggi pula keajegan/ ketepatannya.
a. Reliabilitas Tes (bentuk pilihan ganda)
Untuk mengetahui koefisien reliabilitas tes soal bentuk pilihan ganda digunakan
rumus Kuder Richardson 20 (KR-20) seperti berikut ini.

KR-20 =

Keterangan:
k : jumlah butir soal
2
(SD) : varians
P : Proporsi subjek yang menjawab item dengan benar
q :( 1-p ):Proporsi subjek menjawab item dengan salah

Contoh perhitungan KR-20

Hitunglah koefisien reliabilitas tes berbentuk pilihan ganda yang terdiri dari 4 butir
soal dan diikuti oleh 6 responden dengan respons sebagai berikut
Soal X
Siswa X-
1 2 3 4 (
A 1 0 0 0 1 2 -1 1
B 1 1 0 0 2 2 0 0
C 0 0 1 1 2 2 0 0
D 0 0 0 0 0 2 -2 4
E 1 1 0 1 3 2 -1 1
F 1 1 1 1 4 2 -2 4
P 0,67 0,50 0,33 0,50 12 10
1–p 0,33 0,50 0,67 0,50
p(1 – p) 0,22 0,25 0,22 0,25

p(1 – p) = 0,22 + 0,25 + 0,22 + 0,25 = 0,944


jumlah siswa = 6 orang
jumlah skor = 12

varian =

standar deviasi = = 1,29

r=

r=

= 0,58
Artinya tingkat keajegan tes tersebut sedang

b. Reliabilitas Tes Bentuk Uraian


Untuk menghitung reliabilitas uraian biasanya digunakan rumus Alpha Cronbach,
sebagai berikut

keterangan:
k : banyak soal
sj2 : varians butir ke j
2
sx : varians skor total
kriteria reliabilitas
Koefisien Reliabilitas Kategori
r < 0,2 sangat rendah
0,2 r < 0,4 Rendah

0,4 r < 0,6 Sedang

0,6 r < 0,8 Tinggi

0,8 r 1,0 sangat tinggi

Contoh:
Hitunglah koefisien reliabilitas dari 10 responden dengan item sebanyak 6. Respon dari
responden ditunjukkan dalam tabel berikut.
No Nama Nomor item Skor Kuadrat
1 2 3 4 5 6 Total skor total
1. A 10 6 8 8 10 10 52 2704
2. B 6 4 4 6 6 5 31 961
3. C 8 2 6 8 7 8 39 1521
4. D 7 3 7 7 6 6 36 1296
5. E 0 5 3 2 4 4 18 324
6. F 2 4 2 8 6 8 30 900
7. G 4 3 6 6 6 6 31 961
8. H 5 5 5 7 7 7 36 1296
9. I 5 5 4 6 8 5 33 1089
10. J 3 6 3 4 6 6 28 784
Jumlah 50 43 48 62 66 65 334 11836
Jumlah Kuadrat 328 201 264 418 458 451 2120

2120 = Jumlah kuadrat tiap skor


11836 = jumlah kuadrat skor total
Rumus Varians
( X ) 2
X 2

N
 2

N
50 2
328 
 (1) 2  10  328  250  7,8
10 10
43 2
210 
 ( 2) 2  10  210  184,9  1,61
10 10

48 2
264 
 ( 3) 2  10  264  230,4  3,36
10 10
62 2
418 
 ( 4) 2  10  418  384,4  3,36
10 10
66 2
458 
 (5) 2  10  458  435,6  2,24
10 10
65 2
451 
 (6) 2  10  451  422,5  2,85
10 10
Jumlah Varians semua item ( i ) 
2

7,8 + 1,61+3,36+3,36+2,24+2,85=21,22
334 2
11836 
Varians total = 10  11836  11155 ,6
10 10
680,4
=  68,04
10
Dimasukkanke dalam rumus Alpha
6 21,22 6
r11   (1  )  x(1  0,312 )
6 1 68,04 5
6
  0,688  0,8256 dibulatkan0,826
5
c. Reliabilitas Tes Bentuk Campuran
Pada berbagai bentuk tes yang mengukur factor kemampuan, ada kalanya skor
subjek pada tes tidak berasal hanya dari satu sumber saja melainkan ditentukan oleh
gabungan dari beberapa skor. Beberapa skor tersebut dapat berupa skor dari bagian tes
itu sendiri, yaitu komponen, dapat pula berasal dari tes yang berbeda. Dalam hal
seperti itu komponen atau bagian tes akan memberikan bobot tersendiri yang mungkin
tidak sama besarnya, dalam menentukan skor subjek.
Bobot relative suatu komponen ditentukan besarnya oleh banyaknya sumbangan
komponen tersebut dalam menentukan skor akhir.Misalnya suatu komponen yang
berisi lebih banyak aitem akan lebih besar bobotnya.
Skor akhir pada tes seperti itu merupakan skor komposit (gabungan) yang
merupakan penjumlahan dari skor setiap bagian atau komponen dengan
memperhitungkan besarnya bobot masing-masing
Reliabilitas skor komposit ditentukan oleh reliabilitas skor komponennya. Kita
dapat melakukan estimasi terhadap reliabilitas masing-masing komponen secara
terpisah dan bila reliabilitasnya setiap komponen itu cukup tinggi maka kita dapat
mengharapkan bahwa skor kompositnya juga akan memiliki reliabilitas yang tinggi.
Akan tetapi, bila diinginkan untuk memperoleh estimasi tunggal terhadap skor
komposit, dapat digunakan formula yang disarankan oleh Mosier (1943), yakni

wj = bobot relative komponen j


wk = bobot relative komponen k
sj = deviasi standar komponen j
sk = deviasi standar komponen k
rjj‟ = koefisien reliabilitas tiap komponen
rjk = koefisien korelasi antara dua komponen yang berbeda

Ilustrasi penggunaan rumus:


Tabel 1. Distribusi Skor komponen dan Skor Komposit
Subyek Komponen Skor X
a b c (a + 3b + 2c)
A 6 2 3 18
B 8 4 6 32
C 10 6 8 44
D 10 5 7 39
E 9 4 7 35
F 5 2 3 17
G 7 3 4 24
H 6 2 4 20
I 9 6 7 41
J 9 5 8 40
wJ 1 3 2
sj 1,79 1,60 2,00 10,36

Pada tabel 1 diperlihatkan distribusi skor tes X yang terdiri atas gabungan skor 3
komponen yaitu a, b, dan c. Dimisalkan bahwa komponen a memiliki bobot 1, komponen
b mempunyai bobot 3, dan komponen c memiliki bobot 2 sehingga skor total X merupakan
penjumlahan skor ketiga komponennya setelah dikalikan dengan bobot masing-masing.
Pada subjek H, misalnya skor X didapat dari .
Perhitungan koefisien relasi antara ketiga komponen yang telah dilakukan,
menghasilkan rab = 0,927; rac = 0,953; dan rbc = 0,927. Kemudian untuk contoh ini kita
andaikan pula bahwa koefisien reliabilitas masing-masing komponen berturut-turut adalah
raa‟ = 0,81; rbb‟ = 0,79; dan rcc‟ = 0,86
Dengan demikian, komputasi koefisien reliabilitas untuk skor komposit X adalah
= (1)2 (1,79)2 + (3)2 (1,60)2 + (2)2 (2,00)2 = 42,2441

= (1)2 (1,79)2 (0,81)2 + (3)2 (1,60)2 (0,79)2 + (2)2 (2,00)2 (0,86)2 = 34,5569

= (1)(3)(1,79)(1,60)(0,927) + (1)(2)(1,79)(2,00)(0,953) +

(3)(2)(1,60)(2,00)(0,927)
= 32,5867
Dengan demikian, diperoleh koefisien reliabilitas skor komposit X yaitu
= 0,928
LEMBAR KERJA

SOAL

1. Diketahui hasil scoring dari dua orang ahli pada 15 butir THB sebagai berikut:
Butir Rater 1 Rater 2
1 0 1
2 0 0
3 1 1
4 1 0
5 1 1
6 1 1
7 1 0
8 0 0
9 0 1
10 1 1
11 0 1
12 1 1
13 0 1
14 1 0
15 1 0
Ditinjau dari isinya tentukan apakah THB tersebut dapat dikatakan valid.

2. Diketahui tabel sebagai berikut

Nama Butir soal total


siswa 1 2 3 4 5 6 7 8 9 10
A 1 1 1 1 1 1 0 1 0 0 7
B 1 1 1 1 1 0 1 0 0 0 6
C 0 0 0 1 0 1 1 0 1 1 5
D 1 0 1 0 0 0 0 0 1 1 4
E 1 1 1 0 0 0 0 0 0 0 3
Keterangan

1= soal yang dijawab benar

0 =soal yang dijawab salah

Hitunglah validitas isi dari butir soal nomor 4 menggunakan rumus korelasi product moment !

3. Diketahui 5 butir soal tes uraian dengan 10 responden, respons siswa terhadap tes
tersebut ditunjukkan seperti tabel berikut:

Responden Butir
1 2 3 4 5
1. 15 20 17 18 20
2. 10 7 12 9 10
3. 5 7 5 8 5
4. 20 20 17 20 18
5. 15 17 15 18 17
6. 7 8 7 5 9
7. 15 17 14 15 15
8. 20 19 17 20 17
9. 15 15 16 14 15
10. 4 3 4 4 3

Berdasarkan tabel tersebut carilah reliabilitas soal dengan rumus yang sudah Anda
pelajari!

4. Terkadang hasil pengujian reliabilitas terhadap suatu tes dengan berbagai rumus
menunjukkan hasil yang berbeda. Apakah sebenarnya salah satu penyebab perbedaan
hasil tersebut?
Kunci jawaban

1. Perhitungan dilakukan berdasarkan tabel persiapan sebagai berikut:


No X Y XY

1 0 1 0 1 0
2 0 0 0 0 0
3 1 1 1 1 1
4 1 0 1 0 0
5 1 1 1 1 1
6 1 1 1 1 1
7 1 0 1 0 0
8 0 0 0 0 0
9 0 1 0 1 0
10 1 1 1 1 1
11 0 1 0 1 0
12 1 1 1 1 1
13 0 1 0 1 0
14 1 0 1 0 0
15 1 0 1 0 0
9 9 9 9 5

Substitusikan data yang telah diperoleh ke dalam rumus korelasi, sehingga:

.
Dari perhitungan di atas, didapat hasil , ini berarti kita belum dapat memutuskan

apakah tes tersebut valid atau tidak. Dari hasil perhitungan tersebut, dapat diketahui
bahwa penilaian yang diberikan oleh rater 1 dan rater 2 bertentangan. Maka sebaiknya
dihadirkan rater ketiga, agar dapat diputuskan tes tersebut valid atau tidak.

2. Perhitungan validitas butir 4. Perhitungan dilakukan berdasarkan tabel persiapan


sebagai berikut:
No X Y XY

1 1 7 1 49 7
2 1 6 1 36 6
3 1 5 1 25 5
4 0 4 0 16 0
5 0 3 0 9 0
3 25 3 135 18

Substitusikan data yang telah diperoleh ke dalam rumus korelasi, sehingga:

.
Diperoleh hasil perhitungan r = 0,86. Berdasarkan criteria validitas maka koefisien
validitas termasuk dalam kategori sangat tinggi. Berarti tes tersebut valid.
3. Tabel
Responden Butir
1 2 3 4 5
1. 15 20 17 18 20 90 8100
2. 10 7 12 9 10 48 2304
3. 5 7 5 8 5 30 900
4. 20 20 17 20 18 95 9025
5. 15 17 15 18 17 82 6724
6. 7 8 7 5 9 36 1296
7. 15 17 14 15 15 76 5776
8. 20 19 17 20 17 93 8649
9. 15 15 16 14 15 75 5625
10. 4 3 4 4 3 18 324

643 48723
126 133 124 131 129
1890 2135 1778 2055 1967

keterangan: N = jumlah responden


Menghitung varians butir
( X ) 2
X2  N
2 
N

+ +
= 155,07

Menghitung reliabilitas

Artinya tingkat reliabilitas tes tersebut tinggi.

4. Salah satu penyebab perbedaan hasil perhitungan reliabilitas suatu tes adalah
kecermatan penghitungan yaitu mengenai pembulatan bilangan
RANGKUMAN

1. Validitas berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu yang
diinginkan untuk diukur.
2. Metode pengujian validitas dapat dibagi menjadi tiga macam, yaitu validitas isi,
validitas kriteria, dan validitas konstruk.
3. Validitas Isi (content validity) adalah pengujian validitas dilakukan atas isinya untuk
memastikan apakah butir THB mengukur secara tepat keadaan yang ingin diukur.
4. Perhitungan korelasi dilakukan dengan rumus produk momen sebagai berikut

5. Reliabilitas berhubungan dengan masalah ketetapan hasil tes.


6. Metode penghitungan reliabilitas berdasarkan bentuk soal yaitu 1). Soal pilihan
ganda 2). Soal uraian 3). Soal campuran.

--------------------

DAFTAR PUSTAKA

Arikunto, Suharsimi. 2007. Dasar-dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta:


Bumi Aksara
Azwar, Saifuddin.2001. Reliabilitas dan Validitas. Yogyakarta: Pustaka Pelajar.
Purwanto. 2009. Evaluasi Hasil Belajar. Yogyakarta: Pustaka Pelajar.
http://leoriset.blogspot.com/2009/07/validitas-instrumen-tes.html
http://violetatniyamani.blogspot.com/2007/09/teori-validitas.html

Anda mungkin juga menyukai