JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI SEMARANG
2019
PENGANTAR
Tes Hasil Belajar (THB) adalah alat ukur yang digunakan untuk melakukan
pengukuran guna pengumpulan data hasi belajar. Sebagai sebuah alat ukur maka THB
harus memenuhi syarat sebagai alat ukur yang baik. Alat ukur yang baik harus memenuhi
dua syarat yaitu validitas dan reliabilitas.
Suatu alat ukur yang tidak reliabel atau tidak valid akan memberikan informasi
yang keliru mengenai keadaan subjek atau individu yang dikenai tes itu. Apabila informasi
yang keliru itu dengan sadar atau tidak dengan sadar digunakan sebagai dasar
pertimbangan dalam pengambilan suatu keputusan, maka keputusan itu tentu bukan
merupakan suatu keputusan yang tepat.
Oleh karena itu, sebelum digunakan untuk mengumpulkan data, THB harus
terlebih dahulu diuji validitas dan reliabilitasnya. Dalam Modul ini akan dibahas
mengenai:
a. Validitas, validitas isi, dan reliabilitas.
b. Cara pengujian validitas isi menggunakan perhitungan korelasi dengan rumus
product moment.
c. Batasan reliabilitas dan koefisien reliabilitas.
d. Metode estimasi reliabilitas.
e. Reliabilitas tes berdasarkan bentuk soal.
KEGIATAN BELAJAR :
A. Validitas
Validitas berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu
yang diinginkan untuk diukur. Menurut Anastasi dan Urbina (1997:113)(dalam DR.
Purwanto, 2009), validitas berhubungan dengan apakah tes mengukur apa yang mesti
diukurnya dan seberapa baik dia melakukannya. Validitas merupakan derajat sejauh
mana tes mengukur apa yang ingin diukur (Borg dan Gall, 1983:275, Poppham,
1981:98)(dalam DR. Purwanto, 2009).
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan
dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya (Azwar 1986).
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang
tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil
ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes
yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan
tujuan pengukuran. Terkandung di sini pengertian bahwa ketepatan pada validitas
suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan
pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk
mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel
A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang
dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel
A' atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk
mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A' atau B
(Azwar 1986).
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu
alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi
juga harus memberikan gambaran yang cermat mengenai data tersebut. Cermat berarti
bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang
sekecil-kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam
bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas
maka kita harus menggunakan alat penimbang berat emas agar hasil
penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan
memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat
cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan
terlihat pada alat ukur berat badan.
Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam
perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup
cermat dan karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi,
jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai
waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter
dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan
satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch.
Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu
akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan
menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat
kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai
angka yang sebenarnya atau angka yang mendekati keadaan sebenarnya (Azwar
1986).
Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh
karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran.
Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang
spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam "alat ukur ini
valid" adalah kurang lengkap. Pernyataan valid tersebut harus diikuti oleh keterangan
yang menunjuk kepada tujuan (yaitu valid untuk mengukur apa), serta valid bagi
kelompok subjek yang mana?
THB yang valid adalah THB yang mengukur dengan tepat keadaan yang ingin
diukur. Sebaliknya, THB dikatakan tidak valid bila digunakan untuk mengukur suatu
keadaan yang tidak tepat diukur dengan THB tersebut. Misalnya: tes tertulis bukan
alat ukur yang valid untuk mengukur gaya keterampilan berenang, tes untuk
mengukur hasil belajar matematika tidak tepat untuk mengukur minat terhadap
matematika dan sebagainya.
Sebelum THB digunakan untuk mengumpulkan data, terlebih dahulu harus
diperiksa bahwa THB telah valid. Hal itu diperlukan untuk menjamin adanya
kesesuaian antara THB dengan hasil belajar yang ingin diukur. Pengumpulan data
menggunakan THB yang tidak valid menghasilkan data hasil belajar yang tidak valid.
Validitas yang berkaitan untuk siapa perlu diperhatikan, karena menyangkut
dengan membangun gambaran atau deskripsi terhadap suatu grup normal. Derajat
validitas hanya berlaku untuk suatu kelompok tertentu yang memang telah
direncanakan pemakaiannya oleh si peneliti. Contoh dalam tes pencapaian prestasi
anak yang direncanakan oleh orang dewasa, akan berbeda bentuk maupun
substansinya dengan tes prestasi untuk anak usia remaja.
Pengujian validitas dapat dilakukan menggunakan beberapa metode. Menurut
Nunally (1978:88)(dalam DR. Purwanto, 2009), pengukuran psikologis mempunyai
tiga fungsi utama yaitu membuat hubungan statistik dengan variabel tertentu,
menggambarkan wilayah isi tertentu dan mengukur atribut psikologis. Untuk itu
komite bersama antara The American Psycological Association, The American
Education Research Association, dan The National Council on Measurement used in
Education (Kerlinger, 1996:730-731)(dalam DR. Purwanto, 2009) mengelompokkan
metode pengujian validitas menjadi tiga macam, yaitu validitas isi, validitas kriteria,
dan validitas konstruk. Dalam pengujian validitas melibatkan perhitungan statistik
korelasi.
1. Validitas Isi (content validity)
Validitas Isi (content validity) adalah pengujian validitas dilakukan atas isinya
untuk memastikan apakah butir THB mengukur secara tepat keadaan yang ingin
diukur. Validitasn isi ini berhubungan dengan representativitas sampel butir dari
semesta populasi butir. Secara teoritik butir yang dapat dituliskan untuk mengukur
hasil belajar jumlahnya tidak terhingga.Butir-butir THB yang yang akan digunakan
untuk mengukur merupakan sebagian saja dari populasi butir yang tidak
terhingga.Pengujian validitas butir dilakukan untuk menjamin bahwa meski
penumpulan data hanya dilakukan menggunakan sebagian butir namun butir-butir
yang dipilih mewakili sifat populasi butirnya. Pengujian validitas isi dapat dilakukan
menggunakan satu dari tiga metode yaitu menelaah butir instrument,meminta
pertimbangan ahli dan analisis korelasi butir-total.
Untuk keperluan pengembangan butir-butir THB yang representatif maka
pengembangan buti-butir THB harus didasarkan pada perencanaan kisi-kisi.Pengujian
validitas isi yang dilakukan dengan menelaah butir dilakukan dengan mencermati
kesesuaian isi butir yang ditulis dengan perencanaan yang dituangkan dalam kisi-
kisi.Kriteria yang menjadi dasar pengujian valilditas isi adalah kisi-kisi yang
direncanakan. Review dilakukan untuk menjaga agar materi butir THB yang
dikembangkan tidak menyimpang dari kisi-kisi. Butir-butir THB dapat dinyatakan
valid (logically valid) apabila setelah mencermati isi butir-butir yang ditulis telah
menunjukkan kesesuaian dengan kisi-kisi.
Pengujian validitas isi dapat dilakukan dengan meminta pertimbangan ahli.
Orang yang memiliki kompetensi dalamdalam suatu bidang dapat dimintakan
pendapatnya untuk menilai ketepatan isi butir THB. Pertimbangan juga dapat
dimintakan kepada professional. Orang yang menekuni suatu bidang tertentu yang
sesuai dengan wilayah kajian THB, misalnya guru, mekanik, dokter, advokat,
koreografer dan sebagainya dapat dimintakan pendapatnya untuk menilai ketepatan isi
THB. Penilaian validitas isi juga dapat dimintakan pertimbangannya kepada beberap
orang yang memiliki kompetensi untuk memberikan penilaian. Pertimbangan yang
dimintakan kepada ahli, professional, atau rater menyangkut isi dari butir THB dan
kisi-kisinya. Pertimbangan menyangkut materi yang akan diukur menggunakan butir-
butir THB. Butir-butir yang mengukur materi sebagaimana dipahami dan disepakati
oleh ahli, professional atau penilai dapat dinyatakan sebagai butir-butir THB yang
valid. Pemberian pendapat dapat dilakukan dengan memberikan respon atas
kesesuaian butir yang ditulis dengan kisi-kisinya dalam hal materi. Respon
selanjutnya diskor deengan cara tertentu. Misalnya, dua orang ahli di minta menilai
kesesuaian materi butir degnan kisi-kisinya pada sepuluh butir THB. Penilaian
dilakukan dengan menentukan pilihan pada pilihan yang tersedia yaitu “ tidak sesuai”
“ragu” “sesuai”. Skoring dilakukan dengan memberikan skor -1 pada respon “tidak
sesuai”, 0 pada respon “ragu”, +1 pada respon “sesuai”. Hasil scoring respon dua
orang ahli atas sepuluh butir instrument diringkas sebagai berikut:
Butir Rater 1 Rater 2
1 1 1
2 1 0
3 1 1
4 1 1
5 1 1
6 0 0
7 1 1
8 1 1
9 1 1
10 1 1
Perhitungan korelasi dilakukan dengan rumus produk momen sebagai berikut
Keterangan
N= jumlah responden
X= skor yang diberikan oleh rater 1
Y = skor yang diberikan oleh rater 2
Perhitungan dilakukan berdasarkan tabel persiapan sebagai berikut:
No X Y X2 Y2 XY
1 1 1 1 1 1
2 1 0 1 0 0
3 1 1 1 1 1
4 1 1 1 1 1
5 1 1 1 1 1
6 0 0 0 0 0
7 1 1 1 1 1
8 1 1 1 1 1
9 1 1 1 1 1
10 1 1 1 1 1
9 8 9 8 8
Hasil korelasi skor kedua rater menunjukkan indeks korelasi itu sebesar 0,667.
Hasil konfirmasi table pada n = 10, a = 5% menunjukkan harga table sebesar 0,632.
Oleh Karen R hitung lebih dari R table maka kedua skor berkorelasi signifikan dan
kedua rater manila bahwa kedua THB mengukur hal yang sama sehingga dapat
dikatakan bahwa THB mangukur keadaan yang ingin diukurnya (valid).
Pengujian validitas isi dapat dilakukan dengan melihat korelasi butir dengan
total. Korelasi butir dengan total menunjukkan sumbangan butir terhadap totalnya.
Sebuah butir dinyatakan valid apabila dia berkorelasi tinggi dengan totalnya. Butir
yang berkorelasi tinggi dengan totalnya menunjukkan bahwa butir tersebut
merupakan isi dari instrument karena mempunyai sumbangan besar membentuk skor
total THB. kriteria untuk menilai apakah butir memberikan sumbangan signifikan
bagi total adalah apabila korelasi hitung butir dengan total R hitugn lebih dari R
tabel.
Contoh: dalam sebuah uji coba THB mata pelajaran Matematika atas 10 butir
THB yang diikuti oleh 10 peserta memberikan hasil sebagai berikut:
Responden Butir Total
1 2 3 4 5 6 7 8 9 10
1 4 3 1 5 2 2 2 3 5 2 29
2 5 4 2 4 3 1 1 4 5 3 32
3 3 2 1 4 2 2 1 3 4 2 24
4 4 2 1 3 2 3 2 3 4 2 26
5 5 1 2 4 2 2 2 4 5 2 29
6 3 2 3 5 1 1 1 3 5 3 27
7 4 3 2 5 2 2 1 3 4 3 29
8 5 2 1 4 3 2 1 3 4 2 27
9 2 1 1 3 2 1 2 3 5 1 21
10 3 2 2 4 2 1 1 4 5 3 27
rit 0,78 0,70 0,43 0,54 0,31 0,01 - 0,50 0,17 0.68
69 91 98 08 6 63 0,24 78 01 89
1
kriteria 0,63 0,63 0,63 0,63 0,63 0,63 0,63 0,63 0,63 0,63
2 2 2 2 2 2 2 2 2 2
keputusan valid valid tidak tidak tidak tidak tidak tidak tidak valid
Keterangan
N = jumlah siswa
X = skor siswa pada butir 1
Y = skor total siswa
Dengan menghitung menggunakan korelasi menggunakan rumus product
moment diperoleh koefisien korelasi sebesar 0,787. oleh karena r hitung =0.787 r
tabel = 0,632 maka disimpulkan bahwa butir 1 berkorelasi signifikan dengan skor
total.Dengan kata lain butir 1 mengukur hal yang sama dengan yang diukur oleh skor
total.
2. Validitas Kriteria (criterion related validity)
Validitas Kriteria (criterion related validity) adalah penujian validitas yang
dilakukan dengan membandingkan THB dengan criteria tertentu di luar THB.
2. Koefisien Reliabilitas
Secara empirik, tinggi rendahnya reliabilitas ditunjukkan oleh suatu angka yang
disebut koefisien reliabilitas. Pada awalnya tinggi rendahnya reliabilitas tes
dicerminkan oleh koefisien korelasi antara skor pada dua tes yang pararel, yang
dikenakan pada sekelompok individu yang sama.
Koefisien korelasi antara dua variabel dilambangkan oleh huruf r. Apabila skor
pada tes pertama diberi lambang X dan skor pada tes yang kedua diberi lambang X‟,
maka koefisien korelasi antara kedua tes tersebut adalah rxx‟. Simbol ini yang
digunakan sebagai simbol koefisien reliabilitas.
Secara teoritik besarnya koefisien reliabilitas berkisar mulai dari 0,0 sampai
dengan 1,0 akan tetapi kenyataanya koefisien sebesar 1,0 dan koefisien sekecil 0,0
tidak pernah dijimpai. Di samping itu, walaupun koefisien korelasi dapat saja bertanda
negatif, koefisien reliabilitas selalu mengacu pada angka positif karena angka yang
negative tidak ada artinya bagi interpretasi reliabilitas hasil ukur.
Di mana:
= korelasi antara skor-skor setiap belahan tes
Rumus 2
)
St
Di mana :
S1 var ians belahan pertama (1) yang dalam hal ini varians skor item ganjil
2
S 2 var ians belahan kedua (2) yaitu varians skor item genap
2
Rumus
Di mana:
= Varians beda (varians difference)
d = difference yaitu perbedaan antara skor belahan pertama (awal) dengan skor
belahan kedua (akhir).
= Varians total
Untuk memperjelas keterangan maka table belahan awal-akhir dikutip disini lagi.
No. Nama Awal akhir d
1. Hartati 3 5 -2 4
2. Yoyok 2 3 -1 1
3. Oktaf 1 3 -2 4
4. Wendi 3 2 1 1
5. Diana 5 1 4 16
6. Paul 3 1 2 4
7. Susana 5 2 3 9
8. Helen 3 5 2 4
= = 5,234
Dari perhitungan dengan rumus Flanagan maupun Rulon ternyata hasilnya sama,
keduanya lebih besar dari 1,00. Secara teoretik koefisien ini salah tetapi karena
pembulatan-pembulatan dalam perhitungan, seperti dijelaskan di depan, hasil seperti
ini dapat saja terjadi.
b. Jumlah butir ganjil
Pengujian reliabilitas sebagai koefisien konsistensi internal di mana butir
instrumen berjumlah ganjil dapat dilakukan menggunakan metode Kuder –
Richardson, Hoyt atau Alpha Cronbach.
No. Nama Nomor item Skor Total
1 2 3 4 5 6 7
Di mana :
= reliabilitas tes secara keseluruhan
= proporsi subjek yang menjawab item dengan benar
proporsi subjek yang menjawab item dengan salah (q= 1-p)
jumlah hasil perkalian antara p dan q
n = banyaknya item
S = standar deviasi dari tes ( standar deviasi adalah akar varians )
Contoh :
TABEL PERHITUNGAN MENCARI RELIABILITAS TES DENGAN RUMUS K-R 20
1. Wardoyo 1 0 1 1 1 1 0 5
2. Benny 0 1 1 0 1 1 1 5
3. Hanafi 0 0 0 0 1 0 1 2
4. Rahmad 0 1 1 1 1 1 1 6
5. Tanti 1 0 0 0 1 0 0 2
6. Nadia 0 1 1 1 1 0 0 4
7. Tini 0 0 0 1 1 1 0 3
8. Budi 0 1 0 1 1 0 0 3
9. Daron 0 1 0 1 1 0 0 3
10. Yakob 0 0 0 1 1 0 0 2
Np 2 5 4 7 10 4 3 35
p 0,2 0,5 0,4 0,7 1 0,4 0,3
q 0,8 0,5 0,6 0,3 0 0,6 0,7
pq 0,16 0,25 0,24 0,21 0 0,24 0,21 1,31
(
Metode Hoyt
Rumusnya adalah :
atau
Keterangan :
= Reliabilitas seluruh soal
= Varians Responden
= Varians sisa
KR-20 =
Keterangan:
k : jumlah butir soal
2
(SD) : varians
P : Proporsi subjek yang menjawab item dengan benar
q :( 1-p ):Proporsi subjek menjawab item dengan salah
Hitunglah koefisien reliabilitas tes berbentuk pilihan ganda yang terdiri dari 4 butir
soal dan diikuti oleh 6 responden dengan respons sebagai berikut
Soal X
Siswa X-
1 2 3 4 (
A 1 0 0 0 1 2 -1 1
B 1 1 0 0 2 2 0 0
C 0 0 1 1 2 2 0 0
D 0 0 0 0 0 2 -2 4
E 1 1 0 1 3 2 -1 1
F 1 1 1 1 4 2 -2 4
P 0,67 0,50 0,33 0,50 12 10
1–p 0,33 0,50 0,67 0,50
p(1 – p) 0,22 0,25 0,22 0,25
varian =
r=
r=
= 0,58
Artinya tingkat keajegan tes tersebut sedang
keterangan:
k : banyak soal
sj2 : varians butir ke j
2
sx : varians skor total
kriteria reliabilitas
Koefisien Reliabilitas Kategori
r < 0,2 sangat rendah
0,2 r < 0,4 Rendah
Contoh:
Hitunglah koefisien reliabilitas dari 10 responden dengan item sebanyak 6. Respon dari
responden ditunjukkan dalam tabel berikut.
No Nama Nomor item Skor Kuadrat
1 2 3 4 5 6 Total skor total
1. A 10 6 8 8 10 10 52 2704
2. B 6 4 4 6 6 5 31 961
3. C 8 2 6 8 7 8 39 1521
4. D 7 3 7 7 6 6 36 1296
5. E 0 5 3 2 4 4 18 324
6. F 2 4 2 8 6 8 30 900
7. G 4 3 6 6 6 6 31 961
8. H 5 5 5 7 7 7 36 1296
9. I 5 5 4 6 8 5 33 1089
10. J 3 6 3 4 6 6 28 784
Jumlah 50 43 48 62 66 65 334 11836
Jumlah Kuadrat 328 201 264 418 458 451 2120
N
50 2
328
(1) 2 10 328 250 7,8
10 10
43 2
210
( 2) 2 10 210 184,9 1,61
10 10
48 2
264
( 3) 2 10 264 230,4 3,36
10 10
62 2
418
( 4) 2 10 418 384,4 3,36
10 10
66 2
458
(5) 2 10 458 435,6 2,24
10 10
65 2
451
(6) 2 10 451 422,5 2,85
10 10
Jumlah Varians semua item ( i )
2
7,8 + 1,61+3,36+3,36+2,24+2,85=21,22
334 2
11836
Varians total = 10 11836 11155 ,6
10 10
680,4
= 68,04
10
Dimasukkanke dalam rumus Alpha
6 21,22 6
r11 (1 ) x(1 0,312 )
6 1 68,04 5
6
0,688 0,8256 dibulatkan0,826
5
c. Reliabilitas Tes Bentuk Campuran
Pada berbagai bentuk tes yang mengukur factor kemampuan, ada kalanya skor
subjek pada tes tidak berasal hanya dari satu sumber saja melainkan ditentukan oleh
gabungan dari beberapa skor. Beberapa skor tersebut dapat berupa skor dari bagian tes
itu sendiri, yaitu komponen, dapat pula berasal dari tes yang berbeda. Dalam hal
seperti itu komponen atau bagian tes akan memberikan bobot tersendiri yang mungkin
tidak sama besarnya, dalam menentukan skor subjek.
Bobot relative suatu komponen ditentukan besarnya oleh banyaknya sumbangan
komponen tersebut dalam menentukan skor akhir.Misalnya suatu komponen yang
berisi lebih banyak aitem akan lebih besar bobotnya.
Skor akhir pada tes seperti itu merupakan skor komposit (gabungan) yang
merupakan penjumlahan dari skor setiap bagian atau komponen dengan
memperhitungkan besarnya bobot masing-masing
Reliabilitas skor komposit ditentukan oleh reliabilitas skor komponennya. Kita
dapat melakukan estimasi terhadap reliabilitas masing-masing komponen secara
terpisah dan bila reliabilitasnya setiap komponen itu cukup tinggi maka kita dapat
mengharapkan bahwa skor kompositnya juga akan memiliki reliabilitas yang tinggi.
Akan tetapi, bila diinginkan untuk memperoleh estimasi tunggal terhadap skor
komposit, dapat digunakan formula yang disarankan oleh Mosier (1943), yakni
Pada tabel 1 diperlihatkan distribusi skor tes X yang terdiri atas gabungan skor 3
komponen yaitu a, b, dan c. Dimisalkan bahwa komponen a memiliki bobot 1, komponen
b mempunyai bobot 3, dan komponen c memiliki bobot 2 sehingga skor total X merupakan
penjumlahan skor ketiga komponennya setelah dikalikan dengan bobot masing-masing.
Pada subjek H, misalnya skor X didapat dari .
Perhitungan koefisien relasi antara ketiga komponen yang telah dilakukan,
menghasilkan rab = 0,927; rac = 0,953; dan rbc = 0,927. Kemudian untuk contoh ini kita
andaikan pula bahwa koefisien reliabilitas masing-masing komponen berturut-turut adalah
raa‟ = 0,81; rbb‟ = 0,79; dan rcc‟ = 0,86
Dengan demikian, komputasi koefisien reliabilitas untuk skor komposit X adalah
= (1)2 (1,79)2 + (3)2 (1,60)2 + (2)2 (2,00)2 = 42,2441
= (1)2 (1,79)2 (0,81)2 + (3)2 (1,60)2 (0,79)2 + (2)2 (2,00)2 (0,86)2 = 34,5569
= (1)(3)(1,79)(1,60)(0,927) + (1)(2)(1,79)(2,00)(0,953) +
(3)(2)(1,60)(2,00)(0,927)
= 32,5867
Dengan demikian, diperoleh koefisien reliabilitas skor komposit X yaitu
= 0,928
LEMBAR KERJA
SOAL
1. Diketahui hasil scoring dari dua orang ahli pada 15 butir THB sebagai berikut:
Butir Rater 1 Rater 2
1 0 1
2 0 0
3 1 1
4 1 0
5 1 1
6 1 1
7 1 0
8 0 0
9 0 1
10 1 1
11 0 1
12 1 1
13 0 1
14 1 0
15 1 0
Ditinjau dari isinya tentukan apakah THB tersebut dapat dikatakan valid.
Hitunglah validitas isi dari butir soal nomor 4 menggunakan rumus korelasi product moment !
3. Diketahui 5 butir soal tes uraian dengan 10 responden, respons siswa terhadap tes
tersebut ditunjukkan seperti tabel berikut:
Responden Butir
1 2 3 4 5
1. 15 20 17 18 20
2. 10 7 12 9 10
3. 5 7 5 8 5
4. 20 20 17 20 18
5. 15 17 15 18 17
6. 7 8 7 5 9
7. 15 17 14 15 15
8. 20 19 17 20 17
9. 15 15 16 14 15
10. 4 3 4 4 3
Berdasarkan tabel tersebut carilah reliabilitas soal dengan rumus yang sudah Anda
pelajari!
4. Terkadang hasil pengujian reliabilitas terhadap suatu tes dengan berbagai rumus
menunjukkan hasil yang berbeda. Apakah sebenarnya salah satu penyebab perbedaan
hasil tersebut?
Kunci jawaban
1 0 1 0 1 0
2 0 0 0 0 0
3 1 1 1 1 1
4 1 0 1 0 0
5 1 1 1 1 1
6 1 1 1 1 1
7 1 0 1 0 0
8 0 0 0 0 0
9 0 1 0 1 0
10 1 1 1 1 1
11 0 1 0 1 0
12 1 1 1 1 1
13 0 1 0 1 0
14 1 0 1 0 0
15 1 0 1 0 0
9 9 9 9 5
.
Dari perhitungan di atas, didapat hasil , ini berarti kita belum dapat memutuskan
apakah tes tersebut valid atau tidak. Dari hasil perhitungan tersebut, dapat diketahui
bahwa penilaian yang diberikan oleh rater 1 dan rater 2 bertentangan. Maka sebaiknya
dihadirkan rater ketiga, agar dapat diputuskan tes tersebut valid atau tidak.
1 1 7 1 49 7
2 1 6 1 36 6
3 1 5 1 25 5
4 0 4 0 16 0
5 0 3 0 9 0
3 25 3 135 18
.
Diperoleh hasil perhitungan r = 0,86. Berdasarkan criteria validitas maka koefisien
validitas termasuk dalam kategori sangat tinggi. Berarti tes tersebut valid.
3. Tabel
Responden Butir
1 2 3 4 5
1. 15 20 17 18 20 90 8100
2. 10 7 12 9 10 48 2304
3. 5 7 5 8 5 30 900
4. 20 20 17 20 18 95 9025
5. 15 17 15 18 17 82 6724
6. 7 8 7 5 9 36 1296
7. 15 17 14 15 15 76 5776
8. 20 19 17 20 17 93 8649
9. 15 15 16 14 15 75 5625
10. 4 3 4 4 3 18 324
643 48723
126 133 124 131 129
1890 2135 1778 2055 1967
+ +
= 155,07
Menghitung reliabilitas
4. Salah satu penyebab perbedaan hasil perhitungan reliabilitas suatu tes adalah
kecermatan penghitungan yaitu mengenai pembulatan bilangan
RANGKUMAN
1. Validitas berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu yang
diinginkan untuk diukur.
2. Metode pengujian validitas dapat dibagi menjadi tiga macam, yaitu validitas isi,
validitas kriteria, dan validitas konstruk.
3. Validitas Isi (content validity) adalah pengujian validitas dilakukan atas isinya untuk
memastikan apakah butir THB mengukur secara tepat keadaan yang ingin diukur.
4. Perhitungan korelasi dilakukan dengan rumus produk momen sebagai berikut
--------------------
DAFTAR PUSTAKA