Anda di halaman 1dari 61

EVALUASI PENDIDIKAN MATEMATIKA

“VALIDITAS DAN RELIABILITAS TES”

Dosen Pengampu :
Prof. Dr. I Made Ardana, M.Pd.
Oleh: Kelompok 6

Ni Luh Heni Purnamayanti (1823011002)

Putu Linda Lestari (1823011015)

Ida Ayu Kade Suryani (1823011016)

PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKA


JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PENDIDIKAN GANESHA
2019
KATA PENGANTAR

Puji syukur penulis panjatkan kehadapan Tuhan Yang Maha Esa karena
atas berkah dan rahmat-Nya penulis dapat menyelesaikan makalah yang
berjudul “Validitas dan Reliabilitas Tes” tepat pada waktunya.
Dalam penyusunan makalah ini penulis mendapat banyak bantuan dan
dukungan dari berbagai pihak. Untuk itu, melalui kesempatan ini penulis
menyampaikan terima kasih yang setulus-tulusnya kepada:
1. Bapak Prof. Dr. I Made Ardana, M.Pd., selaku dosen pengampu mata
kuliah Evaluasi Pendidikan Matematika.
2. Rekan-rekan sejawat penulis di Program Studi S2 Pendidikan
Matematika.
3. Pihak-pihak lain yang telah membantu penulis dalam penyusunan
makalah ini melalui ide-ide dan gagasan-gagasan.
Penulis menyadari bahwa makalah ini masih belum sempurna. Oleh
karenanya, penulis memohon maaf apabila dalam makalah terdapat hal yang
kurang berkenan. Penulis juga sangat mengharapkan saran dan kritik dari
pembaca yang sifatnya membangun demi perbaikan makalah ini. Penulis berharap
semoga makalah ini dapat bermanfaat bagi semua pihak.

Denpasar, Maret 2019

Penulis

ii
RINGKASAN EKSEKUTIF

Suatu proses pembelajaran tidak pernah terlepas dari kegiatan


perencanaan, pelaksanaan, serta kegiatan evaluasi. Ketiganya memiliki peran yang
penting dalam mengoptimalkan proses pembelajaran. Kegiatan perencanaan
dilakukan sebagai bentuk upaya dalam memberikan gambaran mengenai apa yang
akan dilakukan selama proses pembelajaran. Kegiatan pelaksanaan dilakukan
sebagai bentuk realisasi dari rencana yang telah dirumuskan dan terakhir kegiatan
evaluasi merupakan suatu bentuk refleksi atau cerminan dari pelaksanaan suatu
pembelajaran. Evaluasi merupakan bagian yang cukup penting sebab melalui
evaluasi kita dapat mengetahui seberapa efektif proses pembelajaran yang telah
berlangsung, apakah pembelajaran yang telah dilaksanakan mencapai target atau
tujuan yang telah ditetapkan atau tidak. Salah satu bagian penting dari kegiatan
evaluasi adalah alat ukur yang digunakan yaitu tes. Dalam menyusun suatu tes
terdapat beberapa kriteria yang harus dipenuhi agar tes tersebut dapat berfungsi
sebagai alat ukur yang efektif mengukur kemampuan siswa. Berdasarkan hal
tersebut penting bagi seorang guru (evaluator) untuk mengetahui kriteria dalam
penyusunan suatu tes. Pertama, suatu alat ukur (tes) haruslah valid yang berarti tes
tersebut harus tepat atau sesuai dengan sesuatu yang ingin diukur. Sering kita
temui bahwa suatu tes terkadang tingkat kesulitan yang lebih tinggi dibandingkan
dengan materi yang dibahas. Validitas tes ini kemudian dibedakan menjadi
beberapa tipe diantaranya adalah validitas logis dan validitas empiris. Kedua,
suatu alat ukur (tes) haruslah reliable yang berarti tes tersebut haruslah konsisten
atau stabil memberikan hasil yang relative tetap apabila diberikan kepada subjek
yang sama. Teknik pengujian reliabilitas suatu tes akan bergantung pada bentuk
instrumen yang disusun.

Kata kunci : Evaluasi, Validitas, Reliabilitas

iii
DAFTAR ISI

Halaman judul ................................................................................................. i


Kata Pengantar ................................................................................................ ii
Ringkasan Eksekutif ...................................................................................... iii
Daftar Isi.........................................................................................................iv
Daftar Gambar ................................................................................................. v
Daftar Tabel....................................................................................................vi
BAB I PENDAHULUAN ................................................................................ 1
1.1 Latar Belakang ........................................................................................... 1
1.2 Rumusan Masalah ...................................................................................... 2
1.3 Tujuan........................................................................................................3
BAB II PEMBAHASAN ................................................................................. 4
2.1 Validitas ..................................................................................................... 4
2.2 Tipe-tipe Umum Validitas ..........................................................................6
2.3 Validitas Alat Ukur .................................................................................. 12
2.4 Validitas Butir Soal atau Validitas Item .................................................... 17
2.5 Faktor-faktor yang Mempengaruhi Validitas pada Tes ............................. 24
2.6 Reliabilitas ............................................................................................... 26
2.7 Cara-cara Menentukan Reliabilitas Tes .................................................... 27
2.8 Faktor-faktor yang Mempengaruhi Reliabilitas Tes .................................. 48
BAB III PENUTUP ....................................................................................... 51
3.1 Simpulan .................................................................................................. 51
3.2 Saran........................................................................................................ 52
DAFTAR RUJUKAN

iv
DAFTAR GAMBAR

Gambar 2.1 Bagan Tipe-tipe Umum Validitas .................................................. 6

v
DAFTAR TABEL

Tabel 2.1 Korelasi Product Moment dengan Simpangan .............................. 13


Tabel 2.2 Korelasi Product Moment dengan Angka Kasar ........................... 14
Tabel 2.3 Makna koefisien korelasi product moment ................................... 16
Tabel 2.4 Makna koefisien validitas ............................................................ 17
Tabel 2.5 Analisis item untuk perhitungan validitas item ............................. 19
Tabel 2.6 Persiapan untuk menghitung validitas item nomor 4 .................... 20
Tabel 2.7 Analisis item untuk perhitungan validitas soal uraian ................... 22
Tabel 2.8 Persiapan untuk menghitung validitas butir soal uraian nomor 1 .. 22
Tabel 2.9 Analisis item untuk perhitungan reliabilitas tes objektif ............... 32
Tabel 2.10 Persiapan untuk menghitung reliabilitas dengan rumus Spearman-
Brown.......................................................................................... 33
Tabel 2.11 Korelasi s kor belahan ganjil dengan belahan genap dengan rumus
Flanangan .................................................................................... 35
Tabel 2.12 Korelasi skor belahan ganjil dengan belahan genap dengan rumus
Rulon ........................................................................................... 37
Tabel 2.13 Persiapan untuk menghitung reliabilitas dengan rumus Kuder
Richardson................................................................................... 39
Tabel 2.14 Alat bantu untuk menggunakan rumus C. Hoyt ............................ 45
Tabel 2.15 Rangkuman Perhitungan .............................................................. 45

vi
BAB I
PENDAHULUAN

1.1 Latar Belakang


Negara yang besar adalah negara yang memiliki sumber daya manusia
yang berkualitas. Kualitas yang dimaksudkan salah satunya dipandang dari segi
pendidikan. Pendidikan khususnya di Indonesia tercermin dari pelaksanaan
kegiatan pembelajaran dalam suatu lembaga pendidikan yaitu sekolah. Tujuan
diselenggarakannya pendidikan di sekolah adalah untuk membekalkan peserta
didik dengan ilmu pengetahuan, keterampilan serta berbagai kemampuan yang
akan membantunya dalam mengantisipasi tantangan dalam perkembangan jaman
yang semakin maju. Hal yang sama juga disebutkan dalam Undang-undang No 20
Tahun 2003 tentang Sistem Pendidikan Nasional yaitu tujuan pendidikan adalah
untuk mengembangkan potensi peserta didik agar menjadi manusia yang beriman
dan bertaqwa kepada Tuhan Yang Maha Esa, berakhlak mulia, sehat, berilmu
cakap, kreatif, mandiri dan menjadi warga Negara yang demokratis serta
bertanggung jawab.
Dalam mewujudkan tujuan pendidikan tersebut, diperlukan adanya
kesatuan dari berbagai komponen dalam kegiatan pembelajaran dimulai dari
komponen perencanaan (meliputi: strategi/ metode/ model pembelajaran, materi/
bahan ajar, media pembelajaran, dan lain sebagainya), komponen pelaksanaan
(meliputi: guru, siswa, dan kurikulum) serta komponen evaluasi yang meliputi
penilaian dari keseluruhan kegiatan yang dilakukan selama proses pembelajaran.
Tidak sedikit yang beranggapan untuk dapat mencapai tujuan pendidikan
diperlukan adanya peningkatan dalam proses belajar mengajar. Dalam hal ini yang
dimaksud adalah peningkatan dari segi cara atau metode yang digunakan guru
dalam menyampaikan informasi kepada siswa. Namun, yang sesungguhnya perlu
diperhatikan adalah proses evaluasi dalam kegiatan pembelajaran. Kegiatan
evaluasi sangatlah penting sebab melalui evaluasi kita dapat menilai seberapa
efektif metode/ model pembelajaran yang telah dipilih berhasil dalam
meningkatkan hasil belajar siswa. Berdasarkan Undang-undang RI tentang
Sisdiknas No. 20 Tahun 2003 pasal 58 ayat 1 evaluasi membantu proses,

1
kemajuan, dan perkembangan hasil belajar peserta didik secara
berkesinambungan. Oleh karenanya setiap guru berperan sebagai evaluator yang
wajib melaksanakan kegiatan evaluasi.
Pada umumnya dalam melakukan kegiatan evaluasi diperlukan suatu alat
ukur atau instrumen yang dapat membantu kegiatan tersebut. Alat ukur ini dikenal
dengan nama tes. Tidak jarang kita menemukan tes dengan tingkat kesukaran
yang tidak sesuai dengan materi pembelajaran yang diterima siswa. Selain itu,
kenyataan lain yang diungkapkan oleh Sukardi (2008) bahwa cara siswa dalam
menginterpretasikan soal juga berpengaruh terhadap hasil dari kegiatan evaluasi
tersebut. Berdasarkan hal tersebut, suatu alat ukur yang baik digunakan pada
kegiatan evaluasi adalah alat ukur yang memenuhi beberapa kriteria. yaitu: tepat
dalam mengukur sesuatu yang ingin diukur serta konsisten dan stabil dalam arti
tidak mengalami perubahan dari waktu pengukuran satu ke pengukuran yang lain.
Dengan demikian, berdasarkan pemaparan di atas, penting bagi seorang
guru (evaluator) untuk mengetahui serta memahami kriteria penyusunan alat ukur
evaluasi meliputi ketepat gunaan alat ukur (validitas) serta kekonsistenan
(reliabilitas) dari penggunaan alat ukur tersebut. Hal tersebutlah yang memotivasi
penulis untuk membahas makalah dengan judul Validitas dan Reliabilitas.

1.2 Rumusan Masalah


Berdasarkan latar belakang yang telah diuraikan, adapun beberapa masalah
yang dirumuskan adalah sebagai berikut.
1. Apa yang dimaksud dengan validitas tes?
2. Bagaimana tipe-tipe umum validitas tes beserta teknik pengujiannya?
3. Bagaimana cara menghitung validitas alat ukur?
4. Bagaimana cara menghitung validitas butir soal atau validitas item?
5. Apa saja faktor-faktor yang mempengaruhi validasi pada tes?
6. Apa yang dimaksud dengan reliabilitas tes?
7. Bagaimana cara menentukan reliabilitas pada tes?
8. Apa saja faktor-faktor yang mempengaruhi reliabilitas pada tes?

2
1.3 Tujuan
Adapun tujuan dari penulisan makalah ini, untuk mengetahui:
1. Pengertian atau makna dari validitas tes
2. Tipe-tipe umum validitas tes beserta teknik pengujiannya.
3. Cara melakukan validitas alat ukur.
4. Cara atau proses menghitung validitas butir soal atau validitas item.
5. Faktor-faktor yang mempengaruhi validasi pada tes
6. Pengertian dari reliabilitas tes
7. Cara menentukan reliabilitas pada tes
8. Faktor-faktor yang mempengaruhi reliabilitas pada tes

3
BAB II
PEMBAHASAN

2.1 Validitas
Para ahli mengemukakan definisi dari validitas, yaitu :
1. Menurut Arikunto (1999:65), validitas adalah suatu ukuran yang
menunjukkan tingkat kesahihan suatu tes. Suatu tes dikatakan valid
apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki
validitas yang tinggi jika hasilnya sesuai kriteria, dalam arti memiliki
kesejajaran antara tes dan kriteria.
2. Menurut Azwar (2012: 8), validitas berasal dari kata validity yang
mempunyai arti sejauh mana akurasi suatu tes atau skala dalam
menjalankan fungsi pengukurannya.
3. Menurut Surapranata (2004: 50) validitas adalah suatu konsep yang
berkaitan dengan sejauhmana tes telah mengukur apa yang seharusnya
diukur.
Berdasarkan beberapa pendapat tentang pengertian validitas di atas, maka
dapat diambil kesimpulan bahwa validitas adalah suatu standar ukuran yang
menunjukkan akurasi dan kesahihan suatu instrumen.
Scarvia B. Anderson dalam Arikunto (2007: 69) menyebutkan “A test is
valid if it measures what it purpose to measure”, yang artinya suatu tes dikatakan
valid apabila tes tersebut mengukur apa yang hendak diukur. Suatu pengukuran
mempunyai validitas yang tinggi apabila menghasilkan data secara akurat,
memberikan gambaran mengenai variabel yang diukur seperti dikehendaki oleh
tujuan pengukuran tersebut. Akurat dalam hal ini berarti tepat dan cermat
sehingga apabila tes menghasilkan data yang tidak relevan dengan tujuan
pengukuran maka dikatakan sebagai pengukuran yang memiliki validitas rendah.
Menurut Azwar (2012: 9) yang mengatakan bahwa valid atau tidaknya suatu
pengukuran tergantung pada kemampuan alat ukur tersebut mencapai tujuan
pengukuran yang dikehendaki dengan tepat. Suatu tes yang dirancang untuk
mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai
variabel A, dikatakan sebagai alat ukur yang hasilnya valid. Sebaliknya, suatu tes
yang dirancang mengukur variabel A akan tetapi menghasilkan data mengenai

4
variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang fungsinya tidak valid
untuk mengukur variabel A, tetapi valid untuk mengukur variabel A’ atau B.
Suatu data akan memberikan hasil yang tepat dan akurat apabila alat ukur
yang digunakan valid atau alat ukur tersebut tepat guna. Cermat berarti bahwa
pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil-
kecilnya di antara subjek yang satu dengan yang lain. Sisi lain dari pengertian
validitas adalah aspek kecermatan pengukuran.
Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam
perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa akan
dianggap cukup cermat untuk menghitung waktu dalam satuan jam dan menit
sehingga akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam
tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai
waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100
meter, dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan
perbedaan satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch.
Menggunakan alat ukur yang bertujuan untuk mengukur suatu aspek tertentu
akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti, tentu akan
menimbulkan kesalahan atau eror. Kesalahan itu dapat berupa hasil yang terlalu
tinggi (overestimated) atau yang terlalu rendah (underestimated). Alat ukur yang
valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang
dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang
mendekati keadaan sebenarnya.
Validitas adalah pertimbangan yang paling utama dalam mengevaluasi kualitas
tes sebagai instrumen ukur. Konsep validitas mengacu kepada kelayakan inferensi
tertentu yang dapat dibuat berdasarkan skor hasil tes yang bersangkutan. Pengertian
validitas sangat erat berkaitan dengan masalah tujuan suatu pengukuran. Oleh karena
itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu
alat ukur dirancang hanya untuk suatu tujuan yang spesifik.

5
2.2 Tipe-Tipe Umum Validitas
Secara umum ada dua tipe validitas, yaitu validitas logis dan validitas
empiris. Dalam Suherman (1993:130) kedua validitas tersebut digambarkan
dalam sebuah bagan seperti berikut

Validitas

Validitas Teoritik Validitas Empirik


(Logis) (Kriterium)

Validitas Validitas Validitas


Validitas isi
Konstruksi Banding Ramal

Validitas
Muka

Gambar 2.1 Bagan Tipe-tipe Umum Validitas

1. Validitas logis (Logical Validity)


Tes hasil belajar yang dikatakan memiliki validitas logika (logical validity)
apabila telah dilakukan penganalisisan secara rasional pada tes tersebut serta tes
memiliki daya daya ketepatan untuk mengukur. Adapun istilah lain dari validitas
logika adalah validitas rasional, validitas teoritik, validitas ideal atau validitas das
sollen.
Validitas rasional adalah validitas yang diperoleh atas dasar hasil
pemikiran dan dengan berpikir secara logis (Wahidmurni dalam Sudaryono,
2012). Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas
rasional, maka dapat dilakukan penelusuran dari tiga segi, yaitu dari segi isinya
(content), segi susunan atau konstruksinya (construct), segi muka (face).

6
a. Validitas Isi (Content Validity)
Validitas isi (Content Validity) adalah ketepatan suatu alat ukur ditinjau
dari isi alat ukur tersebut sehingga validitas isi juga mempunyai peran penting
untuk tes hasil belajar. Sebuah tes dikatakan memiliki validitas isi apabila
mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran dan
telah tertera pada kurikulum.
Oleh karena itu, isi atau materi dari suatu alat ukur harus sesuai dengan
apa yang telah diajarkan berdasarkan kurikulum. Validitas isi sering disebut
validitas kurikuler karena isi atau materi yang diajarkan tertera dalam kurikulum.
Menurut Sukardi (2008), validitas isi pada umumnya ditentukan melalui
pertimbangan para ahli. Tidak ada formula matematis untuk menghitung dan tidak
ada cara untuk menunjukkan secara pasti. Akan tetapi, untuk memberikan
gambaran bagaimana suatu tes divalidasi dengan menggunakan validitas isi,
pertimbangn ahli tersebut dilakukan dengan cara seperti berikut. Pertama, para
ahli diminta untuk mengamati secara cermat semua item dalam tes yang hendak
divalidasi. Kemudian mereka diminta untuk mengoreksi interpretasi item-item
yang telah dibuat. Pada akhir perbaikan, mereka juga diminta untuk memberikan
tentang bagaimana baik interpretasi tes evaluasi tersebut menggambarkan cakupan
isi yang hendak diukur. Pertimbangan ahli tersebut biasanya juga menyangkut,
apakah semua aspek yang hendak diukur telah dicakup melalui inteepretasi item
pertanyaan dalam tes. Atau dengan kata lain perbandingan dibuat antara apa yang
harus dimasukkan dengan apa yang diukur yang telah direfleksikan menjadi
tujuan tes.
b. Validitas Muka (Face Validity)
Pengertian dari validitas muka (face validity) adalah membuat keputusan
mengenai kelayakan suatu tes atau instrumen penilaian lainnya berdasarkan
penampilan, bukan kriteria objektif. Face validity didasarkan pada penilaian
terhadap format penampilan (appearance) tes, maka Sering kali face validity
dikategorikan sebagai tipe validitas yang paling rendah signifikasinya sehingga
validitas tipe ini tentu tidak menjadi hal yang perlu dirisaukan apabila suatu tes
telah terbukti valid lewat pengujian validitas tipe lain yang lebih dapat diandalkan.

7
Apabila konteks dari item-item dalam tes telah sesuai dengan tujuan yang
disebutkan oleh nama tes dan apabila pada saat penampilan tes telah meyakinkan
dan memberikan kesan mampu mengungkap apa yang hendak diukur, maka dapat
dikatakan bahwa validitas muka telah terpenuhi. Saifuddin Azwar (1992: 43)
memberikan sebuah contoh yaitu suatu tes sudah pasti dikatakan tidak valid
berdasarkan validitas muka apabila tes yang menurut namanya mengukur
kemampuan verbal, akan tetapi item-itemnya dipenuhi oleh formula matematika.
Penampilan dari suatu tes sesungguhnya cukup berdampak pada keyakinan
seseorang dalam mengerjakan item-item soalnya. Tes yang memiliki validitas
muka yang tinggi akan terlihat meyakinkan sehingga akan memancing motivasi
individu yang dites untuk menghadapi tes dengan sungguh-sungguh. Motivasi
termasuk aspek yang penting dalam prosedur pengetesan. Pembahasan validitas
muka dalam suatu tes, juga dapat menyangkut bentuk soal, baik berupa
pertanyaan, pernyataan ataupun kalimat suruhan. Dalam konteks ini, keabsahan
susunan kalimat atau kata-kata yang dipergunakan dalam soal dituntut untuk jelas
pengertiannya atau tidak menimbulkan tafsiran yang beragam. Apabila suatu soal
sulit dipahami maksudnya, yang kemudian berakibat responden tidak dapat
menjawabnya, maka ini berarti validitas muka dari tes tersebut tidak baik.
Responden bukan berarti tidak dapat menjawab soal tersebut dengan baik karena
kurangnya kemampuan, akan tetapi dalam situasi ini soal dalam tes yang kurang
dapat dipahami.
Tes yang memuat tulisan yang berdesakan, tanda baca dan notasi yang kurang
jelas, atau dicetak pada kertas yang memiliki kualitas buruk, maka dikatakan tes ini
memiliki muka yang tidak meyakinkan, sehingga tidak akan mendapat apresiasi yang
baik dari calon responden dalam mengerjakan tes. Hal ini bisa jadi membuat
responden menjawab tes secara asal-asalan, sehingga hasil tes menjadi tidak
maksimal dan berdampak pada data yang diperoleh menjadi tidak valid.
c. Validitas Konstruk (Construct Validity)
Menurut Saifuddin Azwar, validitas konstruk adalah seberapa besar derajat
tes mengukur hipotesis yang dikehendaki untuk diukur. Konstruk adalah perangai
yang tidak dapat diamati, yang menjelaskan perilaku. Menguji validitas konstruk
mencakup uji hipotesis yang dideduksi dari suatu teori yang mengajukan konstruk

8
tersebut. Suatu tes hasil belajar dinyatakan sebagai tes yang memiliki validitas
konstruk apabila tes tersebut jika ditinjau dari segi susunan, kerangka atau
rekaannya telah dapat mencerminkan suatu konstruksi dalam teori psikologis.
Tentang istilah “konsruksi dalam teori psikologis” ini perlu dijelaskan bahwa para
ahli di bidang psikologis mengemukakan teori yang menyatakan jiwa dari seorang
peserta didik itu dapat dirinci ke dalam beberapa aspek atau ranah tertentu.
Benjamin S. Bloom (dalam Sudaryono, 2012) misalnya merincinya dalam tiga
aspek kejiwaan yaitu aspek kognitif, aspek afektif, dan aspek psikomotorik.
Validitas konstruk juga dikenal dengan istilah validitas susunan. Namun
istilah susunan yang dimaksudkan bukanlah dilihat dari susunan kalimat soal atau
urutan nomor butir soal, melainkan bahwa tes tersebut secara tepat telah mengukur
aspek perkembangan peserta didik, seperti aspek kognitif, afektif, psikomotor,
sebagaimana yang telah ditentukan dalam indikator pencapaian pembelajaran.
Penganalisisan validitas konstruk dari suatu tes hasil belajar dapat dilakukan dengan
jalan melakukan pencocokan antara aspek-aspek berpikir yang terkandung dalam tes
hasil belajar tersebut, dengan aspek-aspek berpikir yang dikehendaki untuk diungkap
oleh indikator pencapaian dalam pembelajaran. Dengan demikian seperti halnya pada
penganalisisan validitas isi, kegiatan menganalisis validitas konstruk dilakukan secara
rasional, dengan berpikir kritis atau menggunakan logika. Jika secara logis atau
secara rasional menunjukkan bahwa aspek-aspek berpikir yang diungkap sudah
secara tepat mencerminkan aspek-aspek berpikir yang dikehendaki, maka tes hasil
belajar dapat dinyatakan sebagai tes yang valid dari segi susunannya, atau telah
memiliki validitas konstruk.
Contohnya, jika kita akan membuat tes matematika untuk mahasiswa fakultas
ekonomi, maka soal-soal matematika itu harus diusahakan memuat masalah ekonomi.
Soal matematika untuk calon pilot pesawat terbang harus memuat masalah
kedirgantaraan. Soal matematika untuk calon dokter harus memuat masalah kesehatan
dan sebagainya. Sebaliknya jika soal matematika untuk calon mahasiswa ekonomi
banyak berisi permasalahan teknik, pertanian, atau kesehatan, maka soal tersebut
validitas konstruksinya tidak baik. Jadi, validitas konstruksi dapat dikatakan sebagai
kesesuaian materi dalam alat evaluasi itu dengan tujuan evaluasi yang bersangkutan.

9
2. Validitas Empiris (Empirical Validity)
Validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil
analisis yang bersifat empirik. Menurut Djaali dan Mulyono (dalam Sudaryono,
2012) validitas empirik atau validitas kriteria suatu tes ditentukan berdasarkan
data hasil ukur instrumen yang bersangkutan, baik melalui uji coba atau yang
ditentukan berdasarkan kriteria. Dengan kata lain, validitas empirik adalah
validitas yang bersumber atau diperoleh atas dasar pengamatan di lapangan.
Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik
atau belum, dapat dilakukan penelusuran dari dua segi yaitu dari segi daya
ketepatan meramalnya (predictive validity) dan dari segi daya ketepatan
bandingannya (concurrent validity).
a. Validitas Ramalan atau Validitas Prediksi ( Predictive Validity)
Validitas ramalan adalah suatu kondisi yang menunjukan seberapa jauhkah
sebuah tes dapat dengan tepat menunjukan kemampuannya untuk meramalkan
apa yang akan terjadi pada masa mendatang. Dapat diartikan pula menunjukkan
adanya hubungan antara tes skor yang diperoleh, dengan keadaan yang akan
terjadi di waktu yang akan datang.
Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes
yang telah memiliki validitas ramalan atau belum, dapat ditempuh dengan cara
mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya
dengan kriteria tertentu, jika kedua variabel tersebut terdapat korelasi positif yang
signifikan, maka tes hasil belajar yang sedang diuji validitas ramalannya dapat
dinyatakan sebagai tes hasil belajar yang telah memiliki daya ramalan yang tepat,
artinya apa yang diramalkan tersebut benar-benar terjadi secara nyata dalam
praktek.
Contoh sederhana, yaitu terjadi pada penerimaan mahasiswa baru
berdasarkan hasil tes seleksi setelah mereka lulus SMA. Peserta tes yang memiliki
nilai yang bagus di tes seleksi tersebut, lalu diterima diperguruan tinggi, maka
diperkirakan akan berhasil ketika mereka belajar di perguruan tinggi. Apabila hal
itu terjadi, maka tes masuk perguruan tinggi dikatakan memiliki validitas prediksi
yang baik. Sebaliknya, apabila hasil belajar siswa setelah di perguruan tinggi
kurang baik, maka tes seleksi yang dimaksud tidak memiliki validitas yang baik.

10
Untuk menentukan validitas ramalan, dapat digunakan alat pembanding
berupa nilai-nilai yang diperoleh dari hasil perkuliahan. Jika nilai tes seleksi
masuk perguruan tinggi dan nilai hasil perkuliahan berkorelasi tinggi, berarti
validitas prediksi tes tersebut adalah tinggi. Sebaliknya, jika berkorelasi rendah
atau sama sekali tidak berkorelasi, bahkan berkorelasi negatif, maka ini berarti
validitas prediksi tes seleksi masuk perguruan tinggi tersebut adalah tidak baik.
b. Validitas Bandingan atau Validitas Konkuren (Concurrent Validity).
Suatu tes sebagai alat pengukur dikatakan memiliki validitas bandingan
apabila dalam kurun waktu yang sama, dengan tepat telah mampu menunjukkan
adanya hubungan searah antara tes pertama dengan tes berikutnya. Validitas
bandingan juga dikenal dengan istilah validitas pengalaman atau validitas ada
sekarang. Dikatakan validitas pengalaman karena validitas tes tersebut ditentukan
atas dasar pengalaman yang telah diperoleh. Sedangkan dikatakan validitas ada
sekarang, sebab validitas itu dikaitkan dengan hal-hal yang telah ada, sehingga
data mengenai pengalaman masa lalu itu pada saat sekarang ini sudah berada
ditangan.
Dalam rangka menguji validitas bandingan, data yang mencerminkan
pengalaman yang diperoleh pada masa lalu itu, kita bandingkan dengan hasil tes
yang diperoleh sekarang ini. Jika hasil tes yang ada sekarang ini mempunyai
hubungan searah dengan hasil tes berdasarkan pengalaman yang lalu, maka tes
yang memiliki karakteristik seperti itu dapat dikatakan telah memiliki validitas
bandingan menurut Sudijono (dalam Sudaryono, 2012).
Seperti halnya validitas ramalan, maka untuk dapat mengetahui ada atau
tidaknya hubungan searah antara tes pertama dengan tes berikutnya, dapat
digunakan teknik analisis korelasi yaitu analisis korelasi product moment. Jika
korelasi variabel X (tes pertama) dengan variabel Y (tes berikutnya) adalah
positif, maka tes tersebut dapat dinyatakan sebagai tes yang telah memiliki
validitas bandingan.
Misalnya alat evaluasi yang diselidiki validitasnya adalah tes matematika
buatan guru. Adapun kriterium yang dipergunakan adalah nilai rata-rata harian
atau nilai tes akhir semester yang telah ada sebelumnya, dengan asumsi hasil
evaluasi yang digunakan untuk kriterium itu telah mencerminkan kemampuan

11
siswa sebenarnya. Hal ini dilakukan berhubung tes matematika yang telah
dibakukan belum ada. Kedua tes diberikan kepada subjek (siswa) yang sama.
Apabila kedua nilai atau skor itu berkolerasi tinggi, maka tes buatan guru tersebut
memiliki validitas yang tinggi pula. Sebaliknya apabila tidak terdapat korelasi
atau korelasinya rendah maka tes yang dibuat mempunyai validitas yang buruk.
2.3 Menentukan Validitas Alat Ukur
Tingkat dari suatu validitas dapat dilakukan dengan menghitung koefisien
korelasi antara alat ukur yang akan dicari validitasnya denan alat ukur yang telah
ada sebelumnya. Asumsikan bahwa alat ukur yang telah ada sebelumnya memiliki
validitas yang tinggi (baik), sehingga hasil evaluasi yang digunakan sebagai
kriteria itu telah mencerminkan kemampuan siswa sebenarnya. Alat ukur yang
sering dijadikan sebagai alat evaluasi kemampuan siswa adalah berupa soal atau
tes. Teknik pengukuran dilakukan untuk menentukan validitas alat ukur tersebut.
Menurut Pearson, teknik yang biasanya digunakan adalah teknik korelasi product
moment.
Rumus korelasi Product Moment menurut Pearson ada 2 yaitu Korelasi
product moment dengan simpangan dan korelasi product moment dengan angka
kasar.
a. Rumus korelasi product moment dengan simpangan adalah sebagai
berikut.

rxy 
 xy
 x  y 
2 2

Keterangan :
= Koefisien korelasi antara variabel X dan Y.
= deviasi dari mean untuk nilai variabel X
= deviasi dari mean untuk nilai variabel Y
= jumlah perkalian antara nilai X dan Y
= Kuadrat dari nilai
= Kuadrat dari nilai y

12
b. Korelasi Product moment dengan Angka Kasar
Rumus korelasi product moment dengan angka kasar adalah sebagai
berikut.
N  XY   X  Y 
rXY 
N  X 2

  X  N  Y 2   Y 
2 2

Keterangan:
rXY = koefisien korelasi antara variabel X dan variabel Y, dua variabel

yang dikorelasikan ( x  X  X dan y  Y  Y )

 xy = jumlah perkalian x dengan y

x2 = kuadrat dari x
y2 = kuadrat dari y
N = banyak subjek
Contoh:

Salah satu dosen dijurusan Pendidikan Matematika ingin mencari


koefisien korelasi antara nilai Evaluasi Pendidikan (X) dan Micro
Teaching (Y) kelas A yang diperoleh mahasiswa.
Tabel 2.1 Korelasi Product Moment dengan Simpangan
Nama X- Y-
X Y
Mahasiswa y
A 6.9 8.3 -0.1 -2.0 0.0 4.0 0,2
B 7.8 8.6 0.8 -1.7 0.6 2.9 -1.4
C 7.5 7.7 0.5 -2.6 0.3 6.8 -1.3
D 7.0 7.5 0.0 -2.8 0.0 7.8 0.0
E 6.5 8.0 -0.5 -2.3 0.3 5.3 1.1
F 7.5 8.5 0.5 -1.8 0.3 3.2 -0,9
G 5.5 7.7 -1,5 -2.6 2,3 6.8 3.9
H 6.7 8.0 -0,3 -2.3 0,0 5.3 0.7
I 7.0 7.5 0.0 -2.8 0,1 7.8 0.0
J 7.6 7.0 0,6 -3.3 0,4 10.9 -2

13
Nama X- Y-
X Y
Mahasiswa y
Jumlah 70.0 78.8 - - 4.3 60.8 0.3
Rata-rata 7.0 7.88 - - - - -

X 
 x  70.0  7.0 Y
 y  78.8  7.88
N 10 N 10

xX X y  Y Y

rxy 
 xy
 x  y 
2 2

0.3
rxy 
(4.3)(60.8)
rxy  0.026

Bilangan 0.026 ini merupakan angka korelasi antara nilai mata kuliah Evaluasi
Matematika dengan Micro Teaching yang diperoleh mahasiswa melalui
korelasi produk moment dengan simpangan.
Tabel 2.2 Korelasi Product Moment dengan Angka Kasar

Nama
X Y X2 Y2 XY
Mahasiswa

A 6.9 8.3 47.61 68.89 57.27


B 7.8 8.6 60.84 73.96 67.08
C 7.5 7.7 56.25 59.29 57.75
D 7.0 7.5 49.00 56.25 52.50
E 6.5 8.0 42.25 64.00 52.00
F 7.5 8.5 56.25 72.25 63.75
G 5.5 7.7 30.25 59.29 42.35
H 6.7 8.0 44.89 64.00 53.60
I 7.0 7.5 49.00 56.25 52.50
J 7.6 7.0 57.76 49.00 53.20

14
Nama
X Y X2 Y2 XY
Mahasiswa

Jumlah 70.0 78.8 594.1 623.18 552


Rata-rata 7.0 7.88 - - -

N  XY   X  Y 
rXY 
N  X 2

  X  N  Y 2   Y 
2 2

(10)(552 )  (70.0)(78.8)
rXY 
(10)(594.1)  (4900 )(10)(623.18)  (6209 .44)
5520  5516
rXY 
23276 .76
4
rXY 
152 .57
rXY  0.026
Bilangan 0.026 ini merupakan angka korelasi antara nilai mata kuliah
Evaluasi Pendidikan dengan Micro Teaching yang diperoleh mahasiswa
melalui korelasi produk moment dengan angka kasar.
Korelasi product moment simpangan dan angka kasar seperti pada
perhitungan contoh diatas menghasilkan hasil berupa koefisien korelasi yang
sama yaitu 0,026. Kedua teknik tersebut bisa saja menghasilkan angka atau
hasil yang relatif berbeda, namun perbedaan itu umumnya tidak terlalu
signifikan.
Untuk menafsirkan harga korelasi diatas, maka terdapat dua cara yang
dapat dipergunakan yaitu:
1. Mencocokkan nilai koefisen korelasi hasil perhitungan dengan kriteria
korelasi.
2. Mengkonsultasikan nilai koefisien korelasi ke tabel harga kritis r product
moment. Korelasi signifikan jika rxy > harga kritis tabel. Sedangkan jika

harga rxy < harga kritis tabel berarti korelasi tidak signifikan.

15
Interpretasi mengenai besarnya koefisien korelasi ada dua cara, yaitu
dengan kasar atau sederhana dan dengan berkonsultasi dengan Tabel Nilai r
Product Moment. Hasil perhitungan korelasi pada dasarnya dapat
dikelompokkan menjadi 3 kelompok besar:
1. Korelasi positif kuat, apabila hasil perhitungan korelasi mendekati +1. Ini
berarti bahwa setiap setiap kenaikan skor/nilai pada variabel X akan
diikuti dengan kenaikan skor/nilai variabel Y. Sebaliknya, jika variabel X
mengalami penurunan, maka akan diikuti dengan penurunan variabel Y.
2. Korelasi negatif kuat, apabila hasil perhitungan korelasi mendekati -1 atau
sama dengan -1. Ini berarti bahwa setiap kenaikan skor/nilai pada variabel
X akan diikuti dengan penurunan skor/nilai variabel Y. Sebaliknya,
apabila skor/nilai dari variabel X turun, maka skor/nilai dari variabel Y
akan naik.
3. Tidak ada korelasi, apabila hasil perhitungan korelasi( mendekati 0 atau
sama dengan 0). Hal ini berarti bahwa naik turunnya skor/nilai satu
variabel tidak mempunyai kaitan dengan naik turunnya skor/nilai variabel
yang lainnya. Apabila skor/nilai variabel X naik, maka tidak selalu diikuti
dengan naik atau turunnya skor/nilai variabel Y. Demikian juga
sebaliknya.

Dalam Sumarna Surapranata (2004: 59), mencantumkan interpretasi yang


lebih rinci mengenai nilai rxy dalam kriteria korelasi. Adapun nilai rxy dibagi ke

dalam kriteria seperti tabel berikut ini.

Tabel 2.3 Makna koefisien korelasi product moment


Angka Korelasi Makna
0,80  rxy  1,00 Sangat tinggi

0,60  rxy  0,80 Tinggi

0,40  rxy  0,60 Cukup

0,20  rxy  0,40 Rendah

16
Angka Korelasi Makna
0,00  rxy  0,20 Sangat Rendah

Sedangkan untuk menentukan tingkat (derajat) validitas alat evaluasi dapat


digunakan kriteria di atas. Dalam hal ini, koefisien korelasi menunjukkan kriteria
validitas dari tes tersebut. Dalam Suherman (1993: 136) diberikan tabel makna
koefisien validitas sebagai berikut.
Tabel 2.4 Makna koefisien validitas
rxy Makna

0,80  rxy  1,00 Sangat tinggi

0,60  rxy  0,80 Tinggi

0,40  rxy  0,60 Sedang

0,20  rxy  0,40 Rendah

0,00  rxy  0,20 Sangat Rendah

rxy  0 Tidak Valid

Sehingga pada contoh soal diatas diperoleh koefisien validitasnya adalah


0.026, yang berarti termasuk kategori tes dengan validitas sangat rendah. Harus
diingat bahwa koefisien validitas yang dibicarakan tersebut adalah validitas soal
(tes) secara keseluruhan atau validitas perangkat tes. Validitas ini berkenaan
dengan skor total dari seluruh butir soal yang dikorelasikan dengan kriterium yang
dianggap valid.

2.4 Validitas Butir Soal atau Validitas Item


Validitas tes atau alat ukur sangat penting seperti yang dijelaskan
sebelumnya. Selain mencari validitas tes, validitas item atau butir soal juga
penting. Apabila yang telah dibuat memiliki validitas yang rendah maka perlu
untuk mengetaui butir-butir soal yang menyebabkan tes tersebut bervaliditas
rendah. Pengukuran validitas butir soal bertujuan untuk menentukan dapat
tidaknya suatu soal tersebut membedakan kelompok dalam aspek yang diukur

17
sesuai dengan perbedaan yang ada dalam kelompok itu. Validitas butir soal adalah
indeks atau tingkat diskriminasi yang membedakan antara peserta tes yang
berkemampuan tinggi dengan peserta tes yang berkemampuan rendah. Indeks ini
menunjukkan kesesuaian antara fungsi soal dengan fungsi tes secara keseluruhan.
Dengan demikian, validitas butir soal ini sama dengan daya pembeda soal yaitu
daya dalam membedakan antara peserta tes yang berkemampuan tinggi dengan
peserta tes yang berkemampuan rendah.
Item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor
total. Skor pada item menyebabkan skor total menjadi tinggi atau rendah,
sehingga sebuah item dapat memiliki validitas yang tinggi apabila skor pada item
mempunyai korelasi dengan skor total. Rumus yang digunakan untuk mengetahui
validitas item adalah rumus korelasi.
Apabila butir-butir soal yang ada pada suatu tes sudah valid maka dapat
dikatan tes tersebut valid. Berdasarkan penjelasan sebelumnya, ada dua macam
validitas yaitu validitas teoritik (isi dan perilaku) dan validitas empirik. Validitas
empirik butir soal dihitung dengan cara statistik korelasi. Adapun validitas butir
soal objektif dihitung dengan rumus korelasi point biserial, sedangkan validitas
butir soal uraian dihitung dengan rumus korelasi product moment. Angka korelasi
yang diperoleh dengan cara demikian disebut koefisien validitas atau angka
validitas butir soal. Koefisien korelasi tersebut biasanya berkisar antara -1 sampai
+1, karena dalam perhitungan sering dilakukan pembulatan angka-angka, maka
memungkinkan diperolehnya koefisien lebih dari 1. Tanda negatif pada koefisien
korelasi menunjukkan bahwa peserta tes yang kemampuannya rendah dapat
menjawab soal dengan benar, sedangkan peserta tes yang memiliki kemampuan
tinggi menjawab soal dengan salah. Dengan demikian, validitas yang negatif
menunjukkan bahwa butir soal membedakan kelompok tes secara terbalik.
Penganalisisan butir soal atau tes biasanya dilakukan dengan menghitung
koefisien korelasi antara skor butir dengan skor total sehingga memperoleh r hitung.
Setelah itu bandingkan rhitung dengan nilai kritis yaitu rtabel yang memenuhi kriteria
sebagai berikut:
1. Butir soal dinyatakan valid jika rhitung > rtabel
2. Butir soal dinyatakan tidak valid jika rhitung < rtabel

18
a. Validitas Butir Soal Objektif
Variabel butir soal objektif bersifat dikotomi sedangkan variabel skor total
atau sub skor total bersifat kontinu. Variabel butir soal dikatakan dikotomi karena
skor-skor yang terdapat pada setiap butir soal diberikan dengan skor satu atau nol.
Dimana soal yang benar diberi angka satu (1) dan yang salah diberi angka nol (0).
Variabel skor total atau sub total peserta tes bersifat kontinu atau nondikotomi
yang diperoleh dari jumlah jawaban yang benar.
Menurut Sudaryono (2012: 149) yang menyatakan bahwa apabila variabel
I merupakan data dikotomik, sedangkan variabel II berupa data kontinu maka
teknik korelasi yang tepat digunakan dalam mencari korelasi antara variabel I dan
variabel II adalah teknik korelasi point biserial (  pbi ). Korelasi point biserial

adalah korelasi product moment yang diterapkan pada data, dimana variabel-
variabel yang dikorelasikan sifatnya masing-masing berbeda satu sama lain.
Validitas butir soal objektif dihitung dengan rumus korelasi point biserial
antar masing-masing skor butir soal (Xp) dengan skor total (Xt). Adapun rumus
point biserial yang digunakan adalah sebagai berikut.
M p  Mt p
 pbi =
St q

Keterangan:
 pbi = Koefisien korelasi point biserial

Mp = Rata-rata skor dari subyek, dimana butir soal yang dimaksud telah
dijawab dengan benar
Mt = Rata-rata skor total
St = Standar deviasi dari skor total
p = Proporsi siswa yang menjawab benar
 banyaknya siswa menjawab benar 
 p  
 jumlah seluruh siswa 
q = Proporsi siswa yang menjawab salah (q = l – p)

19
Tabel 2.5 Analisis item untuk perhitungan validitas item
No Butir soal/item Skor
Nama
. 1 2 3 4 5 6 7 8 9 10 Total
1. A 1 1 0 0 1 1 1 1 0 1 7
2. B 1 1 1 0 1 1 0 1 1 1 8
3. C 0 1 0 1 0 1 0 1 0 1 5
4. D 1 0 0 1 1 1 1 0 1 0 6
5 E 1 1 1 1 1 1 0 0 1 0 7
6. F 1 0 1 0 1 0 1 0 1 1 6
7. G 1 1 0 1 0 0 1 0 0 0 4
8. H 0 1 1 1 0 1 1 1 0 1 7

Misalnya akan dihitung validitas item nomor 4, maka skor item tersebut
disebut variabel X dan skor total disebut variabel Y.
Contoh perhitungan mencari validitas item objektif
Untuk menghitung validitas item nomor 4, dibuat terlebih dahulu tabel
persiapannya sebagai berikut.

Tabel 2.6 Persiapan untuk menghitung validitas item nomor 4


No. Nama X Y
1. A 0 7
2, B 0 8
3. C 1 5
4. D 1 6
5. E 1 7
6. F 0 6
7. G 1 4
8. H 1 7
Apabila item nomor 4 tersebut dicari validitasnya dengan rumus ini
maka perhitungannya melalui langkah sebagai berikut:

20
5  6  7  4  7 29
1. Mencari Mp =   5.8
5 5
7  8  5  6  7  6  4  7 50
2. Mencari Mt =   6.25
8 8
3. Diperoleh harga standar deviasi yaitu  n = 1,696

( Y ) 2
Y 2

N
SD 
N
2
324  50 
SD   
8  8 
SD  40.5  39,0625
SD  1.4375
SD  1,198957881
5
4. Menentukan harga p, yaitu = 0,625
8
5. Menentukan harga q, yaitu 1 – 0,625 = 0,375
6. Menentukan ke rumus

M p  Mt p
 pbi =
St q

5.8  6.25 0,625


=
1,198957881 0,375
 0.45
= .1,29
1,198957881
= -0,4842
Berdasarkan perhitungan diatas diperoleh koefisien korelasi adalah -
0.4842. Dengan taraf signifikan 5% dan N=8, maka diperoleh nilai dari r tabel
adalah 0.7067. Dengan demikian hal ini berarti r hitung < rtabel , sehingga diperoleh
kesimpulan bahwa butir soal dinyatakan tidak valid.
Dilihat secara sepintas bilangan -0.4842 ini dirasa mampu mewakili
kenyataannya. Hal ini dapat diketahui dari skor-skor yang tertera, baik pada skor
item maupun skor total. Siswa G yang hanya memiliki skor total 4 dapat
memperoleh skor 1 pada item, sedangkan siswa A dan E yang mempunyai skor

21
total sama yaitu 7 skor, namun pada skor item tidak sama. Dapat disimpulkan
hasil tersebut maka validitas butir soal dirasa kurang meyakinkan.
b. Validitas Butir Soal Uraian
Validitas butir soal uraian dihitung dengan rumus product moment, antara
skor butir soal (Xp) dengan skor total (Xt). Dipakainya rumus product moment ini
karena data yang dikorelasikan adalah data interval dengan data interval seringkali
digunakan kisaran skor antara 1 sampai 5 untuk setiap butirnya.
Contoh:
Dalam suatu kelas yang terdiri dari 15 siswa, guru memberikan tes matematika
yang terdiri dari 10 butir soal uraian. Setelah tes berakhir, guru tersebut ingin
mengetahui bagaimana validitas butir soal nomor 1 (X) melalui skor (Y) yang
diperoleh siswa. Berikut tabel skor yang diperoleh oleh siswa dari hasil tes uraian
tersebut.
Tabel 2.7 Analisis item untuk perhitungan validitas soal uraian
No Skor Butir Skor
Siswa 1 2 3 4 5 6 7 8 9 10 Total
1 4 4 3 2 3 3 2 2 4 3 30
2 3 4 4 3 2 4 3 3 4 4 34
3 3 4 3 2 3 4 4 2 3 2 29
4 3 2 2 3 4 4 3 1 3 3 28
5 4 4 4 4 2 3 2 4 4 3 34
6 3 4 2 4 4 3 3 1 4 3 27
7 4 3 2 4 2 2 3 1 4 3 28
8 4 4 2 3 4 3 4 1 4 4 33
9 5 4 4 3 3 3 2 2 3 2 31
10 4 3 2 4 4 4 3 2 1 4 31
11 3 4 4 4 2 4 3 4 3 3 34
12 4 3 3 2 4 4 4 1 4 1 30
13 4 3 2 3 4 3 3 3 1 2 28
14 3 4 3 2 3 4 3 2 3 3 30
15 4 3 4 4 2 3 4 3 1 2 30

22
Tabel 2.8 Persiapan untuk menghitung validitas butir soal uraian nomor 1
Skor Skor
No
Butir Total XY X2 Y2
Siswa
(X) (Y)
1 4 30 120 16 900
2 3 34 102 9 1156
3 3 29 87 9 841
4 3 28 84 9 784
5 4 34 136 16 1156
6 3 27 81 9 729
7 4 28 112 16 784
8 4 33 132 16 1089
9 5 31 155 25 961
10 4 31 124 16 961
11 3 34 102 9 1156
12 4 30 120 16 900
13 4 28 112 16 784
14 3 30 90 9 900
15 4 30 120 16 900
Jumlah 55 457 1677 207 14001

Data di atas substitusikan ke dalam rumus korelasi product moment


dengan angka kasar sebagai berikut:
N  XY   X  Y 
N  X  
rxy =
  X  N  Y 2   Y 
2 2 2

(15)(1677 )  (55)( 457 )


(15)(207)  55 15(14001)  (457) 
=
2 2

25155  25135
=
3105  3025 210015  208849 
20
=
80  1166

23
20
=
93280
20
=
305.417
= 0,065
Berdasarkan hasil diatas, maka diperoleh hasil dari r hitung adalah 0,065.
Jika dibandingkan dengan rtabel dengan N=15 dan  = 0.05 maka diperoleh
rtabel = 0.514 . Sehingga diperoleh rhitung < rtabel . Dengan demikian, itu berarti
hasil uji menunjukkan bahwa butir soal nomor 1 adalah tidak valid. Rumus
ini berlaku pula untuk mencari validitas dari butir soal lainnya.

2.5 Faktor-Faktor Yang Mempengaruhi Validitas


Beberapa faktor yang mempengaruhi validitas secara garis besar dapat
dibedakan menurut sumbernya, yaitu faktor internal dari tes, faktor eksternal
tes, dan faktor yang berasal dari siswa yang bersangkutan.
1. Faktor yang berasal dari dalam tes
Beberapa hal yang mempengaruhi validitas yang pada umumnya
berasal dari faktor internal tes evaluasi diantaranya adalah sebagai berikut.
a. Pernyataan atau arahan yang kurang jelas maknanya atau bisa
ditafsirkan dengan makna lain sehingga dapat membingungkan testi.
Testi menjawab salah bukan karena tidak memahami konsep dalam
soal, tetapi karena ketidakjelasan soal tersebut.
b. Kata-kata yang digunakan dalam struktur instrumen evaluasi yang
terlalu sulit. Terlalu banyak menggunakan kata-kata yang kurang
dikenal dan struktur kalimat yang berbelit-belit akan lebih mengukur
kemampuan berbahasa atau aspek intelegensi daripada tingkah laku
testi dalam aspek tertentu, misalnya matematika atau materi pelajaran
lainnya. Oleh karena itu dapat mengurangi validitasnya.
c. Penyajian soal-soal yang sukar akan mengakibatkan hasil yang jelek
bagi kebanyakan ataupun semua testi, sebaliknya penyajian soal yang
sangat mudah akan mengakibatkan semua atau kebanyakan testi
mendapat nilai baik. Hal ini tidak dapat membedakan kemampuan

24
siswa yang satu dengan yang lainnya. Dengan perkataan lain
kemampuan siswa dalam aspek tertentu tidak terungkap sesuai dengan
keadaan sebenarnya, oleh karena itu validitasnya rendah.
d. Jumlah item tes yang terlalu sedikit, maka bisa jadi tidak mewakili
sampel materi pembelajaran.
e. Jawaban masing-masing item evaluasi bisa diprediksi siswa. Biasanya
terjadi pada soal tipe objektif, seringkali kalimat yang disajikan
memberi petunjuk pada jawaban yang benar atau yang tidak benar,
sehingga jawaban mudah ditebak tanpa harus memahami konsep yang
terkandung dalam soal itu.
f. Penyajian soal hendaknya disusun dari yang mudah menuju pada soal-
soal yang sukar. Penempatan soal-soal yang sukar pada nomor-nomor
awal akan menyebabkan testi menghabiskan banyak waktu dan energi
untuk menjawab soal itu saja, sehingga untuk mengerjakan soal
lainnya testi sudah lelah dan waktu yang dimiliki sedikit sehingga testi
bisa saja gugup dalam mengerjakan soal-soal selanjutnya.
2. Faktor eksternal test yang berasal dari administrasi dan skor
Faktor ini dapat mengurangi validitas interpretasi tes evaluasi,
khususnya tes evaluasi yang dibuat oleh guru. Berikut beberapa contoh
faktor yang sumbernya berasal dari proses administrasi dan skor:
a. Waktu pengerjaan tidak cukup sehingga siswa dalam memberikan
jawaban dalam situasi yang tergesa-gesa;
b. Adanya kecurangan dalam tes sehingga tidak bisa membedakan antara
siswa yang belajar dengan yang melakukan kecurangan;
c. Teknik pemberian skor yang tidak konsisten, misalnya pada tes esai
juga dapat mengurangi validitas tes evaluasi;
d. Siswa tidak dapat mengikuti arahan yang diberikan dalam tes baku;
e. Adanya joki (orang lain bukan siswa) yang masuk dan menjawab item
tes yang diberikan.
3. Faktor-faktor yang berasal dari jawaban siswa
Seringkali terjadi bahwa item-item tes evaluasi tidak valid karena
dipengaruhi oleh jawaban siswa daripada interpretasi item-item pada tes

25
evaluasi itu sendiri. Sebagai contoh: sebelum tes para siswa menjadi
tegang karena guru pengampu mata pelajaran dikenal “killer”, galak, dan
sebagainya sehingga siswa yang ikut tes banyak yang gagal.

2.6 Reliabilitas
Realibilitas yang berasal dari kata reliability berarti sejauh mana hasil
suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat dipercaya
apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subjek
yang sama, diperoleh hasil pengukuran yang relatif sama, selama aspek yang
diukur dalam diri subjek memang belum berubah (Sudaryono, Gaguk M. ,
Wardani R. , 2013 ; 120). Nunnaly (1970), Allen dan Yen (1979), dan Anastasi
(1986) menyatakan bahwa reliabilitas adalah kestabilan skor yang diperoleh orang
yang sama ketika diuji ulang dengan tes yang sama pada situasi yang berbeda atau
dari satu pengukuran ke pengukuran lainnya. Jadi reliabilitas dapat dinyatakan
sebagai tingkat keajegan atau kemantapan hasil dari hasil dua pengukuran
terhadap hal yang sama. Hasil pengukuran itu diharapkan akan sama apabila
pengukuran itu diulangi. Hasil pengukuran itu harus relatif sama jika
pengukurannya diberikan pada subjek yang sama meskipun dilakukan oleh yang
berbeda, waktu yang berbeda dan tempat yang berbeda pula (tidak terpengaruh
situasi dan kondisi). Alat ukur yang reliabilitasnya tinggi disebut alat ukur yang
reliabel.
Instrumen yang baik adalah instrumen yang dapat dengan tetap
memberikan data yang sesuai dengan kenyataan (Arikunto, Suharsimi, 2007).
Tetap yang dimaksud tidak selalu harus sama, tetapi mengalami perubahan yang
tidak berarti (tidak signifikan) dan bisa diabaikan. Perubahan hasil evaluasi ini
disebabkan adanya unsur pengalaman dari peserta tes dan kondisi lainnya.
Misalnya keadaan si A mula-mula lebih rendah dibandingkan dengan B, maka
jika diadakan pengukuran ulang, si A juga berada berada lebih rendah dari B.
Itulah yang dikatakan tetap, yaitu sama dalam kedudukan siswa di antara anggota
kelompok yang lain. Tentunya tidak dituntut semuanya tetap. Besarnya ketetapan
itulah yang menunjukkan tingginya reliabilitas instrumen. Allen & Yen (1979: 62)

26
menyatakan bahwa tes dikatakan reliabel jika skor amatan mempunyai korelasi
yang tinggi dengan skor yang sebenarnya.

2.6.1 Koefisien Reliabilitas


Koefisien reliabilitas dapat diartikan sebagai koefisien keajegan atau
kestabilan hasil pengukuran. Alat ukur yang reliabel adalah alat ukur yang mampu
membuahkan hasil pengukuran yang stabil (Lawrence, 1994) dan konsisten
(Mehrens & Lehmann, 1973: 102). Artinya suatu alat ukur dikatakan memiliki
koefisien reliabilitas tinggi manakala digunakan untuk mengukur hal yang sama
pada waktu berbeda hasilnya sama atau mendekati sama. Dalam hal ini,
reliabilitas merupakan sifat dari sekumpulan dari skor (Frisbie, 2005).
Koefisien reliabilitas yang menyatakan derajat keberadaan alat evaluasi
dinyatakan dengan . Tolak ukur untuk mempersatukan derajat reliabilitas alat
evaluasi oleh J.P. Guiford (1956: 145) diberikan sebagai berikut:

: derajat reliabilitas sangat rendah


: derajat reliabilitas rendah
: derajat reliabilitas sedang
: derajat reliabilitas tinggi
: derajat reliabilitas sangat tinggi

Berikut ini akan dibahas mengenai cara-cara menemukan koefisien


reliabilitas, yaitu berkenaan dengan tes ulang (test retest), dan tes paralel
(alternative test) dengan menggunakan formula produk momen. Selain itu,
dikenalkan pula pendekatan pendekatan tes tungggal (single test) dengan teknik
belah dua yang menggunakan formula Spearman-Brown, Flanagan, Rulon dan
teknik non belah dua yang menggunakan formula kadar-Richardson dan Anave
Hoyt.

27
2.7 Cara-Cara Menentukan Realibilitas pada Tes
Dalam Tes hasil belajar terdapat dua jenis yaitu tes hasil belajar bentuk
objektif dan tes hasil belajar bentuk uraian (Arikunto, Suharsimi, 2007). Berikut
akan dijelaskan cara-cara menentukan realibilitas pada kedua jenis tes tersebut.

2.7.1 Menentukan Reliabilitas Tes Objektif


Ada tiga tes yang digunakan untuk mementukan reliabilitas pada tes
objektif, yaitu sebagai berikut.
a. Test-Retest Method
Metode tes ulang atau test-retest method sering pula dinamakan single-
test-double-trial dimana metode ini dilakukan untuk menghindari penyusunan dua
seri tes. Dalam metode ini pengetes hanya membutuhkan satu seri soal namum
dicobakan dua kali. Dengan menggunakan teknik ini akan dihasilkan indeks
stabilitas. Indeks stabilitas ini diperoleh dengan menggunakan satu perangkat tes
untuk mengetes sekelompok subjek yang sama pada dua kesempatan yang
berbeda tersebut. Kemudian hasil kedua tes tersebut dihitung korelasinya.
Penggunaan cara ini didasarkan pada asumsi bahwa obyek yang diukur memiliki
sifat homogen dan stabil, artinya pengetahuan siswa tidak akan berubah dalam
waktu tertentu, sehingga bilamana dilakukan dua kali tes atau lebih dengan alat
ukur yang sama hasilnya relatif sama (Dantes, 2012). Kekurangan metode ini
adalah pada saat tes dilakukan pada tenggang waktu yang sempit antara tes
pertama dan kedua maka tercoba akan masih ingat terhadap butir-butir soalnya.
Namun apabila tenggang waktunya terlalu lama maka kondisi-kondisi dan faktor-
faktor tes akan berbeda. Sehingga mempengaruhi tingkat reliabilitas. Pada
umumnya tes yang kedua cenderung lebih baik daripada tes yang pertama namun
yang terpenting adalah adanya ketetapan hasil yang dialami oleh semua siswa
(Arikunto, Suharsimi, 2007).
Adapun langkah yang dapat ditempuh pada uji reabilitas ini sebagai berikut :
1) Menyusun sebuah tes yang akan diukur reliabilitasnya
2) Menguji tes yang tersusun tersebut ( tahap I)
3) Menghitung skor hasil tes tahap I
4) Mengujikan ulang tes yang tersusun tersebut (tahap II)

28
5) Menghitung skor hasil tes ulang (tahap II)
6) Menghitung reliabilitas tes tersebut dengan jalan mengkorelasikan skor tes I
dengan skor tes II. Untuk mencari korelasinya dapat digunakan teknik
korelasi rank – order (teknik korelasi tata jenjang) dari Spearman, dengan
menggunakan rumus:
6 D 2
 1

N N 2 1 
Dimana :
 (baca : rho) = Koefisien korelasi antara variabel I (skor-skor hasil
tes I) dengan variabel II (skor-skor hasil tes II).
D = Difference (beda antara rank variabel I dengan rank
variabel II), atau: D = RI – RII.
N = Banyaknya Subyek

Setelah didapat maka dapat dibandingkan antara  yang telah


dihitung (  observasi ) dengan  tabel yang dicari dengan cara melihat pada
tabel nilai rho, dengan menggunakan derajat kebebasan (db) = N dan taraf
signifikan 5 % atau 1 %. Jika setelah dibandingkan antara  observasi dengan
 tabel ternyata  observasi >  tabel , maka dapat disimpulkan hipotesis nol
ditolak, dengan hipotesis nol : “Tidak terdapat korelasi positif yang
signifikan antara hasil tes I dengan hasil tes II”. Dengan demikian
kesimpulan antara tes pertama dengan tes kedua terdapat korelasi positif
yang signifikan .

b. Tes Paralel (Alternate Test)


Tes paralel atau ekuivalen yang sering pula dinamakan double test-double
trial method adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat
kesukaran, dan susunan, namun butir-butir soalnya berbeda (Sudaryono et al,
2013). Dengan metode ini, dua buah tes yang ekuivalen, misalnya tes Matematika
seri A yang akan dicari reliabilitasnya dan tes Matematika seri B diteskan kepada
kelompok siswa yang sama, kemudian hasilnya dikorelasikan. Hasil tes tersebut
menunjukkan koefisien reliabilitas tes. Koefisien realibilitas yang didapatkan

29
dengan teknik parallel disebut dengan indeks ekuivalensi. Metode ini bagus
karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor siswa
untuk mengingat jawaban tes terdahulu. Namun, kekurangan metode ini adalah
memberatkan pekerjaan pengetes karena harus menyusun dua seri tes.
Persoalannya adalah bagaimana menyusun dua buah tes yang ekuivalen
tersebut. Untuk itu ada beberapa hal yang perlu diperhatikan, yaitu :
1) Materi yang ditanyakan sama.
2) Bentuk soal sama.
3) Tingkat kesukaran soal sama.
4) Banyak sedikitnya soal sama.
5) Waktu yang dibutuhkan untuk mengerjakan soal sama.
6) Sistem evaluasi sama.
Dalam pengujian reliabilitas tes dengan menggunakan pendekatan
alternate test atau bentuk paralel ini, skor-skor yang diperoleh dari kedua seri tes
tadi dicari korelasinya. Apabila terdapat korelasi positif yang signifikan maka
dapat dikatakan bahwa tes hasil belajar tersebut dapat dikatakan reliabel. Teknik
korelasi yang dipergunakan bisa dipilih antara teknik korelasi product moment
dari Person atau teknik korelasi rank order dari Spearman (khusus untuk N
kurang dari 30).
Adapun langkah yang ditempuh adalah :
1) Menyusun dua buah tes yang ekuivalen.
2) Menguji kedua tes tersebut ( dalam waktu yang bersamaan atau beriringan ).
3) Memberikan skor hasil tes yang telah diujikan, disusun dengan memisahkan
antara tes A dan Tes B.
4) Mencari koefisien stabilitas kedua tes (A dan B) dengan jalan mencari
korelasinya melalui rumus korelasi Product Moment.
5) Untuk mencari (menghitung) koefisien korelasi antara variabel X (nilai hasil
tes seri I) dengan variabel Y (nilai tes hasil seri II) bisa digunakan teknik
korelasi product moment dari Person dengan rumus sebagai berikut:
N  XY   X  Y 
rxy 
N  X 2

  X  N  Y 2   Y 
2 2

30
c. Tes Tunggal (Single Test)
Pengujian reliabilitas dengan menggunakan pendekatan tes tunggal
merupakan pendekatan yang paling banyak dipakai, sebab ditinjau dari segi
waktu dan biaya lebih bersifat ekonomik daripada pendekatan tes lainnya.
Analisis data untuk tes tunggal bisa dibagi ke dalam dua macam teknik, yaitu
teknik belah-dua (split-half technique) dan teknik non belah-dua (non split-healf
technique).
1. Teknik Belah Dua
Untuk menentukan reliabilitas suatu perangkat tes dengan menggunakan
metode belah dua, dapat dilakukan dengan cara membelah alat evaluasi tersebut
menjadi dua bagian yang sama (relatif sama), sehingga masing-masing testee
memiliki dua macam skor. Kedua macam skor itu adalah skor untuk bagian
(belahan pertama) dan kelompok skor untuk belahan kedua dari perangkat alat
evaluasi tersebut. Karena kedua belahan harus sama maka salah satu syarat yang
harus dipenuhi untuk teknik belah dua ini adalah jumlah soal dalam perangkat tes
tersebut harus genap agar kedua bagian jumlah soalnya sama.
Ada dua cara membelah butir soal, yaitu:
1) Membelah atas item-item genap dan item-item ganjil yang selanjutnya
disebut belahan ganjil-genap.
2) Membelah atas item-item awal dan item-item akhir, yaitu separo jumlah pada
nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya
disebut belahan awal-akhir.

Kelebihan dari metode belah dua ini adalah pengetes tidak susah membuat
banyak bentuk soal. Sedangkan, kekurangannya adalah ada kurang representatif
atas kemampuan siswa karena hanya ada sekali tes.
Adapun langkah secara umum yang ditepuh untuk mencari reliabilitas tes ini
adalah:
1) Menyusun sebuah tes sebaiknya jumlah nomornya genap, sehingga bila
dibelah jumlahnya sama.
2) Mengujikan tes tersebut pada satu sampel.

31
3) Menghitung skor masing-masing peserta didik dalam dua kelompok skor,
dapat dikelompokkan skor ganjil dan genap; dapat pula dikelompokkan skor
belahan atas dan skor belahan bawah.
4) Mencari reliabilitas setengah tes, dengan jalan mengkorelasikan kedua skor
tersebut dengan rumus Product Moment, atau mencari deviasi pada belahan
ganjil genap.
5) Mencari reliabilitas satu tes penuh dengan menggunakan rumus Spearman
Brown atau rumus lainnya.

Beberapa rumus untuk mencari tingkat reliabilitas yang menggunakan


teknik belah dua adalah dengan formula:
1) Rumus Spearman Brown
2) Rumus Flanagan
3) Rumus Rulon

1) Spearman-Brown
Berbeda dengan metode bentuk paralel (equivalent) dan metode tes ulang
(test-retest method) yang setelah diketemukan koefisien korelasi langsung
ditafsirkan itulah koefisien reliabilitas, metode ini tidak demikian. Pada waktu
membelah dua dan mengkorelasikan kedua belahan, baru diketahui reliabilitas
separo tes. Salah satu cara menentukan koefisien reliabilitas digunakan rumus
Spearman-Brown sebagai berikut:

dengan
= korelasi antara skor-skor setiap belahan tes

= koefisien reliabilitas yang sudah disesuaikan


Untuk menghitung bisa digunakan rumus product moment dengan

angka kasar dari Karl Pearson, yaitu:

Keterangan:

32
= banyak subjek
= kelompok data belahan pertama
= kelompok data belahan kedua
Cara perhitungan reliabilitas dengan metode belah dua. Langkah pertama
yang harus dilakukan adalah mengadakan analisis item. Item yang dapat dijawab
dengan benar diberi skor 1 dan bagi yang salah diberi skor 0. Skor-skor untuk
seluruh subjek dan seluruh item tertera dalam tabel analisis. Perhitungan
reliabilitas dilakukan dengan membelah dengan dua cara. Pembelahannya hanya
memilih salah satu saja, untuk selanjutnya dihitung dengan korelasi product
moment.
Contoh:
Tabel 2.9 Analisis item untuk perhitungan reliabilitas tes objektif

Nama
Skor Skor
Siswa
Total
1 2 3 4 5 6 7 8 9 10
A 1 1 1 0 1 1 0 1 1 0 7
B 0 0 1 1 1 1 1 1 0 1 7
C 1 0 0 0 1 1 1 1 0 1 6
D 0 1 1 1 0 0 1 1 1 1 7
E 1 1 1 1 1 1 1 0 0 0 7
F 0 0 1 1 1 1 0 1 0 1 6
G 1 0 1 0 1 1 1 1 1 1 8
H 1 1 1 1 0 1 0 1 0 0 6
I 1 0 1 1 1 1 0 1 0 0 6
J 1 0 1 0 1 0 1 1 1 1 7

Langkah selanjutnya yaitu mencari angka indeks korelasi product


momen, antara variabel X (separuh belahan tes pertama) dengan variabel Y
(separuh belahan tes kedua) yaitu:

33
Tabel 2.10 Persiapan untuk menghitung reliabilitas dengan rumus Spearman-
Brown
Ganjil
Nama Genap(Y) X^2 Y^2 XY
(X)
A 4 3 16 9 12
B 3 4 9 16 12
C 3 3 9 9 9
D 3 4 9 16 12
E 4 3 16 9 12
F 2 4 4 16 8
G 5 3 25 9 15
H 2 4 4 16 8
I 3 3 9 9 9
J 5 2 25 4 10
Jumlah 34 33 126 113 107

Dari tabel diperoleh:

Setelah dihitung dengan rumus korelasi product moment dengan angka


kasar diketahui bahwa Harga tersebut baru menunjukkan
reliabilitas separo tes. Oleh karena itu, untuk belahan ini disebut dengan
istilah atau singkatan dari . Untuk mencari reliabilitas

seluruh tes digunakan rumus Spearman-Brown. Sehingga diperoleh:

34
2) Penggunaan Rumus Flanagan
Rumus ini digunakan untuk mencari reliabilitas tes dengan jalan metode
belah dua, tetapi tidak menggunakan jalan korelasi product moment seperti rumus
Spearman-Brown, melainkan masing-masing standar deviasi untuk masing-
masing belahan dan pada skor total. Langkah ini lebih praktis bila dibandingkan
dengan menggunakan rumus Spearman-Brown.
Rumus:

Keterangan:
= reliabilitas tes
= varians belahan pertama (skor item ganjil)
= varians belahan kedua (skor item genap)
= varians skor total
Varians adalah standar deviasi kuadrat maka rumus varians adalah sebagai
berikut:

Standar deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku
(SB). Rumus , yaitu:

Keterangan,
= standar deviasi
= simpangan baku dari , yang dicari dari
= varians
= banyaknya subjek pengikut tes

35
Adapun langkah-langkahnya sebagai berikut:
1) Membelah tes menjadi dua, yaitu belahan ganjil dan belahan genap serta skor
total.
2) Mencari varians pada belahan ganjil, varians pada belahan genap dan varians
pada skor total.
3) Menghitung besarnya reliabilitas tes dengan rumus Flanagan.

Contoh:
Dengan menggunakan tabel analisis yang sama dengan tabel 2.9 akan dibuat tabel
persiapan untuk menghitung reliabilitas dengan menggunakan rumus Flanangan
berikut.

Tabel 2.11 Korelasi skor belahan ganjil dengan belahan genap dengan rumus
Flanangan
Ganjil
Nama Genap(Y) X^2 Y^2 XY
(X)
A 4 3 16 9 12
B 3 4 9 16 12
C 3 3 9 9 9
D 3 4 9 16 12
E 4 3 16 9 12
F 2 4 4 16 8
G 5 3 25 9 15
H 2 4 4 16 8
I 3 3 9 9 9
J 5 2 25 4 10
Jumlah 34 33 126 113 107

Dari tabel diperoleh:

36
Dimasukkan ke dalam rumus diperoleh:

3) Penggunaaan Rumus Rulon


Cara mencari reliabilitas dengan menggunakan rumus Rulon ini tetap
menggunakan rumus Rulon ini tetap menggunakan bahan dari cara belah dua
seperti cara-cara yang digunakan oleh rumus Spearman-Brown dan Flanagan.
Rumus Rulon menggunakan kuadrat dari deviasi belahan pertama dan belahan
kedua dan standar deviasi kuadrat dari skor total. Adapun langkah-langkahnya
adalah sebagai berikut:
1) Membelah hasil tes menjadi dua belahan.
2) Mencari deviasi antara kedua belahan tersebut.
3) Mencari standar deviasi kuadrat dari deviasi nilai tersebut dan standar
deviasi kuadrat skor total.
4) Menghitung besarnya reliabilitas dengan rumus Rulon sebagai berikut.

Dimana:
= varians beda (varians difference)
= difference yaitu perbedaan antara skor belahan pertama dengan skor belahan
kedua.

37
Contoh:
Dengan menggunakan tabel analisis yang sama dengan tabel 2.9 akan dibuat tabel
persiapan untuk menghitung reliabilitas dengan menggunakan rumus Rulon
berikut.

Tabel 2.12 Korelasi skor belahan ganjil dengan belahan genap dengan rumus
Rulon
Ganjil
Nama Genap(Y) d d^2
(X)
A 4 3 1 1
B 3 4 -1 1
C 3 3 0 0
D 3 4 -1 1
E 4 3 1 1
F 2 4 -2 4
G 5 3 2 4
H 2 4 -2 4
I 3 3 0 0
J 5 2 3 9
Jumlah 34 33 1 25

Dari tabel diperoleh:

Dari perhitungan terdahulu diketahui:


Varians total =

38
Dimasukkan ke dalam rumus Rulon

Telah disinggung di bagian depan bahwa salah satu syarat untuk dapat
menggunakan metode belah dua adalah bahwa banyaknya item harus genap agar
dapat dibelah. Syarat yang kedua item-item membentuk soal tes harus homogen
atau paling tidak setelah dibelah terdapat keseimbangan antara belahan pertama
dengan belahan kedua.

2. Teknik Belah Non Dua


Terdapat banyak cara untuk menilai tes yang terdiri dari n butir menjadi
dua bagian yang masing-masing terdiri n/2 butir, salah satunya adalah pemilihan
berdasarkan butir soal ganjil dan butir soal genap. Karena keterbatasan teknik
belah dua, maka munculah teknik baru yaitu teknik non belah dua.
1) Penggunaan Rumus Kuder Richardson
Tidak puas dengan metode belah dua, Kuder dan Richadson
mengembangkan metode baru menghitung koefisien reliabilitas tes berdasarkan
statistik butir. Adapun formula yang dianjurkan oleh Kuder dan Richardson ada
dua buah yang masing – masing diberi kode KR20 dan KR21, yaitu:
Pendekatan Single Test – Single Trial dengan menggunakan Formula Kuder
Richardson, dimana diterapkan rumus KR20
KR20 merupakan singkatan dari Kuder Richardson, sedangkan 20
merupakan catatan bilangan yang menemukan banyak replikasi perhitungan
sampai penemuan rumus tersebut.
Rumus:

 n  S t   pi qi 
2

r11    
 n  1  
2
St 
Dengan,
= koefisien reliabilitas tes.
= proporsi subjek yang menjawab item dengan benar.
= proporsi subjek yang menjawab item dengan salah
( ).

39
= jumlah hasil perkalian antara dan .
= banyaknya item.
= varian total.
1 = bilangan konstan.

Agar dapat melakukan perhitungan lebih cepat terlebih dahulu dibuat tabel
kerja dengan langkah-langkah sebagai berikut: (Candiasa, 2001: 53)
1. Butir-butir yang dinyatakan tidak valid dikeluarkan dari instrumen. Jadi
reliabilitas instrumen dihitung hanya untuk butir-butir yang dinyatakan valid.
2. Menghitung p, yaitu proporsi siswa yang menjawab benar dari tiap-tiap soal.
3. Menghitung q, yaitu proporsi siswa yang menjawab salah dari tiap-tiap soal.
4. (qi = 1 – pi)
5. Menghitung hasil kali p dengan q (p x q) untuk tiap-tiap butir.

Kelebihan rumus KR20 ialah, bahwa hasil perhitungannya lebih teliti;


hanya saja kelemahannya ialah, bahwa proses perhitungannya lebih sulit atau
lebih rumit.

Contoh:
Tabel 2.13 Persiapan untuk menghitung reliabilitas dengan rumus Kuder Richardson
Skor Skor
Responden X2
1 2 3 4 5 6 7 8 9 10 (X)
A 1 1 1 1 1 1 1 1 1 1 10 100
B 1 0 0 0 1 1 0 0 0 0 3 9
C 1 1 0 0 1 0 0 1 1 1 6 36
D 1 0 1 1 1 0 1 1 1 0 7 49
E 1 1 1 1 1 1 1 1 1 1 10 100
F 0 0 0 1 0 0 1 1 0 1 4 16
F 1 1 1 0 1 1 1 1 1 1 9 81
G 0 1 0 0 0 0 0 0 1 1 3 9
H 1 1 1 0 1 1 1 0 1 1 8 64
I 1 1 0 1 1 1 0 0 1 1 7 49

40
Skor Skor
Responden X2
1 2 3 4 5 6 7 8 9 10 (X)

Total 8 7 5 5 8 6 6 6 8 8 67 513
p 0,8 0,7 0,5 0,5 0,8 0,6 0,6 0,6 0,8 0,8
q 0,2 0,3 0,5 0,5 0,2 0,4 0,4 0,4 0,2 0,2
pxq 0,16 0,21 0,25 0,25 0,16 0,24 0,24 0,24 0,16 0,16  pq
= 2,07

Berdasarkan tabel kerja di atas, hitunglah standrar deviasi untuk skor total. k=10

k  x 2  ( x ) 2
St 
k (k  1)

10  513  (67 ) 2
St   2,67
10(10  1)

Berdasarkan tabel kerja perhitungan reliabilitas dengan KR20 yang dapat dihitung
harga koefisien reliabilitas instrumen sebagai berikut.

 10  2,67  2,07 
2
r11      0,79
 10  1  2,67 2 
Jadi, dengan menggunakan rumus KR20, reliabilitas instrumen yang diujicoba
adalah 0,79

Pendekatan Single Test – Single Trial dengan menggunakan Formula Kuder


Richardson, di Mana Diterapkan Rumus KR21
Rumus:

 n  St  npi qi 
2
r11   
 n  1  
2
St 
Dengan,
= koefisien reliabilitas tes.
= banyaknya item.
1 = bilangan konstan.

41
= mean total (rata-rata hitung dari skor total).
= varian total.

Sebelum perhitungan terlebih dahulu dibuat tabel kerja dengan langkah-


langkah sebagai berikut: (Candiasa, 2001: 65)
1. Butir-butir yang dinyatakan tidak valid dikeluarkan dari instrumen. Jadi
reliabilitas instrumen dihitung hanya untuk butir-butir yang dinyatakan valid.
2. Menghitung p, yaitu proporsi siswa yang menjawab benar dari tiap-tiap soal.
3. Menghitung q, yaitu proporsi siswa yang menjawab salah dari tiap-tiap soal.
4. (qi = 1 – pi)
5. Menghitung hasil kali p dengan q (p x q) untuk tiap-tiap butir.
Nilai p i dan qi dapat dicari tanpa harus menghitung siswa yang menjawab
benar atau salah untuk setiap butir. Rata-rata p sama dengan rata-rata skor total
dibagi n, dan rata-rata q sama dengan 1- pi . Oleh karena itu rumus KR21 dapat

disederhanakan menjadi:
 nS  R W
2

r11   t 

 (n  1) S t
2

Dengan,
St = standar deviasi skor total

R = rata-rata banyak butir dijawab benar


W = rata-rata banyak butir dijawab salah
n = bsnysk butir

Jadi W  1  R . Sudah R sama dengan rata-rata skor total. Rumus KR21 diatas
dapat ditulis:
nS1  M (n  M )
2

r11 
(n  1) S1
2

Kelebihan rumus KR21 ialah, bahwa proses perhitungannya relatif lebih sederhana
atau lebih mudah, sedangkan kelemahannya ialah, bahwa hasil perhitungannya
kurang teliti.

42
Contoh:
Dengan memperhatikan tabel 2.13 akan diperoleh sebagai berikut.
Standar deviasi untuk skor total dapat dihitung dengan rumus k=10

k  x 2  ( x ) 2
St 
k (k  1)

10  513  (67 ) 2
St   2,67
10(10  1)
Selanjutnya, hitung rata-rata skor total (M).
67
M  6,7
10
Berdasarkan tabel kerja tersebutdihitung harga koefisien reliabilitas instrumen
dengan menggunakan rumus KR21 sebagai berikut.
10  (2,67 ) 2  6,7(10  6,7)
r11   0,62
(10  1)( 2,67 ) 2
Jadi, dengan menggunakan rumus KR21, reliabilitas istrumen diujicoba adalah
0,62.

2) Penggunaan Rumus C. Hoyt


Sebagian besar perhitungan statistik terkait reliabilitas melibatkan varian.
Beberapa pakar yang telah menerapkan pendekatan analisis varian, salah satunya
adalah Hoyt. Sama seperti pendekatan KR, pendekatan varian di mulai dari level
butir. Rumus umum disebut relibialitas ANAVA (Analisis Varian) Hoyt sebagai
berikut. (Candiasa, 2001: 60)
Rumus:
Vs Vr  Vs
rtt  1  
Vr Vr
Dengan,
rtt = reliabilitas varian Hoyt

Vr = varians responden
Vs = varians sisa

43
Varian responden ( Vr ) dihitung dengan rumus:

JK r
Vr 
dkr
Dengan,
Vr = varians responden
JK r = jumlah kuadrat responden
dkr = derajat kebebasan responden, dengan dkr = N-1, N = banyaknya responden

X 2
 X  2

 
t t
JK r
n nN
Dengan,
X t = skor total untuk setiap responden

n = banyak butir
N = banyak responden

Varian butir (Vi ) dihitung dengan rumus:

JK i
Vi 
dki
Dengan,
Vi = varians butir

JK i = jumlah kuadrat butir

dki = derajat kebebasan butir, dengan dki = N-1, N = banyaknya responden

R 2
 X  2

 
t t
JK i
N nN
Dengan,
JK i = jumlah kuadrat butir

R = jumlah jawaban benar untuk butir i


X t = skor total untuk setiap responden

n = banyak butir

44
N = banyak responden

Variansi sisa Vs  dihitung dengan rumus:

JK s
Vs 
dks
Dengan,
Vs = varians sisa

JK s = jumlah kuadrat sisa

dk s = derajat kebebasan sisa

JK s  JK t  JK r  JK i

Dengan,
JK s = jumlah kuadrat sisa

JK t = jumlah kuadrat total

JK r = jumlah kuadrat responden


JK i = jumlah kuadrat butir

dks  (n  1)( N  1) , dimana n= banyak butir dan N=banyak responden.

( R i )(Wi )
JK t 
( R i )  (Wi )

Dengan,
Ri = jumlah jawaban yang benar padabutir i

Wi = jumlah jawaban yangsalah pada butir i

Untuk mempermudah perhitungan-perhitungan di atas perlu dibuat tabel kerja


seperti di bawah ini. (Candiasa, 2001 :62-63)

Tabel 2.14 Alat bantu untuk menggunakan rumus C. Hoyt


Peserta Butir X t ( X t ) 2
Tes 1 2 3 … n
1

45
Peserta Butir X t ( X t ) 2
Tes 1 2 3 … n
2
3
… X t  ( X t )2

Bi B i

Si S i

B
2 2
Bi i

Semua perhitungan di atas dapat dirangkum seperti tabel berikut. (Candiasa, 2001
:63-64)
Tabel 2.15 Rangkuman Perhitungan
Sumber Jumlah Kuadrat Derajat Kebebasan Varians
Responden
X t
2


 X  t
2
N-1
Vr 
JK r
n nN dkr
Butir
R t
2


 X t
2
n-1
Vi 
JK i
N nN dki
Sisa JK t  JK r  JK i (n-1)(N-1) JK s
Vs 
dks
Total ( R i )(Wi ) (nxN)-1
( R i )  (Wi )

Contoh:
Dengan menggunakan tabel yang sama pada tabel 2.13 akan diperoleh sebagai
berikut.

JK r 
X t
2


 X  t
2

n nN

JK r 
513

67   6,41 2

10 (10)(10)

dkr = N-1=10-1=9

46
JK r
Vr 
dkr
6,41
Vr   0,712
9

R 2
 X  2

 
t t
JK i
N nN
463 (67) 2
JK i    1,41
10 (10)(10)

JK i
Vi 
dki
1,41
Vi   0,157
9

( R i )(Wi )
JK t 
( R i )  (Wi )

(67)(33)
JK t   22,11
(67)  (33)

JK s  JK t  JK r  JK i

JK s  22,11  6,41  1,41  14,29

dks  (n  1)( N  1) =(10-1)(10-1)=81

JK s
Vs 
dks
14,29
Vs   0,176
81

Substitusi ke rumus berikut


Vs Vr  Vs
rtt  1  
Vr Vr
Diperoleh r = 0,753

47
2.7.2 Menentukan Reliabilitas Tes Uraian
Menilai soal dalam bentuk uraian tidak dapat dilakukan seperti soal
objektif yang terdiri dari butir-butir soal yang dinilai hanya “benar” atau “salah”.
Tetapi, pada tes bentuk uraian tiap butir soal menghendaki gradualisasi penilaian.
Penyekoran butir tes hasil belajar berbentuk uraian hampir sama dengan
penyekoran angket. Sekalipun butir tes uraian memiliki nilai benar atau salah,
akan tetapi masih terdapat rentangan skor di antara skor yang menyatakan
jawaban benar dan skor yang menyatakan jawaban salah. Dengan demikian
analisis butir tes hasil belajar berbentuk uraian menggunakan teknik yang sama
dengan analisis butir instrumen berbentuk angket. Hal yang sama diberlakukan
pula untuk butir tes hasil belajar berbentuk tes kinerja (performancetest).
Untuk mencari reliabilitas tes uraian atau essai, sebelum perhitungan
terlebih dahulu dibuat tabel kerja dengan langkah-langkah sebagai berikut.
a) Butir-butir yang dinyatakan tidak valid dikeluarkan dari instrumen. Jadi,
reliabilitas instrumen dihitung hanya untuk butir-butir yang dinyatakan
valid.
b) Menghitung variasi untuk tiap-tiap butir dan skor total.
Sehingga harga koefisien reliabilitas instrumen dapat dihitung dengan
menggunakan rumus Alpha-Cronbach sebagai berikut:
Rumus Alpha:

 n   S1 
2

r11    1  
 n  1  S t2 

Dimana : r11 = Koefisien reabilitas tes
n = Banyaknya butir item yang dikeluarkan dalam tes
1 = Bilangan konstan

S 1
2
= Jumlah varian skor dari tiap-tiap butir item.

St2 = Varian total

Dengan:
( X ii ) 2
 X ii2  N
S ii2 
N

48
a. Apabila r11  0,70 artinya tes hasil belajar yang sedang diuji reabilitas
yang tinggi
b. Apabila r11  0,70 artinya tes hasil belajar yang sedang diuji dapat
dikatakan belum memiliki reabilitas (un – reliable)

2.8 Faktor-Faktor yang Mempengaruhi Reliabilitas


Banyak hal atau faktor-faktor yang mempengaruhi suatu realibilitas.
Namun, secara garis besar dapat dikelompokkan menjadi 3 yaitu (1) hal yang
berhubungan dengan tes itu sendiri, (2) hal yang berhubungan dengan tercoba
(testee), dan (3) hal yang berhubungan dengan penyelenggaraan tes (Arikunto,
Suharsimi, 2007 ; 101).
1. Hal yang Berhubungan dengan Tes Sendiri, yaitu Panjang Tes dan
Kualitas Butir Soal
Tes yang terdiri dari banyak butir soal tentunya lebih valid dibandingkan
dengan tes yang hanya terdiri dari beberapa butir soal saja. Selanjutnya, tinggi
rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes. Sehingga,
semakin panjang tes maka reliabilitasnya semakin tinggi. Dalam hal menghitung
besarnya reliabilitas berhubungan dengan penambahan banyaknya butir soal
dalam tes terdapat rumus yang diberikan oleh Spearman dan Brown, sehingga
disebut rumus Spearman-brown. Rumusnya adalah :

Keterangan :
= besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal
baru
= berapa kali butir soal itu ditambah
= besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah

Contoh :
Suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabilitas 0,70.
Kemudian butir-butir soal itu ditambah menjadi 60 butir soal. Maka, koefisien
reliabilitas baru adalah :

49
Dengan demikian penambahan 20 butir soal dari 40 butir, memperbesar koefisien
reliabilitas sebesar 0,09. Akan tetapi penambahan butir-butir soal tes adakalanya
tidak berarti bahkan merugikan. Hal tersebut karena :
1) Sampai pada suatu batas tertentu, penambahan banyaknya butir tidak
menambah reliabilitas tes.
2) Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan
waktu, biaya dan tenaga yang dikeluarkan untuk itu. Misalnya guru sudah
cukup membuat 100 soal bentuk objektif dan 10 soal berbentuk esai sudah
cukup mempunyai validitas isi dan tingkah laku. Guru tersebut ingin
menambah butir - butir soal sehingga menjadi 200 soal bentuk objektif dan
20 soal bentuk esai. Tentu saja ini akan hanya akan menambah waktu, biaya,
dan tenaga saja tanpa ada keuntungan apa apa. Kualitas butir-butir soal
ditentukan oleh :
a) Jelas tidaknya rumusan soal.
b) Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak
menimbulkan salah jawab
c) Petunjuknya jelas sehingga mudah dan cepat dikerjakan.

2. Hal yang Berhubungan dengan Tercoba (Testee)


Suatu tes yang dicobakan kepada kelompok testee yang beraneka ragam
kemampuannya akan menghasilkan skor yang heterogen, sehingga varians-varians
skor yang diperoleh sangat besar. Hal ini akan mempengaruhi nilai koefisien
reliabilitas sehingga menjadi lebih tinggi. Begitu pula jika peserta tes lebih
banyak, akan mengakibatkan keanekaragaman yang lebih bervariasi sehingga
berakibat langsung pada penyebaran skor. Makin tersebarnya skor maka estimasi
reliabilitasnya makin tinggi. Hal ini diakibatkan karena koefisisen reliabilitas akan
semakin besar jika individu cenderung tetap pada kedudukan relatifnya dalam
kelompok tersebut. Pada umumnya, sesuatu yang mengurangi kemungkinan
perubahan kedudukan dalam kelompok juga akan memperbesar koefisien
reliabilitas.

50
3. Hal yang Berhubungan dengan Penyelenggaraan Tes
Sudah disebut bahwa faktor penyelengaraan tes yang bersifat
administrative sangat menentukan hasil tes.
Contoh:
1) Petunjuk yang diberikan sebelum tes dimulai akan memberikan ketenangan
pada para testee dalam mengerjakan tes, dan dalam penyelenggaraan tidak
akan banyak terdapat pertanyaan. Ketenangan ini tentu saja mempengaruhi
terhadap hasil tes.
2) Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa
terhadap tes. Bagi siswa-siswa tertentu adanya pengawas yang terlalu ketat
menyebabkan rasa jengkel dan tidak dapat leluasa mengerjakan tes.
3) Suasana lungkungan dan tempat tes (duduk tidak teratur, suasana di
sekeliling ramai, dan sebagaianya) akan mempengaruhi hasil tes.
Adanya hal yang mempengaruhi hasil tes ini semua, secara tidak langsung
akan mampengaruhi reliabilitas soal tes.

51
BAB III
PENUTUP

3.1 Simpulan
Berdasarkan pembahasan diatas, adapun hal-hal yang dapat disimpulkan
adalah sebagai berikut.
3.1.1 Validitas adalah suatu standar ukuran yang menunjukkan akurasi dan
kesahihan suatu instrumen. Validitas merupakan pertimbangan yang
paling utama dalam mengevaluasi kualitas tes sebagai instrumen ukur.
Konsep validitas mengacu kepada kelayakan, kebermaknaan, dan
kebermanfaatan inferensi tertentu yang dapat dibuat berdasarkan skor
hasil tes yang bersangkutan.
3.1.2 Pengujian validitas terhadap tes hasil belajar diklasifikasikan kedalam
dua jenis yaitu pengujian validitas tes secara rasional dan pengujian
validitas tes secara empirik. Pengujian validitas tes secara rasional
dilihat dari segi isinya (content validity) dan dari segi susunan atau
konstruksinya (construct validity). Sedangkan pengujian validitas tes
secara empirik dilihat dari segi daya ketepatan meramalnya (predictive
validity) dan daya ketepatan bandingannya (concurrent validity)
3.1.3 Cara yang dapat dipergunakan untuk menentukan validitas alat ukur
adalah dengan menggunakan teknik pengukuran. Adapun teknik yang
digunakan untuk mengukur validitas adalah teknik Korelasi Product
Moment yang dikemukakan oleh Karl Pearson.
3.1.4 Validitas butir soal objektif dihitung dengan rumus korelasi point
biserial, sedangkan validitas butir soal uraian dihitung dengan rumus
korelasi product moment. Angka korelasi yang diperoleh dengan cara
demikian disebut koefisien validitas atau angka validitas butir soal.
3.1.5 Faktor yang mempengaruhi validitas dapat diklasifikasikan ke dalam
tiga faktor, antara lain yaitu: faktor internal dari tes, faktor eksternal tes,
dan faktor yang berasal dari siswa yang bersangkutan.
3.1.6 Realibilitas yang berasal dari kata reliability berarti sejauh mana hasil
suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat

52
dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subjek yang sama, diperoleh hasil pengukuran yang
relatif sama, selama aspek yang diukur dalam diri subjek memang
belum berubah (Sudaryono, Gaguk M. , Wardani R. , 2013 ; 120).
3.1.7 Cara-cara menemukan koefisien reliabilitas, yaitu berkenaan dengan tes
ulang (test retest), dan tes paralel (alternative test) dengan
menggunakan formula produk momen. Selain itu, dikenalkan pula
pendekatan pendekatan tes tungggal (single test) dengan teknik belah
dua yang menggunakan formula Spearman-Brown, Flanagan, Rulon
dan teknik non belah dua yang menggunakan formula kadar-
Richardson dan Anave Hoyt.
3.1.8 Faktor-faktor yang mempengaruhi suatu realibilitas secara garis besar
dapat dikelompokkan menjadi 3 yaitu (1) hal yang berhubungan
dengan tes itu sendiri, (2) hal yang berhubungan dengan tercoba
(testee), dan (3) hal yang berhubungan dengan penyelenggaraan tes
(Arikunto, Suharsimi, 2007 ; 101).

3.2 Saran
Berdasarkan kesimpulan diatas, adapun hal yang dapat kami sarankan
adalah dalam rangka mengukur hasil belajar siswa, maka seorang guru harus
memperhatikan validitas serta reliabilitas dari alat ukur yang dipergunakan, agar
alat ukur yang digunakan mampu mengukur apa yang hendak diukur serta
konsisten jika digunakan ditempat yang berbeda dengan waktu pelaksanaan yang
berbeda pula.

53
DAFTAR RUJUKAN
Anonim. “Instrumen Penelitian”.

Arikunto, Suharsimi. 2009. Dasar-Dasar Evaluasi Pendidikan Ed. Revisi, Cet 9.


Jakarta: Bumi Aksara

Azwar, Saifudin. 1986. Validitas dan Reliabilitas. Jakarta: Rineka Cipta


file.upi.edu/Direktori/FPMIPA/JUR._PEND.../Makalah_November_2
008.pdf. (Diakses pada tanggal 20 Maret 2019)

----. 1992. Tes Prestasi (Fungsi Dan Pengembangan Pengukuran Prestasi Belajar).
Yogyakarta: Pustaka Pelajar.

----. 2013. Reliabilitas Dan Validitas Edisi 4. Jakarta: Pustaka Pelajar.

Gronlund, Nurman.E. 1982. Constructing Achievement Test (Third Edition).


United State of America.

Hendryadi (2014). “Content Validity”. Teorionline Personal Paper (pdf). Diakses


pada 20 Maret 2019

Hepi Wahyuningsih (2009). “Validitas Konstruk Alat Ukur Spiritualy Orienation


Inventory (SOI)”. Jurnal Psikologi.Vol.36, No. 2. pp116-129. Diakses
pada 18 Maret 2019

Sudaryono. 2012 .Dasar-dasar Evaluasi Pembelajaran.Yogyakarta: Graha Ilmu.

Sudjana, Nana. 2004. Dasar-dasar Proses Belajar Mengajar. Bandung :Sinar


Baru Algensido Offset.

Suherman, Erman. 1993. Evaluasi Proses Dan Hasil Belajar Matematika. Jakarta:
Universitas Terbuka, Depdikbud.

54
Sukardi. 2008. Metodologi Penelitian Pendidikan, Kompetensi dan Praktiknya.
Jakarta : PT. Bumi Aksara.

Surapranata, Sumarna. 2009. Analisis, Validitas, Reliabilitas Dan Interpretasi


Hasil Tes. Jakarta: Rosda.

55

Anda mungkin juga menyukai