VALIDITAS DAN RELIABILITAS

“VALIDITAS DAN RELIABILITAS INSTRUMEN PENELITIAN SERTA
PERSYARATAN PENGUKURAN DALAM PENELITIAN”
MAKALAH
Diajukan untuk memenuhi Tugas Rutin
Mata Kuliah Metodologi Penelitian
DOSEN PENGAMPU : DR. WILDANSYAH LUBIS, M.PD
DISUSUN OLEH :
KELOMPOK 8
Disusun Oleh :
KELOMPOK 7
SITI SYAFRIDA RAHMI 1191111057
MIFTAHUL JANNAH 1192411023
ROSELLA PRISELYA DABUKKE 1192411026
PROGRAM STUDI S1 PENDIDIKAN GURU SEKOLAH DASAR
FAKULTAS ILMU PENDIDIKAN
UNIVERSITAS NEGERI MEDAN MEDAN
OKTOBER 2021
KATA PENGANTAR
Puji dan syukur kami panjatkan atas kehadirat Tuhan Yang Maha Esa yang telah banyak
memberikan beribu-ribu nikmat kepada kita umatnya sehingga kami dapat menyelesaikan
makalah dengan judul “Validitas Dan Reliabilitas Instrumen Penelitian Serta Persyaratan
Pengukuran Dalam Penelitian” ini.
Dalam upaya penyelesaian makalah ini kami telah banyak mendapatkan bantuan dan
bimbingan dari berbagai pihak. Oleh karena itu, kami ucapkan terimakasih kepada Bapak Dr.
Wildansyah Lubis, M.Pd selaku dosen mata kuliah Metodologi Penelitian. Dan atas bimbingan
beliau kami dapat menyelesaikan makalah ini.
Kami menyadari meskipun penulisan makalah ini telah kami upayakan seoptimal
mungkin tentu masih ada kekurangan maupun kekeliruan yang tidak sengaja. Untuk itu kritik
dan saran dari pembaca sangat diharapkan yang sifatnya membangun demi perbaikan dan
kesempurnaan makalah ini. Semoga makalah ini bermanfaat bagi para pembaca umumnya dan
khususnya bagi penulis.
Medan, 20 Oktober 2021

Penyusun
Kelompok 7
i
DAFTAR ISI
KATA PENGANTAR ................................................................................................................ i

DAFTAR ISI..............................................................................................................................ii
BAB I PENDAHULUAN .......................................................................................................... 1
A. Latar Belakang ................................................................................................................ 1
B. Rumusan Masalah ........................................................................................................... 1
C. Tujuan ............................................................................................................................. 2
BAB II PEMBAHASAN ........................................................................................................... 3
2.1 Validitas ........................................................................................................................... 3
2.1.1 Pengertian Validitas ................................................................................................... 3
2.1.2 Jenis – Jenis Validitas ................................................................................................ 4
2.2 Reliabilitas........................................................................................................................ 9
2.2.1 Pengertian Reliabilitas ............................................................................................... 9
2.2.2 Jenis – Jenis Reliabilitas .......................................................................................... 10
2.2.3 Faktor Yang Mempengaruhi Reliabilitas ................................................................ 12
2.3 Uji Persyaratan Analisis Data Penelitian Infrensial ....................................................... 14
BAB III PENUTUP ................................................................................................................. 16
A. Kesimpulan ................................................................................................................... 16
B. Saran ............................................................................................................................. 16
DAFTAR PUSTAKA .............................................................................................................. 17
ii
BAB I
PENDAHULUAN
A. Latar Belakang
Keberhasilan pendidikan sangat ditentukan oleh proses pembelajaran. Untuk
mengukur keberhasilan proses pembelajaran diperlukan evaluasi dan proses analisis
dari evaluasi. Manfaat dari analisis evaluasi untuk mengetahui kekuatan dan kelemahan
pembelajaran dalam rangka meningkatkan proses pembelajaran. Karena itu begitu
pentingnya guru mengadakan analisis butir soal (distraktor, tingkat kesukaran, daya
pembeda, dan kualitas soal), validasi dan reliabilitas instrument. Hasil dari proses
penilaian perlu dilakukan analisis, untuk melihat validitas dan efektivitas instrument,
serta untuk mengetahui kelemahan dan kekuatan proses pembelajaran. Ada tiga sasaran
pokok ketika guru melakukan analisis terhadap hasil belajar, yaitu terhadap guru, siswa
dan prosedur pembelajaran. Fungsi analisis untuk guru terutama untuk mendiagnosis
keberhasilan pembelajaran dan sebagai bahan untuk merevisi dan mengembangkan
pembelajaran dan tes. Bagi siswa, analisis diharapkan berfungsi mengetahui
keberhasilan belajar, mendiagnosa mengoreksi kesalahan belajar, serta Memotivasi
siswa belajar lebih baik.
Perkembangan konsep penilaian pendidikan yang ada pada saat ini
menunjukkan arah yang lebih luas. Penilaian program pendidikan menyangkut
penilaian terhadap tujuan pendidikan, isi program, strategi pelaksanaan program dan
sarana pendidikan. Penilaian proses belajar mengajar menyangkut penilaian terhadap
kegiatan guru, kegiatan siswa, pola interaksi guru siswa dan keterlaksanaan program
belajar mengajar. Sedangkan penilaian hasil belajar menyangkut hasil belajar jangka
pendek dan hasil belajar jangka panjang.
Dengan demikian, inti penilaian adalah proses memberikan atau menentukan
nilai kepada objek tertentu berdasarkan suatu kriteria tertentu. Proses pemberian nilai
tersebut berlangsung, baik dalam bentuk validitas maupun reliabilitas. Keberhasilan
mengungkapkan hasil dan proses belajar siswa sebagaimana adanya (objektivitas hasil
penilaian) sangat tergantung pada kualitas alat penilaiannya di samping pada cara
pelaksanaannya. Pada makalah ini akan dibahas mengenai validitas dan reliabilitas tes
yang berguna sebagai pedoman bagi pembaca dalam melakukan penelitian.
B. Rumusan Masalah
1. Apa yang dimaksud dengan validitas dan reliabilitas instrumen penelitian?
2. Apa saja jenis – jenis dari validitas dan reliabilitas instrumen penelitian?
3. Apa saja faktor yang mempengaruhi reliabilitas?
4. Bagaimana uji persyaratan analisis data penelitian infrensial?
1
C. Tujuan
Berdasarkan rumusan masalah, maka tujuan dari pembuatan makalah ini adalah :
1. Mengetahui dan memahami pengertian validitas dan reliabilitas instrumen penelitian.
2. Mengetahui dan memahami jenis – jenis validitas dan reliabilitas pada instrumen
penelitian.
3. Mengetahui dan memahami faktor yang mempengaruhi reliabilitas.
4. Memahami uji persyaratan analisis data penelitian infrensial.
2
BAB II
PEMBAHASAN
2.1 Validitas
2.1.1 Pengertian Validitas

Validitas menurut KBBI merupakan sifat benar menurut bahan bukti yang ada,
logika berpikir, atau kekuatan hukum, sifat valid, dan kesahihan. Menurut Azwar,
validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Menurut Arikunto,
validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes, dan
menurut Nursalam, validitas adalah suatu ukuran yang menunjukkan tingkat kevalidan
atau kesahihan suatu instrumen. Jadi, dapat disimpulkan bahwa validitas adalah suatu
standar ukuran yang menunjukkan ketepatan dan kesahihan suatu instrumen.
Validitas merupakan suatu ukuran yang menunjukkan tingkat-tingkat kevalidan
atau kesahihan suatu instrumen. Suatu instrumen yang valid atau sahih mempunyai
validitas tinggi. Sebaliknya, instrumen yang kurang valid bearti memiliki validitas
rendah. Sebuah instrumen dikatakan valid apabila mampu mengukur apa yang
diinginkan. Sebuah instrumen dikatakan valid apabila dapat mengungkapakan data dari
variabel yang diteliti secara tepat. Tinggi rendahnya validitas instrumen menunjukkan
sejauh mana data yang terkumpul tidak menyimpang dari gambaran tentang validitas
yang dimaksud.
Suatu instrumen dikatakan valid jika instrumen yang digunakan dapat
mengukur apa yang hendak diukur, Gay (1983). Seorang guru hendak melakukan tes
untuk melakukan penilaian apakah para siswa dapat menguasi pengetahuan yang telah
diberikan di kelas. Agar dapat memperoleh hasil yang baik guru tersebut perlu membuat
atau mengembangkan tes yang sesuai dengan tujuan yang hendak dicapai, kemudian
memanfaatkannya untuk mengukur peserta didik. Oleh karena guru mengetahui seluk-
beluk siswa yang diajarkannya, mereka dapat membuat tes yang cocok dengan tujuan
pembelajaran yang telah ditetapkan. Namun apakah tes tersebut dapat mengukur pada
siswa ain dalam mata pelajaran sama dan guru yang berbeda? Pertanyaan tersebut
memerlukan kajian yang cermat untuk menjawabnya.
Validitas suatu instrumen penelitian, tidak lain adalah derajat yang
menunjukkan di mana suatu tes mengukur apa yang hendak diukur. Prinsip suatu tes
adalah valid, tidak universal. Validitas suatu tes yang perlu diperhatikan oleh para
peneliti adalah bahwa ia hanya valid untuk suatu tujuan tertentu saja. Misalnya tes valid
untuk bidang studi Kimia belum tentu valid untuk bidang yang lain, misalnya bidang
Biologi.
Hal ini juga dapat dianalogkan bahwa tes valid untuk suatu grup individu belum
tentu valid untuk grup lainnya. Sebagai contoh suatu tes valid untuk para siswa Sekolah
Menengah Atas (SMA), belum tentu valid untuk anak Sekolah Menengah Pertama
(SMP). Yang menjadi pertanyaan adalah bukannya valid atau tidak valid suatu tes,
3
tetapi tes yang telah dibuat, valid untuk apa dan valid untuk siapa? Contohnya berkaitan
dengan validitas dapat digambarkan seperti berikut. Seorang guru valid untuk mengajar
kelompok umur tertentu, misalnya taman kanak-kanak, belum tentu valid untuk
mengajar anak kelompok usia sekolah menengah kejuruan.
Validitas yang berkaitan untuk siapa perlu diperhatikan karena menyangkut
dengan membangun gambaran atau deskripsi terhadap suatu grup normal. Derajat
validitas hanya berlaku untuk suatu kelompok tertentu yang memang telah
direncanakan pemakaiannya oleh si peneliti . Contoh dalam tes pencapaian prestasi
anak yang direncanakan oleh orang dewasa, akan berbeda bentuk maupun substansinya
dengan tes prestasi untuk anak usia remaja. Oleh karena itu, tidak aneh dalam hal ini
jika instrumen direncanakan bervariasi bentuk maupun isinya, sesuai dengan tujuan
yang hendak dicapai.
Untuk memperoleh instrumen yang valid peneliti harus bertindak hati-hati sejak
awal penyusunanya. Dengan mengikuti langkah-langkah penyususnan instrumen,
yakni memecah variabel menjadi sub-variabel dan indikator baru memuaskan butir-
butir pertanyaanya, peneliti sudah bertindak hati-hati. Apabila cara dan isi tindakan ini
sudah betul, dapat dikatakan bahwa peneliti sudah boleh berharap memperoleh
instrumen yang memiliki validitas logis. Dikatakan validitas logis karena validitas ini
diperoleh dengan suatu usaha hati-hati melalui cara-cara yang benar sehingga menurut
logika akan dicapai suatu tingkat validitas yang dikehendaki. Selain memperoleh
validitas logis, peneliti juga menguji validitas instrumen yang sudah disusun melalui
pengalaman. Dengan mengujinya melalui pengalaman akan diketahui tingkat validitas
empiris atau validitas berdasarkan pengalaman.
Untuk menguji tingkat validitas empiris instrumen, peneliti mencobakan
instrumen tersebut pada sasaran dalam penelitian. Langkah ini bisa disebut dengan
kegiatan uji coba (try-out) instrumen. Apabila data yang didapat dari uji coba ini sudah
sesuai dengan yang seharusnya, maka berarti bahawa instrumenya sudah baik, sudah
valid. Untuk mengetahui ketepatan data ini diperlukan teknik uji validitas.
2.1.2 Jenis – Jenis Validitas

Secara metodologis, validitas suatu tes dapat dibedakan menjadi empat macam,
yaitu validitas isi, konstruk, kriteria, dan prediksi.
1. Validitas Isi
Validitas isi adalah derajat di mana sebuah tes mengukur cakupan substansi
yang ingin diukur. Untuk mendapatkan validitas isi memerlukan dua aspek penting
yaitu valid isi dan valid teknik sampling. Valid isi mencakup khususnya, hal-hal
yang berkaitan dengan apakah item-item itu menggambarkan pengukuran berkaitan
dengan bagaimanakah baiknya suatu sampel tes merepresentasikan total cakupan
isi. Contoh: Sebuah tes direncanakan untuk mengukur pengetahuan tentang
pendidikan teknologi kejuruan, dikatakan valid, karena dalam kenyataannya semua
item benar-benar berkaitan dengan faktual PTK. Tetapi mungkin tes tersebut
mempunyai validitas sampling jelek, karena pengambilan sampling materi tidak
merepresentasikan untuk materi yang dimaksud.
4
Kadang-kadang tes validitas isi juga disebut face validity atau validitas wajah.
Walaupun hal tersebut masih meragukan, karena validitas wajah hanya
menggambarkan derajat di mana sebuah tes tampak mengukur, tetapi tidak
menggambarkan cara psikometri yang mengukur apa yang ingin diusahakan dapat
diukur. Proses ini sering digunakan sebagai awal menyaring dalam tes pilihan.
Validitas isi juga mempunyai peran yang sangat penting untuk tes pencapaian atau
achievement test.
Validitas isi pada umumnya ditentukan melalui pertimbangan para ahli. Tidak
ada formula matematis untuk menghitung dan tidak ada cara untuk menunjukkan
secara pasti. Tetapi untuk memberikan gambaran bagaimana suatu tes divalidasi
dengan menggunakan validitas isi, pertimbangan ahlii tersebut dilakukan dengan
cara seperti berikut. Para ahli, pertama diminta untuk mengamati secara cermat
semua item dalam tes yang hendak divalidasi. Kemudian mereka diminta untuk
mengoreksi semua item-item yang telah dibuat. Dan pada akhir perbaikan, mereka
juga diminta untuk memberikan pertimbangan tentang tes tersebut menggambarkan
cakupan isi yang hendak diukur. Pertimbangan ahli tersebut biasanya juga
menyangkut, apakah semua aspek yang hendak diukur telah dicakup melalui item
pertanyaaan dalam tes. Atau dengan kata lain perbandingan dibuat antara apa yang
harus dimasukkan dengan apa yang ingin diukur yang telah direfleksikan menjadi
tujuan tes.
Langkah-langkah pengujian validitas isi:
a. Lakukan perhitungan korelasi setiap butir (item) instrumen dengan skor total
(corrected item-total correlation).
b. Lakukan perbandingan nilai korelasi yang diperoleh dengan tabel r dengan
tingkat signifikansi (α) dan derajat bebas sebesar N-2.
c. Pengambilan keputusan
• Jika r hitung (baik manual maupun dari output SPSS) > r tabel, item
tersebut valid
• Jika r hitung (baik manual maupun dari output SPSS) < r tabel atau r
bernilai negatif, maka item tersebut dikatakan tidak valid
d. Jika menggunakan SPSS, butir-butir (item) yang tidak valid perlu dikeluarkan
dari kelompoknya (dibuang) dan pengujian diulang untuk butir-butir yang valid
saja.
e. Apabila seteleh mengeluarkan butir yang tidak valid dan masih ditemukan butir
yang belum valid setelah dilakukan run maka proses eliminasi butir yang tidak
valid terus dilakukan sampai semua butir valid. Semakin banyak pengulangan
maka item yang menyusut semakin banyak
f. Hipotesis yang digunakan : H0 = butir pertanyaan berkorelasi positif dengan
skor total H1= butir pertanyaan tidak berkorelasi positif dengan skor total
2. Validitas Konstruk
Validitas konstruk merupakan derajat yang menunjukkan suatu tes mengukur
sebuah konstruk sementara atau hypotetical construct. Konstruk, secara definitif,
5
merupakan suatu sifat yang tidak dapat diobservasi, tetapi kita dapat merasakan
pengaruhnya melalui satu atau dua indra kita. Contoh suatu konstruk dalam lingkup
pendidikan teknologi kejuruan misalnya, implikasi orang terampil atau memiliki
skill, dapat dilihat dengan melalui tingkah laku dia ketika seseorang tersebut
melakukan pekerjaannya. Konstruk tidak lain adalah merupakan “temuan” atau
suatu pendekatan untuk menerangkan tingkah laku. Konstruk arus listrik dalam
suatu pendekatan, misalnya, dapat dirasakan efeknya, ketika kita dengan sengaja
atau tidak sengaja memegang dua kabel tersebut secara bersama-sama. Kita tidak
dapat memotong benda dan melihat arus listriknya. Arus listrik dalam benda tersbut
dapat dirasakan pengaruhnya secara lebih nyata dengan melalui alat ukur, misalnya
ohmmeter atau amperemeter. Dalam pendidikan anak contoh konstruk seperti
Intelligence Quotient (IQ), melalui penelitian menghasilkan bahwa seseorang yang
memiliki IQ lebih tinggi, ada kecenderungan bahwa orang tersebut dapat
mengerjakan tugas-tugas sekolah dengan lebih baik. Dalam dunia pendidikan,
contoh lain yang menyangkut konstrruk, misalnya ketakutan, kreativitas, semangat,
dan sebagainya.
Proses melakukan validasi konstruk dapat dilakukan dengan cara melibatkan
hipotesis testing yang dideduksi dari teori yang menyangkut dengan konstruk yang
relevan. Misalnya jika suatu teori kecemasan menyatakan bahwa seseorang yang
memiliki kecemasan yang lebih tinggi akan bekerja lebih lama dalam
menyelesaikan suatu masalah, dibanding dengan orang yang memiliki tingkat
kecemasan rendah. Jika terjadi orang yang cemasnya tinggi ternyata kemudian
bekerja sebaliknya, yaitu lebih cepat, ini bukan berarti bahwa tes yang sudah baku
tadi berarti tidak mengukur kecemasan orang. Atau dengan kata lain hipotesis yang
berhubungan dengan tingkah laku seseorang dengan kecemasan tinggi tidak benar.
Dari kasus tersebut mengindikasikan bahwa konstruk yang berhubungan dengan
orang yang memiliki kecemasan tinggi memerlukan kaji ulang, guna mengadakan
koreksi dan penyesuaian kembali. Umumnya beberapa studi yang tidak
berhubungan digunakan untuk mendukung kredibilitas tes konstruk yang telah ada.
3. Validitas Kriteria
Validitas kriteria fokus pada membandingkan instrumen yang telah
dikembangkan dengan instrumen lain yang dianggap sebanding dengan apa yang
akan dinilai oleh instrumen yang telah dikembangkan. Instrumen lain ini disebut
sebagai kriteria. Ada dua jenis validitas kriteria: 1) Validitas Kriteria Prediktif dan
2) Validitas Kriteria Bersamaan (Concurrent) (Fraenkel, Wallen, & Hyun, 2012).
Perbedaan kedua uji validitas kriteria tersebut terletak pada waktu pengujian
instrumen dengan kriterianya. Jika pengujian instrumen dan kriterianya dilakukan
pada waktu yang berbeda, maka disebut dengan validitas kriteria prediktif,
sedangkan jika pengujian instrumen dengan kriterianya dilakukan pada waktu yang
bersamaan maka disebut dengan validitas kriteria bersamaan (concurrent).
Hasil dari uji instrumen dan kriterianya kemudian dihubungkan dengan uji
korelasi. Berikut ini disajikan rumus korelasi untuk mencari koefisien korelasi hasil
uji instrumen dengan uji kriterianya.
6
Keterangan :
rxy = koefisien korelasi
n = jumlah responden
xi = skor setiap item pada instrumen
yi = skor setiap item pada kriteria
Nilai koefisien ini disebut sebagai koefisien validitas (Fraenkel, Wallen, &
Hyun, 2012). Nilai koefisien validitas berkisar antara +1,00 sampai -1,00. Nilai
koefisien +1,00 mengindikasikan bahwa individu pada uji instrumen maupun uji
kriteria, memiliki hasil yang relatif sama, sedangan jika koefisien validitas bernilai
0 mengindikasikan bahwa tidak ada hubungan antara instrumen dengan kriterianya.
Semakin tinggi nilai koefisien validitas suatu instrumen, maka semakin baik
instrumen tersebut.
Hasil yang dicapai atau koefisien validitas yang muncul menunjukkan derajat
hubungan validitas tes yang baru. Jika koefisien tinggi, berarti tes yang baru
tersebut mempunyai validitas konkruen yang baik. Sebaliknya tes yang baru
dikatakan mempunyai validitas konkruen yang jelek, jika koefisien yang dihasilkan
rendah.
Metode pembeda (discrimination) merupakan validitas konkruen yang
melibatkan penentuan suatu tes. Jika skor tes dapat digunakan untuk membedakan
antara orang yang memiliki sifat-sifat tertentu yang diinginkan dengan seseorang
yang tidak memiliki sifat-sifat tersebut. Tes mental adalah merupakan contoh nyata
terapan suatu tes pembeda yang sering ditemui dalam kasus-kasus psikologi. Jika
hasil skor suatu tes dapat digunakan dengan benar untuk mengklarifikasi person
yang satu dengan person lainnya maka validitas konkruen tes tersebut memiliki
daya pembeda yang baik.
4. Validitas Prediksi
Validitas prediksi adalah derajat yang menunjukkan suatu tes dapat
memprediksi tentang bagaimana seseorang akan melakukan suatu prospek tugas
atau pekerjaan yang direncanakan. Tes kemampuan aljabar, sebagai contohnya,
dapat dikatakan mempunyai nilai validitas prediksi, jika tes tersebut dapat menduga
pada seseorang yang memiliki kemampuan aljabar dengan anak yang tidak
memiliki kemampuan. Tes kemampuan akademik yang sering diberikan pada
mahasiswa yang hendak melanjutkan ke jenjang pascasarjana juga dikenal juga
mempunyai nilai prediksi yang baik terhadap calon mahasiswa dalam
menyelesaikan studi di pascasarjana tersebut. Instrumen validitas prediksi mungkin
bervariasi bentuknya tergantung beberapa faktor, misalnya kurikulum yang
digunakan, buku pegangan yang dipakai, intensitas mengejar, dan letak geografis
atau daerah sekolah. Yang perlu diperhatikan ketika kita akan melakukan tes
7
prediksi di antaranya adalah perlunya memperhatikan proses dan cara
membandingkan instrumen yang divalidasi dengan tes yang telah dibakukan. Untuk
tes validasi prediksi, prinsip instrumen umum yang menyatakan bahwa tidak ada
tes yang memiliki tes prediksi sempurna masih tetap berlaku. Oleh karena itu, perlu
disadari bahwa skor tes yang dihasilkan juga memiliki sifat ketidaksempurnaan
tersebut.
Validitas prediksi suatu tes pada umumnya ditentukan dengan membangun
hubungan antara skor tes dan beberapa ukuran keberhasilan dalam situasi tertentu
yang digunakan untuk memprediksi keberhasilan, yang selanjutnya disebut sebagai
predicktor. Sedangkan tingkah laku yang hendak diprediksi pada umumnya disebut
sebagai criterion.
Dalam membuat validasi prediksi, suatu tes biasanya mempunyai sekuensi
sebagai berikut. Pertama, mengidentifikasi dan mendefinisikan secara teliti
criterion yang hendak diinginkan. Kriteria yang terpilih harus mengukur validitas
terhadap tingkah laku yang diprediksi. Sebagai contoh misalnya, jika kita hendak
memprediksi mata kuliah matematika. Kelengkapan kehadiran kuliah satu
semester, menyelesaikan tugas-tugas yang diberikan dan mengikuti mid semester
dari kulih tersebut dapat digunakan sebagai indikator criterion. Sedangkan
mahasiswa yang tidak hadir dan tidak mengumpulkan tugas-tugasnya, skor penuh
yang diperoleh menunjukkan bahwa nilai tersebut tidak merefleksikan prediksi
keberhasilan.
Yang perlu diperhatikan ketika suatu criterion ditentukan oleh seorang peneliti
adalah bahwa dalam menentukan tercapainya suatu kriteria, apakah sebagian besar
mahasiswa yang mengambil mata kuliah tersebut dapat mencapai suatu kriteria
yang sudah ditentukan? Seberapa besar mahasiswa dapat mencapai kriteria dalam
suatu tes sering disebut sebagai rerata dasar atau baserate. Rerata dasar adalah
proporsi individual yang diharapkan dapat memenuhi criterion yang telah
ditentukan. Dalam penentuan criterion suatu objek, kita sebaiknya menghindari
criterion di mana nilai rerata dasarnya adalah sangat tinggi. Nilai rerata dasar tinggi
berarti sangat mudah. Sebaliknya jangan pula terjadi bahwa nilai rerata dasar yang
ada ternyata sangat rendah. Karena nilai rerata dasar rendah tidak lain adalah
menunjukkan bahwa nilai tes sangat sulit.
Ketika kriteria telah diidentifikasi dan ditentukan, prosedur selanjutnya adalah
menentukan validitas prediksi suatu tes dengan cara seperti berikut.
a. Buat item tes sesuai dengan tujuan yang hendak dicapai.
b. Tentukan grup yang dijadikan subjek dalam pilot study.
c. Identifikasi criterion prediksi yang hendak dicapai.
d. Tunggu sampai tingkah laku yang diprediksi atau variabel criterion muncul dan
terpenuhi dalam grup yang telah ditentukan.
e. Capai ukuran-ukuran criterion tersebut.
f. Korelasikan dua set skor yang dihasilkan.
8
2.2 Reliabilitas
2.2.1 Pengertian Reliabilitas

Reliabilitas dalam KBBI diartikan sebagai perihal sesuatu yang bersifat reliabel
(bersifat andal), ketelitian, dan ketepatan teknik pengukuran. Beberapa ahli
mengemukakan pendapatnya mengenai pengertian reliabilitas antara lain; Menurut
Sekaran, reliabilitas atau keandalan suatu pengukuran menunjukkan sejauh mana
pengukuran tersebut tanpa bias (bebas dari kesalahan) dank arena itu menjamin
pengukuran yang konsisten lintas waktu dan lintas beragam item dalam instrument.
Dengan kata lain, keandalan suatu pengukuran merupakan indikasi mengenai stabilitas
dan konsistensi di mana instrument mengukur konsep dan membantu menilai
“ketepatan” sebuah pengukuran, selanjutnya Groth-Marnat mendefinisikan reliabilitas
suatu test merujuk pada derajat stabilitas, konsistensi, daya prediksi, dan akurasi. Ia
melihat seberapa skor-skor yang diperoleh seseorang itu akan menjadi sama jika orang
itu diperiksa ulang dengan tes yang sama pada kesempatan berbeda, sedangkan
Menurut Sugiyono, instrumen yang reliabel adalah instrumen yang bila digunakan
beberapa kali untuk mengukur objek yang sama akan menghasilkan data yang sama.
Dari tiga definisi di atas jelas bahwa reliabilitas instrument terkait dengan bebas dari
bias (error free) dan konsistensi instrument.
Pengertian reliabilitas menunjuk pada ketetapan (konsistensi) dari nilai yang
diperoleh sekelompok individu dalam kesempatan yang berbeda dengan test yang sama
ataupun yang itemnya ekuivalen. Konsep reliabilitas mendasari kesalahan ukuran yang
mungkin terjadi pada nilai tunggal tertentu, sehingga susunan dari kelompok mungkin
berubah.
Reliabel lebih mudah dimengerti, dengan memperhatikan tiga aspek dari suatu
alat ukur, yaitu : kemantapan, ketepatan , dan homogenitas. Suatu instrumen dikatakan
mantap apabila dalam mengukur sesuatu berulang kali, dengan syarat bahwa kondisi
saat pengukuran tidak berubah, instrumen tersebut memberikan hasil yang sama.
Ketepatan menunjuk kepada instrumen yang tepat / benar dalam mengukur dari sesuatu
yang diukur. Instrumen yang tepat adalah instrumen dimana pernyataannya jelas,
mudah dimengerti dan rinci. Homogenitas, menunjuk kepada instrumen yang
mempunyai kaitan erat satu sama lain dalam unsur – unsur dasarnya.
Contoh, umpamanya kita menimbang badan kita pada suatu timbangan dan
jarum menunjukan angka 59. Tak lama kemudian kita coba timbangan itu, ternyata
menunjuk angka 63. Kita katakan bahwa terjadi kesalahan pengukuran , timbangan
tersebut tidak reabel.
Reliabilitas menunjuk pada satu pengertian bahwa sesuatu instrumen cukup
dapat dipercaya untuk digunakan sebagai alat pengumpul data karena instrumen
tersebut sudah baik. Instrumen yang baik tidak akan bersifat tendensius mengarahkan
responden untuk memilih jawaban-jawaban tertentu. Instumen yang sudah dapat
dipercaya, yang reliabel akan menghasilkan data yang dapat dipercaya juga. Apabila
datanya memang benar sesuai dengan kenyataannya, maka berapa kalipun diambil,
9
tetap akan sama. Reliabilitas menunjuk pada tingkat keterandalan sesuatu. Reliabel
artinya, dapat dipercaya, jadi dapat diandalkan.
2.2.2 Jenis – Jenis Reliabilitas

1. Koefisien Stabilitas
Cronbach menggunakan istilah Coefficient of stability (koefisien stabilitas) test
dimana terjadi kesalahan pengukuran dalam nilai test ketika diadakan testing pada
waktu tertentu ke jangka waktu berikutnya. Pengukuran semacam itu menunjukan
sampel dimana nilai-nilai suatu test itu mantap atau dipengaruhi perubahan-
perubahan kondisi dalam ingkungan test. Teknik yang dipergunakan dalam
menentukan corak reliabilitas semacam ini adalah metode test-retest yaitu
pengulangan test yang sama. Koefisien reliabilitas diperoleh melalui korelasi nilai
yang diperoleh orang-orang yang sama melalui dua kali administrasi test tertentu.
2. Koefisien Ekuivalen
Yang dimaksud dengan aspek reliabilitas yang ini adalah pengukuran yang
didasarkan atas perangkat item test yang ekuivalen ( artinya berbeda bentuk tetapi
sama isinya), yang masing-masing perangkatnya berdiri sendiri meskipun jumlah
tingkat kesukaran dan luas itemnya sama.
Metode yang dipakai dalam menyelidiki reliabilitas test ini adalah dengan
menggunakan dua bentuk test yang paralel ( ekuivalen). Syarat-syarat yang harus
dipenuhi dua test paralel :
a. Kriteria yang dipakai pada kedua test sama
b. Masing-masing test dikonstruksi sendiri
c. Jumlah item, isi, dan corak sama.
d. Tingkat kesukaran sama
Suatu teknik yang terkenal dalam menghitung ekuivalensi item melalui
administrasi satu test tunggal adalah teknik ;perhitungan reliabilitas Split-Half. Split
berrti membelah dan half berati separo. Test dibelah menjadi dua bagian yang sama
dengan menyatukan item test yang nomornya ganjil dalam belahan pertama (X) dan
yang nomornya genap dalam belahan kedua (Y). Angka yang diperoleh pada test
belahan X dikorelasikan dengan angka yang diperoleh pada test belahan Y dengan
menggunakan rumus Pearson:
∑(𝑋𝑌) − 𝑁 (𝑀𝑥)(𝑀𝑦)
𝑟=
√(∑ 𝑋2 − 𝑁𝑀𝑥2) (∑ 𝑌2 − 𝑁𝑀𝑦2)
Keterangan :
r = koefisien korelasi
X = angka individu untuk test nomor item ganjil
Y = angka individu untuk test nomor genap
Mx = rata -rata X
My = rata -rata Y
N = Jumlah pengikut ujian
10
Koefisien korelasi yang diperoleh baru menunjukan reliabilitas setengah test.
Setelah kita memperoleh angka korelasi dari angka individu pada nomernomer
ganjil dan genap maka untuk mencari koefisien reliabilitas dari keseluruhan test
dipakai rumus Spearman Brown:
Keterangan :
ri = reliabilitas instrument
rb = indeks korelasi antara dua belahan instrument
N = banyaknya responden
X = belahan pertama
Y = belahan kedua
3. Homogenitas Item
Aspek reliabilitas yang terakhir ini menunjukan ketetapan dalam
penyelenggaraan suatu test tertentu menghadapi semua item. Suatu contoh konkrit:
bila suatu test terdiri dari bagian –bagian perbendaharaan kata, struktur kalimat, dan
tatabahasa, sedangkan test bahasa yang lain hanya berisi item-item perbendaharaan
kata-kata, maka jelas bahwa item-item test terakhir ini lebih homogen dari pada test
pertama sehingga prestasi individu pada test ke 1 merupakan prestasi terhadap test
yang itemnya heterogen.
Ramalan test yang kriterianya homogen menghasilkan interprestasi yang lebih
paasti daripada yang sifatnya heterogen. Sebenarnya masalah ini lebih banyak
dicakup oleh konsep validitas daripada reliabilitas. Namun begitu ketetapan
(konsistensi) respon subyek terhadap semua item test dicari melalui teknik
perhitungan yang terkenal dengan nama: Kuder- Richardson. Teknik ini yang
menunjuk pada konsistensi item-item didasarkan atas administrasi satu test. Rumus
yang terkenal dengan teknik ini adalah sebagai berikut :
Rumus KR-20
11
Keterangan :
ri= reliabilitas instrument
k= banyaknya butir pertanyaan atau banyaknya soal st2 = varians total
pi = proporsi subjek yang menjawab betul pada suatu butir (proporsi subjek
yang mendapat skor 1)
pi = banyaknya subjek yang skornya 1 / N
qi = 1 – pi
Atau
Rumus KR-21
Keterangan :
k= banyaknya butir pertanyaan atau banyaknya soal
𝜎𝑡2 = varians total
pp = skor rata-rata
2.2.3 Faktor Yang Mempengaruhi Reliabilitas
1. Banyaknya Butir Soal
Banyaknya soal pada instrumen ikut mempengaruhi derajat reliabilitas,

sebagaimana dinyatakan dalam rumus Spearman, Brown. Hubungan antara jumlah
butir dengan reliabilitas dapat dilihat pada keadaan berikut:
12
Gambaran diatas menunjukkan bahwa semakin tinggi tingkat reliabilitas
instrumen, semakin sedikit peningkatan yang terjadi akibat pelipatgandaan
butirnya. Makin banyak butir makin reliabel.
2. Range skor total
Makin besar range skor total, alat ukur makin reliabel, karena menunjukkan
bahwa subyek uji coba heterogen.
3. Homogenitas item
Soal yang memili homogenitas tinggi cenderung mengarah kepada

tingginya tingkat reliabilitas. Dua buah tes yang sama jumlah butir-butirnya akan
tetapi berbeda isinya, misal yang satu mengukur pengetahuan kebahasaan dan yang
lainnya mengukur kemampuan kimia, akan menghasilkan tingkat reliabilitas yang
berbeda. Tes kimia cenderung menghasilkan tingkat reliabilitas yang lebih tinggi
daripada tes kebahasaan karena segi isi kemampuan menyelesaikan soal kimia lebih
homogen daripada pengetahuan kebahasaan.Makin homogen aitem, makin reliabel.
4. Waktu yang diperlukan untuk menyelesaikan tes
Semakin terbatasnya waktu dalam pengerjaan tes, maka akan mendorong

tes cenderung memiliki reliabilitas yang tinggi.
5. Keseragaman kondisi pada saat tes diberikan
Kondisi pelaksanaan tes semakin seragam akan memunculkan reliabilitas

yang makin tinggi.
6. Kecocokan tingkat kesukaran terhadap peserta tes
Bahwa soal-soal dengan tingkat kesukaran sedang, cenderung lebih reliable

dibandingkan dengan soal-soal yang sangat sukar maupun sangat mudah. Tingkat
kesulitan butir soal, butir yang terlalu mudah atau terlalu sulit, reliabilitas rendah.
Tingkat kesulitan yang baik berkisar 0.25s/d 0.75.
7. Heteroginitas kelompok
Bahwa semakin heterogen kelompok dalam pengerjaan tes, maka tes
13
tersebut semakin cenderung untuk menunjukkan tingkat reliabilitas yang tinggi.
8. Variabilitas skor
Instrumen yang menghasilkan rentangan skor yang lebih luas atau lebih
tinggi variabilitasnya, akan memiliki tingkat reliabilitas yang lebih tinggi daripada
yang menghasikan rentangan skor yang lebih sempit, seperti bentuk pilihan ganda
cenderung menghasilkan tingkat reliabilitas yang lebih tinggi daripada bentuk
benar- salah.
9. Motivasi individu
Masing-masing individu dalam mengerjakan suatu instrumen akan

mempengaruhi tingkat reliabilitas tersebut secara sungguh-sungguh sehingga
jawaban yang diberikan tidak akan mencerminkan kenyataan yang sebenarnya.
2.3 Uji Persyaratan Analisis Data Penelitian Infrensial

Pengujian prasyarat analisis, merupakan konsep dasar untuk menetapkan statistik
uji mana yang diperlukan, apakah uji menggunakan statistik parametrik atau non
parametrik. Uji prasyarat , yakni uji homogenitas variansi populasi dan uji normalitas untuk
sebaran data hasil penelitian.
1. Uji Homogenitas
Uji homogenitas digunakan untuk mengetahui apakah beberapa varian populasi
adalah sama atau tidak. Uji ini dilakukan sebagai prasyarat dalam analisis independent
sample t test dan Anova. Asumsi yang mendasari dalam analisis varian (Anova) adalah
bahwa varian dari populasi adalah sama. Uji kesamaan dua varians digunakan untuk
menguji apakah sebaran data tersebut homogen atau tidak, yaitu dengan
membandingkan kedua variansnya. Jika dua kelompok data atau lebih mempunyai
varians yang sama besarnya, maka uji homogenitas tidak perlu dilakukan lagi karena
datanya sudah dianggap homogen. Uji homogenitas dapat dilakukan apabila kelompok
data tersebut dalam distribusi normal. Uji homogenitas dilakukan untuk menunjukkan
bahwa perbedaan yang terjadi pada uji statistik parametrik (misalnya uji t, Anava,
Anacova ) benar-benar terjadi akibat adanya perbedaan antar kelompok, bukan sebagai
akibat perbedaan dalam kelompok. Uji homogenitas variansi sangat diperlukan
sebelum membandingkan dua kelompok atau lebih, agar perbedaan yang ada bukan
disebabkan oleh adanya perbedaan data dasar (ketidakhomogenan kelompok yang
dibandingkan). Salah satu rumus yang bisa digunakan untuk uji homogenistas variansi,
yaitu uji Harley.
Uji Harley merupakan uji homogenitas variansi yang sangat sederhana karena
cukup membandingkan variansi terbesar dengan variansi terkecil. Uji homogenitas
variansi dengan rumus Harley bisa digunakan jika jumlah sampel antar kelompok sama
14
Misal ada dua populasi normal dengan varians 𝜎12 dan 𝜎22 . Akan diuji mengenai uji dua
pihak untuk pasangan hipotesis:
𝐻₀ : 𝜎12 = 𝜎22
𝐻1 : 𝜎12 ≠ 𝜎
Statistik yang digunakan untuk menguji hipotesis 𝐻₀ adalah :
𝑣𝑎𝑟𝑖𝑎𝑛𝑠 𝑡𝑒𝑟𝑏𝑒𝑠𝑎𝑟
𝐹= 𝑣𝑎𝑟𝑖𝑎𝑛𝑠 𝑡𝑒𝑟𝑘𝑒𝑐𝑖𝑙
Dimana tolak 𝐻₀ jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 ≥ 𝐹1/2𝑎 (𝑣1. 𝑣2)
2. Uji Normalitas
Uji normalitas yang paling sederhana adalah membuat grafik distribusi frekuensi
atas skor yang ada. Pengujian kenormalan tergantung pada kemampuan kita dalam
mencermati plotting data. Jika jumlah data cukup banyak dan penyebarannya tidak
100% normal ( tidak normal sempurna), maka kesimpulan yang ditarik kemungkinan
akan salah. Pada saat sekarang ini sudah banyak cara yang dikembangkan para ahli
untuk melakukan pengujian normalitas. Salah satu rumus yang bisa digunakan untuk
uji normalitas, yaitu Uji Kolmogorov-Smirnov.
Uji Kolmogorov Smirnov Dalam uji Kolmogorov Smirnov hipotesis yang diajukan
adalah:
𝐻₀ : f(X) = normal
𝐻1 : 𝑓(𝑋) ≠ 𝑛𝑜𝑟𝑚𝑎𝑙
Langkah-langkah dari uji Kolmogorov Smirnov adalah:
a. Menentukan rata-rata dan standar deviasi data
b. Menyusun data dimulai dari yang terkecil diikuti dengan frekuensi masing-masing
, frekuensi kumulatif (F) dari masing-masing skor. Nilai Z ditentukan dengan
rumus;
𝑋 − 𝑋̅
𝑍 𝑠𝑘𝑜𝑟 =
𝜎
Dimana :
𝑋̅ = rata – rata
𝜎 = 𝑠𝑖𝑚𝑝𝑎𝑛𝑔𝑎𝑛 𝑏𝑎𝑘𝑢
∑(𝑥𝑖 − 𝑥̅ )2
𝜎= √
𝑛−1
c. Tentukan Probabilitas dibawah nilai Z yang dapat dilihat pada table Z (P ≤ Z)

d. Tentukan nilai selisih masing- masing baris dan selisih masing-masing F/n = Fz
dengan P ≤ Z (nilai 𝑎2 ) dan selisih masing – masing f/n dengan 𝑎2 (nilai 𝑎1 )
e. Selanjutnya bandingkan nilai tertinggi dari 𝑎1 dengan Tabel Kolmogorov
Smirnov.
f. Selanjutnya Kriteria Pengujian adalah:
Terima 𝐻₀ jika 𝑎1 maks ≤ 𝐷𝑡𝑎𝑏𝑒𝑙
Tolak 𝐻 0 jika 𝑎1 maks > 𝐷𝑡𝑎𝑏𝑒𝑙
15
BAB III
PENUTUP
A. Kesimpulan
Validitas merupakan suatu ukuran yang menunjukkan tingkat-tingkat kevalidan
atau kesahihan suatu instrumen. Suatu instrumen yang valid atau sahih mempunyai
validitas tinggi. Sebaliknya, instrumen yang kurang valid bearti memiliki validitas
rendah. Sebuah instrumen dikatakan valid apabila mampu mengukur apa yang
diinginkan. Sebuah instrumen dikatakan valid apabila dapat mengungkapakan data dari
variabel yang diteliti secara tepat. Tinggi rendahnya validitas instrumen menunjukkan
sejauh mana data yang terkumpul tidak menyimpang dari gambaran tentang validitas
yang dimaksud. Suatu instrumen dikatakan valid jika instrumen yang digunakan dapat
mengukur apa yang hendak diukur. Secara metodologis, validitas suatu tes dapat
dibedakan menjadi empat macam, yaitu validitas isi, konstruk, kriteria, dan prediksi.
Pengertian reliabilitas menunjuk pada ketetapan (konsistensi) dari nilai yang
diperoleh sekelompok individu dalam kesempatan yang berbeda dengan test yang sama
ataupun yang itemnya ekuivalen. Konsep reliabilitas mendasari kesalahan ukuran yang
mungkin terjadi pada nilai tunggal tertentu, sehingga susunan dari kelompok mungkin
berubah. Reliabel lebih mudah dimengerti, dengan memperhatikan tiga aspek dari suatu
alat ukur, yaitu : kemantapan, ketepatan , dan homogenitas.
B. Saran
Oleh karena pengujian ini merupakan suatu hal yang penting dalam suatu
penelitian, alangkah suatu keharusan untuk peneliti mampu memahami teori pengujian
maupun praktiknya. Karena dengan instrumen ataupun data yang valid dan reliabel,
tentu saja akan menghasilkan suatu kesimpulan penelitian yang berkualitas yakni sesuai
dengan fakta yang ada.
16
DAFTAR PUSTAKA
Matondang, Z. (2009). Validitas dan reliabilitas suatu instrumen penelitian. Jurnal

tabularasa, 6(1), 87-97.
Usmadi, U. (2020). PENGUJIAN PERSYARATAN ANALISIS (UJI HOMOGENITAS DAN

UJI NORMALITAS). Inovasi Pendidikan, 7(1).
Yusup, F. (2018). Uji validitas dan reliabilitas instrumen penelitian kuantitatif. Tarbiyah:
Jurnal Ilmiah Kependidikan, 7(1).
17

VALIDITAS DAN RELIABILITAS

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

VALIDITAS DAN RELIABILITAS

Diunggah oleh

Hak Cipta:

Format Tersedia

“VALIDITAS DAN RELIABILITAS INSTRUMEN PENELITIAN SERTA

PERSYARATAN PENGUKURAN DALAM PENELITIAN”

Diajukan untuk memenuhi Tugas Rutin

Mata Kuliah Metodologi Penelitian

DOSEN PENGAMPU : DR. WILDANSYAH LUBIS, M.PD

SITI SYAFRIDA RAHMI 1191111057

MIFTAHUL JANNAH 1192411023

ROSELLA PRISELYA DABUKKE 1192411026

PROGRAM STUDI S1 PENDIDIKAN GURU SEKOLAH DASAR

FAKULTAS ILMU PENDIDIKAN

UNIVERSITAS NEGERI MEDAN MEDAN

Medan, 20 Oktober 2021

KATA PENGANTAR ................................................................................................................ i

2.1.1 Pengertian Validitas

2.1.2 Jenis – Jenis Validitas

2.2.1 Pengertian Reliabilitas

2.2.2 Jenis – Jenis Reliabilitas

rb = indeks korelasi antara dua belahan instrument

ri= reliabilitas instrument

k= banyaknya butir pertanyaan atau banyaknya soal st2 = varians total

pi = banyaknya subjek yang skornya 1 / N

k= banyaknya butir pertanyaan atau banyaknya soal

𝜎𝑡2 = varians total

2.2.3 Faktor Yang Mempengaruhi Reliabilitas

1. Banyaknya Butir Soal

Banyaknya soal pada instrumen ikut mempengaruhi derajat reliabilitas,

2. Range skor total

Soal yang memili homogenitas tinggi cenderung mengarah kepada

4. Waktu yang diperlukan untuk menyelesaikan tes

Semakin terbatasnya waktu dalam pengerjaan tes, maka akan mendorong

5. Keseragaman kondisi pada saat tes diberikan

Kondisi pelaksanaan tes semakin seragam akan memunculkan reliabilitas

6. Kecocokan tingkat kesukaran terhadap peserta tes

Bahwa soal-soal dengan tingkat kesukaran sedang, cenderung lebih reliable

Bahwa semakin heterogen kelompok dalam pengerjaan tes, maka tes

Masing-masing individu dalam mengerjakan suatu instrumen akan

2.3 Uji Persyaratan Analisis Data Penelitian Infrensial

c. Tentukan Probabilitas dibawah nilai Z yang dapat dilihat pada table Z (P ≤ Z)

Matondang, Z. (2009). Validitas dan reliabilitas suatu instrumen penelitian. Jurnal

Usmadi, U. (2020). PENGUJIAN PERSYARATAN ANALISIS (UJI HOMOGENITAS DAN

Anda mungkin juga menyukai