Anda di halaman 1dari 12

RELIABILITAS DAN VALIDITAS

1. RELIABILITAS
1.1 Definisi Reliabilitas
Reliabilitas menyangkut ketepatan alat ukur. Pengertian reliabilitas dapat lebih mudah
dipikirkan jika pertanyaan berikut dijawab :
1) Jika set objek yang sama diukur berkali-kali dengan alat ukur yang sama, apakah kita
akan memperoleh hasil yang sama?
2) Apakah alat ukur yang diperoleh dengan menggunakan alat ukut tertentu adalah alat
ukur yang sebenarnya dari objek tersebut?
3) Berapa besar error yang kita peroleh dengan menggunakan ukuran tersebut terhadap
objek?
Jawaban terhadap pertanyaan tersebut tidak lain dari 3 aspek pengertian tentang
reliabilitas. Suatu alat ukur disebut mempunyai reliabilitas tinggi atau dapat dipercaya
jika alat ukur itu mantap, dalam pengertian bahwa alat ukur tersebut stabil, dapat
diandalkan (dependability) dan dapat diramalkan (predictability).Suatu alat ukur yang
mantap tidak berubah-ubah pengukurannya dan dapat diandalkan karena penggunaan alat
ukur tersebut berkali-kali akan memberikan hasil yang serupa.
Pertanyaan kedua member aspek akurasi. Suatu pertanyaan atau ukuran yang akurat
adalah ukuran yang cocok dengan yang ingin diukur. Jika kedua aspek di atas, yaitu
aspek stabilitas dan aspek akurasi digabungkan, maka dapat disimpulkan bahwa alat ukur
tersebut mantap dan dapat mengukur secara cermat dan tepat. Suatu alat ukur juga harus
sedemikian rupa sifatnya sehingga error yang terjadi, yaitu error pengukuran yang
random sifatnya, dapat ditolerir.
Dari aspek-aspek reliabilitas di atas, dapat disimpulkan bahwa reliabilitas adalah
ketepatan atau tingkat presisi suatu ukuran atau alat pengukur.

1.2 Teori Reliabilitas


Untuk melihat relibilitas suatu alat atau instrumen, kita harus memiliki suatu alat
yang standar. Ukuran yang diperoleh dengan menggunakan alat standar ini dinamakan
ukuran yang sebenarnya atau skor yang sebenarnya. Skor yang diperoleh dengan
menggunakan alat yang kita pakai, dinamakan skor yang diperoleh. Selisih angka antara
skor yang sebenarnya dengan skor yang kita peroleh, kita sebut error ukuran. Jika kita
nyatakan :
Ys = skor yang sebenarnya
Yp = skor yang diperoleh
Ye = error pengukuran
Maka suatu identity dapat dibangun, yaitu :
Yp = Ys + Ye
Besarnya error (galat) pengukuran adalah :
Y p−Y s
G=
Yp
Dalam praktik, reliabilitas dinyatakan dalan bentuk variance. Dalam bentuk variance,
identiti di atas dapat ditulis sebagai :
Vp = variance yang diperoleh
Vs = variance sebenarnya
Ve = variance error
Reliabilitas dapat dilihat dari error yang dibuat. Makin besar error yang terjadi, maka
makin kecil reliabilitas pengukuran, dan begitu pula sebaliknya. Untuk mencari derajat
reliabilitas, maka digunakan koefisien reliabilitas (r) yang memiliki 2 arti, yaitu :
a). Reliabilitas adalah perbandingan antara variance sebenarnya dengan variance yang
diperoleh, yaitu :
Vs
r=
Vp
b). Reliabilitas adalah perbandingan antara selisih variance diperoleh dengan variance
error dan variance sebenarnya, yaitu :
V p −V e Ve
r= =1−
Vp Vp
1.3 Menguji Indeks Reliabilitas
Reliabilitas alat penelitian dapat diuji / dinilai dengan menggunakan beberapa teknik,
antara lain :
1) Teknik kesesuaian
Menilai reliabilitas dengan teknik kesesuaian adlah dengan cara mencari indeks
kesesuaian kasar (crude index of agreement). Caranya adalah dengan mengulang
penelitian dengan menggunakan alat yang sama, responden yang sama, dan dalam
waktu yang tidak lama. Hasil penelitian pertama kemudian digabungkan dengan hasil
penelitian kedua, lalu menganalisis stabilitas dari jawaban.
2) Teknik paralel
Teknik ini hampir serupa prosedurnya dengan teknik penyesuaian, hanya saja
dalam tenik paralel, variabel diukur 2 kali pada waktu yang sama atau hampir
bersamaan. Kerja memisahkan pengukuran atas dua bagian yang paralel dapat
dilakukan dengan 2 cara, yaitu :
- Dua peneliti menggunakan alat ukur yang sama, atau
- Satu peneliti menggunakan dua alat ukur yang berbeda dalam pengertian
bahwa alat-alat ukur tersebut memang diperuntukkan bagi pengukuran
variabel yang bersangkutan
Langkah pertama dalam mencari reliabilitas adalah dengan mencari korelasi
antara kedua hasil ukuran tersebut, dengan cara mencari koefisien korelasi
Spearmam. Dari angka korelasi Spearman tersebut, koefisien reliabilitas dapat dicari
dengan menggunakan rumus :

r=
1+ ρ
dimana :
 = koefisien korelasi Spearman
r = koefisien reliabilitas
Sedangkan koefisien korelasi Spearman, dicari dengan menggunakan rumus :
6 D2
ρ=1−
N (N 2−1)
3) Teknik belah dua (split half)
Teknik ini hampir sama dengan teknik paralel, hanya saja pada teknik split half,
observasi dibagi menjadi dua bagian. Teknik ini bertujuan untuk menguji reliabilitas
pertanyaan-pertanyaan atau pernyataan-pernyataan berbentuk skala, yang mempunyai
hubungan satu sama lain. Penilaian reliabilitas ini bertujuan untuk mengukur internal
konsistensi pertanyaan atau pernyataan.
Rumus reliabilitas yang dikemukakan oleh Kuder dan Richardson (1937) :
∑ p.q
KR=
k
k −1{1−
k. s
2 }
dimana :
k = jumlah item yang diuji
p = proporsi respon yang benar
q = proporsi respon yang salah = 1 - p
s2 = variance dari skor
M = mean dari skor

2. VALIDITAS
Reliabilitas alat ukur menunjukkan pada kita tentang sifat suatu alat ukur dalam
pengertian apakah suatu alat ukur cukup akurat, stabil, atau konsisten dalam mengukur apa
yang ingin kita ukur. Di lain pihak, validitas mempersoalkan apakah kita benar-bnar
mengukur apa yang kita pikirkan sedang kita ukur.
Istilah validitas ternyata memiliki keragaman kategori. Ebel (dalam Nazir 1988)
membagi validitas menjadi concurrent validity, construct validity, face validity, factorial
validity, empirical validity, intrinsic validity, predictive validity, content validity, dan
curricular validity.
§ Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan
kinerja.
§ Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa
yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu
dapat dapat menyebabkan kinerja yang baik dalam pengukuran.
§ Face Validity adalah validitas yang berhubungan apa yang nampak dalam mengukur
sesuatu dan bukan terhadap apa yang seharusnya hendak diukur.
§ Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-
faktor yang yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya,
dimana validitas ini diperoleh dengan menggunakan teknik analisis faktor.
§ Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan
suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang
ingin diramalkan oleh pengukuran.
§ Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba
untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bahwa suatu alat ukur
benar-benar mengukur apa yang seharusnya diukur.
§ Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat
ukur dengan kinerja seseorang di masa mendatang.
§ Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari
suatu populasi.
§ Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari
pengukuran dan menilai seberapa jauh pengukuran tersebut merupakan alat ukur yang
benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.
Berdasarkan definisi-definisi validitas di atas, terlihat bahwa terdapat tumpang tindih
antara yang satu dengan lainnya.Oleh karena itu, Thorndike dan Hagen membagi validitas
atas dua jenis saja, yaitu validitas langsung dan validitas derivatif. Validitas langsung adalah
validitas yang berdasarkan pada analisis rasional dan putusan profesi (professional
judgment), sedangkan validaitas derivatif bergantung pada pembuktian statistic dan empiris.
Kerlinger membagi validitas menjadi tiga jenis, yaitu validitas isi, validitas yang
berhubungan dengan kriteria, dan validitas konstrak.
2.1 Validitas Isi
Validitas isi mempersoalkan apakah isi dari suatu alat ukur (bahannya, topiknya,
subsansinya) cukup representative untuk sebuah sampling. Validitas isi dipandu oleh
pertanyaan : “Apakah isi atau substansi dari alat ukur ini merupakan representative dari
sifat-sifat universal yang ingin diukur?”
Definis dasar dari validaitas isi adalah suatu pendapat, baik pendapat pribadi maupun
pendapat orang lain. Tiap-tiap item dalam uji perlu dipelajari secara seksama, dan
kemudian dipertimbangkan tentang representative tidaknya isi yang akan diuji.
Contoh dari validitas isi adalah : seorang dosen memberikan ujian tengah semester
pada Fakultas Pertanian. Materi yang diberikan selama setengah semester telah
ditentukan dalam course outline. Dosen tersebut membuat soal dalam bentuk objektif dan
essai. Soal tersebut perlu dipertanyakan apakah soal yang dibuat telah mencakup
keseluruhan isi pelajaran sesuai dengan course outline. Pertanyaan tersebut
mempersoalkan masalah validitas isi dari alat ukur (soal ujian) yang digunakan untuk
mengukur prestasi mahasiswa dalam jarak waktu setengah semester. Kita lihat bahwa
dalam menentukan validitas isi alat ukur, yang perlu sekali mendapat perhatian adalah :
1) Apakah alat ukur (soal ujian) telah mewakili semua mata pelajaran yang diberikan?
2) Apakah pokok-pokok yang dicantumkan dalam alat ukur (soal) sesuai dengan mata
pelajaran yang telah diajarkan?
Biasanya dosen mendiskusikan soal dengan dosen lainnya untuk melihat validitas isi
tersebut, di samping menggunakan penilaian sendiri yang disesuaikan dengan course
outline dari mata pelajaran yang bersangkutan.

2.2 Validitas yang berhubungan dengan kriteria


Pendekatan validitas berdasar kriteria menghendaki tersedianya kriteria eksternal
yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel
perilaku yang akan diprediksikan oleh skor alat ukur.
Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi
antara skor alat ukur dengan skor kriteria. Koefisien ini merupakan koefisien validitas
bagi alat ukur yang bersangkutan, yaitu rxy, dimana x melambangkan skor alat ukur dan y
melambangkan skor kriteria.
Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar
kriteria menghasilkan dua macam validitas yaitu validitas prediktif (predictive validity)
dan validitas konkuren (concurrent validity).

2.3 Validitas Konstrak


Konstrak adalah suatu abstraksasi dan generalisasi khusus dan merupakan suatu
konsep yang diciptakan khusus untuk kebutuhan ilmiah dan mempunyai pengertian
terbatas. Konstrak tersebut diberi definisi sehingga dapat diamati dan diukur. Dalam
melihat validitas konstrak, beberapa pertanyaan di bawah ini perlu dijawab.
- Komponen-komponen atau dimensi-dimensi yang membentuk konsep tersebut
- Landasan teori yang merangkum dimensi tersebut
- Bukti empiris yang memperlihatkan ada tidaknya keterkaitan antara komponen atau
dimensi di atas
Hal pertama yang dikerjakan oleh seorang peneliti dalam membahas validitas
konstrak (seperti : inteligensia, status ekonomi, fertilitas, persepsi, pendidikan tradisional,
dsb) adalah menganalisis unsure-unsur apa yang menjadi bagian dari konstrak tersebut.
Kemudian, peneliti melihat isi dan makna dari komponen-komponen tersebut, serta alat
ukur yang digunakan untuk mengukur konstrak tersebut. Hal tersebut dibutuhkan untuk
mengetahui sifat-sifat apakah yang dapat menerangkan variance dari alat ukur tersebut.

2.4 Validitas Muka


Ada 2 pengertian validitas muka. Pertama, validitas muka berhubungan dengan
pengukuran atribut yang konkrit tanpa memerlukan referensi, misalnya : jika ingin
mengetahui kemahiran seseorang dalam menulis steno, maka jumlah kata yang ditulis per
detik sudah merupakan ukuran yang tepat tentang kemahiran steno seseorang. Untuk
mengetahui kemahiran mengetik seseorang, maka suruhlah ia mengetik dan hitung
jumlah huruf / kalimat yang dapat diselesaikan per menit.
Arti lainnya dari validitas muka adalah validitas muka berhubungan dengan penilaian
para ahli terhadap suatu alt ukur, misalnya : seseorang peneliti ingin menyusun skala
tentang persepsi. Skala tersebut diperlihatkan kepada beberapa ahli. Jika ahli-ahli itu
berpendapat bahwa unsure-unsur dalam skala tersebut dapat mengukur persepsi secara
baik, maka skala tersebut mempunyai validitas muka yang tinggi.
3. Contoh Uji Validitas dan Uji Reliabilitas
Contoh perhitungan korelasi butir untuk soal bentuk uraian dengan skor butir
kontinum.
Uji Validitas :
Jika skor butir instrumen atau soal tes kontinum (misalnya skala sikap atau soal bentuk
uraian dengan skor butir 1-5 atau skor soal 0-10) dan diberi simbol X i dan skor total
instrumen atau tes diberi simbol Xt, maka rumus yang digunakan untuk menghitung
koefesien korelasi antara skor butir instrumen atau soal dengan skor total instrumen atau
skor total tes adalah sebagai berikut:
Keterangan:
rit = koefisien korelasi antara skor butir soal dengan skor total.
xi = jumlah kuadrat deviasi skor dari Xi
xt = jumlah kuadrat deviasi skor dari Xt
Data hasil uji coba adalah sebagai berikut:
Nomor Butir PertanyaanJumlah
Nomor Responden
1 2 3 4 5 6 7
1 5 4 3 5 3 5 3 28
2 5 4 3 4 3 4 3 26
3 4 4 2 4 3 4 3 24
4 4 3 3 3 4 3 4 24
5 5 5 3 4 5 5 4 31
6 3 3 2 3 2 3 1 17
7 3 3 2 3 2 2 2 17
8 3 2 2 3 2 2 2 16
9 2 2 1 2 1 2 1 11
10 2 1 1 1 1 1 1 8
Jumlah 36 31 22 32 26 31 24 202
Penyelesaian:
Untuk n=10 dengan alpha sebesar 0,05 didapat nilai table r=0,631. Karena nilai
koefesien korelasi antara skor butir dengan skor total untuk semua butir lebih besar dari
0,631, maka semua butir mempunyai korelasi signifikan dengan skor total tes. Dengan
demikian maka semua butir tes dianggap valid atau dapat digunakan untuk mengukur hasil
belajar.
Uji reliabilitas :
Dari soal diatas, selanjutnya akan dihitung koefesien reliabilitas dengan menggunakan
rumus koefesien Alpha, yaitu:
Keterangan:
rii = koefisien reliabilitas tes
k = cacah butir
  = varian skor butir
  = varian skor total
Koefisien reliabilitas dari contoh diatas dapat dihitung dengan cara pertama-tama
dihitung varian butir sebagai berikut:
Nomor butir Varian Butir
1 1,24
2 1,29
3 0,56
4 1,16
5 1,44
6 1,69
7 1,24
Jumlah 8,62
Jadi koefesien reliabilitas tes (dengan 7 butir) pada contoh diatas adalah 0,97.

Contoh Perhitungan Korelasi Butir untuk Soal Bentuk Objektif


Uji Validitas :
Jika skor butir soal diskontinum (misalnya soal bentuk objektif dengan skor butir soal 0
atau 1) maka kita menggunakan koefesien korelasi biserial dan rumus yang digunakan
untuk menghitung koefesien korelasi biserial antara skor butir soal dengan skor total tes
adalah:
Keterangan:
rbis(i)      = koefesien korelasi beserial antara skor butir soal nomor i dengan skor total
X1         = rata-rata skor total responden yang menjawab benar butir soal nomor i
Xt         = rata-rata skor total semua responden
st          = standar deviasi skor total semua responden
pi          = proporsi jawaban yang benar untuk butir soal nomor i
qi          = proporsi jawaban yang salah untuk butir soal nomor i
Contoh hasil uji coba adalah sebagai berikut:
Nomor Butir PertanyaanJumlah
Nomor Responden
1 2 3 4 5 6 7
1 1 1 1 1 0 0 0 4
2 1 1 0 1 1 1 0 5
3 0 1 1 1 0 0 0 3
4 1 1 0 0 0 0 0 2
5 0 1 0 0 0 0 0 1
6 1 1 1 1 1 1 1 7
7 1 1 1 1 1 1 0 6
8 0 0 0 0 0 0 0 0
9 1 1 0 0 1 0 0 3
10 1 1 1 1 1 0 0 5
Jumlah 7 9 5 6 5 3 1 36
Xt = 3,60
St = 2,107
Nomor Butirr-butirr-tabel Status
1 0,70 0,63 Valid
2 0,57 0,63 Tidak valid
3 0,66 0,63 Valid
4 0,81 0,63 Valid
5 0,76 0,63 Valid
6 0,75 0,63 Valid
7 0,54 0,63 Tidak valid
Ternyata dari tujuh butir soal tes ada 5 butir yang valid dan dua butir tidak valid. Oleh
karena itu perlu dilakukan perhitungan untuk menghitung koefesien antara skor butir
dengan skor total baru (5 butir), sebagai berikut:
Data hasil uji coba adalah sebagai berikut:
Nomor Butir
Nomor
Pertanyaan Jumlah
Responden
1 3 4 5 6
1 1 1 1 0 0 3
2 1 0 1 1 1 4
3 0 1 1 0 0 2
4 1 0 0 0 0 1
5 0 0 0 0 0 0
6 1 1 1 1 1 5
7 1 1 1 1 1 5
8 0 0 0 0 0 0
9 1 0 0 1 0 2
10 1 1 1 1 0 4
Jumlah 7 5 6 5 3 26
Xt = 2,6
St = 1,8
Untuk n = 10 dengan alpha sebesar 0,05 didapat nilai table r = 0,631. Karena niai
koefesien korelasi biserial antara skor butir dengan skor total untuk semua butir lebih besar
dari 0,631, maka semua butir mempunyai korelasi biserial yang signifikan dengan skor
total tes. Dengan demikian maka semua butir tes (5 butir) dianggap valid atau dapat
digunakan untuk mengukur hasil belajar.

Uji Reliabilitas :
Selanjutnya akan dihitung koefesien reliabilitas dengan menggunakan rumus KR-20,
sebagai berikut:
Keterangan:
rii = koefesien reliabilitas tes
k = cacah butir
piqi = varian skor butir
pi    = proporsi jawaban yang benar untuk butir nomor i
qi     = proporsi jawaban yang salah untuk butir nomor i
    = varian skor total
Koefesien reliabitas dari contoh diatas adalah:
Pertama-tama dihitung varian butir (piqi) sebagai berikut:
Nomor butir pi qi pi qi
1 0,7 0,3 0,21
3 0,5 0,5 0,25
4 0,6 0,4 0,24
5 0,5 0,5 0,25
6 0,3 0,7 0,21
Jumlah 1,16
St = 3,24
Jadi koefesien reliabilitas tes (dengan 5 butir) pada contoh diatas adalah 0,80.
DAFTAR PUSTAKA

Anastasia, A & Susana Urbina. 1997. Psychological Testing. New  Jersey: Prentice-Hall Inc.

Arikunto, Suharsimi. 1995. Manajemen Penelitian. Jakarta: Rineka Cipta.

Djaali&Pudji Muljono. 2008. Pengukuran Dalam Bidang Pendidikan. Jakarta: PT Grasindo.

Gregory, Robert J. 2000. Psycological Testing: History, Principles and Aplications. Boston:
Allyn and Bacon

Gronlund., dan Linn. 1990. Measurement and Evaluation in Teaching. Sixth Edition. New York:
Macmillan Publishing Company.

Husaini, Usman, dkk. 2003. Pengantar Statistika. Jakarta: Bumi Aksara.

Kerlinger, EN. 1990. Azas-Azas Penelitian Behavioral (Alih Bahasa Simatupang dan
Koesoemanto). Yogyakarta: Gajah Mada University Press.

Sugiyono. 2006. Metode Penelitian Pendidikan, Pendekatan Kuantitatif, Kualitatif dan R&D.
Bandung: Penerbit Alfabeta.

Suharto. 2009. Uji Validitas, Reliabilitas, Instrumen, Penelitian.

Sukadji, Soetarlinah. 2000. Menyusun dan Mengevaluasi Laporan Penelitian. Jakarta: UI-Press.
Nazir Moh, Ph.D. 1983. Metode Penelitian. Jakarta: Ghalia Indonesia.

Anda mungkin juga menyukai