Anda di halaman 1dari 9

VALIDITAS DAN RELIABILITAS

A. Validitas
1. Pengertian Validitas

cermat. Sebuah alat penimbang badan memang


mengukur berat, akan tetapi tidaklah cukup
Menurut Azwar (1986) Validitas berasal dari kata cermat guna menimbang berat cincin emas karena
validity yang mempunyai arti sejauh mana
perbedaan berat yang sangat kecil pada berat
ketepatan dan kecermatan suatu alat ukur dalam emas itu tidak akan terlihat pada alat ukur berat
melakukan fungsi ukurnya.
badan.
Suatu skala atau instrumen pengukur dapat
Menggunakan alat ukur yang dimaksudkan untuk
dikatakan mempunyai validitas yang tinggi
mengukur suatu aspek tertentu akan tetapi tidak
apabila instrumen tersebut menjalankan fungsi dapat memberikan hasil ukur yang cermat dan
ukurnya, atau memberikan hasil ukur yang sesuai teliti akan menimbulkan kesalahan atau eror. Alat
dengan maksud dilakukannya pengukuran
ukur yang valid akan memiliki tingkat kesalahan
tersebut. Sedangkan tes yang memiliki validitas yang kecil sehingga angka yang dihasilkannya
rendah akan menghasilkan data yang tidak
dapat dipercaya sebagai angka yang sebenarnya
relevan dengan tujuan pengukuran.
atau angka yang mendekati keadaan yang
sebenarnya (Azwar 1986).
Terkandung di sini pengertian bahwa ketepatan
validitas pada suatu alat ukur tergantung pada
Pengertian validitas juga sangat erat berkaitan
kemampuan alat ukur tersebut mencapai tujuan dengan tujuan pengukuran. Oleh karena itu, tidak
pengukuran yang dikehendaki dengan tepat.
ada validitas yang berlaku umum untuk semua
Suatu tes yang dimaksudkan untuk mengukur
tujuan pengukuran. Suatu alat ukur biasanya
variabel A dan kemudian memberikan hasil
hanya merupakan ukuran yang valid untuk satu
pengukuran mengenai variabel A, dikatakan
tujuan yang spesifik. Dengan demikian, anggapan
sebagai alat ukur yang memiliki validitas tinggi. valid seperti dinyatakan dalam alat ukur ini
Suatu tes yang dimaksudkan mengukur variabel Avalid adalah kurang lengkap. Pernyataan valid
akan tetapi menghasilkan data mengenai variabel tersebut harus diikuti oleh keterangan yang
A atau bahkan B, dikatakan sebagai alat ukur
menunjuk kepada tujuan (yaitu valid untuk
yang memiliki validitas rendah untuk mengukur mengukur apa), serta valid bagi kelompok subjek
variabel A dan tinggi validitasnya untuk
yang mana? (Azwar 1986)
mengukur variabel A atau B (Azwar 1986).
Pengertian validitas menurut Walizer (1987)
Sisi lain dari pengertian validitas adalah aspek
adalah tingkaat kesesuaian antara suatu batasan
kecermatan pengukuran. Suatu alat ukur yang
konseptual yang diberikan dengan bantuan
valid tidak hanya mampu menghasilkan data yang operasional yang telah dikembangkan.
tepat akan tetapi juga harus memberikan
gambaran yang cermat mengenai data tersebut. Menurut Aritonang R. (2007) validitas suatu
instrumen berkaitan dengan kemampuan
Cermat berarti bahwa pengukuran itu dapat
instrument itu untuk mengukur atu mengungkap
memberikan gambran mengenai perbedaan yang karakteristik dari variabel yang dimaksudkan
sekecil-kecilnya mengenai perbedaan yang satu untuk diukur. Instrumen yang dimaksudkan untuk
dengan yang lain. Sebagai contoh, dalam bidang mengukur sikap konsumen terhadap suatu iklan,
pengukuran aspek fisik, bila kita hendak
misalnya, harus dapat menghasilkan skor sikap
mengetahui berat sebuah cincin emas maka kita yang memang menunjukkan sikap konsumen
harus menggunakan alat penimbang berat emas terhadap iklan tersebut. Jadi, jangan sampai hasil
agar hasil penimbangannya valid, yaitu tepat dan yang diperoleh adalah skor yang menunjukkan

minat konsumen terhadap iklan itu.


Validitas suatu instrumen banyak dijelaskan
2. Jenis-jenis Validitas
dalam konteks penelitian sosial yang variabelnya
tidak dapat diamati secara langsung, seperti sikap, Ebel (dalam Nazirz 1988) membagi validitas
minat, persepsi, motivasi, dan lain sebagainya. menjadi :
Untuk mengukur variabel yang demikian sulit,
untuk mengembangkan instrumen yang memiliki Concurrent Validity adalah validitas yang
validitas yang tinggi karena karakteristik yang
berkenaan dengan hubungan antara skor dengan
akan diukur dari variabel yang demikian tidak
kinerja.
dapat diobservasi secara langsung, tetapi hanya Construct Validity adalah validitas yang
melalui indikator (petunjuk tak langsung)
berkenaan dengan kualitas aspek psikologis apa
tertentu. (Aritonang R. 2007)
yang diukur oleh suatu pengukuran serta terdapat
evaluasi bahwa suatu konstruk tertentu dapat
Menurut Masri Singarimbun, validitas
menyebabkan kinerja yang baik dalam
menunjukkan sejauh mana suatu alat pengukur itu pengukuran.
mengukur apa yang ingin diukur. Bila seseorang Face Validity adalah validitas yang
ingin mengukur berat suatu benda, maka dia
berhuubungan apa yang nampak dalam mengukur
harus menggunakan timbangan. Timbangan
sesuatu dan bukan terhadap apa yang seharusnya
adalah alat pengukur yang valid bila dipakai
hendak diukur.
untuk mengukur berat, karena timbangan
Factorial Validity dari sebuah alat ukur adalah
memang mengukur berat. Bila panjang sesuatu korelasi antara alat ukur dengan faktor-faktor
benda yang ingin diukur, maka dia harus
yang bersamaan dalam suatu kelompok atau
menggunakan meteran. Meteran adalah alat
ukuran-ukuran perilaku lainnya, di mana validitas
pengukur yang valid bila digunakan untuk
ini diperoleh dengan menggunakan teknik analisis
mengukur panjang, karena memang meteran
faktor.
mengukur panjang. Tetapi timbangan bukanlah Empirical Validity adalah validitas yang
alat pengukur yang valid bilamana digunakan
berkenaan dengan hubungan antara skor dengan
untuk mengukur panjang.
suatu kriteria. Kriteria tersebut adalah ukuran
yang bebas dan langsung dengan apa yang ingin
Sekiranya penelliti menggunakan kuesioner di
diramalkan oleh pengukuran.
dalam pengumpulan data penelitian, maka
Intrinsic Validity adalah validitas yang
kuesioner yang disusunnya harus mengukur apa berkenaan dengan penggunaan teknik uji coba
yang ingin diukurnya. Setelah kuesioner tersebut untuk memperoleh bukti kuantitatif dan objektif
tersusun dan teruji validitasnya, dalam praktek untuk mendukung bhwa suatu alat ukur benarbelum tentu data yang dikumpulkan adalah data benar mengukur apa yang seharusny diukur.
yang valid. Banyak hal-hal lain yang akan
Predictive Validity adalah validitas yang
mengurangi validitas data; misalnya apakah si
berkenaan dengan hubungan antara skor suatu
pewawancara yang mengumpulkan data betul- alat ukur dengan kinerj seorang di msa
betul mengikuti petunjuk yang telah ditetapkan mendatang.
dalam kuesioner. (Masri Singarimbun)
Content Validity adalah validitas yang
berkenaan dengan baik buruknya sampling dari
Menurut Suharsimi Arikunto, validitas adalah
suatu populasi.
keadaan yang menggambarkan tingkat instrumen Curricular Validity adalah validitas yang
bersangkutan yang mampu mengukur apa yang ditentukan dengan cara menilik isi dari
akan diukur.
pengukuran dan menilai seberapa jauh
pungukuran tersebut merupakan alat ukur yang
Menurut Soetarlinah Sukadji, validitas adalah
benar-benar mengukur aspek-aspek sesuai dengan
derajat yang menyatakan suatu tes mengukur apa tujuan instruksional.
yang seharusnya diukur. Validitas suatu tes tidak
begitu saja melekat pada tes itu sendiri, tapi
Sementara itu, Kerlinger (1990) membagi
tergantung penggunaan dan subyeknya.
validitas menjadi tiga yaitu:

Content validity (Validitas isi) adalah validitas atau lewat professional judgement. Pertanyaan
yang diperhitungkan melalui pengujian terhadap yang dicari jawabannya dalam validitas ini adalah
isi alat ukur dengan analisis rasional. Pertanyaan sejauh mana item-item dalam tes mencakup
yang dicari jawabannya dalam validitas ini adalah keseluruhan kawasan ini (dengan catatan tidak
sejauh mana item-item dalam suatu alat ukur
keluar dari batasan tujuan ukur) objek yang
mencakup keseluruhan kawasan isi objek yang hendak diukur atau sejauh mana isi tes
hendak diukur oleh alat ukur yang
mencerminkan ciri atribut yang hendak diukur.
bersangkutan? atau berhubungan dengan
representasi dari keseluruhan kawasan.
Selanjutnya, validitas isi terbagi lagi menjadi dua
tipe (Saifuddin Azwar), yaitu:
Validitas isi suatu instrumen berkaitan dengan
1. Face Validity (Validitas Muka) adalah tipe
kesesuaian antara karakteristik dari variaabel
validitas yang paling rendah signifikansinya
yang dirumuskan pada definisi konseptual dan
karena hanya didasarkan pada penilaian selintas
operasionalnya. Apabila semua karakteristik
mengenai isi alat ukur. Apabila isi alat ukur telah
variabel yang dirumuskan pada definisi
tampak sesuai dengan apa yang ingin diukur
konseptualnya dapat diungkap melalui butir-butir maka dapat dikatakan maka validitas muka telah
suatu instrument, maka instrument itu dinyatakan terpenuhi.
memiliki validitas isi yang baik. Sayangnya, hal 2. Logical Validity (Validitas Logis) disebut juga
itu mungkin tidak akan pernah tercapai karena
sebagai Validitas Sampling (Sampling Validity)
sulitnya untuk mendefinisikan keseluruhan
adalah validitas yang menunjuk pada sejauh mana
karakteristik itu. Selain itu, dari seluruh
isi alat ukur merupakan representasi dari aspek
karakteristik yang dirumuskan pada definisi
yang hendak diukur.
konseptual suatu variabel seringkali sulit untuk
mengembangkan butir-butir yang valid untuk
Validitas logis sangat penting peranannya dalam
mengungkap atau mengukurnya.
penyusunan prestasi dan penyusunan skala, yaitu
dengan memanfaatkan blue-print atu table
Validitas isi dapat dianalisis dengan cara
spesifikasi.
memperhatikan penampakan luar dari instrument Construct validity (Validitas konstruk) adalah
dan dengan menganalisis kesesuaian butirtipe validitas yang menunjukkan sejauh mana alat
butirnya dengan karakteristik yang dirumuskan ukur mengungkap suatu trait atau konstruk
pada definisi konseptual variabel yang diukur.
teoritis yang hendak diukurnya. (Allen & Yen,
Validitas yang dianalisis dengan memperhatikan dalam Azwar 1986).
penampilan luar instrument itu disebut validitas Pengujian validitas konstruk merupakan
tampang (face validity). Validitas tampang
prosesyang terus berlanjut sejalan dengan
dievaluasi dengan membaca dan menyelidiki
perkembangan konsep mengenai trait yang
butir-butir instrument serta sekaligus
diukur.
membandingkannya dengan definisi konseptual
mengenai variabel yang akan diukur. Validitas
Menurut Saifuddin Azwar, validitas konstruk
yang dianalisis dengan memperhatikan
adalah seberapa besar derajat tes mengukur
kerepresentativan butir-butir instrument disebut hipotesis yang dikehendaki untuk diukur.
validitas penyampelan (sampling validity) atau Konstruk adalah perangai yang tidak dapat
kuikulum (curriculum validity). Validitas
diamati, yang menjelaskan perilaku. Menguji
tampang maupun penyampelan disebut juga
validitas konstruk mencakup uji hipotesis yang
sebagai validitas teoritis karena
dideduksi dari suatu teori yang mengajukan
penganalisisannya lazim dilakukan tanpa
konstruk tersebut.
didasarkan pada data empiris. Alat yang
Criterion-related validity (Validitas berdasar
digunakan untuk menganalisis validitas itu adalah kriteria). Validitas ini menghendaki tersedianya
logika dari orang yang menganalisisnya.
criteria eksternal yang dapat dijadikan dasar
pengujian skor alat ukur. Suatu kriteria adalah
Menurut Saifuddin Azwar, validitas isi
variabel perilaku yang akan diprediksi oleh skor
merupakan validitas yang diestimasi lewat
alat ukur.
pengujian terhadap isi tes dengan analisis rasional

Dilihat dari segi waktu untuk memperoleh skor skor kriterianya dapat diperoleh dalam waktu
kriterianya, prosedur validasi berdasar kriteria
yang sama, maka korelasi antara kedua skor
menghasilkan dua macam validitas (Saifuddinn termaksud merupakan koefisien validitas
Azwar), yaitu:
konkuren.
1. Validitas Prediktif. Validitas Prediktif sangat
penting artinya bila alat ukur dimaksudkan untuk Menurut Saifuddin Azwar, validitas ini
berfungsi sebagai predictor bagi kinerja di masa menunjukkan seberapa besar derajat skor tes
yang akan datang. Contoh situasi yang
berkorelasi dengan skor yang diperoleh dari tes
menghendaki adanya prediksi kinerja ini antara lain yang sudah mantap, bila disajikan pada saat
lain adalah dalam bimbingan karir; seleksi
yang sama, atau dibandingkan dengan criteria lain
mahasiswa baru, penempatan karyawan, dan
yang valid yang diperoleh pada saat yang sama.
semacamnya.
Menurut Saifuddin Azwar, validitas prediktif
Asosiasi Psikologi Amerika (APA) (1974; dalam
adalah seberapa besar derajat tes berhasil
Anastasia, 1982) membedakan tiga tipe validitas,
memprediksi kesuksesan seseorang pada situasi yaitu validitas isi, yang dikaitkan dengan criteria,
yang akan datang. Validitas prediktif ditentukan dan konnstrak. Ketiga tipe validitas tersebut dapat
dengan mengungkapkan hubungan antara skor tes diuji dengan dan atau tanpa menggunakan
dengan hasil tes atau ukuran lain kesuksesan
instrument yang telah teruji validitas maupun
dalam satu situasi sasaran.
reabilitasnya.
2. Validitas Konkuren. Apabila skor alat ukur dan
B. Reliabilitas
1. Pengertian Reliabilitas

harus memiliki tingkat konsistensi dan


kemantapan.

Walizer (1987) menyebutkan pengertian


Reliability (Reliabilitas) adalah keajegan
Dalam pandangan Aiken (1987: 42) sebuah tes
pengukuran.
dikatakan reliabel jika skor yang diperoleh oleh
Menurut John M. Echols dan Hasan Shadily
peserta relatif sama meskipun dilakukan
(2003: 475) reliabilitas adalah hal yang dapat
pengukuran berulang-ulang.
dipercaya. Popham (1995: 21) menyatakan bahwa
reliabilitas adalah "...the degree of which test
Dengan demikian, keandalan sebuah alat ukur
score are free from error measurement"
dapat dilihat dari dua petunjuk yaitu kesalahan
baku pengukuran dan koefisien reliabilitas.
Menurut Masri Singarimbun, realibilitas adalah Kedua statistik tersebut masing-masing memiliki
indeks yang menunjukkan sejauh mana suatu alat kelebihan dan keterbatasan (Feldt & Brennan,
ukur dapat dipercaya atau dapat diandalkan. Bila 1989: 105)
suatu alat pengukur dipakai dua kali untuk
Reliabilitas, atau keandalan, adalah konsistensi
mengukur gejala yang sama dan hasil pengukuran dari serangkaian pengukuran atau serangkaian
yang diperoleh relative konsisten, maka alat
alat ukur. Hal tersebut bisa berupa pengukuran
pengukur tersebut reliable. Dengan kata lain,
dari alat ukur yang sama (tes dengan tes ulang)
realibitas menunjukkan konsistensi suatu alat
akan memberikan hasil yang sama, atau untuk
pengukur di dalam pengukur gejala yang sama. pengukuran yang lebih subjektif, apakah dua
orang penilai memberikan skor yang mirip
Menurut Brennan (2001: 295) reliabilitas
(reliabilitas antar penilai). Reliabilitas tidak sama
merupakan karakteristik skor, bukan tentang tes dengan validitas. Artinya pengukuran yang dapat
ataupun bentuk tes.
diandalkan akan mengukur secara konsisten, tapi
belum tentu mengukur apa yang seharusnya
Menurut Sumadi Suryabrata (2004: 28)
diukur.
reliabilitas menunjukkan sejauhmana hasil
Dalam penelitian, reliabilitas adalah sejauh mana
pengukuran dengan alat tersebut dapat dipercaya. pengukuran dari suatu tes tetap konsisten setelah
Hasil pengukuran harus reliabel dalam artian
dilakukan berulang-ulang terhadap subjek dan

dalam kondisi yang sama. Penelitian dianggap


dapat diandalkan bila memberikan hasil yang
konsisten untuk pengukuran yang sama. Tidak
bisa diandalkan bila pengukuran yang berulang
itu memberikan hasil yang berbeda-beda.

mengukur ketrampilan terutama ketrampilan


fisik.
Misalnya seorang guru hendak melihat reliabilitas
tes yang telah dibuatnya. Setelah melakukan dua
kali pengukuran didapatkan skor tes sebagai
berikut:

Pengukuran reliabilitas dapat dilakukan dengan


menggunakan berbagai alat statistik (Feldt &
Brennan, 1989: 105)
Berdasarkan sejarah, reliabilitas sebuah instrumenKoefisien reliabilitas test di atas dapat dihitung
dapat dihitung melalui dua cara yaitu kesalahan dengan menggunakan formula korelasi produk
baku pengukuran dan koefisien reliabilitas (Feldt momen dari Pearson sebagai berikut:
& Brennan: 105). Kedua statistik di atas memiliki
keterbatasannya masing-masing. Kesalahan
pengukuran merupakan rangkuman inkonsistensi
peserta tes dalam unit-unit skala skor sedangkan Dengan demikian, korelasi sebesar 0,954
koefisien reliabilitas merupakan kuantifikasi
menggambarkan bahwa reliabilitas tes cukup
reliabilitas dengan merangkum konsistensi (atau tinggi.
inkonsistensi) diantara beberapa kesalahan
Salah satu kelemahan mendasar dari teknik testpengukuran.
retest adalah carry-over effect. Masalah ini
Dalam kerangka teori tes klasik, suatu tes dapat disebabkan oleh adanya kemungkinan pada test
dikatakan memiliki reliabilitas yang tinggi
yang kedua dipengaruhi oleh test pertama.
apabila skor tampak tes tersebut berkorelasi
Misalnya, jika peserta tes masih ingat dengan
tinggi dengan skor murninya sendiri. Interpretasi soal-soal dan bahkan jawaban ketika dilakukan
lainnya adalah seberapa tinggi korelasi antara
test pertama. Hal ini dapat meningkatkan korelasi
skor tampak pada dua tes yang pararel. (Saifuddin serta overestimasi terhadap PXX. Ross E. Traub
Azwar, 2006: 29). Reliabilitas menurut Ross E. (1994: 38)
Traub (1994: 38) yang disimbolkan oleh dapat
didefinisikan sebagai rasio antara varian skor
murni dan varian skor tampak . Secara matematis 2. Jenis-jenis Reliabilitas
teori di atas dapat ditulis :
Walizer (1987) menyebutkan bahwa ada dua cara
umum untuk mengukur reliabilitas, yaitu:
Reliabilitas alat ukur tidak dapat diketahui
1. Relibilitas stabilitas. Menyangkut usaha
dengan pasti tetapi dapat diperkirakan. Dalam
memperoleh nilai yang sama atau serupa untuk
mengestimasi reliabilitas alat ukur, ada tiga cara setiap orang atau setiap unit yang diukur setiap
yang sering digunakan yaitu (1) pendekatan tes saat anda mengukurnya. Reliabilitas ini
ulang, (2) pendekatan dengan tes pararel dan (3) menyangkut penggunaan indicator yang sama,
pendekatan satu kali pengukuran.
definisi operasional, dan prosedur pengumpulan
Pendekatan tes ulang merupakan pemberian
data setiap saat, dan mengukurnya pada waktu
perangkat tes yang sama terhadap sekelompok
yang berbeda. Untuk dapat memperoleh
subjek sebanyak dua kali dengan selang waktu reliabilitas stabilitas setiap kali unit diukur
yang berbeda. Asumsinya adalah bahwa skor
skornya haruslah sama atau hampir sama.
yang dihasilkan oleh tes yang sama akan
2. Reliabilitas ekivalen. Menyangkut usaha
menghasilkan skor tampak yang relatif sama.
memperoleh nilai relatif yang sama dengan jenis
Estimasi dengan pendekatan tes ulang akan
ukuran yang berbeda pada waktu yang sama.
menghasilkan koefisien stabilitas. Untuk
Definisi konseptual yang dipakai sama tetapi
memperoleh koefisien reliabilitas melalui
dengan satu atau lebih indicator yang berbeda,
pendekatan tes ulang dapat dilakukan dengan
batasan-batasan operasional, paeralatan
menghitung koefisien korelasi linear antara
pengumpulan data, dan / atau pengamatdistribusi skor subyek pada pemberian tes
pengamat.
pertama dengan skor subyek pada pemberian tes Menguji reliabilitas dengan menggunakan ukuran
kedua. Pendekatan tes ulang sangat sesuai untuk ekivalen pada waktu yang sama bias menempuh

beberapa bentuk. Bentuk yang paling umum


dari waktu ke waktu. Realibilitas diukur dengan
disebut teknik belah-tengah. Cara ini seringkali menentukan hubungan antara skor hasil penyajian
dipakai dalam survai.Apabila satu rangkaian
tes yang sama kepada kelompok yang sama, pada
pertanyaan yang mengukur satu variable
waktu yang berbeda.
dimasukkan dalam kuesioner, maka pertanyaanpertanyaan tersebut dibagi dua bagian persis
Metode pengujian reliabilitas stabilitas yang
lewat cara tertentu. (Pengacakan atau pengubahan paling umum dipakai adalah metode pengujian
sering digunakan untuk teknik belah tengah ini.) tes-kembali (test-retest). Metode test-retest
Hasil masing-masing bagian pertanyaan diringkas menggunakan ukuran atau test yang sama
ke dalam skor, lalu skor masing-masing bagian untuk variable tertentu pada satu saat pengukuran
tersebiut dibandingkan. Apabila dalam skor
yang diulang lagi pada saat yang lain. Cara lain
kemudian skor masing-masing bagian tersebut untuk menunjukkan reliabilitas stabilitas, bila kita
dibandingkan. Apabila kedua skor itu relatif
menggunakan survai, adalah memasukkan
sama, dicapailah reliabilitas belah tengah.
pertanyaan yang sama di dua bagian yang
Reliabilitas ekivalen dapat juga diukur dengan
berbeda dari kuesioner atau wawancara. Misalnya
menggunakan teknik pengukuan yang berbeda. the Minnesota Multiphasic Personality Inventory
Kecemasan misalnya, telah diukur dengan
(MPPI) mengecek reliabilitas test-retest dalam
laporan pulsa. Skor-skor relatif dari satu indikator satu kuesionernya dengan mengulang pertanyaan
macam ini haruslah sesuai dengan skor yang lain. tertentu di bagian-bagian yang berbeda dari
Jadi bila seorang subyek nampak cemas pada
kuesioner yang panjang.
ukuran gelisah orang tersebut haruslah
Kesulitan terbesar untuk menunjukkan reliabilitas
menunjukkan tingkatan kecermatan relatif yang stabilitas adalah membuat asumsi bahwa sifat/
sama bila tekanan darahnya yang diukur.
variable yang akan diukur memang benar-benar
bersifat stabil sepanjang waktu. Karena
3. Metode pengujian reliabilitas
kemungkinan besar tidak ada ukuran yang andal
Tiga tehnik pengujian realibilitas instrument
dan sahih yang tersedia. Satu-satunya faktor yang
antara lain :
dapat membuat asumsi-asumsi ini adalah
a. Teknik Paralel (Paralel Form atau Alternate
pengalaman, teori dan/atau putusdan terbaik.
Form)
Dalam setiap kejadian, asumsi ini selalu ditantang
Teknik paralel disebut juga tenik double test
dan sulit rasanya mempertahankan asumsi
double trial. Sejak awal peneliti harus sudah
tersebut atas dasar pijakan yang obyektif.
menyusun dua perangkat instrument yang parallel
(ekuivalen), yaitu dua buah instrument yang
disusun berdasarkan satu buah kisi-kisi. Setiap c. Teknik Belah Dua (Split Halve Method)
butir soal dari instrument yang satu selalu harus Disebut juga tenik single test single trial.
dapat dicarikan pasangannya dari instrumen
Peneliti boleh hanya memiliki seperangkat
kedua. Kedua instrumen tersebut diujicobakan
instrument saja dan hanya diujicobakan satu kali,
semua. Sesudah kedua uji coba terlaksana, maka kemudian hasilnya dianalisis, yaitu dengan cara
hasil instrumen tersebut dihitung korelasinya
membelah seluruh instrument menjadi dua sama
dengan menggunakan rumus product moment
besar. Cara yang diambil untuk membelah soal
(korelasi Pearson).
bisa dengan membelah atas dasar nomor ganjilb. Teknik Ulang (Test Re-test)
genap, atas dasar nomor awal-akhir, dan dengan
Disebut juga teknik single test double trial.
cara undian.
Menggunakan sebuah instrument, namun dites Menurut Saifuddin Azwar, realibilitas ini diukur
dua kali. Hasil atau skor pertama dan kedua
dengan menentukan hubungan antara skor dua
kemudian dikorelasikan untuk mengetahui
paruh yang ekuivalen suatu tes, yang disajikan
besarnya indeks reliabilitas.Teknik perhitungan kepada seluruh kelompok pada suatu saat. Karena
yang digunakan sama dengan yang digunakan
reliabilitas belah dua mewakili reliabilitas hanya
pada teknik pertama yaitu rumus korelasi
separuh tes yang sebenarnya, rumus SpearmanPearson.
Brown dapat digunakan untuk mengoreksi
Menurut Saifuddin Azwar, realibilitas tes-retest koefisien yang didapat.
adalah seberapa besat derajat skor tes konsisten

Apa penyebab ketidakandalan?


beberapa kali pada subjek yang sama di waktu
Ada beberapa sumber ketidakandalan
yang berbeda."
(unreliability), beberapa di antaranya telah
Jika demikian adanya, maka secara logis, satudituangkan. Satu sumber ketidakandalan yang
satunya cara untuk mengestimasi reliabilitas
terbesar adalah ketidaksahihan (invalidity).
adalah dengan melakukan pengetesan paling tidak
Berikut ini adalah daftar periksa (check list)
dua kali pada sekelompok subjek yang sama. Tapi
sumber-sumber yang menyebabkannya (Walizer , benarkah begitu?
1987) :
Pada prakteknya kita mengenal paling tidak ada 3
1. Orang atau unit yang diukur mungkin telah
pendekatan terhadap estimasi reliabilitas. Dan
berubah sejak pengukuran pertama dan kedua.
orang yang memberikan jawaban seperti di atas
(Tentu saja perubahan dalam skor, haruslah
juga memilih metode estimasi reliabilitas yang
ditafsirkan bukan sebagai ketidakandalan.)
hanya melakukan 1 kali administrasi tes. Jadi
2. Selama wawancara unit yang sedang diukur
mana tingkat keajegannya?
berubah, karena:
Baiklah, mungkin beberapa orang tidak terlalu
a. Pewawancara memperoleh pengalaman
peduli dengan hal ini. Yang penting ada angka
b. Kelelahan pewawancara
reliabilitasnya, habis perkara. Tapi ijinkan kami
c. Subyek mengalami hal-hal yang menyebabkan mencoba berbagi pemikiran mengenai hal ini.
penafsiran mereka terhadap pertanyaanKita mulai dari konsep reliabilitas dulu.
pertanyaan berubah (sebagai kebalikan dari
Reliabilitas seperti yang sering diucapkan atau
perubahan seharusnya dari apa yang sedang
ditulis di buku, memiliki arti tingkat kepercayaan.
diukur).
Kita coba pilah kata ini menjadi Rely dan Ability
d. Kesalahan-kesalahan diperbuat.
atau dapat dipercaya. Tapi apa maksud dari dapat
3. Aspek situasi tempat pengukuran berlangsung dipercaya ini? Yang dimaksud dapat dipercaya
mungkin berubah sejak pengukuran pertama dan disini adalah seberapa besar kita bisa
yang kedua. Hal-hal seperti waktu (pagi, siang, mempercayai hasil tes yang kita dapatkan, atau
sore), tempat berlangsungnya pengukuran, orang- juga seberapa besar tingkat kesalahan yang
orang yang berada dekat di sekitar yang mungkin muncul ketika seseorang mengerjakan suatu tes.
mempengaruhi respon mereka dan sebagainya
Semakin besar tingkat kesalahan yang muncul
mungkin berbeda.
ketika seseorang mengerjakan suatu tes, hasil
4. Pertanyaan-pertanyaan mungkin mendua
yang diperoleh dari tes tersebut makin tidak dapat
artinya, sehingga ditafsirkan secara berbeda pada dipercaya, makin tidak reliabel.
saat pengisian kuesioner yang berbeda.
Misalnya: seseorang dites (tes apa saja, karena
5. Pengkode dan/atau pengamat mungkin
reliabilitas tidak terlalu peduli dengan isu materi
membuat penafsiran sendiri-sendiri.
yang diteskan) kemudian memperoleh hasil
6. Apa yang nampak sebagai satu teknik ekivalen sebesar 100. Nah jika tes tersebut reliabel, maka
sebenarnya tidaklah demikian karena pemilihan kita bisa yakin bahwa kapasitas orang tersebut
pembandingan yang kurang baik.
memang 100. Atau dengan kata lain, angka 100
7. Terjadi kekeliruan dalam mencatat hasil
itu diperoleh bukan karena faktor lain selain
pengamatan atau memberi kode-kodenya.
kapasitas orang tersebut. Jika angka 100 ini
8. Atau mungkin kombinasi penyebab-penyebab diperoleh lebih banyak karena faktor lain (faktor
terdahulu.
lain ini yang disebut error), maka kita akan
berkata bahwa tes tersebut tidak reliabel.
Reliabel : Haruskah Ajeg? (Feldt & Brennan,
Konsep reliabilitas didasarkan pada asumsi
1989: 105)
bahwa dalam tiap pengetesan selalu ada
Sering kita dengar baik dalam kuliah atau dalam X, skor yang kita peroleh dari hasil pengetesan
ruang ujian, jawaban mahasiswa terhadap
(skor Tampak)
pertanyaan "Apa yang dimaksud reliabilitas?"
T, skor yang menggambarkan kapasitas
seperti ini : "Taraf Kepercayaan, yaitu seberapa seseorang yang sesungguhnya (skor Murni)
besar tes dapat dipercaya. Tes yang reliabel akan e, faktor lain selain kapasitas yang juga
menghasilkan skor yang relatif sama jika diteskan menyumbang terhadap perolehan X yang disebut
beberapa kali pada subjek yang sama . Dengan juga error.
kata lain seberapa ajeg sebuah tes jika diteskan Dan ketiganya terkait satu sama lain dalam

persamaan seperti ini :


X=T+e

juga disebut sebagai koefisien stabilitas atau


keajegan. Jadi definisi reliabilitas =keajegan
hanya berlaku untuk pendekatan ini. Tapi tentu
Ini dapat dibaca seperti berikut : dalam setiap
saja karena tidak mungkin memenuhi persyaratan
pengetesan, hasil tes yang kita peroleh merupakandi atas, pendekatan ini memiliki beberapa
fungsi penjumlahan dari skor Murni dan error.
kelemahan
Tes dapat dikatakan reliabel jika Tes
o Hanya dapat diterapkan pada tes yang
menghasilkan error yang kecil, sehingga hasil tes mengukur konstruk yang bersifat cenderung ajeg,
makin mencerminkan kapasitas yang sebenarnya misalnya kepribadian.
(atau X = T ).
o Estimasi reliabilitas akan dipengaruhi oleh
adanya carry over effect. Maksudnya, jika jarak
Lalu dari mana ide "keajegan" muncul?
pengetesan pertama dan kedua sangat dekat,
maka subyek akan cenderung mengingat jawaban
Diasumsikan bahwa nilai T memiliki sifat ajeg yang diberikan pada pengetesan pertama. Ini
dalam beberapa kali pengukuran pada subjek
membuat makin besarnya kemungkinan subyek
yang sama. Tapi keajegan ini hanya ada dalam
akan memberikan jawaban pada pengetesan
abstraksi teoretik saja, karena keajegan yang
kedua yang cenderung sama dengan jawaban
dimaksud di sini adalah keajegan T jika
yang diberikan pada pengetesan pertama.Hal ini
memenuhi syarat tertentu :
akan menyebabkan overestimasi reliabilitas, tes
Tiap pengetesan bersifat saling independen, terkesan/ terlihat lebih reliabel daripada yang
pengukuran pertama tidak mempengaruhi
sebenarnya.
pengukuran berikutnya. Jadi anggaplah seseorang o Estimasi reliabilitas juga dipengaruhi adanya
dites lalu dihipnotis untuk membuatnya lupa
practice effect. Ini terjadi ketika subyek, dalam
dengan jawaban dan soal yang telah diberikan. rentang waktu antara tes pertama dan kedua,
Kapasitas orang itu sendiri belum berubah.
belajar atau berlatih untuk meningkatkan
Jadi keajegan ini hanya mungkin jika setelah
kapasitasnya, ini terjadi khususnya dalam
dites, orang ini dimasukkan dalam mesin waktu estimasi reliabilitas tes performansi maksimal
dan dikembalikan ke keadaannya saat dites
seperti tes prestasi. Practice effect akan
pertama kali.
menyebabkan underestimasi reliabilitas, tes
terkesan tidak ajeg karena adanya pembelajaran,
Mustahil? Ya jelas! maka dari itu ide mengenai sehingga hasil tes kedua akan cenderung lebih
keajegan ini hanya ada dalam abstraksi teoretik. baik dari hasil tes pertama.
Pendekatan Tes Paralel, pendekatan ini
Namun demikian tentu saja kita tetap dapat
mengestimasi reliabilitas dengan menggunakan
mengestimasi reliabilitas dengan cara melakukan dua tes paralel, dua tes yang mengukur hal
tes berulang lalu mengkorelasikan hasil tes
/konstruk yang sama, kemudian mengkorelasikan
pertama dengan tes kedua. Dengan
hasil pengetesan dari tes pertama dengan hasil tes
mempertimbangkan beberapa kelemahan dan
paralelnya. Koefisien korelasi yang didapatkan
persyaratannya.
disebut juga koefisien ekuivalensi. Namun
demikian pendekatan ini sangat jarang (kalaupun
Pendekatan-Pendekatan Estimasi Reliabilitas
ada) dilakukan karena sulitnya menghasilkan dua
(Feldt & Brennan, 1989: 105)
tes yang benar-benar paralel.
Pendekatan Konsistensi Internal, pendekatan
Dari beberapa asumsi yang mendasari pemikiran ini mengestimasi reliabilitas dengan membelah
mengenai reliabilitas, kemudian diturunkanlah tes menjadi beberapa bagian, lalu
beberapa pendekatan untuk mengestimasi
"mengkorelasikan" bagian-bagian tersebut.
reliabilitas.
"Korelasi" di sini sebenarnya tidak benar-benar
Pendekatan Tes-Retes. Pendekatan ini
mengkorelasikan bagian-bagian secara harafiah,
mengestimasi reliabilitas tes dengan melakukan tapi menggunakan formula-formula yang
tes ulang, kemudian mengkorelasikan hasil tes dikembangkan untuk mengestimasi
pertama dengan hasil tes kedua. Hasil korelasi ini reliabilitasnya. Koefisien yang diperoleh dinamai
yang merupakan estimasi reliabilitasnya, sering juga koefisien konsistensi internal. Pendekatan

inilah yang paling sering digunakan selama ini


karena lebih praktis dan ekonomis. Meskipun
demikian pendekatan ini tidak dapat
mengestimasi error yang diakibatkan oleh

keadaan temporer karena hanya dilakukan satu


kali. Jadi pendekatan ini memang bukan
"jawaban terhadap segala masalah" dalam hal
mengestimasi reliabilitas.

Kesimpulan
Jadi, reliabilitas apakah sama dengan keajegan?
Jika kita melihat permasalahan ini dari kacamata asumsi yang mendasari pemikiran reliabilitas di
atas, maka reliabel = ajeg. tentu saja dengan persyaratan yang mustahil untuk dipenuhi tadi.
Tapi jika dilihat dalam konteks aplikasinya, reliabilitas tidak selalu sama dengan keajegan,
tergantung dari pendekatan mana yang digunakan untuk mengestimasinya.
Mungkin akan lebih aman jika kita menyebut reliabilitas sebagai "tingkat kepercayaan, seberapa
jauh error yang dihasilkan dari tes, dan seberapa jauh hasil tes dapat dipercaya". (Feldt & Brennan,
1989: 105)

Anda mungkin juga menyukai