Campbell dan Fiske (1959) mengembangkan suatu pendekatan untuk menguji validitas
konstruk yang disebut multitrait-multimethod. Validitas dengan multitrait-multimethod
digunakan dengan menggunakan lebih dari satu macam metode untuk mengukur lebih dari
satu macam trait.
Pada matriks validas tabel 1 di atas, koefisien korelasi antara skor tes dengan dirinya
sendiri tidak dicantumkan sebagai r=1, tetapi digantikan eloh koefisien reliabilitasnya.
Sebagai contoh, koefisien reliabilitas atas skala introversi yang menggunakan metode YT
adalah 0.8 dan dalam matrik diletakan dalam tanda kurung. Dasar pemikiran dalam
validitas dengan pendekatan ini adalah adanya validitas yang baik diperlihatkan oleh
korelasi yang tinggi antara dua pengukuran terhadap trait yang sama oleh dua metode yang
berbeda, atau korelasi yang rendah antara dua pengukuran terhadap trait yang sama oleh
dua metode yang berbeda, atau korelasi yang rendah antara dua pengukuran terhadap trait
10
yang berbeda walaupun menggunakan metode yang serupa. Pada tabel 1, dapat dijelaskan
bahwa skala-skala tersebut menunjukkan hasil ukur yang memiliki validitas konstruk yang
baik. Perhatikan bahwa skala introversi YT dan skala Introversi PG berkolerasi 0.78; skala
neurotisme YT dan Neurotisme PG berkorelasi sebesar 0.72.
Tampak juga pada tabel 1, bahwa korelasi masing-masing skala yang mengukur trait yang
berbeda, kesemuanya rendah. Dalam istilah validitas, skala-skala tersebut memperlihatkan
adanya validitas konvergen dan validitas diskriminan. Validitas konvergen adalah
validitas yang ditunjukkan oleh tingginya korelasi antara skor skala-skala yang mengukur
trait yang sama. Sedangkan validitas diskriminan adalah validitas yang ditunjukan oleh
rendahnya korelasi antara skor skala-skala yang mengukur trait yang berbeda. Pada contoh
tersebut, validitas konvergen dan daya beda diskriminant validity) termasuk dalam kategori
baik. Maka dapat diilustrasikan suatu matriks validasi multitrait-multimethod yang ideal
seperti pada tabel 2 berikut
Perhatikan tabel 2 di atas, huruf melambangkan trait dan angka melambangkan metode.
Jadi, A1 dan A2 adalah dua skala yang mengukur trait yang sama, yaitu traut A diukur oleh
dua metode yang berbeda, metode 1 dan metode 2. A1 dan B1 adalah dua macam trait yang
berbeda yang dikuru oleh satu metode yang sama, yaitu metode 1. A1 dan B2
melambangkan mengukur dua trait yang berbeda yaitu trait A dan B yang diukur oleh dua
metode yang berbeda, metode 1 dan metode 2. Korelasi antara setiap variable dengan
dirinya sendiri, yaitu rA1A1, rB1B1, rA2A2, dan rB2B2.
Pendekatan lain untuk menguji validitas konstruk adalah dengan menggunakan analisis
vaktor. Validitas konstruk dilakukan untuk mengetahui sejauh mana tes/instrument
mengungkap suatu trait atau konstruk teoritik yang hendak diukur (Allen & Yen,
1979:108). Pendekatan ini, melibatkan perhitungan statistic yang memiliki persyaratan-
persyaratan yang ketat, dengan melihat hubungan antara variable-variabel dan menjelaskan
saling hubungan tersebut dalam bentuk kelompok variable yang terbatas yang disebut
faktor. Oleh karena itu validitas yang diperoleh melalui pendekatan ini disebut validitas
faktorial.
Prosedur analisis faktor yang dapat digunakan tergantung pada konstruk teori yang
dibangun. Jika seorang pembuat instrument (tes atau nontes) menganggap konstruk teoritis
yang dibangun sudah mapan, maka analisi faktor yang digunakan adalah analisis faktor
11
konfirmatori, tujuannya untuk mengkonfirmasi apakah eori yang dibangun untuk
menyusun instrument tersebut sesuai dengan data empirik atau tidak. Analsis faktor
konfirmatori pada tulisan ini belum bisa kami jelaskan, cukup diketahui gambaran
umumnya saja. Kemudian, jika pembuat instrument merasa konstruk teoritisnya masih
belum mapan, sehingga faktor-faktor yang membangun instrument tersebut belum
teridentifikasi dengan jelas, maka prosedur analisis faktor yang digunakan adalah analisis
faktor eksploratori. Pembuktian validitas konstruk dilakukan dengan menggunakan
analisis faktor eksploratori digunakan untuk mengungkap trait (sifat) atau konstruk teoritis
yang hendak diukur. Dalam arti, untuk mengetahui apakah butir-butir yang telah disusun
menggunakan factor-faktor yang membangun instrument tersebut. Metode analisis faktor
dapat diukur dengan aplikasi SPSS.
12
Apa itu Reliabilitas?
Reliabilitas adalah keakuratan dan ketepatan dari suatu alat ukur dalam suatu prosedur
pengukuran. Berdasarkan bahasa, reliabilitas berasal dari kata reliability yang terdiri dari
kata rely dan ability, artinya sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu
hasil pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama,
selama aspek yang diukur dalam diri subyek memang belum berubah.
Reliabilitas
Berikut ini beberapa pengertian dan definisi reliabilitas dari beberapa sumber buku:
Karakteristik Reliabilitas
Sebuah tes dianggap memiliki reliabilitas yang baik apabila memiliki karakteristik sebagai
berikut:
13
1. Reliabilitas merupakan milik dari satu set nilai tes bukan milik tes itu sendiri,
artinya suatu tes dikatakan baik apabila dapat menghasilkan skor yang cukup
akurat, apabila tes tersebut diberikan pada kelas tertentu, maka bisa juga
menghasilkan skor yang cukup konsisten bila diberikan pada kelas yang berbeda
atau ketika diberikan pada kelas yang sama pada waktu yang berbeda.
2. Suatu tes dikatakan reliable jika dua buah tes dilakukan pada jarak waktu yang
berbeda dan menunjukkan skor yang tidak jauh berbeda.
3. Reliabilitas dapat dinyatakan untuk dua atau lebih pengukuran independen yang
diperoleh dari tes yang sama untuk setiap anggota kelompok.
Uji reliabilitas dengan metode tes ulang digunakan untuk mengetahui sejauh mana suatu
pengukuran dapat diandalkan. Uji ini dilakukan sebanyak dua kali, pengukuran pertama
dan ulangnya. Kedua pengukuran dapat dilakukan oleh orang yang sama atau berbeda.
Dalam hal ini perlu diatur bahwa proses pengukuran kedua, keadaan yang diukur itu harus
benar-benar sama. Selanjutnya hasil pengukuran yang pertama dan yang kedua
dikorelasikan dan hasilnya menunjukkan reliabilitas dari tes ini.
Hal penting yang perlu diperhatikan dalam pengukuran reliabilitas tes ulang adalah; 1).
jangka waktu antara kedua pengambilan penilaian, 2). stabilitas yang diharapkan dari
kinerja yang diukur. Secara umum, semakin lama antara interval pelaksanaan tes yang
berulang, semakin rendah tingkat reliabilitasnya. Pendekatan tes ulang merupakan
pemberian perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan
selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh tes yang
sama akan menghasilkan skor tampak yang relatif sama.
Estimasi reliabilitas dengan pendekatan tes ulang akan menghasilkan koefisien stabilitas
(stability). Untuk memperoleh koefisien reliabilitas melalui pendekatan tes ulang dapat
dilakukan dengan menghitung koefisien korelasi linier antara distribusi skor subyek pada
pemberian tes pertama dengan skor subjek pada pemberian tes kedua.
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran dan susunan tetapi butir-butir soalnya berbeda, dalam istilah bahasa
Inggris disebut alternate-forms method (parallel forms).
X
Pengujian reliabilitas instrument dengan cara ini cukup dilakukan sekali, tetapi
instrumennya dua, pada responden yang sama, waktu sama, instrument berbeda.
Reliabilitas instrument dihitung dengan cara mengkorelasikan antara data instrument yang
satu dengan data instrument yang dijadikan ekuivalen. Bila korelasi positif dan signifikan,
maka instrument dapat danyatakan reliable.
14
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus
menyusun dua seri tes. Lagipula harus tersedia waktu yang lama untuk mencobakan dua
kali tes.
Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrument yang
ekuivalen itu beberapa kali, ke responden yang sama. Reliabilitas instrument dilakukan
dengan mengkorelasikan dua instrument, setelah itu dikorelasikan pada pengujian kedua
dan selanjutnya dikorelasikan silang. Jika dengan dua kali pengujian dalam waktu yang
berbeda maka akan dapat dianalisis keenam koefesien reliabilitas. Bila keenam koefesien
korelasi itu semuanya positif dan signifikan maka dapat dinyatakan bahwa instrument
tersebut reliable.
Terdapat beberapa rumus dalam pengujian reliabilitas instrumen, antara lain; Spearman
Brown, Flanagan, Rulon, Kuder Richardson (KR) dan Cronbanch Alpha.
a. Rumus Spearman-Brown
Rumus Spearman-Brown
Keterangan:
ri = reliabilitas instrument
rb = indeks korelasi antara dua belahan instrument
N = banyaknya responden
X = belahan pertama
Y = belahan kedua
b. Rumus Flanagan
15
Rumus Flanagan
Keterangan:
BACA JUGA
c. Rumus Rulon
Rumus Rulon
Keterangan:
ri = reliabilitas instrument
Vt = varians total atau varians skor total
Vd = varians (varians difference)
d = skor pada belahan awal dikurangi skor pada belahan akhir
d. Rumus KR 20
Rumus KR 20
16
Keterangan:
ri = reliabilitas instrument
k = banyaknya butir pertanyaan atau banyaknya soal
pi = proporsi subjek yang menjawab betul pada suatu butir (proporsi subjek yang
mendapat skor 1)
e. Rumus KR 21
Rumus KR 21
Keterangan:
ri = reliabilitas instrument
k = banyaknya butir pertanyaan atau banyaknya soal
p = skor rata-rata
17
. Validitas Prediktif
Validitas tes berdasarkan kriteria yakni umumnya tes yang akan diuji validitasnya
disebut prediktor. Statistik yang diperlukan untuk pengujian validitas ini adalah
koefisien korelasi antara skor tes sebagai prediktor dan skor suatu kriteria. Mardapi
(2004) mengatakan bahwa prosedur guna mencapai criterion-related
validity menghendaki adanya kriteria eksternal yang dapat dihubungkan dengan
skor tes yang diuji validitasnya. Kriteria dalam hal ini adalah variabel perilaku yang
akan diprediksi oleh skor tes. Koefisien korelasi antara skor tes (X) dengan kriteria
(Y) merupakan koefisien validitas yang menunjukkan kekuatan validitas prediktif
suatu tes.
Pembaca, apabila skor kriteria validasi merupakan skor yang hendak di prediksi oleh
tes dan karenanya baru dapat diperoleh setelah tenggang waktu tertentu setelah
tes dikenakan, maka prosedur validasi berdasar kriteria akan menghasilakan sebuah
statistik yang disebut koefisien validitas prediktif (Azwar, 2004). Selanjutnya, Azwar
memberikan ilustrasi sebagai berikut: Tes A dirancang sebagai alat seleksi dalam
memilih calon operator komputer yang akan diterima diantara sekian banyak
pelamar. Pemilihan calon yang akan diterima harus berdasarkan prediksi bahwa
mereka yang akan diterima akan berhasil dalam pekerjaannya. Misalnya tes A
mengukur kemampuan psikologis tertentu, misalnya motivasi, jadi skor tes A
18
merupakan predictor keberhasilan kerja. Kalau tes A memang baik sebagai alat
prediksi keberhasilan kerja, pastilah pelamar yang diterima bekerja, karena skornya
tinggi pada tes A, akan berhasil nantinya dalam pekerjaan mereka. Berhasil dalam
arti, memiliki ukuran-ukuran keberhasilan. Misal keberhasilan iu dapat diketahui
dari hasil rating yang dilakukan oleh asesor setelah mereka bekerja.
Untuk dapat menguji validitas prediktif tes A, diperlukan skor hasil rating dari asesor
setelah pelamar yang diterima bekerja. Prosedurnya adalah menghitung korelasi
antara skor yang diperoleh pelamar pada saat dites (skor motivasi) dengan tes A
dengan skor hasil rating assessor. Semakin tinggi korelasi antara kedua skor
tersebut, maka semakin baik validitas prediktif tes A tersebut.
Contoh lain misalnya, skor tes masuk perguruan tinggi yang mana sebagian besar
calon mahasiswa dikenai tes (SBMPTN) masuk yang pada dasarnya adalah prediktor
terhadap keberhasilan belajar mereka setelah menjadi mahasiswa. Mereka yang
mencapai skor tertentu dapat diterima dan diperbolehkan belajar di perguruan
tinggi, sedangkan sisanya ditolak. Karena tes masuk tersebut dirancang guna
membedakan antara mereka yang memiliki kemungkinan besar untuk berhasil
dalam belajar di perguruan tinggi dan yang tidak, maka selayaknya bila kriteria yang
dipakai sebagai indikator keberhasilan itu adalah indeks prestasi (IP) mereka setelah
beberapa semester menjadi mahasiswa. Hanya saja, karena tidak semua calon
mahasiswa dapat diterima maka skor kriteria hanya dapat diperoleh dari mereka
yang diterima menjadi mahasiswa saja, jadi merupakan sampel yang relatif
homogen karena hanya diambil dari ujung distribusi skor tes masuk. Jadi, korelasi
antara skor prediktor dan skor kriteria hanya dapat dihitung berdasar data sampel
yang relative terbatas heterogenitasnya.
Bagaimana efek restrisik sebaran ini terhadap koefisien validitas? Bila skor prediktor
adalah X dan skor kriteria adalah Y, korelasi antara X dan Y adalah r XY yang
merupakan koefisien validitas prediktif tes X. Hubungan antara r XY dan kesalahan
standar estimasi (standard error of estimate) dilukiskan sebagai :
Keterangan :
19
s Y X = kesalahan standar estimasi X terhadap Y, yaitu deviasi standard distribusi Y
untuk harga X tertentu
s y = Deviasi standar skor criteria Y (distribusi marginal)
r XY = Koefisien korelasi antara perdiktor X dan criteria Y.
Tampak pada tabel 1, besarnya korelasi antara skor masuk tes A (X) dengan skor
ratting assessor (Y) adalah r XY =0.81. ini menunjukkan bahwa tes A memiliki
validitas prediktif yang baik. Selanjutnya, dapat dihitung kesalahan standar estimasi
skor X terhadap skor Y, dengan terlebih dahulu menghitung standar deviasi skor
kriteria s y = 1.73. Subsitusikan nilai r XY dan s y pada persamaan
Jadi kesalahan standar estimasi sebesar 0.0145. Angka ini menunjukkan bahwa
kesalahan standar estimasi masih tergolong dapat ditolerir.
2. Validitas Konkuren
20
Pada dasarnya, dalam menyusun dan mengembangkan instrumen psikologi,
pengujian validitas suatu instrument dala menjalankan fungsi ukurnya seringkali
dapat dilakukan dengan melihat sejauh mana kesesuaian antara hasil ukur
instrumen tersebut dengan hasil ukur instrumen lain yang sudah teruji kualitasnya
atau dengan ukuran-ukuran yang dianggap dapat menggambarkan aspek yang
diukur tersebut secara reliabel. Dalam kasus seperti ini, instrumen yang telah teruji
validitasnya atau ukuran yang dianggap tepat berlaku sebagai kriteria validasi.
Tampak pada tabel 2, hasil perhitungan atas data fiktif untuk kedua tes X dan tes Y,
diperoleh korelasi antara tes X dengan tes Y sebagai kriteria, yaitu r XY =0.86. angka
0.86 merupakan koefisien validitas tes X. Azwar (2004) menyatakan bahwa
ada perbedaan antara validitas prediktif dengan validitas konkuren, yaitu :
21
Waktu pengambilan data : pada validitas prediktif data yang dijadikan
sebagai kriteria diperoleh setelah tenggang waktu tertentu sedangkan data validasi
konkuren diperoleh bersama dengan data prediktornya;
Fungsi dari kriterianya : pada validasi prediktif kriterinya merupakan variabel
perilaku yang hendak diprediksikan oleh tes sedangkan pada validasi konkuren
kriterianya merupakan ukuran kesesuaian fungsi ukur tes yang bersangkutan.
Dengan kata lain, kriteria pada validasi prediktif sudah diketahui terlebih dahulu
sedangkan pada validasi konkuren menentukan kriteria yang layak tidak selalu
mudah dilakukan.
22
BAB II
KAJIAN PUSTAKA
A. Kajian Teori
1. Pengertian Reliabilitas
yang berasal dari kata reliable yang berarti dapat dipercaya. Raliabilitas
Carmines & Zeller, 1979: 11; Cohen et al., 2007: 147; Faralina, Kadri, &
Yap, 2016:
48; Franzen, 2002: 7; Garson, 2013: 28; Mardapi, 2017: 46; Wantah,
2010: 132). Oleh karena itu, reliabilitas suatu instrumen harus diestimasi
Reliabilitas tidak bisa diketahui secara tepat atau pasti. Hal ini
bukanlah sesuatu yang pasti atau mutlak (Onwuegbuzie & Daniel, 2002:
23
konsistensi, dan kemampuan meniru dari waktu ke waktu, dengan
satu
24
atau lebih instrumen dan satu atau lebih kelompok responden.
ini diambil (Kirk & Miller, 1986: 19). Dalam buku Introduction to
tes. Sebagai contoh, sebuah tes adalah reliable jika skor amatan
kapanpun dengan kondisi yang sama ataupun pada subjek yang berbeda
2. Macam-Macam Reliabilitas
consistency (Allen & Yen, 1979: 77-83; Azwar, 2018: 51-88; Cohen et al.,
menggunakan instumen yang sama dan pada subjek yang sama (atau
paralel, yaitu dua buah tes yang paralel (mengukur konstruk dan
karakterisik yang sama) kemudian digunakan pada dua kelompok
3. Internal Consistency
Reliabilitas berdasarkan internal consistency diestimasi hanya
menggunakan satu kali tes, dan hal ini untuk menghindari masalah yang
& Yen, 1979: 78; Azwar, 2018: 59; Cohen et al., 2007: 147; Mardapi,
2017:
brunet, & Doval, 2017: 755). Sampel yang sangat besar dari peserta akan
mengukur satu laten trait (Allen & Yen, 1979: 83). Internal
2013: 947).
Internal consistency dapat dilakukan menggunakan 3 pendekatan,
adalah paralel (memiliki varians belahan yang sama dan rerata kedua
kedua belahan tes memiliki varians yang sama dan rerata kedua belahan
4. τ-Equivalent
sangat mungkin bahwa kedua belahan tersebut tidak homogen. Padahal pada
penelitian ini.
5. Faktor-Faktor yang Mempengaruhi Reliabilitas
berbeda walaupun diterapkan pada data yang sama. Hal ini dikarenakan
adalah perbedaan konsep atau dasar pikiran yang melandasi ide dasar
terbentuknya suatu formula, sifat distribusi skor item atau skor tes,
a. Panjang Tes
item. Hal ini terutama terlihat jelas pada data dikotomus, karena pada
memberi skor.
yang berlaku agar tidak terjadi estimasi yang sembarangan. Ketika tanpa
hampir sama. Jika dalam hal ini, penerapan teknik estimasi reliabilitas
Pendekatan τ- equivalent
reliabilitas.
a. Flanagan
Keterangan:
b. Guttman
=2 1− (2)
Keterangan:
c. Rulon
varians yang sama (Mardapi, 2017: 61). Hal ini berarti, rumus Rulon
61).
=1− (3)
Keterangan:
d. Koefisien Alpha
dari skor pada tes multiple-item yang mengukur satu latent trait
reliabilitas dengan metode belah dua. Apabila kedua belahan tes tidak
3). Jika teknik Koefisien Alpha diterapkan pada tes yang isinya
belahan homogen dan rerata tidak sama). Rumus Koefisien Alpha yang
digunakan untuk estimasi koefisien reliabilitas dengan metode belah
∑ (4)
=
Keterangan:
: Varians belahan ke - i
e. Kuder Richardson-20
dikembangkan oleh Kuder dan Richardson pada tahun 1937 (Allen &
Yen, 1979: 84). Nama lain dari rumus ini adalah Koefisien Alpha –
tidaklah cukup (Tan, 2009: 108). Hal ini sesuai dengan yang
∑ ( ) (5)
− 20 =
Keterangan:
reliabilitas adalah sebagai berikut ini (Allen & Yen, 1979: 84;
Azwar,
()
− 21 = (6)
Keterangan:
item
reliable
suatu instrument, maka semakin sedikit kesalahan pengukuran yang terjadi.
sebagai berikut.
= =1− (7)
Keterangan:
: koefisien reliabilitas
sama dengan true score dari examinee tersebut (Allen & Yen, 1979: 89).
Jadi, semakin kecil nilai SEM, maka semakin tepat pengukuran yang
lainnya dengan data yang sama, maka teknik estimasi reliabilitas tersebut
dalam tema yang sama dengan penelitian ini. Namun, tentunya terdapat
penelitian ini adalah sebagai berikut ini. Penelitian yang dilakukan oleh
yang dilakukan oleh Westrick dan penelitian ini memiliki persamaan dan
bantuan SPSS. Penelitian sekarang ini juga akan mencari tahu apakah terdapat
perbedaan koefisien reliabilitas dari berbagai teknik dengan memberikan
penggunaan yang sama. Grup pertama terdiri dari teknik estimasi reliabilitas
ada.
belahan. Dalam penelitian ini akan diadakan uji homogenitas varians antara
kedua belahan. Sumber data dalam penelitian Sarwiningsih didapatkan dari
Nasional Kimia SMA Tahun Ajaran 2014/2015. Sedangkan penelitian ini akan
menjadi skor z mengacu pada tabel z kurve normal. Hasil penelitian tersebut
estimasi teknik reliabilitas lainnya terhadap data yang sama dan perbandingan
dari segi SEM. Pada penelitian ini teknik estimasi reliabilitas yang
Jumlah estimasi reliabilitas yang dilakukan dalam penelitian ini akan lebih
C. Kerangka Pikir
dari 0 sampai
baik diantara yang lain dan apakah terdapat perbedaan koefisien estimasi
administrasi tes sebanyak 1 kali. Karena pelaksanaan tes hanya 1 kali, maka
tidak ada kekhawatiran yang dapat terjadi akibat pengulangan tes yang dapat
tepat digunakan pada tes yang mengukur satu latent trait (unidimensi). Salah
untuk belah dua yaitu kedua belahan memiliki varians yang sama/homogen
biasanya terdapat toleransi kesalahan 0.05 (5%) yang dapat digunakan untuk
kedua belahan tidak sama dan rerata kedua belahan tidak sama ( ≠
≠ ).
tidak mensyaratkan agar kedua belahan homogen, tetapi bukan berarti tidak
dapat digunakan pada dua belahan tes yang homogen. Sehingga dalam
penelitian ini teknik estimasi reliabilitas dengan Rulon akan digunakan pada
Khusus untuk teknik estimasi reliabilitas dengan metode belah dua (spit-
homogen dengan taraf signifikansi 0.05. Selain itu, akan diestimasi juga
seseorang dalam suatu tes. SEM berlaku sama untuk semua individu dalam
teknik estimasi reliabilitas, untuk varians skor total akan selalu sama karena
(Azwar, 2018: 93). Hal ini dikarenakan, beberapa hal yang dapat
dasar pemikiran yang berbeda, sifat distribusi skor item dan skor tes, varians
membelah tes yang dikotomus menjadi sebanyak butir tes, yaitu KR-20. Hal
menjawab benar dengan proporsi menjawab salah sama dengan varians item
estimasi reliabilitas walaupun digunakan pada data yang sama. Jika koefisien
21?