Tugas 3
Tugas 3
adalah validitas yang menunjukkan sejauhmana suatu tes mengukur konstruk teori yang
menjadi dasar penyusunan tes itu. Prosedur pengujian validitas konstruk berasal dari hasil
komputasi interkorelasi diantara berbagai hasil test dan kemudian diikuti oleh hasil test dan
kemudian diikuti oleh analisis lebih lanjut terhadap matriks korelasi yang diperoleh,
melalui berbagai metode. Diantara metode yang sering digunakan adalah metode
multirait-multimethod dan analisis faktor. Pengukuran validitas konstruk merupakan
proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait (sifat)
yang diukur. Namun, pada situasi-situasi tertentu adanya bukti validitas konstruk mungkin
diperlihatkan. Validitas ini adalah salah satu jenis validitas, menurut yang ditetapkan oleh
American Psycological Association ada 3 jenis validitas yaitu conten validity, construct
validity dan criterion-related validity.
Campbell dan Fiske (1959) mengembangkan suatu pendekatan untuk menguji validitas
konstruk yang disebut multitrait-multimethod. Validitas dengan multitrait-multimethod
digunakan dengan menggunakan lebih dari satu macam metode untuk mengukur lebih dari
satu macam trait.
Pada matriks validas tabel 1 di atas, koefisien korelasi antara skor tes dengan dirinya
sendiri tidak dicantumkan sebagai r=1, tetapi digantikan eloh koefisien reliabilitasnya.
Sebagai contoh, koefisien reliabilitas atas skala introversi yang menggunakan metode YT
adalah 0.8 dan dalam matrik diletakan dalam tanda kurung. Dasar pemikiran dalam
validitas dengan pendekatan ini adalah adanya validitas yang baik diperlihatkan oleh
korelasi yang tinggi antara dua pengukuran terhadap trait yang sama oleh dua metode yang
berbeda, atau korelasi yang rendah antara dua pengukuran terhadap trait yang sama oleh
dua metode yang berbeda, atau korelasi yang rendah antara dua pengukuran terhadap trait
10
yang berbeda walaupun menggunakan metode yang serupa. Pada tabel 1, dapat dijelaskan
bahwa skala-skala tersebut menunjukkan hasil ukur yang memiliki validitas konstruk yang
baik. Perhatikan bahwa skala introversi YT dan skala Introversi PG berkolerasi 0.78; skala
neurotisme YT dan Neurotisme PG berkorelasi sebesar 0.72.
Tampak juga pada tabel 1, bahwa korelasi masing-masing skala yang mengukur trait yang
berbeda, kesemuanya rendah. Dalam istilah validitas, skala-skala tersebut memperlihatkan
adanya validitas konvergen dan validitas diskriminan. Validitas konvergen adalah
validitas yang ditunjukkan oleh tingginya korelasi antara skor skala-skala yang mengukur
trait yang sama. Sedangkan validitas diskriminan adalah validitas yang ditunjukan oleh
rendahnya korelasi antara skor skala-skala yang mengukur trait yang berbeda. Pada contoh
tersebut, validitas konvergen dan daya beda diskriminant validity) termasuk dalam kategori
baik. Maka dapat diilustrasikan suatu matriks validasi multitrait-multimethod yang ideal
seperti pada tabel 2 berikut
Perhatikan tabel 2 di atas, huruf melambangkan trait dan angka melambangkan metode.
Jadi, A1 dan A2 adalah dua skala yang mengukur trait yang sama, yaitu traut A diukur oleh
dua metode yang berbeda, metode 1 dan metode 2. A1 dan B1 adalah dua macam trait yang
berbeda yang dikuru oleh satu metode yang sama, yaitu metode 1. A1 dan B2
melambangkan mengukur dua trait yang berbeda yaitu trait A dan B yang diukur oleh dua
metode yang berbeda, metode 1 dan metode 2. Korelasi antara setiap variable dengan
dirinya sendiri, yaitu rA1A1, rB1B1, rA2A2, dan rB2B2.
Pendekatan lain untuk menguji validitas konstruk adalah dengan menggunakan analisis
vaktor. Validitas konstruk dilakukan untuk mengetahui sejauh mana tes/instrument
mengungkap suatu trait atau konstruk teoritik yang hendak diukur (Allen & Yen,
1979:108). Pendekatan ini, melibatkan perhitungan statistic yang memiliki persyaratan-
persyaratan yang ketat, dengan melihat hubungan antara variable-variabel dan menjelaskan
saling hubungan tersebut dalam bentuk kelompok variable yang terbatas yang disebut
faktor. Oleh karena itu validitas yang diperoleh melalui pendekatan ini disebut validitas
faktorial.
Prosedur analisis faktor yang dapat digunakan tergantung pada konstruk teori yang
dibangun. Jika seorang pembuat instrument (tes atau nontes) menganggap konstruk teoritis
yang dibangun sudah mapan, maka analisi faktor yang digunakan adalah analisis faktor
11
konfirmatori, tujuannya untuk mengkonfirmasi apakah eori yang dibangun untuk
menyusun instrument tersebut sesuai dengan data empirik atau tidak. Analsis faktor
konfirmatori pada tulisan ini belum bisa kami jelaskan, cukup diketahui gambaran
umumnya saja. Kemudian, jika pembuat instrument merasa konstruk teoritisnya masih
belum mapan, sehingga faktor-faktor yang membangun instrument tersebut belum
teridentifikasi dengan jelas, maka prosedur analisis faktor yang digunakan adalah analisis
faktor eksploratori. Pembuktian validitas konstruk dilakukan dengan menggunakan
analisis faktor eksploratori digunakan untuk mengungkap trait (sifat) atau konstruk teoritis
yang hendak diukur. Dalam arti, untuk mengetahui apakah butir-butir yang telah disusun
menggunakan factor-faktor yang membangun instrument tersebut. Metode analisis faktor
dapat diukur dengan aplikasi SPSS.
12
Apa itu Reliabilitas?
Reliabilitas adalah keakuratan dan ketepatan dari suatu alat ukur dalam suatu prosedur
pengukuran. Berdasarkan bahasa, reliabilitas berasal dari kata reliability yang terdiri dari
kata rely dan ability, artinya sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu
hasil pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif sama,
selama aspek yang diukur dalam diri subyek memang belum berubah.
Reliabilitas
Berikut ini beberapa pengertian dan definisi reliabilitas dari beberapa sumber buku:
Karakteristik Reliabilitas
Sebuah tes dianggap memiliki reliabilitas yang baik apabila memiliki karakteristik sebagai
berikut:
13
1. Reliabilitas merupakan milik dari satu set nilai tes bukan milik tes itu sendiri,
artinya suatu tes dikatakan baik apabila dapat menghasilkan skor yang cukup
akurat, apabila tes tersebut diberikan pada kelas tertentu, maka bisa juga
menghasilkan skor yang cukup konsisten bila diberikan pada kelas yang berbeda
atau ketika diberikan pada kelas yang sama pada waktu yang berbeda.
2. Suatu tes dikatakan reliable jika dua buah tes dilakukan pada jarak waktu yang
berbeda dan menunjukkan skor yang tidak jauh berbeda.
3. Reliabilitas dapat dinyatakan untuk dua atau lebih pengukuran independen yang
diperoleh dari tes yang sama untuk setiap anggota kelompok.
Uji reliabilitas dengan metode tes ulang digunakan untuk mengetahui sejauh mana suatu
pengukuran dapat diandalkan. Uji ini dilakukan sebanyak dua kali, pengukuran pertama
dan ulangnya. Kedua pengukuran dapat dilakukan oleh orang yang sama atau berbeda.
Dalam hal ini perlu diatur bahwa proses pengukuran kedua, keadaan yang diukur itu harus
benar-benar sama. Selanjutnya hasil pengukuran yang pertama dan yang kedua
dikorelasikan dan hasilnya menunjukkan reliabilitas dari tes ini.
Hal penting yang perlu diperhatikan dalam pengukuran reliabilitas tes ulang adalah; 1).
jangka waktu antara kedua pengambilan penilaian, 2). stabilitas yang diharapkan dari
kinerja yang diukur. Secara umum, semakin lama antara interval pelaksanaan tes yang
berulang, semakin rendah tingkat reliabilitasnya. Pendekatan tes ulang merupakan
pemberian perangkat tes yang sama terhadap sekelompok subjek sebanyak dua kali dengan
selang waktu yang berbeda. Asumsinya adalah bahwa skor yang dihasilkan oleh tes yang
sama akan menghasilkan skor tampak yang relatif sama.
Estimasi reliabilitas dengan pendekatan tes ulang akan menghasilkan koefisien stabilitas
(stability). Untuk memperoleh koefisien reliabilitas melalui pendekatan tes ulang dapat
dilakukan dengan menghitung koefisien korelasi linier antara distribusi skor subyek pada
pemberian tes pertama dengan skor subjek pada pemberian tes kedua.
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran dan susunan tetapi butir-butir soalnya berbeda, dalam istilah bahasa
Inggris disebut alternate-forms method (parallel forms).
X
Pengujian reliabilitas instrument dengan cara ini cukup dilakukan sekali, tetapi
instrumennya dua, pada responden yang sama, waktu sama, instrument berbeda.
Reliabilitas instrument dihitung dengan cara mengkorelasikan antara data instrument yang
satu dengan data instrument yang dijadikan ekuivalen. Bila korelasi positif dan signifikan,
maka instrument dapat danyatakan reliable.
14
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus
menyusun dua seri tes. Lagipula harus tersedia waktu yang lama untuk mencobakan dua
kali tes.
Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrument yang
ekuivalen itu beberapa kali, ke responden yang sama. Reliabilitas instrument dilakukan
dengan mengkorelasikan dua instrument, setelah itu dikorelasikan pada pengujian kedua
dan selanjutnya dikorelasikan silang. Jika dengan dua kali pengujian dalam waktu yang
berbeda maka akan dapat dianalisis keenam koefesien reliabilitas. Bila keenam koefesien
korelasi itu semuanya positif dan signifikan maka dapat dinyatakan bahwa instrument
tersebut reliable.
Terdapat beberapa rumus dalam pengujian reliabilitas instrumen, antara lain; Spearman
Brown, Flanagan, Rulon, Kuder Richardson (KR) dan Cronbanch Alpha.
a. Rumus Spearman-Brown
Rumus Spearman-Brown
Keterangan:
ri = reliabilitas instrument
rb = indeks korelasi antara dua belahan instrument
N = banyaknya responden
X = belahan pertama
Y = belahan kedua
b. Rumus Flanagan
15
Rumus Flanagan
Keterangan:
BACA JUGA
c. Rumus Rulon
Rumus Rulon
Keterangan:
ri = reliabilitas instrument
Vt = varians total atau varians skor total
Vd = varians (varians difference)
d = skor pada belahan awal dikurangi skor pada belahan akhir
d. Rumus KR 20
Rumus KR 20
16
Keterangan:
ri = reliabilitas instrument
k = banyaknya butir pertanyaan atau banyaknya soal
pi = proporsi subjek yang menjawab betul pada suatu butir (proporsi subjek yang
mendapat skor 1)
e. Rumus KR 21
Rumus KR 21
Keterangan:
ri = reliabilitas instrument
k = banyaknya butir pertanyaan atau banyaknya soal
p = skor rata-rata
17
. Validitas Prediktif
Validitas tes berdasarkan kriteria yakni umumnya tes yang akan diuji validitasnya disebut
prediktor. Statistik yang diperlukan untuk pengujian validitas ini adalah koefisien korelasi
antara skor tes sebagai prediktor dan skor suatu kriteria. Mardapi (2004) mengatakan
bahwa prosedur guna mencapai criterion-related validity menghendaki adanya kriteria
eksternal yang dapat dihubungkan dengan skor tes yang diuji validitasnya. Kriteria dalam
hal ini adalah variabel perilaku yang akan diprediksi oleh skor tes. Koefisien korelasi
antara skor tes (X) dengan kriteria (Y) merupakan koefisien validitas yang menunjukkan
kekuatan validitas prediktif suatu tes.
Pembaca, apabila skor kriteria validasi merupakan skor yang hendak di prediksi oleh tes
dan karenanya baru dapat diperoleh setelah tenggang waktu tertentu setelah tes dikenakan,
maka prosedur validasi berdasar kriteria akan menghasilakan sebuah statistik yang disebut
koefisien validitas prediktif (Azwar, 2004). Selanjutnya, Azwar memberikan ilustrasi
sebagai berikut: Tes A dirancang sebagai alat seleksi dalam memilih calon operator
komputer yang akan diterima diantara sekian banyak pelamar. Pemilihan calon yang akan
diterima harus berdasarkan prediksi bahwa mereka yang akan diterima akan berhasil dalam
pekerjaannya. Misalnya tes A mengukur kemampuan psikologis tertentu, misalnya
motivasi, jadi skor tes A merupakan predictor keberhasilan kerja. Kalau tes A memang
baik sebagai alat prediksi keberhasilan kerja, pastilah pelamar yang diterima bekerja,
karena skornya tinggi pada tes A, akan berhasil nantinya dalam pekerjaan mereka. Berhasil
18
dalam arti, memiliki ukuran-ukuran keberhasilan. Misal keberhasilan iu dapat diketahui
dari hasil rating yang dilakukan oleh asesor setelah mereka bekerja.
Untuk dapat menguji validitas prediktif tes A, diperlukan skor hasil rating dari asesor
setelah pelamar yang diterima bekerja. Prosedurnya adalah menghitung korelasi antara
skor yang diperoleh pelamar pada saat dites (skor motivasi) dengan tes A dengan skor
hasil rating assessor. Semakin tinggi korelasi antara kedua skor tersebut, maka semakin
baik validitas prediktif tes A tersebut.
Selanjutnya, sekadar untuk mengingatkan bahwa validitas prediktif diuji dengan cara
menghitung kecocokan antara skor-tampak tes (skor pelamar pada saat diseleksi) dan skor
kriterianya (skor hasil rating assessor setelah bekerja). Akan tetapi, dalam berbagai hal
sering terjadi apa yang disebut retriksi sebaran (retriction of range) baik pada distribusi
skor tes sebagai prediktor maupun pada distribusi skor kriteria.
Contoh lain misalnya, skor tes masuk perguruan tinggi yang mana sebagian besar calon
mahasiswa dikenai tes (SBMPTN) masuk yang pada dasarnya adalah prediktor terhadap
keberhasilan belajar mereka setelah menjadi mahasiswa. Mereka yang mencapai skor
tertentu dapat diterima dan diperbolehkan belajar di perguruan tinggi, sedangkan sisanya
ditolak. Karena tes masuk tersebut dirancang guna membedakan antara mereka yang
memiliki kemungkinan besar untuk berhasil dalam belajar di perguruan tinggi dan yang
tidak, maka selayaknya bila kriteria yang dipakai sebagai indikator keberhasilan itu adalah
indeks prestasi (IP) mereka setelah beberapa semester menjadi mahasiswa. Hanya saja,
karena tidak semua calon mahasiswa dapat diterima maka skor kriteria hanya dapat
diperoleh dari mereka yang diterima menjadi mahasiswa saja, jadi merupakan sampel yang
relatif homogen karena hanya diambil dari ujung distribusi skor tes masuk. Jadi, korelasi
antara skor prediktor dan skor kriteria hanya dapat dihitung berdasar data sampel yang
relative terbatas heterogenitasnya.
Bagaimana efek restrisik sebaran ini terhadap koefisien validitas? Bila skor prediktor
adalah X dan skor kriteria adalah Y, korelasi antara X dan Y adalah rXY yang merupakan
koefisien validitas prediktif tes X. Hubungan antara rXY dan kesalahan standar
estimasi (standard error of estimate) dilukiskan sebagai :
s YX = s y 1- r 2 xy
r 2 XY = 1 – s 2 y . x / s2y
Keterangan :
s Y X = kesalahan standar estimasi X terhadap Y, yaitu deviasi standard distribusi Y untuk
harga X tertentu
s y = Deviasi standar skor criteria Y (distribusi marginal)
r XY = Koefisien korelasi antara perdiktor X dan criteria Y.
Tampak pada tabel 1, besarnya korelasi antara skor masuk tes A (X) dengan skor ratting
assessor (Y) adalah r XY =0.81. ini menunjukkan bahwa tes A memiliki validitas prediktif
yang baik. Selanjutnya, dapat dihitung kesalahan standar estimasi skor X terhadap skor Y,
dengan terlebih dahulu menghitung standar deviasi skor kriteria s y = 1.73. Subsitusikan
nilai r XY dan s y pada persamaan
s YX = s y 1- r 2 xy
s YX = (1.73) 1- 0.81
s YX = 0.0145
Jadi kesalahan standar estimasi sebesar 0.0145. Angka ini menunjukkan bahwa kesalahan
standar estimasi masih tergolong dapat ditolerir.
2. Validitas Konkuren
Pada dasarnya, dalam menyusun dan mengembangkan instrumen psikologi, pengujian
validitas suatu instrument dala menjalankan fungsi ukurnya seringkali dapat dilakukan
dengan melihat sejauh mana kesesuaian antara hasil ukur instrumen tersebut dengan hasil
ukur instrumen lain yang sudah teruji kualitasnya atau dengan ukuran-ukuran yang
dianggap dapat menggambarkan aspek yang diukur tersebut secara reliabel. Dalam kasus
seperti ini, instrumen yang telah teruji validitasnya atau ukuran yang dianggap tepat
berlaku sebagai kriteria validasi.
Untuk keperluan pengujian validitasnya, instrumen yang mau diuji validitas konkurennya
harus diambil dari kelompok subjek yang sama dengan instrumen yang telah teruji
validitasnya. Korelasi antara skor subjek yang diperoleh dengan instrumen yang mau diuji
validitasnya dengan skor subjek yang diperoleh dengan instrumen yang sudah diuji
20
validitasnya, menunjukkan kekuatan validitas konkuren instrumen tersebut. Semakin tinggi
koefisien korelasinya (mendekati 1), maka semakin baik validitas konkurennya.
Untuk memperjelas konsep perhitungan validitas konkuren, misalnya kita ingin menguji
validitas konkuren instrument sikap terhadap mata pelajaran matematika yang disusun oleh
lembaga tertentu (kita sebut tes X). sebagai kriterinya, kita ambil instrumen sikap terhadap
matematika (The Attitudes Toward Mathematics Inventory-ATMI) yang dikembangkan
oleh McLeod (1992) yang telah teruji validiasnya (kita sebut tes Y). Kedua instrumen
tersebut diujikan pada sekelompok siswa (misalnya 10 orang siswa), dengan skor masing-
masing seperti pada tabel 2.
Tampak pada tabel 2, hasil perhitungan atas data fiktif untuk kedua tes X dan tes Y,
diperoleh korelasi antara tes X dengan tes Y sebagai kriteria, yaitu r XY =0.86. angka 0.86
merupakan koefisien validitas tes X. Azwar (2004) menyatakan bahwa ada perbedaan
antara validitas prediktif dengan validitas konkuren, yaitu :
Waktu pengambilan data : pada validitas prediktif data yang dijadikan sebagai
kriteria diperoleh setelah tenggang waktu tertentu sedangkan data validasi konkuren
diperoleh bersama dengan data prediktornya;
Fungsi dari kriterianya : pada validasi prediktif kriterinya merupakan variabel
perilaku yang hendak diprediksikan oleh tes sedangkan pada validasi konkuren kriterianya
merupakan ukuran kesesuaian fungsi ukur tes yang bersangkutan. Dengan kata lain,
kriteria pada validasi prediktif sudah diketahui terlebih dahulu sedangkan pada validasi
konkuren menentukan kriteria yang layak tidak selalu mudah dilakukan.
21
BAB II
KAJIAN PUSTAKA
A. Kajian Teori
1. Pengertian Reliabilitas
yang berasal dari kata reliable yang berarti dapat dipercaya. Raliabilitas
22
derajat keajegan/konsistensi hasil pengukuran suatu instrumen pada
Carmines & Zeller, 1979: 11; Cohen et al., 2007: 147; Faralina, Kadri, &
Yap, 2016:
48; Franzen, 2002: 7; Garson, 2013: 28; Mardapi, 2017: 46; Wantah,
2010: 132). Oleh karena itu, reliabilitas suatu instrumen harus diestimasi
Reliabilitas tidak bisa diketahui secara tepat atau pasti. Hal ini
bukanlah sesuatu yang pasti atau mutlak (Onwuegbuzie & Daniel, 2002:
satu
23
atau lebih instrumen dan satu atau lebih kelompok responden.
ini diambil (Kirk & Miller, 1986: 19). Dalam buku Introduction to
tes. Sebagai contoh, sebuah tes adalah reliable jika skor amatan
kapanpun dengan kondisi yang sama ataupun pada subjek yang berbeda
2. Macam-Macam Reliabilitas
consistency (Allen & Yen, 1979: 77-83; Azwar, 2018: 51-88; Cohen et al.,
menggunakan instumen yang sama dan pada subjek yang sama (atau
paralel, yaitu dua buah tes yang paralel (mengukur konstruk dan
25
Reliabilitas yang kedua yaitu kelompok internal consistency. Pada internal
3. Internal Consistency
Reliabilitas berdasarkan internal consistency diestimasi hanya
menggunakan satu kali tes, dan hal ini untuk menghindari masalah yang
& Yen, 1979: 78; Azwar, 2018: 59; Cohen et al., 2007: 147; Mardapi,
2017:
brunet, & Doval, 2017: 755). Sampel yang sangat besar dari peserta akan
mengukur satu laten trait (Allen & Yen, 1979: 83). Internal
2013: 947).
26
Internal consistency dapat dilakukan menggunakan 3 pendekatan,
27
menggunakan paralel klasik memiliki asumsi bahwa kedua belahan tes
adalah paralel (memiliki varians belahan yang sama dan rerata kedua
kedua belahan tes memiliki varians yang sama dan rerata kedua belahan
4. τ-Equivalent
sangat mungkin bahwa kedua belahan tersebut tidak homogen. Padahal pada
penelitian ini.
28
5. Faktor-Faktor yang Mempengaruhi Reliabilitas
berbeda walaupun diterapkan pada data yang sama. Hal ini dikarenakan
adalah perbedaan konsep atau dasar pikiran yang melandasi ide dasar
terbentuknya suatu formula, sifat distribusi skor item atau skor tes,
a. Panjang Tes
29
meningkat ketika panjangnya tes ditingkatkan menjadi k kali lipat
item. Hal ini terutama terlihat jelas pada data dikotomus, karena pada
30
e. Objektivitas penskoran
memberi skor.
yang berlaku agar tidak terjadi estimasi yang sembarangan. Ketika tanpa
hampir sama. Jika dalam hal ini, penerapan teknik estimasi reliabilitas
Pendekatan τ- equivalent
reliabilitas.
a. Flanagan
31
sebagai berikut ini (Mardapi, 2017: 61).
32
= (1)
Keterangan:
b. Guttman
= 2 1− (2)
Keterangan:
c. Rulon
varians yang sama (Mardapi, 2017: 61). Hal ini berarti, rumus Rulon
33
ataupun tidak. Rumus Rulon yang digunakan untuk estimasi koefisien
61).
=1− (3)
Keterangan:
d. Koefisien Alpha
dari skor pada tes multiple-item yang mengukur satu latent trait
reliabilitas dengan metode belah dua. Apabila kedua belahan tes tidak
3). Jika teknik Koefisien Alpha diterapkan pada tes yang isinya
35
digunakan untuk estimasi koefisien reliabilitas dengan metode belah
∑ (4)
=
Keterangan:
: Varians belahan ke - i
e. Kuder Richardson-20
dikembangkan oleh Kuder dan Richardson pada tahun 1937 (Allen &
Yen, 1979: 84). Nama lain dari rumus ini adalah Koefisien Alpha –
tidaklah cukup (Tan, 2009: 108). Hal ini sesuai dengan yang
36
reliabilitas adalah sebagai berikut ini (Allen & Yen, 1979: 84; Azwar,
∑ ( ) (5)
− 20 =
Keterangan:
reliabilitas adalah sebagai berikut ini (Allen & Yen, 1979: 84;
Azwar,
( )
− 21 = (6)
Keterangan:
item
reliable
38
suatu instrument, maka semakin sedikit kesalahan pengukuran yang terjadi.
sebagai berikut.
= = 1− (7)
Keterangan:
: koefisien reliabilitas
sama dengan true score dari examinee tersebut (Allen & Yen, 1979: 89).
Jadi, semakin kecil nilai SEM, maka semakin tepat pengukuran yang
lainnya dengan data yang sama, maka teknik estimasi reliabilitas tersebut
39
B. Penelitian yang Relevan
dalam tema yang sama dengan penelitian ini. Namun, tentunya terdapat
penelitian ini adalah sebagai berikut ini. Penelitian yang dilakukan oleh
yang dilakukan oleh Westrick dan penelitian ini memiliki persamaan dan
bantuan SPSS. Penelitian sekarang ini juga akan mencari tahu apakah terdapat
40
perbedaan koefisien reliabilitas dari berbagai teknik dengan memberikan
penggunaan yang sama. Grup pertama terdiri dari teknik estimasi reliabilitas
ada.
belahan. Dalam penelitian ini akan diadakan uji homogenitas varians antara
41
kedua belahan. Sumber data dalam penelitian Sarwiningsih didapatkan dari
Nasional Kimia SMA Tahun Ajaran 2014/2015. Sedangkan penelitian ini akan
menjadi skor z mengacu pada tabel z kurve normal. Hasil penelitian tersebut
42
nilai reliabilitas murni yang telah ditetapkan oleh peneliti, sedangkan dalam
estimasi teknik reliabilitas lainnya terhadap data yang sama dan perbandingan
dari segi SEM. Pada penelitian ini teknik estimasi reliabilitas yang
Jumlah estimasi reliabilitas yang dilakukan dalam penelitian ini akan lebih
C. Kerangka Pikir
dari 0 sampai
baik diantara yang lain dan apakah terdapat perbedaan koefisien estimasi
43
Estimasi koefisien reliabilitas memiliki banyak teknik yang dapat
administrasi tes sebanyak 1 kali. Karena pelaksanaan tes hanya 1 kali, maka
tidak ada kekhawatiran yang dapat terjadi akibat pengulangan tes yang dapat
tepat digunakan pada tes yang mengukur satu latent trait (unidimensi). Salah
untuk belah dua yaitu kedua belahan memiliki varians yang sama/homogen
biasanya terdapat toleransi kesalahan 0.05 (5%) yang dapat digunakan untuk
kedua belahan tidak sama dan rerata kedua belahan tidak sama ( ≠
≠ ).
44
belah dua, seperti Flanagan dan Guttman juga sering digunakan tanpa
tidak mensyaratkan agar kedua belahan homogen, tetapi bukan berarti tidak
dapat digunakan pada dua belahan tes yang homogen. Sehingga dalam
penelitian ini teknik estimasi reliabilitas dengan Rulon akan digunakan pada
Khusus untuk teknik estimasi reliabilitas dengan metode belah dua (spit-
homogen dengan taraf signifikansi 0.05. Selain itu, akan diestimasi juga
seseorang dalam suatu tes. SEM berlaku sama untuk semua individu dalam
teknik estimasi reliabilitas, untuk varians skor total akan selalu sama karena
45
Walaupun menggunakan data yang sama, beberapa teknik estimasi
(Azwar, 2018: 93). Hal ini dikarenakan, beberapa hal yang dapat
dasar pemikiran yang berbeda, sifat distribusi skor item dan skor tes, varians
membelah tes yang dikotomus menjadi sebanyak butir tes, yaitu KR-20. Hal
menjawab benar dengan proporsi menjawab salah sama dengan varians item
estimasi reliabilitas walaupun digunakan pada data yang sama. Jika koefisien
46
D. Pertanyaan Penelitian
21?
47