Pengukuran, Kesahan (Validity) Dan Kebolehpercayaan (Reliability) Instrumen

PENGUKURAN, KESAHAN (VALIDITY)
DAN KEBOLEHPERCAYAAN (RELIABILITY) INSTRUMEN
Dr. Ferlis Bin Bullare @ Hj. Bahari

Pensyarah Kanan/Ketua
Unit Penyelidikan Psikologi & Kesihatan Sosial
Universiti Malaysia Sabah
Tel (O)
H/P
e-mel
: 088 320 000 (8979)

: 016 520 2070
: ferlis27@yahoo.com; ferlis@ums.edu.my
A. PENGUKURAN
1. Edward L. Thorndike, seorang ahli psikologi, berkata bahawa: ...
jika sesuatu itu wujud, maka ia wujud dalam sesuatu amaun. Jika ia
wujud dalam suatu amaun, maka ia boleh diukur. Demikianlah
data atau khususnya pembolehubah.
2. Kerlinger (1973) mentakrifkan pembolehubah sebagai satu simbol
yang diberikan perangkaan atau nilai.
3. Pembolehubah yang dikumpul boleh dikod dan kemudiannya
dikomputerkan.
4. Kerlinger (1973) membahagikan pemboleh ubah kepada dua jenis:
(i)
(ii)
Pemboleh ubah bebas dan terikat

Pemboleh ubah berterusan dan kategorikal
2014 Dr. Ferlis bin Bullare @ Bahari
5. Pemboleh ubah bebas dinyatakan sebagai pemboleh ubah yang

menyebabkan berlakunya pemboleh ubah terikat; ia juga melibatkan
kesan atau pengaruhnya ke atas pemboleh ubah terikat.
6. Pemboleh ubah berterusan mengambil nilai perangkaan berjulat.
Misalnya umur memperlihatkan perbezaan seorang bayi berumur
dua bulan dengan seorang tua berumur 70 tahun.
7. Pemboleh ubah kategorikal mempunyai ukuran berbentuk nominal,
iaitu objek dimasukkan ke dalam satu kategori yang ditentukan.
Misalnya jantina (lelaki dikodkan dengan nombor 1 dan perempuan
dikodkan dengan nombor 2). Komputer tidak membezakan antara
peringkat-peringkat ukuran yang berlainan seperti contoh umur dan
jantina di atas. Komputer akan memproses sebarang jenis angka
yang diberikan kepadanya tanpa membezakan sama ada sesuatu
ukuran itu bersifat mutlak (umur) atau bersifat sembarangan
(jantina).
8. Mengukur pemboleh ubah bererti memberi angka kepada objek,
kejadian atau manusia mengikut aturan tertentu (Stevens, 1951).
Cohen & Nagel (1934) mendefinisikan ukuran sebagai mengkorelasi
entiti yang bukan angka dengan angka.
9. Lazimnya terdapat EMPAT (4) peringkat pengukuran/ skala

pengukuran:
(i)
Nominal atau kategori (Nominal)

Setiap nilai yang diberikan sebagai kategori tersendiri (label
dan tanda semata-mata).
Tidak boleh melakukan operasi aritmetik (menjumlah,
menolak, mendarab dan membahagi) terhadap data angka
tersebut kerana hasilnya tidak memberi apa-apa makna.
Contohnya jantina (1 = lelaki; 2 = perempuan);
Contohnya Etnik (1 = Melayu; 2 = Kadazan; 3 = Bajau; 4 =
Murut; 5 = Bisaya; 6 = Iban; 7 = Lain-lain)
Statistik perihalan (mod dan frekuensi) boleh digunakan
untuk memerihalkan pembolehubah yang diukur. Statistik
tak berparameter (ujian khi kuasa dua dan ujian binomial)
sesuai digunakan menganalisis data yang melibatkan skala
nominal.
(ii)
Ordinal atau darjah (Ordinal)
Untuk pembolehubah yang boleh diatur atau disusun mengikut

pangkat atau darjah.
Jarak antara dua paras ukuran masih belum diketahui. Kita tidak
ketahui berapa tingginya SES kelas atasan daripada SES kelas
menengah atas atau antara kelas menengah atas dengan menengah
bawah. Kita Cuma tahu SES kelas atasan lebih tinggi daripada kelas
menengah atas, yang lebih tinggi pula daripada kelas bawahan.

Tidak lebih daripada itu.
Dengan kata lain, susunan pangkat yang dibuat hanya memberikan
kategori manakah yang tinggi atau rendah dan BUKAN berapa
banyakkah ia lebih besar, lebih baik atau lebih tinggi dipilih
berbanding kategori lain.
Kita tidak boleh melakukan apa-apa operasi aritmetik.
Namun, statistik yang sesuai untuk menghuraikan kecenderungan
memusat untuk kategori-kategori dalam skala ordinal ialah
penengah dan mod.
Bagi menentukan perbezaan antara kategori-kategori dalam skala
ordinal, ujian-ujian statistik tak parametrik yang sesuai digunakan
seperti Ujian Kolmogorov-Smirnov, Ujian Larian Satu Sampel,
Ujian Tanda, Ujian Wilcoxon, Ujian Median, Ujian Mann-Whitney,
Ujian Wald-Wolfowitz, Ujian Friedman dan Ujian Kruskal-Wallis.
Untuk menentukan perkaitan antara pembolehubah, pekali korelasi
pangkat Spearman dan pekali korelasi pangkat Kendall sesuai
digunakan.
Contohnya, jawapan berbentuk skala Likert iaitu, 1 = sangat tidak
setuju;
2 = tidak setuju; 3 = tidak pasti; 4 = setuju; 5 = sangat setuju
Contoh lain ialah status ekonomi social (SES) seseorang iaitu, 1 =
kelas
atasan; 2 = kelas menengah atas; 3 = kelas menengah bawah; 4
= kelas bawahan
(iii) Sela atau selang (Interval)

Pengukuran yang menggunakan skel sela tidak mempunyai titik sifar
yang mutlak (nilai sifar sebenar), misalnya sukatan suhu Celsius dan
Fahrenheit.
Operasi aritmatik (campur dan tolak) boleh dilakukan ke atas
cerapan skala sela. Skala sela adalah skala pertama yang bersifat
kuantitatif.
Semua statistik parametrik umum (min, sisihan piawai dan pekali
korelasi Pearson) boleh digunakan.
Angka sela boleh dijumlah dan ditolak antara satu sama lain,
misalnya kita boleh mencampurkan suhu beberapa tempat di
Malaysia pada hari tertentu dan mengira puratanya. Namun kita
tidak boleh mengira nisbah dua suhu kerana kita tidak boleh
membahagi angkubah yang bersifat sela. Dengan kata lain, operasi
bahagi dan darab tidak boleh dilakukan bagi data sela (interval).
Contohnya 32F31F=1F. Jarak 1 darjah ini sama dengan 1 darjah
bagi perbezaan 85F84F atau 78F77F. Tapi salah sama sekali jika
kita mengatakan bahawa haba 100F bernilai dua kali ganda haba
yang ada pada 50F.
(iv) Nisbah (Ratio)

Pengukuran secara nisbah mempunyai sifat pengukuran sela,
dengan ditambah satu sifat lagi, iaitu titik sifar mutlak sudah dapat
ditakrifkan baginya (ataupun mempunyai nilai sifar sebenar).
Contohnya, markah pelajar bagi subjek Matematik dalam
peperiksaan antara 0 hingga 100. Angka 0 merupakan sifar yang
sebenar kerana pelajar yang mendapat markah 0 menunjukkan
mereka menjawab salah dalam semua soalan.
Apabila ada titik sifar yang mutlak, semua operasi aritmetik dapat
dilakukan. Misalnya timbangan berat, jarak jauh, umur, keluasan
tanah, jumlah pendapatan (RM).
Misalnya berat badan seorang kanak-kanak 30kg semestinya
melebihi berat badan seorang yang berat badan 15kg sebanyak dua
kali ganda (30/15=2).
Contoh lain ialah pendapatan sebanyak RM 4,000 sebulan adalah
RM1,000 lebih tinggi daripada pendapatan RM3,000 sebulan.
Pendapatan RM 5,000 sebulan ini adalah dua kali lebih tinggi
daripada RM2,000. Oleh yang demikian, semua operasi aritmetik
(campur, tolak, darab dan bahagi) boleh digunakan bagi data nisbah
(ratio).
B. KESAHAN (VALIDITY)
B1
Pendahuluan
1. Kesahan sesuatu alat pengukuran merujuk kepada sejauh mana alat

itu mengukur data yang sepatutnya ia dikehendaki mengukur.
2. Anastasi (1967) mendefinisikan kesahan sebagai satu ujian yang
menekankan tentang apa yang hendak diukur dan sejauhmana ia
boleh berbuat demikian.
3. Kerlinger (1973) menyatakan bahawa kesahan alat ujian mempunyai
ciri-ciri kestabilan (stabiliti), konsistensi, keramalan dan ketepatan.
4. Sekiranya data yang dikehendaki ialah ketinggian pelajar, alat ukur
yang digunakan mestilah dapat mengukur ketinggian pelajar dengan
tepat. Misalnya, timbang adalah alat sah mengukur berat dan tidak
sah digunakan untuk mengukur ketinggian. Ketinggian pelajar sah
diukur menggunakan pembaris.
5. Persoalan utama yang perlu diambilkira tentang pengukur yang
digunakan dalam sesuatu kajian ialah:
Apakah yang alat itu telah ukur?
Adakah alat itu benar-benar mengukur apa yang kita ingin
ukur?
Adakah dengan menggunakannya, alat itu membenarkan
pengutipan data yang relevan dengan apa yang menjadi
tumpuan kajian?
6. Kesahan sesuatu alat kajian dipengaruhi oleh jenis pemboleh ubah
iaitu pemboleh ubah fizikal atau kuantitatif (ketinggian pembaris;
berat timbang) dan kualitatif/gagasan/konsep (pencapaian, stres,
kecerdasan, sikap, motivasi).
7. Satu konsep yang digunakan dalam kajian sains sosial ialah satu yang
abstrak seperti kecerdasan. Ujian diberikan untuk melihat tahap
kecerdasan. Adakah ujian kecerdasan ini menguji kecerdasan
seseorang? Oleh itu pengukuran bagi sesuatu yang abstrak biasanya
menimbulkan keraguan.
8. Seperkara lagi iaitu tentang penerimaan satu ujian sebagai sah atau
tidak. Kesahan ujian bagi satu kumpulan di sesuatu tempat tidak
semestinya sah bagi ujian lain di tempat berasingan. Misalnya ujian
kecerdasan atau kesulitan ekonomi di Afrika tidak tentu sama
keberkesanan kesahannya di negara Malaysia kerana masing-masing
mempunyai kebudayaan dan gaya hidup yang berlainan.
9. Gronlund (1985) menyatakan bahawa perkara yang perlu diingat
semasa menggunakan kesahan ialah:
9.1
Kesahan
berhubung
rapat
dengan
keputusan
ujian
dan
hubungannya terhadap alat ukuran itu sendiri.

9.2
Kesahan sepatutnya tidak dilihat dari segi sah atau tidak sah tetapi
dari segi darjah kesahannya sama ada tinggi, sederhana atau rendah.
9.3
Kesahan perlu dirujuk kepada satu kegunaan yang khusus dan ujian
tidak akan menunjukkan kesahan untuk semua tujuan.
B2
Jenis Kesahan
B2.1 Kesahan Muka (Face Validity)

1. Bailey (1984) menyatakan bagi mengetahui sama ada instrumen atau
soal selidik mempunyai kesahan, penyelidik perlu tahu bagaimana
konsep hendak diukur itu didefinisikan dan sama ada maklumat
yang dikumpulkan itu berkaitan dengan konsep itu. Kesahan muka
adalah perkara yang perlu dipertimbangkan oleh pengkaji sendiri,
kumpulan penyelidik ataupun pakar.
2. Kesahan muka juga dapat dinilai berdasarkan penyelidikan pengkaji
tentang konsep yang hendak diukur dan pertimbangan berdasarkan
sama ada alat itu berjaya mendekati satu konsep itu dengan
sepenuhnya atau tidak. Jika ukuran itu mengukur satu konsep pada
keseluruhannya, maka pengkaji berjaya dengan mengemukakan
kesahan muka.
3. Misalnya seorang penyelidik ingin membentuk instrumen kajian.
Penyelidik itu akan memberikan instrumen kepada pakar dalam
bidang yang hendak dikaji bagi dinilai sekali imbas. Pengesahan
awal soal selidik itu memperlihatkan ciri-ciri pengukuran yang
hendak diukur adalah merupakan kesahan muka bagi instrumen
tersebut. Dengan kata lain, apabila dilihat kali pertama, instrumen
ini mengukur apa yang hendak diukur dan nampak sesuai.
4. Bagi mengetahui suatu alat pengukur itu mempunyai kesahan muka
atau tidak; definisi konsep yang hendak dikur serta maklumat yang
dikumpulkan itu bersesuaian ataupun tidak dengan konsep tersebut
perlu diketahui.
5. Contohnya, seorang pelajar ingin menjalankan kajian tentang
penyusuan susu ibu tetapi item-item atau soalan-soalan dalam soal
selidik yang digunakan berkaitan dengan stres, maka dapat
dikatakan item-item tersebut tidak mempunyai kesahan muka.
6. Namun, masalah yang wujud apabila tidak wujudnya kata sepakat

tentang sesuatu konsep. Misalnya percanggahan tentang sesuatu
ujian / soalan peperiksaan antara pensyarah dengan pelajar.
Pensyarah yakin bahawa ujian yang dijalankan mempunyai kesahan
muka yang tinggi, namun para pelajar mungkin ada pendapat
tersendiri.
7. Satu isu lagi yang wujud iaitu dimensi atau gagasan sesuatu konsep
itu berubah dari semasa ke semasa.
8. LATIHAN 1: Tentukan dan kenal pasti kesahan muka bagi
IKSOKU-F.
B2.2 Kesahan Kandungan (Content Validity)
1. Ia adalah kesahan kedua selepas kesahan muka. Ia lebih mendalam
di mana soal selidik akan dipastikan memang mengukur konsepkonsep yang hendak diukur. Contohnya pengukuran kepuasan
kerja meliputi pelbagai komponen seperti gaji, rakan sekerja,
pangkat, penghargaan, pengiktirafan dan sebagainya. Oleh itu,
semua komponen ini perlu diambilkira sewaktu memilih item.
2. Item-item ini akan diperiksa dari segi perkataan, ayat, dan istilah
yang digunakan.
3. Kesahan kandungan dapat dilakukan dengan menggunakan khidmat
panel / pakar bagi menimbangkan sejauhmana instrumen itu
memenuhi piawaian. Cadangan pakar dalam bidang yang diukur
perlu bagi tujuan pembaikan, pembetulan, penambahan ataupun
pengurangan ke atas skala dan item dalam soal selidik yang
digunakan.
4. Guion (dlm. Brown, 1983) mencadangkan lima syarat yang perlu

dipenuhi sebelum sesuatu ujian itu dikatakan mempunyai kesahan
kandungan:
Bidang kandungan mestilah dinyatakan dalam bentuk tingkah
laku secara umum diterima maknanya
Bidang mestilah dihuraikan dengan jelas
Bidang mestilah relevan dengan tujuan penggunaan ujian
Hakim-hakim/ panel/ pakar yang berkelayakan mestilah
bersetuju bahawa bidang telah disampel secara mencukupi
Gerak balas mestilah diperhati dan dinilai secara tekal
5. Latihan: Tentukan dan kenal pasti kesahan kandungan (content
validity) bagi IKSOKU-F.
B2.3 Kesahan Kriteria (Kesahan Serentak & Kesahan Peramal)
1. Kesahan ini diperolehi apabila sesuatu ujian yang dijalankan
membezakan ukuran melalui sesuatu kriteria yang ingin dilihat
dalam sesuatu soal selidik.
2. Tujuan kesahan kriteria ialah untuk menggunakan ujian sebagai
pentaksir terhadap satu tingkah laku atau sikap. Misalnya, apabila
seseorang itu telah melalui ujian memandu dan disahkan lulus, kita
akan mentaksirkan bahawa dia akan dapat memandu dengan baik
dan cermat.
3. Kesahan Serentak/ Selari (Concurrent Validity) : Ialah kriteria yang
ditunjukkan pada masa yang sama atau hampir sama dengan
pengukuran yang dikenakan ke atas kriteria tersebut. Ia digunakan
untuk mengukur sesuatu fenomena pada masa kini.
Contoh 1 : Alat kajian bagi mengukur kebolehan bermain muzik

dikatakan mempunyai kesahan kriteria serentak yang tinggi jika
seseorang pelajar yang mencapai kebolehan yang cemerlang
dalam ujian tersebut juga pada masa itu boleh menunjukkan
kebolehannya bermain muzik dengan baik.
Contoh 2 : Di dalam satu kilang, seorang pengkaji telah
mendapatkan ukuran bahawa mereka yang mengikuti latihan
jasmani pada tiap-tiap pagi adalah mereka yang menunjukkan
prestasi dan dapat mengeluarkan produktiviti yang lebih tinggi
berbanding pekerja lain. Masa yang sama, penyelia diminta
memberikan laporan samada benar bahawa pekerja yang
mengikuti latihan jasmani tersebut mencatat daya pengeluaran
yang tinggi. Jika ini betul, maka pihak kilang akan melakukan
ujian jasmani tersebut kerana ia ada kaitan dengan daya
pengeluaran pekerja.
4. Kesahan Peramal (Predictive Validity) : Merujuk kepada keupayaan
ukuran itu meramalkan peristiwa masa akan datang atau
sejauhmanakah sesuatu /soal selidik ujian (peramal) itu dapat
meramalkan sesuatu yang sebenar (kriteria). Bagi menentukan
kesahan ramalan, korelasi antara ujian ramalan dengan kejadian
sebenar akan dibuat. Jika korelasi yang diperoleh tinggi, ini
bermakna ujian itu mempunyai kesahan ramalan yang tinggi.
Contoh 1: Sejauhmana ujian percubaan SPM dapat meramal
kejayaan akademik seterusnya iaitu peperiksaan SPM sebenar.
Ujian SPM sebenar akan dibandingkan dengan ujian
percubaan SPM; yang mana penyelidik merasa yakin dapat
mengukur konstruk ini iaitu prestasi akademik di sekolah
menengah. Indeks statistik bagi kesahan ramalan ini ialah
ukuran korelasi di antara peramal (agregat dalam ujian
percubaan SPM) dengan kriteria (agregat dalam ujian SPM
sebenar).
Contoh 2: Kesahan STPM sebagai pengukur kejayaan

seseorang itu dalam universiti kelak.
Contoh 3 : Apabila seseorang itu lulus dan dapat sijil
memandu, dia akan dapat memandu kenderaan dengan baik.
Namun, keadaan ini tidak selalu benar.
Contoh 4 : Majikan mengadakan ujian seperti temuduga, ujian
bertulis dan lisan bagi calon-calon yang akan diterima bekerja
di dalam syarikat/organisasi.
LATIHAN 3: Tentukan dan kenal pasti kesahan peramal
IKSOKU-F.
B2.4
Kesahan Konstruk/ Gagasan, Kesahan

Konvergens dan Kesahan Discriminant
Pengenalan
1.
Gagasan (construct) merujuk kepada sekumpulan pemikiran yang

ada dalam fikiran tetapi tidak dapat dilihat objek tersebut secara
langsung / dengan mata kasar.
2.
Kesahan gagasan melibatkan hubungan di antara satu kerangka teori

yang menyeluruh supaya dapat menentukan sama ada alat ukuran
yang digunakan mempunyai hubungan dengan konsep dan andaian
yang digunakan.
3.
Kesahan gagasan digunakan bagi mengukur sifat-sifat yang tidak dapat

diukur oleh kriteria luaran, misalnya kepuasan. Kelebihan
menggunakan kesahan gagasan ialah ia mengukur kesahan sifat yang
tersembunyi bagi satu-satu ukuran. Ia membolehkan pengkaji
menentukan komponen satu-satu sifat yang ditunjukkan oleh sesuatu
alat (Siti Saleha Samsuddin, 2002).
4.
LATIHAN 4: Uji kesahan konstruk bagi SDKSOKU-F dan

SSKSOKU-F menggunakan analisis faktor.
Kesahan Convergens
1. Cara mendapatkan kesahan ini ialah dengan mendapatkan
keputusan korelasi di antara soal selidik yang baru dibentuk dengan
soal selidik yang lain yang telah ada yang mengukur konsep yang
sama. Sekiranya keputusan menunjukkan hasil korelasi yang tinggi,
maka kesahan konvergen dikatakan telah diperolehi. Ini adalah
kerana kedua-dua soal selidik tadi mengukur konsep yang sama.
2. Sebaliknya sekiranya keputusan korelasi rendah atau tidak
signifikan, ini bermakna soal selidik yang baru dibentuk itu
mungkin tidak sesuai dengan teori kerana tidak mempunyai
hubungan dengan konsep yang sama dalam soal selidik yang telah
ada (piawai).
3. LATIHAN 5: Uji kesahan konvergen kedua-dua skala dengan
PWB dan SWLS dengan menggunakan korelasi Pearson.
Kesahan Discriminant
1. Cara memperolehi kesahan ini ialah dengan mendapatkan
keputusan korelasi di antara soal selidik yang baru dibentuk itu
dengan soal selidik yang lain yang telah ada yang tidak mengukur
konsep yang sama. Sekiranya tidak ada korelasi yang signifikan yang
dicatatkan, ini bermakna berdasarkan teori konsep dalam soal
selidik baru mempunyai kesahan diskriminan.
2. Sekiranya ada korelasi yang signifikan, ini bermakna konsep dalam
soal selidik yang baru tadi tidak mengukur apa yang hendak diukur
kerana ia berkorelasi dengan konsep yang tidak sepatutnya dalam
soal selidik yang ada.
3. LATIHAN 6: Uji kesahan diskriminan kedua-dua instrumen
dengan skala tertentu dengan menggunakan korelasi Pearson.
Jadual 1: Perbezaan antara Kesahan Konvergen dan Kesahan
Diskriminan
Kesahan Konvergen (KK)
Kesahan Diskriminan/Divergent
(KD)
construct-validated 1. samb but low correlations
A
instrument should have high with measure
correlations with other measures constructs
or methods of measuring the
same construct samb
1.
of
different
2. KK baik apabila nilai korelasi 2. KD baik apabila nilai korelasi

tinggi
rendah
C. KEBOLEHPERCAYAAN (RELIABILITY)
C1
Pengenalan
1. Kebolehpercayaan ialah suatu konsep yang ditujukan kepada

pengukuran atau instrumen yang digunakan oleh pengkaji terhadap
sesuatu konstruk teorinya.
2. Menurut Carmines dan Zeller (1979), kebolehpercayaan ialah
sejauhmana satu uji kaji, ujian atau prosedur kajian apabila
diulangkan akan memberikan keputusan yang sama.
3. Ia juga merujuk kepada ketekalan dalam pengukuran berkenaan
sesuatu set data yang diperoleh.
4. Kerlinger (1973) menyatakan bahawa ujian yang amat tinggi
kebolehpercayaannya mempunyai ciri-ciri stabiliti, konsistensi,
keramalan dan ketepatan.
Contoh 1 : Apabila rakan rapat anda mempunyai sikap dan tabii
yang konsisten, tepat dan dapat diramalkan, anda akan
menganggap rakan anda itu boleh dipercayai.
Contoh 2 : Jam sebagai ukuran masa. Jika sebuah jam itu
sentiasa memberikan waktu yang tepat, tekal dan stabil, kita yakin
akan tahap kebolehpercayaan jam tersebut sebagai pengukur
masa.
5. Satu pengukur yang mempunyai tahap kebolehpercayaan yang tinggi
akan mempunyai ralat yang kecil (tiada langsung). Lebih kecil ralat,
maka lebih tinggi tahap kebolehpercayaan sesuatu pengukur atau
alat ujian/kajian.
Misalnya dalam ujian A (jam tangan A), kita akan dapati bahawa
ralatnya ialah 10% sahaja, sementara dalam ujian B (jam tangan
B), kita akan dapati ralatnya ialah 40%. Ini bermakna bahawa
sekali dalam 10 kali, jam tangan A tidak akan menunjukkan
waktu yang tepat, manakala bagi jam tangan B, 4 kali dalam 10
kali jam tangan itu akan memberikan waktu yang salah. Kita
akan lebih mengharapkan jam A daripada jam tangan B.
6. Mohd Majid Konting (1990) menyatakan bahawa kebolehpercayaan

sesuatu alat ujian boleh dipertingkat dengan beberapa cara iaitu:
Pernyataan item yang tepat dan jelas

Item-item yang digunakan hendaklah homogenous
Arahan-arahan ujian mestilah jelas, ringkas dan padat
Mengelakkan gangguan semasa subjek menjawab ujian
Pengumpulan data dilakukan dalam keadaan yang piawai, serupa
dan terkawal.
7. Misalnya dalam sesuatu kajian, pengkaji membentuk empat item

bagi mengukur kepuasan perkahwinan di kalangan responden ibu
etnik Rungus, Sabah. Item-item tersebut dibahagikan kepada dua
item positif dan dua item negatif seperti berikut:
V1 Saya berpuas hati dengan perkahwinan saya (+)
V2 Saya tidak berpuas hati dengan suami saya (-)
V3 Saya berpuas hati dgn kasih sayang yang suami saya
berikan (+)
V4 Saya tidak berpuas hati dgn layanan yang suami saya
berikan (-)
8. Jawapan bagi item positif dan negatif yang boleh dipilih oleh
responden berdasarkan Jadual 9.1 berikut:
Jadual 9.1 Skor Bagi Item Positif dan Negatif

Item Positif (+)
5 = Sangat Setuju
4 = Setuju
3 = Tidak Pasti
2 = Tidak Setuju
1 = Sangat Tidak Setuju
Item Negatif (-)

5 = Sangat Tidak Setuju
4 = Tidak Setuju
3 = Tidak Pasti
2 = Setuju
1 = Sangat Setuju
Nota: Recode boleh dibuat pada program SPSS

9. Kebolehpercayaan sesuatu alat ujian boleh diukur melalui tiga cara
iaitu:
C2
Jenis Kebolehpercayaan
C2.1
Ketekalan/Kebolehpercayaan Luaran
1. Kaedah Uji-Uji Kembali (Test-Retest)

Sesuatu ujian/soal selidik diberikan kepada responden yang
sama pada dua masa berlainan. Contohnya, ujian/soal selidik
diberikan pada hari ini, dan kemudian ujian/soal selidik yang
sama diberikan semula seminggu kemudian kepada
responden yang sama. Ujian korelasi dilakukan dan semakin
tinggi korelasi antara dua ujian/soal selidik ini, maka semakin
boleh dipercayai ujian/soal selidik tersebut.
Dalam kebolehpercayaan Uji-Uji Kembali, ujian yang sama
diberikan semula kepada subjek yang sama selepas satu
jangkamasa tertentu. Jangkamasa yang diberikan boleh jadi
daripada beberapa minit kepada beberapa tahun (Brown,

1976).
Bila reliabiliti ujian semula ini dilaporkan di dalam test
manual, jarak masa yang digunakan mestilah dinyatakan.
Korelasi ujian kembali akan menjadi rendah jika jarak masa
terlalu lama. Perkara ini terjadi disebabkan oleh beberapa
angkubah lain seperti umur, kematangan dan pembelajaran
yang mungking mempengaruhi subjek (Anastasi, 1968).
Di samping itu pekali kebolehpercayaan juga akan menjadi
tinggi jika jangka masa yang digunakan terlalu singkat kerana
individu itu masih dapat mengingati kembali jawapan pada
item-item yang tertentu (Mehrens & Lehmann, 1978).
Namun begitu, kelesuan dan jemu pada satu ujian itu juga
mungkin mempengaruhi prestasi subjek untuk menjawab ujian
yang diberikan dan akibatnya reliabiliti akan menjadi rendah.
Mohd Majid Konting (1990) menyatakan kaedah test-retest
merupakan kaedah bagi mendapatkan dua set markat dengan
mentadbir alat ukur yang sama ke atas subjek yang sama
sebanyak dua kali.
Skor-skor yang diperoleh pada
pengukuran pertama dan pengukuran kedua dikorelasikan.
Pengkaji mengandaikan responden dapat mencapai keputusan

yang sama dalam ujian pertama dan kedua. Sekiranya keduadua skor dalam ujian pertama dan kedua itu mempunyai
korelasi yang tinggi, menunjukkan alat pengukuran (alat
ujian/soal selidik) itu mempunyai kebolehpercayaan yang
tinggi.
Contoh 1 : Mesin pemberat untuk mengukur berat badan A.
Dua hari kemudian kita ukur semula berat A. Kita berharap
mendapatkan ukuran yang sama jika pengukur (mesin
pemberat) adalah dalam keadaan yang sama. Masalah yang
timbul ialah jika kita ulangi pengukuran ini 4 bulan kemudian,
mungkin A telah mengurangkan berat badannya dengan
berdiet, maka berat badannya akan lebih ringan berbanding

permulaannya. Ini tidak bermakna mesin mengukur berat
badan yang salah, tetapi yang telah berubah ialah berat badan
A.
Contoh 2 : Soalan bertanyakan tarikh lahir responden B dan
jawapannya ialah 30 November 1947, maka pada ujian yang
kedua kita menanyakan soalan sama, sudah tentu kita akan
mendapat jawapan yang sama. Masalahnya ialah, jika
ditanya pada waktu lain, responden lupa bila tarikh lahirnya,
maka soalan yang kita reka sebagai pengukur bukanlah salah.
Yang silap ialah jawapan responden.
TUGASAN 7: Uji kebolehpercayaan uji-uji kembali
IKSOKU-F dengan menggunakan korelasi Pearson.
2. Ujian Bentuk Selari/Setara (Parallel-Forms Coefficient)

Dalam ujian ini, pengkaji mempunyai dua ujian (2 bahagian
soal selidik), tetapi kedua-duanya mengukur perkara yang
sama. Ia ditadbir ke atas kumpulan orang/ responden yang
sama bagi mendapat hubung kait antara dua ujian.
Mohd Majid Konting (1990) menyatakan bahawa kaedah ini
menggunakan satu alat ukur yang dibina dan satu alat ukur
yang piawai. Kedua-dua alat ukur tersebut adalah setara dari
segi kandungannya tetapi mungkin berbeza dari segi
penyampaian. Kedua-dua alat ukur ditadbir pada subjek yang
sama dan skor yang diperoleh daripada kedua-dua alat ukuran
itu dikorelasikan.
Perkara yang sama seperti dilakukan dalam prosedur testretest. Cuma perkataan dan susunan item dalam alat
ujian/soal selidik ditukar supaya nampak berbeza namun
isinya tetap sama.
Sekiranya korelasi yang dicatat tinggi, maka alat ujian/soal
selidik itu boleh dipercayai.
Masalah yang dihadapi ialah untuk menentukan supaya keduadua ujian tersebut mengukur fenomena yang sama.
C2.2
Ketekalan Dalaman (Internal Consistency)

1. Menurut Brown (1984), analisis kebolehpercayaan
ketekalan dalaman merujuk kepada sejauh mana itemitem dalam sesuatu ujian saling berhubung kait. Ini
bermakna semakin tinggi korelasi antara item, semakin
tinggi kebolehpercayaan item itu.
2. Ketekalan dalaman berhubung kait dengan korelasi
purata antara item. Sesuatu ujian dikatakan seragam
sekiranya skor bagi keseluruhan item dalam ujian
tesebut adalah berkorelasi positif.
3. Bagi memaksimumkan korelasi antara item ini,
kepayahan item sepatutnya adalah sama. Jika dua item
mengukur tingkah laku yang sama tetapi berbeza dalam
kepayahan
masing-masing,
kedua-dua
item
ini
dikatakan mempunyai korelasi antara item yang sangat

rendah.
4. Secara
umumnya,
boleh
dikatakan
bahawa
kebolehpercayaan sesuatu ujian itu sangat berhubung

kait dengan darjah kepayahan iaitu pelbagai item dalam
sesuatu ujian adalah berkorelasi di antara satu sama
lain.
5. Kebolehpercayaan sesuatu ujian dijelaskan sebagai satu
nombor perpuluhan positif yang melingkungi sifar
(0.00) hingga satu (1.00). Nilai 1.00 menunjukkan
kebolehpercayaan yang sempurna. Manakla 0.00
menunjukkan
ketiadaan
nilai
kebolehpercayaan
(Aiken, 1988).
6. Anastasi
(1982)
menyatakan
bahawa
pekali
kebolehpercayaan yang memuaskan dan tinggi adalah

di antara 0.70 dan 0.90. Kaplan dan Succuzoo (2001)
pula mencadangkan nilai kebolehpercayaan dalam
lingkungan 0.70 hingga 0.80 adalah cukup baik untuk
kebanyakan penyelidikan.
7. Kerlingger (1973) berpendapat nilai kebolehpercayaan
yang tinggi ialah 0.80.
8. Terdapat pelbagai kaedah yang boleh digunakan untuk
mengukur ketekalan dalaman seperti kaedah pekali alfa
Cronbach, Split Half, dan analisis varians ukuran

berulang Hoyt.
1. Alfa Cronbach
1.
Pekali Alfa Cronbach (Cronbach, 1951) merupakan salah satu

teknik yang digunakan untuk menganggarkan kebolehpercayaan
ketekalan dalaman.
2.
Ianya digunakan dalam situasi di mana format jawapan adalah lebih

daripada alternatif misalnya pilihan jawapan betul atau salah.
3.
Alfa yang disarankan oleh Cronbach dan rakan-rakan (1955) boleh

digunakan untuk melihat kebolehpercayaan ketekalan dalaman dan
keseragaman item bagi sesuatu ujian.
4.
Anastasi (1982) menyatakan bahawa pekali Cronbach merupakan

satu kaedah kebohpercayaan ketekalan dalaman sesuatu alat ukuran
yang menggunakan jawapan tidak dikotomi. Kaedah ini sesuai
digunakan bagi alat ukuran yang mempunyai skala jawapan lebih
daripada dua seperti skala likert. Formula pekali alfa Cronbach
adalah seperti berikut:
Cr
Di mana,
Cr
= pekali alfa
= jumlah item dalam ujian
N
Sa Si
N 1
Sa
Sa
= varians alat ukuran
Si
= varians item
TUGASAN 8: Uji kebolehpercayaan ketekalan dalaman Cronbach

alfa IKSOKU-F.
2. Berbahagi-Dua (Split-Half)
1. Menurut Anastasi (1982) kaedah split-half merupakan kaedah yang
digunakan untuk melihat kebolehpercayaan dengan membahagikan
item-item kepada dua bahagian dan mengkorelasikan item-item di
antara kedua-dua bahagian masing-masing dengan menggunakan
kaedah indeks ketekalan dalaman.
2. Kaedah bahagi dua dilakukan dengan menggunakan statistik pekali
korelasi Pearson dan diperbaiki dengan menggunakan formula
Spearman Brown (Anastasi, 1982).
3. Pembahagian juga boleh dibahagikan dengan dua cara. Pertama
ialah apabila ujian adalah panjang maka ujian tersebut dibahagikan
kepada
dua
bahagian.
Cara
pertama
ini
mungkin
akan
menimbulkan masalah akibat kesukaran membezakan item antara

dua bahagian.
4. Bagi mengatasi masalah ini, cara kedua perlu diaplikasikan iaitu
dengan membahagikan ujian kepada dua berdasarkan nombor ganjil
dan nombor genap soal selidik (Kaplan & Saccuzzo, 1993; Murphy
& Davidshofer, 1991). Formula split half adalah sperti berikut:
2R
1 r
Di mana,
R = kebolehpercayaan keseluruhan item dalam ujian
r = korelasi antara item bernombor ganjil dan genap
5. Jika diteliti split half ini hanya merupakan sebahagian daripada

keseluruhan ujian. Jadi, keseluruhan kebolehpercayaan sesuatu alat
ujian itu perlu diubahsuai dengan formula Spearman-Brown (1910)
seperti di bawah:
nrll'
rll
1 n 1 rll'
Di mana,
rII
= estimate coefficient
nrII
= korelasi yang telah diperolehi daripada dua split-half
= berapa kali item-item itu telah dibahagikan daripada jumlah item-item

secara keseluruhannya.
6. Korelasi antara dua bahagian itu dinamakan correlation between

forms.
Pekali yang dinamakan equal length Spearman-Brown
memberi anggaran kebolehpercayaan skel lapan item
seandainya skel tersebut terbina daripada dua bahagian sama
panjang.
Satu cara lagi untuk mengukur kebolehpercayaan ialah dengan
mengira pekali Guttman split-half yang kebetulannya boleh
dilakukan serentak dalam satu prosedur.
7. TUGASAN 9: Uji kebolehpercayaan ketekalan dalaman SplitHalf IKSOKU-F.

Kuder-Richardson (KR)
1. Kaedah ini berasaskan sisihan piawai alat ukur dan sisihan piawai
item-item yang berlainan.
2. Pekali kebolehpercayaan melalui kaedah ini juga dikenali sebagai
alfa Cronbach.
3. Menurut Sidek Mohd Noah (1990) dan Tuckman (1978), apabila
item-item ujian yang dibina mempunyai skor sama ada A atau B,
Salah atau Betul, Ya atau Tidak pada suatu ujian, kaedah ini sesuai
digunakan.
Menggunakan kaedah ini, skor yang diperolehi dari setiap item
akan dikorelasikan dengan skor keseluruhan item.
C2.3
Kebolehpercayaan interrater/interscorer
1. Sesuatu kajian kadangkala perlukan rater atau pakar bagi membuat

penilaian ke atas sesuatu fenomena. Oleh kerana data yang
diperoleh mungkin melibatkan pemerhatian, pengkategorian
ataupun temubual, maka pengkaji perlu memastikan sejauh mana
tekalnya jawapan atau maklum balas yang mereka berikan.
2. Sebagai contoh, adakah ketekalan dalam ujian memastikan sama
ada 10 jenis air yang diminum itu panas, suam ataupun biasa.
Mungkin 5 orang akan diminta menilai. Sejauhmana tekal dan
sama jawpan yang diberikan merupakan kebolehpercayaan
interrater.
D. ANALISIS ITEM
D1. Pengenalan
1. Analisis item ialah satu kaedah yang digunakan bagi menilai kualiti
item-item
alat
ujian
dengan
menggunakan
beberapa
cara
berdasarkan sifat yang ingin dikaji.

2. Analisis item bertujuan untuk memperbaiki sesuatu ujian dengan
menyemak dan menggugurkan item-item yang tidak berkenaan
(Aiken 1988).
3. Alat pengukuran yang baik adalah alat pengukuran berkualiti yang
didakwa sesuai bagi mengukur perkara yang ingin diuji. Bagi
menghasilkan item yang baik dalam alat ujian, ahli psikometrik
biasanya akan menjalankan proses pemilihan item bagi memastikan
item-item yang berjaya menjadi ujian yang terakhir adalah item-item
yang dianggap berkualiti untuk mengukur sesuatu trait yang hendak
diukur.
4. Menurut Aiken (1988), analisis item yang baik dapat memberi
maklumat mengapa sesuatu alat ukuran itu tidak boleh dipercayai
atau gagal menunjukkan tahap kesahan yang dijangkakan.
5. Analisis item juga dapat menunjukkan mengapa ukuran itu boleh
dipercayai dan dapat digunakan sebagai peramal kepada sesuatu
kriteria tetapi tidak kepada kriteria pengukuran (Murphy &
Davidshofer, 1988).
6. Hasil dari analisis item dapat memberi satu petunjuk apakah ukuran
itu dapat difahami oleh sampel kajian (Iran Herman, 1988).
7. Murphy dan Davidshofer (1988) menyatakan bahawa sesuatu
kriteria dapat diramal dan dijangka oleh analisis item tetapi
sesetengah pula tidak dapat diramal.
8. Allen dan Yen (1982) menyatakan bahawa sesuatu alat yang baik
dan sesuai harus mengalami satu proses analisis item bagi
memastikan hanya item-item yang baik sahaja yang dapat dijadikan
edisi ujian.
Ini adalah penting untuk membuat kesimpulan
keputusan dalam menentukan sama ada ukuran itu sah atau tidak
sah.
9. Anastasi
(1982)
menyatakan
bahawa
analisis
item
dapat
memendekkan ujian dan pada masa yang sama meningkatkan

kebolehpercayaan dan kesahan alat ujian tersebut.
10.
Wolman (1973) berpendapat bahawa analisis item adalah
sesuatu
penentu
kepayahan,
kemampuan
mendiskriminasi,
ketekalan dalaman dan kebolehpercayaan item-item di dalam ujian.

Ia juga merupakan penentu kesahan item.
D2. Indeks Kepayahan Item

1. Kepayahan item didefinisikan sebagai kebolehan individu menjawab
betul sesuatu item (Anastasi, 1982). Sesuatu item yang senang akan
menghasilkan peratus jawapan yang tinggi. Item yang terlalu susah
pula akan menunjukkan nilai peratus jawapan betul yang rendah.
2. Kedua-dua keadaan tersebut sama ada item yang terlalu senang dan
terlalu susah adalah bentuk item yang kurang baik untuk dijadikan
ujian terhadap sesuatu tret.
3. Sesuatu item ujian yang baik dan ideal diperolehi sekiranya jawapan
dapat menunjukkan 50% jawapan betul dan 50% jawapan salah.
D3. Indeks Kebolehpercayaan Item
1. Indeks Kebolehpercayaan item melihat fungsi keperbezaan dan

serakan markat item dan juga korelasi di antara markat item dengan
keseluruhan ujian. Secara formula indeks ini ialah hasil darab di
antara item dengan markat keseluruhan.
Jumlah keseluruhan
markat dianggap sebagai kriteria dalam sesuatu item. Formulanya

adalah berikut:
I kl SPi rit
Di mana,
Iki
= indeks kebolehpercayaan item
spi = sisihan piawai item.

rit
= korelasi item dengan keseluruhan item.
D4. Indeks Kesahan Item
1. Indeks kesahan item diperolehi dengan mengkorelasikan markat

item dengan markat pembolehubah kriterium (ric). Indeks kesahan
item adalah hasil darab sisihan piawai item sebagai petunjuk
keperbezaan dan serakan dengan korelasi item dengan kriterium.
Formulanya adalah seperti berikut:
ISi SP ric
Di mana
Isi = Indeks Kesahan item
Spi = Sisihan piawai item
ric
= Korelasi item dengan kriterium.

Pengukuran, Kesahan (Validity) Dan Kebolehpercayaan (Reliability) Instrumen

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Pengukuran, Kesahan (Validity) Dan Kebolehpercayaan (Reliability) Instrumen

Diunggah oleh

Hak Cipta:

Format Tersedia

PENGUKURAN, KESAHAN (VALIDITY)

DAN KEBOLEHPERCAYAAN (RELIABILITY) INSTRUMEN

Dr. Ferlis Bin Bullare @ Hj. Bahari

: 088 320 000 (8979)

Pemboleh ubah bebas dan terikat

2014 Dr. Ferlis bin Bullare @ Bahari

5. Pemboleh ubah bebas dinyatakan sebagai pemboleh ubah yang

2014 Dr. Ferlis bin Bullare @ Bahari

9. Lazimnya terdapat EMPAT (4) peringkat pengukuran/ skala

Nominal atau kategori (Nominal)

Ordinal atau darjah (Ordinal)

Untuk pembolehubah yang boleh diatur atau disusun mengikut

2014 Dr. Ferlis bin Bullare @ Bahari

menengah atas, yang lebih tinggi pula daripada kelas bawahan.

2014 Dr. Ferlis bin Bullare @ Bahari

(iii) Sela atau selang (Interval)

2014 Dr. Ferlis bin Bullare @ Bahari

(iv) Nisbah (Ratio)

2014 Dr. Ferlis bin Bullare @ Bahari

1. Kesahan sesuatu alat pengukuran merujuk kepada sejauh mana alat

2014 Dr. Ferlis bin Bullare @ Bahari

hubungannya terhadap alat ukuran itu sendiri.

2014 Dr. Ferlis bin Bullare @ Bahari

B2.1 Kesahan Muka (Face Validity)

6. Namun, masalah yang wujud apabila tidak wujudnya kata sepakat

2014 Dr. Ferlis bin Bullare @ Bahari

4. Guion (dlm. Brown, 1983) mencadangkan lima syarat yang perlu

2014 Dr. Ferlis bin Bullare @ Bahari

Contoh 1 : Alat kajian bagi mengukur kebolehan bermain muzik

2014 Dr. Ferlis bin Bullare @ Bahari

Contoh 2: Kesahan STPM sebagai pengukur kejayaan

Kesahan Konstruk/ Gagasan, Kesahan

Gagasan (construct) merujuk kepada sekumpulan pemikiran yang

Kesahan gagasan melibatkan hubungan di antara satu kerangka teori

Kesahan gagasan digunakan bagi mengukur sifat-sifat yang tidak dapat

2014 Dr. Ferlis bin Bullare @ Bahari

LATIHAN 4: Uji kesahan konstruk bagi SDKSOKU-F dan

2014 Dr. Ferlis bin Bullare @ Bahari

2. KK baik apabila nilai korelasi 2. KD baik apabila nilai korelasi

2014 Dr. Ferlis bin Bullare @ Bahari

1. Kebolehpercayaan ialah suatu konsep yang ditujukan kepada

6. Mohd Majid Konting (1990) menyatakan bahawa kebolehpercayaan

Pernyataan item yang tepat dan jelas

7. Misalnya dalam sesuatu kajian, pengkaji membentuk empat item

2014 Dr. Ferlis bin Bullare @ Bahari

Jadual 9.1 Skor Bagi Item Positif dan Negatif

Item Negatif (-)

Nota: Recode boleh dibuat pada program SPSS

1. Kaedah Uji-Uji Kembali (Test-Retest)

2014 Dr. Ferlis bin Bullare @ Bahari

daripada beberapa minit kepada beberapa tahun (Brown,

Pengkaji mengandaikan responden dapat mencapai keputusan

berdiet, maka berat badannya akan lebih ringan berbanding

2. Ujian Bentuk Selari/Setara (Parallel-Forms Coefficient)

2014 Dr. Ferlis bin Bullare @ Bahari

Ketekalan Dalaman (Internal Consistency)

2014 Dr. Ferlis bin Bullare @ Bahari

dikatakan mempunyai korelasi antara item yang sangat

kebolehpercayaan sesuatu ujian itu sangat berhubung

kebolehpercayaan yang memuaskan dan tinggi adalah

2014 Dr. Ferlis bin Bullare @ Bahari

Cronbach, Split Half, dan analisis varians ukuran

Pekali Alfa Cronbach (Cronbach, 1951) merupakan salah satu

Ianya digunakan dalam situasi di mana format jawapan adalah lebih