Gagasan merupakan sekumpulan konsep yang ada pada fikiran tetapi kita tidak dapat dilihat objeknya secara langsung seperti pencapaian, kecerdasan dan kreativiti. Setiap gagasan pendidikan mengandungi konsep-konsep yang rumit yang terdiri daripada banyak faktor yang saling berkait dan sukar dicerakinkan. Setiap gagasan mungkin diperlihatkan dalam suatu situasi tetapi tidak pada situasi lain. Sebab itu, tidak ada satu ujian yang boleh mengukur sesuatu gagasan dengan tepat
Sesuatu ujian yang mempunyai kebolehpercayaan yang tinggi tidak semestinya sah. Bagaimanapun, sesuatu ujian yang sah biasanya boleh dipercayai.
Jika faktor-faktor lain serupa, sesuatu ujian yang mempunyai pekali kebolehpercayaan yang tinggi perlu dipilih kerana ujian tersebut mempunyai ketekalan pemeringkatan individu dalam kumpulannya.
Satu lagi ciri yang penting sesuatu ujian ialah kebolehpercayaan ujian. Kebolehpercayaan ujian merujuk kepada ketepatan dan kejituan ujian itu dalam membuat ukuran. Persoalan di sini ialah Adakah ujian yang sama jika diberikan semula kepada pelajar yang sama akan menghasilkan keputusan yang sama? Kebolehpercayaan sesuatu ujian dipengaruhi oleh beberapa faktor seperti:
Pada umumnya, sekiranya faktor-faktor yang lain tidak berubah, ujian yang lebih panjang mempunyai tahap kebolehpercayaan yang lebih tinggi. Ini bermakna ujian yang mempunyai lebih banyak soalan adalah lebih boleh dipercayai
Sekiranya masa ujian tetap, ujian yang mengandungi sebilangan besar soalan pendek akan mempunyai tahap kebolehpercayaan yang lebih tinggi.
Pada umumnya, ujian yang mengandungi soalan yang kesukarannya sederhana akan mempunyai tahap kebolehpercayaan yang lebih tinggi.
Soalan yang tidak jelas tugasannya akan mengurangkan tahap kebolehpercayaan ujian.
Terdapat
dua prosedur yang sering digunakan dalam menganggarkan kebolehpercayaan skor ujian.
a) b)
Kaedah uji dan uji sekali lagi (Test Retest Method) Kaedah ujian bentuk setara (Parallel Form Method) atau kaedah bentuk selang-seli (Alternate Form Method)
Skornya dikorelasikan, maka kita akan dapat pekali kestabilan dan penyetaraaan Ujian bentuk setara ini dibina secara berasingan dan mestilah memenuhi spesifikasi berikut:
Sama Aras Kesukaran Sama Bilangan Sama Bentuk
Sama Kandungan
Sama Julat
Sama Arahan
Sama Format
Soalan Berbeza
Kaedah belah dua (Split half method) (a) Kaedah Belah Dua. Pembina memberikan satu bentuk ujian kepada satu kumpulan calon. Untuk menskorkan ujian, pembina membahagikan item kepada dua sub-ujian. Setiap ujian mengandungi daripada bilangan item yang asal. Tujuan membahagikan kepada dua sub-ujian ialah untuk mendapatkan dua ujian yang selari mungkin. rtt = 2 r 1 + r
Kedua-dua
bentuk ujian ini kemudiannya diskorkan secara berasingan dan pekali korelasi antara kedua ujian ini dihitung. konsepnya, pekali korelasi bagi kedua-dua ujian ini ialah pekali persamaan (kesetaraan) bagi keduadua ujian berkenaan.
Secara
Cronbach (1951) telah menggunakan pekali alfa sebagai ukuran Ketekalan Dalaman. Kaedah ini adalah lanjutan kepada K-R 20, bagi item-item yg bukan berjawapan dikotomi. Rumus bagi pekali alfa adalah sama seperti rumus bagi K-R 20 kecuali pq diganti dengan S i2) iaitu varians bagi skor item. Pekali alfa adalah amat berguna bagi item yang bukan berjawapan dikotomi terutama item yang berbentuk esei yang markahnya boleh merangkumi julat nilai yang besar. Rumus pekali alfa adalah seperti berikut : = k ( 1 - i2) k 1 T2
Formula Kudder Richardson 20 dan 21 dibuat berdasarkan penskoran yang dibuat secara diskrit atau dikotomi. K-R 20 digunakan sekiranya indeks kesukaran item (p) berbeza bagi semua item. K-R 21 digunakan sekiranya indeks ini sama bagi semua item. Ianya juga lebih mudah digunakan oleh guru disebabkan rumus ini tidak memerlukan banyak pengiraan. Digunakan untuk item yang diskor secara dikotomi (betulsalah) seperti dalam ujian objektif perlbagai pilihan
KR20 = k ( 1 - pq) k 1 T2
KR21
= k ( 1 - m(k-m)) k 1 ks2
k ialah bilangan item dalam ujian, p ialah kadar pelajar yang menjawab item dengan betul ( indeks kesukaran item ), q ialah kadar pelajar yang salah menjawab item (q=1-p, pq adalah varians skor item), x ialah minimum skor keseluruhan item dan S x2 ialah varians skor keseluruhan ujian
Daripada nilai statistik setiap soalan itulah dianggarkan statistik ujian akhir yang terbentuk itu. Kaedah menganggar statistik ujian adalah seperti berikut. Sediakan jadual seperti berikut:
No Soalan 1 2 3 . . k p q=1 - p pq pq r rpq
Min ujian, Mt = p Sisihan piawai ujian, st = rpq Kebolehpercayaan ujian (KR 20), rtt = k___ [ 1 __pq__ ]
k 1 st2
Ralat piawai pengukuran ujian, se = st 1 rtt di mana, p = indeks kesukaran soalan q = 1 p k = bilangan soalan
Berikut adalah cara bagaimana pensyarah boleh meningkatkan kebolehpercayaan sesuatu ujian yang dibina:
Situasi dan masa ujian dijalankan hendaklah piawai, serupa dan terkawal.
Elak ganguan kepada pelajar disebabkan arahan dan soalan tidak jelas.