_________________
diamalkan dinegara kita adalah penilaian berbentuk ujian. Mengikut Ebel (1979),
sebenarnya pembina ujian menghadapi dua persoalan : pertama, untuk menentukan apa
yang ingin diukur, dan kedua, membuat keputusan bagaimana mengukurnya. Sementara
dari segi makna ujian pula Crombach (1970) telah memberikan satu definisi ujian yang
agak luas, iaitu satu prosedur sistematik untuk memerhati tingkah laku seseorang dan
yang boleh dilakukan begitu sahaja. Malah ianya memerlukan perancangan dan
lebih luas dan lebih menyeluruh jika dibandingkan dengan ujian. Mengikut Popham
tentang nilai fenomena pendidikan. Secara lebih luas, penilaian pendidikan itu
sistematik untuk menentukan sejauh mana objektif pengajaran telah dicapai oleh para
pelajar (Gronlund, 1981). Ini jelas menunjukkan bahawa penilaian adalah merupakan
suatu cara atau alat bagi mengukur keberkesanan pengajaran di samping untuk
Sebagaimana yang kita ketahui, ujian atau peperiksaan adalah satu aspek penting dalam
sistem pendidikan kita. Berbagai bentuk ujian bertulis boleh diadakan oleh guru dari
semasa ke semasa, seperti ujian betul/salah, mengisi tempat kosong, mamadankan, ujian
beraneka pilihan dan juga bentuk esei. Pada asasnya, semua ini bertujuan mendapatkan
maklumat. Daripada maklumat yang didapati itu, guru dapat mengukur pencapaian
untuk sesuatu tujuan, atau sebagainya. Walau apa pun format ujian yang hendak dibina,
atau dipilih, pastikanlah bahawa ujian itu mempunyai ciri-ciri tertentu yang
menjadikannya suatu ujian yang baik. Antara ciri-ciri penting ujian yang baik ialah
Kesahan
Kesahan sesuatu ujian merujuk kepada sejauh mana ujian berkenaan dapat mengumpul
maklumat berkaitan bidang yang ditetapkan. Dengan perkataan lain, sesuatu ujian itu
dikatakan sah, sekiranya ujian berkenaan boleh mengukur sesuatu yang sebenarnya
Kesahan bermaksud kebolehan ujian mengukur apa yang sepatutnya diukur (Youngman
& Eggleston, 1982; Sax & Newton, 1997). Kesahan merujuk kepada kesesuaian dan
kekuatan interpretasi markat ujian dan lain-lain keputusan penilaian dengan merujuk
kepada kegunaan tertentu alat ukur tersebut. Kesahan boleh dibuktikan melalui beberapa
kaedah seperti kesahan isi (content validity), kesahan telahan (predictive validity),
kesahan serentak (concurrent validity) dan kesahan gagasan (construct validity) (Fraenkel
& Wallen, 1996). Ringkasan jenis kesahan dan kaedah memperolehinya ditunjukkan
dalam Rajah 1.
Adakah soalan menguji apa Kesahan Isi Bina JPU dan rujuk item-item
yang ingin diuji? kepada pakar
Kesahan sesuatu ujian tidak dapat ditentukan secara langsung seperti mengukur
ketinggian seseorang. Keputusan ujian, atau skor markah memberi gambaran sebenar atai
tidak sebenar tentang apa yang hendak diukur. Oleh itu ia tidak dengan sendirinya sah.
Ini ialah kesahan yang terpenting bagi seseorang guru yang hendak menyediakan ujian.
Isi ujian ditentukan dengan menilai apakah tujuan ujian itu diadakan, kandungan sukatan
pelajaran, penelkanan yang diberi kepada tajuk-tajuk dalam sukatan pelajaran peringkat
atau kategori objektif pelajaran bagi tiap-tiap tajuk. Bagi sebarang ujian bertulis maka
sangat penting bagi guru supaya sentiasa menyedari tujuan utama ujian itu. Kemudian ia
hendaklah memilih atau menyediakan item ujian-ujian yang sesuai. Jenis-jenis item pula
bergantung kepada jenis pencapaian murid-murid, aras kesukaran, dan peringkat objektif
pelajaran yang hendak diuji. Contohnya, item ujian akhir tahun (ujian sumatif) misalnya
tertumpu kepada tajuk-tajuk tertentu, sedangkan tajuk-tajuk lain diabaikan, maka ujian itu
dikatakan tidak sah dari segi isi kerana tidak meliputi sukatan pelajaran.
Kesahan ramalan adalah berkait rapat dengan ujian meramal kebolehan atau kelayakan
seseorang calon untuk menjalankan sesuatu tugas pada masa depan. Contohnya guru
murid ini maka kita dapat meramal kejayaan murid-murid dalam peperiksaan sebenar
tersebut. Demikian juga bagi Ujian Kelayakan Latihan Perguruan (UKELP). Sekiranya
calon-calon yang lulus dalam UKELP dan dipilih mengikuti kursus perguruan juga
berjaya dan mendapat sijil atau diploma perguruan serta menjadi guru yang berkesan
c) Kesahan Semasa/Serentak
Kesahan semasa penting bagi guru merujuk pencapaian seseorang dalam sesuatu ujian itu
selaras denagn pencapaian kemudian dalam suatu ujian yang serupanya. Sekiranya ujian
kedua yang sama taraf dengan ujian yang pertama ditakbirkan tidak lama kemudian,
pencapaian calon biasanya lebih baik daripada ujian pertama, kerana calon yang
berkenaan telah memperolehi sedikit sebanyak pengalaman daripada ujian yang pertama.
d) Kesahan Gagasan
Kesahan gagasan amat penting diadakan untuk mengukur sejauh mana seseorang itu
menunjukkan trait personaliti, tingkah laku, atau trait mental, seperti sifat peramah,
bertanggung jawab, adil, introvert, bermotivasi, kreatif, cergas otak dan sebagainya.
Semua ini merupakan idea atau gagasan psikologi perlu dianalisa untuk mengenal pasti
proses-proses atau ciri-ciri yang dikaitkan dengan sesuatu trait agar item-item ujian yang
khusus dan tepat dapat disediakan. Berdasarkan teori atau kajian ini, kita boleh membuat
berbagai-bagai ramalan yang ada hubungannya dengan gagasan tersebut. Misalnya kita
boleh menelah bahawa seseorang murid yang kreatif juga merupakan seorang yang
imaginatif.
a) Cara yang baik untuk meningkatkan dan memastikan kesahan sesuatu ujian ialah
Jadual Penentuan Ujian (JPU). JPU ini dapat memastikan kesahan isi ujian yang
Taksonomi yang seumpamanya, bilangan soalan bagi tiap-tiap satu objektif dan
murid yang menduduki ujian itu. Ini bermakna guru perlu meneliti dan memahami
markah pada ujian yang dibentuk dengan markah ujian tentang trait yang
diperkatakan itu. Hal ini bermakna bahawa jikalau kita mahu menentukan
kesahan gagasan untuk satu ujian yang dikatakan mengukur semangat berdikari,
maka kita terpaksa mencari korelasi markahnya dengan satu markah bagi ujian
c) Kesahan gagasan boleh ditingkatkan dengan mencubakan ujian ini kepada satu
kumpulan yang diketahui mempunyai trait itu. Sifat hormat menghormati boleh
mempunyai sifat ataupun trait yang dikehendaki itu. Jika markah kumpulan itu
tinggi maka dapatlah dikatakan yang ujian itu mempunyai kesahan gagasan yang
tinggi.
dalam ekperimen itu. Ini bermakna kesahan berasaskan pendirian yang keadaan
mengubah sesuatu trait itu dapat diwujudkan. Keadaan yang berlainan itu
memberi kesan kepada trait seseorang itu. Umpamanya sifat putus asa akan
Oleh itu untuk mendapatkan kesahan bagi satu ujian yang mengukur trait putus
asa ini, maka ujian ini bolehlah diberi kepada satu kumpulan yang dimasukkan ke
ujian itu menunjukkan pertambahan dari satu masa ke satu masa yang berikutnya
e) Langkah utama bagi mendapatkan kesahan ini ialah menentukan kriteria tentang
apa yang dikatakan kemampuan atau kejayaan di dalam sesuatu perkara yang
diramalkan itu. Umpamanya perlu diketahui apakah ciri-ciri yang ada pada
jurutaip yang dikatakan baik itu ataupun apakah ciri-ciri kejayaan di dalam
menyurat, dapat mengeja dengan tidak membuat salah lebih daripada 2% daripada
perkataan yang terdapat pada sesuatu kerja yang dikendalikan, dapat menaip terus
menerus dalam jangkamasa 1 jam, dan berbagai- bagai lagi. Bagi kejayaan dalam
pelajaran sekolah menengah pula, mungkin perkara- perkara yang penting ialah
mendapat markah tidak kurang daripada 60% di dalam tiap-tiap ujian yang
f) Cara yang ideal bagi meningkatkan kesahan ialah mencari korelasi diantara ujian
ayang diberi sebelum calon-calon itu melalui pengalaman yang berkenaan dengan
perlakuan yang di dalam konteks kriatiria pada akhir pengalaman itu. Kesahan
ujian itu boleh diterima jikalau didapati calon yang tinggi markah dalam ujian itu
mencapai prestasi yang dikehendaki di dalam kretiria itu, dan calon yang rendah
Kebolehpercayaan
Salah satu daripada kriteria tersebut di atas ialah reliabiliti (kebolehpercayaan). Menurut
Mokhtar (1995), reliabiliti ujian boleh disebut sebagai darjah ketekalan antara dua
Reliabiliti adalah istilah yang keliru di sini dan setengah penulis cuba mengganti kannya
dengan ‘consistency’. Walau bagaimana pun, persoalan asas reliabiliti adalah: Adalah
penilai lain setuju dengan interpretasi tingkah laku pelajar? Tetapi variasi yang
mengganggu pula adalah: Adakah saya menterjemah tingkah lakunya dalam keadaan
yang sama jika saya melihatnya lagi? (Rowntree, 1977). Secara umum, kesilapan
angkubah pengukuran adalah banyak terdapat dalam skor ujian dalam pendidikan (atau,
dengan kata lain, ujian pendidikan cenderung kepada tidak reliabel) melainkan kerja yang
lebih berhati-hati dilakukan bagi menentukan aras reliabiliti yang diterima (Martuza,
1977). Ini menunjukkan bahawa reliabiliti bukan sahaja skor yang sama didapati walau
pun orang lain yang menilainya, tetapi jika kita harus memberikan skor yang sama juga
telah ditunjukkan oleh Dicker (1973), yang menemukan bahawa pekali korelasi hanya
0.46 apabila 24 guru memeriksa sekali dan kemudian diperiksa semula selepas tiga bulan.
Aschersleben (1971) menganalisis pemeriksaan oleh 24 guru ke atas 623 pelajar dalam
empat ujian matematik yang bersiri dan empat ujian ‘dictation’. Beliau mendapati
secara purata, nilai lebih kecil (Ingenkamp, 1977). Ini menunjukkan bahawa pemeriksaan
seseorang pemeriksa bukan sahaja tidak tekal tetapi amat berbeza di antara seorang
pemeriksa dengan pemeriksa lain. Dengan kata lain pemeriksaan mereka mempunyai
Soalan yang dibina jika tidak mempunyai reliabilti atau mempunyai reliabiliti
rendah tidak akan dapat menggambarkan pencapaian pelajar dan seterusnya akan
menjadikan sistem penilaian yang sia-sia. Oleh itu para pendidik perlu berhati-hati dalam
kebolehbergantungan ujian berkenaan. Ini bermaksud sesuatu ujian yang boleh dipercayai
akan menghasilkan maklumat yang tekal (merujuk kepada beberapa pentadbiran ujian
yang telah dijalankan), tepat seperti yang sepatutnya serta boleh diterima pakai tanpa
keraguan.
Pada kebiasaannya , sesuatu ukuran itu tidak lepas daripada ralat (error). Ini amat
ketara dalam prestasi fizikal. Jauh lompatan seseorang misalnya, tidak sentiasa sama
kerana pengaruh halaju angin kedaan fizikalnya, kedaan atau jenis kasut yang dipakai,
latihan, larian atau sebagainya. Sedangkan berat seseorang pun boleh berubah dalam satu
Kepentingan Kebolehpercayaan
Apabila kita menilai ataupun menguji murid-murid, kita akan menyoal diri kita sendiri
adakah jawapan yang diberikan itu tidak berubah-ubah dan dapat mencerminkan
kemahiran, kebolehan dan nilai pada murid itu. Jika benar maka ujian yang kita berikan
itu bolehlah kita anggapkan sebagai stabil. Ujian yang stabil ialah ujian yang dapat
memberikan market yang sama apabila murid itu mengambil ujian itu beberapa kali di
dalam satu jangka masa yang pendek. Katakan kita menyediakan satu ujian penggal
matematik. Untuk menentukan samada ujian itu stabil atau tidak , kita boleh memberikan
dua kali ujian kepada murid kelas kita. Biarkan jarak di antara ujian pertama dengan yang
kedua itu lebih kurang satu ataupun dua minggu. Jikalau markah bagi tiap-tiap murid di
dalam ujian pertama itu lebih kurang sama dengan markah yang diperolehi untuk ujian
kedua , maka ujian itu bolehlah dianggap stabil ataupun boleh dipercayai.
Kebolehpercayaan ujian sangat penting oleh kerana kita tidak mahu markah yang
diperolehi itu dalah disebabkan oleh nasib. Kita mahukan markah itu datangnya daripada
kemampuan murid itu sendiri. Kebolehpercayaan adalah satu perkara yang senang dilihat
didalam ukuran seperti berat, panjang, tinggi dan lain-lain yang berbentuk maujud.
Sesuatu ukuran panjang itu sudah tentu memberi bacaan yang sama jikalau barang yang
sama diukur berulang kali. Begitu juaga dengan sesuatu penimbang berat itu sudah tentu
memberi bacaan yang sama jikalau kita menimbang benda yang sama berulangkali.
Bacaan yang berlainan akan menimbulkan syak wasangka kepada kita oleh kerana alat-
Bagi ujian ataupun penilaian yang kita sediakan , kebolehpercayaan adalah satu
ciri yang patut kita pastikan sebagai dapat diterima. Jika tidak, penilaian yang kita
lakukan itu tidak akan memberi peluang yang cukup kepada murid-murid membuktikan
yang mereka mempunyai kemahiran, pengetahuan dan sikap yang dinilaikan itu. Satu
peluang sahaja sudah tentu tidak mengcukupi. Umpamanya kita mahu menguji samada
murid itu dapat menolak nombor-nombor tidak lebih dariapada 20 dan dengan bertangan.
Kita tidak hanya memberikan satu soalan sahaja..Kita akan mengemukakan beberapa
soalan yang dapat menguji kemahiran yang sama. Jika murid itu dapat peluang menjawab
sebilangan besar soalan-soalan itu , maka baharulah kita berpuas hati dan menerima
kebolehpercayaan pada ujian ini ialah untuk kita memastikan yang ujian atupun alat
Panjang pendek ujian itu boleh mempengaruhi keutuhan. Biasanya, semakin panjang
ujian maka semakin tepat skornya kerana semakin kurang pergantungan kepada tekaan
atau kebetulan. Demikian juga ujian yang bersifat objektif yang mempunyai keutuhan
yang lebih tinggi kerana tidak terdedah kepada berbagai-bagai interpretasi. Ujian yang
sah juaga biasanya utuh, tetapi ujian yang utuh tidak semestinya sah. Skor yang konsisten
tidak semestinya mengukur apa yang hendak diukur. Item-item ujian hanya merupakan
sampel bagi bidang yang diuji . variasi dalam sampel mungkin terdapat dalam dua ujian
yang setara bentuknya. Hal ini merupakan satu lagi punca ralat.
Oleh kerana guru yang membina dan mentadbir ujian kepada murid-murid, maka
perhubungan guru murid yang baik biasanya akan menambah keutuhan keputusannya.
Keadaan fizikal dan mental yang positif, azam dan motivasi, galakan guru, kebiasaan
dengan format ujian juaga akan memberi kesan yang positif terhadap kebolehpercayaan.
Perbezaan skor munkin timbul lantaran perbezaan cara ujian itu ditadbirkan.
murid haruslah diberi masa yang cukup, terutama dalam ujian daya (power test). Mereka
ditentukan dengan cara uji-ulang (retest) . Sebarang manfaat yang didapati oleh murid-
ulang uji murid-murid mungkin lebih biasa dengan format , atau lebih faham dengan
item-item ujian. Oleh itu, mereka mendapat skor yang lebih tinggi. Hal ini menunjukkan
Persekitaran yang sesuai, seperti kerusi meja yang selesa , ruang dan cahaya yang cukup ,
kebolehpercayaan ujian.
Apabila sesuatu ujian itu bersifat subjektif , biasanya markah yang diberi untuk
jawapan yang sama adalah berbeza mengikut pemeriksa, walaupun skim permarkahan
masa dan keadaan. Perkara ini tidak berlaku dalam ujian objektif, kerana semua
responnya adalah tepat. Mana-mana pemeriksa akan memberi markah yang sama untuk
respon yang sama. Oleh itu, keobjektifan merupakan satu syarat bagi keutuhan.
Pada lazimnya , adalah sangat sukar bagi guru untuk membentuk satu ujian yang
mempunyai ciri kebolehpercayaan yang tinggi. Ini adalah kerana pencapaian murid
dalam situasi yang berlainan akan dipengaruhi oleh factor-faktor berlainan seperti
bilangan soalan, emosi dan kesihatan calon, keadaan persekitaran dan cara memeriksa.
Oleh itu untuk meninggikan ciri kebolehpercayaan dalam sesuatu ujian , guru harus
Faktor pertama ialah keadaan tempat murid-murid itu mengambil ujian. Keadaan
yang tidak selesa menyebabkan murid-muird tidak dapat menjawab seperti yang selalu
ditunjukkan. Jika bilik itu bising dan panas umpamanya , muird tidak akan dapat
menjawab soalan dengan sebaik-sebaiknya. Jika murid itu tidak sihat ketika mengambil
ujian , maka jawapannyapun tidak sebaik yang dapat ditunjukkannya jikalau dia di dalam
keadaan sihat. Oleh itu , guru haruslah memastikan yang keadaan tempat murid itu
Faktor kedua ialah kejelasan yang terdapat pada arahan dan item-item ujian itu.
Arahan dan item-item yang kurang jelas boleh menimbulkan interpretasi yang berlainan
dariapada muri-murid. Oleh itu semasa menyediakan ujian ataupun penilaian , guru
seharusnya memastikan yang arahan dan item-item, sama ada dalam bentuk kenyataan,
Faktor ketiga berkait dengan panjangnya ujian ataupun penilaian itu. Ujian yang
banyak itemnya itu selalunya lebih stabil oleh kerana guru berpeluang menyoalnya
beberapa kali. Sebaliknya, ujian yang banyak item itu memakan masa yang panjang.
Murid yang rendah umurnya sudah tentu tidak dapat memberi tumpuan yang
dikehendaki. Kita tahu lama masa yang dapat ditumpukan oleh murid terhadap sesuatu
tumpuan yang terhad. Mereka cepat jemu dan dengan itu tidak akan dapat menjawab
soalan-soalan yang dikemukakan. Bagi mengelakkan perkara ini daripada berlaku, guru
seharusnya menyediakan ujian yang tidak terlalu memakan masa yang panjang. Guru
menimbulkan masalah. Tetapi ujian ataupun penilaian yang berkaitan dengan sikap, nilai
dan juga amali sukar diperiksa dan diberikan markah secara objektif. Masalah ini sering
berlaku di dalam ujian-ujian terbuka yang guru lakukan. Di dalam pemerhatian juga, guru
dapati yang pemarkahan sukar diberi dengan tepat. Bagi mengelakkan perkara-perkara
ini, guru harus menyediakan satu skim pemeriksaan dan pemarkahan yang jelas dan kita
ataupun penilaian ilah dengan memberikan bilangan soalan yang berpatutan. Biasanya
semakin bilangan solan bertambah, maka semakin tepat pencapaian murid itu., kerana
bilangan soalan ditambah akan dapat mengurangkan peluang untuk murid meneka.
Penutup
Isu kesahan dan kebolehpercayaan adalah amat penting dalam pembinaan sesuatu alat
ukur sebelum boleh di gunapakai. Walaupun sesuatu alat ukur yang digunakan telah
pernah dipakai oleh penyelidik terdahulu, dan telah teruji kebolehpercayaan dan
keesahannya, namun alat ukur tersebut masih perlu diuji rintis semula kerana inferens
yang diperolehi hanya sesuai untuk tujuan dan sampel kajian tertentu sahaja
Bibliografi
Lee Shok Mee dan Mook Soon Sang (1989). Pengujian dan penilaian dalam pendidikan,
Mohd. Majid Konting. (1998). Kaedah penyelidikan pendidikan. Kuala Lumpur : Dewan
Mokhtar Ismail (1995).Penilaian di bilik darjah. Kuala Lumpur: Dewan Bahasa &
Pustaka.
Yap Yee Khiong et al. (1985). Pengukuran dan penilaian dalam pendidikan. Selangor