0 PENGENALAN
Sistem penilaian memang tidak dapat dipisahkan daripada pendidikan. Setiap
perancangan kurikulum mesti diikuti dengan penilaian. Kebanyakan penilaian yang
diamalkan di negara kita adalah penilaian berbentuk ujian. Mengikut Ebel (1979), sebenarnya
pembina ujian menghadapi dua persoalan : pertama, untuk menentukan apa yang ingin
diukur, dan kedua, membuat keputusan bagaimana mengukurnya. Sementara dari segi makna
ujian pula Cronbach (1970) telah memberikan satu definisi ujian yang agak luas, iaitu satu
prosedur sistematik untuk memerhati tingkah laku seseorang dan memperihalkannya dengan
bantuan skala bernombor, atau satu sistem berkategori.
2.0 DEFINISI
2.1 Kesahan
Kesahan sesuatu ujian merujuk kepada sejauh mana ujian berkenaan dapat
mengumpul maklumat berkaitan bidang yang ditetapkan. Dengan perkataan lain,
sesuatu ujian itu dikatakan sah, sekiranya ujian berkenaan boleh mengukur sesuatu
yang sebenarnya hendak diukur atau sepatutnya diukur.
Alat taksiran yang mengukur apa yang ia ukur adalah sah. Sesuatu alat pengukur tidak
memiliki kesahan untuk “semua tujuan”. Sesuatu ujian mungkin sangat sah untuk
sesuatu tujuan tertentu tetapi ia tidak mungkin sah dalam situasi lain. Oleh sebab
sesuatu ujian yang tidak sah dianggap tidak berguna maka seseorang itu hendaklah
membentangkan bukti yang boleh memberi keyakinan bahawa ujian yang digunakan
mengukur tepat ciri-ciri ujian yang berkenaan direka bentuk untuk diukur.
2.2 Kebolehpercayaan
2.3 Penilaian
Penilaian kurikulum adalah suatu proses mengumpul data untuk menilai seorang
pelajar atau sesuatu kurikulum. Penilaian kurikulum adalah merangkumi proses
memberi pengetahuan, menjalankan ujian dan menilai hasil yang diperolehi oleh
pelajar. Bagi kurikulum itu sendiri penilaian bermaksud menilai isi kandungan, susun
atur, organisasi dan kaedah penyampaiannya. Penilaian kurikulum memberi maksud
sama ada kurikulum yang dibina, direka bentuk dan dilaksana menerbitkan hasil
pembelajaran yang diharapkan.
Menurut Kelly, A.V (2009), Penilaian kurikulum adalah proses dimana kita berusaha
atau mencuba untuk mengukur nilai dan keberkesanan daripada sebahagian aktiviti
pendidikan sama ada projek di peringkat nasional ataupun hanya aktiviti bersama
murid di dalam bilik darjah.
3.0 KESAHAN
Thorndike (1991) konsep kesahan merujuk kepada keseluruhan apa yang hendak kita ukur
dan tiada lain selain apa yang kita hendak ukur. Konsep kesahan pengukuran merujuk kepada
tafsiran dan hasil daripada pengukuran. Kesahan merujuk kepada tahap sesuatu ujian dapat
mengukur apa yang sepatutnya di ukur iaitu tahap dimana sesuatu ujian memenuhi objektif
yang dihajati. Ciri-ciri kesahan dalam pengujian/penilaian boleh dibahagikan kepada empat
jenis berdasarkan pengujian/penilaian yang ingin dijalankan, di antaranya adalah:
1. Kesahan kandungan
2. Kesahan ramalan
3. Kesahan serentak
4. Kesahan konstruk
Kesahan merujuk kepada takat sesuatu ujian dapat memenuhi ujiannya. Ujian sepatutnya
mengukur apa yang patut diukur.
i. Contohnya jika kita hendak mengukur sikap, hendaklah mengukur sikap.
ii. Contoh jika menggunakan ujian diagnostik maka tidak sah jika diberi gred.
iii. Contoh jika ujian ejaan hendaklah mengukur kebolehan mengeja atau ujian
mendengar hanyalah untuk mengukur kemahiran mendengar.
1. Kesahan kandungan
Merujuk kepada keupayaan ujian menguji apa yang sepatutnya diuji. Contohnya,
ujian kebolehan berbahasa perlu mengandungi soalan tentang bacaan petikan dan
soalan kefahaman tentang petikan.
Merangkumi kandungan ujian yang hendak diukur
Merujuk kepada objektif pengajaran yang jelas dan bahan pengajaran yang
ditentukan atau bidang pengajaran yang khusus
Digunakan dalam ujian pencapaian
Mengukur penguasaan pengetahuan atau kemahiran tertentu dalam mata
pelajaran tertentu
Memastikan setiap konstruk yang diuji mewakili aspek penting pelajaran yang
diajar
Bergantung kepada relevensi atau kesesuaian tingkah laku yang ingin
diperhatikan atau diketahui
Perlu memenuhi Huraian Sukatan Pelajaran, Jadual Spesifikasi Ujian
2. Kesahan berkaitan kriteria
Perbezaan diantara kesahan semasa dan ramalan bergantung kepada prosedur
mentadbir ujian iaitu:
Pentadbiran ujian pada jangka masa yang singkat bagi ujian piawaian (concurrebt)
atau setelah beberapa bulan berlalu (predictive)
a. Kesahan semasa/serentak
Bertujuan menetukan tahap seseorang murid.merujuk kepada pencapaian
seseorang calon didalam sesuatu ujian adalah samada setara dengan
pencapaian di dalam ujian yang lain.
Contohnya jika anda melakukan kesilapan di dalam satu ujian matapelajaran,
anda juga dijangka akan melakukan kesilapan yang hampir sama di adalam
ujian yang lain (yang sama) bermaksud anda akan mengulangi kesilapan yang
sama di dalam ujian ulangan untuk matapelajaran yang sama.
Contohnya, jika seseorang guru membina dan menjalankan sesuatu ujian yang
melibatkan aspek kerja sekolah dan hasil keputusan adalah sama dengan
pencapaian di tunjukan maka dikatakan ujian tersebut mempunyai kesahan
semasa yang tinggi.
Contohnya, dalam matapelajaran bahasa melayu, satu objektif penting adalah
untuk membolehkan murid menulis dengan baik bedasarkan peraturan-
peraturan tatabahasa. Murid yang memperolehi markah yang tinggi dalam
ujian pencapaian (Bahasa Melayu) seharusnya boleh menulis dan bertutur
dengan baik jika kesahan serentak ujian itu tinggi.
Hubungkait diantara skor ujian dengan kumpulan murid berdasarkan
kriteria tertentu
Ditadbir pada masa yang sama atau dalam jangka masa yang pendek.
b. Kesahan ramalan
Merujuk kepada takat ujian meramal kebolehan seseorang calon menjalankan
sesuatu tugas dalam situasi yang lain ataupun pada masa hadapan. Untuk
mendapatkan kesahan ramalan yang tinggi, item ujian hendaklah benar-benar
menguji kebolehan yang relevan dengan kebolehan, kemahiran atau
kelayakkan yang diperlukan di dalam sesuatu bidang yang akan diterokai
kelak.
Contohnya, hasil ujian penulisan mungkin dapat meramal sejauh mana murid
dapat membuat karangan dalam sesebuah bengkel. Sekirannya markah calon
itu tinggi dan selalu dapat membuat karangan yang baik semasa bengkel di
jalankan, maka kesahan ramalan ujian penulisan adalah tinggi.
Contohnya, seseorang pelajar matrikulasi yang mempunyai keputusan yang
baik di dlam SPM/STPM akan dijangka memperolehi keputusan yang baik
diperingkat peperiksaan Matrikulasi kelak.
Maklumat dikumpul melalui ujian/kriteria/tingkah laku yang hendak
diukur oleh ujian
Membuat perbandingan antara maklumat yang dikumpul atau skor
yang diperolehi daripada pelajar yang mengambil ujian tersebut
Dapat menetukan kebolehan calon unruk melaksanakan tugasan dalam
sesuatu keadaan yang berbeza dengan efektif
Dapat meramal perubahan sikap seseorang calon pada masa akan
datang.
3. Kesahan gagasan/konstruk
Merujuk kepada takat sesuatu trait hipotetikal dibayangkan dalam pencapaian ujian.
Tujuan ujian adalah untuk mengukur tahap kebolehan ciri mental atau kognitif
individu seperti kecerdasan,kebolehan dan kemahiran berfikir,
kreativiti,motivasi,emosi,toleransi, kebolehan mengulas,keadilan dan sifat.
Contohnya, markah seseorang mungkin dipengaruhi oleh kecerdasan, kebolehan
menaakul, dan sebagainya.
Contohnya, alat yang dibina untuk mengukur konstruk ‘sabar’ sepatutnya mengukur
konstruk ini dengan lebih baik. Pembina item inventori perlu terlebih dahulu
memahami maksud ‘tidak sabar’, ‘kurang sabar’,’sabar’ dan juga ciri-ciri orang yang
‘tidak sabar’ dan ‘kurang sabar’.
Ujian ditadbir kepada pelajar yang julat pencapaiannya luas
Keputusan ujian membezakan antara pelajar yang berpencapaian tinggi
dengan yang rendah dan ujian tersebut dianggap mengukur kebolehan
konstruk.
4. Kesahan muka
Merujuk kepada ujian dilihat mengukur apa yang hendak diukur. Nampak pada
permukaan sahaja dan jika seseorang itu tidak terlatih dalam pembinaan dan
perealisasian item, maka item dikatakan sah.
Meningkatkan motivasi semasa pelajar mengambil ujian
Mengurangkan perasaan kurang puas hati atau tidak adil kepada
kumpulan murid yang berskor rendah
Membantu meyakinkan penggunanya berpontensi contohnya, guru,
pentadbir sekolah untuk menggunakan ujian tersebut.
Bukti yang menunjukkan setakat mana isi kandungan sesuatu ujian itu merupakan
sampel “representif” domain isi kandungan yang sepatutnya diukur. Fokus bukti
berkaitan dengan isi kandungan untuk kesahan ialah tentang kerelevenan dan cukup
tidaknya sampel tugasan yang terkandung dalam ujian. Jadual penentuan ujian yang
disediakan untuk sesuatu ujian merupakan satu bukti berkaitan dengan isi kandungan
untuk menyokong kesahan rumusan skor ujian. Bukti berkaitan dengan isi kandungan
amat penting untuk menyokong tafsiran skor ujian percapaian.
Bukti yang menunjukkan setakat mana skor ujian berkenaan dapat meramalkan
prestasi dalam sesuatu Kriteria,
Ukuran kriteria boleh dilakukan dengan dua cara ; satu dimasa depan dan serentak
dengan ujian Bukti yang menunjukan bahawa skor ujian dapat meramalkan prestasi
dalam kriteria dimasa depan. Bukti yang berkaitan dengan kriteria boleh
dikumpulakan dengan menentukan koefesien kolerasi antara ujian dan kriteria yang
diukur serentak dengan ujian.
Glock &Ahmann (1981) mentakrifkan konstruk sebagai sesuatu sifat yang dianggap
wujud untuk memberi penjelasan mengapa sesuatu aspek tingkah laku manusia
berlaku. Bukti berkaitan dengan konstruk ialah bukti yang menunjukkan setakat mana
skor ujian itu dapat ditafsirkan sebagai ukuran bagi sesuatu trait psikologi, ciri, kualiti
atau konstruk berkenaan.
Dalam penyelidikan kualitatif, bilangan subjek kajian yang digunakan biasanya kurang dan
data-data kualitatif yang dikumpulkan melalui prosedur kajian seperti temubual, dan
pemerhatian haruslah mempunyai semua jenis kesahan di atas. Masalah yang sering timbul
ialah mengenai kesahan luaran.
4.0 KEBOLEHPERCAYAAN
Kaedah uji dan uji kembali terdedah kepada perubahan disebabkan faktor sistematik
dan faktor tidak sistematik. Oleh kerana alat ukur yang sama ditadbir sebanyak dua
kali ke atas responden yang sama tetapi pada waktu yang berlainan, maka perubahan
sistematik yang berlaku adalah disebabkan oleh kematangan responden dan alat ukur.
Responden semakin matang pada pengukuran kedua berbanding dengan pada
pengukuran pertama. Bagaimanapun, faktor sistematik tidak mempengaruhi paras
kebolehpercayaan sesuatu alat ukur.
Operasi atau pengurusan alat ukur pada kali pertama dan kali kedua dalam kaedah uji
dan uji kembali mungkin menghasilkan faktor tidak sistematik yang boleh
mempengaruhi kebolehpercayaan. Oleh itu, kita perlu mengadakan pengurusan alat
ukur yang piawai; serupa dan terkawal bagi mencegah kesan faktor tidak sistematik.
Untuk menjamin kebolehpercayaan penilaian , kita perlu menghalang perubahan
disebabkan sikap, minat, kecergasan fizikal dan kestabilan emosi responden.
Dua set markah yang boleh digunakan untuk mendapatkan indeks kebolehpercayaan
boleh juga didapati dengan menggunakan kaedah bentuk setara. Kaedah bentuk setara
menggunakan satu alat ukur yang dibina dan satu alat ukur yang piawai. Kedua-dua
alat ukur yang ditadbir ke atas responden yang sama dan pada masa yang sama.
Markah-markah yang didapati daripada pengukuran dengan menggunakan kedua-dua
alat ukur tersebut dikorelasikan. Pekali korelasi yang positif dan teguh menunjukkan
indeks kebolehpercayaan yang tinggi bagi alat ukur yang dibina.
c. Kaedah Berbahagi Dua
Kaedah ini sering digunakan bagi menentukan kebolehpercayaan sesuatu alat ukur
kerana kaedah ini hanya memerlukan pentadbiran alat ukur sekali sahaja. Dengan
menggunakan pentadbiran, kaedah berbahagi dua dapat mencegah berlakunya
perubahan disebabkan ketiga-tiga sumber variasi iaitu individu, dari satu pengukuran
ke suatu pengukuran, variasai tugasan dari satu pengukuran ke satu pengukuran dan
variasai persampelan gagasan yang berbeza antara satu pengukuran dengan
pengukuran lain.