Anda di halaman 1dari 20

1 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item

Bab 8 P PE EN NY YE ED DIIA AA AN NU UJ JIIA AN N,, P PE EN NT TA AD DB BIIR RA AN ND DA AN NA AN NA AL LIIS SIIS S IIT TE EM M


Di akhir bab ini, anda harus boleh: Menerangkan fasa-fasa dalam penyediaan ujian Menyenaraikan garispanduan untuk mentadbir ujian Mentakrifkan analisis item Menghitung indeks kepayahan dan diskriminasi Analisis keberkesanan penganggu dalam soalan Membincangkan hubungkait antara indeks kepayahan dan indeks diskriminasi sebuah item

BAB SEPINTAS LALU

8.1 Menyediakan sebuah ujian 8.2 Apakah itu Analisis Item? 8.3 Langkah-langkah Analisis Item 8.4 Indeks Kepayahan 8.5 Indeks Diskriminasi 8.6 Hubungkait Antara Indeks Kepayahan dan Indeks Diskriminasi 8.7 Analisis Pengganggu 8.8 Pendekatan Praktikal Dalam Analisis Item 8.9 Bank Item Ringkasan Istilah Penting Rujukan

Bab 1: Pengenalan Bab 2: Memutuskan apa yang akan ditaksir Bab 3: Mentaksir Hasil Pembelajaran Menggunakan Ujian Objectif Bab 4: Mentaksir Hasil Pembelajaran Menggunakan Ujian Karangan Bab 5: Mentaksir Hasil Pembelajaran Menggunakan Projek dan Amali Bab 6: Mentaksir Hasil Pembelajaran Menggunakan Pencerapan, Ujian Lisan, dan Portfolio Bab 7: Kebolehpercayaan dan Kesahan Kaedah Pentaksiran Bab 8: Analisis Item Bab 9: Analisis Pemarkahan Ujian dan Melaporkan Pentaksiran Pelajar

Dalam bab ini, kita akan memperincikan bagaimana merancang sebuah ujian dan melaksanakan analisis item. Sebuah ujian harus dirancang dengan teliti dan ia melibatkan beberapa fasa: memperjelaskan tujuan, memilih jenis soalan, membina sebuah jadual spesifikasi dan merancang pentadbiran ujian. Adalah juga penting semasa menggubal ujian untuk mengenal pasti kekuatan dan kelemahan setiap item dengan menggunakan analisis item. Analisis item melibatkan penggunaan tiga prosedur: kepayahan item, diskriminasi item dan analysis pengganggu untuk membantu penggubal ujian membuat keputusan samada item-item dalam sebuah ujian dapat diterima, dimodifikasi ataupun ditolak. Prosedur-prosedur ini adalah agak mudah dan senang digunakan dan pendidik perlu memahami logik yang mendasari analisis-analisis ini agar dapat menggunakannya dengan betul dan berkesan.

2 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item 8.1 Menyediakan Ujian

Bagi memastikan keputusan yang terbaik, sebuah ujian perlu dirancang. Sebuah ujian yang baik tidak terjadi dengan sendirinya! Ia terhasil daripada perancangan yang teliti dan cermat. Perancangan dilaksanakan melalui fasa-fasa berikut: memperjelaskan tujuan, menyediakan jadual spesifikasi, menentukan format ujian, menyemak semula, menghimpunkan, mereproduksi dan melaksanakan ujian (lihat Gambarajah 8.1).
Mentadbir

Mereproduksi

Menghimpun

Menyemak Semula

Format Ujian

Jadual Spesifikasi

Memperjelaskan Tujuan

Gambarajah 8.1 Fasa-fasa Dalam Penyediaan dan Pentadbiran Ujian

FASA 1: MEMPERJELASKAN TUJUAN Cubalah Tanya seorang guru; Apakah tujuan ujian yang anda sedang bina? Jawaban yang kemungkinan besar anda akan terima adalah: Bagi melihat banyak mana pelajar tahu tentang mata pelajaran tersebut. Jawaban seperti ini memberi tanggapan bahawa pengujian adalah untuk member gred, iaitu suatu tujuan yang berasas. Walau bagaimanapun, ini mungkin suatu pernyataan tujuan yang tidak memuaskan. Seperti yang kita telah bincangkan dalam Bab-bab 2 sehinga 6, kita ingin mentaksir hasil pembelajaran menggunakan berbagai teknik pentaksiran seperti soalan aneka pilihan, esei, projek, amali dan sebagainya. Suatu cara untuk melihat tujuan pentaksiran atau pengujian yang lengkap dan tepat adalah seperti berikut: Bagi mengukur tahap pencapaian keseluruhan dalam bidang kursus untuk tujuan member gred

3 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item Bagi menentukan sejauhmana individu pelajar dan kumpulan secara keseluruhannya telah menguasai keperluan minimum kursus atau mata pelajaran Bagi menentukan tahap fungsi kognitif, afektif dan psikomotor pelajar yang dapat diterjemahkan kepada suatu keterangan tentang apa dia boleh buat

Suatu pernyataan tujuan pengujian yang menyeluruh harus memberi indikasi yang jelas tentang bentuk keputusan yang guru ingin buat, bentuk data yang diperlukan serta ciri-ciri individu dan kumpulan yang mana keputusan tersebut dibuat. Anda perlu mencari jawaban kepada soalan-soalan berikut: Apakah keputusan yang anda ingin buat berdasarkan keputusan ujian tersebut? Apakah data yang anda perlukan untuk dapat membuat keputusan tersebut? FASA 2: MENYEDIAKAN JADUAL SPESIFIKASI Fasa berikutnya dalam pembinaan sebuah ujian adalah untuk menggubal suatu rancangan ujian. Ini ada kalanya dipanggil sebagai sebuah "jadual spesifikasi" atau "rangka tindakan" untuk ujian anda (Gronlund, 1988). Topik 1 1 Topik 2 1 1 Topik Topik TOTAL 3 4 1 1 5 (12.5%)

Tahap Hasil Pembelajaran Pengetahuan: Mengingat semula takrif Mengenal pasti Pemahaman Membuat interpretasi Mengklasifikasi Membuat inferensi Membandingkan Menjelaskan Aplikasi Menyelesai Mengaitkan Menggunakan Analisis Menganalisis Mengasingkan Membuat inferensi Sintesis Mereka Penilaian Menjustifikasi

1 1 -

1 -

1 1

1 1 -

7 (17.5%)

2 1 1

1 2 1

1 1 1

1 1 2

15 (37.5%)

2 1

1 1

2 1 -

1 1 -

10 (25.0%)

2 (5.0%)

1 (2.5%)

4 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item JUMLAH 10 10 10 10 (25%) (25%) (25%) (25%) 40

Jadual 8.1 Contoh Jadual Spesifikasi Ia bertujuan membantu memastikan agar ujian tersebut akan menjadi suatu perwakilan objektif-objektif pembelajaran yang sah dan agar kandungan-kandungan yang dicakupi dalam ujian mencerminkan penekanan yang anda letakkan dalam pengajaran, nota-nota dan perbincangan dalam kelas. Dengan menyenarai kandungan atau topik dan peratusan penekanan baginya, anda membina suatu struktur untuk ujian anda. Anda juga mungkin ingin mempertimbangkan tahap kefahaman yang anda mahukan pelajar anda perolehi tentang setiap topik. Sebagai contoh, adakah anda ingin pelajar anda sekadar boleh mengingat semula maklumat, ataupun anda ingin agar mereka memahami atai mengaplikasi maklumat kepada suatu situasi yang baru. Anda boleh membuat suatu matriks dengan menyenaraikan kandungan atau topik sebagai baris-baris, dan tahap pemikiran atau kemahiran proses (seperti mengingat semula, memahami, mengaplikasi, menganalisis, mensintesis atau menilai) sebagai lajur (lihat Jadual 8.1). Jadual spesifikasi mengenal pasti objektif-objektif dan kemahiran-kemahiran yang diuji dan pemberat yang diberikan kepada setiap daripadanya pada ujian tersebut. Jadual spesifikasi boleh membantu anda menentukan yang anda mendapat liputan yang diinginkan untuk topic-topik dan tahap-tahap bagi setiap objektif. Rangka tindakan tersebut membolehkan guru mensampel hasil-hasil pengajaran secara seimbang, dengan memberikan penekanan secukupnya kepada jenis-jenis objektif dan juga kandungan. FASA 3: FORMAT UJIAN Setelah menggariskan tujuan dan spesifikasi, anda perlu membuat beberapa keputusan teknikal terlebih dahulu: a) Bentuk ujian Aneka pilihan, esei, amali, projek, ujian lisan b) Panjangnya ujian dan peruntukan masa jumlah bilangan soalan c) Arahan-arahan a) Bentuk Ujian Apabila anda membuat rangka tindakan ujian anda, anda bolehlah mula menulis item-item. Apabila anda menulis atau memilih item-item (daripada sumber lain) anda harus mengikut rancangan anda dan sampel item tersebut akan mewakili kandungan kursus anda. Menggubal sebuah rancangan ujian juga membantu anda menentukan jenis item-item yang anda ingin masukkan dalam ujian anda. Pilihan anda di antara item esei dan item objektif bergantung kepada jenis-jenis objektif yang anda telah gubal dan tahap pemikiran yang anda ingin uji. Anda mungkin ingin menggabungkan beberapa jenis item dalam ujian anda. b) Panjangnya Ujian dan Peruntukan Masa Semasa menulis item-item ujian, anda harus mempertimbangkan panjangnya ujian atau peperiksaan tersebut dan juga tahap pembacaan pelajar anda. Anda tidak mahu pelajar anda merasa didesak dan kecewa kerana mereka tidak boleh menunjukkan pengetahuan mereka tentang bahan dalam masa yang diperuntukkan. Beberapa garispanduan mengenai keperluan masa untuk pelajar

5 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item sekolah menengah yang mengambil ujian ditunjukkan dalam Jadual 8.2 (Nitko, 2004). Sekiranya anda menggabungkan soalan aneka pilihan dan item-item esei, anggaran-anggaran ini mungkin dapat membantu anda menentukan berapa item yang perlu dimasukkan. Salah satu kesilapan yang sering dibuat oleh pendidik adalah memasukkan terlalu banyak soalan bagi masa yang diperuntukkan. Anggaran Masa Bagi Setiap Item
20-30 saat 40-60 saat 70-90 saat 2-4 minit 2-4 minit 2-5 minit 5-10 minit 15-20 minit 15-25 minit 35-50 minit

Tugasan
Item betul/salah Item aneka pilihan (fakta) Item aneka pilihan (kompleks) Item memadankan (5 stem/6 pilihan) Item jawaban pendek Item aneka pilihan (dengan penghitungan) Masalah dalam perkataan (kiraan mudah) Esei pendek Analysis data / membuat geraf Esei panjang

Jadual 8.2 Peruntukan Masa Untuk Setiap Jenis Item d) Arahan-arahan Apabila soalan-soalan anda telah digubal, pastikan anda memasukkan arahan-arahan yang jelas kepada pelajar. Bagi item-item objektif, khususkan samada pelajar harus memilih satu jawaban bagi setiap item dan beri indikasi nilai mata bagi setiap soalan, khususnya apabila anda memberi pemberat yang berlainan bagi setiap bahagian dalam ujian. Bagi item-item esei, beri indikasi nilai mata dan cadangkan masa untuk diluangkan untuk seriap item. Sekiranya anda mengajar dalam sebuah kelas yang besar dengan kedudukan kerusikerusi yang rapat dan anda menyediakan ujian objektif, anda mungkin perlu mempertimbangkan untuk mentadbir beberapa versi ujian anda untuk mengurangkan peluang meniru. Cukup kalau anda menyediakan beberapa versi ujian anda dengan susunan item-item yang berbeza.

6 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item


SEMAK KENDIRI 8.1

a) Apakah tujuan Jadual Spesifikasi? b) Pernahkah anda menggunakan Jadual Spesifikasi? Jelaskan. c) Adakah anda bersetuju dengan peruntukan masa bagi setiap jenis soalan seperti dalam Jadual 8.2?

FASA 4: SEMAK SEMULA Walau bagaimana bagus penguasaan anda tentang mata pelajaran atau bagaimana tinggi kemahiran anda dalam membina sebuah ujian, anda selalunya akan mendapat manafaat daripada menyemak semula bahan-bahan ujian. Apabila anda telah mengerjakan bahan-bahan yang sama selama beberapa waktu, ada kemungkinan anda hilang kesegaran berbanding semasa memulakan tugasan tersebut. Hasilnya, anda mungkin gagal menjumpai kekeliruan dan kesalahan-kesalahan teknikal lain yang mungkin menyelinap masuk ke dalam ujian tersebut. Adalah suatu amalan yang baik untuk menyerahkan bahan-bahan kepada seorang atau lebih rakan ataupun sebuah jawatankuasa penyemak semula bagi mendapatkan pandangan kritikal mereka. Penyemak semula harus diminta melihat soalan-soalan, merekod pilihan mereka atau menggariskan jawaban mereka secara bersendiri. Pengalaman ini harus membolehkan mereka menghakimi kesesuaian setiap item atau soalan serta menjumpai kesalahankesalahan (Furst, 1972). Berikut adalah beberapa perkara penyemak semula harus semak: Semak jawaban-jawaban yang dihajatkan (untuk soalan esei) atau pilihan jawaban (untuk ujian objektif) berbanding soalan. Semak sekiranya ada item-item atau soalan-soalan yang bertindih. Semak set response set dimana tidak terdapat corak yang dapat dikenal pasti dalam satu siri respon untuk item ujian objektif. FASA 5: MENGHIMPUN Selepas soalan ditulis dan disemak semula, soalan-soalan itu harus dihimpunkan dalam suatu bentuk yang bermakna. Menurut Furst (1972), terdapat beberapa cara menghimpun soalan-soalan atau item-item: 1) mengikut bidang; 2) mengikut objektif; 3) mengikut bentuk; dan 4) Mengikut tahap kepayahan. Tidak ada satu cara penghimpunan yang secara sendirinya lebih baik daripada yang lain. Asalkan anda dapat memberi rational bagi pilihan anda, mana-mana cara penghimpunan tersebut dapat diterima. Mengikut bidang adalah apabila anda menghimpun soalan-soalan mengikut kandungan yang dicakupi oleh ujian. Sebagai contoh, kandungan yang diuji diambil daripada empat bidang (mungkin empat unit atau topik); adalah memudahkan bagi tujuan pemeriksaan (ataupun pemarkahan) dan membuat interpretasi tentang prestasi untuk menghimpun soalan-soalan mengikut empat bidang tersebut. Dalam setiap bidang, anda seterusnya boleh merombak soalan-soalan tadi ataupun menyusunnya mengikut tahap kepayahan ataupun mengikut objektif. Mengikut objektif adalah apabila anda menghimpun atau menyusun ikut turutan soalan-soalan mengikut objektif atau hasil pembelajaran. Sebagai contoh, anda mungkin menghimpun soalanan-soalan yang mengukur daya

7 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item ingatan fakta dan prinsip sementara sebuah kumpulan lain terdiri daripada soalan-soalan yang berkaitan aplikasi konsep dan prinsip. Mengikut bentuk adalah apabila anda menghimpun soalan-soalan mengikut jenis soalan. Sebagai contoh, Bahagian A mungkin terdiri daripada jenis soalan objektif sementara Bahagian B mungkin terdiri daripada soalan esei. Mengikut tahap kepayahan adalah apabila anda menghimpun mengikut tahap kepayahannya. Sebagai contoh, adalah menjadi amalan biasa untuk memulakan ujian dengan item-item senang bagi memberi pelajar peluang untuk memanaskan badan dan membina keyakinan. Ia juga menjarakkan tugasan agar pelajar boleh mengusahakan tugasan secara semakin mencabar sehingga ke had kebolehan mereka dan tidak disekat pada awal lagi disebabkan item-item susah.

FASA 6: REPRODUKSI Apabila ujian telah siap, langkah seterusnya adalah untuk menghasilkan semula atau membuat banyak salinan ujian untuk ditadbir. Walau bagaimanapun, isu membuat salinan ujian tidak timbul sekiranya anda mentadbir ujian tersebut secara atas talian. Pastikan cetakannya jelas, khususnya apabila grafik digunakan seperti gambar, gambarajah, formula, simbol-simbol matematik dan sebagainya. Misalnya, sekiranya gambar merupakan komponen penting sebuah soalan, semak sekiranya anda perlukan gambar berwarna ataupun gambar hitam putih sudah memadai. FASA 7: PENTADBIRAN UJIAN Matlamat pentadbiran ujian adalah untuk memastikan keadaan yang paling konsisten dengan tujuan ujian. Dalam kes ujian pencapaian, ini bermakna membentuk keadaan yang akan memastikan kerja yang paling cekap untuk pelajar yang mengambil ujian tersebut. Pentadbiran ujian boleh menjadi suatu aktiviti yang kompleks khususnya sekiranya ia melibatkan bilangan pelajar yang ramai. Keadaan yang betul Anda perlu memastikan bahawa semua keadaan fizikal menyokong kerja yang baik. Harus ada cahaya dan aliran udara yang mencukupi, suhu yang selesa, kesenyapan, kerusi yang selesa serta cukup ruang kerja agar pelajar dapat menebarkan bahan-bahan mereka. Sekiranya saiz kumpulan memerlukan penggunaan sebuah dewan atau auditorium, akustik harus memuaskan dan sebuah sistem PA harus digunakan. Prosedur melaksanakan ujian Pastikan semua butiran tentang prosedur dituliskan dan dibincang terlebih dahulu, dan ujian harus dilaksanakan dengan cermat. Bagi mengelakkan gangguan dan kekeliruan, bahan ujian harus diagihkan dan dikumpulkan mengikut rancangan. Sebagai peraturan menyeluruh, bahan tambahan atau sokongan harus diagihkan sebelum buku jawaban dan kertas soalan diagihkan. Senaraikan peraturan yang berkaitan dengan yang berikut: o Pelajar meminta penjelasan tentang arahan-arahan o Pelajar meminta takrif sesuatu konsep yang ada dalam soalan.

8 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item


8.1 AKTIVITI

a) Bincangkan bagaimana anda menyemak (atau memoderasi) kertas ujian atau peperiksaan dalam bidang anda. b) Adakah ada cara yang istimewa anda menghimpun soalansoalan ujian dalam bidang anda? c) Apakah masalah yang timbul semasa pentadbiran sebuah ujian atau peperiksaan dalam bidang anda? d) Sejauhmanakah sekolah atau institusi anda mengikut fasafasa penyediaan ujian yang telah dibincangkan?

8.2 APAKAH ANALISIS ITEM?

Setelah mentadbir ujian dan memeriksanya, ramai guru yang akan membincangkan jawaban dengan pelajar. Perbincangan selalunya tertumpu kepada jawaban yang betul dan kesalahan yang biasa dilakukan oleh pelajar. Ada juga guru yang menumpukan kepada soalan yang ramai pelajar menjawab dengan lemah serta soalan yang pelajar menjawab dengan baik. Walau bagaimanapun, terdapat lebih banyak maklumat information tentang sesebuah ujian yang selalu ditinggalkan oleh guru. Maklumat ini akan hanya timbul sekiranya Analisis Item dilakukan. Apakah analisis item? Analisis item merupakan suatu proses yang meneliti respon-respon pelajar terhadap setiap item atau soalan ujian bagi mentaksir mutu item-item tersebut dan ujian tersebut secara keseluruhan. Analisis item sangat bernilai dalam memperbaiki item-item atau soalan-soalan yang akan digunakan lagi dalam ujian-ujian kemudian, dan ia juga boleh digunakan untuk menolak item-itemyang kabur atau mengelirukan dalam sesebuah ujian. Khususnya, analisis item merupakan sebuah proses mencari indeks kepayahan, indeks diskriminasi dan keberkesanan pengganggu. [Kita akan membincangkan setiap component analisis item ini secara terperinci kemudian]. Mutu sesebuah ujian ditentukan oleh mutu setiap item atau soalan dalam ujian tersebut. Guru yang membina sebuah ujian hanya boleh menganggar secara kasar mutu ujian tersebut. Anggaran ini adalah berdasarkan hakikat bahawa guru telah menuruti semua peraturan dan syarat pembinaan ujian. Walau bagaimanapun, mungkin juga suatu anggaran tidak tepat dan beberapa aspek penting telah ditinggalkan. Dengan itu, adalah disarankan agar kita melaksanakan analisis item ke atas respon pelajar bagi mendapatkan kefahaman yang menyeluruh tentang ujian tersebut. Analisis item dilaksanakan untuk mendapatkan maklumat tentang setiap item

9 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item atau soalan dalam sebuah ujian dan bagaimana ujian tersebut dapat diperbaiki. Ia juga dapat membantu penggubalan sebuah bank item atau soalan (Anastasi, 2001). 8.2 LANGKAH-LANGKAH DALAM ANALISIS ITEM

Mari kita mengambil contoh seorang guru yang telah menjalankan sebuah ujian objektif dengan 30 item aneka pilihan dalam mata pelajaran geografi kepada 45 orang pelajar sekolah menengah. Langkah 1: Tentunya, selepas menerima buku jawaban, langkah pertama adalah untuk memeriksa setiap buku jawaban. Langkah 2: Susunkan 45 buku jawaban tadi daripada markah tertinggi kepada markah terendah yang diterima. Buku jawaban dengan markah tertinggi diletakkan di atas dan buku jawaban dengan markah terendah diletakkan di bawah. Langkah 3: Kalikan 45 (bilangan buku jawaban) dengan 0.27 (atau 27%) iaitu12.15 dan dibulatkan menjadi 12. Penggunaan nilai 0.27 atau 27% bukan tetap. Anda boleh menggunakan mana-mana peratusan daripada 27% sehingga 35% sebagai nilai. Langkah 4: Susunkan 45 buku jawaban tadi mengikut markah yang diterima (daripada markah tertinggi kepada markah terendah). Keluarkan 12 buku jawaban daripada atas longgokan tadi dan 12 buku jawaban daripada bawah longgokan. Kita gelarkan longgokan-longgokan ini sebagai pelajar markah tinggi dan pelajar markah rendah. Ketepikan buku-buku jawaban di pertengahan (21 buku jawaban). Walaupun ini boleh dimasukkan dalam analisis ini, dengan menggunakan hanya kumpulan tinggi dan rendah memudahkan prosedur ini. Langkah 5: Rujuk kepada Item #1 atau Soalan #1, Kira bilangan pelajar daripada kumpulan markah tinggi yang menjawab setiap pilihan (A, B, C atau D), Kira bilangan pelajar daripada kumpulan markah rendah yang menjawab pilihan A, B, C atau D (lihat Gambarajah 8.3).

10 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item

Soalan 1: Ujian Geografi Apakah nama kawasan subur dalam padang pasir dimana mata air sampai ke permukaan tanah? A. miraj B. oasis C. mata air D. polder Analisis Item Pilihan Kumpulan Markah Tinggi (n=12) Kumpulan Markah Rendah (n=12) A 0 3 B 11 2 C 1 3 D 0 4 Kosong 0 0

Jadual 8.3 Analisis Item Untuk Satu Item atau Soalan Daripada analisis ini, 11 pelajar daripada kumpulan Markah Tinggi dan 2 pelajar daripada kumpulan Markah Rendah memilih jawabanB iaiut jawaban yang betul. Ini bermakna bahawa 13 daripada 24 pelajar telah memilih jawaban yang betul. Dan juga, perhatikan bahawa pengganggu-pengganggu; A, C & D) telah dipilih oleh sekurang-kurangnya satu pelajar. Walau bagaimanapun, maklumat yang diberi dalam Gambarajah 8.1 tidak memadai dan analisis lanjut harus dilaksanakan.

8.3 INDEKS KEPAYAHAN

Dengan menggunakan maklumat yang diberi dalam Jadual 8.3, ada dapat menghitung Indeks Kepayahan iaitu suatu indikator kuantitatif tentang tahap kepayahan setiap item atau soalan. Ia dapat dihitung menggunakan formula berikut: Bilangan Pelajar Dengan Jawaban Betul (R) Indeks Kepayahan = (p) Bilangan Pelajar Yang Cuba Menjawab (T) R = T = 24 13 = 0.54

Apakah maksud Indeks Kepayahan (p) yang berjumlah 0.54? Indeks kepayahan merupakan pekali yang menunjukkan peratusan pelajar yang menjawab dengan betul berbanding bilangan pelajar dalam dua kumpulan tadi yang mendapat jawaban yang salah. Dalam erti kata lain, 54% pelajar telah memilih jawaban yang betul. Walaupun hitungan ini berdasarkan kumpulan markah tinggi dan rendah sahaja, ia memberikan

11 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item suatu anggaran yang hampir kepada anggaran yang mungkin dibuat dengan kesemua pelajar. Dengan itu, kita boleh katakana bahawa indeks kepayahan untuk item ini adalah 54% (untuk kumpulan ini). Perhatikan, oleh kerana kepayahan merujuk kepada peratusan yang menjawab item dengan betul, lebih kecil peratusan maka lebih payah item tersebut. Lien (1980) memberikan beberapa garispanduan tentang maksud indeks kepayahan seperti berikut (lihat Gambarajah 8.4):

> 0.70 0.30 0.69 < 0.29

= Mudah = Sederhana = Payah

Jadual 8.4 Interpretasi Indeks Kepayahan (p) Sekiranya seorang guru percaya bahawa pencapaian 0.54 dalam item tersebut adalah terlalu rendah, dia boleh mengubah cara dia mengajar bagi lebih memenuhi objektif yang diwakili oleh item tersebut. Satu lagi interpretasi ialah bahawa mungkin item itu terlalu susah atau mengelirukan, ataupun tidak sah, dan dalam kes ini guru mungkin menolak item tersebut atau mengubahnya, dengan menggunakan maklumat daripada samada indeks diskriminasi item atau analisis pengganggu.

8.1 AKTIVITI

Seorang guru telah memberikan sebuah ujian sains 20 item kepada sekumpulan 35 pelajar. Jawaban betul untuk Soalan #25 adalah C dan keputusannya adalah berikut: Pilihan A B C D Kosong Kump Markah Tinggi 0 2 8 2 0 (n= 10) Kump Markah Rendah 2 4 3 2 1 (n- 10) a) Hitungkan indeks kepayahan (p) untuk soalan #25. b) Adakah Soalan #25 sebuah soalan yang payah atau senang? c) Adakah anda berpendapat anda harus memperbaiki Soalan #25?

8.4 INDEKS THE DISKRIMINASI Indeks Diskriminasi merupakan ukuran asas yang menunjukkan sejauhmana sebuah soalan mengasingkan atau membezakan antara pelajar dalam kumpulan Markah Tinggi dan kumpulan Markah Rendah. Indeks ini boleh diinterpretasi sebagai suatu indikator sejauhmana keseluruhan pengetahuan tentang kandungan pelajaran atau penguasaan kemahiran dikaitkan dengan respon kepada sesebuah item. Yang paling penting dalam sebuah item ujian adalah samada seorang pelajar telah mendapat jawaban betul atau salah disebabkan pengetahuan atau kemahirannya dan

12 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item bukan disebabkan sesuatu perkara lain seperti nasib atau bias dalam ujian (Kubiszyn dan Borich, 2006) Perhatikan dalam contoh kita yang terdahulu, 11 dalam kumpulan markah tinggi dan 2 pelajar dalam kumpulan markah rendah telah memilih jawaban yang betul. Ini menunjukkan diskriminasi yang positif, kerana item tersebut membezakan antara pelajar dengan cara yang sama ujian keseluruhan juga berbuat demikian. Iaitu, pelajar dengan markah tinggi dalam ujian (kumpulan markah tinggi) telah lebih selalunya menjawab item tersebut dengan betul berbanding pelajar yang mendapat markah rendah (kumpulan markah rendah). Walaupun analisis melalui penelitian mungkin apa yang perlu dibuat untuk kebanyakan tujuan, indeks diskriminasi dapat dihitung menggunakan formula berikut dengan lebih mudah: Indeks Diskriminasi = Bilangan pelajar dalam kumpulan Markah Tinggi (RH ) dengan jawaban yang betul u) Tolak ( ) Bilangan pelajar dalam kumpulan Markah Rendah (RL ) dengan jawaban yang betul Bahagi dengan ( ) Separuh Jumplah Bilangan Pelajar yang Cuba Menjawab Soalan (T) Contoh: Sebuah ujian telah diberikan kepada sekumpulan 43 pelajar dan 10 daripada 13 orang dalam kumpulan Markah Tinggi telah mendapat jawaban tersebut dengan betul berbanding 5 daripada 13 orang dalam kumpulan Markah Rendah yang mendapat jawaban betul. Indeks diskriminasi tersebut dihitung seperti berikut: RH RL = T = (26) 10 5 = 13 10 5 = 0.38

Apakah maksud Indeks Diskriminasi 0.38? Indeks diskriminasi merupakan pekali yang menunjukkan sejauhmana soalan tersebut mengasingkan atau membezakan antara pelajar dengan Markah Tinggi dan pelajar dengan Markah Rendah. Blood dan Budd (1972) memberikan garispanduan berikut tentang maksud indeks diskriminasi (lihat Jadual 8.5): Value > 0.40 0.20 0.39 0.10 0.19 0.00 & negative Description high discrimination moderate discrimination low discrimination no discrimination Suggestion Question is retained Question is checked & revised Question is removed or rewritten Question is removed

Jadual 8.5 Interpretasi Indeks Diskriminasi

13 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item Sebuah soalan yang mempunyai indeks diskriminasi yang tinggi dapat membezakan antara pelajar yang tahu dan tidak tahu jawaban kepada soalan itu. Apabila kita mengatakan bahawa sebuah soalan mempunyai indeks diskriminasi yang rendah, ia tidak dapat membezakan antara pelajar yang tahu dan pelajar yang tidak tahu jawabannya. Indeks diskriminasi yang rendah bermaksud bahawa lebih ramai pelajar Markah Rendah mendapat jawaban betul kerana soalan tersebut terlalu mudah. Ia mungkin juga bermaksud bahawa pelajar daripada kedua-dua kumpulanMarkah Tinggi dan Markah Rendah mendapat jawaban salah disebabkan soalan tersebut terlalu payah. Formula untuk indeks diskriminasi mungkin tinggi sekiranya lebih ramai pelajar dalam kumpulan Markah Tinggi memilih jawaban yang betul berbanding pelajar dalam kumpulan Markah Rendah, dan nombor yang terhasil adalah positif. Sekurang-kurangnya, kita mengharapkan mendapat nilai positif, kerana ini menunjukkan bahawa jawaban betul itu adalah disebabkan kerana pengetahuan pelajar tentang kandungan. Lebih tinggi nilai positif (nilai hampir kepada 1.0), lebih kukuh perkaitan antara prestasi ujian keseluruhan dan prestasi dalam item tersebut. Sekiranya indeks diskriminasi adalah negatif, ini bermaksud bahawa pelajar yang mendapat markah rendah dalam ujian berkemunkinan lebih tinggi mendapat jawaban yang betul. Ini mungkin suatu situasi yang pelik yang menunjukkan kesahan yang lemah untuk item tersebut.

8.2 AKTIVITI

Seorang guru telah memberi sebuah ujian ekonomi dengan 35 item kepada 42 pelajar. Untuk Soalan #16, 8 daripada 11 pelajar kumpulanMarkah Tinggi telah mendapat jawaban betul berbanding 4 orang daripada 11 dalam kumpulan Markah Rendah yang mendapat jawaban betul. a) Hitungkan indeks diskriminasi untuk Soalan #16. b) Adakah Soalan #16 mempunyai indeks diskriminasi yang tinggi atau rendah?

8.5 PERKAITAN DISKRIMINASI

ANTARA

INDEKS

KEPAYAHAN

DAN

INDEKS

Secara Teori, lebih payah sebuah soalan (atau item) ataupun lebih senang sebuah soalan (atau item), lebih rendahlah indeks diskriminasinya. Stanley dan Hopkins (1972) mensyorkan sebuah model teori bagi menjelaskan hubungkait diantara indeks kepayahan dan indeks diskriminasi sesebuah soalan atau item (lihat Gambarajah 8.2). Menurut model tersebut, indeks kepayahan 0.2 mungkin membawa kepada indeks diskriminasi lebih kurang 0.3 untuk sebuah item (yang mungkin diterangkan sebagai sebuah item dengan diskriminasi yang sederhana). Perhatikan bahawa, sambil indeks kepayahan menaik daripada 0.1 kepada 0.5, indeks

14 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item diskriminasi menaik dengan lebih tinggi. Apabila indeks kepayahan mencapai 0.5 (dijelaskan sebagai sebuah item dengan kepayahan sederhana), indeks diskriminasi adalah positif 1.00 (diskriminasi yang tinggi). Yang menarik, indeks kepayahan > 0.5 membawa kepada indeks diskriminasi yang menurun.

1.00 0.90 0.80 0.70 Indeks Diskrimi -nasi 0.60 0.50 0.40 0.30 0.20 0.10 0.00 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Indeks Kepayahan Gambarajah 8.2 Hubungkait Teoretikal antara Inde Kepayahan dan Indeks Diskriminasi [sumber: G. Stanley dan D. Hopkins, 1972. Introduction to Educational Measurement and Testing. Boston: Macmillan. p.270] Soalan terlalu senang Soalan terlalu payah

Contohnya, indeks kepayahan 0.9 menghasilkan indeks diskriminasi lebih kurang 0.2 yang menerangkan item sebagai mempunyai diskriminasi rendah hingga sederhana. Apakah maksudnya? Lebih payah sesebuah soalan, lebih sukar untuk soalan atau item itu mengasingkan antara pelajar yang tahu dan tidak tahu jawaban kepada soalan itu. Sama juga, apabila indeks kepayahan adalah lebih kurang 0.1, indeks diskriminasi jatuh sehingga lebih kurang 0.2. Apakah maksudnya? Lebih mudah soalan itu, lebih sukar soalan atau item itu mengasingkan antara pelajar yang tahu dan yang tidak tahu jawaban kepada soalan itu.

15 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item

SEMAK KENDIRI 8.2

a) Apakah yang dapat anda rumuskan tentang perkaitan antara indeks kepayahan sebuah item dan indeks diskriminasinya? b) Adakah anda mempertimbangkan faktor-faktor ini semasa memberi sebuah ujian objektif kepada pelajar di sekolah anda?

8.6 ANALISIS PENGGANGGU

Tambahan kepada meneliti prestasi keseluruhan item ujian, guru juga ingin meneliti prestasi setiap pengganggu (pilihan jawaban yang tidak betul) pada item aneka pilihan. Dengan menghitung bahagian pelajar yang memilih setiap pilihan jawaban, guru dapat mengenal pasti pengganggu yang mana yang "bertugas" dan nampak menarik kepada pelajar yang tidak tahu jawaban betul, dan pengganggu yang mana sekadar mengisi ruang kosong dan tidak dipilih oleh ramai pelajar. Bagi mengelakkan pelajar meneka membuta tuli yang menghasilkan jawaban yang betul semata-mata kerana nasib (yang mengurangkan kesahan sesebuah item ujian), guru mahukan sebanyak mungkin pengganggu yang berkemungkinan. Analysis pilihan respon membolehkan guru memperincikan dan memperbaiki item-item yang mereka ingin gunakan lagi untuk kelas-kelas akan datang. Mari kita perincikan prestasi sebuah item atau soalan (lihat Jadual 8.6) Negara Eropah manakah yang menakluk Melaka dalam tahun 1511?
Portugis Belanda Spain Inggeris

Pilihan Kump Markah Tinggi (n=12) Kump Markah Rendah (n=12)

A 5 3

B 5 4

C 0 0

D 2 5

Tiada Respon 0 0

Jadual 8.6 Keberkesanan Pengganggu Umumnya, sebuah pengganggu harus boleh menarik lebih ramai pelajar Markah Rendah untuk memilih respon itu ataupun mengganggu pelajar Markah Rendah untuk menjawab sesuatu respon tertentu. Apakah yang menentukan keberkesanan sesebuah pengganggu? Lihat Gambarajah 8.5 yang menunjukkan bagaimana 24 pelajar memilih jawaban A, B, C dan D untuk sesuatu soalan. Pilihan B adalah sebuah pengganggu yang kurang berkesan kerana ramai pelajar Markah Tinggi (n = 5) telah memilih pilihan B. Pilihan D adalah suatu pengganggu yang lebih baik kerana 2 pelajar daripada kumpulan Markah Tinggi dan 5 pelajar daripada kumpulan Markah Rendah memilih pilihan ini. Analisis pilihan respon ini menunjukkan bahawa mereka yang tersalah dalam item itu mungkin memilih pilihan B atau D. Tiada pelajar memilih pilihan C. Pilihan C tidak bertindak sebagai sebuah

16 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item pengganggu yang baik. Sebenarnya pelajar tidak memilih daripada empat pilihan dalam item ini, mereka hanya memilih daripada tiga pilihan, kerana mereka tidak langsung mempertimbangkan pilihan C. Ini menjadikan meneka jawaban dengan betul lebih berkemungkinan, yang akan mengurangkan kesahan item tersebut. Indeks diskriminasi boleh diperbaiki dengan mengubah dan memperbaiki pilihan B dan C.

8.3 AKTIVITI

Residen British yang manakah yang dibunuh oleh Maharajalela di Pasir Salak? H. Low Birch Brooke Gurney Pilihan A B C D Tiada Respon Mark Tinggi (n=15) 4 7 0 4 0 Markah Rendah (n=15) 6 3 2 4 0 Jawaban adalah B. Analisis keberkesanan pengganggu-penggangu.

8.7 PENDEKATAN PRAKTIKAL DALAM ANALISIS ITEM

Ada guru medapati teknik-teknik yang dibincangkan terlebih dahulu mengambil masa dan ini tidak dapat dinafikan (lebih-lebih lagi jika anda mempunyai ujian dengan 40 item). Walau bagaimanapun, ada suatu pendekatan yang lebih practikal yang mengambil kurang masa. Bayangkan anda telah mentabir sebuah ujian dengan 40 item kepada sebuah kelas dengan 30 pelajar. Tentunya, untuk menganalisis keberkesanan setiap item akan mengambil masa dan mungkin akan menghalang guru daripada menganalisis setiap item dalam ujian tersebut. Diederich (1971) mensyorkan suatu kaedah analisis item yang boleh dilakukan oleh guru dan pelajar di dalam kelas. Berikut adalah langkah-langkahnya: Langkah 1: Susunkan 30 buku jawaban daripada markah tertinggi sehingga ke markah terendah yang diterima. Langkah 2: Pilih buku jawaban yang menerima markah pertengahan. Himpunkan kesemua buku jawaban yang mendapat jawaban lebih tinggi daripada itu sebagai Markah Tinggi (catatkan T pada buku-buku jawaban ini). Himpunkan semua buku jawaban di bawah markah ini sebagai kumpulan Markah Rendah (Tandakan dengan R pada buku-buku jawaban tersebut). Langkah 3: Bahagikan kelas kepada dua kumpulan (Tinggi dan Rendah) dan agihkan buku jawaban Tinggi kepada kumpulan Tinggi dan buku jawaban Rendah kepada kumpulan Rendah. Lantik seorang pelajar daripada setiap kumpulan tadi menjadi penghitung.

17 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item

Langkah 3: Seterusnya guru bertanya pelajar. Guru: Jawaban untuk Soalan #1 adalah C dan siapa yang mendapat betul, angkat tangan kamu. Penghitung daripada kumpulan T: Empat belas daripada kumpulan T Penghitung daripada kumpulanR: Lapan daripada kumpulan R Langkah 4: Guru mencatat respon-respon tadi pada papan putih seperti berikut: Tinggi 14 12 16 Rendah 8 6 7 Jumlah Jawaban Betul 22 18 23

Soalan #1 Soalan #2 Soalan #3 | | Soalan #n

Langkah 5: Hitungkan Indeks Kepayahan untuk Soalan #1 seperti berikut: RT + RR Indeks Kepayahan = 30 = 30 14 + 8 = 0.73

Langkah 5: Hitungkan Indeks Diskriminasi untuk Soalan #1 seperti berikut: RT RR Indeks Diskriminasi = = 14 8 = 15 15 6 = 0.40

30

Perhatikan bahawa terlebih awal, kita telah mengambil 27% daripada buku jawaban dalam kumpulanMarkah Tinggi dan 27% buku jawaban dalam kumpulan Markah Rendah daripada keseluruhan buku jawaban. Walau bagaimanapun, dalam pendekatan ini kita membahagikan jumlah kesemua buku jawaban kepada dua kumpulan. Tidak ada kumpulan pertengahan. Yang penting adalah menggunakan pecahan kumpulan yang cukup besar untuk memberi maklumat yang berguna. Memilih yang atas dan bawah 27 peratus daipada kumpulan adalah disyorkan bagi mendapatkan suatu analisis yang lebih jitu. Kaedah ini mungkin kurang tepat tetapi ia merupakan suatu kaedah yang cepat.
8.4 AKTIVITI

Bandingkan indeks kepayahan dan indeks diskriminasi yang didapati menggunakan kaedah kasar ini dengan model teoretikal oleh Stanley Hopkins dalam Gambarajah 8.4. Adakah indeks-indeks tersebut jauh berbeza?

18 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item 8.8 BANK ITEM

Sebuah Bank Item merupakan suatu koleksi soalan-soalan atau item-item yang telah ditadbir dalam masa yang panjang. Untuk ujian pencapaian yang mentaksir prestasi dalam suatu bidang pengetahuan seperti geografi, sejarah, kimia atau matematik, soalan-soalan yang boleh disoal agak terhad. Dengan itu, tidak hairanlah sekiranya soalan-soalan yang pernah digunakandikitar semula dengan beberapa perubahan kecil dan ditadbir kepada sebuah kumpulan pelajar yang lain. Membuat item-item ujian yang baik bukanlah suatu tugasan yang mudah dan boleh mengambil maa kepada guru. Sebuah bank item atau soalan dapat membantu guru. Sebuah bank item terdiri daripada soalan-soalan yang telah dianalisis dan disimpan sebab mereka merupakan item-item yang baik. Setiap item yang disimpan akan mempunyai maklumat tentang indeks kepayahan dan indeks diskriminasinya. Setiap item disimpan mengikut apa yang diukurnya, khususnya berkaitan topik-topik dalam kurikulum. Item-item ini akan disimpan dalam bentuk jadual spesifikasi yang mengindikasi kandungan yang diukur serta tahap kognitif yang diukur. Contohnya, anda akan dapat mengeluarkan daripada bank item, item-item yang mengukur aplikasi konsep untuk topik tentang Letrik. Anda juga akan dapat mengeluarkan item-item dengan tahap yang berbeza daripada bank tersebut. Kemungkinan, anda ingin menyusun soalan-soalan yang lebih mudah pada permulaan ujian agar dapat membina keyakinan pelajar dan memberi soalan-soalan yang lebih susah secara beransur. Dengan database berkomputer, bank-bank item adalah mudah dicapai. Guru akan mempunyai beratus-ratus item tersedia daripada mana mereka dapat keluarkan item-item semasa membina ujian kelas. Ini tentunya akan membantu guru dengan tugasan remeh membina item-item atau soalan-soalan daripada mula yang selalunya mengambil masa. Namun begitu, tidak banyak institusi-institusi pendidikan bersedia dengan bank item seperti itu. Amalan yang lebih biasa adalah untuk guru memilih item-item atau soalan-soalan daripada buku-buku kerja yang disediakan secara komersial, kertas-kertas soalan peperiksaan yang lepas dan sampel item-item daripada buku teks. Sumber-sumber ini tidak mempunyai maklumat tentang indeks kepayahan dan indeks diskriminasi item-item tersebut, dan tiada juga maklumat tentang tahap kognitif soalan-soalan tersebut ataupun apa yang ia ingin mengukur. Guru-guru akan terpaksa memikirkan sendiri ciri-ciri item-item berdasarkan pengalaman mereka dalam mengajar kandungan tersebut.

8.5 AKTIVITI

a) Sejauhmanakah sekolah-sekolah di Malaysia mempunyai item bank? Jelaskan. b) Adakah anda berpendapat bahawa guru harus mempunyai capaian kepada bank item berkomputer? Jelaskan.

19 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item RINGKASAN

Sebuah ujian yang baik adalah hasil daripada perancangan yang cermat dan teliti. Perancangan dilaksanakan melalui fasa-fasa berikut: memperjelaskan tujuan, menyediakan jadual spesifikasi, menentukan format ujian, menyemak semula, menghimpun, mereproduksi dan menyediakan garispanduan untuk pentadbiran. Analisis item merupakan suatu proses yang meneliti respon-respon setiap item atau soalan ujian agar dapat mentaksir mutu item-item tersebut dan ujian secara keseluruhan. Analisis item dijalankan untuk mendapatkan maklumat tentang setiap item atau soalan dalam ujian dan bagaimana ujian tersebut dapat diperbaiki. Indeks Kepayahan merupakan suatu indikator kuantitatif tentang tahap kepayahan sesebuah item atau soalan. Indeks Diskriminasi merupakan suatu ukuran asas yang menunjukkan sejauhmana sebuah soalan mengasingkan atau membezakan antara pelajar dalam kumpulan Markah Tinggi dan kumpulan Markah Rendah. Secara teori, lebih payah sebuah soalan (atau item) ataupun lebih senang sebuah soalan (atau item), lebih rendah indeks diskriminasi. Dengan menghitung proporsi pelajar yang memilih setiap pilihan jawaban, guru dapat mengenal pasti pengganggu yang mana "bertugas" dan nampak menarik kepada pelajar yang tidak tahu jawaban betul, dan pengganggu yang mana sekadar mengisi ruang dan tidak dipilih oleh pelajar. Umumnya, sebuah pengganggu yang baik dapat menarik lebih ramai pelajar Markah Rendah untuk memilih respon tersebut atau mengganggu pelajar Markah Rendah agar memilih respon tersebut. Sebuah Bank Item merupakan sebuah koleksi soalan-soalan atau item-item yang telah ditadbir dalam masa yang lama.

ISTILAH PENTING Menyedia ujian Menyemak semula Menghimpun Reproduksi Jadual Spesifikasi Analisis Item Bank Item Indeks Diskriminasi Data Bank Berkomputer Indeks Kepayahan Pengganggu yang baik Soalan Payah Analisis Pengganggu

20 Bab 8: Peyediaan Ujian, Pentadbiran dan Analisis Item

RUJUKAN: Anastasi, A. (2001). Psychological Testing. New York, New York: MacMillan Publishing Company. Ebel. L. (1979). Essentials of educational measurement. Englewood Cliff, NJ: Prentice-Hall. Kubiszyn, T. & G. Borich (2006). Educational Testing and Measurement: Classroom Application and Practice. New Jersey: Wiley Gronlund, N. (1988). How to construct achievement tests. Engelwood Cliffs, NJ: Prentice-Hall. Furst, J. (1972). Constructing evaluation instruments. New York: Longmans Nitko, A.J. (2004). Educational assessments of students. Englewood Cliffs, NJ: Prentice-Hall. Stanley, G. and D. Hopkins (1972). Introduction measurement and testing. Boston: Macmillan. to educational

Anda mungkin juga menyukai