Anda di halaman 1dari 11

TAJUK 8

ANALISIS ITEM UJIAN

1.1

Sinopsis Kursus ini menekankan kefahaman kaedah menganalisis item ujian

Hasil Pembelajaran 1. 2. Membina dan menilai soalan berdasarkan Indeks Kesukaran Membina dan menilai soalan berdasarkan Indeks Diskriminasi

8.1

Analisis Item Ujian

Analisis Item Ujian

Aras Kesukaran Item Aras Diskriminasi Item

Analisis Item ialah satu proses menganalisis secara statistik tindak balas calon terhadap setiap item dalam sesuatu ujian untuk membuat pertimbangan mengenai kualiti dan keberkesanan item-item tersebut. Ia memberi maklumat kepada kita mengenai bagaimana sesuatu item itu akan berfungsi dalam ujian. Secara khusus melalui analisis item, kita akan mengetahui aras kesukaran dan aras diskriminasi item tersebut.

8.1.1 Aras/indeks Kesukaran Item

Item boleh dianalisis, secara empirikal, berdasarkan jawapan yang diberi untuk mengetahui kekuatan dan kelemahan item. Hasil item analisis boleh digunakan untuk memperbaiki kualiti item berkenaan. Ciri pertama yang dapat menentukan kualiti sesuatu item ujian ialah indeks kesukaran item (item difficulty index, p). Indeks ini dapat menunjukkan aras kesukaran sesuatu item, iaitu sama ada sesuatu item itu mudah dijawab atau susah dijawab. Bagi ujian berbentuk objektif (betul/salah, isi tempat kosong, padanan, beraneka pilihan), indeks ini dikira dengan menggunakan nisbah bilangan calon yang memberi jawapan betul bagi item tertentu kepada jumlah calon yang menjawab item tersebut. Pengiraannya adalah seperti persamaan berikut:

Sekiranya satu soalan dapat dijawab dengan betul oleh 20 orang pelajar daripada sejumlah 40 orang pelajar yang menjawab soalan tersebut. Nilai p bagi soalan ini ialah 20/40 = 0.50. Nilai p ialah antara 0.00 hingga 1.00.

Sekiranya tiada seorang pelajar pun dapat menjawab dengan betul, maka nilai p akan menjadi 0 (soalan amat sukar), tetapi jika semua pelajar dapat menjawab dengan betul, nilai p akan menjadi 1 (soalan terlalu mudah). Secara statistik, Indeks Kesukaran mempunyai nilai di antara 0.0 dan 1.0. Indeks yang bernilai tinggi menunjukkan item itu senang, dan indeks yang bernilai rendah menunjukkan item itu sukar. Justeru, item yang sukar mempunyai nilai p yang rendah, sebaliknya item yang mudah/senang mempunyai nilai p yang tinggi, seperti yang ditunjukkan dalam Rajah 8.1.

Rajah 8.1: Indeks kesukaran item Item A mendapat respons betul oleh 50 daripada 80 orang pelajar, sementara Item B mendapat respons betul oleh 20 daripada 40 orang pelajar. Item mana yang lebih sukar?

Dari segi kesesuaian soalan ujian rujukan norma, pembina soalan perlu diingatkan bahawa soalan yang terlalu mudah/senang ( p > 0.85) atau soalan yang terlalu sukar (p < 0.15) tidak dapat memberikan maklumat psikometrik (ukuran psikologi) yang bermakna. Ini adalah disebabkan soalan yang terlalu mudah akan dapat dijawab oleh hampir semua pelajar, sementara soalan yang terlalu sukar tidak akan dapat dijawab oleh hampir semua pelajar. Justeru, soalan-soalan tidak dapat membezakan pelajar

yang lebih rendah keupayaan dengan yang lebih tinggi keupayaan. Sebagai panduan, aras kesukaran item boleh ditafsirkan mengikut nilai p seperti yang ditunjukkan dalam Jadual 8.1. Jadual 8.1 : Aras Kesukaran dan Pengkelasan Item Nilai p 0.00 0.20 0.21 0.40 0.41 0.60 0.61 0.80 0.81 1.00 Pengkelasan Item terlalu sukar sukar sederhana senang senang terlalu senang

Bagi ujian objektif, indeks kesukaran menggambarkan peratusan pelajar yang menjawab sesuatu item dengan betul. Lebih tinggi peratusan pelajar menjawab sesuatu item dengan betul, lebih mudahlah item tersebut (Wood, 1960). Item yang dijawab dengan betul oleh 85% pelajar akan mempunyai nilai p = 0.85, manakala item yang dijawab dengan betul oleh 50% pelajar akan mempunyai nilai p = 0.50. Sebaliknya, indeks kesukaran item boleh memberi jangkaan peratus pelajar yang dapat menjawab item tersebut dengan betul. Misalnya, jika indeks kesukaran bagi sesuatu item ialah 0.65, ini bermakna 65% pelajar akan dapat menjawab item tersebut dengan betul

Sebagai ingatan, nilai p merupakan nilai yang relatif kepada sesuatu kumpulan pelajar yang mengambil ujian. Nilai ini boleh berubah mengikut keupayaan kumpulan pelajar tersebut, dan seterusnya boleh berubah sekiranya kumpulan calon yang sama menduduki ujian kali kedua. Sebagai contoh, item manakah lebih sukar antara Siapakah Tun Abdullah Ahmad Badawi? dan Siapakah Tun Dr. Mahathir Mohamed?. Kita tidak boleh menyatakan item mana yang lebih sukar selepas membaca soalan ini. Kita hanya boleh menentukan kesukaran soalan ini selepas kita

mentadbirkannya kepada sekumpulan pelajar dan mengira nilai p bagi soalan ini. Bagi item subjektif (esei); yang markahnya mengambil nilai 0, 1, 2, 3, ; indeks kesukarannya boleh dikira sebagai nisbah markah purata (markah min) kepada julat markah penuh seperti berikut (Nitko, 2004: 317):

Sebagai contoh, suatu item ujian esei berjawapan pendek diberi markah minimum 0 dan maksimum 10. Sepuluh (10) orang pelajar (P) telah menjawab soalan ini dan mendapat markah seperti dalam jadual di bawah. Jumlah markah bagi 10 orang pelajar ialah 63.0. Pengiran indeks kesukaran item ialah seperti berikut:

Pelajar

P1

P2 3.5

P3 7.0

P4 2.5

P5 4.5

P6 8.5

P7 9.0

P8 6.5

P9 9.5

P10 Jumlah 5.5 63.0

Markah 6.5

Berbeza daripada indeks kesukaran item objektif, indeks kesukaran item subjektif dapat menggambarkan markah purata bagi sesuatu item dalam peratus. Contohnya, markah purata 6.3 (daripada 10) ialah 63% (iaitu sama dengan indeks kesukaran didarabkan dengan 100).

Seterusnya, indeks kesukaran item yang dapat menghasilkan indeks diskriminasi item (akan dibincangkan kemudian) yang maksimum ialah

antara 0.50 hingga 0.85, bergantung kepada format item. Indeks kesukaran tersebut ialah 0.50 bagi item berjawapan

pendek/melengkap, 0.70 bagi item objektif lima-opsyen, 0.74 bagi item objektif empat-opsyen, 0.77 bagi item objektif tiga-opsyen, dan 0.85 bagi item objektif dua-opsyen (betul/salah) [Lord (1952) dalam Mehrens & Lehmann (1991)]. Selain itu, Nitko (2004: 323) menyatakan indeks kesukaran bagi item- item ujian yang mengukur satu jenis keupayaan (contohnya, membaca) haruslah antara 0.16 dan 0.84 (iaitu ada item-item mudah, sederhana sukar dan sukar); sementara bagi item-item ujian yang mengukur dua jenis keupayaan (contohnya, membaca dan menulis) haruslah mempunyai indeks kesukaran item antara 0.40 hingga 0.60 (item-item sederhana sukar).

Satu item subjektif diberi markah satu dan maksimum lima. Markah lima orang pelajar ialah 3,2,4,2,5. Kira indeks kesukaran item ini. Adakah ia mudah atau susah?

Selain

menjadi

panduan

semasa

membina

item

supaya

indeks

diskriminasi menjadi maksimum, indek kesukaran juga boleh digunakan untuk tujuan-tujuan seperti dalam Jadual 8.2:

Jadual 8.2: Tujuan Indeks Kesukaran Prinsip 1 Penerangan Mengenal pasti konsep yang perlu diajar semula, iaitu apabila guru mendapati soalan-soalan berkenaan tidak dapat dijawab oleh sebahagian besar pelajar (soalan sukar) Mengenal pasti dan melaporkan kekuatan dan kelemahan bahagian-bahagian kurikulum, iaitu yang boleh dikuasai pelajar dan yang tidak boleh dikuasai pelajar Memberi maklum balas kepada pelajar tentang kekuatan dan kelemahan mereka bagi setiap tajuk pengajaran yang diuji Mengenal pasti soalan yang biasa kepada sesuatu kandungan (content bias), seperti kandungan yang ditekankan semasa pengajaran (misalnya, diberi latih tubi/ulangan)

3 4

8.1.2 Aras/Indeks Diskriminasi Item

Salah satu daripada tujuan ujian ialah untuk mengenal pasti calon/pelajar yang berkeupayaan tinggi, untuk matlamat tertentu, seperti melanjutkan pengajian dalam bidang tertentu. Item/soalan yang baik akan dapat membezakan/ mendiskriminasikan antara mereka yang berkeupayaan rendah dan yang berkeupayaan tinggi. Indeks yang diguna untuk menentukan perbezaan keupayaan pelajar ini ialah indeks diskriminasi item. Indeks Diskriminasi boleh dikira melalui langkah-langkah Mehrens & Lehmann (1991) seperti berikut: a. Membahagikan pelajar kepada tiga (3) kumpulan, iaitu pelajar berpencapaian rendah (27% pelajar berpencapaian terendah), pelajar berpencapaian sederhana (46% pelajar berpencapaian antara terendah dan tertinggi) dan pelajar berpencapaian tinggi (27% pelajar berpencapaian tertinggi). b. Mengira bilangan pelajar yang menjawab dengan betul di kalangan pelajar berpencapaian rendah (RL Right Lower), bilangan pelajar yang menjawab dengan betul di kalangan pelajar berpencapaian

tinggi (RU Right Upper) dan jumlah pelajar berpencapaian rendah dan tinggi (T(L+U) Total). c. Indeks Diskriminasi boleh dikira dengan membahagikan perbezaan (RU RL) dengan separuh T(L+U) seperti berikut:

d.

Sebagai contoh, andaikan seramai 200 orang pelajar menjawab soalan tertentu. Setelah 54 orang (27% daripada 200) pelajar berpencapaian tinggi dikenal pasti, didapati 45 orang daripada mereka dapat menjawab soalan tersebut dengan betul (R U = 45). Seterusnya, daripada 54 orang pelajar berpencapaian rendah, seramai 15 orang dapat menjawab dengan betul (RL = 15). Dalam contoh ini, jumlah pelajar berpencapaian rendah dan tinggi ialah 108 orang (T = 54 + 54 = 108). Indeks Diskriminasi boleh dikira seperti berikut:

e.

Dalam contoh ini, Indeks Diskriminasi boleh bernilai 1.00, sekiranya semua pelajar berpencapaian tinggi dan tiada seorang pun pelajar berpencapaian rendah dapat menjawab soalan ini dengan betul (RU RL = 54 0 = 54):

f.

Indeks Diskriminasi boleh bernilai 0.00, sekiranya bilangan pelajar berpencapaian tinggi dan rendah yang dapat menjawab soalan ini dengan betul adalah sama (R R = 0).

g.

Akhirnya, Indeks Diskriminasi boleh bernilai 1.00, sekiranya semua pelajar berpencapaian rendah dan tiada seorang pun pelajar berpencapaian tinggi dapat menjawab soalan ini dengan betul (RU RL = 0 54 = 54).

Item yang mempunyai Indeks Diskriminasi positif menunjukkan pelajar berpencapaian tinggi lebih ramai dapat menjawab sesuatu soalan dengan betul daripada pelajar berpencapaian rendah. Nilai Indeks Diskriminasi hampir kepada 1.00 bermakna soalan tersebut baik untuk Penilaian Rujukan Norma (PRN) sebab ia membezakan pelajar berpencapaian tinggi daripada pelajar berpencapaian rendah. Soalan yang mempunyai Indeks Diskriminasi positif menghampiri 0.00 dikatakan tidak baik untuk PRN kerana ia tidak berupaya membezakan pelajar pandai dan lemah manakala Indeks Diskriminasi negatif yang menghampiri -1.00 soalannya dikatakan tidak baik untuk PRN sebab secara songsang membezakan pelajar pandai daripada pelajar lemah. Pembina soalan perlu memperbaiki atau menggantikan soalan yang mempunyai Indeks Diskriminasi rendah atau negatif. Jadual 5.3 olah dijadikan panduan dalam mentafsir aras kesukaran soalan.

Jadual 8.3: Aras Diskriminasi dan Pengkelasan Item Nilai (d) 0.00 0.10 0.11 0.20 0.21 0.30 0.31 0.40 0.41 1.00 Pengkelasan Item Tidak baik Kurang baik Sederhana baik Baik Sangat baik

Menurut Hanna dan Dettmer (2004: 252), soalan-soalan yang dibina oleh guru hanya mempunyai Indeks Kesukaran antara 0.00 hingga 0.50. Walaubagaimanapun, menurut Mehrens dan Lehmann (1991), Indeks Diskriminasi untuk soalan-soalan ujian di bilik darjah perlu melebihi 0.20, sekiranya pencapaian pelajar dibahagikan kepada dua (separuh

berpencapaian rendah, separuh berpencapaian tinggi). Indeks ini sepatutnya lebih tinggi daripada 0.20, sekiranya pelajar dibahagikan kepada 27% berpencapaian rendah dan 27% berpencapaian tingggi. Seterusnya, Nitko (2004: 323) menyatakan item yang boleh dipilih untuk sesuatu ujian hendaklah mempunyai Indeks Diskriminasi melebihi 0.30. Justeru, sebagai kesimpulan, item/soalan yang baik untuk sesuatu ujian perlu mempunyai Indeks Diskriminasi melebihi 0.30.

Walaubagaimanapun, Indeks Diskriminasi yang lebih tinggi diperlukan untuk ujian-ujian PRN. Akhirnya, seperti juga Indeks Kesukaran, selain menjadi panduan semasa membina item, Indek Diskriminasi juga boleh digunakan untuk lima tujuan seperti dalam Jadual 8.4.

Jadual 8.4: Tujuan Indeks Diskriminasi Tujuan 1 Penerangan Mengenal pasti konsep yang perlu diajar semula, iaitu apabila guru mendapati soalan-soalan berkenaan tidak dapat dijawab oleh sebahagian besar pelajar pandai Mengenal pasti dan melaporkan kekuatan dan kelemahan bahagian-bahagian kurikulum, iaitu yang tidak boleh dikuasai pelajar pandai Memberi maklum balas kepada pelajar pandai tentang kelemahan mereka bagi setiap tajuk pengajaran yang diuji Mengenal pasti soalan yang bias kepada sesuatu kandungan, seperti kandungan yang tidak ditekankan semasa pengajaran atau langsung tidak diajar Mengenal pasti pelajar-pelajar yang berpencapaian tinggi untuk melanjutkan pengajian dalam bidangbidang tertentu Seramai 40 dari 50 orang pelajar berpencapaian rendah dapat menjawab satu soalan objektif dengan betul sementara 20 daripada 50 orang pelajar berpencapaian tinggi dapat menjawab soalan ini dengan betul. kira indeks diskriminasi soalan ini dan jelaskan

kesesuaiannya.