Zamri Mahamod, Mohd Sarifuddin Mat Salleh & Anita Abdul Rahman
Fakulti Pendidikan
Universiti Kebangsaan Malaysia
43600 Bangi, Selangor.
d-zam@ukm.my, 019-3952626
ABSTRAK
Kajian ini bertujuan untuk mengukur ketepatan Model Rasch dalam mengukur
item soalan peperiksaan Bahasa Melayu bagi peringkat Penilaian Menengah
Rendah dari tahun 2005 – 2007 serta dan mengaitkannya dengan aras Taksonomi
Bloom. Sampel kajian terdiri daripada 50 orang pelajar Tingkatan 3 yang
menduduki peperiksaan pada tahun 2007. Kumpulan pelajar ini menjawab soalan
peperiksaan tahun 2005 dan 2006 sebelum menduduki peperiksaan sebenar,
manakala jawapan soalan tahun 2007 diperoleh selepas pelajar menduduki
peperiksaan sebenar pada tahun tersebut. Data kajian diproses dalam perisian
SPSS versi 11.5 dan seterusnya dianalisis menggunakan program Winsteps
3.57.2 yang mengaplikasikan Model Analisis Rasch. Hasil analisis menunjukkan
taburan kesukaran item bagi soalan PMR 2005, 2006 dan 2007 mencapai aras
1.00, iaitu menunjukkan nilai kesahan yang sangat tinggi. Indeks
kebolehpercayaan item yang dihasilkan juga menunjukkan nilai yang sangat
boleh dipercayai iaitu melebihi 0.80. Tahun 2005 menunjukkan nilai 0.82 , tahun
2006 (0.84) dan tahun 2007 (0.92). Item kajian pada tahun 2005 tersebar pada
skala logit aras maksimum (3.07), minimum (-2.74), tahun 2006 maksimum
(4.25), minimum (-2.28), dan tahun 2007 maksimum (4.50), minimum (-2.75).
Aras kesukaran item kajian tersebar mengikut kedudukan aras Taksonomi Bloom
berdasarkan terdapatnya taburan item paling sukar dan paling mudah serta
lebihan soalan yang lain berada dalam kategori sederhana. Kesimpulannya,
kajian ini menunjukkan peperiksaan PMR Kertas I Bahasa Melayu untuk tahun
2005, 2006 dan 2007 benar-benar dapat menguji tahap kebolehan kepelbagaian
pelajar berdasarkan aras taburan kesukaran item yang ditunjukkan.
Abstract: The purposes of this study are to measure the item difficulty of the
questions of Bahasa Melayu Paper 1, Penilaian Menengah Rendah (PMR) year
2005, 2006 and 2007 and to relate it with the Taxonomy Bloom item difficulty
level. The subjects are 50 form 3 students who sat for the examination in year
2007. These subjects have sat for an examination in the year 2005 and 2006
before sitting for the actual examination and the answers obtained for this
research was from the actual examination sat in the year 2007. The data is
processed with the SPSS system, version 11.5 and it is analyzed with the use of
the Winsteps 3.57.2 program. The validity and reliability was tested through
Rasch Analysis Model. The results of the analysis shows the Infit MNSQ value for
1
Zamri Mahamo, Mohd Sarifuddin Mat Salleh & Anita Abdul Rahman
the year 2005, 2006 and 2007 reaches a very high validity level of 1.00. The
reliability index proves a very high value which is above .80. Examination item of
the year 2005, the reliability index shows 0.82, year 2006 (0.84) and year 2007
(0.92). Examination item of the year 2005 shows the maximum logit scale of
(3.07), minimum scale is (-1.74), and year 2006 the maximum scale is (4.25),
minimum is (-2.28) and year 2007 maximum scale is (4.50), and minimum is (-
2.75). Taken as a whole, item difficulty of this research as according to the level
of Taxonomy Bloom, it proves that the items are categorized as most difficult
items, easiest items and the remainder items are in the medium category. By
conclusion, the results of this study proves that the Bahasa Melayu Paper 1, PMR
examination of the year 2005, 2006 and 2007 is valid in testing students
proficiency as according to the level of item difficulty.
PENGENALAN
PERNYATAAN MASALAH
3
Zamri Mahamo, Mohd Sarifuddin Mat Salleh & Anita Abdul Rahman
TUJUAN KAJIAN
Kajian ini bertujuan untuk melihat taburan kesukaran item soalan Bahasa Melayu
PMR Kertas I tahun 2005, 2006 dan 2007 dan akan dibuat satu perbandingan
berdasarkan susunan aras Taksonomi Bloom. Secara khusus, tujuan kajian ini
adalah untuk:
1. Mengenal pasti kesahan dan kebolehpercayaan soalan peperiksaan PMR
bagi tahun 2005, 2006 dan 2007
2. Mengenal pasti taburan aras kesukaran item soalan peperiksaan PMR
bagi tahun 2005, 2006 dan 2007.
3. Mengenal pasti bentuk-bentuk soalan yang sukar bagi peperiksaan PMR
bagi tahun 2005, 2006 dan 2007 dan kaitannya dengan Taksonomi
Bloom.
PERSOALAN KAJIAN
METODOLOGI
2006 dan 2007. Pelajar terlibat adalah pelajar yang menduduki peperiksaan PMR
pada tahun 2007. Pelajar terbabit dikehendaki menjawab soalan peperiksaan
PMR Bahasa Melayu Kertas 1 untuk tahun 2005 dan 2006 sebelum menghadapi
peperiksaan sebenar pada tahun tersebut. Pelajar-pelajar ini, menjawab soalan-
soalan tersebut setelah selesai sukatan pelajaran menengah rendah, iaitu sebelum
pelajar menduduki peperiksaan sebenar PMR untuk tahun 2007. Manakala untuk
kertas soalan tahun 2007, pelajar terbabit dikehendaki menanda semula jawapan
yang telah dijawab dalam pepriksaan sebenar setelah selesai menghadapi
peperiksaan PMR pada tahun tersebut.
Instrumen kajian yang digunakan dalam kajian ini ialah soalan
peperiksaan PMR Bahasa Melayu Kertas 1 yang dikendalikan oleh Lembaga
Peperiksaan Malaysia (LPM) untuk tahun 2005, 2006 dan 2007. Dalam hal ini,
kajian rintis tidak dijalankan terhadap instrumen kajian memandangkan
instrumen tersebut telah diterima pakai di seluruh sekolah di Malaysia.
Pemilihan soalan berdasarkan tahun 2005, 2006 dan 2007 disebabkan pada tahun
2005 bermulanya format baru peperiksaan PMR untuk soalan Bahasa Melayu
Kertas 1 dan Kertas 2 (Format Pentaksiran PMR 2005). Ini bermaksud, soalan-
soalan sebelumnya adalah tidak sama dari segi formatnya sama ada bilangan
soalan, ataupun kandungan pemberatan soalan yang berbeza. Pemilihan soalan
yang sama formatnya bermula soalan tahun 2005, 2006 dan 2007 bertujuan untuk
dibuat perbandingan taburan indeks kesukaran antara soalan tersebut.
Sebelum analisis prestasi responden dilakukan, respons setiap pelajar
disemak berpandukan panduan pemarkahan yang telah disediakan. Data-data
yang diperolehi daripada respon 50 pelajar dimasukkan ke dalam perisian
Statistical Packages for The Social Science (SPSS) versi 11.5 dan diproses
dengan menggunakan program Winsteps 3.63.0. Perisian ini membolehkan
analisis dijalankan tanpa perlu ujian normaliti kerana corak taburan data tidak
mempengaruhi hasil analisis (Linacre 2004). Pendekatan Model Rasch tidak
mengandaikan taburan normal bagi individu atau item bagi membolehkan
analisis dijalankan. Salah satu sifat yang paling penting Model Rasch ialah
objektiviti khususnya (Rasch 1977). Maksudnya, perbandingan antara dua item
tidak bergantung kepada aras kebolehan individu yang digunakan untuk
pengukuran aras kesukaran item dan perbandingan terhadap kebolehan dua
individu berbeza tidak bergantung kepada aras kesukaran item-item yang diguna
untuk mengukur kebolehan individu .
Model Rasch dipilih kerana model ini dapat menunjukkan dengan jelas
taburan kesukaran soalan dalam bentuk data dan graf. Menurut Linarce (1992)
dan Van der Linden, (1992), Model Rasch dipilih kerana item dan individu
diukur pada satu skala yang sama serta skor ujian adalah mencukupi untuk
analisis statistik Ini bermakna jika data serasi dengan model, maka skor ujian
mengandungi semua maklumat tentang kebolehan individu yang diuji lalu
menyebabkan pengelasan individu berdasarkan skor ujian adalah dijustifikasi.
Dalam Model Rasch kebarangkalian individu untuk menjawab sesuatu item
dengan betul bergantung kepada kebolehan individu tersebut dan kesukaran item.
Oleh itu, seseorang yang lebih berkebolehan mempunyai kebarangkalian yang
lebih besar untuk menjawab item itu dengan betul berbanding dengan individu
kebolehan rendah.
5
Zamri Mahamo, Mohd Sarifuddin Mat Salleh & Anita Abdul Rahman
DAPATAN KAJIAN
Rajah 2 menunjukkan taburan kesukaran item pada skala logit lebih tersebar
berbanding dengan taburan kebolehan kedudukan individu. Bacaan nilai logit
item tersebar pada kedudukan 4.00 logit hingga bacaan paling bawah -3.00 logit.
Sedangkan kedudukan individu hanya tersebar pada kedudukan nilai logit paling
atas dengan bacaan 3.12 logit dan bacaan paling bawah -.17 nilai logit. Hal ini
menunjukkan item soalan tahun 2005 tersebar pada aras kesukaran paling sukar
pada bacaan 4.00 nilai lagit dan aras yang paling mudah pada bacaan -3.00 nilai
logit.
Kelihatan item juga banyak tertumpu berhampiran bacaan min item (M /
0.00). Nilai min individu yang dihasilkan ialah 1.39 logit manakala min item
telah ditetapkan pada aras 0.00. Menurut Wright dan Masters (1982), apabila
nilai min kebolehan individu menghampiri nilai min bagi kesukaran item (0.00
logit), menunjukkan item-item kajian bersesuaian atau berpadanan dengan
kebolehan individu. Jarak antara nilai logit min kebolehan individu (1.39 logit)
dengan nilai min bagi kesukaran item (0.00 logit) menunjukkan kesukaran item
Kertas 1 PMR tahun 2005 tidak tersebar kepada semua kebolehan individu.
Dari segi taburan aras kesukaran dipadankan dengan susunan dalam
Taksonomi Bloom, nilai bacaan paling tinggi (maksimum) pada skala logit ialah
3.07 mewakili S2, manakala bacaan paling bawah (minimum) ialah -2.74
mewakili S3. Didapati item bertaburan mengikut aras Taksonomi Bloom dan
bagi soalan Penilaian Menengah Rendah (PMR) Tahun 2005, kelihatan item
banyak bertumpu di kawasan domain aplikasi dan kefahaman. Kajian ini
memberi tumpuan kepada item paling sukar yang mewakili satu item (S2).
Agihan yang dipersetujui oleh penggubal-penggubal soalan dan Lembaga
Peperiksaan Malaysia (LPM), untuk membentuk soalan ujian yang bermutu
memerlukan agihan mengikut perkadaran 5 (mudah), 3 (sederhana) dan 2 (sukar).
Berdasarkan perkadaran ini, agihan yang sepatutnya untuk sejumlah 40 item
ujian ialah 20 item untuk soalan berbentuk mudah, 12 item untuk soalan jenis
sederhana dan 8 item untuk jenis soalan jenis sukar. Berdasarkan Jadual 2,
terdapat 12 soalan yang terletak pada aras pengetahuan dan kefahaman yang
boleh dikaitkan dengan soalan jenis mudah. Susunan soalan tersebut mengikut
skala logit ialah S3, S38, S31, S29, S24, S22, S12, S37, S1, S18, S16 dan S11.
Terdapat tiga item soalan yang berada pada aras penilaian dan sintesis yang
6
Seminar Pendidikan Kejuteraan dan Alam Bina 2008
dapat dikaitkan dengan soalan jenis sukar (S2, S28 dan S39). Selebihnya iaitu
sebanyak 25 soalan dapat digolongkan dalam kumpulan sederhana.
7
Zamri Mahamo, Mohd Sarifuddin Mat Salleh & Anita Abdul Rahman
<less>|<frequ>
8
Seminar Pendidikan Kejuteraan dan Alam Bina 2008
skala logit ialah S1, S12, S29, S9, S14, S34, S40, S5, S6, S28, S36, S7, S17 dan
S2. Hanya terdapat satu item soalan yang boleh dikaitkan dengan soalan jenis
sukar iaitu soalan yang berada pada aras penilaian dan sintesis (S11). Selebihnya
iaitu sebanyak 25 soalan dapat digolongkan dalam kumpulan sederhana.
|T
|
-3 + s17 s2
<less>|<frequ>
Analisis yang dijalankan untuk soalan tahun 2006, didapati soalan paling
sukar ialah soalan nombor 11. Soalan nombor 11 berdasarkan Kertas I Bahasa
Melayu PMR, masih tergolong dalam soalan yang menguji kemahiran morfologi
pelajar. Dalam soalan ini, pelajar dikehendaki memilih penggunaan perkataan
yang salah dari segi tatabahasa berdasarkan jawapan bergaris yang bertanda A, B
atau C. Jika semua perkataan dalam ayat tersebut didapati tidak mengandungi
kesalahan, pelajar dikehendaki memilih jawapan D. Jawapan yang dicadangkan
untuk soalan 11 ialah C, memandangkan ejaan yang betul bagi perkataan
‘perkarangan’ mengikut Kamus Dewan Edisi Keempat (2007) ialah
‘pekarangan’. Terdapat 5 orang daripada 50 orang yang menanda betul untuk
soalan ini. Petikan soalan 11 Peperiksaan PMR Bahasa Melayu Kertas I untuk
tahun 2006 ialah (LPM 2006):
Hasil analisis didapati terdapat dua soalan yang dikatakan paling mudah
untuk tahun kajian 2006 iaitu soalan nombor 17 dan 2 (Rajah 3). Semua pelajar
menjawab betul untuk kedua-dua soalan ini. Kedudukan soalan 17 lebih hampir
dengan garis logit, berbanding soalan 2. Perkara ini menggambarkan soalan 17
lebih cenderung kepada Model Rasch berbanding soalan 2. Soalan 17 menguji
kemahiran sintaksis pelajar, iaitu pelajar dikehendaki memilih pasangan ayat
yang menggunakan huruf condong dengan betul. Cadangan jawapan bagi soalan
17 ialah C iaitu untuk pasangan jawapan III dan IV. Soalan 2 pula menguji
kemahiran morfologi iaitu menguji penggunaan kata ganda yang sesuai dalam
ayat. Jawapan untuk soalan 2 ialah C. Petikan soalan 17 Peperiksaan PMR
Bahasa Melayu Kertas I untuk tahun 2006 ialah (LPM 2006):
10
Seminar Pendidikan Kejuteraan dan Alam Bina 2008
“Jangan berbual-bual dan membuat kerja lain ketika saya mengajar,” kata
Cikgu Rosnah kepada murid-muridnya.
12
Seminar Pendidikan Kejuteraan dan Alam Bina 2008
|
|S
-2 + s1 s16 s2 s28 s3
| s31 s30 s4 s6
|
-3 + s22 Pengetahuan
<less>|<frequ>
RAJAH 4. Perkaitan Aras Kesukaran dan Taksonomi Bloom
Susunan dalam aras Taksonomi Bloom disusun secara menaik mengikut garis
logit pada graf pemetaan item-individu (Wright map) sehingga kepada aras
paling sukar iaitu penilaian. Setelah dibuat perbandingan antara taburan item
dengan kedudukan aras Taksonomi Bloom didapati:
RUJUKAN
Abd Aziz Abd Talib. 2000. Pedagogi bahasa Melayu: Prinsip, kaedah dan
teknik. Kuala Lumpur: Utusan Publications.
Abd. Rashid Johar & Siti Rahayah Ariffin. 2001. Isu pengukuran dan penilaian
pendidikan. Bangi: Penerbitan Universiti Kebangsaan Malaysia.
Alias Baba. 1997. Statistik penyelidikan dalam pendidikan dan sains sosial.
Bangi: Penerbitan Universiti Kebangsaan Malaysia.
13
Zamri Mahamo, Mohd Sarifuddin Mat Salleh & Anita Abdul Rahman
Bhasah Abu Bakar. 2003. Asas pengukuran dalam bilik darjah. Tanjong Malim:
Quantum Books.
Bond, T.G. & Fox, C.M. 2001. Applying the Rasch Model: Fundamental
measurement in the humans sciences. New Jersey: Lawrence Erlbaum
Associates.
Bond, T.G. 2004. Validity and assesment: A Rasch measurement perpective.
Metodoligia de las Ciencias del Comportamiento, 5(2): 179-194.
http://www.faess.jcu.edu.au/dowmloads/bondValidity.pdf(10 Januari 2005)
Borg, R.W. & Gall D.M. 1989. Educational research: An introduction.5th
Edition. New York: Longman Inc
Hanizah Hamzah. 2007. Kebezaan kefungsian item berkaitan gender dalam
peperiksaan Matematik peringkat kebangsaan: kewujudan dan perkaitan
dengan jenis item. Tesis Dr. Fal. Universiti Kebangsaan Malaysia, Bangi.
Kementerian Pendidikan Malaysia. 2001. Sukatan Pelajaran Kurikulum
Bersepadu Sekolah Menengah: Bahasa Melayu. Kuala Lumpur: Pusat
Perkembangan Kurikulum.
Kumar, R. 1996. Research methodology. Australia: Longman.
Linacre, J. M. 2004. Winstep Rasch measurement computer program. Chicago:
Winsteps.com.
Mohamad Sahari Nordin. 2008. Pengujian dan penaksiran di bilik darjah. Kuala
Lumpur: Penerbit Universiti Islam Antarabangsa Malaysia.
Mohd Majid Konting. 1998. Kaedah penyelidikan pendidikan. Kuala Lumpur:
Dewan Bahasa & Pustaka.
Rasch Measurement Transactions, 18:3. 2004. When does a gap between
measures matter? atas talian pada 17 November 2004.
htp:/www.209.41.153/rmt/rmt32a.htm
Siti Rahayah Ariffin. 2003. Teori, konsep dan amalan dalam pengukuran dan
penilaian. Bangi: Penerbit Universiti Kebangsaan Malaysia.
Wiersma, W. 2000. Research methode in education. 7th Edition. Boston: Allyn
& Bacon.
Wright, B. D. & Linacre, J. M. C. 1989. Observations are always ordinal;
measurements, however, must be interval. Physical Medicine and
Rehabilitation, 70(12): 857-860
http://www.rasch.org/memo44.htm (8 Ogos 2004).
Wright, B. D. & Masters, G. N. 1982. Rating scale analysis. Chicago: MESA
Press.
Wright, B. D. & Stone, M. H. 1979. Best test design. Chicago: MESA Press,
2387 - 2396.
14