Secara umumnya, data korpus ialah koleksi data linguistik, sama ada dalam bentuk teks bertulis
atau transkripsi ucapan yang dirakam, yang boleh digunakan sebagai titik permulaan pemerian
linguistik atau sebagai satu kaedah untuk mengesahkan hipotesis tentang sesuatu maklumat
dalam bahasa. Dalam bidang korpus lingustik, keupayaan pemprosesan data dapat meningkatkan
sekiranya melalui penggunaan computer. Hal ini kerana data dalam bentuk eletronik ini boleh
analisis korpus. Misalnya perisian AntConc yang dihasilkan oleh Laurence Anthony, merupakan
suatu perisian yang boleh menjana baris konkordans KWIC dan plot pengedaran konkordans
serta dapat melihat kekerapan penggunaan kata dan makna yang terdapat dalam ucapan, teks atau
Sehubungan itu, cara-cara penggunaan Antconc adalah memuat turun dan memasangkan
pada petak ‘Word List’, tekan pada petak ‘File’ dan pilih ‘Open File’ seperti mana yang
ditunjukkan:
Kemudian masukkan teks kajian yang berbentuk ‘Notepad’ atau berformat (*.txt) dan tekankan
‘Start’.
Selepas itu, paparan perkataan dalam teks akan ditunjukkan melalui ‘Word Tokens’- jumlah
perkataan dalam teks dan ‘Word Types’- jumlah bilangan kata yang berbeza dalam teks
manakala data penggunaan kekerapan perkataan dalam teks-teks tersebut akan ditunjukkan
Masalah yang dihadapi oleh pengkaji dalam proses menghasilkan data digital ialah
langkah yang terlalu rumit dalam menukar data yang dalam asalnya dalam (*.pdf) kepada (*.txt).
kerana sesetengah (*.pdf) yang terlalu besar akan memakan masa yang panjang dalam proses
pertukaran tersebut. Namun demikian, tidak dapat dinafikan bahawa melalui penggunaan
perisian AntConc, pengkaji berupaya menghasilkan data digital seterusnya membina korpus
digital untuk kajian lingustik. Hal ini secara tidak langsung juga membuka ruang kepada
maklumat lingustik yang lebih besar dan benar, memudahkan kajian lingsuitik seterusnya
Korpus bahasa Melayu ini dihasilkan dengan memfokuskan kepada tema sukan. Sebelum
ini, pengkaji telah menghasilkan korpus dengan ‘word tokens’ atau jumlah kekerapan pengunaan
perkataan iaitu 120116 dan ‘word types’ atau jumlah jenis perkataan iaitu 10957 dengan 58 fail.
Bagi menjamin kualitinya, korpus harus ‘dicuci’ teksnya supaya perkara-perkara yang tidak
berkaitan dengan tema, ejaan salah dan perkataan inggeris seperti xa, pj, al dapat dibuang
daripada dianalisis dalam sistem tersebut. Cara korpus dicuci ialah buka teks asal yang berbentuk
‘Notepad’ atau berformat (*.txt). Seterusnya, tekan pada bahagian ‘edit’ dan tekan pada bahagian
selepas dicuci. Singkatan-singkatan perkataan ini tidak boleh dicuci kerana akan menjejaskan
makna sesuatu ayat di dalam konteks seperti x di sini adalah berfungsi sebagai formula bagi
menghitung kelajuan seseorang pemain dalam sesuatu pergerakan manakala lee pula merujuk
Setelah teks dicuci, saiz korpus turut akan berubah di mana ‘word tokens’ atau jumlah
kekerapan penggunaan perkataan berkurangan menjadi 116869 dan ‘word types’ atau jumlah
jenis perkataan menjadi 10668. Di samping itu, korpus yang dihasilkan ini juga mencerminkan
tema yang dipilih oleh pengkaji iaitu tema sukan seperti mana yang ditunjukkan melalui gambar
rajah di bawah:
Buktinya, perkataan-perkataan seperti pemain naik dengan kekerapan sebanyak 876 kali,
bola sebanyak 655 kali, badminton sebanyak 590 kali, pukulan sebanyak 386 kali, mata
sebanyak 273 kali. Sekiranya melihat kepada medan makna dalam semantik, boleh dikatakan
bahawa korpus ini sememangnya telah mencerminkan laras sukan kerana perkataan tersebut
seperti pemain, badminton, pukulan, mata semuanya berada dalam satu lingkungan yang sama,
iaitu sukan. Sebagai contoh, perkataan ‘mata’ selalunya akan dikait dengan organ penglihatan
tetapi melalui kajian korpus ini, perkataan tersebut amat kerap digunakan dalam laras sukan yang
penggunaan sesuatu leksis daripada sekumpulan data korpus yang akan dikaji. Dalam bahagian
ini, sebanyak dua konkordans iaitu ‘kaki’ dengan kekerapan sebanyak 308 kali dan ‘mata’
dengan kekerapan sebanyak 273 kali telah dipilih untuk dianalisis. Hal ini kerana kedua-dua
perkataan tersebut mempunyai jumlah kekerapan yang tinggi di mana turut melambangkan
Perkataan: kaki
Bi Makna Kelas Kata Nilai Sosial Hit
l
1 Bahagian tubuh manusia Kata nama 5,6,8,10,24,51,58,
yang bermula dari paha 70,75,78,91,96,
sampai ke bawah sekali dan 99,102,104,108,
digunakan untuk berjalan, 110,134,226,200,
berlari, berdiri dan 272,276,291
sebagainya
2 Kata majmuk Metonimi: kaki 249,263
tangan
anak buah yang
ditempatkan dalam
sesuatu situasi
tertentu untuk
membantu seorang
‘atasan’ dalam
mencapai tujuannya
3 Sebagai unit ukuran yang Kata bilangan 16,66,77,192
mempunyai kepanjangan (satuan)
sebanyak 12 inci
Berdasarkan jadual di atas, dapat dikatakan bahawa ‘kaki’ merupakan suatu kata yang
bersifat polisemi, iaitu mempunyai lebih dari satu makna berdasarkan pola kalimat atau konteks
kalimat yang sedang diutarakan. Hal ini menyebabkan kelas kata bagi ‘kaki’ turut berbeza seperti
yang ditunjukkan dalam jadual, ‘kaki’ boleh dikelaskan sebagai kata nama, kata bilangan,
ataupun kata majmuk berdasarkan penggunaannya dalam konteks. Secara umumnya, ‘kaki’
merujuk kepada bahagian tubuh manusia yang bermula dari paha sampai ke bawah sekali dan
digunakan untuk berjalan, berlari atau berdiri seperti mana yang dipaparkan dalam hit
10-‘...pada tumit kasut yang muat pada kaki anda akan mengelak kecederaa...’, hit 99-‘… kedua
Sehubungan itu, unsur hiponim yang merupakan salah satu tinjauan semantik dalam
pengkajian makna juga dapat dilihat melalui paparan konkordans tersebut. Buktinya, punggung
kaki dalam hit 5 dan 91, lutut kaki dalam hit 134, telapak kaki dalam hit 110, pergelangan kaki
dalam hit 272, tapak kaki dalam hit 200, semuanya boleh dikenali sebagai anggota di bawah
lingkungan kategori ‘kaki’. Dari segi nilai sosial pula, boleh dikatakan bahawa makna ‘kaki’
turut mengalami perubahan akibat dipengaruhi oleh salah satu jenis bahasa kiasan, iaitu
metonimi. Berdasarkan Lakoff & Johnson (1980), metonimi berfungsi sebagai rujukan yang
menggunakan satu entiti untuk mewakili satu entiti lain melalui pemakaian kata atau ungkapan
dengan makna yang bukan makna sebenar. Contohnya, ‘kaki tangan’ dalam hit 249-‘…tahun
depan. Semalam, media melaporkan lebih 80 kaki tangan ISN seluruh negara resah
memikirkan…’, bukan merujuk kepada kaki dan tangan yang ada pada tubuh badan manusia,
tetapi anak buah yang ditempatkan dalam sesuatu situasi tertentu, iaitu Institusi Sukan Negara
Selain membawa definisi sebagai bahagian tubuh manusia, ‘kaki’ juga berfungsi sebagai
kata bilangan. Contohnya, ‘kaki’ dalam hit 77-‘… menentukan lapangan servis awal dan
terletak 6 kaki dan 6 inchi (1,98 meter) dari net.’ merupakan unit ukuran yang mempunyai
kepanjangan sebanyak 12 inci, begitu juga dengan hit 16, 66 dan 192. Seterusnya, makna ‘kaki’
berubah dengan merujuk kepada pergerakan kaki seperti yang ditunjukkan dalam hit 1, iaitu ‘…
langkah-langkah yang berbeza. Asas pergerakan kaki mula dengan gerak kaki ke belakang…’.
Jadi, jelasnya konsep ‘kaki’ dalam ayat tersebut adalah melambangkan gerakan kaki seseorang
sama ada ke depan, ke belakang, ke kiri atau ke kanan waktu bersukan. Bukan itu sahaja,’kaki’
turut diertikan sebagai jarak di antara dua belah kaki ketika jalan seperti mana yang dicatatkan
dalam hit 15:’…menaikkan kecepatan dengan cara melebarkan langkah kaki, atau mendorong
Melalui hit 72-‘…waktu yang cukup lama sepeti jalan kaki, bersepeda atau juga
jogging.’, pula, ‘kaki’ dilihat sebagai salah satu kaedah senaman dengan cara bergerak ke
hadapan melalui langkah demi langkah dengan kelajuan yang kurang daripada berlari.
Seterusnya, ‘kaki’ dalam hit 280 dan 290, merujuk kepada sejenis garmen yang dirajut untuk
menutupi kaki manusia atau dikenali sebagai stoking. Contohnya, hit 280-‘… minum,
mempersiapkan pakaian seragam, sepatu, kaus kaki untuk bertanding serta memilih alat
transport…’, di mana ‘kaki’ tersebut berfungsi untuk menggambarkan suatu benda yang
dihasilkan dalam keadaan berpasangan bagi mengurangkan gesekan antara kaki dan alas kaki.
Perkataan: mata
Bi Makna Kelas Kata Nilai Sosial Hit
l
1 Indera penglihatan Kata nama 57,97,103,106
manusia yang digunakan
untuk melihat sesuatu
2 skor/jumlah angka Kata nama 1,4,13,15,18,27,
kemenangan dalam 35,41,44,56,108,
perlawanan
125,181,198,243
3 jenis-jenis ilmu Kata nama 139,140
pengetahuan yang
diajarkan di sekolah
4 hanya dan tidak lebih kata tugas 10,11,25,29,91
daripada
5 Kata Personifikasi: berputih 38
majmuk mata
Menggambarkan perasaan
kekecewaan kerana hak
miliknya telah dirampas
oleh pihak lain.
6. Air yang keluar dari Kata nama 92,113,135,209,
mata disebabkan 249
kesedihan atau
kekecewaan
7 Apa yang terlihat dan Kata nama 7
tergambar di mata
8 Posisi dari perspektif Kata nama 119
mata manusia dalam
melihat sesuatu benda
yang berada dalam
lingkungan persekitaran
9 Kata Metonimi: membuka mata 214
majmuk Melihat sesuatu dengan
jelas supaya dapat
menerima kenyataan yang
sebenarnya
Sama seperti ‘kaki’, makna yang tersenarai dalam konkordans ‘mata’ juga memaparkan
lebih dari satu makna atau dikenali sebagai polisemi. Selain kata nama, ‘mata’ juga
dikategorikan sebagai kata majmuk, kata tugas mengikut konteks ayat yang berbeza. Secara
umumnya, ‘mata’ merupakan suatu indera penglihatan manusia yang digunakan untuk melihat.
Contohnya, dalam hit 57-‘… tuala membantu mengelapkan peluh dari muka, mata dan tangan.
Sarung tangan daripada kulit.’, ‘mata’ telah berfungsi sebagai salah satu alat pancaindera yang
ada pada muka manusia. Sehubungan itu, unsur kiasan seperti personifikasi dan metonimi juga
dapat dikesan melalui hit 38 dan hit 214 iaitu ‘…setakat ini. Thailand berpotensi manakala
Malaysia dan Indonesia berputih mata’. Jelasnya, ‘mata’ di sini telah diberi sifat manusia iaitu
proses perubahan warna rambut seseorang dari hitam ke putih (uban) apabila sudah berumur
dalam menggambarkan perasaan kekecewaan kerana hak miliknya telah dirampas oleh pihak
lain. Hal ini selari dengan Kamus Dewan (1995) yang menjelaskan bahawa personifikasi ialah
pemberian sifat-sifat manusia kepada benda yang tidak bernyawa atau sesuatu yang abstrak bagi
betapa mereka akan …’. pula memperlihat fungsi metonimi yang menggunakan ungkapan
‘membuka mata’ bagi menyeru seseorang supaya melihat sesuatu dengan jelas bagi menerima
kenyataan yang sebenarnya. Seterusnya, ‘mata’ juga membawa makna skor atau jumlah angka
kemenangan dalam perlawanan seperti yang dipapar dalam hit 1-‘... terima pilihan yang
berikutnya. Sistem pengiraan mata dalam permainan…’ di mana pihak mana yang mendapat
skor yang paling banyak akan dikira sebagai pemenang. ‘Mata’ bukan sahaja mewakili alat
pancaindera, malah juga merujuk kepada air yang keluar dari mata disebabkan kesedihan atau
kekecewaan. Buktinya, dalam hit 113-‘Chong Wei menitiskan air mata kesedihan ketika acara
penyampaian pingat…’. Apabila ‘mata’ dikaitkan dengan subjek-subjek akademik seperti bahasa
Melayu, Sejarah, maka makna ‘mata’ akan menjadi jenis-jenis ilmu pengetahuan yang diajarkan
di sekolah seperti mata pelajaran peperiksaan dan mata pelajaran PJ yang terkandung dalam hit
mereka kelihatan kurus. Senario…’, menjelaskan bahawa ‘mata’ diertikan sebagai suatu hasil
memandang secara permukaan, iaitu hanya apa yang terlihat dan tergambar di mata mereka
sahaja. Satu lagi makna ‘mata’ yang berkaitan dengan pandangan adalah melalui hit 119-‘…
lemah lebih kecil. dan sudut pandang mata lebih sempit. Untuk menghadapi para…’ di mana
merujuk kepada posisi dari perspektif mata manusia dalam melihat sesuatu benda yang berada
dalam lingkungan persekitaran. Di samping itu, apabila ‘mata’ mengalami proses terbitan dengan
menerima awalan se- dan bentuk -nya selepas kata dasar digandakan akan berfungsi sebagai kata
adverba bawah kata tugas, iaitu semata-mata. Dalam hit 29-‘…kecuali alat-alat yang digunakan
semata-mata bertujuan untuk menghadkan atau mengurangkan…’, dapat dikatakan bahawa alat
yang digunakan tersebut hanya mempunyai tujuan untuk mengehad atau mengurangkan dan
bertemakan sukan, jadi makna yang disenaraikan kebanyakan adalah bersifat denotasi yang
bebas daripada nilai subjektif. Hal ini dikatakan demikian kerana salah satu ciri bagi laras sukan
ialah bahasa yang digunakan mestilah ringkas, bersahaja, jelas serta mudah difahami. Walau
bagaimanpun, tidak dapat dinafikan bahawa kaedah korpus yang diguna membolehkan semua
data diproses secara sistematik dalam mendapatkan maklumat seperti senarai kata, kekerapan
butiran leksikal dan maklumat leksikal yang lain. Kaedah korpus turut meluaskan komponen
makna sesuatu perkataan melalui penelitian atas pola penggunaan dalam teks sebenar melalui
Analisis komponen makna merupakan satu kaedah yang mengaitkan intensi perkataan
dalam konsep abstrak yang mengatakan bahawa setiap perkataan ada komponen atau bahagian
makna yang lebih kecil daripada keseluruhan makna perkataan, iaitu fitur semantik. Sehubungan
itu, setiap fitur makna merupakan komponen yang memadai dan sepatutnya
(neseccary&sufficient) dengan menjamin dan membolehkan keahlian dalam kategori. Oleh itu,
bagi analisis komponen makna ‘kaki’ dan ‘mata’, pengkaji hanya melihat kepada perkataan itu
Melalui takrifan analisis komponen makna di atas, dapat dilihat dengan jelas bahawa
fitur-fitur bagi perkataan ‘kaki’ terdiri daripada anggota badan, bilangan kuantiti, daya bergerak
dan jari sementara bagi perkataan ‘mata’ pula ialah anggota badan, alat pancaindera, bilangan
kuantiti, dan visual. Dalam hal ini, ‘kaki’ dan ‘mata’ berkongsi fitur yang sama di mana kedua-
duanya merupakan sebahagian daripada anggota badan manusia dan mempunyai bilangan
kuantiti yang sama, iaitu sepasang. Cuma yang membezakannya ialah ‘kaki’ mempunyai daya
untuk bergerak seperti berjalan, berlari atau berdiri dan disokong oleh sejumlah jari di bahagian
hujung kaki supaya tubuh tetap seimbang dan tidak terjatuh manakala ‘mata’ pula merupakan
salah satu alat pancaindera yang digunakan untuk melihat dan memberikan rasa visual.
Tuntasnya, melalui kaedah analisis komponen, makna persamaan dan perbezaan perkataan yang
mempunyai perkaitan makna dapat dikesan seterusnya membolehkan perkataan tersebut
dikelompokkan dalam kelas-kelas tabii (natural classes) berdasarkan fitur-fitur yang dikongsi
bersama.