Anda di halaman 1dari 9

KORPUS BAHASA

BMM3112 Oleh: Syed Raffie Bin Maksit Asran Bin Omar Md Azzezan Bin Sukur Deldrin Peter

Pengenalan..
Dalam linguistik, korpus ialah himpunan data-data mentah yang bakal digunakan untuk kajian lingustik. Contohnya adalah seperti himpunan manuskrip dan teks bertulis yang lain.

Dalam penyusunan kamus, kata-kata yang dimasukkan ke dalam kamus seharusnya kata-kata yang pernah ataupun yang sedang digunakan oleh masyarakat. Penyusun kamus sebenarnya tidak mencipta kata untuk dimasukkan ke dalam kamus. Untuk itu, penyusun kamus akan membina korpus kamus daripada sumbersumber seperti : Sumber Tulisan
              Buku-buku Majalah Tesis Akhbar Memo Akta Borang Surat Risalah Laporan Rasmi (lain-lain lagi) Radio Televisyen (lain-lain lagi)

Sumber Lisan

Daripada sumber-sumber ini, para penyusun kamus akan mendapatkan kata-kata masukan untuk kamus.

PANGKALAN DATA
Peringkat awal dalam penyusunan kamus ialah perancangan. Pada peringkat ini penyusun kamus perlulah menentukan tujuan penyusunan tersebut agar jelas siapakah khalayak yang akan menggunakan kamus tersebut. Seterusnya, penyusun kamus perlulah memilih kaedah kerja yang bersesuaian dengan tujuan kamus tersebut dihasilkan. Setelah kedua-dua perkara tersebut jelas, baharulah penyusun kamus akan mula mengumpul bahan yang diperlukan seperti penyediaan entri, takrif, data korpus yang mendapat ayat-ayat contoh, dan sebagainya.

Sambungan
Seterusnya penyusun kamus juga perlu membina data korpus. Dalam hal ini, hanya kata-kata yang pernah digunakan oleh penutur dalam masyarakat tertentu perlu dimasukkan ke dalam pangkalan data.

PENGUMPULAN DAN PENGELASAN KATA


Selepas selesai pengumpulan data, penyusun kamus haruslah menjalankan kerja pengisihan dan pengabjadan data. Dalam prosedur ini, setiap kata yang telah dirakam akan disusun mengikut abjad. Ini boleh dilakukan secara manual atau dengan penggunaan komputer. Data ini akan disimpan dalam bank data untuk digunakan sebagai rujukan kelak.

Sambungan
Setelah selesai pengisihan entri, penyusun kamus akan bergerak kepada prosedur seterusnya, iaitu pengolahan data. Pada peringkat ini penyusun kamus akan mengklasifikasikan kepada yang ditemui ke dalam kata baharu, kata yang lewah, kata yang jarang digunakan (neologisme) dan kata yang mengalami perubahan makna.

Sambungan..
Kata lewah akan dibuang dengan menggunakan pendekatan semantik dan pragmatik, mendokumentasikan kata neologisme, dan seterusnya mengambil kata-kata baru dan kata-kata yang mengalami perubahan makna pada peringkat pemerian makna. Selepas itu penyusun akan membuang kata-kata lewah,mendokumentasikan neologisme dan mengambil kata-kata baharu. Pemberian makna ialah proses menjelaskan makna sesuatu perkataan. Penyusun kamus boleh menggunakan pelbagai bahan rujukan yang sedia ada seperti daftar istilah dan sebagainya untuk mencari maksud sesuatu kata.

Sambungan..
Pembutiran setiap medan maklumat secara relatifnya berbeza antara satu kamus dengan yang lain bergantung kepada tujuan kamus dihasilkan. Medan maklumat bagi sebuah ekabahasa ialah entri (kata masukan utama atau kata dasar), subentri (kata terbitan), entri varian, subentri varian,sebutan, etimologi, kelas kata, takrif, contoh penggunaan, homonim,sinonim, antonim, frasa dan ungkapan, simpulan bahasa dan peribahasa,nama saintifik, label, angka penanda, dan rujuk silang.

Anda mungkin juga menyukai