209 709 1 SM PDF
209 709 1 SM PDF
Abstrak – Penelitian ini bertujuan menyusun sebuah model file korpus Al-Qur'an digital yang
dapat digunakan sebagai bahan data primer bagi penelitian kebahasaan dalam kerangka
cabang ilmu linguistik korpus yang berkenaan dengan daftar kata (word list) dan konkordansi
(concordance) dalam Al-Qur'an. Penelitian ini menggunakan metode kombinasi antara
eksplorasi dan eksperimen yang digunakan untuk mencari berbagai aplikasi pengolah korpus
dan menguji coba satu persatu aplikasi itu untuk mengolah korpus teks Al-Qur'an bertulisan
Arab dengan segala karakteristiknya. Setelah aplikasi yang tepat ditemukan, langkah
berikutnya menggunakan metode deskriptif yaitu menguraikan secara faktual mekanisme
pengolahan bahan digital menjadi format korpus Al-Qur'an sekaligus menyusun dafar kata
dan konkordansinya dalam Al-Qur'an. Penelitian ini menunjukkan bahwa aplikasi WordSmith
adalah yang paling memadai untuk melakukan pengolahan teks berbahasa Arab dalam
kerangka linguistik korpus. Dengan prosedur dan langkah-langkah yang sesuai dengan
sistematika aplikasi tersebut, dapat dihasilkan file Al-Qur'an digital yang memenuhi syarat
teknis untuk diolah guna menyusun daftar kata dan konkordansi.
Abstract – This research aims to develop a model of the corpus file digital Qur'an that can be
used as primary data for the study of language in terms of corpus linguistics branch of science
with regard to word list and concordance in the Qur'an. This research is using a combination
method of exploration and experimentation that are used to search for a variety of corpus
processing applications and tested one by one to process Arabic Qur'an text with all its
characteristics. And after having found the right application, the next step is using descriptive
method that describes in factual material processing mechanisms into digital format at the same
corpus of the Qur'an and its concordance and word list. This study shows that the WordSmith
software is the most adequate to do the Arabic text processing within the framework of corpus
linguistics. With procedures and measures in accordance with the application, it can produces a
digital file of the Qur'an that is technically qualified to be processed in order to compile a list of
words and a concordance.
itu,
Al-Qur’an
menjadi sumber utama bagi ajaran Islam.
Al-Qur’an juga penting
baik dalam aspek gramatika, retorika, stilistika,
maupun sisi kebahasaan Arab yang lain.
kedudukannya sebagai acuan utama berbagai Kajian kebahasaan terhadap Al-Qur'an sudah
disiplin ilmu, baik ilmu alam, ilmu pasti, menjadi perhatian para linguis Arab maupun
maupun ilmu sosial-humaniora. Bagi salah satu non-Arab sejak dahulu kala. Orientasi kajian
cabang dalam rumpun ilmu humaniora, yaitu pun beragam, mulai dari tataran bahasa paling
216 Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016
rendah, seperti fonem, morfem, lalu setingkat atau tulisan konvensional. Sejak ditemukannya
di atasnya, seperti kajian kosa kata, sampai ke teknologi komputer dan dimulainya era digital,
tataran yang lebih tinggi dan luas, yaitu kajian kini data kebahasaan berupa tulisan atau teks
struktur kalimat, kajian makna, dan kajian serta bahasa lisan yang dituliskan dapat
wacana. Beragam kajian itu memposisikan Al- disimpan dan diolah secara digital dengan lebih
Qur'an sebagai sebuah teks, dalam hal ini teks mudah. Di sinilah linguistik korpus mengambil
kebahasaan. Namun, model teks Al-Qur'an bagian, yaitu mengolah data kebahasaan yang
sendiri berkembang dari zaman ke zaman. sudah berbentuk digital.
Sebelum era digital, teks Al-Qur'an hanya
dituliskan dengan tangan di atas kertas kuno Apabila dulu Al-Qur'an hanya berupa mushaf
atau tertera di atas lembaran kertas yang konvensional bertulisan tangan dan lalu dicetak
dicetak secara konvensional lazimnya beredar dengan berbagai bentuk dan variasi tulisan,
di kalangan umat Islam dan bangsa lain. Di era seiring dengan perkem-bangan dan kemajuan
modern, khususnya di era digital, teks Al- teknologi, kini Al-Qur'an pun memasuki era
Qur'an telah dikonversi ke banyak model teks digital. Format digital Al-Qur'an kini tersedia
dan bisa diolah melalui ber-bagai piranti lunak dalam berbagai versi: ada yang berupa gambar
maupun aplikasi digital khusus, sekali lagi, dalam aplikasi Al-Qur'an digital, ada yang
dalam konteks Al-Qur’an sebagai sebuah teks berupa font yang dapat diinstalasikan ke dalam
kebahasaan. sistem operasi komputer, maupun teks digital
biasa yang bisa diakses dan diolah dengan
Situasi itu kemudian memposisikan Al-Qur'an aplikasi pengolah kata. Berbagai bentuk teks
sebagai “korpus”. Dalam ilmu linguistik, digital yang sudah ada setakat ini cukup bisa
korpus adalah sekumpulan data, bisa dimanfaatkan dalam beberapa penggunaan
konvensional maupun digital, dalam bentuk yang terbatas, seperti aplikasi Al-Qur’an digital
tertulis yang mengandung berbagai informasi untuk bacaan, dan lain sebagainya. Namun,
kebahasaan untuk diteliti mulai dari tataran untuk penelitian yang memanfaatkan format
kata, struktur, makna, dan wacana. Dalam digital teks Al-Qur’an, format yang ada masih
perkembangan terkini, teks Al-Qur'an banyak harus diolah dan diverifikasi agar dapat
diolah dalam bentuk digital dan menjadi bahan dijadikan bahan dasar bagi format baru yang
utama yang sangat penting bagi kajian disebut dengan korpus Al-Qur'an.
linguistik terhadap kitab suci pada era
penelitian lebih lanjut. Untuk menyusun format tersebut, penelitian ini
akan melakukan sejumlah langkah guna
Di masa kini, berkembang suatu cabang ilmu di menyiapkan suatu model data yang nantinya
bawah rumpun ilmu linguistik, yaitu linguistik dapat dimanfaatkan untuk berbagai kajian
korpus. Menurut pengertiannya, linguis-tik kebahasaan terhadap Al-Qur'an oleh berbagai
korpus meneliti bahasa melalui seperangkat pihak yang berminat kepada kajian bahasa Arab
data yang sifatnya alamiah, apa adanya, baik itu Al-Qur'an, terutama yang menggunakan
data tulisan maupun data lisan yang linguistik korpus. Diharapkan agar produk atau
ditranskripsikan atau dituliskan (Adolphs, hasil kajian itu nantinya dapat membantu
2006: 137). Menurut Cheng (2012: 6), mempermudah masyarakat dalam memahami
linguistik korpus menganalisis data dengan Al-Qur'an serta dan menyingkap banyak sisi
mengompilasikannya terlebih dahulu kebahasaan yang kaya akan informasi penting
berdasarkan kategori dan satuan analisisnya. seputar ajaran dan nilai Islam.
Lebih lanjut, kategori dan satuan analisis yang
paling penting dalam linguistik korpus adalah Dengan latar belakang situasi tersebut,
daftar kata (word list) dan korkondansi penelitian ini sesungguhnya bertujuan
(concordance). Daftar kata berisi semua kata menyusun sebuah model file korpus Al-Qur'an
yang terdapat dalam data dan disertai dengan digital yang dapat digunakan sebagai bahan
jumlah frekuensi kemunculan kata dalam teks. data primer bagi penelitian kebahasaan dalam
Adapun konkordansi adalah daftar kata-kata kerangka cabang ilmu linguistik korpus yang
yang berkolokasi dan membentuk suatu makna berkenaan dengan daftar kata (word list) dan
berdasarkan konteks dan koteksnya (Adolphs, konkordansi (concordance) dalam Al-Qur'an.
2006: 136). Dahulu kala, semua data
kebahasaan tulisan masih berupa manuskrip
Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016 217
Dengan mengacu kepada tujuan penelitian satu bahan ajar bahasa Arab diplomasi sebagai
tersebut, maka rumusan masalah penelitian ini kosa kata yang harus dikenali dan dikuasai oleh
terfokus pada model file korpus Al-Qur'an mahasiswa/pembelajar. Demikian pula di
digital yang dapat dijadikan bahan data primer bidang-bidang lainnya, penelitian ini nantinya
bagi penelitian kebahasaan dalam kerangka dapat menawarkan suatu metodologi
linguistik korpus. Adapun pertanyaan penyusunan korpus dari suatu teks sumber
penelitian yang diajukan adalah: kebahasaan.
1. Aplikasi apa yang paling representatif
digunakan untuk membuat model file
korpus Al-Qur'an digital? TEORI TENTANG LINGUISTIK KORPUS
2. Bagaimana format file yang dapat diolah
aplikasi tersebut? Penelitian ini sesungguhnya adalah sebuah
3. Bagaimana format isi teks digital yang akan model dari kajian dalam bidang ilmu linguistik
diolah dengan aplikasi tersebut? korpus. Menurut pengertiannya, linguistik
4. Bagaimana teknik membuat daftar kata dan korpus adalah sebuah metode empiris dalam
konkordansi dalam Al-Qur'an dengan analisis dan deskripsi linguistik untuk meneliti
menggunakan aplikasi tersebut? bahasa yang dipakai oleh para penutur secara
alamiah. Bahasa itu dikompilasikan
Bidang penelitian linguistik korpus berdasarkan kategori tertentu lalu diteliti
sesungguhnya sangatlah luas. Demikian pula dengan tujuan mencapai pemahaman yang
dengan Al-Qur’an sebagai objek penelitian. benar dari pemakaian bahasa tersebut (Cheng,
Oleh karena itu, lingkup penelitian ini dibatasi 2012:6, 29-30). Pada tahun 1980-an, Linguistik
hanya pada aspek pengolahan bahan data Korpus mulai me-rambah kepada pemanfaaan
digital bernama “Al-Mushaf Al-Imla’i” dengan teknologi komputer dan itu cukup
menggunakan aplikasi pengolah korpus yang membangkitkan gairah perkembangan
representatif untuk menghasilkan format digital metodologi korpus. Sejak itu, kemunculan
standar yang dapat digunakan untuk melakukan sejumlah korpus dan kajian berbasis korpus
pemetaan daftar kata dan konkordansi dalam semakin meningkat drastis. Pada masa kini,
Al-Qur'an. metodologi korpus sudah sangat populer dan
bahkan digunakan di berbagai macam riset
Penelitian ini diharapkan nantinya secara multidisiplin ilmu pengetahuan.
khusus dapat memberikan kontribusi berupa :
1. Terbentuknya model teks digital Al-Qur'an Dalam hal penyusunan korpus bahasa, kini
yang bisa digunakan untuk pemetaan daftar sudah tersedia banyak sekali model korpus
kata dan konkordansi; bahasa. Wikipedia, misalnya, mendata ada
2. contoh model pemetaan daftar dan sejumlah korpus bahasa yang dibagi ke dalam
konkordansi kata dan kalimat dalam Al- beberapa kelompok bahasa. Uniknya, bahasa
Qur'an, serta Inggris berada dalam kelompok tersendiri
3. gambaran langkah, prosedur, dan karena ketersediaan banyak sekali ragam dan
sistematika penelitian korpus Al-Qur'an sumber korpusnya, seperti yang paling
menggunakan bahan digital. terkemuka dan termutakhirkan adalah British
National Corpus (BNC), American National
Penelitian ini memang hanya terfokus pada Al- Corpus (ANC), Corpus of Contemporary
Quran digital sebagai model awal. Namun American English (COCA), dan lain
demikian, nantinya model dan prosedur yang sebagainya. Selain bahasa Inggris korpus
ada dapat digunakan secara luas dalam berbagai bahasa-bahasa dunia dimuat daftarnya di laman
kajian maupun keperluan di bidang bahasa wikipedia dalam kelompok-kelompok bahasa
Arab. Sebagai contoh, penyusunan daftar kata Eropa, bahasa Timur Tengah, bahasa Asia
ataupun kamus bahasa di bidang khusus dapat Timur, korpus paralel multibahasa, dan korpus
menggunakan pendekatan ini. Daftar istilah perbandingan antarbahasa.1
bahasa Arab di bidang diplomasi, misalnya,
dapat diambilkan dari sejumlah teks berbahasa
Arab yang berkisar pada topik-topik 1
kediplomasian. Manfaat berikutnya, daftar https://en.wikipedia.org/wiki/List_of_text_
istilah tersebut dapat digunakan sebagai salah corpora, diakses 29 Juli 2016
218 Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016
Salah satu langkah penyusunan korpus bahasa Berdasarkan informasi dari sejumlah penelitian
Arab yang mencantumkan Al-Qur'an sebagai terdahulu, dapat dikatakan bahwa belum ada
salah satu sumbernya adalah yang dilakukan atau belum ditemukan karya yang khusus
oleh Alrabia (et.al., 2014). Mereka menamakan mengkaji teknik pembuatan model file digital
korpusnya dengan King Saud University Al-Qur'an untuk keperluan penelitian linguistik
Corpus of Classical Arabic. Sesuai namanya, korpus. Dari segi hasil pun, peneliti melihat
mereka hanya mengambil korpus dari bahasa belum ada model korpus Al-Qur'an yang
Arab periode klasik dan Al-Qur'an termasuk ke sederhana dan dapat dijadikan model bagi
dalam periode itu. Mereka beralasan bahwa pembuatan korpus, dalam hal ini, yang
pola bahasa Arab klasik adalah basis teori berbahasa Arab. Oleh karena itu, yang berbeda
linguistik Arab dan harus diperlakukan serta dari hasil penelitian ini bila dibandingkan
dipahami secara akademis. Korpus ini dengan hasil penelitian terdahulu adalah pada
mencakup 50 juta kata dari khazanah bahasa model korpus yang dihasilkan. Selain hasil,
Arab klasik dan digunakan untuk kepentingan penelitian ini juga memberikan langkah-
studi distribusi semantik leksikal Al-Qur'an dan langkah aplikatif tentang cara pembuatan
bahasa Arab klasik dengan pendekatan model file korpus terutama terkait data yang
linguistik komputasional. Namun, selain berbahasa Arab.
menggambarkan struktur korpus, penelitian
mereka juga mendeskripsikan gejala perubahan
bahasa dari masa klasik ke masa kini. METODE PENELITIAN
Sharaf dan Atwell (2012). Mereka membuat Penelitian ini menggunakan kombinasi
“QurAna”, korpus Al-Qur'an beranotasi pada beberapa metode terkait dengan kondisi data
anafora pronominal. Penelitian mereka hanya dan tujuan penelitian. Metode pertama adalah
terfokus pada analisis pronomina dalam Al- kombinasi antara eksplorasi dan eksperimen
Qur'an dan pola kemunculan anafora yang yang digunakan untuk mencari berbagai
terkait dengan pronomina dan antesedennya aplikasi pengolah korpus dan menguji coba satu
dalam teks-teks ayat Al-Qur'an. Model analisis persatu aplikasi itu untuk mengolah korpus teks
penelitian ini berguna bagi analisis pronomina, Al-Qur'an bertulisan Arab dengan segala
anafora, dan antesedennya dalam wacana karakteristiknya. Setelah aplikasi yang tepat
bahasa Arab modern dan perbandingan antara ditemukan, langkah berikutnya menggunakan
kedua masa itu. metode deskriptif yaitu menguraikan secara
faktual mekanisme pengolahan bahan digital
Salah satu contoh lain penelitian korpus Al- menjadi format korpus Al-Qur'an sekaligus
Qur'an namun lebih spesifik adalah karya Imad menyusun dafar kata dan konkordansinya
dan Abdelhak (2016) melakukan penelitian dalam Al-Qur'an.
untuk menyusun korpus Al-Qur'an khusus
untuk penelitian morfologi Arab. Mereka Berikut digambarkan prosedur dan mekanisme
menggunakan teks Al-Qur'an dan tabel kerja dari penelitian ini menurut tahapan-
morfologi Al-Khalil. Mereka menggunakan tahapannya.
Quranic Arabic Corpus milik University of a. Pemerolehan teks digital Al-Qur'an dan
Leeds dan Quranic Corpus of Haifa milik konversinya. Teks dalam bentuk dokumen
University of Haifa sebagai pedoman dan lalu (*.doc) yang telah diunduh diformat ulang
membuat analisis dan kritik terhadap konsep ke dalam bentuk teks (*.txt) dengan
dasar akar kata, serta diakhiri dengan konversi model UTF-8 pada proses save-as-
perbandingan antara keduanya dan pola nya di MS Word.
rumusan si peneliti sendiri. Dalam pengolahan b. Bahan korpus diverifikasi dengan cara
data, mereka menggunakan teknik anotasi dibaca secara manual dan otomatis untuk
semiotomatis dan rumusan CSV (Comma memastikan kelengkapan ayat Al-Qur'an
Separated Values) yang cukup kompleks. secara keseluruhan dan meng-hindari jangan
Hasilnya, rumusan pola dasar konsep morfologi sampai ada ayat yang hilang akibat proses
mereka lebih kompleks bila dibandingkan konversi digital.
dengan dua model acuannya dan menghasilkan c. Penelusuran, percobaan, dan pemilihan
lebih banyak lema atau entri kata dari aplikasi pengolah korpus yang
keseluruhan kata dalam isi Al-Qur'an. memungkinkan proses pengolahan teks
220 Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016
7 8
http://tanzil.net/ http://tanzil.net/download
Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016 221
Berikut contoh halaman aplikasi Nooj untuk Gambar 4. Contoh halaman aplikasi TextStat
mengolah teks Al-Qur'an juz 30.
MonoconcEsy
MonoconcEsy adalah program yang didesain
untuk melakukan pencarian kata ataupun
ungkapan kebahasaan. Kelebihan program ini
dapat mencari kata berikut dengan perubahan
bentuk grammatikanya, contoh: speak – speaks
– spoke – speaking, dll. Program ini merupakan
program yang dapat dijalankan dalam windows
95 hingga versi yang terbaru windows 7/8/10.
Gambar 3. Contoh halaman aplikasi Nooj
Tidak jauh berbeda dari dua aplikasi
sebelumnya, aplikasi ini tidak bisa digunakan
TextSTAT untuk menganalisis teks berbahasa Arab
TextStat adalah program yang terhitung dengan baik sebagaimana yang diperlukan
sederhana dan mudah digunakan untuk untuk analisis korpus teks Al-Qur'an . Itu
menganalisis teks. Program ini dapat membaca karena aplikasi ini hanya memiliki fitur yang
berbagai macam teks dalam banyak model terbatas, hanya dapat membaca file dengan
encoding dan file dalam bentuk HTML. format (.txt), tidak bisa membaca file selain itu,
Dengan program ini, pengguna dapat dan dalam fitur konkordansi, hasil pencarian
mengetahui frekuensi kemunculan kata dan kata yang ditampilkan terbalik-balik, sehingga
konkordansi dari setiap file yang dibuka. penyulitkan pengguna untuk membaca hasil
TextStat dapat membaca file MS Word maupun olahan teks.
OpenOffice tanpa harus dikonversi. Selain itu
program ini dapat digunakan untuk membuka
file dengan berbagai macam bahasa dan mode
encoding. Program ini dapat di jalankan dalam
system operasi windows, linux, maupun
MacOS.
membantu dan memperkaya analisis linguistik kalimat dalam teks menjadi tidak teratur
sampai ke aspek kuantitatif yang lebih luas. sebagaimana aslinya dan itu tidak
Aplikasi ini bahkan bisa mengolah file dalam memungkinkan untuk melakukan proses
ukuran yang besar dan berisi jumlah kata yang analisis konkordansi.
lebih banyak. Tidak hanya itu, aplikasi ini
dapat berjalan dalam sistem operasi Windows,
Linux, maupun MasOS.
Dalam gambar tersebut, aplikasi WordSmith kata al-jannah ‘surga’ berikut highlight pada
memperlihatkan sejumlah kata yang terdapat kata sebelumnya untuk menandakan kolokasi
dalam Al-Qur'an berikut frekuensi
kemunculannya, persentase jumlah kemunculan Penyusunan Daftar Kata dan Konkordansi
suatu kata, dan variasi kedudukan kata tersebut, dengan Aplikasi WordSmith
apakah kata itu berdiri sendiri sebagai kata Setelah digambarkan kemampuan teknis
tunggal atau membentuk kata majemuk aplikasi WordSmith untuk menganalisis teks
berangkai dengan pronomina posesif. Fungsi berbahasa Arab, berikut akan dideskripsikan
itu dimanfaatkan antara lain untuk melihat langkah-langkah penyusunan daftar kata.
produktivitas kemunculan kata yang, dalam 1. Buka aplikasi WordSmith, lalu klik menu
konsep linguistik korpus, dikaitkan dengan WordList di bagian kanan atas halaman
asumsi bahwa kata itu menjadi pokok pikiran menu utama aplikasi, sampai muncul
dalam suatu wacana kebahasaan. halaman awal WordList.
Gambar 10. Contoh halaman aplikasi WordSmith Gambar 12. Halaman menu dan pemilihan file yang
untuk melihat hasil pengolahan konkordansi akan dianalisis
Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016 225