Anda di halaman 1dari 13

Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No.

3, Maret 2016 215

Penyusunan Model Korpus Al-Qur’an Digital


Nur Hizbullah1, Fazlurrahman2, Fuzi Fauziah3
1, 2, 3
Program Studi Sastra Arab, Fakultas Sastra, Universitas Al Azhar Indonesia
Jalan Sisingamangaraja, Kebayoran Baru, Jakarta Selatan 12110

Penulis untuk Korespondensi/E-mail: nurhz@uai.ac.id

Abstrak – Penelitian ini bertujuan menyusun sebuah model file korpus Al-Qur'an digital yang
dapat digunakan sebagai bahan data primer bagi penelitian kebahasaan dalam kerangka
cabang ilmu linguistik korpus yang berkenaan dengan daftar kata (word list) dan konkordansi
(concordance) dalam Al-Qur'an. Penelitian ini menggunakan metode kombinasi antara
eksplorasi dan eksperimen yang digunakan untuk mencari berbagai aplikasi pengolah korpus
dan menguji coba satu persatu aplikasi itu untuk mengolah korpus teks Al-Qur'an bertulisan
Arab dengan segala karakteristiknya. Setelah aplikasi yang tepat ditemukan, langkah
berikutnya menggunakan metode deskriptif yaitu menguraikan secara faktual mekanisme
pengolahan bahan digital menjadi format korpus Al-Qur'an sekaligus menyusun dafar kata
dan konkordansinya dalam Al-Qur'an. Penelitian ini menunjukkan bahwa aplikasi WordSmith
adalah yang paling memadai untuk melakukan pengolahan teks berbahasa Arab dalam
kerangka linguistik korpus. Dengan prosedur dan langkah-langkah yang sesuai dengan
sistematika aplikasi tersebut, dapat dihasilkan file Al-Qur'an digital yang memenuhi syarat
teknis untuk diolah guna menyusun daftar kata dan konkordansi.

Kata kunci : linguistik korpus, korpus Al-Qur'an, daftar kata, konkordansi

Abstract – This research aims to develop a model of the corpus file digital Qur'an that can be
used as primary data for the study of language in terms of corpus linguistics branch of science
with regard to word list and concordance in the Qur'an. This research is using a combination
method of exploration and experimentation that are used to search for a variety of corpus
processing applications and tested one by one to process Arabic Qur'an text with all its
characteristics. And after having found the right application, the next step is using descriptive
method that describes in factual material processing mechanisms into digital format at the same
corpus of the Qur'an and its concordance and word list. This study shows that the WordSmith
software is the most adequate to do the Arabic text processing within the framework of corpus
linguistics. With procedures and measures in accordance with the application, it can produces a
digital file of the Qur'an that is technically qualified to be processed in order to compile a list of
words and a concordance.

Keywords: corpus linguistics, corpus Al-Qur'an, word list, concordance

ilmu bahasa, dalam hal ini bahasa Arab, Al-


PENDAHULUAN Qur'an merupakan sumber data primer karena
memiliki ragam bahasa yang baku dan tinggi,
sesungguhnya
K
Selain
eberadaan

itu,
Al-Qur’an
menjadi sumber utama bagi ajaran Islam.
Al-Qur’an juga penting
baik dalam aspek gramatika, retorika, stilistika,
maupun sisi kebahasaan Arab yang lain.
kedudukannya sebagai acuan utama berbagai Kajian kebahasaan terhadap Al-Qur'an sudah
disiplin ilmu, baik ilmu alam, ilmu pasti, menjadi perhatian para linguis Arab maupun
maupun ilmu sosial-humaniora. Bagi salah satu non-Arab sejak dahulu kala. Orientasi kajian
cabang dalam rumpun ilmu humaniora, yaitu pun beragam, mulai dari tataran bahasa paling
216 Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016

rendah, seperti fonem, morfem, lalu setingkat atau tulisan konvensional. Sejak ditemukannya
di atasnya, seperti kajian kosa kata, sampai ke teknologi komputer dan dimulainya era digital,
tataran yang lebih tinggi dan luas, yaitu kajian kini data kebahasaan berupa tulisan atau teks
struktur kalimat, kajian makna, dan kajian serta bahasa lisan yang dituliskan dapat
wacana. Beragam kajian itu memposisikan Al- disimpan dan diolah secara digital dengan lebih
Qur'an sebagai sebuah teks, dalam hal ini teks mudah. Di sinilah linguistik korpus mengambil
kebahasaan. Namun, model teks Al-Qur'an bagian, yaitu mengolah data kebahasaan yang
sendiri berkembang dari zaman ke zaman. sudah berbentuk digital.
Sebelum era digital, teks Al-Qur'an hanya
dituliskan dengan tangan di atas kertas kuno Apabila dulu Al-Qur'an hanya berupa mushaf
atau tertera di atas lembaran kertas yang konvensional bertulisan tangan dan lalu dicetak
dicetak secara konvensional lazimnya beredar dengan berbagai bentuk dan variasi tulisan,
di kalangan umat Islam dan bangsa lain. Di era seiring dengan perkem-bangan dan kemajuan
modern, khususnya di era digital, teks Al- teknologi, kini Al-Qur'an pun memasuki era
Qur'an telah dikonversi ke banyak model teks digital. Format digital Al-Qur'an kini tersedia
dan bisa diolah melalui ber-bagai piranti lunak dalam berbagai versi: ada yang berupa gambar
maupun aplikasi digital khusus, sekali lagi, dalam aplikasi Al-Qur'an digital, ada yang
dalam konteks Al-Qur’an sebagai sebuah teks berupa font yang dapat diinstalasikan ke dalam
kebahasaan. sistem operasi komputer, maupun teks digital
biasa yang bisa diakses dan diolah dengan
Situasi itu kemudian memposisikan Al-Qur'an aplikasi pengolah kata. Berbagai bentuk teks
sebagai “korpus”. Dalam ilmu linguistik, digital yang sudah ada setakat ini cukup bisa
korpus adalah sekumpulan data, bisa dimanfaatkan dalam beberapa penggunaan
konvensional maupun digital, dalam bentuk yang terbatas, seperti aplikasi Al-Qur’an digital
tertulis yang mengandung berbagai informasi untuk bacaan, dan lain sebagainya. Namun,
kebahasaan untuk diteliti mulai dari tataran untuk penelitian yang memanfaatkan format
kata, struktur, makna, dan wacana. Dalam digital teks Al-Qur’an, format yang ada masih
perkembangan terkini, teks Al-Qur'an banyak harus diolah dan diverifikasi agar dapat
diolah dalam bentuk digital dan menjadi bahan dijadikan bahan dasar bagi format baru yang
utama yang sangat penting bagi kajian disebut dengan korpus Al-Qur'an.
linguistik terhadap kitab suci pada era
penelitian lebih lanjut. Untuk menyusun format tersebut, penelitian ini
akan melakukan sejumlah langkah guna
Di masa kini, berkembang suatu cabang ilmu di menyiapkan suatu model data yang nantinya
bawah rumpun ilmu linguistik, yaitu linguistik dapat dimanfaatkan untuk berbagai kajian
korpus. Menurut pengertiannya, linguis-tik kebahasaan terhadap Al-Qur'an oleh berbagai
korpus meneliti bahasa melalui seperangkat pihak yang berminat kepada kajian bahasa Arab
data yang sifatnya alamiah, apa adanya, baik itu Al-Qur'an, terutama yang menggunakan
data tulisan maupun data lisan yang linguistik korpus. Diharapkan agar produk atau
ditranskripsikan atau dituliskan (Adolphs, hasil kajian itu nantinya dapat membantu
2006: 137). Menurut Cheng (2012: 6), mempermudah masyarakat dalam memahami
linguistik korpus menganalisis data dengan Al-Qur'an serta dan menyingkap banyak sisi
mengompilasikannya terlebih dahulu kebahasaan yang kaya akan informasi penting
berdasarkan kategori dan satuan analisisnya. seputar ajaran dan nilai Islam.
Lebih lanjut, kategori dan satuan analisis yang
paling penting dalam linguistik korpus adalah Dengan latar belakang situasi tersebut,
daftar kata (word list) dan korkondansi penelitian ini sesungguhnya bertujuan
(concordance). Daftar kata berisi semua kata menyusun sebuah model file korpus Al-Qur'an
yang terdapat dalam data dan disertai dengan digital yang dapat digunakan sebagai bahan
jumlah frekuensi kemunculan kata dalam teks. data primer bagi penelitian kebahasaan dalam
Adapun konkordansi adalah daftar kata-kata kerangka cabang ilmu linguistik korpus yang
yang berkolokasi dan membentuk suatu makna berkenaan dengan daftar kata (word list) dan
berdasarkan konteks dan koteksnya (Adolphs, konkordansi (concordance) dalam Al-Qur'an.
2006: 136). Dahulu kala, semua data
kebahasaan tulisan masih berupa manuskrip
Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016 217

Dengan mengacu kepada tujuan penelitian satu bahan ajar bahasa Arab diplomasi sebagai
tersebut, maka rumusan masalah penelitian ini kosa kata yang harus dikenali dan dikuasai oleh
terfokus pada model file korpus Al-Qur'an mahasiswa/pembelajar. Demikian pula di
digital yang dapat dijadikan bahan data primer bidang-bidang lainnya, penelitian ini nantinya
bagi penelitian kebahasaan dalam kerangka dapat menawarkan suatu metodologi
linguistik korpus. Adapun pertanyaan penyusunan korpus dari suatu teks sumber
penelitian yang diajukan adalah: kebahasaan.
1. Aplikasi apa yang paling representatif
digunakan untuk membuat model file
korpus Al-Qur'an digital? TEORI TENTANG LINGUISTIK KORPUS
2. Bagaimana format file yang dapat diolah
aplikasi tersebut? Penelitian ini sesungguhnya adalah sebuah
3. Bagaimana format isi teks digital yang akan model dari kajian dalam bidang ilmu linguistik
diolah dengan aplikasi tersebut? korpus. Menurut pengertiannya, linguistik
4. Bagaimana teknik membuat daftar kata dan korpus adalah sebuah metode empiris dalam
konkordansi dalam Al-Qur'an dengan analisis dan deskripsi linguistik untuk meneliti
menggunakan aplikasi tersebut? bahasa yang dipakai oleh para penutur secara
alamiah. Bahasa itu dikompilasikan
Bidang penelitian linguistik korpus berdasarkan kategori tertentu lalu diteliti
sesungguhnya sangatlah luas. Demikian pula dengan tujuan mencapai pemahaman yang
dengan Al-Qur’an sebagai objek penelitian. benar dari pemakaian bahasa tersebut (Cheng,
Oleh karena itu, lingkup penelitian ini dibatasi 2012:6, 29-30). Pada tahun 1980-an, Linguistik
hanya pada aspek pengolahan bahan data Korpus mulai me-rambah kepada pemanfaaan
digital bernama “Al-Mushaf Al-Imla’i” dengan teknologi komputer dan itu cukup
menggunakan aplikasi pengolah korpus yang membangkitkan gairah perkembangan
representatif untuk menghasilkan format digital metodologi korpus. Sejak itu, kemunculan
standar yang dapat digunakan untuk melakukan sejumlah korpus dan kajian berbasis korpus
pemetaan daftar kata dan konkordansi dalam semakin meningkat drastis. Pada masa kini,
Al-Qur'an. metodologi korpus sudah sangat populer dan
bahkan digunakan di berbagai macam riset
Penelitian ini diharapkan nantinya secara multidisiplin ilmu pengetahuan.
khusus dapat memberikan kontribusi berupa :
1. Terbentuknya model teks digital Al-Qur'an Dalam hal penyusunan korpus bahasa, kini
yang bisa digunakan untuk pemetaan daftar sudah tersedia banyak sekali model korpus
kata dan konkordansi; bahasa. Wikipedia, misalnya, mendata ada
2. contoh model pemetaan daftar dan sejumlah korpus bahasa yang dibagi ke dalam
konkordansi kata dan kalimat dalam Al- beberapa kelompok bahasa. Uniknya, bahasa
Qur'an, serta Inggris berada dalam kelompok tersendiri
3. gambaran langkah, prosedur, dan karena ketersediaan banyak sekali ragam dan
sistematika penelitian korpus Al-Qur'an sumber korpusnya, seperti yang paling
menggunakan bahan digital. terkemuka dan termutakhirkan adalah British
National Corpus (BNC), American National
Penelitian ini memang hanya terfokus pada Al- Corpus (ANC), Corpus of Contemporary
Quran digital sebagai model awal. Namun American English (COCA), dan lain
demikian, nantinya model dan prosedur yang sebagainya. Selain bahasa Inggris korpus
ada dapat digunakan secara luas dalam berbagai bahasa-bahasa dunia dimuat daftarnya di laman
kajian maupun keperluan di bidang bahasa wikipedia dalam kelompok-kelompok bahasa
Arab. Sebagai contoh, penyusunan daftar kata Eropa, bahasa Timur Tengah, bahasa Asia
ataupun kamus bahasa di bidang khusus dapat Timur, korpus paralel multibahasa, dan korpus
menggunakan pendekatan ini. Daftar istilah perbandingan antarbahasa.1
bahasa Arab di bidang diplomasi, misalnya,
dapat diambilkan dari sejumlah teks berbahasa
Arab yang berkisar pada topik-topik 1
kediplomasian. Manfaat berikutnya, daftar https://en.wikipedia.org/wiki/List_of_text_
istilah tersebut dapat digunakan sebagai salah corpora, diakses 29 Juli 2016
218 Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016

Dalam penyusunan korpus bahasa Arab, kebahasaan Al-Qur'an, di antaranya adalah


melalui aplikasi Sketch Engine, misalnya, telah QuranCode. Namun, aplikasi ini hanya
tersedia korpus yang berisi lebih kurang 5,8 memberikan gambaran jumlah kata dan
juta kata (versi 2012) dan dikembangkan gramatika kata-kata dalam Al-Qur'an meski
menjadi 8,3 juta kata (versi 2015)2 yang dilengkapi dengan informasi klasifikasi ayat
diambil dari berbagai sumber. Selain itu, berdasarkan kategori makiyah dan madaniyah,
tercatat ada sekitar 18 jenis korpus dari pencarian kata, dan lain-lain.6 Aplikasi ini
berbagai sumber dalam sublaman University of belum optimal fungsinya jika harus digunakan
Leeds, di antaranya Corpus of Contemporary untuk keperluan analisis korpus yang lebih
Arabic, Arabic Gigaword, dan yang sedang luas.
dalam pengembangan adalah International
Corpus of Arabic oleh University of Yang menjadi catatan penelitian ini sampai
Alexandria, Mesir.3 bagian ini adalah belum adanya model file Al-
Qur'an digital yang tersedia dan dapat
Di samping sudah tersedianya korpus bahasa digunakan untuk melakukan analisis korpus
Arab, disusun pula korpus khusus mengenai serta cara pengolahan file tersebut dengan
Al-Qur'an dengan menggunakan berbagai aplikasi tertentu. Atas dasar itulah, penelitian
pendekatan dan aplikasi. Yang paling ini memandang perlunya penyusunan model
representatif kiranya adalah karya University of korpus Al-Qur'an digital untuk penelitian
Leed, yaitu The Quranic Arabic Corpus.4 Lebih dengan pendekatan linguistik korpus.
dari sekadar korpus Al-Qur'an, laman itu
menyediakan berbagai peta analisis kebahasaan Penelitian ini mengacu antara lain kepada
Al-Qur'an, seperti terjemah kata-per-kata sejumlah penelitian terdahulu yang terkait
dengan bahasa Inggris, kamus Al-Qur'an, dengan korpus bahasa Arab dan khususnya
“pohon” sintaksis struktur konsep dan kata korpus Al-Qur'an. Di Indonesia, kajian
dalam Al-Qur'an, dan gramatika Al-Qur'an. linguistik korpus tergolong baru, apalagi
Laman ini menyediakan pula file Al-Qur'an terhadap teks-teks keagamaan seperti Al-
digital dalam format *.txt yang bisa diunduh Qur'an. Oleh karena itu, dipilihlah beberapa
untuk bahan analisis. Namun, file tersebut penelitian dari luar negeri yang berkenaan
hanya berisi teks Al-Qur'an bertransliterasi dengan korpus Al-Qur'an berikut ini.
latin, bukan Arab, meski dilengkapi dengan
status gramatikal setiap kata dalam Al-Qur'an. Khan dan Alginahi (2013) menulis laporan
Hal itu menjadi tantangan tersendiri bagi penelitian tentang tantangan dan keperluan
langkah analisis teks Al-Qur'an dengan aplikasi digitalisasi Al-Qur'an. Dengan metode survei
pengolah korpus. menggunakan kuesioner, mereka mencoba
melihat sejauh mana kebutuhan umat Islam
Pendalaman lebih lanjut dilakukan Sharaf terhadap upaya digitalisasi Al-Qur'an dalam
(2009). Melalui situs resminya, Sharaf konteks penggunaannya untuk keperluan rutin
memperkenalkan serangkaian kajiannya berikut seperti membaca dan mempelajarinya. Para
hasil pemetaan konseptual dengan aplikasi peneliti menyimpulkan, secara umum, umat
khusus. Namun, tidak dapat ditemukan bahan Islam yang menjadi responden penelitian
digital olahannya yang dapat diunduh dan mereka, terlebih generasi muda yang sudah
dimanfaatkan oleh para peneliti lain untuk akrab dengan teknologi, merasa perlunya
melakukan ataupun melanjutkan pekerjaannya.5 langkah segera dan menyeluruh bagi
digitalisasi Al-Qur'an. Untuk mendukung hal
Selain laman web, ada pula beberapa aplikasi itu, penelitian mereka merekomendasikan agar
khusus yang berisi data dan analisis gramatika format digital Al-Qur'an dibuat semudah dan
seramah mungkin dengan pengguna serta
diawasi dan dikendalikan oleh lembaga yang
2
https://www.sketchengine.co.uk/artenten-corpus/ berwenang agar tidak terjadi dan tersebar
diakses 29 Juli 2016 kesalahan-kesalahan yang dapa merusak
3
http://www.comp.leeds.ac.uk/eric/latifa/arabic_c
kesucian Al-Qur'an.
orpora.htm, diakses 29 Juli 2016
4
http://corpus.quran.com/ diakses 29 Juli 2016
5
http://www.textminingthequran.com/wiki/QurCo
6
ncord, diakses 29 Juli 2016 http://heliwave.com, diakses 29 Juli 2016
Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016 219

Salah satu langkah penyusunan korpus bahasa Berdasarkan informasi dari sejumlah penelitian
Arab yang mencantumkan Al-Qur'an sebagai terdahulu, dapat dikatakan bahwa belum ada
salah satu sumbernya adalah yang dilakukan atau belum ditemukan karya yang khusus
oleh Alrabia (et.al., 2014). Mereka menamakan mengkaji teknik pembuatan model file digital
korpusnya dengan King Saud University Al-Qur'an untuk keperluan penelitian linguistik
Corpus of Classical Arabic. Sesuai namanya, korpus. Dari segi hasil pun, peneliti melihat
mereka hanya mengambil korpus dari bahasa belum ada model korpus Al-Qur'an yang
Arab periode klasik dan Al-Qur'an termasuk ke sederhana dan dapat dijadikan model bagi
dalam periode itu. Mereka beralasan bahwa pembuatan korpus, dalam hal ini, yang
pola bahasa Arab klasik adalah basis teori berbahasa Arab. Oleh karena itu, yang berbeda
linguistik Arab dan harus diperlakukan serta dari hasil penelitian ini bila dibandingkan
dipahami secara akademis. Korpus ini dengan hasil penelitian terdahulu adalah pada
mencakup 50 juta kata dari khazanah bahasa model korpus yang dihasilkan. Selain hasil,
Arab klasik dan digunakan untuk kepentingan penelitian ini juga memberikan langkah-
studi distribusi semantik leksikal Al-Qur'an dan langkah aplikatif tentang cara pembuatan
bahasa Arab klasik dengan pendekatan model file korpus terutama terkait data yang
linguistik komputasional. Namun, selain berbahasa Arab.
menggambarkan struktur korpus, penelitian
mereka juga mendeskripsikan gejala perubahan
bahasa dari masa klasik ke masa kini. METODE PENELITIAN

Sharaf dan Atwell (2012). Mereka membuat Penelitian ini menggunakan kombinasi
“QurAna”, korpus Al-Qur'an beranotasi pada beberapa metode terkait dengan kondisi data
anafora pronominal. Penelitian mereka hanya dan tujuan penelitian. Metode pertama adalah
terfokus pada analisis pronomina dalam Al- kombinasi antara eksplorasi dan eksperimen
Qur'an dan pola kemunculan anafora yang yang digunakan untuk mencari berbagai
terkait dengan pronomina dan antesedennya aplikasi pengolah korpus dan menguji coba satu
dalam teks-teks ayat Al-Qur'an. Model analisis persatu aplikasi itu untuk mengolah korpus teks
penelitian ini berguna bagi analisis pronomina, Al-Qur'an bertulisan Arab dengan segala
anafora, dan antesedennya dalam wacana karakteristiknya. Setelah aplikasi yang tepat
bahasa Arab modern dan perbandingan antara ditemukan, langkah berikutnya menggunakan
kedua masa itu. metode deskriptif yaitu menguraikan secara
faktual mekanisme pengolahan bahan digital
Salah satu contoh lain penelitian korpus Al- menjadi format korpus Al-Qur'an sekaligus
Qur'an namun lebih spesifik adalah karya Imad menyusun dafar kata dan konkordansinya
dan Abdelhak (2016) melakukan penelitian dalam Al-Qur'an.
untuk menyusun korpus Al-Qur'an khusus
untuk penelitian morfologi Arab. Mereka Berikut digambarkan prosedur dan mekanisme
menggunakan teks Al-Qur'an dan tabel kerja dari penelitian ini menurut tahapan-
morfologi Al-Khalil. Mereka menggunakan tahapannya.
Quranic Arabic Corpus milik University of a. Pemerolehan teks digital Al-Qur'an dan
Leeds dan Quranic Corpus of Haifa milik konversinya. Teks dalam bentuk dokumen
University of Haifa sebagai pedoman dan lalu (*.doc) yang telah diunduh diformat ulang
membuat analisis dan kritik terhadap konsep ke dalam bentuk teks (*.txt) dengan
dasar akar kata, serta diakhiri dengan konversi model UTF-8 pada proses save-as-
perbandingan antara keduanya dan pola nya di MS Word.
rumusan si peneliti sendiri. Dalam pengolahan b. Bahan korpus diverifikasi dengan cara
data, mereka menggunakan teknik anotasi dibaca secara manual dan otomatis untuk
semiotomatis dan rumusan CSV (Comma memastikan kelengkapan ayat Al-Qur'an
Separated Values) yang cukup kompleks. secara keseluruhan dan meng-hindari jangan
Hasilnya, rumusan pola dasar konsep morfologi sampai ada ayat yang hilang akibat proses
mereka lebih kompleks bila dibandingkan konversi digital.
dengan dua model acuannya dan menghasilkan c. Penelusuran, percobaan, dan pemilihan
lebih banyak lema atau entri kata dari aplikasi pengolah korpus yang
keseluruhan kata dalam isi Al-Qur'an. memungkinkan proses pengolahan teks
220 Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016

berbahasa Arab dan penerapan fungsi


penyusunan daftar kata dan konkordansi.
d. Dari bahan korpus yang sudah diverifikasi,
dibuatlah contoh model penyusunan daftar
kata dan konkordansi kata dalam Al-Qur'an
secara digital.

Data penelitian ini berupa ayat-ayat Al-Qur'an


yang terdiri atas kata dan kalimat yang Gambar 1. Contoh perbedaan Mushaf Imla’i
bersumber dari teks digital “Al-Mushaf Al- dari Mushaf Usmani dalam penelitian Ismail
Imla’iy”. Bahan tersebut diunduh dari dan Rahman (2016: 44)
tanzil.net.7 Karakteristik teks ini di antaranya
berasal dari teks periwayatan termasyhur di Secara digital, kedua jenis tulisan Mushaf
kalangan para ahli qiraah, yaitu riwayat Hafs Usmani dan Mushaf Imla’i sudah ada dan
dari ‘Ashim. Teks ini juga mengacu kepada tersebar luas penggunaannya dalam berbagai
mushaf dengan ortografi Usmani, yaitu mushaf aplikasi. Namun, untuk aplikasi digital
yang merujuk kepada kodifikasi Usman bin pengolahan kata, Mushaf Imla’i lebih banyak
‘Affan. Lebih lanjut, karena ada perbedaan dipakai karena bentuknya yang standar dengan
ortografi dengan model ortografi Arab standar kaidah penulisan Arab standar baku hingga
modern, maka ortografi Usmani itu disesuaikan kini. Adapun Mushaf Usmani tidak banyak
menjadi ortografi Arab standar modern. Itulah digunakan karena kekhasan karakteristik
yang disebut dengan Al-Mushaf Al-Imla’iy. tulisannya dan dianggap tulisan baku Al-Qur'an
sejak masa awal penulisannya dan bahkan ada
sebagian ahli ortografi Arab yang
HASIL DAN PEMBAHASAN memperlakukannya sebagai tulisan yang
“sakral” dan tak boleh diganggu-gugat apalagi
Pemerolehan File Al-Qur'an Digital Mushaf dimodifikasi menjadi format lainnya.
Imla’i dan Pengoversiannya
Ismail dan Rahman (2016: 44) menyebutkan, Untuk keperluan pengolahan teks digital,
mushaf Imla’i merupakan versi mushaf Al- penelitian ini memanfaatkan teks yang tersedia
Quran yang ditulis berdasarkan kaidah pada laman tanzil.net.8 Teks yang tersedia ada
penulisan bahasa Arab biasa atau standar baku dua jenis, yaitu Usmani dan Imla’i. Namun,
yang disebut Rasm Imla’i atau Rasm Qiyasi. yang dimanfaatkan untuk penelitian ini adalah
Struktur penulisan kata dalam Al-Quran (rasm) yang berjenis Imla’i. Lebih lanjut, teks yang
dan tanda-tanda (dabt atau diakritik) dalam dipilih tidak mengandung tanda-tanda diakritik,
Mushaf Imla’ī memiliki perbedaan dari apa jadi hanya berisi rangkaian huruf dalam semua
yang ada dalam Mushaf ‛Usmani, yaitu mushaf kata. Dengan demikian, pengolahan file dalam
standar yang ditulis sejak era Khalifah Usman aplikasi korpus akan lebih mudah dan terbebas
bin ‘Affan. Secara khusus, perbedaan tersebut dari kendala teknis.
dapat dilihat pada lima faktor teknik ortografi,
yaitu pembuangan huruf (hadhf), penambahan Setelah file tersebut didapatkan, perlu
huruf (ziyadah), penukaran huruf (badl), dipastikan bahwa encoding konversinya
penyambungan dua kata (wasl), dan pemisahan menggunakan UTF-8 dan disimpan dengan
dua ekstensi *.txt dari semula *.doc. Pemilihan dan
kata (fasl). penggunaan encoding UTF-8 disarankan dalam
petunjuk teknis penggunaan dan pengolahan
file di laman tanzil.net. Setelah diuji coba,
dapat dikonfirmasikan bahwa mode konversi
selain encoding UTF-8 tak berterima bagi
hampir semua aplikasi pengolah korpus. Secara
teknis, hanya file dengan ekstensi *.txt dengan
mode konversi UTF-8 saja yang dapat diolah
dengan aplikasi korpus.

7 8
http://tanzil.net/ http://tanzil.net/download
Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016 221

Beberapa aplikasi yang ada, misalnya, hanya


mampu membaca teks Arab, tetapi tidak
mampu membuat susunan kalimat dengan pola
yang berlaku pada tulisan Arab (dari kanan ke
kiri). Untuk memecahkan masalah tersebut,
selain mencari dan mengonsultasikan masalah
ini ke praktisi dan ahli linguistik korpus dari
Universitas Indonesia, peneliti juga
mengeksplorasi dan mempelajari beberapa pola
Gambar 2. Mekanisme konversi file Al-Qur'an korpus bahasa Arab yang ada dan model-model
digital dari *.doc ke *.txt dengan encoding analisisnya lalu mencoba melakukan
menggunakan UTF-8 dan contoh teks Mushaf Imla’i eksperimen pengolahan korpus dengan aplikasi
tersebut. Berikut ulasan tentang beberapa
Verifikasi Bahan Korpus aplikasi yang ditemukan dan dicoba untuk
Sebelum diolah dengan aplikasi, bahan korpus mengolah korpus teks Al-Qur'an.
yang sudah dikonversi kemudian harus
diverifikasi dengan cara dibaca secara manual Nooj
untuk memastikan kelengkapan ayat Al-Qur'an Nooj adalah sebuah aplikasi pengolah korpus
secara keseluruhan dan menghindari jangan yang memungkinkan ahli bahasa untuk
sampai ada ayat yang hilang akibat proses melakukan analisis linguistik terhadap ortografi
konversi digital. Hal ini sengaja dilakukan dan ejaan, kamus suatu topik tertentu, pola-pola
secara khusus terhadap teks Al-Qur'an karena kalimat, dan sebagainya. Nooj memfasilitasi
statusnya sebagai kitab suci demi menjaga agar penggunanya untuk dapat memberikan
jangan sampai ada unsur teks yang hilang deskripsi setiap fenomena linguistik serta alat
karena pasti berdampak kepada hasil akhir dari yang digunakan untuk penentuan klasifikasi
proses pengolahan korpus. Bagaimana pun, kelas kata dalam kalimat suatu bahasa yang
proses konversi teks dari suatu format ke dirancang dengan sangat efisien. Aplikasi ini
format lain selalu berisiko terhadap kondisi juga memungkinkan penggunanya untuk
teks, terlebih jika teks itu ditulis dalam bahasa kuantifikasi teks secara otomatis, menyusun
dengan sistem ortografi yang tidak sama konkordansi, menyortir lema untuk kamus,
dengan sistem ortografi bahasa latin. melakukan analisis statistik, dan lain-lain.
Cara verifikasi manual yang dilakukan adalah Nooj tersedia dan dapat diunduh secara cuma-
dengan membaca teks ayat demi ayat, sambil cuma dengan beberapa modul untuk
merujuknya ke bacaan tilawah Al-Qur'an multibahasa, antara lain Acadian, Arab,
dengan tempo yang lambat. Pembacaan Armenia, Bulgaria, Catalan, Cina, Kroasia,
dilakukan secara bertahap surah demi surah, juz Prancis, Inggris, Jerman, Ibrani, Yunani,
demi juz, sampai tuntas sebanyak 114 surah Hungaria, Italia, Polandia, Portugis, Spanyol
dalam 30 juz. Penting untuk dipastikan ada atau dan Turki. Nooj dapat bekerja dalam sistem
tidak unsur teks yang hilang dalam file digital operasi MS-Windows, Mac OS X, LINUX dan
Al-Qur'an yang akan diolah. Setelah dipastikan BSD Unix.
kelengkapan dan keutuhan teks, barulah file
tersebut bisa diolah melalui aplikasi khusus. Saat dicoba digunakan untuk analisis teks Al-
Qur'an, aplikasi ini menunjukkan kekurangan
Pemilihan Aplikasi Pengolah Korpus dan itu menjadi kendala teknis yang tidak
Setelah file digital didapat dan dikonversi, memungkinkan bagi analisis linguistik korpus
langkah berikutnya adalah pencarian, uji coba, lebih lanjut, yaitu:
dan pemilihan aplikasi pengolah korpus. a. Program ini selalu memerlukan aplikasi
Aplikasi itu sesungguhnya cukup banyak yang penunjang Java untuk menjalankanya.
bisa dipilih. Namun, karakteristik bahasa Arab b. File eksekutor Nooj.exe tidak terdapat
dan ortografinya yang relatif berbeda dari dalam folder program yang sudah
banyak bahasa pada umumnya, seperti arah terinstalasi, sehingga seringkali program
tulisan dari kanan ke kiri, keberadaan tanda sulit ataupun bermasalah dalam
diakritik, dan jenis serta bentuk huruf yang eksekusinya.
spesifik, membuat pilihan menjadi terbatas.
222 Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016

c. Program ini tidak menunjang untuk


kalkulasi daftar kata dan kolokasi, hanya
bisa untuk konkordansi saja.
d. Program ini tidak memiliki material lexical
resources untuk bahasa Arab sehingga tidak
bisa dipakai untuk menganalisis data
berbahasa Arab yang kompleks dan
beragam.

Berikut contoh halaman aplikasi Nooj untuk Gambar 4. Contoh halaman aplikasi TextStat
mengolah teks Al-Qur'an juz 30.
MonoconcEsy
MonoconcEsy adalah program yang didesain
untuk melakukan pencarian kata ataupun
ungkapan kebahasaan. Kelebihan program ini
dapat mencari kata berikut dengan perubahan
bentuk grammatikanya, contoh: speak – speaks
– spoke – speaking, dll. Program ini merupakan
program yang dapat dijalankan dalam windows
95 hingga versi yang terbaru windows 7/8/10.
Gambar 3. Contoh halaman aplikasi Nooj
Tidak jauh berbeda dari dua aplikasi
sebelumnya, aplikasi ini tidak bisa digunakan
TextSTAT untuk menganalisis teks berbahasa Arab
TextStat adalah program yang terhitung dengan baik sebagaimana yang diperlukan
sederhana dan mudah digunakan untuk untuk analisis korpus teks Al-Qur'an . Itu
menganalisis teks. Program ini dapat membaca karena aplikasi ini hanya memiliki fitur yang
berbagai macam teks dalam banyak model terbatas, hanya dapat membaca file dengan
encoding dan file dalam bentuk HTML. format (.txt), tidak bisa membaca file selain itu,
Dengan program ini, pengguna dapat dan dalam fitur konkordansi, hasil pencarian
mengetahui frekuensi kemunculan kata dan kata yang ditampilkan terbalik-balik, sehingga
konkordansi dari setiap file yang dibuka. penyulitkan pengguna untuk membaca hasil
TextStat dapat membaca file MS Word maupun olahan teks.
OpenOffice tanpa harus dikonversi. Selain itu
program ini dapat digunakan untuk membuka
file dengan berbagai macam bahasa dan mode
encoding. Program ini dapat di jalankan dalam
system operasi windows, linux, maupun
MacOS.

Namun, saat dicoba untuk mengolah teks Al-


Qur'an, program ini menampilkan dalam menu
word frequency dan word form masih banyak
kata-kata yang terpenggal, seperti: kata ‫الذين‬ Gambar 5. Contoh halaman aplikasi MonoconcEsy
/alladzi:na/, kata ‫ ين‬menjadi 1 penggalan kata
sendiri, terpisah dari bagian depannya ‫ الذ‬. Hal AntConc
ini menandakan ada masalah sistemik dalam Seperti aplikasi yang lainnya, AntConc
aplikasi itu untuk berinteraksi dengan teks merupakan aplikasi yang digunakan untuk
berbahasa Arab. Amat riskan kiranya jika melakukan analisis teks dan konkordansi.
aplikasi itu digunakan untuk analisis teks Al- Namun, dibandingkan dengan yang lainnya,
Qur'an karena pasti akan menimbulkan banyak aplikasi ini relatif lebih berkembang dan kaya
masalah pada bentuk-bentuk kata yang menu untuk mengolah teks. Artinya, aplikasi
terpotong dan tidak bisa diidentifikasi lebih ini mampu melakukan analisis dan penyusunan
lanjut untuk analisis linguistik. daftar kata, dan konkordansi. Lebih dari itu,
menu-menu statistik pada aplikasi ini sangat
Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016 223

membantu dan memperkaya analisis linguistik kalimat dalam teks menjadi tidak teratur
sampai ke aspek kuantitatif yang lebih luas. sebagaimana aslinya dan itu tidak
Aplikasi ini bahkan bisa mengolah file dalam memungkinkan untuk melakukan proses
ukuran yang besar dan berisi jumlah kata yang analisis konkordansi.
lebih banyak. Tidak hanya itu, aplikasi ini
dapat berjalan dalam sistem operasi Windows,
Linux, maupun MasOS.

Meski secara umum lebih unggul dibanding


aplikasi pengolah korpus lainnya, program ini
tetap saja memiliki kendala untuk mengolah
teks berbahasa Arab, yaitu:
a. seringkali gagal membaca file;
b. program ini hanya dapat membaca file
dengan format *.txt, maka pengguna harus Gambar 8. Contoh halaman aplikasi AntCont untuk
mengkonversi file dengan format yang melihat hasil pengolahan konkordansi
berbeda agar dapat dibaca;
c. program ini tidak dapat konsisten membaca WordSmith
teks berbahasa arab dengan sempurna meski Dibanding aplikasi-aplikasi lainnya,
encoding sudah menggunakan UTF-8. WordSmith adalah yang paling lengkap dan
paling representatif. Yang lebih utama,
kemampuannya untuk mengolah teks
multibahasa sudah memadai, lengkap dengan
konten penyesuaian sistem yang diperlukan
untuk menganalisis teks berbagai bahasa yang
memiliki keunikan ortografi dan kesulitan
teknis lainnya. Lebih lanjut, aplikasi ini
menyediakan fasilitas konversi teks yang
memungkinkan kustomisasi yang optimal bagi
teks yang akan dianalisis.
Gambar 6. Contoh halaman aplikasi AntCont untuk
melihat file konversian ke *.txt Selain daftar kata dan konkordansi, aplikasi ini
juga menyediakan fasilitas untuk menganalisis
d. Dalam fitur word list, kata-kata terpecah kata-kata kunci dalam suatu wacana yang
menjadi huruf sehingga fitur ini tidak terkandung dalam teks. Kata kunci adalah
maksimal fungsinya untuk menghitung sejumlah kata yang paling produktif muncul
jumlah kata dalam sebuah file. dalam suatu teks dan diasumsikan sebagai
“pusat wacana” dari teks tersebut. Namun, kata
kunci bukanlah kata tugas, seperti preposisi,
kata sambung dll yang memang sering muncul
dalam wacana.

Gambar 7. Contoh halaman aplikasi AntCont untuk


melihat hasil pengolahan word list

e. Dalam fitur concordance, susunan kata


dalam hasil pencarian tidak teratur. Artinya,
aplikasi AntCont gagal membaca teks Gambar 9. Contoh halaman aplikasi WordSmith
berbahasa Arab dengan sistem arah tulisan untuk melihat hasil pengolahan daftar kata
dari kanan-ke-kiri. Lebih dari itu, susunan berikut frekuensi kemunculannya
224 Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016

Dalam gambar tersebut, aplikasi WordSmith kata al-jannah ‘surga’ berikut highlight pada
memperlihatkan sejumlah kata yang terdapat kata sebelumnya untuk menandakan kolokasi
dalam Al-Qur'an berikut frekuensi
kemunculannya, persentase jumlah kemunculan Penyusunan Daftar Kata dan Konkordansi
suatu kata, dan variasi kedudukan kata tersebut, dengan Aplikasi WordSmith
apakah kata itu berdiri sendiri sebagai kata Setelah digambarkan kemampuan teknis
tunggal atau membentuk kata majemuk aplikasi WordSmith untuk menganalisis teks
berangkai dengan pronomina posesif. Fungsi berbahasa Arab, berikut akan dideskripsikan
itu dimanfaatkan antara lain untuk melihat langkah-langkah penyusunan daftar kata.
produktivitas kemunculan kata yang, dalam 1. Buka aplikasi WordSmith, lalu klik menu
konsep linguistik korpus, dikaitkan dengan WordList di bagian kanan atas halaman
asumsi bahwa kata itu menjadi pokok pikiran menu utama aplikasi, sampai muncul
dalam suatu wacana kebahasaan. halaman awal WordList.

Setelah daftar kata, fungsi lain yang dapat


dilakukan oleh WordSmith adalah analisis
konkordansi. Konkordansi berisi daftar kata
dalam suatu wacana, tapi tidak berurusan
dengan frekuensi kemunculannya, melainkan
dengan ada kata apa di sekitar kata yang
bersangkutan. Dalam analisis ini, suatu kata
dilihat dalam kaitannya dengan kata lain di Gambar 11. Halaman awal aplikasi WordSmith dan
sekitarnya. Model analisis ini erat kaitannya menu WordList
dengan telaah makna kontekstual dalam bidang
ilmu semantik leksikal dan leksikologi serta 2. Buat file baru melalui menu File lalu
kajian wacana pada umumnya. Secara mudah, submenu New maka akan muncul halaman
aplikasi ini mengurutkan daftar kata yang dicari berikut. Semula, menu Change Selection
dan ingin dilihat kaitannya dengan kata lain belum menunjukkan ada file yang dipilih.
secara kolokasional dalam kalimat tempat kata Setelah diklik, akan muncul halaman seperti
itu berada. Dari situlah peneliti dapat di bagian kanan bawah berikut, lalu cari
mengidentifikasi satu persatu aspek kontekstual folder tempat file Al-Qur'an digital berada
dan kotekstual dari suatu kata untuk kemudian dan pindahkan ke halaman bagian kanan
ditentuan maknanya secara lebih akurat. Files selected, lalu klik OK di bagian kanan
atas halaman.

Gambar 10. Contoh halaman aplikasi WordSmith Gambar 12. Halaman menu dan pemilihan file yang
untuk melihat hasil pengolahan konkordansi akan dianalisis
Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016 225

3. Setelah teks yang dipilih muncul di


halaman semula, klik menu Make a word
list now, maka akan muncul halaman seperti
di kanan bawah berikut.

Gambar 14. Halaman awal aplikasi WordSmith dan


menu Concord
2. Buat file baru melalui menu File lalu
Gambar 13. Halaman eksekusi penyusunan daftar submenu New maka akan muncul halaman
kata dan kemunculan hasil dalam berikut. Semula, menu Change Selection
peringkat 20 besar teratas. belum menunjukkan ada file yang dipilih.
Setelah diklik, akan muncul halaman seperti
Dari gambar tersebut, terlihat bahwa kata di bagian kanan bawah berikut, lalu cari
“Allah” adalah kata yang paling produktif atau folder tempat file Al-Qur'an digital berada
paling banyak muncul di dalam Al-Qur'an. dan pindahkan ke halaman bagian kanan
Sekali lagi, kata-kata tugas seperti ‫ من‬/min/, ‫في‬ Files selected, lalu klik OK di bagian kanan
/fi:/ dan beberapa kata tugas lain yang tampak atas halaman.
dalam daftar tidak dihitung karena sifat dan
kedudukannya yang suplementer dalam
susunan kalimat ayat-ayat Al-Qur'an maupun
dalam wacana tekstual yang umum. Yang
menarik, misalnya, ada kata kerja yang paling
produktif muncul dalam Al-Qur'an, yaitu ‫قال‬
/qa:la/ ‘berkata’ (makhluk) ‘berfirman’ (Allah)
‘bersabda’ (Rasul). Secara semantis, fenomena
itu mengisyaratkan sesuatu terkait wacana
dalam Al-Qur'an secara umum dan bisa
didalami lebih lanjut berdasarkan konteks- Gambar 15. Halaman menu dan pemilihan file yang
konteks tertentu yang tersebar dalam berbagai akan dianalisis
ayat di dalam Al-Qur'an.
3. Setelah teks yang dipilih muncul di halaman
Setelah gambaran proses penyusunan daftar semula, klik menu Search Word, maka akan
kata, berikut gambaran proses penyusunan muncul halaman seperti berikut.
konkordansi dalam Al-Qur'an.
1. Buka aplikasi WordSmith, lalu klik menu
Concord di bagian kiri atas halaman menu
utama aplikasi, sampai muncul halaman
awal Concord.
226 Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016

tanpa menyertakan tanda-tanda diakritik


(harakat) yang dapat mengganggu teknis
pengolahan file.
4. Proses membuat daftar kata dan
konkordansi dalam Al-Qur'an dengan
menggunakan aplikasi tersebut didasarkan
sepenuhnya atas teknik-teknik yang tersedia
dalam aplikasi secara memadai untuk
mendapatkan hasil yang maksimal dan
minim kendala teknis.
Gambar 16. Halaman eksekusi penyusunan 5. Secara khusus, model file digital semacam
konkordansi dan kemunculan hasil dalam ini dapat digunakan oleh para peneliti
susunan 20 teratas. pemula yang ingin menggunakan Al-Qur'an
sebagai korpus data penelitiannya. Selain
Dari gambar tersebut, kita misalnya akan itu, mekanisme yang diuraikan dalam
mencari konkordansi kata ‫ العالمين‬/al-‘a:lami:n/ penelitian ini diharapkan dapat menjadi
‘alam semesta’. Terlihat bahwa kata itu sangat model bagi peneliti lain dalam hal tata
dekat kata ّ‫ رب‬/rabb/ ‘Penguasa’ ‘Tuhan’. laksana pembuatan korpus data berbahasa
Secara semantis, fenomena itu mengisyaratkan Arab.
bahwa kata ‫ العالمين‬berkolokasi erat dengan kata
ّ‫ رب‬/rabb/. Oleh karena itu, dapat disimpulkan Untuk lebih jauh lagi melanjutkan dan
bahwa kedua kata membentuk kolokasi berupa mengembangkan penelitian sederhana ini,
kata majemuk dan bermakna tunggal atau berikut saran-saran yang diajukan.
menyatu antara keduanya. 1. Perlunya penelitian linguistik korpus secara
bertahap namun berkelanjutan dan
Demikian secara ringkas gambaran proses dan komprehensif terhadap Al-Qur'an khususnya
langkah-langkah penyusunan daftar kata dan untuk dihubungkan dengan bidang ilmu
konkordansi dalam Al-Qur'an dengan aplikasi linguistik yang lain, seperti morfosintaksis,
WordSmith yang ternyata secara teknis mampu semantik, pragmatik, wacana, leksikografi,
mengatasi masalah-masalah teknis ortografi dan penerjemahan, terutama dalam
nonbahasa Latin. kaitannya dengan penerjemahan Al-Qur'an
ke dalam bahasa Indonesia.
2. Perlunya lebih digalakkan pendekatan
KESIMPULAN DAN SARAN linguistik korpus sebagai titik tolak dalam
penelitian linguistik untuk memaksimalkan
Berdasarkan gambaran pada bab-bab terdahulu, pemanfaatan data-data kebahasaan terkini
berikut dirumuskan simpulan dan saran dari yang sudah lebih banyak berbentuk digital.
penelitian ini.
1. Aplikasi yang paling representatif
digunakan untuk membuat model file DAFTAR PUSTAKA
korpus Al-Qur'an digital adalah WordSmith.
Itu karena aplikasi tersebut tidak hanya [1] Adolphs S, Introducing Electronic Text
mampu mengatasi masalah teknis ortografi Analysis - A Practical Guide for
tulisan nonbahasa Latin, tetapi juga Language and Literary Studies,
menyediakan fungsi-fungsi yang beragam Routledge, New York, p. 136-137, 2006
dan sangat berguna bagi kepentingan [2] Cheng W, Exploring Corpus Linguistics:
analisis linguistik korpus. Language in Action, Routledge, Oxon,
2. Format file yang dapat diolah aplikasi p.6, 29-30, 2012
tersebut haruslah dikonversi terlebih dahulu [3] Wikipedia, List of Text Corpora,
menjadi berekstensi *.txt, lebih khusus lagi, https://en.wikipedia.org/wiki/List_of_text
mode konversi file menggunakan encoding _corpora, 2016, (Diakses pada 29 Juli
UTF-8. 2016)
3. Format isi teks digital berbahasa Arab yang [4] Sketch Engine, Arabic TenTen Corpus,
akan diolah dengan aplikasi tersebut
haruslah berisi karakter huruf sepenuhnya,
Jurnal AL-AZHAR INDONESIA SERI HUMANIORA, Vol .3, No. 3, Maret 2016 227

https://www.sketchengine.co.uk/artenten- [11] Imad Z, Abdelhak L, New Quranic


corpus/, 2015, (Diakses pada 29 Juli Corpus rich in Morphological
2016) Information, International Journal of
[5] Al-Sulaiti L, Arabic Corpora, Speech Technology, pp 339-346, 2016
http://www.comp.leeds.ac.uk/eric/latifa/a (Diakses pada 29 Juli 2016)
rabic_corpora.htm, 2010, (Diakses pada [12] Ismail D, Asyraf HA, Mushaf Imla’i dan
29 Juli 2016) Implikasinya dalam Pembacaan Al-
[6] Dukes K, The Quranic Arabic Corpus, Quran (Imla’i Mushaf and It’s
http://corpus.quran.com/, 2011 [29 Juli Implication in Reading Al-Quran),
2016] ‘Ulum Islamiyyah Journal,
[7] Adams A, QuranCode, http://ddms.usim.edu.my/bitstream/12345
http://heliwave.com, 2015 [29 Juli 2016] 6789/12106/1/ulum%20islamiyyah%201
[8] Tanzil, Tanzil Quran Text Features, 7%20-%203.pdf, p. 43-55, 2016 (Diakses
http://tanzil.net/docs, 2007 [29 Juli 2016] pada 29 Juli 2016)
[9] Khan MK, Alginahi YM, The Holy [13] http://www.nooj4nlp.net/pages/nooj.html
Quran Digitization: Challenges and [14] http://neon.niederlandistik.fu-
Concerns, berlin.de/en/textstat/
Life Science Journal, p.156-164, [15] http://www.monoconc.com/
http://www.lifesciencesite.com, 2013. [16]http://www.laurenceanthony.net/software/a
(Diakses pada 29 Juli 2016). ntconc/
[10] Sharaf A, Atwell ES, QurAna: Corpus of [17] http://www.lexically.net/wordsmith/
the Quran annotated with Pronominal [18] Alhaj A, New Theory of the Holy Qur'an
Anaphora, University of Leeds Translation. A Textbook for Advanced
http://www.textminingthequran.com/wiki University Students of Linguistics and
/QurConcord, 2012, (Diakses pada 29 Translation, Hamburg, Anchor Academic
Juli 2016) Publishing, 2015

Anda mungkin juga menyukai