202183750
Vol. 8, No. 5, Oktober 2021, hlm. 907-918 p-ISSN: 2355-7699
Akreditasi KEMENRISTEKDIKTI, No. 36/E/KPT/2019 e-ISSN: 2528-6579
Abstrak
Hadis merupakan sumber hukum dan pedoman kedua bagi umat Islam setelah Al-Qur’an dan banyak sekali
hadis yang telah diriwayatkan oleh para ahli hadis selama ini. Penelitian ini membangun sebuah sistem yang
dapat melakukan klasifikasi teks hadis Bukhari terjemahan berbahasa Indonesia. Topik ini diangkat untuk
memenuhi kebutuhan umat Islam dalam mengetahui apa saja informasi mengenai anjuran dan larangan yang
terdapat dalam suatu hadis. Klasifikasi teks memiliki tantangannya tersendiri terkait dengan jumlah fitur yang
sangat banyak (dimensi sangat besar) sehingga waktu komputasi menjadi besar dan mengakibatkan sulitnya
mendapatkan hasil yang optimal. Pada penelitian ini, digunakan salah satu metode hibrid dalam dunia deep
learning dengan menggabungkan Convolutional Neural Network dan Recurrent Neural Network, yaitu
Convolutional Recurrent Neural Network (CRNN). Convolutional Neural Network dipilih sebagai metode
seleksi dan reduksi data dikarenakan dapat menangkap informasi spasial yang saling berhubungan dan
berkorelasi. Sementara Recurrent Neural Network digunakan sebagai metode klasifikasi dengan mengusung
kemampuan utamanya yaitu dapat menangkap informasi kontekstual yang sangat panjang khususnya pada data
sekuens seperti data teks dengan mengandalkan ‘memori’ yang dimilikinya. Hasil penelitian menyajikan
beberapa hasil klasifikasi menggunakan deep learning, dimana hasil akurasi terbaik diberikan oleh
Convolutional Recurrent Neural Network (CRNN), yakni sebesar 80.79%.
Kata kunci: convolutional neural network, recurrent neural network, klasifikasi teks, reduksi dimensi
Keywords: convolutional neural network, recurrent neural network, text classification, dimension reduction
terdapat dua sumber utama dalam ajarannya yaitu dalam dokumen bisa sangat banyak dan bervariasi,
Al-Qur’an dan Hadis. Hadis merupakan panduan Singular Value Decomposition (SVD) digunakan
bagi umat Muslim yang bersumber dari perbuatan dalam penelitian untuk mencari fitur yang relevan
dan perkataan Nabi Muhammad SAW. dan menjadi bagi proses klasifikasi. Penggunaan SVD sebagai
pedoman bagi umat Muslim untuk lebih memahami seleksi fitur berhasil meningkatkan performansi
Islam agar dapat menjalankan kehidupannya di dengan akurasi sebesar 88.33% dibandingkan tanpa
dunia. menggunakan proses seleksi fitur.
Telah banyak hadis yang diriwayatkan oleh Hadis juga dikategorikan ke dalam hadis
para ahli hadis ke dalam beberapa kitab. Salah satu anjuran, larangan, dan informasi seperti yang telah
ahli hadis yang telah meriwayatkan banyak hadis dikerjakan oleh (Abu Bakar et al., 2019; Al Faraby
adalah Al-Bukhari. Saat ini, ada sekitar 7000 hadis et al., 2018; Fauzan et al., 2018; Hidayati et al.,
sahih yang telah diriwayatkan oleh Bukhari dan 2020; Mediamer et al., 2019; Purbolaksono et al.,
telah diterjemahkan ke dalam Bahasa Indonesia. 2020). Pengkategorian hadis tersebut dilakukan
Jumlah hadis yang tergolong ke dalam teks yang terhadap hadis Bukhari terjemahan Indonesia.
cukup besar membuat tingkat kesulitan dalam proses (Fauzan et al., 2018) mengelompokkan masing-
klasifikasi menjadi tinggi. Hal ini dikarenakan masing hadis tersebut ke dalam salah satu dari tiga
terdapat banyak sekali fitur/kata yang diproses kelas yang ada atau yang biasa disebut dengan
sehingga dimensi dari data menjadi sangat besar dan klasifikasi multi-class. Pada penelitiannya, mereka
membuat proses klasifikasi menjadi lama dan menggunakan metode Latent Semantic Indexing
menurunkan hasil klasifikasi. Metode deep learning sebagai seleksi fitur dan Bootstrap Aggregating
digunakan dalam penelitian ini untuk mengatasi (Bagging) untuk meningkatkan hasil akurasi dengan
masalah yang telah dipaparkan sebelumnya. metode klasifikasi Support Vector Machine (SVM).
LSI merupakan salah satu metode representasi fitur
1.1. Penelitian Terkait yang paling bagus untuk semantic kata. LSI
bertujuan untuk mencari hubungan antara suatu
Hadis terbagi ke dalam beberapa kategori istilah (term) terhadap dokumen. LSI akan
diantaranya hadis berdasarkan tingkat keabsahannya menghitung korelasi semantic antara term dan
seperti sahih, hasan, maudo’, dan dhaif seperti yang
dokumen pada representasi teks tidak terstruktur
telah dikerjakan oleh (Aldhlan et al., 2013). Dalam
(Al-Anzi & AbuZeina, 2017).
penelitiannya, mereka menyebutkan bahwa beberapa
Pekerjaan yang serupa juga telah dilakukan
atribut pada data yang digunakan diindikasikan
oleh (Al Faraby et al., 2018) dalam penelitiannya
sebagai nilai yang hilang. Oleh sebab itu, mereka mengenai klasifikasi teks hadis ke dalam
menggunakan suatu mekanisme yang disebut dengan kategorisasi multi-label. Mereka menggunakan
Missing Data Detector (MDD) untuk mengatasi data
dataset yang sama dengan penelitian (Fauzan et al.,
yang hilang tersebut. MDD yang digabungkan
2018). SVM dan Neural Network dipilih sebagai
dengan classifier Decision Tree dapat meningkatkan
metode klasifikasi dengan bantuan TF-IDF sebagai
hasil akurasi dengan sangat baik dari 50.1502% metode ekstraksi fitur. Beberapa Teknik pencocokan
menjadi 97.597% dan menyimpulkan bahwa string berbasis aturan sederhana dibangun sebagai
Decision Tree merupakan pendekatan yang layak
pembanding pada metode yang diusulkan. Hal ini
untuk klasifikasi hadis dilihat dari kemudahannya
dilakukan karena pada saat penelitian tersebut
dalam aturan induksi.
dikerjakan, mengklasifikasikan hadis ke dalam
Al-Kabi et al. mengklasifikasikan hadis ke
ketiga kelompok (anjuran, larangan, dan informasi)
dalam delapan kategori berdasarkan klasifikasi Al- merupakan pekerjaan yang sangat baru. Penelitian
Bukhari menggunakan metode TF-IDF (Al-Kabi et tersebut mendapatkan hasil akurasi yang cukup baik
al., 2005). Metode yang digunakan akan menghitung
yaitu sekitar 88% menggunakan metriks pengukuran
bobot dari masing-masing istilah (term) yang
F1-Score.
mengacu pada setiap kelas. Bobot suatu istilah akan
(Mediamer et al., 2019) menggunakan
lebih tinggi apabila sering muncul pada suatu kelas
ekstraksi fitur berbasis aturan pada metode TF-IDF
dan jarang muncul dikelas yang lainnya. Sebanyak dan Word2Vec. Percobaan dilakukan pada 2000 data
15 data dari masing-masing kelas digunakan sebagai multi-label hadis Bukhari terjemahan Indonesia.
data latih dan 5 data dari masing-masing kelas
Metode yang diusulkan bekerja efektif pada dataset
digunakan sebagai data uji. Dengan menggunakan
yang digunakan dan mampu melampaui metode
TF-IDF, penelitian ini berhasil mendapatkan akurasi
sebelumnya dengan nilai Hamming Loss sebesar
rata-rata sekitar 83.2%. 0.0623.
Hal serupa juga telah dikerjakan oleh Harrag Adapun (Abu Bakar et al., 2019; Hidayati et
(Harrag & El-Qawasmah, 2009) dalam penelitiannya
al., 2020) mengkategorikan klasifikasi hadis tersebut
namun dengan jumlah kelas yang lebih banyak yakni
ke dalam bentuk klasifikasi multi-label. Klasifikasi
14 kategori yang semuanya tersebar ke dalam 453
multi-label adalah mengelompokkan setiap data ke
dokumen berbahasa Arab. Mereka menggunakan
dalam lebih dari satu kelas (G. Chen et al., 2017; R.
Artificial Neural Network (ANN) sebagai classifier. Li et al., 2017). Hal ini berlaku pada data hadis
Dikarenakan jumlah kata-kata unik yang terdapat
Yuslan Abu Bakar, Klasifikasi Teks Hadis Bukhari … 909
dimana suatu hadis mungkin mengandung makna melakukan klasifikasi hubungan dengan cara
anjuran dan larangan sekaligus. Dikarenakan hal itu, memisahkan konsep dan konteks dari suatu teks ke
penelitian ( Abu Bakar et al., 2019; Hidayati et al., dalam lima segmen. Metode yang diajukan pada
2020) memfokuskan untuk mengerjakan klasifikasi penelitian tersebut dengan hanya menggunakan fitur
hadis terjemahan Indonesia tersebut ke dalam bentuk word embedding berhasil mendapatkan nilai f-
klasifikasi multi-label. Keduanya menggunakan measure hingga 0.800.
metode klasifikasi yang dibantu dengan suatu RNN juga digunakan sebagai media untuk
metode seleksi fitur untuk meningkatkan hasil pelatihan terhadap lapisan pooling pada CNN agar
akurasi. Backpropagation dengan bantuan pooling dapat lebih beradaptasi dengan data dan
Information Gain yang dikerjakan oleh (Abu Bakar komponen lainnya pada jaringan sehingga
et al., 2019) mendapatkan hasil cukup baik dengan meningkatkan akurasi (S. Li et al., 2019). Setiap
akurasi sebesar 88.42% sedangkan k-Nearest fitur pada wilayah pooling dipindai sebagai suatu
Neighbor dengan bantuan Latent Semantic Analysis urutan dan menjadi masukan bagi lapisan recurrent.
pada penelitian ( Hidayati et al., 2020) berhasil Hasil keluaran terakhir dari lapisan recurrent
mendapatkan nilai akurasi sebesar 90.28%. merupakan fitur gabungan dari wilayah pooling
Klasifikasi hadis termasuk ke dalam salah satu local dan akan menjadi suatu fitur gabungan.
kelompok kategorisasi teks. Saat ini, sangat banyak Hasilnya menunjukkan bahwa metode yang
penelitian yang membahas kategorisasi teks (Daeli dibangun dapat mengungguli performansi dari
& Adiwijaya, 2020; Herlambang & Wijoyo, 2019; fungsi pooling lainnya khususnya pada dataset citra
Hmeidi et al., 2015; Pinheiro et al., 2015; CIFAR-10 yang digunakan pada penelitian tersebut.
Purnomoputra & Wisesty, 2019; Shimpikar & Sementara itu, CNN dengan kemampuannya
Govilkar, 2017). Penelitian mengenai kategorisasi dalam melakukan seleksi dan ekstraksi fitur
teks telah jauh berkembang dengan adanya metode- dikombinasikan dengan RNN dalam melakukan
metode canggih seperti neural network dan deep klasifikasi berbasis urutan telah banyak dilakukan
learning (Johnson & Zhang, 2015; X. Zhang et al., dan mendapatkan hasil performansi yang baik (G.
2015). Deep learning merupakan salah satu metode Chen et al., 2017; Choi et al., 2017; Sivaram et al.,
yang dapat secara otomatis mencari fitur dari 2019). Penelitian (Choi et al., 2017) memanfaatkan
sejumlah data dengan proses pembelajaran tanpa CNN sebagai metode untuk ekstraksi fitur dan RNN
harus berdasarkan aturan-aturan yang dibuat oleh sebagai metode untuk meringkas fitur yang telah
manusia, khususnya untuk memproses data yang diekstrak. Mereka membandingkan metode yang
sangat banyak apabila dilakukan oleh manusia diusulkan dengan beberapa jenis struktur pada CNN
(Liang et al., 2017). yang biasa digunakan pada penandaan musik.
(Abdi et al., 2019) dalam penelitiannya Metode CRNN yang dibangun dapat menghasilkan
mengenai deep learning membahas klasifikasi performansi yang baik daripada metode pembanding
analisis sentimen menggunakan metode Recurrent dengan mengatur beberapa parameter yang tepat.
Neural Network (RNN) dengan bantuan Long Short- Sementara itu, hal yang serupa juga telah dikerjakan
Term Memory (LSTM) untuk mendapatkan dengan menggunakan data yang berbeda, yaitu data
keuntungan dari proses sekuensial dan gambar untuk pendeteksian keakuratan wajah
menghilangkan kelemahan pada metode tradisional (Sivaram et al., 2019). Penelitian tersebut
lainnya yaitu kehilangan informasi pada proses memanfaatkan suatu lapisan yang ada pada CNN
pembelajaran. Penelitian ini mengelompokkan data yaitu lapisan pooling untuk metode ekstraksi fitur
ke dalam dua kelas yaitu kelas positif dan kelas sebelum akhirnya diteruskan menuju LSTM untuk
negatif. Metode yang dibangun dapat meningkatkan proses deteksi wajah. Metode yang diusulkan dapat
nilai F1-Score hingga 15% dibandingkan dengan mengimbangi empat metode deteksi citra lainnya
metode pembanding. Sementara itu, Chen et al. (B. seperti CFAN (J. Zhang et al., 2014), SDM (deng et
Chen et al., 2019) menggunakan dua lapisan al., 2015), TCDN (Z. Zhang et al., 2014), dan RCPR
Convolutional Neural Network (CNN) untuk (Burgos-Artizzu et al., 2013).
menangkap fitur-fitur pada teks sebelum dilakukan Penelitian ini mencoba untuk menggabungkan
klasifikasi menggunakan LSTM. Metode yang metode CNN sebagai ekstraksi fitur dengan
diajukan berhasil mengungguli beberapa metode beberapa struktur RNN sebagai metode klasifikasi
seperti SVM, CNN, dan LSTM. (CRNN) untuk melakukan klasifikasi multi-label
RNN sebagai metode klasifikasi berbasiskan pada dataset hadis Bukhari terjemahan Indonesia
deep learning telah banyak digunakan karena sebanyak 7000 data teks. Gabungan kedua metode
kemampuannya dalam melakukan proses data ini dikenal dengan nama Convolutional Recurrent
sekuensial (G. Chen et al., 2017; Lai et al., 2015; S. Neural Network (CRNN). Penelitian ini
Li et al., 2019; Luo, 2017). Luo (Luo, 2017) membandingkan pengaruh penggunaan CNN
menerapkan RNN khususnya model LSTM untuk sebagai metode ekstraksi fitur terhadap hasil
melakukan klasifikasi hubungan pada catatan klinis klasifikasi dibandingkan jika tanpa menggunakan
menggunakan dataset i2b2/VA. Level segmen CNN.
LSTM digunakan pada penelitian tersebut untuk
910 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), Vol. 8, No. 5, Oktober 2021, hlm. 907-918
Gambar 2. Arsitektur standar dari CNN yang terdiri dari lapisan konvolusi, lapisan pooling, dan lapisan dense (Hu et al., 2015).
Yuslan Abu Bakar, Klasifikasi Teks Hadis Bukhari … 911
( ) (2)
Pertama, RNN mengambil dari urutan W adalah bobot, h adalah vektor dari lapisan
masukan dan kemudian outputnya yang bersama- tersembunyi, adalah bobot pada lapisan
sama dengan adalah masukan untuk langkah tersembunyi sebelumnya, adalah bobot pada
selanjutnya. Jadi, dan adalah masukan untuk keadaan masukan saat ini, ReLU adalah fungsi
langkah selanjutnya. Demikian pula, dari aktivasi, yang mengimplementasikan non-linearitas
berikutnya adalah masukan dengan untuk langkah yang menekan aktivasi ke kisaran [0 , ∞]. Fungsi
selanjutnya dan seterusnya. Dengan cara ini, ia terus aktivasi atau fungsi ambang atau fungsi transfer
mengingat konteks saat berlatih. digunakan untuk mengubah tingkat aktivasi unit
Formula yang digunakan pada current state (neuron) menjadi sinyal keluaran (Karlik & Olgac,
adalah seperti pada persamaan (1): 2011). Fungsi ReLU dengan mudah bekerja dengan
( ) (1) menetapkan nilai pada 0, yaitu ( ) ( ).
dan aktifkan fungsi aktivasi menggunakan Sederhananya, ketika , maka akan
persamaan (2): menghasilkan 0 dan sebaliknya, akan menghasilkan
Yuslan Abu Bakar, Klasifikasi Teks Hadis Bukhari … 913
fungsi linear ketika (Agarap, 2018) seperti pada data teks saling berhubungan satu sama lain
persamaan (3) berikut: membentuk konteks makna kata. Memori yang
( ) ( ) ( ) (3) digunakan sangat berguna untuk mengingat kata
dan untuk lapisan keluaran adalah seperti yang diproses diawal sebagai nilai masukan pada
persamaan (4): saat memproses kata saat ini.
( ) (4) Berikut adalah algoritma dari CRNN yang
adalah status keluaran. adalah bobot dibangun pada penelitian ini:
pada status keluaran dan sigmoid adalah fungsi Langkah-1: representasi data untuk masukan
aktivasi untuk lapisan keluaran. Sigmoid adalah CNN
fungsi aktivasi non-linear yang sebagian besar Langkah-2: terapkan beberapa filter dan
digunakan dalam jaringan saraf feedforward. Ini dikumpulkan untuk menangkap informasi
adalah fungsi nyata terdiferensiasi terbatas, kontekstual dan mengekstrak fitur-fitur penting dari
didefinisikan untuk nilai masukan asli, dengan setiap data
turunan positif dimana-mana dan beberapa tingkat Langkah-3: adalah masukan pada langkah
kelancaran (Nwankpa et al., 2018). Fungsi Sigmoid waktu t. Misalnya, bisa berupa vektor one-hot
dihitung menggunakan persamaan (5): yang sesuai dengan kata kedua dari sebuah kalimat.
( ) Langkah-4: adalah status tersembunyi saat
(5)
langkah t. Ini adalah "memori" jaringan. dihitung
Fungsi Sigmoid digunakan dalam model multi- berdasarkan keadaan tersembunyi sebelumnya dan
label dimana ia mengembalikan probabilitas masing- masukan pada langkah saat ini (lihat persamaan 1).
masing kelas, nilai di atas 0,5 menjadi 1 dan lainnya Fungsi f biasanya adalah nonlinier seperti tanh atau
menjadi 0, dimana 1 menunjukkan kelas target. ReLU. Dalam persamaan 2, kita menggunakan
ReLU sebagai fungsi f. ( ) , diperlukan untuk
2.3. Convolutional Recurrent Neural Network menghitung status tersembunyi pertama serta
(CRNN) menggunakan matriks identitas untuk inisialisasi
Convolutional Recurrent Neural Network bobot.
(CRNN) memanfaatkan CNN sebagai metode Langkah-5: adalah output pada langkah t
ekstraksi fitur dan RNN sebagai metode untuk seperti yang bisa kita lihat dalam persamaan 4.
melakukan ringkasan dari fitur yang telah diekstrak Langkah-6: Ulangi langkah 1-5 hingga
(Choi et al., 2017). RNN berperan sebagai lapisan mencapai kesalahan minimum.
terakhir dari CNN dalam melakukan tahapan
klasifikasi. Hal ini dilakukan karena kemampuan 2.4. Fungsi Optimasi
RNN dalam mendapatkan konteks makna dari Fungsi optimasi digunakan pada saat melatih
kalimat yang terdiri dari susunan kata-kata yang jaringan dengan mengubah nilai pada semua bobot
saling terkait. RNN juga mampu menerima masukan menggunakan prinsip gradient descent.
data dengan dimensi beragam, tidak seperti CNN Sederhananya, masalah optimasi melibatkan sesuatu
yang harus dilakukan metode padding terlebih untuk menemukan parameter yang meminimalkan
dahulu untuk menyeragamkan panjang data pada fungsi matematika. Fungsi yang ingin kita
keseluruhan dataset. minimalkan saat membangun model deep learning
Selain digunakan pada teks, CRNN juga yang rumit (melibatkan beberapa parameter seperti
digunakan pada data gambar (Zuo et al., 2015) dan skalar, vektor, atau matriks), secara konseptual
suara (Sigtia et al., 2016). Metode yang digunakan hanyalah menemukan parameter yang dapat
pada penelitian (Zuo et al., 2015) mempelajari meminimalkan fungsi tersebut (Ketkar, 2017).
dependensi spasial antara daerah gambar untuk Sebagai contoh pada stochastic gradient
meningkatkan kekuatan diskriminatif representasi descend (SGD), kita asumsikan bahwa adalah
gambar. Lapisan CNN pertama kali diproses untuk sebuah vektor. Kita ingin meminimalkan nilai ( ),
menghasilkan fitur tingkat menengah. Lapisan RNN dimana kita ingin merubah nilai sehingga ( )
kemudian dipelajari untuk menyandikan dependensi
akan berkurang. Misalkan merupakan sebuah unit
spasial. CRNN dapat mempelajari representasi
vektor atau arah dari yang seharusnya berubah dan
gambar yang lebih baik, terutama untuk gambar
α merupakan besarnya arah (skalar) dari perubahan
dengan ketergantungan kontekstual spasial yang
ini. Semakin besar nilai α akan menyebabkan
jelas. Metode yang dibangun mencapai kinerja yang
perubahan arah yang besar, dimana hal ini tidak
kompetitif untuk beberapa dataset seperti ILSVRC
diinginkan.
2012, SUN 397, dan MIT indoor.
Maka dari itu, kita ingin menemukan
Pada penelitian yang kami lakukan, CNN
sehingga pada persamaan (6):
dilakukan untuk mendapatkan fitur-fitur penting dari
( ) (6)
data teks hadis untuk meningkatkan performansi
dapat diminimalkan. Karena itu (persamaan 7):
sistem. CNN juga digunakan untuk mengurangi
waktu komputasi secara signifikan. RNN yang ( ) ( )
(7)
memiliki sistem memori sangat cocok digunakan
914 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), Vol. 8, No. 5, Oktober 2021, hlm. 907-918
Label (Kelas)
Data hadis
Anjuran Larangan Informasi
1 0 1
0 1 1
0 0 1
Percobaan dilakukan dengan menggunakan Bahasa Dengan beberapa lapisan penyatuan, akhirnya akan
Pemrograman Python 3 di Google Collaboratory. memiliki 274 fitur yang dipilih untuk
Google Collaboratory menyediakan 12 GB RAM, diklasifikasikan ke dalam 3 (tiga) kelas. Model
Intel Xeon Processors 2.3 GHz, Tesla K80 GPU 12 dilatih dalam 25 epochs menggunakan fungsi
GB, dan Disk 320 GB yang sangat cukup untuk optimisasi perubahan bobot Adam dan
menjalankan keseluruhan proses. mengkonsumsi waktu sekitar 5 detik untuk setiap
Seperti yang terlihat pada Gambar 2, ada epochs dengan akurasi sebesar 90.80% pada data
beberapa lapisan di CNN. Lapisan pertama adalah latih (5600 sampel) dan 80.79% akurasi pada data
lapisan masukan. Jumlah masukan untuk lapisan ini uji (1400 sampel). Hasil akurasi yang didapatkan
diperoleh dari panjang urutan maksimal data. dari metode yang diusulkan (CRNN) melampaui
Setelah lapisan masukan ini, ada lapisan konvolusi hasil akurasi dari seluruh metode pembanding.
dan lapisan pooling yang digunakan untuk Adapun untuk waktu komputasi, metode yang
mengurutkan dan menilai fitur yang dianggap diusulkan melampaui beberapa metode pembanding
penting untuk proses klasifikasi. Fitur-fitur yang meskipun lebih lambat dibandingkan dengan metode
dipilih digunakan untuk mengklasifikasikan data ke MLP dan CNN (masing-masing sekitar 1 detik untuk
dalam 3 (tiga) kelas. setiap epochs). Tabel 3 menampilkan statistik
Dari Gambar 7, kita dapat melihat bahwa perbandingan dari metode yang digunakan.
lapisan masukan atau lapisan embedding memiliki
1647 masukan dari panjang urutan maksimal data.
Tabel 4. Perbandingan hasil klasifikasi benar dan salah pada data latih dan data uji.
916 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), Vol. 8, No. 5, Oktober 2021, hlm. 907-918
based pooling. Neurocomputing, 338(Shuai SIGTIA, S., BENETOS, E., & DIXON, S. 2016. An
Li), 72–82. end-to-end neural network for polyphonic
https://doi.org/10.1016/j.neucom.2019.02.004 piano music transcription. IEEE/ACM
LIANG, H., SUN, X., SUN, Y., & GAO, Y. 2017. Transactions on Audio Speech and Language
Text feature extraction based on deep learning: Processing, 24(5), 927–939.
a review. Eurasip Journal on Wireless https://doi.org/10.1109/TASLP.2016.2533858
Communications and Networking, 2017(1), 1– SIVARAM, M., PORKODI, V., MOHAMMED, A.
12. https://doi.org/10.1186/s13638-017-0993-1 S., & MANIKANDAN, V. 2019. Detection of
LUO, Y. 2017. Recurrent neural networks for accurate facial detection using hybrid deep
classifying relations in clinical notes. Journal convolutional recurrent neural network. 1844–
of Biomedical Informatics, 72, 85–95. 1850. https://doi.org/10.21917/ijsc.2019.0256
https://doi.org/10.1016/j.jbi.2017.07.006 TALATHI, S. S., & VARTAK, A. 2015. Improving
MEDIAMER, G., ADIWIJAYA & FARABY, S. A. performance of recurrent neural network with
2019. l.. Development of rule-based feature relu nonlinearity.
extraction in multi-label text classification. http://arxiv.org/abs/1511.03771
International Journal on Advanced Science, WANG, B. 2018. Disconnected recurrent neural
Engineering and Information Technology, networks for text categorization. ACL 2018 -
9(4), 1460–1465. 56th Annual Meeting of the Association for
https://doi.org/10.18517/ijaseit.9.4.8894 Computational Linguistics, Proceedings of the
MUSLIM POPULATION BY COUNTRY 2020. Conference (Long Papers), 1, 2311–2320.
(n.d.). Retrieved October 18, 2020, from https://doi.org/10.18653/v1/p18-1215
https://worldpopulationreview.com/country- YAMASHITA, R., NISHIO, M., DO, R. K. G., &
rankings/muslim-population-by-country TOGASHI, K. 2018. Convolutional neural
NWANKPA, C., IJOMAH, W., GACHAGAN, A., networks: an overview and application in
& MARSHALL, S. 2018. Activation radiology. Insights into Imaging, 9(4), 611–
Functions: Comparison of trends in Practice 629. https://doi.org/10.1007/s13244-018-0639-
and Research for Deep Learning. 1–20. 9
http://arxiv.org/abs/1811.03378 ZHANG, J., SHAN, S., KAN, M., & CHEN, X.
PINHEIRO, R. H. W., CAVALCANTI, G. D. C., & 2014. Coarse-to-Fine Auto-Encoder Networks
REN, T. I. 2015. Data-driven global-ranking (CFAN) for Real-Time Face Alignment (pp. 1–
local feature selection methods for text 16). https://doi.org/10.1007/978-3-319-10605-
categorization. Expert Systems with 2_1
Applications, 42(4), 1941–1949. ZHANG, X., ZHAO, J., & LECUN, Y. 2015.
https://doi.org/10.1016/j.eswa.2014.10.011 Character-level Convolutional Networks for
PRUSA, J. D., & KHOSHGOFTAAR, T. M. 2017. Text Classification. Advances in Neural
Improving deep neural network design with Information Processing Systems, 649–657.
new text data representations. Journal of Big http://arxiv.org/abs/1502.01710
Data, 4(1). https://doi.org/10.1186/s40537- ZHANG, Z., LUO, P., LOY, C. C., & TANG, X.
017-0065-8 2014. Facial Landmark Detection by Deep
PURBOLAKSONO, M. D., RESKYADITA, F. D., Multi-task Learning. Proceedings of
ADIWIJAYA, SURYANI, A. A., & HUDA, International Conference on European
A. F. 2020. Indonesian text classification using Conference on Computer Vision, 94–108.
back propagation and sastrawi stemming https://doi.org/10.1007/978-3-319-10599-4_7
analysis with information gain for selection ZUO, Z., SHUAI, B., WANG, G., LIU, X., WANG,
feature. International Journal on Advanced X., WANG, B., & CHEN, Y. 2015.
Science, Engineering and Information Convolutional recurrent neural networks:
Technology, 10(1), 234–238. Learning spatial dependencies for image
https://doi.org/10.18517/ijaseit.10.1.8858 representation. IEEE Computer Society
PURNOMOPUTRA, R. B., & WISESTY, U. N. Conference on Computer Vision and Pattern
2019. Sentiment Analysis of Movie Reviews Recognition Workshops, 2015-Octob, 18–26.
using Naïve Bayes Method with Gini Index https://doi.org/10.1109/CVPRW.2015.730126
Feature Selection. Journal of Data Science 8
and Its Applications, 2(July), 85–94.
https://doi.org/10.34818/jdsa.2019.2.36
SHIMPIKAR, S., & GOVILKAR, S. 2017. A
Survey of Text Summarization Techniques for
Indian Regional Languages. International
Journal of Computer Applications, 165(11),
29–33.
https://doi.org/10.5120/ijca2017914083