Abstrak
Dokumen menjadi hal penting dan memudahkan pekerjaan manusia. Salah satu dari jenis dokumen
adalah karya sastra. Karya sastra merupakan rangkain tulisan atau sebuah ide dan pemikiran yang
disampaikan dengan tujuan estetika. Karya sastra yang digunakan dalam penelitian ini adalah kata-kata
bijak, puisi dan pantun. Selama ini pembuatan karya sastra kebanyakan ditulis secara manual. Sebabnya,
banyak dari karya sastra tersebut menjadi terlalu lama dibuat. Fokus dari penelitian ini adalah
mengaplikasikan sebuah karya sastra yang dibuat dari program sehingga dalam pembuatannya tidak
memerlukan waktu yang lama. Penelitian ini menggunakan algoritma Modified Long Short Term
Memory berbasisi Extreme Learning Machine untuk pembuatan karya sastra tersebut. Proses dari
pembuatan karya sastra tersebut adalah prepocessing, membagi data latih dan data uji, fase pelatihan,
fase pengujian, menghitung MAPE dan menghitung akurasi BLEU Score. Pada pengujian jumlah
context neuron dan hidden neuron didapatkan hasil yang optimal yaitu sebanyak 5 dan 800 untuk ketiga
karya sastra. Penghitungan menggunakan BLEU Score dengan nilai N = 4 menghasilkan rata-rata
akurasi untuk kata bijak sebesar 74.66%, puisi sebesar 14.49% dan pantun sebesar 73.76%.
Kata kunci: pembuatan teks, karya sastra, modified long short term memory, extreme learning machine.
Abstract
Documents as important and make it easy for human work. one type of document is a literary work.
Literary work is a series of writings or an idea and thought conveyed with aesthetic purposes. The
literary works used in this research are words of wisdom, poetry and rhymes. All this time making
literary works are written manually. This is why many of these literary works took too long to produce.
The focus of this research is to apply a literary work made from the program so that it does not take a
long time to make it. This study uses a Modified Long Short Term Memory algorithm based on Extreme
Learning Machine for the creation of the literary work. The process of making the literary work is
preprocessing, dividing training data and test data, training phase, testing phase, calculating MAPE
and calculating the accuracy of the BLEU Score. In testing the number of context neurons and hidden
neurons, optimal results were obtained, namely as many as 5 and 800 for the three literary works.
Calculation using the BLEU Score with a value of N = 4 produces an average accuracy for words of
wisdom 74.66%, poetry of 14.49% and rhymes of 73.76%.
Keywords: text generation, literary work, modified long short term memory, extreme learning machine.
dokumen zaman. Dikatakan sebagai dokumen karya sastra secara otomatis. Untuk saat ini
zaman karena sastra merangkum kegiatan pada sebenarnya ada sebuah alat yang bernama
setiap zaman. Sastra sebagai sebuah dokumen ChatGPT yang dapat dimanfaatkan untuk
diperkuat oleh pernyataan dari Wiyatmi (2013) permasalahan pembuatan karya sastra tetapi
bahwa sastra termasuk ke dalam dokumen sosial karena tidak hanya berfokus pada pembuatan
budaya yang mencatat peristiwa sosial budaya karya sastra maka data yang dibutuhkan pada
yang telah terjadi di masyarakat pada waktu alat ini tergolong cukup besar. Selain itu pada
tertentu. Sastra termasuk dokumen sosial budaya ChatGPT ketika melakukan parafrase pada teks
ditandai oleh beberapa hal, yaitu unsur dalam menghasilkan teks yang relatif sama dengan alat
sastra yang langsung dihubungkan dengan unsur parafrase yang lain. Dapat disimpulkan bahwa
sosial budaya, selain itu tema yang terdapat di ketika melakukan parafrase, ChatGPT tidak
karya sastra menggunakan keadaan nyata yang menghasilkan teks asli (Aydin & Karaarslan,
terjadi pada masyarakat. 2022). Penggunaan alat dalam permasalahan ini
Karya sastra menurut definisi lama selain akan meringkas waktu dalam pembuatan
merupakan sebuah wadah bagi seseorang untuk karya, juga dapat membantu seseorang dalam
menyalurkan ide atau pemikiran menggunakan proses pembuatan karya yaitu seperti
kata-kata indah mengenai kehidupan sosial. keterampilan mengolah kata demi kata.
Sedangkan, karya sastra menurut definisi baru Beberapa metode yang digunakan dalam
merupakan sebuah wadah bagi seseorang untuk kasus pembuatan karya sastra atau teks adalah
menyalurkan ide atau pemikiran dengan Recurrent Neural Networks (RNNs), Long Short
menggunakan bahasa bebas mengenai sesuatu Term Memory (LSTM), BiDirectional RNNs
yang baru dan tidak dibatasi oleh suatu hal. (BRNNs) dan lainnya. Contoh penelitian untuk
Karya sastra terbagi menjadi 3 macam antara permasalahan pembuatan teks yaitu dilakukan
lain puisi, drama, dan prosa. Di Indonesia, puisi oleh Cholissodin, et.al (2021) yang
terdiri dari puisi modern dan puisi lama. Puisi menggunakan perbandingan dua metode yaitu
lama berupa pantun atau sebuah syair (Ahyar, LSTM dan Bi-LSTM. Hasil perbandingan kedua
2019) metode tersebut yaitu pada hal kebijakan terkait
Karya sastra menurut Damono (2006) vaksinasi Covid-19 metode Bi-LSTM
adalah bentuk dari dunia khayalan manusia yang memberikan akurasi lebih besar sedangkan pada
tidak dapat dikaitkan dengan sebuah kenyataan. hal kebijakan terkait PPKM darurat metode
Ini dimaksudkan bahwa dunia dalam karya LSTM memberikan akurasi lebih besar. Metode
sastra seperti puisi, novel ataupun drama tidak yang akan digunakan dalam penelitian ini adalah
berkaitan dan harus dipisahkan dari dunia nyata. Modified Long Short Term Memory (LSTM)
Damono (2006) menambahkan bahwa sastra berbasis Extreme Learning Machine (ELM).
merupakan hasil dari proses merusak bahasa Dari penelitian ini diharapkan dapat memberikan
yang dilakukan oleh sastrawan. Maksud dari suatu karya sastra yang baik dalam hal susunan
merusak bahasa adalah sebuah hak seorang katanya.
sastrawan dalam membuat sebuah karya sastra
sesuai dengan keahlian dan kapasitasnya. 2. TINJAUAN PUSTAKA
Selama ini pembuatan karya sastra pada
umumnya dilakukan dengan cara manual. 2.1. Pembelajaran Mesin
Pembuatan karya sastra secara manual akan Pembelajaran mesin atau yang sering
menyita banyak waktu, mengalami kesulitan disebut sebagai Machine Learning adalah
dalam merangkai kata maupun penentuan sebuah disiplin ilmu yang berfokus membangun
ide/tema dan sumber yang kurang luas. Seiring sistem komputer yang secara otomatis
perkembangan zaman kebanyakan kegiatan meningkat melalui pengalaman. Ilmu ini
manusia yang menggunakan cara manual merupakan irisan dari bidang ilmu seperti ilmu
berpindah menjadi menggunakan komputer komputer, statistik, kecerdasan buatan dan data
(Zhang & Zhang, 2020). science (Jordan & Mitchell, 2015).
Penelitian kali ini akan mencoba
menyelesaikan permasalahan pembuatan karya
sastra yang umumnya digunakan yaitu 2.2. Pembuatan Teks
pembuatan secara langsung merangkai ke dalam
bentuk tulisan diubah menjadi diterapkan ke Pembuatan teks adalah salah satu jenis dari
dalam sebuah alat yang dapat menghasilkan pemroresan bahasa alami (NLP) yang
Output Gate
(Zhang & Sun, 2009). Contoh dari penerapan
Input Fitur ke-2
Hasil prediksi
pembuatan teks adalah seperti pada pembuatan Gate 𝑏2
output layer
input layer
hidden layer
𝛿(𝑛 − 1)
𝑁
𝐻′+ = (𝐻′𝑇 𝐻′ )−1 𝐻′𝑇 (4)
𝐺𝐴𝑃𝑆 = 𝑒𝑥𝑝(∑ 𝑤𝑛 log 𝑃𝑛 (8)
Keterangan: 𝑛=1
𝛽̂ ′ = bobot keluaran setelah proses recurrent
𝐵𝑙𝑢𝑒 𝑆𝑐𝑜𝑟𝑒 = 𝐵𝑃 × 𝐺𝐴𝑃𝑆 (9)
𝐻′+ = matriks Moore-Penrose Pseudo Invers
Keterangan:
pada proses recurrent
𝐵𝑃 = Brevity Penalty
𝑁 = nilai standar untuk BLEU Score (umumnya yang
𝑇 = matriks target
digunakan nilai 1 sampai 4)
𝐺𝐴𝑃𝑆 = nilai rata-rata geometri dari modified precion
𝐻′ = matriks keluaran pada hidden layer
score
e) Menghitung hasil prediksi untuk tahapan 𝑐 = jumlah kata hasil prediksi
pelatihan menggunakan Persamaan berikut. 𝑟 = jumlah kata asli
𝑌̂ ′ = 𝐻′ 𝛽̂ ′ (5) 𝑊𝑛 = 1/N
𝑃𝑛 = jumlah n-gram hasil prediksi yang sesuai dengan
Keterangan: kalimat asli dibagi jumlah n-gram kalimat
𝑌̂ ′ = hasil prediksi asli.
𝐻′ = matriks keluaran pada hidden layer
𝛽̂ ′ = bobot keluaran setelah proses recurrent 2.6. MAPE
2. Tahapan Pengujian (Testing)
a) Mengambil nilai bobot input, bias dan bobot Mean Absolute Percentage Error (MAPE)
keluaran yang ada pada tahapan pelatihan digunakan untuk mengukur nilai rata-rata
b) Membuat matriks delay untuk tahapan kesalahan (error) antara data asli dengan hasil
pengujian. prediksi yang berupa persentase. Hasil
c) Menghitung nilai matriks keluaran pada peramalan bisa dikatakan baik jika hasil dari
hidden layer dengan menggunakan nilai MAPE kecil, sebaliknya jika semakin besar
Persamaan berikut. nilai MAPE hasil peramalan semakin tidak
1
akurat. Rumus untuk menghitung nilai MAPE
𝐻′ = (6) terdapat pada Persamaan 10 dan 11 (Hapsari, et
1 + 𝑒𝑥𝑝 (−([𝑥𝑡𝑒𝑠𝑡 , 𝛿]𝑊 ′𝑇 + 𝑏(𝑜𝑛𝑒𝑠(𝑖𝑡𝑒𝑠𝑡 , 1), : )))
al., 2016).
Keterangan: 1 𝑁
𝐻′ = matriks keluaran pada hidden layer 𝑀𝐴𝑃𝐸 = ∑ 𝐸𝑟𝑟𝑜𝑟𝑖 (10)
𝑁 𝑖=1
[𝑥𝑡𝑒𝑠𝑡 , 𝛿 ]= gabungan dari matriks input dan
matriks delay |(𝑋𝑖 + 𝑐) − (𝐹𝑖 + 𝑐)|
′𝑇 100 , > 100
𝑊 = matriks transpose dari bobot input 𝐸𝑟𝑟𝑜𝑟𝑖 =
(𝑋𝑖 + 𝑐)
(11)
|(𝑋𝑖 + 𝑐) − (𝐹𝑖 + 𝑐)| |(𝑋𝑖 + 𝑐) − (𝐹𝑖 + 𝑐)|
𝑖𝑡𝑒𝑠𝑡 = jumlah data uji { (𝑋𝑖 + 𝑐)
× 100,
(𝑋𝑖 + 𝑐)
< 100
𝑏 = matriks bias
d) Menghitung hasil prediksi untuk tahapan Keterangan:
pengujian menggunakan Persamaan 5. 𝑋𝑖 = nilai aktual untuk data ke-i
𝐹𝑖 = nilai hasil prediksi untuk data ke-i
2.5. BLEU Score 𝑐 = nilai konstanta
𝑁 = jumlah keseluruhan data
BLEU (Bilingual Evaluation Understudy)
merupakan algoritma untuk menilai kualitas 3. METODOLOGI
antara hasil terjemahan mesin dengan kalimat
referensi. BLEU Score dihasilkan dari perkalian 3.1. Rancangan Penelitian
antara brevity penalty dengan geometry average
precision score (Darwis, et al., 2019). Rumus Data dikumpulkan dari internet dan diambil
BLEU dapat diamati pada Persamaan 9 dengan cara scraping. Data yang telah terkumpul
sedangkan untuk rumus brevity penalty (BP) dan lalu akan masuk ke tahapan prepocessing.
geometry average precision score (GAPS) dapat Setelah itu data dibagi menjadi dua yaitu
diamati pada Persamaan 7 dan 8 (Doshi, 2021). menjadi data latih dan data uji, dimana data latih
akan masuk ke tahapan training algoritma
1 𝑖𝑓 𝑐 > 𝑟
𝐵𝑃 = { 𝑒 (1−𝑟/𝑐) (7) Modified LSTM berbasis ELM dan data uji akan
𝑖𝑓 𝑐 ≤ 𝑟 masuk ke tahapan testing algoritma Modified
LSTM berbasis ELM. Setelah itu masuk ke
tahapan terakhir yaitu menghitung akurasi
Internet
Scraping Data Prepocessing Data
Data
Training Training Modified
Pre-processing Data LSTM berbasis ELM
Training Modified
Data LSTM berbasis ELM
Testing Testing Modified
LSTM berbasis ELM
Nilai BLEU
Hasil
Gambar 2. Perhitungan
Score Diagram Blok Pembuatan
Prediksi Dokumen Karya
Sastra Indonesia Menggunakan Metode Modified Long
BLEU Score
Testing Modified
Short Term Memory,Berbasis Extreme Learning LSTM berbasis ELM
Machine
3.2. Metode Pengumpulan Data
Perhitungan BLEU
Proses pengumpulan data pada penelitian Score
ini dilakukan dengan mengambil data berupa
kumpulan kata-kata bijak, puisi dan pantun pada
sebuah website yang berbeda. Pengambilan data Hasil prediksi,
tersebut dilakukan dengan proses scraping. Data Nilai BLEU
yang digunakan berjumlah 50 untuk masing- Score
masing karya sastra.
4. PERANCANGAN
Selesai
4.1. Diagram Alir Sistem
Gambar 4. Diagram Alir Sistem (lanjutan)
Data karya sastra yang telah terkumpul
dilakukan proses prepocessing untuk 5. PENGUJIAN DAN ANALISIS
mendapatkan kata penting. Setelah dilakukan
proses prepocessing dilanjutkan ke tahap Pengujian yang dilakukan dalam penelitian
training dan testing data menggunakan algoritma ini adalah pengujian persentase banyak data latih
Modified Long Short Term Memory berbasis dan data uji, pengujian jumlah fitur, pengujian
Extreme Learning Machine (ELM). Kemudian jumlah context neuron, pengujian jumlah hidden
dilakukan proses evaluasi hasil prediksi neuron dan pengujian jumlah nilai N pada BLEU
menggunakan evaluasi BLEU Score. Diagram Score.
alir sistem terdapat pada Gambar 3 dan 4.
5.1. Pengujian Persentase Banyak Data
Latih dan Data Uji
Mulai
Pada pengujian ini terdapat 10 variasi
perbandingan data latih dan data uji yaitu
50%:50%, 55%:45%, 60%:40%, 65%:35%,
Dokumen 70%:30%, 75%:25%, 80%:20%, 85%:15%,
Karya Sastra
90%:10%, dan 95%:5%. Parameter yang
digunakan pada pengujian ini yaitu jumlah fitur
sebanyak 5, jumlah context neuron sebanyak 2,
A jumlah hidden neuron sebanyak 600.
Banyak nilai N yang digunakan dalam Karya Contoh hasil karya sastra
pengujian ini adalah dari 1 sampai 4. Parameter Sastra
yang digunakan yaitu menggunakan 95% data Kata kemanapun anda pergi lakukanlah
latih dan 5% data uji, jumlah fitur sebanyak 6, Bijak segalanya dengan segenap hati
jumlah context neuron sebanyak 5, jumlah katakata anda menunjukkan kualitas diri
hidden neuron sebanyak 800, dan menggunakan anda
token awal sebanyak 450 token. Puisi luasnya benua tak seluas harapanku
indahnya senja sama indahnya dengan
puisiku
aku lumpuh jika aku kehilangan
kehilangan segala lurusan bait juga
kehilangan cinta sepertimu
seperti untuk
Gambar 9. Hasil Pengujian Jumlah N pada BLEU Score aku tak pernah kau