Anda di halaman 1dari 9

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN: 2548-964X

Vol. 6, No. 12, Desember 2022, hlm. 5845-5853 http://j-ptiik.ub.ac.id

Pembelajaran Mesin untuk Pembuatan Dokumen Karya Sastra Indonesia


Secara Otomatis menggunakan Metode Modified Long Short Term Memory
(LSTM) berbasis Extreme Learning Machine (ELM)
Gusti Reza Maulana1, Imam Cholissodin2, Bayu Rahayudi3

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya


Email: 1gustireza@student.ub.ac.id, 2imamcs@ub.ac.id, 3ubay1@ub.ac.id

Abstrak
Dokumen menjadi hal penting dan memudahkan pekerjaan manusia. Salah satu dari jenis dokumen
adalah karya sastra. Karya sastra merupakan rangkain tulisan atau sebuah ide dan pemikiran yang
disampaikan dengan tujuan estetika. Karya sastra yang digunakan dalam penelitian ini adalah kata-kata
bijak, puisi dan pantun. Selama ini pembuatan karya sastra kebanyakan ditulis secara manual. Sebabnya,
banyak dari karya sastra tersebut menjadi terlalu lama dibuat. Fokus dari penelitian ini adalah
mengaplikasikan sebuah karya sastra yang dibuat dari program sehingga dalam pembuatannya tidak
memerlukan waktu yang lama. Penelitian ini menggunakan algoritma Modified Long Short Term
Memory berbasisi Extreme Learning Machine untuk pembuatan karya sastra tersebut. Proses dari
pembuatan karya sastra tersebut adalah prepocessing, membagi data latih dan data uji, fase pelatihan,
fase pengujian, menghitung MAPE dan menghitung akurasi BLEU Score. Pada pengujian jumlah
context neuron dan hidden neuron didapatkan hasil yang optimal yaitu sebanyak 5 dan 800 untuk ketiga
karya sastra. Penghitungan menggunakan BLEU Score dengan nilai N = 4 menghasilkan rata-rata
akurasi untuk kata bijak sebesar 74.66%, puisi sebesar 14.49% dan pantun sebesar 73.76%.
Kata kunci: pembuatan teks, karya sastra, modified long short term memory, extreme learning machine.
Abstract
Documents as important and make it easy for human work. one type of document is a literary work.
Literary work is a series of writings or an idea and thought conveyed with aesthetic purposes. The
literary works used in this research are words of wisdom, poetry and rhymes. All this time making
literary works are written manually. This is why many of these literary works took too long to produce.
The focus of this research is to apply a literary work made from the program so that it does not take a
long time to make it. This study uses a Modified Long Short Term Memory algorithm based on Extreme
Learning Machine for the creation of the literary work. The process of making the literary work is
preprocessing, dividing training data and test data, training phase, testing phase, calculating MAPE
and calculating the accuracy of the BLEU Score. In testing the number of context neurons and hidden
neurons, optimal results were obtained, namely as many as 5 and 800 for the three literary works.
Calculation using the BLEU Score with a value of N = 4 produces an average accuracy for words of
wisdom 74.66%, poetry of 14.49% and rhymes of 73.76%.
Keywords: text generation, literary work, modified long short term memory, extreme learning machine.

tanah). Dokumen juga dapat berupa barang


1. PENDAHULUAN cetakan atau naskah, film, lukisan dan
Dokumen menjadi suatu hal yang berkaitan sebagainya yang dapat dijadikan alat bukti
erat dengan pekerjaan manusia. Banyak kegiatan keterangan. Dari pengertian di atas bisa
yang dilakukan oleh manusia membutuhkan disimpulkan bahwa dokumen dapat berbentuk
sebuah dokumen. Menurut Kamus Besar Bahasa sebuah rekaman ataupun tulisan.
Indonesia, dokumen adalah suatu surat tertulis Salah satu dari berbagai jenis dokumen
yang dapat digunakan sebagai alat bukti adalah sebuah karya sastra. Menurut Suantoko
keterangan (surat cerai, surat perjanjian dan akta (2019) karya sastra merupakan bentuk dari

Fakultas Ilmu Komputer


Universitas Brawijaya 5845
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5846

dokumen zaman. Dikatakan sebagai dokumen karya sastra secara otomatis. Untuk saat ini
zaman karena sastra merangkum kegiatan pada sebenarnya ada sebuah alat yang bernama
setiap zaman. Sastra sebagai sebuah dokumen ChatGPT yang dapat dimanfaatkan untuk
diperkuat oleh pernyataan dari Wiyatmi (2013) permasalahan pembuatan karya sastra tetapi
bahwa sastra termasuk ke dalam dokumen sosial karena tidak hanya berfokus pada pembuatan
budaya yang mencatat peristiwa sosial budaya karya sastra maka data yang dibutuhkan pada
yang telah terjadi di masyarakat pada waktu alat ini tergolong cukup besar. Selain itu pada
tertentu. Sastra termasuk dokumen sosial budaya ChatGPT ketika melakukan parafrase pada teks
ditandai oleh beberapa hal, yaitu unsur dalam menghasilkan teks yang relatif sama dengan alat
sastra yang langsung dihubungkan dengan unsur parafrase yang lain. Dapat disimpulkan bahwa
sosial budaya, selain itu tema yang terdapat di ketika melakukan parafrase, ChatGPT tidak
karya sastra menggunakan keadaan nyata yang menghasilkan teks asli (Aydin & Karaarslan,
terjadi pada masyarakat. 2022). Penggunaan alat dalam permasalahan ini
Karya sastra menurut definisi lama selain akan meringkas waktu dalam pembuatan
merupakan sebuah wadah bagi seseorang untuk karya, juga dapat membantu seseorang dalam
menyalurkan ide atau pemikiran menggunakan proses pembuatan karya yaitu seperti
kata-kata indah mengenai kehidupan sosial. keterampilan mengolah kata demi kata.
Sedangkan, karya sastra menurut definisi baru Beberapa metode yang digunakan dalam
merupakan sebuah wadah bagi seseorang untuk kasus pembuatan karya sastra atau teks adalah
menyalurkan ide atau pemikiran dengan Recurrent Neural Networks (RNNs), Long Short
menggunakan bahasa bebas mengenai sesuatu Term Memory (LSTM), BiDirectional RNNs
yang baru dan tidak dibatasi oleh suatu hal. (BRNNs) dan lainnya. Contoh penelitian untuk
Karya sastra terbagi menjadi 3 macam antara permasalahan pembuatan teks yaitu dilakukan
lain puisi, drama, dan prosa. Di Indonesia, puisi oleh Cholissodin, et.al (2021) yang
terdiri dari puisi modern dan puisi lama. Puisi menggunakan perbandingan dua metode yaitu
lama berupa pantun atau sebuah syair (Ahyar, LSTM dan Bi-LSTM. Hasil perbandingan kedua
2019) metode tersebut yaitu pada hal kebijakan terkait
Karya sastra menurut Damono (2006) vaksinasi Covid-19 metode Bi-LSTM
adalah bentuk dari dunia khayalan manusia yang memberikan akurasi lebih besar sedangkan pada
tidak dapat dikaitkan dengan sebuah kenyataan. hal kebijakan terkait PPKM darurat metode
Ini dimaksudkan bahwa dunia dalam karya LSTM memberikan akurasi lebih besar. Metode
sastra seperti puisi, novel ataupun drama tidak yang akan digunakan dalam penelitian ini adalah
berkaitan dan harus dipisahkan dari dunia nyata. Modified Long Short Term Memory (LSTM)
Damono (2006) menambahkan bahwa sastra berbasis Extreme Learning Machine (ELM).
merupakan hasil dari proses merusak bahasa Dari penelitian ini diharapkan dapat memberikan
yang dilakukan oleh sastrawan. Maksud dari suatu karya sastra yang baik dalam hal susunan
merusak bahasa adalah sebuah hak seorang katanya.
sastrawan dalam membuat sebuah karya sastra
sesuai dengan keahlian dan kapasitasnya. 2. TINJAUAN PUSTAKA
Selama ini pembuatan karya sastra pada
umumnya dilakukan dengan cara manual. 2.1. Pembelajaran Mesin
Pembuatan karya sastra secara manual akan Pembelajaran mesin atau yang sering
menyita banyak waktu, mengalami kesulitan disebut sebagai Machine Learning adalah
dalam merangkai kata maupun penentuan sebuah disiplin ilmu yang berfokus membangun
ide/tema dan sumber yang kurang luas. Seiring sistem komputer yang secara otomatis
perkembangan zaman kebanyakan kegiatan meningkat melalui pengalaman. Ilmu ini
manusia yang menggunakan cara manual merupakan irisan dari bidang ilmu seperti ilmu
berpindah menjadi menggunakan komputer komputer, statistik, kecerdasan buatan dan data
(Zhang & Zhang, 2020). science (Jordan & Mitchell, 2015).
Penelitian kali ini akan mencoba
menyelesaikan permasalahan pembuatan karya
sastra yang umumnya digunakan yaitu 2.2. Pembuatan Teks
pembuatan secara langsung merangkai ke dalam
bentuk tulisan diubah menjadi diterapkan ke Pembuatan teks adalah salah satu jenis dari
dalam sebuah alat yang dapat menghasilkan pemroresan bahasa alami (NLP) yang

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5847

memanfaatkan pengetahuan linguistik Mono Cell


Gate

komputasi dan kecerdasan buatan untuk 𝑊𝑚𝑛

menghasilkan teks bahasa alami secara otomatis Fitur ke-1 𝑏1 𝛽𝑚

Output Gate
(Zhang & Sun, 2009). Contoh dari penerapan
Input Fitur ke-2
Hasil prediksi
pembuatan teks adalah seperti pada pembuatan Gate 𝑏2
output layer

lirik lagu, cerita, karya sastra dan sebagainya.


Pada penelitian ini berfokus pada pembuatan Fitur ke-n

input layer

karya sastra. hst 𝑏𝑚

hidden layer

𝛿(𝑛 − 1)

2.3. Karya Sastra Forget gate


Recurr 𝛿(𝑛 − 2) by Extend
Long-Short
ent
Menurut Ahyar (2019) karya sastra adalah Gate
feature

sebuah wadah bagi seseorang untuk 𝛿(𝑛 − 𝑟)

menyalurkan ide atau pemikiran dengan context

menggunakan bahasa bebas mengenai sesuatu neurons


(b)
yang baru dan tidak dibatasi oleh suatu hal.
Menurut Kamus Besar Bahasa Indonesia, karya Gambar 1. (a) Long Short Term Memory (LSTM), (b)
sastra adalah hasil penulisan, bisa berupa puisi, Jaringan Algoritma Modified LSTM berbasis Extreme
lakon ataupun prosa. Learning Machine

Menurut Cholissodin, et al. (2020) secara


2.4. Modified LSTM berbasis ELM
umum tahapan penyelesaian algoritma Modified
Algoritma Modified Long Short Term Long Short Term Memory berbasis Extreme
Memory berbasis Extreme Learning Machine Learning Machine terdapat 2. Berikut penjelasan
merupakan algoritma Recurrent Neural Network mengenai kedua tahapan tersebut :
(RNN) yang digabungkan dengan algoritma 1. Tahapan Pelatihan (Training)
Extreme Learning Machine (ELM). a) Membuat matriks delay untuk tahapan
Penggabungan dua algoritma tersebut pelatihan dengan menggunakan Persamaan
menghasilkan algoritma Modified Long Short berikut.
Term Memory berbasis Extreme Learning 𝛿𝑡𝑟 = 𝑇 (𝑡 − (𝑛 + 𝑟) + 𝑛) (1)
Machine (ELM) atau nama lain nya adalah
RELMNN (Recurrent Extreme Learning Keterangan:
Machine Neural Network). Algoritma ini 𝛿 = Matriks delay
diciptakan untuk memecahkan permasalahan 𝑇 = target
pada dataset yang bersifat time series (berurutan 𝑡 = urutan data
𝑛 = jumlah fitur
waktu) ( Cholissodin, et al., 2020). Jaringan dari
𝑟 = context neuron
algoritma Modified Long Short Term Memory
b) Membuat nilai acak untuk bobot input
berbasis Extreme Learning Machine terdapat
dengan range antara -1 sampai 1 dan bias
pada Gambar 1.
dengan range antara 0 sampai 1.
ht-1 ht ht+1
c) Menghitung nilai matriks keluaran pada
hidden layer dengan menggunakan
Persamaan berikut.
x + 1
t 𝐻′ = (2)
1 + 𝑒𝑥𝑝 (−([𝑥𝑡𝑟𝑎𝑖𝑛 , 𝛿]𝑊 ′𝑇 + 𝑏(𝑜𝑛𝑒𝑠(𝑖𝑡𝑟𝑎𝑖𝑛 , 1), : )))
x x
σ σ t σ Keterangan:
𝐻′ = matriks keluaran pada hidden layer
[𝑥𝑡𝑟𝑎𝑖𝑛 , 𝛿 ]= gabungan dari matriks input dan
Xt-1 Xt Xt+1
matriks delay
(a) 𝑊 ′𝑇 = matriks transpose dari bobot input
𝑖𝑡𝑟𝑎𝑖𝑛 = jumlah data latih
𝑏 = matriks bias
d) Menghitung bobot keluaran setelah proses
recurrent menggunakan Persamaan berikut.
𝛽̂ ′ = 𝐻′+ 𝑇 (3)

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5848

𝑁
𝐻′+ = (𝐻′𝑇 𝐻′ )−1 𝐻′𝑇 (4)
𝐺𝐴𝑃𝑆 = 𝑒𝑥𝑝(∑ 𝑤𝑛 log 𝑃𝑛 (8)
Keterangan: 𝑛=1
𝛽̂ ′ = bobot keluaran setelah proses recurrent
𝐵𝑙𝑢𝑒 𝑆𝑐𝑜𝑟𝑒 = 𝐵𝑃 × 𝐺𝐴𝑃𝑆 (9)
𝐻′+ = matriks Moore-Penrose Pseudo Invers
Keterangan:
pada proses recurrent
𝐵𝑃 = Brevity Penalty
𝑁 = nilai standar untuk BLEU Score (umumnya yang
𝑇 = matriks target
digunakan nilai 1 sampai 4)
𝐺𝐴𝑃𝑆 = nilai rata-rata geometri dari modified precion
𝐻′ = matriks keluaran pada hidden layer
score
e) Menghitung hasil prediksi untuk tahapan 𝑐 = jumlah kata hasil prediksi
pelatihan menggunakan Persamaan berikut. 𝑟 = jumlah kata asli
𝑌̂ ′ = 𝐻′ 𝛽̂ ′ (5) 𝑊𝑛 = 1/N
𝑃𝑛 = jumlah n-gram hasil prediksi yang sesuai dengan
Keterangan: kalimat asli dibagi jumlah n-gram kalimat
𝑌̂ ′ = hasil prediksi asli.
𝐻′ = matriks keluaran pada hidden layer
𝛽̂ ′ = bobot keluaran setelah proses recurrent 2.6. MAPE
2. Tahapan Pengujian (Testing)
a) Mengambil nilai bobot input, bias dan bobot Mean Absolute Percentage Error (MAPE)
keluaran yang ada pada tahapan pelatihan digunakan untuk mengukur nilai rata-rata
b) Membuat matriks delay untuk tahapan kesalahan (error) antara data asli dengan hasil
pengujian. prediksi yang berupa persentase. Hasil
c) Menghitung nilai matriks keluaran pada peramalan bisa dikatakan baik jika hasil dari
hidden layer dengan menggunakan nilai MAPE kecil, sebaliknya jika semakin besar
Persamaan berikut. nilai MAPE hasil peramalan semakin tidak
1
akurat. Rumus untuk menghitung nilai MAPE
𝐻′ = (6) terdapat pada Persamaan 10 dan 11 (Hapsari, et
1 + 𝑒𝑥𝑝 (−([𝑥𝑡𝑒𝑠𝑡 , 𝛿]𝑊 ′𝑇 + 𝑏(𝑜𝑛𝑒𝑠(𝑖𝑡𝑒𝑠𝑡 , 1), : )))
al., 2016).
Keterangan: 1 𝑁
𝐻′ = matriks keluaran pada hidden layer 𝑀𝐴𝑃𝐸 = ∑ 𝐸𝑟𝑟𝑜𝑟𝑖 (10)
𝑁 𝑖=1
[𝑥𝑡𝑒𝑠𝑡 , 𝛿 ]= gabungan dari matriks input dan
matriks delay |(𝑋𝑖 + 𝑐) − (𝐹𝑖 + 𝑐)|
′𝑇 100 , > 100
𝑊 = matriks transpose dari bobot input 𝐸𝑟𝑟𝑜𝑟𝑖 =
(𝑋𝑖 + 𝑐)
(11)
|(𝑋𝑖 + 𝑐) − (𝐹𝑖 + 𝑐)| |(𝑋𝑖 + 𝑐) − (𝐹𝑖 + 𝑐)|
𝑖𝑡𝑒𝑠𝑡 = jumlah data uji { (𝑋𝑖 + 𝑐)
× 100,
(𝑋𝑖 + 𝑐)
< 100

𝑏 = matriks bias
d) Menghitung hasil prediksi untuk tahapan Keterangan:
pengujian menggunakan Persamaan 5. 𝑋𝑖 = nilai aktual untuk data ke-i
𝐹𝑖 = nilai hasil prediksi untuk data ke-i
2.5. BLEU Score 𝑐 = nilai konstanta
𝑁 = jumlah keseluruhan data
BLEU (Bilingual Evaluation Understudy)
merupakan algoritma untuk menilai kualitas 3. METODOLOGI
antara hasil terjemahan mesin dengan kalimat
referensi. BLEU Score dihasilkan dari perkalian 3.1. Rancangan Penelitian
antara brevity penalty dengan geometry average
precision score (Darwis, et al., 2019). Rumus Data dikumpulkan dari internet dan diambil
BLEU dapat diamati pada Persamaan 9 dengan cara scraping. Data yang telah terkumpul
sedangkan untuk rumus brevity penalty (BP) dan lalu akan masuk ke tahapan prepocessing.
geometry average precision score (GAPS) dapat Setelah itu data dibagi menjadi dua yaitu
diamati pada Persamaan 7 dan 8 (Doshi, 2021). menjadi data latih dan data uji, dimana data latih
akan masuk ke tahapan training algoritma
1 𝑖𝑓 𝑐 > 𝑟
𝐵𝑃 = { 𝑒 (1−𝑟/𝑐) (7) Modified LSTM berbasis ELM dan data uji akan
𝑖𝑓 𝑐 ≤ 𝑟 masuk ke tahapan testing algoritma Modified
LSTM berbasis ELM. Setelah itu masuk ke
tahapan terakhir yaitu menghitung akurasi

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5849

dengan BLEU Score. Rancangan penelitian


berupa diagram blok terdapat pada Gambar 2. A

Internet
Scraping Data Prepocessing Data
Data
Training Training Modified
Pre-processing Data LSTM berbasis ELM

Training Modified
Data LSTM berbasis ELM
Testing Testing Modified
LSTM berbasis ELM
Nilai BLEU
Hasil
Gambar 2. Perhitungan
Score Diagram Blok Pembuatan
Prediksi Dokumen Karya
Sastra Indonesia Menggunakan Metode Modified Long
BLEU Score
Testing Modified
Short Term Memory,Berbasis Extreme Learning LSTM berbasis ELM
Machine
3.2. Metode Pengumpulan Data
Perhitungan BLEU
Proses pengumpulan data pada penelitian Score
ini dilakukan dengan mengambil data berupa
kumpulan kata-kata bijak, puisi dan pantun pada
sebuah website yang berbeda. Pengambilan data Hasil prediksi,
tersebut dilakukan dengan proses scraping. Data Nilai BLEU
yang digunakan berjumlah 50 untuk masing- Score
masing karya sastra.

4. PERANCANGAN
Selesai
4.1. Diagram Alir Sistem
Gambar 4. Diagram Alir Sistem (lanjutan)
Data karya sastra yang telah terkumpul
dilakukan proses prepocessing untuk 5. PENGUJIAN DAN ANALISIS
mendapatkan kata penting. Setelah dilakukan
proses prepocessing dilanjutkan ke tahap Pengujian yang dilakukan dalam penelitian
training dan testing data menggunakan algoritma ini adalah pengujian persentase banyak data latih
Modified Long Short Term Memory berbasis dan data uji, pengujian jumlah fitur, pengujian
Extreme Learning Machine (ELM). Kemudian jumlah context neuron, pengujian jumlah hidden
dilakukan proses evaluasi hasil prediksi neuron dan pengujian jumlah nilai N pada BLEU
menggunakan evaluasi BLEU Score. Diagram Score.
alir sistem terdapat pada Gambar 3 dan 4.
5.1. Pengujian Persentase Banyak Data
Latih dan Data Uji
Mulai
Pada pengujian ini terdapat 10 variasi
perbandingan data latih dan data uji yaitu
50%:50%, 55%:45%, 60%:40%, 65%:35%,
Dokumen 70%:30%, 75%:25%, 80%:20%, 85%:15%,
Karya Sastra
90%:10%, dan 95%:5%. Parameter yang
digunakan pada pengujian ini yaitu jumlah fitur
sebanyak 5, jumlah context neuron sebanyak 2,
A jumlah hidden neuron sebanyak 600.

Gambar 3. Diagram Alir Sistem

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5850

5.3. Pengujian Jumlah Context neuron


Banyak context neuron yang digunakan
dalam pengujian ini adalah dari 2 sampai 5.
Parameter yang digunakan yaitu menggunakan
95% data latih dan 5% data uji, jumlah fitur
sebanyak 5, jumlah hidden neuron sebanyak
600.

Gambar 5. Hasil Pengujian Persentase Banyak Data Latih


dan Data Uji

Pada Gambar 5 dapat disimpulkan bahwa


pada karya sastra kata-kata bijak dan pantun
mengalami penurunan dan didapatkan rata-rata
nilai MAPE yang paling optimal pada persentase
95%:5%. Sedangkan untuk karya sastra puisi
mengalami kenaikan rata-rata nilai MAPE Gambar 7. Hasil Pengujian Jumlah Context neuron
sehingga rata-rata nilai MAPE yang paling
Pada Gambar 7 dapat disimpulkan bahwa
optimal terdapat pada persentase 50%:50%.
pada ketiga karya sastra mengalami penurunan
dan didapatkan rata-rata nilai MAPE yang paling
5.2. Pengujian Jumlah Fitur
optimal ketika menggunakan jumlah context
Banyak fitur yang digunakan dalam neuron sebesar 5. Hal ini membuktikan bahwa
pengujian ini adalah dari 3 sampai 6. Parameter semakin banyak jumlah context neuron, maka
yang digunakan yaitu menggunakan 95% data nilai MAPE akan semakin kecil.
latih dan 5% data uji, jumlah context neuron
sebanyak 2, jumlah hidden neuron sebanyak 5.4. Pengujian Jumlah Hidden neuron
600.
Banyak hidden neuron yang digunakan
dalam pengujian terdapat 4 variasi yaitu
500,600,700, dan 800. Parameter yang
digunakan yaitu menggunakan 95% data latih
dan 5% data uji, jumlah fitur sebanyak 5, jumlah
context neuron sebanyak 2.

Gambar 6. Hasil Pengujian Jumlah Fitur

Pada Gambar 6 dapat disimpulkan bahwa


pada karya sastra kata-kata bijak mengalami
penurunan dan didapatkan rata-rata nilai MAPE
yang paling optimal ketika jumlah fitur sebesar
6 sedangkan untuk pantun mendapatkan rata-rata Gambar 8. Hasil Pengujian Jumlah Hidden neuron
nilai MAPE yang paling optimal ketika jumlah
fitur sebesar 5 dan 6. Lain halnya dengan karya Pada Gambar 8 dapat disimpulkan bahwa
sastra puisi mengalami kenaikan rata-rata nilai pada ketiga karya sastra mengalami penurunan
MAPE sehingga nilai yang paling optimal ketika dan didapatkan rata-rata nilai MAPE yang paling
menggunakan jumlah fitur sebesar 3. Pada kedua optimal ketika menggunakan jumlah hidden
karya sastra yaitu kata-kata bijak dan pantun, neuron sebesar 800. Hal ini membuktikan bahwa
penambahan jumlah fitur membuat rata-rata nilai semakin banyak jumlah hidden neuron, maka
MAPE semakin kecil. nilai MAPE akan semakin kecil.

5.5. Pengujian Jumlah Nilai N pada BLEU

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5851

Score Tabel 1. Hasil Karya Sastra Sistem

Banyak nilai N yang digunakan dalam Karya Contoh hasil karya sastra
pengujian ini adalah dari 1 sampai 4. Parameter Sastra
yang digunakan yaitu menggunakan 95% data Kata kemanapun anda pergi lakukanlah
latih dan 5% data uji, jumlah fitur sebanyak 6, Bijak segalanya dengan segenap hati
jumlah context neuron sebanyak 5, jumlah katakata anda menunjukkan kualitas diri
hidden neuron sebanyak 800, dan menggunakan anda
token awal sebanyak 450 token. Puisi luasnya benua tak seluas harapanku
indahnya senja sama indahnya dengan
puisiku
aku lumpuh jika aku kehilangan
kehilangan segala lurusan bait juga
kehilangan cinta sepertimu
seperti untuk

seperti kau aku tak pernah


aku selalu kau kau tak

Gambar 9. Hasil Pengujian Jumlah N pada BLEU Score aku tak pernah kau

Pada Gambar 9 dapat disimpulkan bahwa aku tak pernah


pada ketiga karya sastra mengalami penurunan
dan didapatkan rata-rata nilai N yang paling kau aku tak pernah
optimal ketika menggunakan jumlah N sebesar Pantun ke pasar membeli salak
1. Hal ini terjadi karena perhitungan BLEU untuk kemudian dibagibagi
Score pada N sebesar 1 adalah membandingkan janganlah kamu
1 kata per kata dari kalimat asli dengan kalimat tamak
hasil prediksi. Ketika yang dibandingkan adalah agar diri tidak merugi
1 kata per kata, maka semua kata dari hasil
prediksi yang terdapat pada kalimat asli akan Pada Tabel 1 merupakan contoh hasil karya
menambah akurasi dari sebuah BLEU Score. sastra dari penerapan algoritma Modified LSTM
Berbeda hal nya dengan jumlah N sebesar 4, berbasis ELM. Untuk karya sastra hasil dari
maka yang dibandingkan adalah total sampai 4 penerapan algoritma Modified LSTM berbasis
kata. Jika semakin banyak nilai N tetapi antara ELM secara lengkap dapat dilihat pada link
kalimat asli dan kalimat hasil prediksi ternyata berikut :
berbeda jauh maka akan mempengaruhi hasil https://github.com/gustireza14/FileSkripsi/tree/
dari BLEU Score. main/Karya_Sastra_Hasil_Modified_LSTM_Be
Dalam kasus penelitian ini jumlah token rbasis_ELM
awal yang digunakan sebanyak 450 token. Pada
kedua karya sastra yaitu kata-kata bijak dan 7. KESIMPULAN DAN SARAN
pantun penggunaan token awal ini dapat
menghasilkan rata-rata akurasi BLEU Score di 7.1. Kesimpulan
atas 50%. Sebaliknya untuk karya sastra puisi Dari pengujian yang telah dilakukan
yang termasuk data dengan korpus besar mengenai pembelajaran mesin untuk pembuatan
penggunaan token awal ini masih mendapatkan dokumen karya sastra Indonesia secara otomatis
rata-rata akurasi BLEU Score di bawah 50%. menggunakan metode Modified Long Short
Term Memory (LSTM) berbasis Extreme
Learning Machine (ELM) dapat ditarik
kesimpulan sebagai berikut:
1. Metode Modified Long Short Term Memory
(LSTM) Berbasis Extreme Learning Machine
(ELM) mampu digunakan untuk pembuatan
dokumen karya sastra Indonesia. Dalam
penerapan metode tersebut didapatkan
6. KARYA SASTRA HASIL SISTEM

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5852

beberapa parameter yang optimal. Beberapa sastra yang baik.


parameter tersebut adalah dengan 5. Melakukan pemangkasan terutama untuk
menggunakan persentase data latih dan data karya sastra puisi jika terdapat hasil yang
uji sebesar 95%:5% menghasilkan nilai rata- terus berulang.
rata MAPE sebesar 0.0584 dan 0.0578 untuk
karya sastra kata-kata bijak dan pantun, DAFTAR PUSTAKA
sedangkan untuk puisi yaitu pada persentase
Ahyar, J. 2019. Jenis-jenis Karya Sastra dan
data latih dan data uji sebesar 50%:50%
Bagaimanakah Cara Menulis dan
menghasilkan nilai rata-rata MAPE sebesar
Mengapresiasi Sastra. Yogyakarta:
0.0819. Parameter selanjutnya adalah
Deepublish. 260 hlm.
penggunaan jumlah fitur sebanyak 6
menghasilkan nilai rata-rata MAPE sebesar Aydın, O., Karaarslan, E. (2022). OpenAI
0.0519 dan 0.0575 untuk karya sastra kata- ChatGPT Generated Literature Review:
kata bijak dan pantun, sedangkan untuk puisi Digital Twin in Healthcare. Emerging
ketika menggunakan jumlah fitur sebesar 3 Computer Technologies 2 (22-31).
dengan nilai rata-rata MAPE sebesar 0.0828.
Cholissodin, I., Pinasthika, K., Prastiwi, H. J.,
Parameter selanjutnya adalah penggunaan
Dewantara, R. 2021. Social Computing to
jumlah context neuron sebanyak 5 dengan
Create Government Public Policy
nilai rata-rata MAPE sebesar 0.003 untuk
Document Blueprint Draft Based on
kata-kata bijak, 0.0761 untuk puisi dan
Social Media Data About Covid-19 Using
0.0167 untuk pantun. Parameter terakhir
LSTM and MMR Hybrid Algorithms. the
adalah penggunaan jumlah hidden neuron
10th International Conference on Green
sebanyak 800 dengan nilai rata-rata MAPE
Technology.
sebesar 0.052 untuk kata-kata bijak, 0.073
untuk puisi dan 0.0387 untuk pantun. Cholissodin, I., Sutrisno, S., Soebroto, AA.,
2. Pada ketiga karya sastra menggunakan token Hasanah, U., Febiola, YI., 2020, AI,
awal sebanyak 450 token dan menghasilkan Machine Learning & Deep Learning.
akurasi rata-rata BLEU Score untuk metode Damono, S. D. 2006. Pengarang, karya sastra
Modified Long Short Term Memory (LSTM) dan pembaca. Universitas Indonesia. 22-
Berbasis Extreme Learning Machine (ELM) 37
sebesar 74.66% untuk kata-kata bijak,
14.49% untuk puisi dan 73.76% untuk Darwis, R., Sujaini, H., & Nyoto, R. D. 2019.
pantun. Nilai rata-rata tersebut menggunakan Peningkatan mesin penerjemah statistik
nilai N sebanyak 4. dengan menambah kuantitas korpus
monolingual (studi kasus : Bahasa
7.2. Saran Indonesia - Sunda). Jurnal Sistem dan
Teknologi Informasi. 7(1), 27-32.
Saran yang dapat dikembangkan untuk
penelitian berikutnya, yaitu: Doshi, K. 2021. Intuitive NLP Series. [Online]
1. Penggunaan data karya sastra khususnya Tersedia di
pada kata-kata bijak dan pantun masih sangat https://towardsdatascience.com/foundatio
sedikit. Diperlukan data yang lebih banyak ns-of-nlp-explained-bleu-score-and-wer-
lagi sehingga dapat dilihat seberapa besar metrics-1a5ba06d812b [Diakses 17
akurasi yang dihasilkan. November 2021]
2. Diperlukan metode tambahan untuk Hapsari, K. D., Cholissodin, I., Santoso, E. 2016.
menentukan jumlah hidden neuron agar nilai Optimasi Radial Basis Function Neural
akurasi menjadi baik khususnya untuk karya Network Menggunakan Hybrid Particle
sastra puisi. Swarm Optimization Dan Genetic
3. Pada karya sastra pantun di penelitian ini Algorithm Untuk Peramalan Curah
masih belum berbentuk sebuah rima. Perlu Hujan. DORO : Repository Jurnal
ditambahkan sebuah metode agar setiap Mahasiswa PTIIK Universitas Brwijaya.
pembuatan pantun bisa berbentuk rima. 7 (15).
4. Diperlukan metode tambahan untuk
mengukur hubungan antar kata seperti word Jordan, M., I, Mitchell, T., M. 2015. Machine
embedding agar dapat menghasilkan karya learning: Trends, perspectives, and
prospects.

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5853

Suantoko. 2019. Kajian sosiologi sastra-objektif


karya sastra sebagai dokumen sosial
dalam trilogi cerpen penembak misterius.
Jurnal Edukasi Khatulistiwa. 2(2), 13-26.
Wiyatmi. 2013. Sosiologi Sastra. Kanwa
Publisher. 197 hlm.
Zhang, L., Sun, J. T. 2009. Text Generation. In:
LIU L., ÖZSU M.T. (eds) Encyclopedia
of Database Systems. Springer, Boston,
MA.Zhang, H, & Zhi, Z. 2020. Automatic
Generation Method of Ancient Poetry
Based on LSTM. Big Data Science and
Engineering Research. 95-99.

Fakultas Ilmu Komputer, Universitas Brawijaya

Anda mungkin juga menyukai