Anda di halaman 1dari 4

Smart Comp Vol. 11 No.

1 Januari Tahun 2022 P-ISSN: 2089-676X


E-ISSN: 2549-0796

Perbandingan Prediksi Harga Saham Dengan Menggunakan LSTM GRU


Dengan Transformer

Idham 1, Muhammad Ghudafa Taufik Akbar 2, Supriadi Panggabean 3, Mohamad Noor 4


Email : 14002600@nusamandiri.ac.id1, 14002455@nusamandiri.ac.id2, 14002471@nusamandiri.ac.id3,
14002440@nusamandiri.ac.id4
Program Studi Ilmu Komputer (S2) Universitas Nusa Mandiri Jakarta1,2,3,4

Abstrak
Saham adalah sebuah bukti kepemilikan nilai sebuah perusahaan, artinya pemilik saham adalah pemilik
perusahaan . Semakin besar saham yang dimiliki, maka semakin besar kekuasaannya di perusahaan tersebut.
Faktor yang terjadi sekarang dalam sektor pasar saham yaitu adanya dampak dari virus corona terhadap
indeks harga saham dan arus dana asing ke pasar saham. Maka sangat perlu untuk dilakukan prediksi
sentiment analysis pandemi corona terhadap sektor pasar saham untuk melihat bagaimana perbandingan
pergerakan IHSG di Indonesia sebelum terjadi pandemi dan pada saat terjadi pandemi Covid-19. Metode
yang digunakan untuk prediksi analysis sentimen dengan index harga saham Indonesia ini menggunakan
transformers dengan fitur bag of word , TF- IDF dan word embedding. Dari hasil prediksi sebelum
menggunakan metode transformers pada LSTM,dan GRU didapatkan rata-rata pada LSTM Performance
akurasi 0,394 dan GRU 0,216[1]. Algoritma yang yang digunakan dalam model ini adalah Long short-term
memory (LSTM), dan Gated Recurrent Unit (GRU), sedangkan untuk mendapatkan hasil word embedding
menggunakan Vector space model. Terdapat 1989 baris data dan 27 atribut, sedangkan untuk akurasi yang
dihasilkan setelah melakukan iterasi beberapa kali mendapatkan hasil yang signifikan, performance yang
dihasilkan adalah semakin mendekati akurasi yang cukup tinggi. Berdasarkan hasil eksprimen perbandingan
performance akurasi antara LSTM dan GRU terhadap penggunaan Transformers, maka terlihat lebih baik
performance akurasinya setelah menggunakan transformers pada ketiga model tersebut.

Kata kunci : Transformer, GRU, LSTM, TF-IDF, word embedding, bag of word

1. Pendahuluan Analisa sentimen sering juga dikenal


Pasar modal/ saham yang ada di dengan opinion mining yaitu studi komputasi
Indonesia merupakan pasar yang sedang dari pendapat, sentimen, sikap, serta emosi
berkembang, Sangat rentan terhadap yang disajikan dalam sebuah teks(Liu, 2012).
ekonomi global dan pasar modal dunia. Deep learning adalah salah satu cabang
Dalam pasar modal terdapa istilah investasi. dari ilmu machine learning yang terdiri
Investasi adalah suatu cara/ proses algoritme pemodelan abstraksi tingkat tinggi
penundaan konsumsi dari saat ini untuk masa pada data menggunakan sekumpulan fungsi
depan yang akan datang yang mana terdapat transformasi non-linear yang ditata berlapis-
risiko ketidakpastian.(Dwi & Pengembangan, lapis dan mendalam(Deng, 2014).
2015) Saham merupakan surat berharga/ GRU adalah arsitektur yang diciptakan
instrument pasar keuangan yang menjadi oleh Kyunghun Cho pada Tahun 2014 (Cho
bukti kepemilikan seseorang atas suatu et al., 2014). Serupa dengan LSTM, GRU
perusahaan (Ramadani, 2018). Semakin besar juga menggunakan sistem gerbang,
saham yang dimiliki, maka semakin besar Arsitektur GRU lebih sederhana daripada
kekuasaannya di perusahaan tersebut. Faktor LSTM. GRU tidak menggunakan cell state,
yang terjadi sekarang dalam sektor pasar tetapi memanfaatkan hidden state untuk
saham yaitu adanya dampak dari virus corona menyimpan informasi. Reset gate dalam
terhadap indeks harga saham dan arus dana GRU menentukan informasi baru harus
asing ke pasar saham. dilupakan atau tidak, sedangkan update gate
Untuk Metode Deep Learning yang untuk mengingat.
digunakan menggunakan model LSTM adalah metode yang lebih baik
Transformers dengan algoritma GRU, dan dibandingkan dengan konventional, metode
LSTM. sedangkan untuk mendapatkan hasil LSTM sangat cocok untuk diterapkan pada
word embedding menggunakan Vector space sentiment analisis (Jelodar et al., 2020).
model.
44
Smart Comp Vol. 11 No. 1 Januari Tahun 2022 P-ISSN: 2089-676X
E-ISSN: 2549-0796

alphanumeric kedalam bentuk vector.


2. Metode Penelitian Prediksi yang dilakukan diimplementasikan
Dalam penelitian ini melakukan prediksi dengan menggunakan Word Embedding atau
harga saham dengan menggunakan metode representasi numerik dari teks sehingga
transformer. Transformer adalah model komputer dapat menanganinya.
transduksi pertama yang mengandalkan Seteleh menerapkan transformer dengan
seluruhnya pada self-attention sendiri untuk fitur Bag of Words, Tf-IDF dan Word
mengetahui hasil representasi masukan embedding, kemudian dibandingkan dengan
maupun keluarannya. Pada penerapan ini, penerapan LSTM dan GRU.
fitur yang digunakan adalah Bag of Words, Di dalam GRU, komponen pengatur alur
Tf-IDF dan Word embedding. informasi tersebut disebut sebagai gate dan
Bag of Words (BOW) adalah algoritma GRU mempunyai 2 gate, yaitu reset gate dan
yang menghitung berapa kali suatu kata update gate. Bila kita ingin membuat
muncul dalam suatu dokumen. Jumlah kata keputusan untuk makan seperti analogi
dalam dokumen tersebut memungkinkan diatas, reset gate pada GRU akan
untuk membandingkan dokumen dan menentukan bagaimana untuk
mengukur kesamaannya untuk aplikasi menggabungkan input baru dengan informasi
seperti pencarian, klasifikasi dokumen, dan masa lalu, dan update gate, akan menentukan
pemodelan topik. berapa banyak informasi masa lalu yang
Tf-Idf merupakan singkatan dari Term harus tetap disimpan.
frequency-inverse document frequency. Jadi, Dalam penelitian ini penulis melakukan
dua hal: frekuensi istilah dan frekuensi eksprimen terhadap data public Jakarta
dokumen terbalik. Term frequency (TF) pada Composite Index (JKSE) dan data Combine
dasarnya adalah keluaran dari model BoW. News DJIA.
Untuk dokumen tertentu, ini menentukan Penelitian ini menggunakan metode
seberapa penting sebuah kata dengan melihat Knowledge Discovery Database (KDD), ada
seberapa sering kata itu muncul di dokumen. 5 langkah yang harus dilakukan dalam
Frekuensi istilah mengukur pentingnya kata. metode ini, yaitu: Seleksi Data, Pra
Jika sebuah kata muncul berkali-kali, maka Pemrosesan, Transformasi, Penambangan
kata itu pasti penting. Misalnya, jika Data, dan Evaluasi Interpretasi (lihat Gambar
dokumen kita adalah “Saya seorang pecinta 1).
kucing. Saya punya kucing bernama Steve.
Saya memberi makan kucing di luar kamar
saya secara teratur”, kita melihat bahwa kata-
kata dengan frekuensi tertinggi adalah saya,
a, dan kucing. Ini sesuai dengan intuisi kami
bahwa frekuensi jangka tinggi = kepentingan
yang lebih tinggi.
TF(t) = (Jumlah istilah t muncul dalam
dokumen) / (Jumlah total istilah dalam
dokumen) Gambar 1. Metode KDD
IDF digunakan untuk menghitung bobot
kata-kata langka di semua dokumen. Kata- 3. Hasil dan Pembahasan
kata yang jarang muncul di corpus memiliki Dalam penelitian ini melakukan prediksi
skor IDF yang tinggi. Namun, diketahui harga saham dengan menggunakan metode
bahwa istilah-istilah tertentu, seperti “aku”, transformer. Transformer adalah model
“a” mungkin sering muncul tetapi tidak transduksi pertama yang mengandalkan
begitu penting. Jadi kita perlu seluruhnya pada self-attention sendiri untuk
mempertimbangkan istilah yang sering mengetahui hasil representasi masukan
digunakan sambil meningkatkan yang langka maupun keluarannya. Pada penerapan ini,
IDF(t) = log_e(Jumlah total dokumen / fitur yang digunakan adalah Bag of Words,
Jumlah dokumen dengan term t di Tf-IDF dan Word embedding.
dalamnya).
Word embeddings adalah proses
konversi kata yang berupa karakter

45
Smart Comp Vol. 11 No. 1 Januari Tahun 2022 P-ISSN: 2089-676X
E-ISSN: 2549-0796

GRU 0,25 0,50 0,34


4
Sequential4 0,26 0,51 0,34
LSTM 1,00 1,00
(Drop Out) 1,00 1,00 1,00
5
Bidirect 1,00
model
LSTM(Drop 0,47 0,47
Out) 0,47 0,47 0,47
6
Bidirect 0,47
model
GRU(Drop 1,00 1,00
Out) 1,00 1,00 1,00
7
Bidirect 1,00
model
GRU(Drop 0,49 0,49
Out) 0,49 0,49 0,49
8
Bidirect 0,49
model
Tabel 2. Performance Akurasi Transformers
Accuracy Val- Val-
No Model Loss
Loss Accuracy
Transformers
Gambar 2. Performance Deep model LSTM 1 0,39 0,82 0,34 0,86
Epoch 1
Transformers
2 0,20 0,93 0,32 0,87
Epoch 2
Akurasi yang dihasilkan setelah
melakukan iterasi beberapa kali mendapatkan
hasil yang signifikan. Terlihat performance
dari data diatas semakin mendekati akurasi
yang cukup tinggi.
Gerbang di LSTM adalah fungsi aktivasi
sigmoid yaitu mereka menghasilkan nilai
antara 0 atau 1 dan dalam sebagian besar
kasus itu adalah 0 atau 1. kami menggunakan
fungsi sigmoid untuk gerbang karena, kami
ingin gerbang hanya memberikan nilai positif
dan harus dapat memberi kami jawaban yang
jelas apakah, kami perlu mempertahankan
fitur tertentu atau kami perlu membuang fitur
itu. Persamaan untuk gerbang LSTM adalah :
(1)

(1)
Ada beberapa variasi pada unit gated
penuh, dengan gating dilakukan
Gambar 3. Performance Deep model GRU menggunakan keadaan tersembunyi
Dari hasil eksprimen di dapatkan hasil dapat di sebelumnya dan bias dalam berbagai
lihat dari table berikut: kombinasi, dan bentuk yang disederhanakan
Tabel 1. Performance Akurasi disebut unit gated minimal. [8]
Recall F1- Awalnya, untuk t=0, vector keluarannya
No Model Precission
Score
adalah h0=0:
LSTM 0,27 0,50 0,35
1 (1)
Sequential1 0,29 0,54 0,38
LSTM 0,25 0,50 0,34 (2)
2 (3)
Sequential2 0,26 0,51 0,34
GRU 0,27 0,50 0,35 (4)
3
Sequential3 0,29 0,54 0,38

46
Smart Comp Vol. 11 No. 1 Januari Tahun 2022 P-ISSN: 2089-
676X
E-ISSN: 2549-
0796

4. Kesimpulan engenal-Evergrande-Raksasa-Properti-
Hasil penelitian dengan menggunakan China-Yang-Sedang-Krisis/.
model algoritma Recurrent neural networks [4] Jelodar, H., Wang, Y., Orji, R., &
(RNN,) Long short-term memory (LSTM), Huang, S. (2020). Deep Sentiment
dan Gated Recurrent Unit (GRU), Classification and Topic Discovery on
sedangkan untuk mendapatkan hasil word Novel Coronavirus or COVID-19
embedding menggunakan Vector space Online Discussions: NLP Using LSTM
model. Terdapat 1989 baris data dan 27 Recurrent Neural Network Approach.
atribut, sedangkan untuk akurasi yang IEEE Journal of Biomedical and
dihasilkan setelah melakukan iterasi Health Informatics, 24(10), 2733–
beberapa kali mendapatkan hasil yang 2742.
signifikan, performance yang dihasilkan https://doi.org/10.1109/JBHI.2020.300
adalah semakin mendekati akurasi yang 1216.
cukup tinggi. [5] Lien Minh, D., Sadeghi-Niaraki, A.,
Berdasarkan hasil eksprimen Huy, H. D., Min, K., & Moon, H.
perbandingan performance akurasi antara (2018). Deep Learning Approach for
LSTM dan GRU terhadap penggunaan Short-Term Stock Trends Prediction
Transformers, maka terlihat lebih baik Based on Two-Stream Gated Recurrent
performance akurasinya setelah Unit Network. IEEE Access, 6, 55392–
menggunakan transformers pada ketiga 55404.
model tersebut. https://doi.org/10.1109/ACCESS.2018.
Kesimpulan menjawab masalah penelitian 2868970.
tidak melampaui kapasitas temuan. [6] Liu, B. (2012). Sentiment Analysis and
Kesimpulan berbentuk narasi, logis, dan Opinion Mining. Synthesis Lectures on
tepat guna. Kesimpulan tidak berupa poin- Human Language Technologies, 5(1),
poin. Ukuran 11pt font Times New Roman. 1–167.
https://doi.org/10.2200/S00416ED1V0
5. Daftar Pustaka 1Y201204HLT016.
[1] Cho, K., van Merrienboer, B., [7] Liu, P., Qiu, X., & Huang, X. (2016).
Gulcehre, C., Bahdanau, D., Bougares, Recurrent Neural Network for Text
F., Schwenk, H., & Bengio, Y. (2014). Classification with Multi-Task
Learning Phrase Representations using Learning.
RNN Encoder-Decoder for Statistical [8] Ramadani, F. (2018). PENGARUH
Machine Translation. INFLASI, SUKU BUNGA DAN
[2] Deng, L. (2014). Deep Learning: NILAI TUKAR RUPIAH
Methods and Applications. TERHADAP HARGA SSAHAM
Foundations and Trends® in Signal PERUSAHAAN SEKTOR
Processing, 7(3–4), 197– PROPERTI DAN REAL ESTATE
387.https://doi.org/10.1561/200000003 YANG TERCATAT DI BURSA
9. EFEK INDONESIA. Manajemen
[3] https://www.akseleran.co.id. (2021, Bisnis, 6(1).
October 22). Mengenal Evergrande, https://doi.org/10.22219/jmb.v6i1.5392
Raksasa Properti China yang Sedang .
Krisis.
Https://Www.Akseleran.Co.Id/Blog/M

47

Anda mungkin juga menyukai