SKRIPSI
Oleh:
i
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
THESIS
By:
ii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
HALAMAN PERSETUJUAN
SKRIPSI
Disusun Oleh:
Pembimbing,
iii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
HALAMAN PENGESAHAN
SKRIPSI
PREDIKSI HARGA BURSA EFEK INDONESIA
MENGGUNAKAN METODE LONG-SHORT TERM MEMORY
Tanda Tangan
Yogyakarta, …….………………
Fakultas Sains dan Teknologi
Universitas Sanata Dharma
Dekan
iv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
HALAMAN MOTTO
Publilius Syrus.
v
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Dengan ini saya menyatakan dengan sesungguhnya bahwa tugas akhir yang saya
tulis tidak mengandung atau memuat karya orang lain, kecuali yang telah
disebutkan dalam daftar Pustaka dan kutipan selayaknya karya ilmiah.
Yogyakarta,
vi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Abstrak
Pada masa pandemi seperti sekarang ini, banyak orang yang mau mencari
uang dengan berbagai macam hal salah satunya dengan berinvestasi melalui Bursa
Efek Indonesia. Dengan meningkatnya jumlah investor baru yang bergabung ke
Bursa Efek Indonesia banyak orang yang hanya asal menginvestasikan uangnya di
perusahaan tertentu tanpa berpikir panjang.
Dengan banyaknya muncul hal tersebut maka dilakukan sebuah penelitian
untuk membuat indikator yang dapat memprediksi harga saham dengan metode
Long Short-Term Memory dengan menggunakan proses pre processing MinMax
Scaler dan Z-Score, serta penginputan lookback berentang 1 sampai 4 minggu yang
diimplementasikan ke 5 dataset berbeda
Hasil akhir dari proses ini adalah untuk mencari eror rate terkecil dari hasil
pengujian yang telah dilakukan dengan menggunakan 2 proses preprocessing dan
input Lookbaack yang ada maka didapatkan eror rate paling kecil adalah 0.13 pada
dataset PT. Medco Energi Internasional Tbk. dengan input lookback 3 minggu dan
epoch sebanyak 50.
Kata Kunci: Prediksi, Long-Short Term Memory, Harga Bursa Efek Indonesia,
Root Mean Squared Eror.
viii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Abstract
During a pandemic like today, many people are willing to make money with
various things, one of which is by investing through the Indonesia Stock Exchange.
With the increasing number of new investors joining the Indonesia Stock Exchange,
many people only invest their money in certain companies without thinking.
With so many emergences, a study was carried out to create an indicator
that can predict stock prices using the Long Short-Term Memory method using the
MinMax Scaler and Z-Score pre-processing processes, as well as inputting
lookbacks spanning 1 to 4 weeks which are implemented into 5 different datasets
The final result of this process is to find the smallest error rate from the test
results that have been carried out using 2 preprocessing processes and existing
Lookback inputs, the smallest error rate is 0.13 in the PT. Medco Energi
International Tbk. with a 3-week input lookback and 50 epochs.
ix
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Kata Pengantar
Puji syukur penulis haturkan pada Tuhan Yang Maha Esa atas segala berkat
yang telah diberikan pada penulis sehingga dapat menyelesaikan tugas akhir yang
berujudul “Prediksi Harga Bursa Efek Indonesia Menggunakan Metode Long-Short
Term Memory” ini dengan baik. Tugas Akhir ini merupakan salah satu syarat yang
harus ditempuh oleh penulis untuk memperoleh gelar Sarjana Komputer yang
penulis tempuh di prodi Informatika Universitas Sanata Dharma Yogyakarta.
Dalam menyelesaikan tugas akhir ini penulis tak lepas dari doa, dukungan,
motivasi, maupun bimbingan dari berbagai pihak. Pada kali ini penulis ingin
mengucapkan terima kasih pada:
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Penulis menyadari masih banyak kekurangan yang terdapat pada tugas akhir
ini. Maka dari itu kritik maupun saran yang membangun dapat sangat membantu
penulis untuk menyempurnakannya. Semoga tugas akhir ini dapat bermanfaat bagi
siapapun yang membacanya dan saya sendiri sebagai penulis tugas akhir ini
Yogyakarta, …………………..
Penulis ……………
xi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Daftar Isi
xii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Daftar Tabel
xv
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Daftar Gambar
Gambar 2.1 Kiri Reccurent Network, tengah Multi Layer, kanan Single Layer 6
Gambar 2.2 Arsiterktur RNN 7
Gambar 2.2 Arsitektur Jaringan LSTM 8
Gambar 2.3 Arsitektur Forget Gate 9
Gambar 2.3 Arsitektur Input Gate 10
Gambar 2.4 Arsitektur Cell state baru 11
Gambar 2.5 Arsitektur Hidden State baru 12
xvi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xvii
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Bab I
Pendahuluan
Pada bab ini akan menjelaskan mengapa peneliti mengambil bahan penelitian
dengan judul Prediksi Harga Bursa Efek Indonesia Menggunakan Metode Long-
Short Term Memory. Pada bab ini akan dijelaskan latar belakang peneliti memilih
judul ini dilanjutkan dengan tujuan masalah, rumusan masalah, manfaat penelitian
dan batasan masalah yang diteliti pada penelitian ini.
Dengan data tersebut peneliti yang juga merupakan salah satu dari sekian
banyak orang yang ikut masuk ke dunia investasi tentu saja ingin mendapatkan
sebuah keuntungan dari hasil berinvestasi tersebut. Ditambah dengan
meningkatnya jumlah investor baru dan muncul beberapa berita kurang
mengenakan dikarenakan orang-orang yang masuk ke bursa efek hanya mengikuti
tren saja yang mengakibatkan banyaknya investor merugi (Viral Beli Saham Pakai
Utang n.d.). Maka dari itu memunculkan ide untuk membuat suatu alat bantu atau
indikator yang dapat berguna untuk memprediksi pergerakan dari emiten yang
melantai di Bursa Efek Indonesia.
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Banyak cara yang dapat dilakukan untuk membuat suatu sistem prediksi
seperti salah satunya adalah Neural Network System Long-Short Term Memory.
Metode ini dianggap memiliki performa yang cukup baik dengan tingkat kesalahan
yang rendah dengan tingkat kesalahan yang rendah tersebut harga saham yang
diprediksi dapat akurat (Arfan and ETP, 2019). Metode ini dapat bekerja
menggunakan sebuah data yang disebut data Time-Series yang di mana tipe data
tersebut dapat diproses menggunakan metode yang dipilih peneliti.
Penelitian tentang prediksi harga saham ini sudah cukup banyak dilakukan di
lakukan oleh peneliti lain yang di mana peneliti tersebut menggunakan Mean
Squared Eror atau Root Mean Squared Eror untuk mencari tingkat error rate yang
di mana semakin kecil angka MSE atau RMSE maka semakin akurat hasil prediksi
tersebut. Berikut adalah hasil penelitian yang dilakukan oleh beberapa peneliti lain
seperti penelitian dari (Ko and Chang, 2021) yaitu penelitian tentang beberapa
emiten yang melantai di bursa efek Tiongkok, tingkat RMSE paling rendah yang
didapatkan dari 6 emiten yang diuji salah satunya bernilai 0.073. Penelitian dari
(Karno, 2020) memprediksi harga emiten BRI dengan tingkat RMSE yang
didapatkan 227,47. Penelitian dari (Arfan and ETP, 2019) memprediksi harga
emiten Unilever dengan tingkat MSE yang didapatkan sebesar 0.0015.
Dengan hasil penelitian yang telah dilakukan peneliti lain yang di mana
memiliki tingkat error rate yang cukup rendah, maka dari itu peneliti ingin
melakukan penelitian berupa Prediksi Harga Bursa Efek Indonesia menggunakan
metode LSTM dengan menggunakan data dari emiten yang berbeda dan keluaran dari
penelitian ini dapat memprediksi harga saham untuk hari berikutnya. Selain itu
peneliti juga ingin mengetahui apakah dengan adanya penelitian ini dapat
memperkuat indikator-indikator lain yang digunakan oleh peneliti untuk
menganalisis emiten secara manual.
Bab II
Landasan Teori
Pada bab ini akan dilakukan pembahasan mengenai teori yang digunakan
peneliti dalam penelitian kali ini yang meliputi Bursa Efek, Indeks Liquidity, Deep
Learning, Long Short-Term Memory, MinMax Scaler, Z-Score Scaler, dan Root
Mean Squared Error.
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Pada table 2.1 di atas merupakan contoh dari salah satu isi dari indeks yang
dikeluarkan oleh Bursa Efek Indonesia. Terdapat 3 Indeks Liquidity yang
dikeluarkan secara resmi oleh Bursa Efek Indonesia yaitu LQ 30, LQ 45, LQ 80.
Pada tiga indeks tersebut dapat berisi perusahaan yang sama secara jelasnya
perusahaan yang masuk ke dalam indeks LQ 30 sudah pasti juga berada di daftar
indeks LQ 45 dan LQ 80 sementara untuk indeks LQ 45 dan LQ 80 ada beberapa
perusahaan yang tidak termasuk dalam indeks LQ 30.
dan dapat membuat sebuah keputusan berdasarkan hasil proses belajar yang
dilakukan.
Neural Network atau artificial neural network atau ANN terbagi menjadi 3
bagian yaitu single layer, multi layer, dan reccurent network. Single layer bekerja
dengan input layer yang berasal dari sumber node diproyeksikan langsung ke utput
pada layer neuron tetapi tidak berlaku sebaliknya. Multi layer adalah input layer
yang menyuplai input vector pada jaringan, kemudian input tersebut di masukan
melalui komputasi pada layer kedua, hasil dari output layer kedua digunakan
sebagai input layer ketiga dan seterusnya atau sampai jumlah layer yang digunakan
sudah terpenuhi. Reccurent Network terbentuk pada jaringan single dan multi layer
yang idmana harus memiliki feedback untuk diri sendiri pada setiap loop
jaringannya (Artificial Neural Network (ANN) – Universitas Gadjah Mada Menara
Ilmu Machine Learning n.d.). Proses dari dari bagian-bagian dari ANN dapat dilihat
pada gambar 2.1 berikut
Pada gambar 2.2 dapat dilihat untuk arsitektur dari RNN pada bagian
sebelum tanda panah merupakan bentuk posisi RNN yang tidak dibuka atau dapat
dikatakan pada posisi unrolled ke jaringan penuh atau full network. Untuk bagian
setelah tanda panah merupakan posisi RNN pada bentuk full network. Xt pada
gambar di atas menjelaskan tentang input time step atau input data yang di masukan
ke model perhitungan. St merupakan hidden state pada step t yang berupa sebuah
memory yang di mana pada bagian ini dapat menyimpan hasil perhitungan yang
telah dilakukan. Ot merupakan output hasil step t yang di mana hasil ini nantinya
dapat digunakan sebagai input untuk perhitungan time step selanjutnya ataupun
menjadi hasil akhir dari semua perhitungan yang telah dilakukan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
Dapat dilihat pada Gambar 2.1 bahwa pada proses ini terbagi
menjadi 2 bagian yang di mana bagian pertama mengambil nilai input
data baru ditambah dengan hidden state lalu dilakukan proses sigmoid
untuk mendapatkan hasil 0 sampai 1, proses ini dapat dirumuskan
sebagai berikut:
𝑖𝑡 = σ(𝑊𝑖 × [ℎ𝑡 − 1, 𝑋𝑡 ] + 𝑏𝑖 ) (2.2)
Keterangan :
𝑖𝑡 : input gate
σ : fungsi sigmoid
𝑊𝑖 : weight input gate
ℎ𝑡 − 1 : output dari block lstm pada timestep sebelumnya
𝑋𝑡 : input pada timestep saat ini
𝑏𝑖 : bias input gate
Sementara pada proses kedua menggunakan data yang sama
dengan proses sebelumnya namun setelah ditambahkan menggunakan
fungsi tanh untuk mendapatkan hasil -1 sampai 1 proses ini dapat
dirumuskan sebagai berikut
𝐶̃𝑡 = α(𝑊𝑐 × [ℎ𝑡 − 1, 𝑋𝑡 ] + 𝑏𝑐 ) (2.4)
Keterangan :
𝐶̃𝑡 : kandidat representasi cell state pada timestep t
α : fungsi tanh
𝑊𝑐 : weight cell state
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
12
13
Dengan proses arsitektur LSTM yang sudah dijabarkan di atas, maka bentuk
permodelan pada LSTM dimulai dari Input Gate yang dimana data akan mulai di
masukan ke dalam jaringan neural network untuk dilakukan proses perhitungan atau
proses pembelajaran. Kemudian berlanjut ke bagian cell state di mana data akan di
proses kembali untuk menjalani iterasi atau perulangan berikutnya atau
mengeluarkan hasil akhir yang di mana hal ini juga akan divalidasi bersamaan
dengan output gate.
Forget gate pada algoritma ini digunakan Ketika proses iterasi atau perulangan
proses learning masih harus dilanjutkan yang di mana bagian ini akan menyaring
data yang dianggap tidak perlu dan dilanjutkan pada gate selanjutnya.
𝑥−𝑥𝑚𝑖𝑛
𝑥𝑠𝑡𝑑 = (2.8)
𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛
Keterangan :
𝑥𝑠𝑡𝑑 : nilai baru atau value baru
𝑥 : nilai original atau nilai asli atau nilai awal
𝑥𝑚𝑖𝑛 : nilai minimum pada kolom
𝑥𝑚𝑎𝑥 : nilai maksimum pada kolom
14
dengan cara mentransformasi ke dalam bentuk distribusi dengan nilai rata-rata 0 dan
standart deviasi 1 (Data normalization with Pandas and Scikit-Learn | by Amanda
Iglesias Moreno | Towards Data Science n.d.). Setiap data yang distrandarisasikan
nilainya dihitung dengan mengurangi rata-rata fitur dan membaginya dengan standar
deviasi.
𝑥− 𝜐
𝑥𝑠𝑡𝑑 = (2.9)
𝜎
Keterangan :
𝑥𝑠𝑡𝑑 : nilai standarisasi
𝑥 : nilai original atau nilai asli atau nilai awal
𝜐 : rata rata populasi
𝜎 : standar deviasi populasi
𝑅𝑀𝑆𝐸 = √̅̅̅̅̅̅̅̅̅̅
(𝑓 − 𝑂)2 (2.10)
Keterangan :
𝑅𝑀𝑆𝐸 : nilai standarisasi
𝑓 : hasil yang diharapkan atau data asli
𝑂 : nilai hasil pengujian
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Bab III
Metodologi Penelitian
Pada bab ini akan dibahas mengenai data penelitian yang akan digunakan, alat
yang digunakan peneliti untuk melakukan penelitian, desain alat uji yang
digunakan, scenario pengujian yang dilakukan, dan desain interface yang
digunakan.
15
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
17
Pada proses awal data diambil dari local yang sudah didapatkan sebelumnya
dan semua pengujian menggunakan data Close, bentuk data yang ada sebagai berikut:
18
Adj
Date Open High Low Close Volume
Close
8/18/2020 690 715 685 690 690 26173700
8/19/2020 690 705 690 690 690 6584600
8/24/2020 690 710 685 710 710 27868500
8/25/2020 710 720 695 705 705 18177600
8/26/2020 710 710 695 695 695 20689600
8/27/2020 700 705 685 685 685 8288900
8/28/2020 685 695 680 685 685 12940100
8/31/2020 690 690 665 680 680 22706300
Dengan data yang sudah didapatkan maka dilakukan proses Normalisasi data
dan pembagian data atau bisa disebut split data. Proses split data dilakukan dengan
cara membagi data secara langsung yaitu dengan membagi jumlah data pada dataset
yang ada. Pada pegujian ini pembagian dataset dibagi menjadi 98% testing 2%
testing. Pembagian ini didapatkan berdasarkan hasil peneliti membaca referensi
maupun jurnal yang ada.
19
20
1 2 3 4 5 6 7 8 9 10
Input Output
1, 2 3
2, 3 4
3, 4 5
4, 5 6
5, 6 7
6, 7 8
7, 8 9
8, 9 10
Secara jelas lookback ini digunakan untuk membagi data untuk menjadi
train per minggu ataupun per hari, penggunaan lookback ini berbeda-beda
tergantung penelitian yang dilakukan. Hal ini juga berpengaruh pada timestep
LSTM yang digunakan maka bentuknya akan menjadi seperti berikut:
21
Pada gambar grafik di atas dapat dilihat untuk proses kerja LSTM
pada penggunaan lookback. Kotak biru menjadi nilai input yang di masukan
pada algoritma LSTM yang kemudian berlanjut ke kotak merah yang di
mana input data di masukan ke dalam neuron-neuron LSTM. Pada kotak
kuning di mana algoritma LSTM bekerja ketika nilai input di masukan maka
akan diteruskan pada proses perhitungan di forget gate, input gate, output
gate.
Proses pertama dimulai dengan masuknya data pada cell LSTM.
Nilai input masuk ke dalam gate yang ada pada LSTM unit secara
bersamaan. Pada forget gate apabila nilai input yang sudah dilakukan
perhitungan bernilai 0 maka data tersebut tidak akan diteruskan pada proses
timestep selanjutnya sebaliknya apabila bernilai mendekati diubah menjadi
nilai hidden state pada unit/timestep selanjutnya pada proses LSTM.
Sebagai contoh pada gambar di atas setelah data input di proses pada LSTM
t+1 dilanjutkan ke LSTM t+2 hasil dari LSTM t+1 menjadi nilai hidden state
pada proses LSTM t+2 hal ini berulang sampai pada t+n yang sudah
ditentukan atau jumlah perhitungan pada lookback yang digunakan sudah
terpenuhi. Proses ini juga akan diulangi terus menerus sampai sesuai dengan
berapa banyak epoch yang digunakan pada penelitian ini.
22
Pada proses training data ini data mulai masuk pada gate yang terdapat pada
metode LSTM ini. Semua data input awal di masukan pada proses forget gate
terlebih dahulu yang di mana forget gate ini akan mengecek apakah ada kesamaan
pada data input sebelumnya. Apabila ada data yang sama maka dapat dilihat pada
kolom 5 dari tabel 3.3 input pada kolom input 3 dan 4 yang bernilai 655 sebelum
dilakukan proses normalisasi. Pada kolom 3 data sudah terlebih dahulu dilakukan
proses perhitungan maka dari itu ketika data pada kolom ke 4 masuk ke forget gate
maka data tersebut langsung di eliminasi oleh forget gate dan cell state yang ada
sebelumnya langsung diteruskan ke proses timestep selanjutnya. Hal ini yang
membuat LSTM lebih efisien dalam melakukan proses training data.
Setelah data di masukan ke dalam proses LSTM data akan terus di train
sampai batasan tertentu, batasan yang dimaksud ini adalah jumlah perulangan yang
dilakukan pada proses training data dengan metode ini. Begitu perulangan selesai
maka didapatkan hasil output dari perhitungan sebagai berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
24
𝑅𝑀𝑆𝐸 = √̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅̅
(total data test − total hasil prediksi)2
Dengan demikian hasil pengujian untuk data dummy didapatkan dengan nilai
error rate yang didapatkan 14.343 poin, hasil ini merupakan tingkat yang cukup baik
karena rata-rata nilai hasil prediksi memiliki perbedaan yang tidak jauh dengan data
asli yang ada.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
Pada tabel 3.8 merupakan parameter yang akan digunakan pada pengujian
kali ini. Angka ini dipilih dengan mengacu pada jurnal-jurnal yang menjadi acuan
penulis. Pada prosesnya pengujian akan dilakukan sebagai berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
27
Pengujian ini dilakukan pada semua dataset yang ada total pengujian yang
dilakukan sebanyak 40 kali pengujian yang di mana pada masing-masing dataset
perusahaan dilakukan pengujian sebanyak 8 kali yang terdiri dari pengujian dengan
menggunakan lookback 5, 10, 15, 20 dan normalisasi MinMax maupun Z-Score.
Dengan penggunaan beberapa parameter di atas maka hasil yang optimal atau nilai
eror rate yang didapatkan dapat bernilai kurang dari 1.
28
Bab IV
Hasil Penelitian Dan Analisis
Pada bab ini dijelaskan mengenai hasil penelitian yang telah diuji oleh
peneliti berdasarkan data yang sudah dipilih peneliti.
4.1. Data
Data yang digunakan berupa 5 dataset terdiri dari beberapa perusahan yang
berada dalam list Bursa Efek Indonesia yaitu PT. Aneka Tambang Tbk. (ANTM),
PT. Bank Central Asia Tbk. (BBCA), PT. Medco Energi Internasional Tbk.
(MEDC), PT. Perusahaan Gas Negara Tbk. (PGAS), PT. Mitra Adi Perkasa Tbk.
(MAPI). Kelima dataset ini nantinya akan digunakan satu persatu untuk mencari
prediksi masing masing dari harga saham perusahaan tersebut.
Seluruh scenario ini digunakan sesuai dengan yang sudah peneliti tuliskan
pada bab sebelumnya dan untuk hasil penelitian ini parameter deep learning pada
masing-masing pengujian algoritma LSTM yang digunakan sebagai berikut:
Tabel 4.1 Proses Pengujian
Proses Pengujian
Param\Pengujian 1 2 3 4
MinMax & MinMax & MinMax & MinMax &
Normalise Data
Z-Score Z-Score Z-Score Z-Score
Lookback 5 10 15 20
learning rate 0.01 0.01 0.01 0.01
split data 0.98 0.98 0.98 0.98
Neuron 10 10 10 10
Batch size 15 15 15 15
Epoch 50 50 50 50
Validation 0.01 0.01 0.01 0.01
29
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
Pada gambar 4.1 di atas digunakan fungsi pandas untuk membaca data csv
yang nantinya akan digunakan untuk proses pengujian. Seluruh file yang ada
tersimpan di lokal data.
Pada gambar 4.2 dan 4.3 merupakan potongan code yang dilakukan untuk
melakukan proses normalisasi data yang akan digunakan untuk pengujian. Nantinya
setelah proses normalisasi sudah selesai akan dilanjutkan ke proses pembagian data
train dan data test.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
32
33
34
Untuk data train dan testnya akan di inputkan juga history point yang
di mana history point ini digunakan untuk melihat nilai data dengan rentang
hari tertentu sesuai dengan yang di inputkan.
Pada gambar 4.11 dilakukan Langkah awal untuk membuat model LSTM
yang akan digunakan. Bentuk dari LSTM terdiri dari history_point atau bisa
disebut lookback dan dimensi yang didapatkan dari hasil preprocessing.
35
Untuk melatih data, digunakan epoch atau perulangan sebanyak 50 kali dan
dengan total batch 15. Untuk validasi data digunakan sebesar 0.01 agar lebih akurat.
Perhitungan error rate didapatkan dari hasil testing dengan model predict
yang dilakukan sebelumnya. Pada library memang tertulis mean squared error.
Berdasarkan publikasi dari website resmi scikit learn maka untuk mendapatkan root
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
mean squared error ini dapat ditambahkan squared = False untuk mendapatkan
nilai RMSE (sklearn.metrics.mean_squared_error — scikit-learn 1.1.1
documentation n.d.).
37
Error Rate
0.6
0.4
0.2
0
MEDC WIKA ANTM MAPI BBCA
Emiten
MinMax Z-Score
Berdasarkan hasil yang dapat dilihat pada tabel 4.2 dan gambar 4.14
dapat diketahui bahwa untuk pengujian dengan menggunakan lookback 5
ini error rate terendahnya didapatkan pada pengujian perusahaan MAPI
dengan nilai eror sebesar 0.198 dengan menggunakan normalisasi MinMax.
38
0.6
Error Rate
0.4
0.2
0
MEDC WIKA ANTM MAPI BBCA
Emiten
MinMax Z-Score
39
0.6
Error Rate
0.4
0.2
0
MEDC WIKA ANTM MAPI BBCA
Emiten
MinMax Z-Score
40
0.8
0.6
0.4
0.2
0
MEDC WIKA ANTM MAPI BBCA
Emiten
MinMax Z-Score
41
42
0.8
0.6
0.4
0.2
0
LB 5 LB 10 LB 15 LB 20
Lookback
MinMax Z-Score
43
44
45
Error Rate
0.6
0.4
0.2
0
LB 5 LB 10 LB 15 LB 20
Lookback
MinMax Z-Score
46
dengan melihat tingkat error yang didapatkan cukup baik dan dengan
perbedaan nilai lookback yang berbeda tidak terlalu mempengaruhi hasil
pengujian. Untuk hasil dari pengujian antara data testing dan hasil prediksi
dapat dilihat pada gambar berikut ini.
Berdasarkan gambar 4.24 dan 4.25 dapat dilihat bahwa untuk harga
prediksi posisinya cukup mendekati dengan harga testing yang digunakan.
Untuk error rate yang cukup kecil pada pengujian ini di dominasi dengan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
47
0.2
0.1
0
LB 5 LB 10 LB 15 LB 20
Lookback
MinMax Z-Score
48
Dari data pada tabel 4.9 dapat dilihat bahwa untuk data perusahaan
MEDC mendapat tingkat error yang cukup rendah. Pada normalisasi
MinMax penggunaan nilai lookback cukup berpengaruh dalam memprediksi
harga saham. Untuk normalisasi Z-Score penggunaan lookback yang
berbeda cukup mempengaruhi tingkat error yang didapatkan dan proses
normalisasi ini dapat dikatakan yang terbaik untuk pengujian dengan
menggunakan data ini hasilnya dapat dilihat sebagai berikut.
0.2
0.1
0
LB 5 LB 10 LB 15 LB 20
Lookback
MinMax Z-Score
Untuk hasil pengujian antara data testing dan hasil prediksi dapat
dilihat sebagai berikut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
49
50
0.4
0.2
0
LB 5 LB 10 LB 15 LB 20
Lookback
MinMax Z-Score
51
52
sebelumnya dapat dilihat bahwa hasil yang didapat cukup baik dan untuk
mendapatkan hasil yang lebih baik lagi untuk beberapa Pengujian yang sudah
dilakukan maka penguji melakukan pengujian kembali dengan memvariasikan
parameter yang ada dan di dapatkan hasil sebagai berikut ini.
Bab V
Penutup
5.1. Kesimpulan
Berdasarkan hasil penelitian tentang Prediksi Harga Bursa Efek Indonesia
Menggunakan Metode LSTM yang telah dikerjakan, maka dapat disimpulkan
sebagai berikut:
1. Pengujian dengan menggunakan 5 dataset yang berbeda dan
menggunakan beberapa parameter yang berbeda menunjukan bahwa
hasil prediksi yang didapat hasil yang cukup baik dan memiliki nilai eror
rate yang cukup optimal.
2. Penggunaan jumlah neuron yang berbeda dapat mempengaruhi hasil
akhir dari proses pengujian hasil yang didapatkan dapat bernilai lebih
baik.
3. Penggunaan normalisasi data dapat berpengaruh terhadap hasil
pengujian seperti contoh pengujian data ANTM ketika penggunaan
lookback 20 untuk hasil Z-Score menjadi sangat tinggi dikarenakan
normalisasi ini merata-rata seluruh nilai yang digunakan pada pengujian
dengan adanya hal tersebut ketika nilai yang dinormalisasi mengalami
kenaikan yang cukup signifikan menimbulkan nilai error yang cukup
besar.
4. Arsitektur terbaik didapatkan pada pengujian data PT. Medco Energi
Internasional Tbk. dengan pengujian pada model lookback 15 hari dan
proses normalisasi Z-Score yang menghasilkan error rate 0.131.
Dengan hasil yang didapatkan maka dapat ditentukan apakah emiten
yang diprediksi aman untuk di investasikan atau tidak.
53
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
54
5.2. Saran
Untuk pengembangan sistem yang ada, adapun saran yang dapat diberikan
untuk membuat sistem ini lebih baik lagi yaitu:
1. Dapat dilakukan proses Forecasting untuk melihat ramalan harga di hari
kedepan.
2. Penggunaan dataset terbaru.
3. Menggunakan parameter yang berbeda seperti penggunaan fungsi
aktivasi yang berbeda, parameter LSTM yang berbeda.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
Daftar Pustaka
“Analysis of Stock Price Predictions using LSTM models | by Yu Hao Lee | Analytics Vidhya |
Medium.” https://medium.com/analytics-vidhya/analysis-of-stock-price-predictions-
using-lstm-models-f993faa524c4 (tanggal di akses November 29, 2021).
“A Tour of Machine Learning Algorithms.” https://machinelearningmastery.com/a-tour-of-
machine-learning-algorithms/ (tanggal di akses June 23, 2022).
Arfan, Adhib, and Lussiana ETP. 2019. “Prediksi Harga Saham Di Indonesia Menggunakan
Algoritma Long Short-Term Memory.” SeNTIK 3(1): 225–30.
“Artificial Neural Network (ANN) – Universitas Gadjah Mada Menara Ilmu Machine
Learning.” https://machinelearning.mipa.ugm.ac.id/2018/05/24/artificial-neural-network-
ann/ (tanggal di akses June 23, 2022).
“Data Normalization with Pandas and Scikit-Learn | by Amanda Iglesias Moreno | Towards Data
Science.” https://towardsdatascience.com/data-normalization-with-pandas-and-scikit-
learn-7c1cc6ed6475 (tanggal di akses May 27, 2022).
Indonesia Stock Exchange (IDX). 2021. “Pengumuman Evaluasi Mayor Indeks IDX30, LQ45
Dan IDX80 No. Peng-00210/BEI.POP/07-2021.” 2021.
“Investor Newbie Wajib Kenalan Nih Sama Indeks LQ45.”
https://www.idxchannel.com/economia/investor-newbie-wajib-kenalan-nih-sama-indeks-
lq45 (tanggal di akses June 15, 2022).
Karno, Adhitio Satyo Bayangkari. 2020. “Prediksi Data Time Series Saham Bank BRI Dengan
Mesin Belajar LSTM (Long ShortTerm Memory).” Journal of Informatic and Information
Security 1(1): 1–8.
Ko, Ching Ru, and Hsien Tsung Chang. 2021. “LSTM-Based Sentiment Analysis for Stock Price
Forecast.” PeerJ Computer Science 7: 1–23.
“LSTM : What’s the Fuss about?. LSTM Learns. LSTM Remembers. Be Like… | by Etqad
Khan | Analytics Vidhya | Medium.” https://medium.com/analytics-vidhya/lstm-whats-the-
fuss-about-1ae9d4c3e33e (tanggal di akses September 19, 2022).
Olah, Christopher. 2015. “Understanding LSTM Networks [Blog].” Web Page: 1–13.
http://colah.github.io/posts/2015-08-Understanding-LSTMs/.
“Pengenalan Deep Learning – Universitas Gadjah Mada Menara Ilmu Machine Learning.”
55
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
56
https://machinelearning.mipa.ugm.ac.id/2018/06/10/pengenalan-deep-learning/ (tanggal di
akses June 23, 2022).
PT Kustodian Sentral Efek Indonesia. 2021. “Statistik Pasar Modal Indonesia Februari 2021.” :
1–6.
“Recurrent Neural Network (RNN) – Universitas Gadjah Mada Menara Ilmu Machine
Learning.” https://machinelearning.mipa.ugm.ac.id/2018/07/01/recurrent-neural-network-
rnn/ (tanggal di akses June 23, 2022).
“RMSE: Root Mean Square Error - Statistics How To.”
https://www.statisticshowto.com/probability-and-statistics/regression-analysis/rmse-root-
mean-square-error/ (tanggal di akses December 1, 2021).
“Sklearn.Metrics.Mean_squared_error — Scikit-Learn 1.1.1 Documentation.” https://scikit-
learn.org/stable/modules/generated/sklearn.metrics.mean_squared_error.html (tanggal di
akses June 14, 2022).
“Sklearn.Preprocessing.MinMaxScaler — Scikit-Learn 1.0.1 Documentation.” https://scikit-
learn.org/stable/modules/generated/sklearn.preprocessing.MinMaxScaler.html (tanggal di
akses December 1, 2021).
“ViralBeli Saham Pakai Utang.” https://www.cnnindonesia.com/ekonomi/20210118092457-
92-594972/viral-beli-saham-pakai-utang (tanggal di akses November 29, 2021).
“Yahoo Finance - Stock Market Live, Quotes, Business & Finance News.”
https://finance.yahoo.com/ (tanggal di akses November 29, 2021).