Anda di halaman 1dari 12

Data Mining Menggunakan Regresi Linear untuk Prediksi Harga Saham

Perusahaan Pelayaran

(Data Mining Using Linear Regression to Predict the Stock Price of


Shipping Companies)

Bintang Aditya Alhakam

Universitas Budi Luhur, Fakultas Teknologi Informasi, Sistem Informasi


1912500103@student.budiluhur.ac.id

Abstrak: Pergerakan harga penutupan saham BULL cenderung mengalami variasi harga tiap hari.
Investor memerlukan tindakan yang tepat, sehingga resiko yang ada dapat dikurangi dengan mengetahui
naik turunnya harga saham pada masa yang akan datang dan memprediksi langkah kebijakan yang
optimal untuk membuat keputusan pembelian/penjualan saham yang sesuai. Tujuan penelitian ini untuk
menerapkan data mining menggunakan regresi linear untuk prediksi harga saham perusahaan pelayaran.
Lokasi penelitian, yaitu di Bursa Efek Indonesia, Jakarta. Populasi dalam penelitian ini adalah semua
perusahaan pelayaran yang terdaftar di Bursa Efek Indonesia. Jenis nonprobability sampling yang dipilih
yaitu purposive sampling dan quota sampling. Purposive sampling yang dipakai adalah sebanyak 1
perusahaan pelayaran, yakni PT. Buana Lintas Lautan, Tbk (BULL). Quota sampling yang digunakan
dalam penelitian ini adalah data time series periode harian harga pembukaan, harga tertinggi, harga
terendah, harga penutupan, dan volume saham periode harian BULL selama 1 tahun 2 bulan antara bulan
Juni tahun 2019 hingga bulan Juli tahun 2020. Penelitian ini menggunakan metodologi Cross Industry
Standard Process for Data Mining (CRISP-DM). Proses data mining berdasarkan CRISP-DM terdiri dari
6 fase, yaitu Bussiness Understanding, Data Understanding, Data Preparation, Modelling, Evaluation,
dan Deployment. Hasil penelitian menunjukkan masih ada selisih antara harga penutupan saham luaran
data testing dengan harga penutupan saham aktual yang ada di bursa saham. Evaluasi nilai Root Mean
Square Error (RMSE) menunjukkan angka plus 7,522 dari data aktual harga penutupan saham periode
harian PT. BULL.

Abstract: The movement of the closing price of BULL shares tends to experience price variations every
day. Investors need appropriate action, so that existing risks can be reduced by knowing the ups and
downs of stock prices in the future and predicting the optimal policy steps to make appropriate share
buying / selling decisions. The purpose of this study is to apply data mining using linear regression to
predict the share price of shipping companies. The research location is on the Indonesia Stock Exchange,
Jakarta. The population in this study are all shipping companies listed on the Indonesia Stock Exchange.
The type of nonprobability sampling chosen was purposive sampling and quota sampling. The purposive
sampling used is 1 shipping company, namely PT. Buana Lintas Lautan, Tbk (BULL). The sampling quota
used in this study is the time series data for the daily opening price, the highest price, the lowest price,
the closing price, and the volume of shares during the BULL daily period for 1 year 2 months between
June 2019 and July 2020. This study uses the Cross Industry Standard Process for Data Mining (CRISP-
DM) methodology. The data mining process based on CRISP-DM consists of 6 phases, namely Business
Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, and Deployment. The
results showed that there is still a difference between the closing price of the output of the test data and
the closing price of the actual shares on the stock exchange. Evaluation of the value of Root Mean Square
Error (RMSE) shows the plus number 7.522 from the actual data on the closing price of shares in the
daily period of PT. BULL.

PENDAHULUAN yang menarik untuk dibicarakan


Naik turunnya harga saham di berkaitan dengan isu naik turunnya nilai
pasar modal menjadi sebuah fenomena perusahaan itu sendiri. Fluktuasi harga

120
121

saham terjadi pada perusahaan terendah, volume) dinaikkan atau


pelayaran yang terdaftar di Bursa Efek diturunkan nilainya.
Indonesia. Salah satu perusahaan
pelayaran yang cenderung mengalami Penelitian yang relevan
fluktuasi harga saham dalam 5 tahun Tabel 1 menunjukkan hasil
terakhir adalah PT. Buana Lintas penelitian terdahulu yang telah
Lautan, Tbk (BULL). Pergerakan harga dilakukan peneliti-peneliti lain
penutupan saham BULL cenderung sebelumnya.
mengalami variasi harga tiap hari. Persamaan penelitian yang
Kumpulan data saham periode dilakukan dengan penelitian terdahulu
harian BULL membutuhkan penggalian adalah menggunakan algoritma regresi
data (data mining) untuk mencari pola linear.
atau informasi menarik dalam prediksi Perbedaan penelitian yang
harga saham dengan menggunakan dilakukan dengan penelitian terdahulu
teknik atau metode atau algoritma atau kebaruan penelitian (novelty),
tertentu. yaitu menggunakan perhitungan skor
Beberapa penelitian tentang deviasi untuk regresi linear berganda
pendekatan prediksi harga saham telah data training dan proses data mining
dilakukan menggunakan berbagai dengan CRISP-DM.
metode selain analisis fundamental dan
analisis teknikal, antara lain Jaringan Cross Industry Standard Process for
Syaraf Tiruan, Autoregressive Data Mining (CRISP-DM)
Integrated Moving Average (ARIMA), Metodologi CRISP-DM
Hidden Markov Model, Hybrid regresi mempunyai enam tahapan, yaitu
dengan Algoritma Genetika, dan Business Understanding, Data
Support Vector Regression. Salah satu Understanding, Data Preparation,
metode yang umum digunakan untuk Modeling, Evaluation, dan Deployment
memprediksi data adalah metode (Suntoro, 2019).
Regresi, karena memiliki keunggulan, Business understanding berisi
yakni perhitungannya yang mudah. tentang menentukan tujuan bisnis,
Uraian latar belakang masalah menilai situasi saat ini, dan menetapkan
tersebut dapat diturunkan rumusan tujuan dilakukan data mining. Data
masalah yang akan dicari jawabannya understanding merupakan kegiatan
melalui penelitian ini, yaitu Bagaimana persiapan, mengevaluasi persyaratan
data mining menggunakan regresi linear data, dan termasuk pengumpulan data.
untuk prediksi harga saham perusahaan Data preparation dilakukan setelah data
pelayaran? dikumpulkan, data-data tersebut perlu
Tujuan penelitian berikut ini diidentifikasi, dipilih, dibersihkan,
merupakan uraian hasil yang akan kemudian dibangun ke dalam
dicapai melalui penelitian, yaitu bentuk/format yang diinginkan.
menerapkan data mining menggunakan Modeling adalah aplikasi dari algoritma
regresi linear untuk prediksi harga untuk mencari, mengidentifikasi, dan
saham perusahaan pelayaran. menampilkan pola. Evaluation
Luaran penelitian mampu digunakan untuk membantu
memprediksi harga saham perusahaan pengukuran evaluasi pada model.
pelayaran periode harian dengan Deployment digunakan untuk
mengetahui perubahan nilai variabel melakukan otomatisasi model atau
terikat (harga penutupan), bila nilai pengembangan aplikasi, terintregasi
variabel bebas (tanggal, harga dengan sistem informasi manajemen
pembukaan, harga tertinggi, harga atau operasional yang ada.
122

Tabel 1
Hasil Penelitian yang Relevan
Peneliti/
Judul Masalah Pendekatan/ Teori Hasil
tahun
Padhye, Regression prediction of stock - Linear regression Technical method depends on the weekly data
Sudip and Analysis for Stock value for upcoming - Gaussian and the Weka forecast package. More
Karuna Gull Market Prediction week, for various regression specifically the comparison is done on the data
(2016) using Weka Tool companies by knowing - RegressionByDisc collected for different companies using various
without Sentiment the previous weeks retization regression methods to predict the future
Analysis stock data - RBFRegressor position of the stock market.
- MultilayerPercep This paper began by stating that irrespective of
tron the type or the sector of the stock, predictions
with less errors can be made. In our
- MLPRegressor
consideration of 6 stocks, KPIT belongs to IT
- SMOReg
Sector, Ashok Leyland and Bajaj Auto belongs
- M5P to automotive sector, Axis Bank is a banking
(Padhye, 2016) stock whereas LIC Housing Finance is a
Finance Stock & L&T is a diversified stock
company. Thus, in spite of this variation in
nature of stocks, our Numerical method
formula proved successful with minimal error.
The comparison result of the algorithms had
given more accurate results i.e. by showing
less deviation from actual valuescollected after
completion of the week under prediction.
Statistical analysis drawn show the predicted
results and accuracy of the methods defined.
Atikah, Pembuatan Bagaimana - Double - Dalam tugas akhir ini model peramalan
Nabihah Aplikasi Prediksi menentukan nilai
Exponential dengan model bayesian belief network
Hanun. Harga Saham parameter alpha dan
Smoothing Dua memiliki performa yang lebih baik daripada
beta yang optimal pada
(2017). Berbasis Web Parameter: hasil peramalan menggunakan model
metode Holt’s?
Menggunakan Bagaimana Metode Holt’s double exponential smoothing holt’s jika
Metode Holt’s dan menentukan (Admin, 2012) dalam hal klasifikasi arah perubahan harga
Bayesian Belief saham. Hal ini dibuktikan dengan tingkat
probabilitas dari - Bayesian Belief
kesesuaian pola yang dihasilkan dari proses
Network: Studi parameter- parameter Network
Kasus di PT Bank yang berpengaruh (Roselina, peramalan harga saham dengan
Central Asia, Tbk. terhadap harga saham 2012)c menggunakan bayesian belief network lebih
pada metode Bayesian tinggi daripada double exponential
Belief Network? smoothing holt’s yaitu sebesar 44%.
Bagaimana mengetahui Metode bayesian belief network mampu
aplikasi peramalan mengikuti pergerakan harga saham sebesar
harga saham berbasis 44%, sedangkan metode holt’s sebesar 39%.
web ini dapat berfungsi
dengan baik sesuai - Pada tugas akhir ini, peramalan
dengan deskripsi use menggunakan metode holt’s menghasilkan
case yang telah dibuat MAPEyang sangat baikyaitusebesar 0.823%.
sebelumnya? Hal ini menunjukkan bahwa metode time
series double exponential smoothing holt’s
memiiki performa yang baik dan cocok
untuk diterapkan dalammemprediksi harga
saham pada PT Bank Central Asia Tbk. Namun
hasil klasifikasi menggunakan metode
bayesian belief network kurang baik, yaitu
hanya mampu mengikuti pergerakan harga
saham sebesar 44%. Hal ini disebabkan
karena data yang digunakan untuk
peramalan metode bayesian belief network
menggunakan datahasil interpolasi bulanan
ke harian, dimana kredibilitas dari hasil
interpolasi bulananke harian adalah rendah,
sehingga menyebabkan hasil peramalan
yang kurang baik.
Izzah, Prediksi Harga Nilai prediksi regresi - Multiple Linear Pada penelitian ini telah dilakukan prediksi
Abidatul dan Saham linear masih memiliki Regression harga saham menggunakan Multiple Linear
Ratna Menggunakan data outlier (Zunaidhy, d.k.k., Regression dengan K-Means dan Moving
Average. Dari hasil yang diperoleh, dapat
Widyastuti. Improved 2008)
dilihat bahwa pendekatan paling baik
(2017) Multiple Linear - K-Means ditunjukkan oleh metode MLR dan MA, yakni
Regression Untuk (Kanungo, et. al, dengan nilai MSE sebesar 15087.465, RMSE
Pencegahan Data 2002) sebesar 122.831, dan MAPE sebesar 3.255
Outlier - Moving Average
(Hatidja, 2011)
123

Bommareddy Predicting The It is generally a - Linear We performed study on TCS stock prices in
, Sasidhar Stock Price Using dynamic market where Regression National Stock Exchange of India (NSEI)
Reddy, et. al. Linear Regression the prices vary and it (Bommareddy, using Linear Regression Technique by
(2018) becomes difficult for
Sasidhar predicting the values of Open, Close, High,
an investor for
predicting the prices Reddy, et. al.., and Low. Our main goal for this study is to
2018) assist stock market investors understand the
future prices of TCS as predicting the stock
prices is always a challenging task as the
market is dynamic in nature.
Future scope of this study involves considering
more multiple companies from any stock
exchange of different countriesand
alsoperforming comparison of any different
techniques of prediction so that one can
understand which technique has less MSE,
MAE and R2 Score.
Poornima S. Stock Price Forecasting the stock - K-Nearest The outcome of these 2 techniques have been
P., Priyanka Prediction using prices is very Neighbour compared on the bases of the Confidence
C. N., KNN and Linear challenging and - Linear value.By using R2(Coefficientof
Reshma P., Regression complicated process Regression determination) we are finding the accuracy.
Suraj Kr because movement of (Poornima, 2019) KNN-Algorithm shows 63% of accuracy,
Jaiswal, and price just behaves like whereas in Linear regression 98% of accuracy
Surendra unusual and time has been shown for daily stock prices.
Babu K N. variation.
(2019)
Sumber: Padhye (2016), Atikah (2017), Izzah (2017), Bommaredy (2018), Poornima (2019)
(RMSE) merupakan akar dari MSE
Regresi Linear Berganda (Izzah, 2017). Rumus untuk MSE dan
Analisis regresi linear berganda RMSE adalah sebagai berikut.
sebenarnya sama dengan analisis
regresi linear sederhana, hanya variabel
bebasnya lebih dari satu buah.
Persamaan umumnya adalah:
Y = a + b1 X1 + b2 X2 + + bn Xn.
Dengan Y adalah variabel
terikat, dan X adalah variabel-variabel
bebas, a adalah konstanta (intersept) Sumber: Izzah (2017)
dan b adalah koefisien regresi pada Keterangan:
masing-masing variabel bebas. n = jumlah data
(konsultanstatistik, 2009) Y = nilai hasil observasi
Jika analisis regresi linear Y = nilai hasil prediksi
berganda dibuat, maka data setiap t = urutan data pada database
variabel harus tersedia. Berdasarkan
data tiap variabel, peneliti dapat METODE PENELITIAN
menemukan persamaan regresi melalui Rancangan Penelitian
perhitungan (Sugiyono, 2012:277-292). Pеnеlitiаn ini merupakan jеnis
pеnеlitiаn deskriptif dengan pendekatan
Uji Performa kuantitatif. Penelitian ini
Ukuran kesalahan pola hasil mendeskripsikan metode CRISP Data
prediksi adalah kesalahan yang terjadi Mining menggunakan algoritma regresi
antara data prediksi dan data aktual. linear untuk prediksi harga saham
Kesalahan tersebut direpresentasikan perusahaan pelayaran periode harian.
menggunakan mean square error Populasi
(MSE), yakni merupakan rataan selisih Populasi dalam penelitian ini
kuadrat antara nilai yang diprediksikan adalah semua perusahaan pelayaran
dengan diamati, root mean square error yang terdaftar di Bursa Efek Indonesia.
124

Tabel 2
Sampel Operasionalisasi variabel data mining
menggunakan regresi linear untuk prediksi
1. Purposive Sampling harga saham
Pemilihan sampel berdasarkan
pertimbangan peneliti bahwa sampel
yang dipilih memiliki kaya informasi.
Ukuran sampel yang dipakai adalah
sebanyak satu perusahaan pelayaran,
yakni PT. Buana Lintas Lautan, Tbk
(BULL).

2. Quota Sampling Alur Penelitian


Peneliti mengambil sampel Penelitian ini menggunakan
berdasar pada pertimbangan- metodologi data mining CRISP-DM.
pertimbangan tertentu, menentukan Gambar 1 menjelaskan enam
sampel dari populasi yang mempunyai tahapan CRISP-DM (Shearer, 2000).
ciri-ciri tertentu sampai jumlah (kuota)
yang diinginkan. Sampel yang
digunakan dalam penelitian ini adalah
data time series periode harian untuk
harga pembukaan, harga tertinggi,
harga terendah, harga penutupan, dan
volume saham PT. Buana Lintas
Lautan, Tbk (BULL) selama 1 tahun 2
bulan antara bulan Juni tahun 2019
hingga bulan Juli tahun 2020.

Variabel Penelitian
Penelitian ini memiliki variabel
terikat, yaitu harga penutupan saham Gambar 1. Tahapan CRISP-DM
Sumber: Shearer (2000)
periode harian. Sedangkan variabel
bebas dalam penelitian ini meliputi Sumber Data
tanggal, harga pembukaan, harga Sumbеr dаtа pаdа pеnеlitiаn ini
tertinggi, harga terendah, dan volume аdаlаh dаtа primer seperti informasi
saham. Variabel bebas diukur mengenai perusahaan dan jenis jasa
berdasarkan data periode harian harga yang dihasilkan. Selain itu
saham. menggunakan sumber data sekunder
Variabel penelitian selanjutnya berupa data historis harga saham tahun
akan dioperasionalisasikan. 2019-2020 dari Yahoo Finance dan
Pengukuran yang digunakan akan Laporan Tahunan dari Bursa Efek
menghasilkan data dalam bentuk skala Indonesia.
rasio dan nominal. Variabel tersebut Teknik Pengumpulan Data
disusun dengan indikator-indikator Tеknik pengumpulan data yang
seperti pada Tabel 2. dilakukan dalam penelitian ini adalah
dokumen dan studi pustaka.
Lokasi Penelitian Teknik Analisis Data
Lokasi penelitian, yaitu di Bursa Teknik analisis data penelitian
Efek Indonesia, Jakarta ini menggunakan cara sebagai berikut.
(www.idx.co.id).
125

Langkah-langkah yang akan dilakukan penyimpanan lepas pantai untuk sektor


untuk memprediksi nilai harga saham, minyak dan gas. Selain itu, perusahaan
yaitu menawarkan layanan agen pengiriman,
1. Diawali dengan pengumpulan data seperti pengaturan izin dan fasilitas
dan pra-proses data. pelabuhan; dan penyediaan pasokan,
2. Selanjutnya dilakukan proses termasuk bahan bakar, air tawar, suku
prediksi menggunakan regresi linear cadang, layanan perbaikan, dan lainnya.
berganda. Lebih lanjut, perusahaan menyediakan
3. Proses prediksi dilakukan layanan manajemen kapal untuk kapal
menggunakan tools data mining tanker minyak dan gas, serta untuk
RapidMiner. penyimpanan dan pembongkaran
4. Setelah hasil prediksi diperoleh, produksi terapung (Floating Production
maka hasil tersebut dianalisis dan Storage and Offloading (FPSO)) /
dievaluasi. Analisis dikerjakan dengan penyimpanan dan pembongkaran
menggambarkan grafik harga saham terapung (Floating Storage and
aktual dan grafik harga saham hasil Offloading (FSO)); dan layanan
prediksi regresi linear. Evaluasi manajemen kru.
dilakukan dengan melihat hasil Root Perusahaan sebelumnya dikenal
Mean Square Error (RMSE) harga sebagai PT. Buana Listya Tama, Tbk
pentupan saham satu hari berikutnya dan berganti nama menjadi PT. Buana
hasil prediksi menurut CRISP Data Lintas Lautan, Tbk pada Februari 2018.
Mining menggunakan algoritma regresi PT. Buana Lintas Lautan, Tbk didirikan
linear. pada 2005 dan berkantor pusat di
HASIL DAN PEMBAHASAN Jakarta Selatan, Indonesia. PT. Buana
Lintas Lautan, Tbk melakukan
Hasil Penelitian penawaran umum perdana (Initial
Public Offering) di Bursa Efek
Profil PT. Buana Listya Tama, Tbk Indonesia pada tanggal 23 Mei 2011.
atau PT. Buana Lintas Lautan, Tbk PT. Buana Lintas Lautan, Tbk
(BULL) mempunyai kode saham BULL dan
PT. Buana Lintas Lautan, Tbk diklasifikasikan ke dalam sektor
menyediakan transportasi laut dan infrastruktur, utilitas, dan transportasi,
layanan terkait di Indonesia. sub sektor transportasi.
Perusahaan beroperasi melalui Tanker Harga Saham BULL
Gas; Tanker Minyak, FPSO dan FSO; Hasil penelitian meliputi
Tanker Kimia; dan segmen lainnya. perkembangan harga saham BULL
Perusahaan bergerak dalam selama 1 tahun 2 bulan dari tanggal 1
pengangkutan gas laut yang dicairkan, Juni 2019 sampai dengan 31 Juli 2020.
termasuk gas minyak cair, propilena, Penelitian ini mengambil data harga
propana, dan LNG; minyak pelumas, saham BULL periode harian yang
minyak mentah, dan produk minyak berasal dari halaman web
bumi; dan bahan kimia cair organik dan finance.yahoo.com. Harga saham
non-organik, minyak nabati, dan lemak mengalami kenaikan sebesar Rp324,00
hewani. (harga penutupan saham tanggal
Perusahaan juga menyediakan 30/07/2020) – Rp191,00 (harga
layanan fasilitas tanker apung untuk penutupan saham tanggal 03/06/2019)
produksi, penyimpanan, dan = Rp133,00 per lembar saham.
pembongkaran produk minyak; Data training untuk data mining
penyewaan kapal jangka pendek, regresi linear menggunakan harga
menengah, dan panjang; dan layanan saham BULL mulai tanggal 3 Juni 2019
126

hingga 29 Mei 2020. Sedangkan data visualisasi data pada penelitian ini
testing menggunakan harga saham adalah RapidMiner 7.3. Sesuai dengan
BULL mulai tanggal 2 Juni 2020 data understanding yang sudah
sampai dengan 30 Juli 2020. diterangkan sebelumnya diketahui
Pembahasan dataset harga saham PT. BULL dibagi
Penelitian ini mengerjakan menjadi dua kelompok yang terdiri dari
tahapan CRISP-DM sebagai berikut. 272 baris data training (data saham
Business Understanding BULL mulai bulan Juni 2019 hingga
Investor memerlukan tindakan bulan Mei 2020) dan 43 baris data
yang tepat untuk mengurangi resiko yang testing (data saham BULL bulan Juni
ada dengan mengetahui naik turunnya 2020 sampai dengan bulan Juli 2020).
harga saham PT. BULL pada masa yang Persentase data training adalah 86,35%
akan datang. Selain itu, investor perlu (=272/315) dan data testing sebesar
memprediksi langkah kebijakan yang 13,65% (=43/315).
sesuai untuk membuat keputusan Gambar 2 menjelaskan dataset
pembelian/penjualan saham PT. BULL. harga saham PT. BULL yang telah
Salah satu cara yang efektif disimpan dalam format file Excel
untuk memprediksi harga saham adalah (*.xlsx) dimasukkan ke dalam Process
dengan menggunakan teknik data RapidMiner. Operator Read Excel
mining regresi linear. digunakan untuk memasukkan data
Data Understanding training saham BULL dan data testing
Data saham PT. BULL saham BULL ke dalam Process
dikumpulkan dari yahoo.finance.com. RapidMiner.
Data saham periode harian PT. BULL
diperoleh penulis selama 14 bulan sejak
Juni 2019 hingga Juli 2020. Data saham
terdiri dari 6 atribut (5 variabel bebas
dan 1 variabel terikat). Keenam atribut
data saham adalah sebagai berikut.
a. Tanggal, berisi data tanggal transaksi
saham, tipe data date_time.
b. Harga Pembukaan, berisi data harga
saat awal dimulainya bursa saham tiap Gambar 2. Read Excel pada RapidMiner
hari, tipe data real. Sumber: file process saham BULL RapidMiner
c. Harga Tertinggi, berisi data harga Gambar 3 menunjukkan data
tertinggi yang diperoleh emiten di bursa saham BULL diatur tipe data dan jenis
saham/hari, tipe data real. atributnya.
d. Harga Terendah, berisi data harga
terendah yang diperoleh emiten di bursa
saham/hari, tipe data real.
e. Volume, berisi data jumlah lembar
saham yang diperdagangkan di bursa
saham, tipe data real.
f. Harga Penutupan, berisi data harga
yang terakhir muncul pada sebuah
saham sebelum bursa saham tutup, tipe
data real (label).
Data Preparation
Perangkat lunak yang digunakan Gambar 3. Atur Tipe Data dan Jenis Atribut
Sumber: file process saham BULL RapidMiner
untuk pengolahan dan

http://dx.doi.org/10.30649/japk.v10i2.83
127

Gambar 4 menerangkan pada mencari koefisien regresi b1 (open), b2


tab Statistics, melihat metadata dari (high), b3 (low), dan b4 (volume) dapat
dataset saham BULL tidak ada missing digunakan persamaan simultan, sebagai
value. berikut.
1. Σ X1 Y = b1 Σ X12 + b2Σ X1 X2 + b3Σ X1 X3 +
b4Σ X1 X4
2. Σ X2 Y = b1 Σ X1 X2 + b2 Σ X 2 +
2 b 3Σ X 2 X 3
+ b 4Σ X 2 X 4
3. Σ X3 Y = b1 Σ X1 X3 + b2 Σ X2 X3 + b3 Σ X32
+ b 4Σ X 3 X 4
4. Σ X4 Y = b1 Σ X1 X4 + b2 Σ X2 X4 + b3 Σ X3
X4 + b4 Σ X42
Dengan metode skor deviasi diperoleh
Gambar 4. Metadata dataset saham BULL hasil sebagai berikut.
Sumber: file process saham BULL RapidMiner
Modeling
Pada tahapan modeling
digunakan persamaan regresi linear
berganda untuk empat prediktor atau
empat variabel independen/bebas
sebagai berikut.
Y = a + b1X1 + b2X2 + b3X3 + b4X4
Keterangan:
Y = variabel dependen/terikat (harga
penutupan (close) (Y))
X1, X2, X3, X4 = variabel
independen/bebas; harga pembukaan
(open) (X1), harga tertinggi (high) (X2),
harga terendah (low) (X3), volume
(volume) (X4))
a = konstanta (apabila nilai x sebesar 0,
Hasil skor deviasi dimasukkan ke dalam
maka Y akan sebesar a atau konstanta)
persamaan simultan sebagai berikut.
b1, b2, b3, b4 = koefisien regresi (nilai
peningkatan atau penurunan)
Berdasarkan perhitungan
persamaan regresi empat prediktor
untuk data training diperoleh hasil
sebagai berikut.

Khusus variabel bebas/


independen data tanggal tidak ikut
dihitung dalam analisis regresi linear
berganda. Alasan data tanggal tidak ikut
dihitung karena tipe data tanggal adalah
nominal bukan tipe data rasio. Untuk
128

Untuk mencari koefisien regresi


b1, b2, b3, dan b4 dapat digunakan
persamaan simultan, sebagai berikut.
1. Σ X1 Y = b1 Σ X12 + b2Σ X1 X2 + b3Σ
X1 X3 + b4Σ X1 X4
2. Σ X2 Y = b1 Σ X1 X2 + b2 Σ X22 + b3Σ
X2 X3 + b4Σ X2 X4
3. Σ X3 Y = b1 Σ X1 X3 + b2 Σ X2 X3 +
b3 Σ X32 + b4Σ X3 X4
4. Σ X4 Y = b1 Σ X1 X4 + b2 Σ X2 X4 +
b3 Σ X3 X4 + b4 Σ X42
Tabel 3 menunjukkan hasil
koefisien regresi empat prediktor untuk
data testing setelah dihitung
menggunakan software SPSS 17.0.
Tabel 3
Koefisien regresi empat prediktor untuk data
testing
a = Y – b1X1 – b2X2 – b3X3 – b4X4
a=181,6176-(-
0,199137487).(182,3162)-
(0,630059762).(185,8199)-
(0,552091304).(178,6765)-(2,07358E-
09).( 46.754.106,25)
a = 2,10325768
Dari tabel 3 kolom kedua
Kemudian nilai a, b1, b2, b3, dan b4 diperoleh koefisien regresi berturut-
dimasukkan ke dalam persamaan turut untuk data testing sebagai berikut.
regresi Y = 11,622 +-0,351 X1 + 0,730 X2
Y = a + b1X1 + b2X2 + b3X3 + b4X4 +0,594 X3 + -5,258E-8 X4
Hasil persamaan regresi untuk data
training adalah sebagai berikut.
Y = 2,10325768 + -0,199137487 X1
+0,630059762 X2 + 0,552091304 X3 +
2,07358E-09 X4

Berdasarkan perhitungan
persamaan regresi empat prediktor
untuk data testing diperoleh hasil
sebagai berikut. Gambar 5. Design hubungan read excel, linear
regression, apply model, dan performance
Sumber: file process saham BULL RapidMiner

Gambar 5 menerangkan
hubungan antara operator read excel
data training dan data testing dengan
operator linear regression dan apply
model dan performance dalam design
rapidminer. Hubungan antara operator
read excel, linear regression, dan apply
129

model menghasilkan grafik garis regresi Jadi harga saham PT. BULL
linear berganda untuk data training dan keluaran persamaan regresi linear
data testing pada Gambar berganda data testing untuk tanggal 30
6. Sedangkan hubungan dengan Juli 2020 adalah 325,5231 rupiah.
operator performance akan Namun, data aktual harga
menghasilkan nilai RMSE. penutupan saham PT. BULL pada
tanggal 30 Juli 2020 adalah 324 rupiah,
sehingga prediksi harga penutupan
saham PT. BULL memiliki selisih
1,5231 rupiah antara data prediksi
tanggal 30 Juli 2020 dengan data aktual
tanggal 30 Juli 2020.
Evaluasi mengukur kesalahan
yang terjadi antara data prediksi dan
data aktual direpresentasikan
Gambar 6. Grafik garis data testing terhadap menggunakan root mean square error
data training harga penutupan saham BULL (RMSE), yaitu akar rataan selisih
Sumber: file process saham BULL RapidMiner kuadrat antara nilai yang diprediksikan
dengan diamati.
Gambar 6 menunjukkan grafik Luaran nilai RMSE dari data
garis dari persamaan regresi linear mining regresi linear data testing
berganda untuk data training dan data dengan Rapidminer untuk harga
testing harga saham penutupan PT. penutupan saham PT. BULL sama
BULL. Grafik garis mempunyai dengan plus 7,522 dari data aktual harga
keterangan sumbu x untuk tanggal penutupan saham PT. BULL di bursa
periode harian dan sumbu y untuk harga saham.
penutupan saham periode harian.
Periode harian menggunakan data time Deployment
series dari tanggal 2 Juni 2020 hingga
30 Juli 2020. Penyebaran (deployment)
diterapkan kepada investor yang
Evaluation investasi saham PT. BULL. Namun,
Uji coba prediksi variabel investor belum bisa menggunakan
terikat yakni, harga penutupan saham model regresi linear berganda data
(Y) PT. BULL periode harian tanggal testing luaran penelitian ini untuk
30 Juli 2020 menggunakan data pembelian atau penjualan saham PT.
variabel bebas tanggal 30 Juli 2020 BULL.
sebagai berikut. Ada beberapa hal yang perlu
Harga pembukaan (X1) = 322; diperhatikan pengembangan data
Harga tertinggi (X2) = 334; mining sebagai berikut.
Harga terendah (X3) = 322; a. Data time series periode harian atau
Volume (X4) = 155.285.400 dataset bisa diubah jumlah datanya
Kemudian data variabel bebas menjadi lebih besar, misal 3 atau 5
dimasukkan ke persamaan regresi linear tahun terakhir.
berganda dari data testing sebagai b. Tahap modelling data mining bisa
berikut. menggunakan algoritma regresi linear
Y = 11,622 + -0,351 X1 + 0,730 X2 + dengan pengembangan atau algoritma
0,594 X3 + -5,258E-8 X4 lain untuk meminimalkan nilai RMSE
= 11,622 + -0,351.(322) + 0,730.(334) antara data prediksi dan data aktual
+ 0,594.(322) + -5,258E-8.(155285400) harga saham.
= 325,5231
130

KESIMPULAN DAN SARAN Bayesian Belief Network: Studi


Kesimpulan Kasus di PT Bank Central Asia,
Proses data mining Tbk. Tugas Akhir. Departemen
menggunakan Cross Industry Standard Sistem Informasi, Fakultas
Process for Data Mining (CRISP-DM). Teknologi Informasi, Institut
Data mining menggunakan data time Sepuluh Nopember Surabaya.
series periode harian mulai bulan Juni B. Heizer and Render. (2014).
tahun 2019 hingga bulan Juli tahun Operation Management
2020. Data mining telah menghasilkan Sustainability and Suply Chain
persamaan regresi linear berganda dan Management, 11th Edition,
grafik garis regresi linear berganda Pearson.
untuk data training dan data testing. Uji Bommareddy, Sasidhar Reddy, et. al.
coba prediksi harga penutupan saham (2018). Predicting The Stock
periode harian perusahaan pelayaran Price Using Linear Regression.
dilakukan dengan menggunakan International Journal of
persamaan regresi linear berganda Advanced Research in Computer
untuk data testing. Hasil uji coba Science. Volume 9, Special Issue
menunjukkan masih ada selisih antara No. 3, May 2018, 81-85.
harga penutupan saham luaran data D. Hatidja. (2011). Penerapan Model
testng dengan harga penutupan saham Arima Untuk Memprediksi Harga
aktual yang ada di bursa saham. Saham PT Telkom Tbk. Jurnal
Evaluasi nilai Root Mean Square Error Ilmiah Sains, Vol. 11, No. 1, Pp.
(RMSE) menunjukkan angka plus 116–123.
7,522 dari data aktual harga penutupan Duwi Consultant. (2011). Analisis
saham periode harian PT. BULL. Regresi Linear Sederhana.
Saran Diakses dari
Data mining dapat http://duwiconsultant.blogspot.co
menggunakan algoritma selain regresi m/2011/11/analisis-regresi-linier-
linear, misal jaringan syaraf tiruan sederhana.html tanggal
untuk meminimalkan selisih antara 5/12/2019.
harga penutupan saham periode harian Izzah, Abidatul dan Ratna Widyastuti.
perusahaan pelayaran luaran prediksi (2017). Prediksi Harga Saham
data testing dengan harga penutupan Menggunakan Improved Multiple
saham periode harian yang sebenarnya. Linear Regression Untuk
Pencegahan Data Outlier.
DAFTAR PUSTAKA KINETIK, Vol. 2, No. 3, Agustus
2017, Hal. 141-150.
Admin. Teknik Peramalan S1 Pertemuan 5. Konsultanstatistik. (2009). Regresi
(2012). Diakses dari Linear Berganda. Diakses dari
http://ocw.stikom.edu/course/downl http://www.konsultanstatistik.co
oad/2012/11/16-03-
m/2009/03/regresi-linear.html
2012.15.12.32_745_410103096_Te
knik-Peramalan-S1-
tanggal 5/12/2019.
SI_P1_Pert5_1.doc. Padhye, Sudip and Karuna Gull. (2016).
Arikunto, Suharsimi. (2010). Prosedur Regression Analysis for Stock
Penelitian : Suatu Pendekatan Market Prediction using Weka
Praktik. Jakarta: Rineka Cipta. Tool without Sentiment Analysis.
Atikah, Nabihah Hanun. (2017). Sixth International Conference on
Pembuatan Aplikasi Prediksi Computational Intelligence and
Harga Saham Berbasis Web Information Technology – CIIT
Menggunakan Metode Holt’s dan 2016
131

Poornima S. P., Priyanka C. N., Reshma


P., Suraj Kr Jaiswal, and
SurendraBabu K. N. (2019).
Stock Price Prediction using KNN
and Linear Regression.
International Journal of
Engineering and Advanced
Technology (IJEAT) ISSN: 2249–
8958, Volume-8, Issue-5S, May,
2019.
R. Zunaidhi, W. Saputra, N. Sari.
(2008). Aplikasi Peramalan
Penjualan Menggunakan Metode
Regresi Linier. Jurnal Scan, Vol.
2, No. 3, pp. 41-45.
Roselina. (2012). Aplikasi Diagnosa
Penyakit Asma Menggunakan
Bayesian Network Berbasis Web.
Teknik Informatika. Vol. 1,
September 2012, Riau.
Shearer, Colin. (2000). The CRIPS-DM
Model: The New Blueprint for
Data Mining. Journal of Data
Warehousing, Vol. 5, No. 4 Fall
2000.
Sugiyono. (2012). Metode Penelitian
Bisnis. Bandung: Penerbit
ALFABETA.
Suntoro, Joko. (2019). Data Mining
Algoritma dan Implementasi
dengan Pemrograman PHP.
Jakarta: PT. Elex Media
Komputindo.
T. Kanungo, D. Mount, N. Netanyahu.
(2002). An Efficient K-Means
Clustering Algorithm: Analysis
and Implementation. IEEE
Transactions on Pattern Analysis
and Machine Intelligence, Vol.
24, No. 7.
Tim Riset CNBC Indonesia. (2019). di
era tol laut emiten kapal
berpeluang cetak keajaiban.
Diakses dari
https://www.cnbcindonesia.com/
market/20190225205153-17-
57543/di-era-tol-laut-emiten-
kapal-berpeluang-cetak-
keajaiban/2 tanggal 24/12/2019

Anda mungkin juga menyukai