Anda di halaman 1dari 58

TUGAS AKHIR

PENERAPAN DATA MINING DALAM MEMPREDIKSI HASIL PRODUKSI


KELAPA SAWIT DI PTP.NUSANTARA XIV BURAU LUWU TIMUR
MENGGUNAKA N METODE ALGORITMA LINIEAR REGRSSION

OLEH

MAWAR

219611225

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS KRISTEN INDONESIA TORAJA

2023
TUGAS AKHIR

PENERAPAN DATA MINING DALAM MEMPREDIKSI HASIL PRODUKSI


KELAPA SAWIT DI PTP.NUSANTARA XIV BURAU LUWU TIMUR
MENGGUNAKAN METODE ALGORITMA LINIEAR REGRSSION

Diajukan sebagai salah syarat untuk menyelesaikan studi pada program studi
Teknik Informatika

OLEH

MAWAR

219611225

PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS KRISTEN INDONESIA TORAJA

2023

i
LEMBAR PENGESAHAN

PENERAPAN DATA MINING DALAM PREDIKSI HASIL PRODUKSI


KELAPA SAWIT DI PTP.NUSATARA XIV BURAU LUWU TIMUR
MENGGUNAKAN METODE ALGORITMA LINIEAR REGRESSION

DISUSUN OLEH

NAMA : MAWAR
NOMOR STAMBUK : 219611225
FAKULTAS : TEKNIK
PROGRAM STUDI : TEKNIK INFORMATIKA

Menyetujui :

PEMBIMBING I PEMBIMBING II

Melki Garongga, S.Kom.,M.Kom. Ferayanti B.Gallaran, S.T.,M.Eng.


NIDN.0906038601 NIDN.0929059101

Menyetujui :

Ketua Program Studi Teknik Informatika

Srivan Palelleng, S.Kom.,M.T


NIDN.0904028201

ii
ABSTRAK

Berdasarkan data yang ada seperti Luas Lahan(Ha), Jml tandan(buah), Berat
pupuk (kg) dan Jumlah Produksi sebagai variable yang akan diprediksi. Oleh
karena itu, peneliti melakukan analisi Data Mining Hasil Produksi kelapa sawit
agar menjadi informasi yang dapat di gunakan oleh PTP. Nusantara Xiv Burau
Luwu Timur Dalam melakukan analisis peneliti menggunakan Aplikasi Orange,
metode yang digunakan dalam penelitian ini adalah Liniear Regression. Setelah
dilakukan analisis prediksi Liniear Regression pada Aplikasi Orange maka di
dapatlah 2 variable factor yang mempengaruhi Hasil Produksi kelapa sawit yaitu
variable X1 (Luas Lahan) dan variable X2 (Jml tandan) dengan nilai coefficient
masing-masing variable sebesar 52,09 untuk variable Luas Lahan, variable Jml
tandan(buah) sebesar 1,28 .

Kata Kunci : Data Mining, Liniear Regression, Orange3

iii
ABSTRACT

Based on existing data such as Land Area (Ha), Number of Bunches (fruit),
Fertilizer Weight (kg) and Production Amount as variables that will be predicted.
Therefore, researchers conducted an analysis of Data Mining Results of Palm Oil
Production so that it becomes information that can be used by PTP. Nusantara Xiv
Burau Luwu Timur In conducting the analysis the researchers used the Orange
Application, the method used in this study was Linear Regression. After analyzing
the Linear Regression prediction on the Orange Application, there are 2 variable
factors that influence palm oil production, namely variable X1 (Land Area) and
variable X2 (Number of bunches) with a coefficient value of 52,09 for each
variable Land Area, variable Number of bunches (fruit) of 1,28 .

Keywords: Data Mining, Linear Regression, Orange3

iv
PRAKATA

Puji dan syukur kepada tuhan Yang Maha Esa atas kasih dan kasihnya lah, sehingga

penulis dapat menyelesaikan proposal penelitian yang berjudul “PENERAPAN DATA

MINING DALAM PREDIKSI HASIL PRODUKSI KELAPA SAWIT DI PTP.

NUSANTARA XIV BURAU LUWU TIMUR Menggunakan Metode Linier

Regression” dengan baik dan tepat waktu. Disini penulis dapat mengharapkan yaitu

proposal penelitian ini kiranya dapat bermanfaatkan bagi yang membacanya terlebih

dahulu kepada Mahasis wa UKI Toraja.

Dengan tersusunnya propasal ini, penulis juga menyampaikan rasa terima kasih yang

sebesar-basarnya kepada pihak yang telah memberikan dukungan sehingga propsal

penelitian ini dapat terselesaikan dengan baik. Ucapan terima kasih ini, penulis di

sampaikan kepada :

1. Kedua orang tua, keluarga dan saudara yang selalu mendoakan, dan mendukung baik

dalam segi moral dan materi.

2. Bapak Dr.Yafet Bontong, ST.,M.T. Selaku dekan Fakultas Teknik Universitas

Kristen Indonesia Toraja.

3. Ibu Srivan Palelleng, S.Kom.,M.T. Selaku Ketua Program Studi Teknik Informatika

Universitas Kristen Indonesia Toraja.

4. Bapak Melki Garonga, S.Kom., M.Kom. Selaku Dosen Pembimbing I yang telah

banyak meluangkan waktunya dalam memberikan bimbingan proposal kepada

penulis.
v
5. Ibu Ferayanti B, Gallaran, S.T.,M,Eng. Selaku Pembimbing II yang telah banyak

meluangkan waktunya dalam memberikan bimbingan penulisan proposal kepda

penulis.

6. Segenap Dosen dan Staf, Universitas Kristen Indonesia Toraja Secara Khusus Dosen

Program Studi Teknik Informatika dan Program Studi lain yang perna jadi dosen

pengampuh selama perkuliahan.

7. Para teman dan sahabat dari maba sampai semester akhir yang selalu setia

mendukung, membantu, dan menghibur penulis.

8. Admin Program Studi Teknik Informatika yang senantiasa dengan sabar selalu

memberikan informasi.

9. Teruntuk para sahabat-sahabatku, Julia Pongrangga, Marlina Piter, Fenny Alfionita

Rante Lolo, Yendri Bela, Alfriani Banne Parinding. Yang selalu memberikan

memberikan semangat dan support, sehigga penulis mampu menyelesaikan skripsi ini

dengan penuh kebahagian.

Dengan rendah hati penulis menyadari bahwa dalam penyusunan proposal

penelitian ini masih banyak kekurangan.untuk itu, dengan bedar hati penulis sangat

mengharapkan saran dan masukan dari pembaca demi kesempurnaan penyususunan

proposal penelitian ini. Akhir kata penulis berharap semoga proposal penelitian ini dapat

bermanfaat bagi para pembaca atau peneliti selanjutnya.

Bolu, 08 Agustus 2023

Mawar

vi
DAFTAR ISI

TUGAS AKHIR ...................................................................................................................... i

LEMBAR PENGESAHAN .................................................................................................. ii

PRAKATA .............................................................................................................................. v

DAFTAR ISI ..........................................................................................................................vii

DAFTAR GAMBAR ..............................................................................................................x

DAFTAR TABEL ..................................................................................................................xi

BAB I PENDAHULUAN ..................................................................................................... 1

1.1 Latar Belakang ............................................................................................... 1

1.2 Rumusan Masalah .......................................................................................... 3

1.3 Tujuan Penelitian ............................................................................................ 3

1.4 Batasan Masalah ............................................................................................. 3

1.5 Manfaat Penelitian .......................................................................................... 4

BAB II TINJAUAN PUSTAKA .......................................................................................... 5

2.1 Penelitian Terkait ........................................................................................... 5

2.2 Landasan Teori ............................................................................................... 7

2.2.1 Pengertian Data Mining .............................................................................. 7

2.2.2 Knowleddge Discovery In Database (KDD) .............................................. 9

2.2.3 Prediksi ..................................................................................................... 13

2.2.4 Algoritma linier regression ....................................................................... 14

2.2.5 RMSE (Root Mean Square Error) ............................................................ 15

2.2.6 Orange3 ..................................................................................................... 16

vii
2.3 Kerangka pikir .............................................................................................. 17

BAB III METODOLOGI PENELITIAN .......................................................................... 18

3.1 Waktu Dan Lokasi Penelitian ....................................................................... 18

3.1.1 Waktu Penelitian ....................................................................................... 18

3.1.2 Tempat Penelitian ..................................................................................... 18

3.2 Instrumen Penelitian ..................................................................................... 18

3.2.1. Bahan Penelitian ....................................................................................... 18

3.2.2. Alat Penelitian........................................................................................... 18

3.3 Tahapan penelitian ....................................................................................... 19

3.3.1 Pengumpulan Data .................................................................................... 20

3.3.2 Pemilihan Data .......................................................................................... 20

3.3.3 Penerapan Algoritma liniear regression .................................................... 21

3.3.4 Preprocessing ............................................................................................ 21

3.3.5 Pengujian Akurasi ..................................................................................... 21

3.3.6 Analisis Pembuatan Laporan .................................................................... 22

3.3.7 Hasil Dan Kesimpulan .............................................................................. 22

BAB IV HASIL DAN PEMBAHASAN ......................................................................... 23

4.1 Hasil.............................................................................................................. 23

4.1.1 Pengumpulan data ..................................................................................... 23

4.1.2 Data Selection ........................................................................................... 23

4.1.3 Preprocesing ............................................................................................. 24

4.1.4 Transformation ......................................................................................... 25

4.1.5 Data Mining .............................................................................................. 27

viii
4.1.6 ALGORITMA LINIEAR REGRESSION ................................................ 28

4.1.7 Evaluasi/ Pengujian................................................................................... 32

4.1.8 Implementasi Menggunakan Aplikasi Orange3 ....................................... 33

4.1.9 Pembahasan .............................................................................................. 39

BAB V KESIMPULAN DAN SARAN ............................................................................ 41

5.1 Kesimpulan ................................................................................................... 41

5.2 Saran ............................................................................................................. 42

DAFTAR REFERENSI ....................................................................................................... 43

ix
DAFTAR GAMBAR

Gambar 2.1 Tahapan KDD(Knowledge Discovery In Database) ................... 10

Gambar 2.2 Orange3 ....................................................................................... 16

Gambar 2.3 kerangka pikir .............................................................................. 17

Gambar 2.4 Flowchart Tahapan Penelitian .................................................... 19

Gambar 4.1 Penginputan Data di Orange ....................................................... 33

Gambar 4.2 komponen yang dirancang .......................................................... 34

Gambar 4.3 penentuan nilai optimal .............................................................. 35

Gamabar 4.4 Hasil pengelompokan Data......................................................... 36

Gambar 4.5 hasil perhitungan RMSE di Orange ............................................. 37

Gambar 4.6 Visualisasi Data ............................................................................ 38

x
DAFTAR TABEL

Tabel 4. 1 hasil produksi bauh kelapa sawit .................................................... 23

Tabel 4.2 data yang sudah diseleksi ................................................................. 24

Tabel 4.3 pengelompokan data hasil produksi kelapa sawit ............................ 25

Tabel 4.4 Data Training Pengiriman Tandan 2020-2021................................. 26

Tabel 4.5 Data Testing pengiriman tandan Tahun 2022 .................................. 26

Tabel 4.6 Jumlah variabel ................................................................................ 29

Tabel 4.7 Jumlah Pengkuadratan ..................................................................... 30

Tabel 4.8 Data hasil prediksi ............................................................................ 32

xi
BAB I

PENDAHULUAN

1.1 Latar Belakang

PTP. NUSANTARA XIV BURAU LUWU TIMUR merupakan perusahaan

industri yang berkembang dibidang produksi kelapa sawit. Produksi kelapa sawit

merupakan salah satu kegiatan untuk menghasilkan sebuah kualitas produk kelapa

sawit bagi perusahaan kelapa sawit. Perusahaan berupaya untuk meningkatkan

produksi kelapa sawit untuk prediksi perencanaan kapasitas produksi dan fasilitas

produksi. Salah satu metode prediksi yang digunakan adalah Algoritma Liniear

Regression.

Produksi dalam sebuah perusahaan sangat penting. Apabila jumlah produksi

kelapa sawit semakin banyak, maka keuntungan yang di dapatkan perusahaan juga

semakin besar dan sebaliknya apabila produksi kelepa sawit sedikit karenakan curah

hujan yang cukup tinggi maka hasil produksi kelapa sawit semakin kecil, maka

keuntungan perusahaan juga tidak mencapai target. Sehingga perusahaan akan

menggalami kerugian yang cukup besar. Maka dari itu perusahaan perlu suatu

sistem prediksi yang menguntungkan bagi perusahaan.

Oleh karna itu, perusahaan membutuhkan sebuah sistem yang dapat

memberikan gambran terhadap hasil produksi sebelumnya yang tidak mencapai

target dengan histori tahun lalu dengan tujuan untuk dapat memperkirakan hasil

produksi kelapa sawit dimasa mendatang.

1
2

Prediksi atau pelamaran merupakan suatu suatu kegiatan perhitungan yang

dilakukan untuk mengatasi keadaan di masa yang akan mendatang melalui

pengujian keadaan di masa lalu berdasarkan data yang ada. Melakukan prediksi

hasil produksi di masa yang akan datang berarti menggunakan pikiraan besarnya

volume produksi, bahkan menentukan potensi produksi. Salah satu kegunaan dari

prediksi adalah membantu suatu perusahaan atau instansi dalam pengambilan

keputusan dan mementukan jumlah produksi yang harus di sediakan oleh

perusahaan. Prediksi dapat membantuh pihak perusahaan dalam perencanaan

produksi, prediksi memberikan ouput yang benar sehingga resiko kesalahan yang

disebabkan oleh kesalahan perencanaan dapat diketakan minimal kemungkinan dan

jumlah data besar.[2]

Kelapa sawit merupakan salah satu perkebunan yang memiliki manfaat yang

sangat besar untuk meningkatkan perekonomian masyarakat di karenakan

komunitas perkebunan ini memiliki tingkat probalitas produksi yang sangat

menggiurkan. Kelapa sawit banyak ditanam di Wilayah Jawa, Sumatera, Nusa

Tenggara, Kalimantan, Sulawesi, Maluku dan Papua. Namun perkebunan kelapa

sawit yang paling luas berada di wilayah sumatra dan kalimantan. Menurut Snarko

(2014), hal ini di sebabkan wilayah Indonesia Timur belum banyak di minati oleh

para investor di karenakan permasalahan infrastruktur dan keamanan.[6]


3

PTP. NUSANTARA XIV BURAU LUWU TIMUR merupakan sebuah

perusahaan yang bergerak di bidang perkebunan kelapa sawit dan pengelolahan

minyak kelapa sawit yang berdiri sejak 1996.

Untuk mengetahui prediksi hasil produksi maka di butuhkan sebuah metode

yang dapat memprediksi hasil produksi kelapa sawit maka dibutuhkan sebuah

Metode Linier Regression.

1.2 Rumusan Masalah

Berdasarkan latar belakang diatas yang diuraikan sebelumnya, maka

permasalahan pada penelitian ini dapat di ambil dalam sebuah rumusan masalah,

yaitu:

Bagaimana tingkat akurasi Algoritma linier regression dalam memprediksi hasil

kelapa sawit.

1.3 Tujuan Penelitian

Adapun tujuan penelitian ini adalah:

Untuk memprediksi hasil produksi kelapa sawit dengan menggunakan

algoritma linier regression

1.4 Batasan Masalah

Adapun batasan masalah dalam penelitian ini adalah:

1. Menganalisis data hasil produksi kelapa sawit DI PTP.NUSANTARA VIX BURAU

LUWU TIMUR 2019-2021

2. Sistem prediksi produksi kelapa sawit menggunakan algoritma linier regression


4

1.5 Manfaat Penelitian

Adapun manfaat penelitian yang dilakukan adalah:

1. Bagi Penulis

Menambah wawasan mengenai penelitian tentang penerapan data mining dalam

memprediksi hasil produksi kelapa sawit dengan menggunakan algoritma linier

regression

2. Bagi UKI Toraja

Menambah referensi penelitian di program studi teknik informatika UKI Toraja

sehingga dapat sebagai bahan penelitian untuk melakukan penelitian ini lebih lanjut.
BAB II

TINJAUAN PUSTAKA

2.1 Penelitian Terkait

Adapun beberapa penelitian terkait mengenai judul yang diangkat oleh

penulis: dengan penerapan data mining dalam prediksi hasil produksi kelapa sawit

sistem prediksi hasil produksi kelapa sawit dengan menggunakan algoritma linier

regression di antaranya adalah:

Penelitian pertama (Kurniadi et al., 2020) oleh yang berjudul“ Penerapan

Metode Regresi Linier untuk Memprediksi Kebiasaan Pelanggan Studi Kasus: PT.

Mensa Binasukses”. PT. Mensa Binasukses merupakan distributor usaha yang

bergerak di bidang pelayanan kesehatan, khususnya dalam hal penjualan obat-

obatan, baik itu penjualan obat melalui resep dokter maupun apotek.[2]

Sebuah prediksi kebiasaan pelanggan. Hasil prediksi ini akan digunakan

sebagai strategi perusahaan untuk memberi rekomendasi pembelian produk dalam

bentuk paket (untuk pelanggan) dan strategi pemasaran serta pembuatan katalog

(untuk perusahaan).

Proses prediksi dilakukan dengan cara menggali informasi hubungan

asosiasi antar item produk yang terjadi pada setiap transaksi. Salah satu Metode

yang dapat digunakan untuk menggali informasi potensial ini adalah dengan

pendekatan data mining menggunakan metode regresi linier. Penelitian ini

bertujuan untuk mengimplementasikan sebuah perangkat lunak untuk

5
6

memprediksi kebiasaan pelanggan menggunakan metode regresi linier dengan

memanfaatkan data transaksi pelanggan yang sudah ada.

Penelitian kedua oleh (Herwanto et al., 2019) yang berjudul“ Penerapan

Algoritme Linear Regression untuk Prediksi Hasil Panen Tanaman Padi”. Hasil

panen padi sangat berpengaruh dalam pemenuhan kebutuhan pangan pokok beras.

Dikarenakan kebutuhan beras tiap tahunnya selalu mengalami peningkatan,

diperlukan prediksi hasil panen untuk memperkirakan penanaman yang akan

dilakukan, sehingga dapat mencukupi pemenuhan kebutuhan beras. Untuk

memperoleh hasil panen, diperlukan informasi mengenai luas lahan, jumlah bibit

yang akan di tanam, dan pupuk yang digunakan sebagai penunjang kebutuhan

tanaman padi.[3]

Penelitian ketiga dilakukan oleh Ahmad, dan kawan-kawan (2019), bertujuan

untuk memperediksi hasil produksi buah kelapa sawit untuk periode berikutnya

pada PT. Bumi Sawit Sukses (BSS) dan perusahaan dapat mengambil keputusan

yang tepat dapat terus meningkatkan hasil produksi kelapa sawit.[4]

Penelitian yang dilakukan oleh Fajar, dkk, berdasarkan penelitian yang

dilakukan untuk menganalisis pengelolaan panen pada perkebunan kepala sawit

dalam upaya mencapai kuantitas dan kulitas minyak kelapa sawit.[5]

Penelitian yang dikakukan oelh putrid an kawan-kawan pada tahun(2017)

tentang penerapan multiple regression dalam pengugaan awal kelulusan

mahasiswa, dari perhitungan tersebut didapat nilai hubungan antara IPK, fakaltas

dan jurusan dalam pengaruh pengetahuan semester tamat mahasiswa sebesar 0,53
7

memiliki korelasi yang kuat, sedangkan pengaruh variabel IPK, fakultas dan

jurusan terhadap semester 28,2%[6].

Penelitian yang dilakukan oleh Mirrah Zain, Ni Ketut Dewi Ari Jayanti,

Yohanes Priyo Atmajo bertujuan untuk mengetahui jumlah pembukaan kelas di

STIKOM Bali diperiode berikutnya dengan cara meramalkan, dimana metode

peramalan yang digunakan adalah metode Regresi Linear[14].

2.2 Landasan Teori

2.2.1 Pengertian Data Mining

Data mining adalag proses yang menggunakan teknik statistik, matematika,

kecerdasan buatan, dan Machine Learning untuk mengentraksi dan mengidentifikasi

informasi yang bermafaat dan pengetahuan yang terkait dari berbagai basis data

besar[5]

Data mining adalah serangkaian proses untuk menambah serta mencari informasi

yang selama ini tidak diketahui secara manual dari suatu basis data.informasi yang

dihasilkan diperoleh dengan cara mengekstrasi dan mengenali pola yang penting

atau menarik dari data yang terdapat pada basis data. Data mining biasanya

digunakan untuk mencari pengetahuan dalam basis data yang besar yang sering

disebut Knowladge Discovery Database (KDD). (Vulandari,2017).[5]

Data mining juga analisis untuk peninjaun kumpulan data dalam menemukan

hubungan yang bersifat tidak terguna dan meringkas beberapa data menjadi satu

dengan cara yang berbeda dengan cara sebelumnaya serta dapat di pahami dan di
8

mengerti serta memberikan manfaat bagi pemilik data tersebut. Beberapa bidang

dalam keilmuan yang menyatakan beberapa teknik dalam mempelajari pengenalan

pola, statistik, database serta visualisasi dalam menangani masalah dan mengambil

informasi data disebut data mining. Terdapat beberapa tujuan dalam data mining

yaitu sebagai berikut:

1) Eksplanatori yaitu untuk menjelaskan beberapa kegiatan dalam observasi atau

untuk mengetahui suatu kondisi tertentu

2) Konfirmasi yaitu untuk mengetahui mengkonfirmasikan beberapa hipotesis

yang telah ada sebelumnya.

3) Eksplor yaitu menganalisis beberapa data yang termasuk baru dengan relasi

yang janggal.

Sebelum melakukan proses data mining maka perlu untuk mengetahui apa

yang bisa dilakukan oleh data mining supaya bisa menentukan kesesuaiannya dengan

apa yang dibutuhkan dalam menghasilkan sesuatu yang sebelumnya tidak dapat

diketahui dan sifatnya baru serta memberikan manfaat bagi pengguna data tersebut

sendiri. Selanjutnya terdapat beberapa kegunaan dalam data mining serta tugas dalam

mengklasifikasikan beberapa pola yang harus ditemukan dalam proses mining

tersebut.
9

Berikut adalah tugas data mining yang terbagi menjadi dua yaitu :

1) Prediktif

Prediktif ini memiliki tugas dalam memprediksi nilai dari beberapa atribut

tertentu berdasarkan pada nilai dari atribut lainnya. Atribut yang di prediksi

ini umumnya dikenal sebagai target atau variabel yang tidak bebas sedangkan

atribut biasa digunakan dalam membuat prediksi tersebut dikenal sebagai

variabel bebas.

2) Deskriptif

Deskriptif dalam data mining memiliki tugas untuk menurunkan pola-pola

atau kolerasi yang memiliki kegunaan dalam meringkas hubungan yang pokok

dalam data. Tugas data mining secara deskriptif sering di sebut sebagai

kegiatan menyelidiki dan memerlukan tekni setelah proses dalam mevalidasi

dan menjelaskan hasil.

2.2.2 Knowleddge Discovery In Database (KDD)

Knowledge Discovery In Database (KDD) merupakan proses dalam

menentukan informasi yang memiliki kegunaan serta pola yang ada di dalama

data. Informasi ini digunakan dalam basis data dengan ukuran yang besar

sebelummnya tidak diketahui dan potensialnya bermanfaat. KDD merupakan

salah satu dari langkah serangkaian proses data mining. Proses KDD secara garis

besar,tentu saja memerlukan data. Data yang digunakan. adalah data yang sudah

terpisah dengan data oprerasional. dapat dilihat pada gambar berikut:[6]


10

Gambar 2. 1 Tahapan KDD(Knowledge Discovery In Database)


Tahapan Proses KDD Terdiri Dari:
1 Data selection

Pemilihan (seleksi ) data dari sekumpulan data operasional perlu dilakukan

sebelum tahapan panggalian, tahapan informasi dalam KDD dimulai. Data

hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam

suatu berkas terpisah dari basis data operasional.

2 Pre-processing/cleaning

Sebelum proses data mining dapat diselesaikan, perlu dilakukan proses

cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup 11

antara lain membuang duplikasi data, memeriksa data yang inkonsistem, dan

memperbaikki kesalahan pada data, seperti kesalahan cetak (tipografi), juga

dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada

dengan data atau informasi lain yang relevan dan di perlakukan KDD, seperti

data atau informasi eksternal.


11

3 Transformation

Coding adalah proses transformasi pada data yang telah dipilih sehingga data

tersebut sesuai untuk proses data mining. Proses koding dalam KDD

merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi

yang akan di cari dalam basis data

4 Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data

terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode,

atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD

secara keseluruhan.

5 Interpretation/ Evaluation

Pada informasi yang di hasilkan dari proses data mining perlu ditampilkan

dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan.

Tahapan ini merupakan proses dari KDD yang disebut interpretation. Tahapan

ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan

bertentangan dengan fakta atau hipotesis yang ada sebelumnya.

Menurut Larose [1] dan [2] Han, Data Mining menjadi beberapa

kelompok berdasarkan tugas yang dapat dilakukan yaitu:


12

1. Deskripsi

Deskripsi adalah cara untuk menggambarkan pola atau kecenderungan yang

terkandung didalam data yang memungkinkan untuk memberikan penjelasan

lebih dalam untuk suatu pola atau kecenderungan tersebut.

2. Etimasi

Etimasi hampir sama dengan klsasifikasi, namun etimasi masih memiliki

karakteristik yang lebih dalam ke arah mumerik dari pada keara kategori.

Model dibangun dengan menggunakan record lengkap yang menyediakan

nilai variabel terget sebagai nilai predikdi.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan etimasi, akan tetapi nilai dari

hasil prediksi akan ada dimasa yang akan mendatang.

4. Klasifikasi

Klasifikasi adalah proses menemukan model yang menggambarkan atau

membedakan sautu kelas data dengan tujuan untuk memprediksi kelas untuk

data yang tidak memiliki kelas.

5. Pengklusteran

Pengklusteran merupakan pengelompokan record, pengamatan, atau

memeperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.

Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang

lainnya tetapi tidak memiliki kemiripan dengan record di kluster lain.

Pengklusteran lebih memperhatikan pada variabel terget yang ditujuh.


13

6. Asosiasi

Asosiasi dalam bentuk data mining adalah menemukan atribut yang muncul

dalam suatu waktu tertentu. Dalam dunia bisnis biasa disebut market basket

analysis atau analisis keranjang belajna.

2.2.3 Prediksi

prediksi merupakan teknik kombinasi dari beberapa teknik data mining

lainnya. Prediksi umumnya dipakai untuk menganalisis peristiwa atau

kejadian dimasa lalu dalam urutan tertentu memperkirakan peristiwa masa

depan. Prediksi adalah hasil dari kegiatan memprediksi atau memperkirakan,

suatu hasil prediksi yang biasanya menggunakan metode ilmia maupun

subjektif belakang. Data yang biasa digunakan adalah data historis masa lalu.
14

2.2.4 Algoritma linier regression

Algoritma linier regression adalah jenis antara classification and regession

pada data mining selain linier regression yang termasuk pada golongan ini

adalah support vactor machine,logistic resegression dan lain-lain. Analisis

regresi linier adalah teknik data mining untuk menentukan bahwa terdapat

hubungan antara variabel yang ingin diramalkan denhan variabel lain.[8]

Model persamaan regresi liniear dalah sebagai berikut:

Y= a+b X (4)

Dimana :

Y= Variabel Response (Dependent)

X= Variabel Predictor (Independent)

a = Kostanta

b = Koefisien regresi, besaran Response yang ditimbulkan oleh Predictor.

Nilai-nilai a dan b dapat di hitung dengan menggunakan rumus dibawah

ini :

a = (Σy) (Σx²) – (Σx) (Σxy) (5)

. n(Σx²) – (Σx)²

b = n(Σxy) – (Σx) (Σy) (6)


15

n(Σx²) – (Σx)²

2.2.5 RMSE (Root Mean Square Error)

Untuk mengetahui hasil akurasi prediksi dalam mengevaluasi data

sebenarnya digunakan metode salah satunya dengan menghitung kesalahan

peramalan yang disebut dengan Root Mean Squared Eror (RMSE). Metode ini

diketahui mampu dalam mengevaluasi kinerja prediksi. Adapun cara kerja nya

yakni dengan mengetahui error yang berada untuk menunjukkan besar hasil antara

estimasi dengan data yang akan diprediksi sehingga diketahui perbedaan datanya.

RMSE juga mengakarkan nilai dari MSE yang sudah diketahui sebelumnya.

Dengan menunjukkan nilai hasil akurasi peramalan data dalam histroy dengan

rumus yang terdapat pada nilai kesalahan sehingga RMSE mengahasilkan akurasi

data Akuari data dikatakan bagus jika nilai RMSE nya kecil nilai yang dihasilkan.

Rumus RMSE sebagai berikut:

Dimana :

At = Nilai data Aktual

Ft = Nilai hasil peramalan

N= banyaknya data

∑ = Summation (Jumlahkan keseluruhan nilai)


16

2.2.6 Orange3

Orange merupakan software open source untuk mengelolah data mining.

Orange sangat mudah digunakan dalam proses pengelolahan data dan unggul dalam

hal visualisasi atau biasa disebut visual programing.

Apalikasi orange menyediakan banyak widget yang diletakkan pada canvas

kemudian dapat dihubungkan dengan widget-widget lainnya. Dengan canvas ini

memudahkan pengguna dalam mengelolah data yang akan diproses.

Gambar 2. 2 Orange3
17

2.3 Kerangka pikir

Untuk menjelaskan proses penelitian yang dilakukan, maka perlukan penyususnan

kerangka pikir, untuk melengkapi proses penelitian. Penelitian sebagai berikut:

Masalah Penelitian :

Permasalahan Jumlah Produksi Yang Mengalami Penurunan Dan


Produksi Yang Tidak Sesuai Terget.

Solusi :

Memprediksi Hasil Produksi Kelapa Sawit Di PTP.Nusantara XIV


Burau Luwu Timur

Pendekatan :

Menggunakan Algoritma Linier Regresseion

Implementasi :

Menggunakan Orange3

Pengujian :

Menggunakan Mean Squared Error (MSE)

Hasil :

Prediksi Hasil Produksi Kelapa Sawit Di PTP. Nusantara XIV Burau


Luwu Timur Dengan Menerapkan Linier Regresseion

Gambar 2. 3 kerangka pikir


BAB III

METODOLOGI PENELITIAN

3.1 Waktu Dan Lokasi Penelitian

3.1.1 Waktu Penelitian

Waktu penelitian akan dimulai dari bulan januari, sampai maret 2023

3.1.2 Tempat Penelitian

Tempat penelitian dilaksanakan DI PTP.NUSANTARA XIV BURAU LUWU

TIMUR

3.2 Instrumen Penelitian

3.2.1. Bahan Penelitian

Bahanyang digunakan dalam penelitian ini adalah data informasi prediksi

kelapa sawit

3.2.2. Alat Penelitian

Alat yang digunakan dalam penelitian ini terdiri dari spesifikasi hardware dan

software yang digunakan penulis dalam melaksanakan penelitian.

A. Hardware

Perangkat keras yang digunakan dalam pembuatan sistem ini adalah:

Laptop dengan spesifikasi processor Intel® Celeron® CPU N3350 @1.10GHz

(2 CPUs), ~1.1GHz, Memory 2048MB RAM

18
19

B. Software

Perangkat lunak yang digunakan dalam pembuatan sistem ini adalah:

1. Sistem Operasi Windows 10

2. Orange

3. Microsoft Office 2010

3.3 Tahapan penelitian

Tahapan penelitian dituangkan dalam gambar flowchart penelitian pada gambar

Pengumpulan Data

Preprocessing

Integrasi Data

Pengujian akurasi

Pembuatan laporan

Selesai

Gambar 2. 4 Flowchart Tahapan Penelitian


20

3.3.1 Pengumpulan Data

Adapun data yang diperlukan dalam penelitian ini dikumpulkan dari beberapa

sumber. Metode yang digunakan penulis dalam pengumpulan data yaitu sebagai

berikut:

a. Observasi

Melakukan pendekatan untuk menggumpulkan data dengan cara

mengamati langsung pada pabrik kelapa sawit.

b. Wawancara

Melakukan percakapan antara peneliti dengan pegawai pabrik atau sumber

data. Wawancara ini dilakukan secara langsung kepada pihak direktur atau

pegawai DI PERUSAHAAN PTP. NUSANTARA VIX BURAU LUWU

TIMUR. yang bersangkutan untuk memberikan informasi mengenai apa

yang dibutuhkan penulis. Data transaksi produksi setiap tahunnya yang

dapat di input kedalam laporan keuangan setiap tahunnya.

3.3.2 Pemilihan Data

Pada tahapan ini dilakukan seleksi atau pemilihan data sebelum tahap

penggalian informasi, pemilihan himpunan data atau memfokuskan pada subset

variabel atau sampel data, mengambil bagian dari atribut sesuai yang perlukan.

Hasil seleksi disimpan dalam suatu berkas terpisah dari basis data operasional.
21

3.3.3 Penerapan Algoritma liniear regression

Pada tahap ini dilakukan implementasi penerapan Algoritma liniear

regresseion terhadap data yang sudah melalui seleksi untuk menetukan nilai hasil

analisis prediksi dari hasil produksi kelapa sawit yang digunakan adalah algoritma

liniear regression untuk menghitung hasil produksi menggunakan rumus yang telah

di tentukan. Data yang telah diolah akan diinput kedalam microsoft excel untuk

nantinya digunakan di aplikasi Orange3 Selanjutnya aplikasi Orange3 akan

digunakan untuk mengolah data yang ada menggunakan metode Algoritma liniear

regression sehingga menghasilkan informasi prediksi hasil produksi kelapa sawit.

3.3.4 Preprocessing

Pada tahap preprocessing dilakukan pengelompokan data dalam tabel

berdasarkan jumlah dan tahun produksi.

3.3.5 Pengujian Akurasi

Pada tahapan ini akan dilaksanakan tahapan pengujian yang digunakan untuk

mengukur tingkat akurasi model prediksi terbentuk menggunakan orange.


22

3.3.6 Analisis Pembuatan Laporan

Pada tahapan ini akan di analisis hasil data penelitian mengenai prediksi hasil

produksi kelapa sawit.

3.3.7 Hasil Dan Kesimpulan

Pada tahap ini yaitu menyimpulkan hasil penelitian yang telah dilakukan.
BAB IV

HASIL DAN PEMBAHASAN

4.1 Hasil
4.1.1 Pengumpulan data
Pengumpulan data dilakukan dengan tujuan untuk mendapatkan informasi dan

data yang dibutuhkan untuk melakukan prediksi hasil produksi kelapa sawit

menggunakan metode algoritma liniear regression. Untuk pengambilan data

dilakukan secara langsung dari tempat penelitian DI PTP. NUSANTARA XIV

BURAU LUWU TIMUR. Data yang diambil merupakan data hasil produksi dari

Tahun 2020, 2021 dan 2022 dapat dilihat pada tabel 4.1

Tabel 4. 1 hasil produksi bauh kelapa sawit

No Tahun Produksi (Ton)


1. 2020 116476
2. 2021 2350165
3. 2022 235484
Jumlah 2,702.124

4.1.2 Data Selection


Data yang digunakan dalam penelitian ini adalah data hasil produksi kelapa

sawit selama 3 tahun terkahir yaitu tahun 2020, 2021, dan 2022. Data yang

dikumpulkan kemudian diseleksi.

23
24

Tabel 4. 2 data yang sudah diseleksi

Bulan Tahun 2020 Tahun 2021 Tahun 2022

Januari 700 980 1080

Februari 850 810 840

Maret 780 920 670

April 600 720 970

Mei 950 850 820

Juni 800 790 940

Juli 670 610 760

Agustus 900 930 880

September 730 820 800

Oktober 1050 680 620

November 830 890 960

Desember 660 740 830

4.1.3 Preprocesing
Pada tahap preprocessing di lakukan penggabungan data hasil produksi kelapa

sawit yang di kelompokkan pertahun sehingga menghasilkan data seperti pada tabel

berikut ini.
25

Tabel 4. 3 pengelompokan data hasil produksi kelapa sawit

Data hasil produksi kelapa sawit


1 2 3 4 5 6 7 8 9 10 11 12
2020 700 850 780 600 950 800 670 900 730 1050 830 660
2021 980 810 920 720 850 790 610 930 820 680 890 740
2022 1080 840 670 970 820 940 760 880 800 620 960 830

4.1.4 Transformation
Data yang dibentuk pada preprocessing digunakan untuk memebuat data

training dan data testing. Data set dibuat dari data yang sudah ada kemudian di

bentuk menjadi 2 bagian yaitu data input dan data target. Data training dan data

testing dari data set yang telah dibuat sebelumnya menggunakan aplikasi orange3.

Adapun data training dan data testing dari hasil produksi kelapa sawit dapat di lihat

pada tabel berikut ini.


26

Tabel 4. 4 Data Training Pengiriman Tandan 2020-2021

Bulan Luas Jml Berat pupuk Jml produksi


Lahan(Ha) tandan(buah) (kg) (kg)
Jan-2020 2,5 150 200 700
Feb-2020 3 180 250 850
Mat-2020 2,8 160 220 780
Apr-2020 2,2 130 180 600
Mei-2020 3,5 200 270 950
Jun-2020 2,9 170 230 800
Jul-2020 2,7 `40 190 670
Agt-2020 3,2 190 260 900
Sep-2020 2,6 160 210 730
Okt-2020 3,8 220 300 1050
Nov-2020 3,1 180 240 830
Des-2020 2,4 140 200 660
…… …… ……. …….. ……..
Jan-2021 3,6 210 280 980
Feb-2021 2,7 170 230 810
Mat-2021 3,4 200 260 920
Apr-2021 2,5 150 210 720
Mei-2021 3 190 250 850
Jun-2021 2,8 160 220 790
Jul-2021 2,3 130 180 610
Agt-2021 3,4 200 270 930
Sep-2021 3,1 180 230 820
Okt-2021 2,7 140 190 680
Nov-2021 3,3 190 260 890
Des-2021 2,5 160 210 740
27

Tabel 4. 5 Data Testing pengiriman tandan Tahun 2022

Bulan Luas (Ha) Jumlah tandan Berat pupuk Jumlah


(buah) (kg) produksi (kg)
Jan-2022 3,7 220 300 1080
Feb-2022 3 180 240 840
Mat-2022 2,4 140 200 670
Apr-2022 3,5 210 280 970
Mei-2022 2,8 170 230 820

Jun-2022 3,3 200 260 940

Jul-2022 2,6 150 210 760

Agt-2022 3,2 190 250 880

Sep-2022 2,9 160 220 800

Okt-2022 2,3 130 180 620

Nov-2022 3,6 200 270 960


Des-2022 2,7 170 230 830

4.1.5 Data Mining


Pada tahapan ini, data yang sudah diolah melalui proses data mining

menggunakan algoritma liniear regression untuk menentukan hasil evaluasi dari

analisis prediksi dari hasil produksi kelapa sawit yang di gunakan adalah algoritma

liniear regression.
28

4.1.6 ALGORITMA LINIEAR REGRESSION


Dalam perhitungan manual yang dilakukan ada beberapa tahapan dalam

Algoritma Liniear Regression tahapan tersebut dapat dilakukan sebagai berikut:

Persamaan regression

Y= a+bx

Ket :

Y= Variabel respons (Dependent)

X = Variabel predictor (Indenpendent)

a= Kostanta

b= Koefisien regresi, besaran response yang di timbulkan oleh predictor.

Untuk mencari nilai a dan b dapat di hitung dengan menggunakan rumus dibawah
ini:

a= (Σy) (Σx²) – (Σx) (Σxy)


n(Σx²) – (Σx)²
b = n(Σxy) – (Σx) (Σy)
n(Σx²) – (Σx)²
Berdasarkan dari tahapan data mining untuk algorimta Liniear regression

adapaun langkah-langkah dari algoritma:

1. Menghitung nilai a dan b menggunakan rumus yang telah ditentukan

2. Melakukan pengmp ulan data dalam bentuk tabel

3. Melakukan prediksi terhada p variabel predictor atau reponse.


29

Tabel 4. 6 Jumlah variabel

Bulan Luas (Ha) Jml Berat pupuk Jml produksi


tandan(buah) (kg) (kg)
Jan-2020 2,5 150 200 700
Feb-2020 3 180 250 850
Mat-2020 2,8 160 220 780
Apr-2020 2,2 130 180 600
Mei-2020 3,5 200 270 950
Jun-2020 2,9 170 230 800
Jul-2020 2,7 `40 190 670
Agt-2020 3,2 190 260 900
Sep-2020 2,6 160 210 730
Okt-2020 3,8 220 300 1050
Nov-2020 3,1 180 240 830
Des-2020 2,4 140 200 660
…… …… ……. …….. ……..
Jan-2021 3,6 210 280 980
Feb-2021 2,7 170 230 810
Mat-2021 3,4 200 260 920
Apr-2021 2,5 150 210 720
Mei-2021 3 190 250 850
Jun-2021 2,8 160 220 790
Jul-2021 2,3 130 180 610
Agt-2021 3,4 200 270 930
Sep-2021 3,1 180 230 820
Okt-2021 2,7 140 190 680
Nov-2021 3,3 190 260 890
Des-2021 2,5 160 210 740
30

Tabel 4. 7 Jumlah Pengkuadratan

X1 X2 X3 Y X1^2 X2^2 X3^2 Y^2 X1Y X2Y X3Y X1.X2.X3


2.5 150 200 700 6.25 22500 40000 490000 1750 105000 140000 75000
3 180 250 850 9 32400 62500 722500 2550 153000 212500 135000
2.8 160 220 780 7.84 25600 48400 608400 2184 124800 171600 98560
2.2 130 180 600 4.84 16900 32400 360000 1320 78000 108000 51480
3.5 200 270 950 12.3 40000 72900 902500 3325 190000 256500 189000
2.9 170 230 800 8.41 28900 52900 640000 2320 136000 184000 113390
2.7 140 190 670 7.29 19600 36100 448900 1809 93800 127300 71820
3.2 190 260 900 10.2 36100 67600 810000 2880 171000 234000 158080
2.6 160 210 730 6.76 25600 44100 532900 1898 116800 153300 87360
3.8 220 300 1050 14.4 48400 90000 1102500 3990 231000 315000 250800
3.1 180 240 830 9.61 32400 57600 688900 2573 149400 199200 133920
2.4 140 200 660 5.76 19600 40000 435600 1584 92400 132000 67200
3.6 210 280 980 13 44100 78400 960400 3528 205800 274400 211680
2.7 170 230 810 7.29 28900 52900 656100 2187 137700 186300 105570
3.4 200 260 920 11.6 40000 67600 846400 3128 184000 239200 176800
2.5 150 210 720 6.25 22500 44100 518400 1800 108000 151200 78750
3 190 250 850 9 36100 62500 722500 2550 161500 212500 142500
2.8 160 220 790 7.84 25600 48400 624100 2212 126400 173800 98560
2.3 130 180 610 5.29 16900 32400 372100 1403 79300 109800 53820
3.4 200 270 930 11.6 40000 72900 864900 3162 186000 251100 183600
3.1 180 230 820 9.61 32400 52900 672400 2542 147600 188600 128340
2.7 140 190 680 7.29 19600 36100 462400 1836 95200 129200 71820
3.3 190 260 890 10.9 36100 67600 792100 2937 169100 231400 163020
31

2.5 160 210 740 6.25 25600 44100 547600 1850 118400 155400 84000
Total 70 4100 5540 19260 208 715800 1304400 15781600 57318 3360200 4536300 2930070
32

4.1.7 Evaluasi/ Pengujian


Tujuan akhir dari tahapan yang dilakukan yaitu untuk menghasilkan informasi

prediksi hasil produksi kelapa sawit dari proses data mining dengan metode

algoritma liniear regression. Mengevaluasi bertujuan untuk melihat apakah

informasi yang didapatkan sudah sesuai atau belum dengan fakta sebelumnya.

Evaluasi dilakukan dengan menggunakan Root Mean Squared Error, untuk

mendapatkan hasil prediksi kelapa sawit berikut adalah hasil prediksi yang dihitung

secara manual dapat dilihat pada tabel dibawah ini.

Tabel 4. 8 Data hasil prediksi

Prediksi Y' Y - Y' Y ABS (Y-Y')^2


1038.550 41.4503 41.450302 1718.127516
836.110 3.88964 3.8896416 15.12931163
677.134 -7.1339 7.1338835 50.89229355
977.074 -7.0741 7.0741471 50.04355666
793.762 26.2385 26.238453 688.4564164
915.599 24.4014 24.401404 595.4285227
719.483 40.5173 40.517305 1641.652011 RMSE =25.26549
878.459 1.54083 1.5408302 2.374157556
767.041 32.9591 32.959108 1086.302818
620.868 -0.8677 0.8677177 0.752934006
950.353 9.64651 9.6465082 93.05512027
788.552 41.4478 41.447838 1717.923308
Total 7660.137966
33

4.1.8 Implementasi Menggunakan Aplikasi Orange3


Aplikasi orange3 merupakan paket perangkat pemprograman visual berbasis

komponen untuk visualisasi data machine learning, data mining, dan analisis data.

Pemprograman visual implementasi melalui antar muka dimana alur kerja dibuat

dengan menghubungkan widget yang telah ditentukan sebelumnya atau yang

dirancang oleh penggun.

Berikut langkah yang akan dilakukan dalam mengelolah data pada aplikasi

orange:

1. Siapka data yang akan diolah ke dalam aplikasi orange, kemudian upload data

pada widgets file akan mucul seperti gambar 4.1

Gambar 4. 1 Penginputan Data di Orange


34

2. Berikut merupakan tampilan alur kerja yang akan diolah, dimana setiap

widgetsudah dihubungkan berdasarkan widget yang dibutuhkan.

Gambar 4. 2 komponen yang dirancang


35

3. Pada gambar merupakan widget regression yang digunakan untuk

memasukkan beberapa cluster yang akan digunakan. Dimana akan

ditampilkan correlations yang akan menentukan nilai yang optimal.

Gambar 4. 3 penentuan nilai optimal


36

4. Berikut merupakan hasil pengelompokan data testing ke dalam data tabel

Gambar 4. 4 Hasil pengelompokan Data


37

5. Berikut merupakan hasil dari orange yang menunjukkan hasil RMSE

Gambar 4. 5 hasil perhitungan RMSE di Orange


38

6. Berdasarkan proses perhitungan yang telah dilakukan maka hasil yang

didapatkan akan di tampilkan dalam bentuk visualisasi seperti pada Gambar

4.6 visualisasi data digunakan agam mempermudah penyampaian yang

ditampilkan dalam bentuk titik, garis atau gambar.

Gambar 4. 6 Visualisasi Data


39

4.2 Pembahasan
Dalam sebuah perusahaan perlu perancanaan untuk menunjang kegiatan yang

akan datang, memprediksi kebutuan yang di perlukan kedepannya. Prediksi dapat

membantuh pihak pihak perusahaan atau instansi dalam perancanaan penyedian

produksi yang akan mendatang. Prediksi memberikan informasi yang dapat

digunakan untuk mengurangi resiko kesalahan yang disebabkan oleh kesalahan

perancanaan. Salah satu yang dapat digunakan dalam masalah ini yaitu data

mining. Pada data mining akan menerapkan algoritma linear regression dengan

menghitung hasil produksi sebuah kelapa sawit. Data yang digunakan dalam

penelitian ini adalah data hasil produksi kelapa sawit.

Sebelum mengelolah data lebih lanjut hal yang perlu dilakukan terlebih dahulu

adalah melakukan pembagian data. Data yang dikelolah sebanyak 34 bulan, mulai

dari bulan Januari 2020 sampai bulan Desember 2021. Data tersebut dibagi menjadi

dua bagian antara lain data training dan data testing. Pada penelitian ini penulis

menggunakan data training sebanyak 24 bulan, mulai dari Tahun 2020 sampai

Tahun 2021 dan data testing sebanyak 12 bulan yaitu Tahun 2022.

Prediksi hasil produksi kelapa sawit yang dilakukan dengan algoritma linear

regression merupakan sebuah metode untuk melakukan prediksi terhadap data hasil

produksi kelapa sawit tersebut. Dari data hasil produksi kelapa sawit yang

digunakan adalah jumalah produksi yang paling banyak. Dengan implementasi

kedalam linear regression dengan menggunakan rumus Y= a+bx pada data hasil
40

produksi kelapa sawit pada tahun sebelumnya yaitu data training dan data testing.

Nilai RMSE menggunakan tingkat kesalahan rata-rata dari prediksi model dalam

suatu yang sama dengan variable target atau satuan target.

Dari hasil penelitian dengan nilai RMSE 25.2655 dianggap buruk atau nilai

RMSEnya tinggi karena nilainya relative beasar didanding dengan selisihnya nilai

maksimum dan minimum data. Biasaya semakin kecil nilai RMSE maka semakin

baik model prediksi tersebut. Hal ini dipengaruhi oleh beberapa factor yaitu setiapa

tahun harga kelapa sawit biasa mengalami penurunan sehingga hasil produksi

kelapa sawit tidak menentu. Data yang sedikit yang menyebabkan nilai error yang

diperoleh cukup tinggi.


BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan
Berdasarkan penelitian yang dilakukan dan analisis evaluasi menggunakan

aplikasi orange3 tentang prediksi hasil produksi kelapa sawit menggunakan metode

Algoritma Linear Regrssion kesimpulan yang didapatkan sebagai berikut:

1. Metode Linear Regression dapat diterapkan untuk memprediksi factor apa

saja yang pada hasil produksi kelapa sawit di PTP.NUSANTARA XIV

BURAU LUWU TIMUR dengan menggunakan hasil produksi tahun 2020,

2021 sampai 2022.

2. Metode uji menggunakan apalikasi orang3 dengan membagi data testing dan

training. Diambil dari tahun 2020, 2021 sedangkan data testing diambil dari

data tahun 2022. Dari data yang telah diuji menggunakan aplikasi orange

maka dapat disimpulkan factor-faktor apa saja yang mempengaruhi hasil

produksi kelapa sawit menggunakan algoritma linear regression.

3. Hasil prediksi jumlah produksi kelapa sawit pada PTP.NUSANTARA XIV

BURAU LUWU TIMUR di Tahun 2022 sebesar 7660.137966.

4. Dari tiga variable yang digunakan untuk melakukan prediksi jumlah produksi

kelapa sawit, meliputi Luas Lahan(X1), Jumlah Tandan(X2) dan Berat

Pupuk(X3). Maka variable Curah Hujan dan Jumalah Tandan yang paling

berpengaruh pada jumlah produksi kelapa sawit dengan masing-masing nilai

41
42

coefficient Luas Lahan (X1) sebesar 52,09 dan Jumlah Tandan (X2) sebesar

1,28 Dengan perhitu ngan metode Linier Regression dapat menjadi solusi bagi

perusahaan dalam mengatasi masalah ketidaksatabilan dalam hasil produksi

kelapa sawit.

5.2 Saran
Berdasarkan yang telah diuraikan maka ada beberapa saran yang dapat

disampaikan untuk di kembangkan dalam penelitian berikutnya:

1. Pada penelitih selanjutnya dapat dikembangkan dengan dukungan dari sebuah

system yang lebih modern untuk dapat membantu dalam perhitungan prediksi.

Sehingga perusahaan lebih mudah dalam meningkatkan hasil produksi kelapa

sawit untuk penyedian produksi kedepannya.

2. Untuk penelitih selanjutnya dapat diterapkan jenis data yang berbeda atau dapat

menggunakan metode algoritma C 4.5.


DAFTAR REFERENSI

[1] Loisa Saragih, „Penerapan Data Mining Untuk Memprediksi Jumlah Produksi

Kelapa Sawit Menggunakan Metode Regresi Linear Berganda‟, P.

Pekambaru, Desember 2020.

[2] Djumhar R. Kadir, „Penerapan Regresi Linear Berganda Untuk Prediksi

Jumlah Produksi Tepung Kelapa‟, Nasional Cosphi, Vol. Vol.2.No.1, 2018.

[3] Sidik Rahmatullah, Dita Destia, Prediksi Alokasi Jumllah Produksi Minyak

Sawit Dengan Metode Regresi Linier Berganda Pada Pt.Palm Lampung

Persanda. Candimas,Lampung Utara, 2018.

[4] N. N. I. Nela Nevrivabti Aulia, „Prediksi Harga Minyak Sayuran Data Kaggle

Dengan Regresi Linear Berganda Dan Backpropagation‟, Sisfotenika, Vol. 12

N0.2, P. Lamongan, Jul. 2022, Doi: 10.30700/Jst.Vi2i2.1071.

[5] I. S. Fachruddin, „Prediksi Jumlah Produksi Kelapa Sawit Dengan Regresi

Linear Berganda‟, Snastikom, 2020.

[6] R. Putri Taqwa, Penerapan Data Mining Dalam Prediksi Hasil Produksi

Kelapa Sawit Pt Borneo Ketapang Indah Menggunakan Metode Linear

Regression. Yogyakarta, 2021.

[7] Adji Prasetyo, Prediksi Produksi Kelapa Sawit Menggunakan Metode Regresi

Linear Berganda. Desember 2021


43
44

[8] Tahyani,Penerapan Data Mining Untuk Mempermudah Diapres Dengan

Menggunakan Algoritma Regresi Linear. Vol.1 No.1 Tahun 2022

[9] Penerapan Metode Regresi Linear Dalam Koherensi Pengolahan Data Bahan

Baku Tiandra Store Guna Meningkatkan Mutu Produksi. Sintak 2019

[10] Muhammad Rafi Nauf Akbar, Penerapan Data Mining Untuk Memprediksi

Penjualan Makanan Pada Kopi Krinjit Menggunakan Algoritma Regresi

Liniear Dan C4.5. Tahun 2021

[11] T. Khotimah and R. Nindyasari, “Forecasting Dengan Metode Regresi Liniar

Pada Sistem Penjualan Keputusan Untuk Memprediksi Jumlah Penjualan

Batik (Studi Kasus Kub Sarwo Endah Batik Tulis Lasem),” J. Matik Penusa,

Vol. 1, no. 1, pp. 71-92, 2017

[12] J. Adhiva, S.A Putri, and S. G. Setyorini, “Prediksi Hasil Produksi Kelapa

Sawit Menggunakan Model Regresi Pada PT. Perkebunan Nusantara V,” pp.

155-162, 2020

[13] A. Saifudin “ Metode Data Mining Untuk Seleksi Calon Mahasiswa,” J.

Teknol., Vol. 10, no. 1, pp. 25-36, 2018


45

[14] M. Iqbal Ramadhan, “Penerapan Data Mining Analisis Data Bencana Milik

Bnpb Menggunakan Algoritma K-Means Dan Lenear Regression,” J. Inform.

dan Komput., Vol. 22, no. 1, pp. 57-65, 2017

[15] R. Yanto, “Implementasi Data Mining Estimasi Ketersedian Lahan

Pembuangan Sampah Menggunakan Algoritma Simple Linear Regression,” J.

RESTI (Rekayasa Sist. dan Teknol. informasi), Vol. 2, no. 1, pp. 361-366,

2018, doi: 10.29207/resti.v2il.282.


46

Anda mungkin juga menyukai