OLEH
MAWAR
219611225
FAKULTAS TEKNIK
2023
TUGAS AKHIR
Diajukan sebagai salah syarat untuk menyelesaikan studi pada program studi
Teknik Informatika
OLEH
MAWAR
219611225
FAKULTAS TEKNIK
2023
i
LEMBAR PENGESAHAN
DISUSUN OLEH
NAMA : MAWAR
NOMOR STAMBUK : 219611225
FAKULTAS : TEKNIK
PROGRAM STUDI : TEKNIK INFORMATIKA
Menyetujui :
PEMBIMBING I PEMBIMBING II
Menyetujui :
ii
ABSTRAK
Berdasarkan data yang ada seperti Luas Lahan(Ha), Jml tandan(buah), Berat
pupuk (kg) dan Jumlah Produksi sebagai variable yang akan diprediksi. Oleh
karena itu, peneliti melakukan analisi Data Mining Hasil Produksi kelapa sawit
agar menjadi informasi yang dapat di gunakan oleh PTP. Nusantara Xiv Burau
Luwu Timur Dalam melakukan analisis peneliti menggunakan Aplikasi Orange,
metode yang digunakan dalam penelitian ini adalah Liniear Regression. Setelah
dilakukan analisis prediksi Liniear Regression pada Aplikasi Orange maka di
dapatlah 2 variable factor yang mempengaruhi Hasil Produksi kelapa sawit yaitu
variable X1 (Luas Lahan) dan variable X2 (Jml tandan) dengan nilai coefficient
masing-masing variable sebesar 52,09 untuk variable Luas Lahan, variable Jml
tandan(buah) sebesar 1,28 .
iii
ABSTRACT
Based on existing data such as Land Area (Ha), Number of Bunches (fruit),
Fertilizer Weight (kg) and Production Amount as variables that will be predicted.
Therefore, researchers conducted an analysis of Data Mining Results of Palm Oil
Production so that it becomes information that can be used by PTP. Nusantara Xiv
Burau Luwu Timur In conducting the analysis the researchers used the Orange
Application, the method used in this study was Linear Regression. After analyzing
the Linear Regression prediction on the Orange Application, there are 2 variable
factors that influence palm oil production, namely variable X1 (Land Area) and
variable X2 (Number of bunches) with a coefficient value of 52,09 for each
variable Land Area, variable Number of bunches (fruit) of 1,28 .
iv
PRAKATA
Puji dan syukur kepada tuhan Yang Maha Esa atas kasih dan kasihnya lah, sehingga
Regression” dengan baik dan tepat waktu. Disini penulis dapat mengharapkan yaitu
proposal penelitian ini kiranya dapat bermanfaatkan bagi yang membacanya terlebih
Dengan tersusunnya propasal ini, penulis juga menyampaikan rasa terima kasih yang
penelitian ini dapat terselesaikan dengan baik. Ucapan terima kasih ini, penulis di
sampaikan kepada :
1. Kedua orang tua, keluarga dan saudara yang selalu mendoakan, dan mendukung baik
3. Ibu Srivan Palelleng, S.Kom.,M.T. Selaku Ketua Program Studi Teknik Informatika
4. Bapak Melki Garonga, S.Kom., M.Kom. Selaku Dosen Pembimbing I yang telah
penulis.
v
5. Ibu Ferayanti B, Gallaran, S.T.,M,Eng. Selaku Pembimbing II yang telah banyak
penulis.
6. Segenap Dosen dan Staf, Universitas Kristen Indonesia Toraja Secara Khusus Dosen
Program Studi Teknik Informatika dan Program Studi lain yang perna jadi dosen
7. Para teman dan sahabat dari maba sampai semester akhir yang selalu setia
8. Admin Program Studi Teknik Informatika yang senantiasa dengan sabar selalu
memberikan informasi.
Rante Lolo, Yendri Bela, Alfriani Banne Parinding. Yang selalu memberikan
memberikan semangat dan support, sehigga penulis mampu menyelesaikan skripsi ini
penelitian ini masih banyak kekurangan.untuk itu, dengan bedar hati penulis sangat
proposal penelitian ini. Akhir kata penulis berharap semoga proposal penelitian ini dapat
Mawar
vi
DAFTAR ISI
PRAKATA .............................................................................................................................. v
vii
2.3 Kerangka pikir .............................................................................................. 17
4.1 Hasil.............................................................................................................. 23
viii
4.1.6 ALGORITMA LINIEAR REGRESSION ................................................ 28
ix
DAFTAR GAMBAR
x
DAFTAR TABEL
xi
BAB I
PENDAHULUAN
industri yang berkembang dibidang produksi kelapa sawit. Produksi kelapa sawit
merupakan salah satu kegiatan untuk menghasilkan sebuah kualitas produk kelapa
produksi kelapa sawit untuk prediksi perencanaan kapasitas produksi dan fasilitas
produksi. Salah satu metode prediksi yang digunakan adalah Algoritma Liniear
Regression.
kelapa sawit semakin banyak, maka keuntungan yang di dapatkan perusahaan juga
semakin besar dan sebaliknya apabila produksi kelepa sawit sedikit karenakan curah
hujan yang cukup tinggi maka hasil produksi kelapa sawit semakin kecil, maka
menggalami kerugian yang cukup besar. Maka dari itu perusahaan perlu suatu
target dengan histori tahun lalu dengan tujuan untuk dapat memperkirakan hasil
1
2
pengujian keadaan di masa lalu berdasarkan data yang ada. Melakukan prediksi
hasil produksi di masa yang akan datang berarti menggunakan pikiraan besarnya
volume produksi, bahkan menentukan potensi produksi. Salah satu kegunaan dari
produksi, prediksi memberikan ouput yang benar sehingga resiko kesalahan yang
Kelapa sawit merupakan salah satu perkebunan yang memiliki manfaat yang
sawit yang paling luas berada di wilayah sumatra dan kalimantan. Menurut Snarko
(2014), hal ini di sebabkan wilayah Indonesia Timur belum banyak di minati oleh
yang dapat memprediksi hasil produksi kelapa sawit maka dibutuhkan sebuah
permasalahan pada penelitian ini dapat di ambil dalam sebuah rumusan masalah,
yaitu:
kelapa sawit.
1. Bagi Penulis
regression
sehingga dapat sebagai bahan penelitian untuk melakukan penelitian ini lebih lanjut.
BAB II
TINJAUAN PUSTAKA
penulis: dengan penerapan data mining dalam prediksi hasil produksi kelapa sawit
sistem prediksi hasil produksi kelapa sawit dengan menggunakan algoritma linier
Metode Regresi Linier untuk Memprediksi Kebiasaan Pelanggan Studi Kasus: PT.
obatan, baik itu penjualan obat melalui resep dokter maupun apotek.[2]
bentuk paket (untuk pelanggan) dan strategi pemasaran serta pembuatan katalog
(untuk perusahaan).
asosiasi antar item produk yang terjadi pada setiap transaksi. Salah satu Metode
yang dapat digunakan untuk menggali informasi potensial ini adalah dengan
5
6
Algoritme Linear Regression untuk Prediksi Hasil Panen Tanaman Padi”. Hasil
panen padi sangat berpengaruh dalam pemenuhan kebutuhan pangan pokok beras.
memperoleh hasil panen, diperlukan informasi mengenai luas lahan, jumlah bibit
yang akan di tanam, dan pupuk yang digunakan sebagai penunjang kebutuhan
tanaman padi.[3]
untuk memperediksi hasil produksi buah kelapa sawit untuk periode berikutnya
pada PT. Bumi Sawit Sukses (BSS) dan perusahaan dapat mengambil keputusan
mahasiswa, dari perhitungan tersebut didapat nilai hubungan antara IPK, fakaltas
dan jurusan dalam pengaruh pengetahuan semester tamat mahasiswa sebesar 0,53
7
memiliki korelasi yang kuat, sedangkan pengaruh variabel IPK, fakultas dan
Penelitian yang dilakukan oleh Mirrah Zain, Ni Ketut Dewi Ari Jayanti,
informasi yang bermafaat dan pengetahuan yang terkait dari berbagai basis data
besar[5]
Data mining adalah serangkaian proses untuk menambah serta mencari informasi
yang selama ini tidak diketahui secara manual dari suatu basis data.informasi yang
dihasilkan diperoleh dengan cara mengekstrasi dan mengenali pola yang penting
atau menarik dari data yang terdapat pada basis data. Data mining biasanya
digunakan untuk mencari pengetahuan dalam basis data yang besar yang sering
Data mining juga analisis untuk peninjaun kumpulan data dalam menemukan
hubungan yang bersifat tidak terguna dan meringkas beberapa data menjadi satu
dengan cara yang berbeda dengan cara sebelumnaya serta dapat di pahami dan di
8
mengerti serta memberikan manfaat bagi pemilik data tersebut. Beberapa bidang
pola, statistik, database serta visualisasi dalam menangani masalah dan mengambil
informasi data disebut data mining. Terdapat beberapa tujuan dalam data mining
3) Eksplor yaitu menganalisis beberapa data yang termasuk baru dengan relasi
yang janggal.
Sebelum melakukan proses data mining maka perlu untuk mengetahui apa
yang bisa dilakukan oleh data mining supaya bisa menentukan kesesuaiannya dengan
apa yang dibutuhkan dalam menghasilkan sesuatu yang sebelumnya tidak dapat
diketahui dan sifatnya baru serta memberikan manfaat bagi pengguna data tersebut
sendiri. Selanjutnya terdapat beberapa kegunaan dalam data mining serta tugas dalam
tersebut.
9
Berikut adalah tugas data mining yang terbagi menjadi dua yaitu :
1) Prediktif
Prediktif ini memiliki tugas dalam memprediksi nilai dari beberapa atribut
tertentu berdasarkan pada nilai dari atribut lainnya. Atribut yang di prediksi
ini umumnya dikenal sebagai target atau variabel yang tidak bebas sedangkan
variabel bebas.
2) Deskriptif
atau kolerasi yang memiliki kegunaan dalam meringkas hubungan yang pokok
dalam data. Tugas data mining secara deskriptif sering di sebut sebagai
menentukan informasi yang memiliki kegunaan serta pola yang ada di dalama
data. Informasi ini digunakan dalam basis data dengan ukuran yang besar
salah satu dari langkah serangkaian proses data mining. Proses KDD secara garis
besar,tentu saja memerlukan data. Data yang digunakan. adalah data yang sudah
hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam
2 Pre-processing/cleaning
cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup 11
antara lain membuang duplikasi data, memeriksa data yang inkonsistem, dan
dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada
dengan data atau informasi lain yang relevan dan di perlakukan KDD, seperti
3 Transformation
Coding adalah proses transformasi pada data yang telah dipilih sehingga data
tersebut sesuai untuk proses data mining. Proses koding dalam KDD
merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi
4 Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data
atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD
secara keseluruhan.
5 Interpretation/ Evaluation
Pada informasi yang di hasilkan dari proses data mining perlu ditampilkan
Tahapan ini merupakan proses dari KDD yang disebut interpretation. Tahapan
Menurut Larose [1] dan [2] Han, Data Mining menjadi beberapa
1. Deskripsi
2. Etimasi
karakteristik yang lebih dalam ke arah mumerik dari pada keara kategori.
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan etimasi, akan tetapi nilai dari
4. Klasifikasi
membedakan sautu kelas data dengan tujuan untuk memprediksi kelas untuk
5. Pengklusteran
Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang
6. Asosiasi
Asosiasi dalam bentuk data mining adalah menemukan atribut yang muncul
dalam suatu waktu tertentu. Dalam dunia bisnis biasa disebut market basket
2.2.3 Prediksi
subjektif belakang. Data yang biasa digunakan adalah data historis masa lalu.
14
pada data mining selain linier regression yang termasuk pada golongan ini
regresi linier adalah teknik data mining untuk menentukan bahwa terdapat
Y= a+b X (4)
Dimana :
a = Kostanta
ini :
. n(Σx²) – (Σx)²
n(Σx²) – (Σx)²
peramalan yang disebut dengan Root Mean Squared Eror (RMSE). Metode ini
diketahui mampu dalam mengevaluasi kinerja prediksi. Adapun cara kerja nya
yakni dengan mengetahui error yang berada untuk menunjukkan besar hasil antara
estimasi dengan data yang akan diprediksi sehingga diketahui perbedaan datanya.
RMSE juga mengakarkan nilai dari MSE yang sudah diketahui sebelumnya.
Dengan menunjukkan nilai hasil akurasi peramalan data dalam histroy dengan
rumus yang terdapat pada nilai kesalahan sehingga RMSE mengahasilkan akurasi
data Akuari data dikatakan bagus jika nilai RMSE nya kecil nilai yang dihasilkan.
Dimana :
N= banyaknya data
2.2.6 Orange3
Orange sangat mudah digunakan dalam proses pengelolahan data dan unggul dalam
Gambar 2. 2 Orange3
17
Masalah Penelitian :
Solusi :
Pendekatan :
Implementasi :
Menggunakan Orange3
Pengujian :
Hasil :
METODOLOGI PENELITIAN
Waktu penelitian akan dimulai dari bulan januari, sampai maret 2023
TIMUR
kelapa sawit
Alat yang digunakan dalam penelitian ini terdiri dari spesifikasi hardware dan
A. Hardware
18
19
B. Software
2. Orange
Pengumpulan Data
Preprocessing
Integrasi Data
Pengujian akurasi
Pembuatan laporan
Selesai
Adapun data yang diperlukan dalam penelitian ini dikumpulkan dari beberapa
sumber. Metode yang digunakan penulis dalam pengumpulan data yaitu sebagai
berikut:
a. Observasi
b. Wawancara
data. Wawancara ini dilakukan secara langsung kepada pihak direktur atau
Pada tahapan ini dilakukan seleksi atau pemilihan data sebelum tahap
variabel atau sampel data, mengambil bagian dari atribut sesuai yang perlukan.
Hasil seleksi disimpan dalam suatu berkas terpisah dari basis data operasional.
21
regresseion terhadap data yang sudah melalui seleksi untuk menetukan nilai hasil
analisis prediksi dari hasil produksi kelapa sawit yang digunakan adalah algoritma
liniear regression untuk menghitung hasil produksi menggunakan rumus yang telah
di tentukan. Data yang telah diolah akan diinput kedalam microsoft excel untuk
digunakan untuk mengolah data yang ada menggunakan metode Algoritma liniear
3.3.4 Preprocessing
Pada tahapan ini akan dilaksanakan tahapan pengujian yang digunakan untuk
Pada tahapan ini akan di analisis hasil data penelitian mengenai prediksi hasil
Pada tahap ini yaitu menyimpulkan hasil penelitian yang telah dilakukan.
BAB IV
4.1 Hasil
4.1.1 Pengumpulan data
Pengumpulan data dilakukan dengan tujuan untuk mendapatkan informasi dan
data yang dibutuhkan untuk melakukan prediksi hasil produksi kelapa sawit
BURAU LUWU TIMUR. Data yang diambil merupakan data hasil produksi dari
Tahun 2020, 2021 dan 2022 dapat dilihat pada tabel 4.1
sawit selama 3 tahun terkahir yaitu tahun 2020, 2021, dan 2022. Data yang
23
24
4.1.3 Preprocesing
Pada tahap preprocessing di lakukan penggabungan data hasil produksi kelapa
sawit yang di kelompokkan pertahun sehingga menghasilkan data seperti pada tabel
berikut ini.
25
4.1.4 Transformation
Data yang dibentuk pada preprocessing digunakan untuk memebuat data
training dan data testing. Data set dibuat dari data yang sudah ada kemudian di
bentuk menjadi 2 bagian yaitu data input dan data target. Data training dan data
testing dari data set yang telah dibuat sebelumnya menggunakan aplikasi orange3.
Adapun data training dan data testing dari hasil produksi kelapa sawit dapat di lihat
analisis prediksi dari hasil produksi kelapa sawit yang di gunakan adalah algoritma
liniear regression.
28
Persamaan regression
Y= a+bx
Ket :
a= Kostanta
Untuk mencari nilai a dan b dapat di hitung dengan menggunakan rumus dibawah
ini:
2.5 160 210 740 6.25 25600 44100 547600 1850 118400 155400 84000
Total 70 4100 5540 19260 208 715800 1304400 15781600 57318 3360200 4536300 2930070
32
prediksi hasil produksi kelapa sawit dari proses data mining dengan metode
informasi yang didapatkan sudah sesuai atau belum dengan fakta sebelumnya.
mendapatkan hasil prediksi kelapa sawit berikut adalah hasil prediksi yang dihitung
komponen untuk visualisasi data machine learning, data mining, dan analisis data.
Pemprograman visual implementasi melalui antar muka dimana alur kerja dibuat
Berikut langkah yang akan dilakukan dalam mengelolah data pada aplikasi
orange:
1. Siapka data yang akan diolah ke dalam aplikasi orange, kemudian upload data
2. Berikut merupakan tampilan alur kerja yang akan diolah, dimana setiap
4.2 Pembahasan
Dalam sebuah perusahaan perlu perancanaan untuk menunjang kegiatan yang
perancanaan. Salah satu yang dapat digunakan dalam masalah ini yaitu data
mining. Pada data mining akan menerapkan algoritma linear regression dengan
menghitung hasil produksi sebuah kelapa sawit. Data yang digunakan dalam
Sebelum mengelolah data lebih lanjut hal yang perlu dilakukan terlebih dahulu
adalah melakukan pembagian data. Data yang dikelolah sebanyak 34 bulan, mulai
dari bulan Januari 2020 sampai bulan Desember 2021. Data tersebut dibagi menjadi
dua bagian antara lain data training dan data testing. Pada penelitian ini penulis
menggunakan data training sebanyak 24 bulan, mulai dari Tahun 2020 sampai
Tahun 2021 dan data testing sebanyak 12 bulan yaitu Tahun 2022.
Prediksi hasil produksi kelapa sawit yang dilakukan dengan algoritma linear
regression merupakan sebuah metode untuk melakukan prediksi terhadap data hasil
produksi kelapa sawit tersebut. Dari data hasil produksi kelapa sawit yang
kedalam linear regression dengan menggunakan rumus Y= a+bx pada data hasil
40
produksi kelapa sawit pada tahun sebelumnya yaitu data training dan data testing.
Nilai RMSE menggunakan tingkat kesalahan rata-rata dari prediksi model dalam
Dari hasil penelitian dengan nilai RMSE 25.2655 dianggap buruk atau nilai
RMSEnya tinggi karena nilainya relative beasar didanding dengan selisihnya nilai
maksimum dan minimum data. Biasaya semakin kecil nilai RMSE maka semakin
baik model prediksi tersebut. Hal ini dipengaruhi oleh beberapa factor yaitu setiapa
tahun harga kelapa sawit biasa mengalami penurunan sehingga hasil produksi
kelapa sawit tidak menentu. Data yang sedikit yang menyebabkan nilai error yang
5.1 Kesimpulan
Berdasarkan penelitian yang dilakukan dan analisis evaluasi menggunakan
aplikasi orange3 tentang prediksi hasil produksi kelapa sawit menggunakan metode
2. Metode uji menggunakan apalikasi orang3 dengan membagi data testing dan
training. Diambil dari tahun 2020, 2021 sedangkan data testing diambil dari
data tahun 2022. Dari data yang telah diuji menggunakan aplikasi orange
4. Dari tiga variable yang digunakan untuk melakukan prediksi jumlah produksi
Pupuk(X3). Maka variable Curah Hujan dan Jumalah Tandan yang paling
41
42
coefficient Luas Lahan (X1) sebesar 52,09 dan Jumlah Tandan (X2) sebesar
1,28 Dengan perhitu ngan metode Linier Regression dapat menjadi solusi bagi
kelapa sawit.
5.2 Saran
Berdasarkan yang telah diuraikan maka ada beberapa saran yang dapat
system yang lebih modern untuk dapat membantu dalam perhitungan prediksi.
2. Untuk penelitih selanjutnya dapat diterapkan jenis data yang berbeda atau dapat
[1] Loisa Saragih, „Penerapan Data Mining Untuk Memprediksi Jumlah Produksi
[3] Sidik Rahmatullah, Dita Destia, Prediksi Alokasi Jumllah Produksi Minyak
[4] N. N. I. Nela Nevrivabti Aulia, „Prediksi Harga Minyak Sayuran Data Kaggle
[6] R. Putri Taqwa, Penerapan Data Mining Dalam Prediksi Hasil Produksi
[7] Adji Prasetyo, Prediksi Produksi Kelapa Sawit Menggunakan Metode Regresi
[9] Penerapan Metode Regresi Linear Dalam Koherensi Pengolahan Data Bahan
[10] Muhammad Rafi Nauf Akbar, Penerapan Data Mining Untuk Memprediksi
Batik (Studi Kasus Kub Sarwo Endah Batik Tulis Lasem),” J. Matik Penusa,
[12] J. Adhiva, S.A Putri, and S. G. Setyorini, “Prediksi Hasil Produksi Kelapa
Sawit Menggunakan Model Regresi Pada PT. Perkebunan Nusantara V,” pp.
155-162, 2020
[14] M. Iqbal Ramadhan, “Penerapan Data Mining Analisis Data Bencana Milik
RESTI (Rekayasa Sist. dan Teknol. informasi), Vol. 2, no. 1, pp. 361-366,