TREND PENJUALAN
OLEH :
NPM : 43A87006160148
BANI SALEH
BEKASI
2019
DAFTAR ISI
ABSTRAK .............................................................................................................. 3
BAB I ...................................................................................................................... 4
1. PENDAHULUAN .............................................................................................. 4
BAB II ..................................................................................................................... 8
PEMBAHASAN ..................................................................................................... 8
ALGORITMA ....................................................................................................... 13
2
3.3 K-NN ........................................................................................................... 14
BAB IV ................................................................................................................. 16
KESIMPULAN ..................................................................................................... 16
ABSTRAK
3
Bayes dan Decision Tree. Dari tiga algoritma tersebut, didapatkan hasil akurasi
untuk k-NN dengan k=5 adalah 48.59%, dengan k=10 adalah 48.28%, dengan k=15
adalah 46.39%, dengan k=20 adalah 45.45%, dan dengan k=25 adalah 41.38%.
Sementara untuk algoritma Naive Bayes, akurasi yang dihasilkan mencapai
92.79%, dan untuk algoritma Decision Tree mencapai 75.24%. Sehingga bisa
disimpulkan bahwa, algoritma dengan akurasi tertinggi dimiliki oleh Naive Bayes.
BAB I
1. PENDAHULUAN
Data mining adalah suatu konsep yang digunakan untuk menemukan pengetahuan
yang tersembunyi di dalam database. Data mining merupakan proses semi otomatik
yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine
learning untuk mengekstraksi dan mengidentifikasi informasi pengetahuan
potensial dan berguna yang tersimpan di dalam database besar. (Turban et al, 2005).
Data mining adalah bagian dari proses KDD (Knowledge Discovery in Databases)
yang terdiri dari beberapa tahapan seperti pemilihan data, pra pengolahan,
transformasi, data mining, dan evaluasi hasil (Maimon dan Last, 2000). KDD secara
umum juga dikenal sebagai pangkalan data. Teknik data mining secara garis besar
dapat dibagi dalam dua kelompok: verifikasi dan discovery. Metode verifikasi
umumnya meliputi teknik-teknik statistik seperti goodness of fit, dan analisis
variansi. Metode discovery lebih lanjut dapat dibagi atas model prediktif dan model
deskriptif. Teknik prediktif melakukan prediksi terhadap data dengan
menggunakan hasil-hasil yang telah diketahui dari data yang berbeda. Model ini
dapat dibuat berdasarkan penggunaan data historis lain. Sementara itu, model
deskriptif bertujuan mengidentifikasi polapola atau hubungan antar data dan
memberikan cara untuk mengeksplorasi karakteristik data yang diselidiki
(Dunham, 2003). 2 Masih menjadi isu sentral di dunia pendidikan tinggi khususnya
4
program diploma dalam hal faktor prediktor dan teknik yang digunakan untuk
memprediksi keinginan mahasiswa dalam melanjutkan studinya ke jenjang yang
lebih tinggi. Hingga saat ini masih jarang ditemukan prediktor-prediktor serta
teknik yang cukup handal dan akurat dalam memprediksi tingkat keinginan
mahasiswa untuk melanjutkan studinya, apakah mereka akan melanjutkan studinya
pada bidang ilmu yang sama atau melanjukan studinya tapi kebidang ilmu yang
berbeda atau tidak malanjutkan studinya.
“Bagaimana cara menerapkan Data Mining pada trend penjualan study kasus
PT.Indomarco Palembang?”.
5
1.4 Tujuan dan Manfaat Penelitian
6
c. Design
Tahap penerjemahan dari data yang dianalisis kedalam bentuk yang mudah
dimengerti oleh user.
d. Coding
Tahap penerjemahan data atau pemecahan masalah yang telah dirancang
keadalam bahasa pemrograman tertentu.
e. Pengujian
Merupakan tahap pengujian terhadap perangkat lunak yang dibangun.
f. Maintenance
Tahap akhir dimana suatu perangkat lunak yang sudah selesai dapat mengalami
perubahan–perubahan atau penambahan sesuai dengan permintaan user.
Sumber:Al-Fatah, (2007:13)
7
BAB II
PEMBAHASAN
2.1Landasan Teori
berhirarki, Nama lain dari decision tree adalah CART (Classification and
Regression Tree). Dimana metode ini merupakan gabungan dari dua jenis
pohon, yaitu classification tree dan juga regression tree. Untuk
memudahkan, berikut ilustrasi dari keduanya. Manfaat utama dari
penggunaan decision treeadalah kemampuannya untuk mem-break
down proses pengambilan keputusan yang kompleks menjadi lebih simple,
sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari
permasalahan.
Algoritma Naive Bayes merupakan sebuah metoda klasifikasi
menggunakan metode probabilitas dan statistik yg dikemukakan oleh
ilmuwan Inggris Thomas Bayes. Algoritma Naive Bayes memprediksi
peluang di masa depan berdasarkan pengalaman di masa sebelumnya
sehingga dikenal sebagai Teorema Bayes. Ciri utama dr Naïve Bayes
8
Classifier ini adalah asumsi yg sangat kuat (naïf) akan independensi dari
masing-masing kondisi / kejadian Naive Bayes Classifier bekerja sangat
baik dibanding dengan model classifier lainnya. Hal ini dibuktikan pada
jurnal Xhemali, Daniela, Chris J. Hinde, and Roger G. Stone. “Naive
Bayes vs. decision trees vs. neural networks in the classification of
training web pages.” (2009), mengatakan bahwa “Naïve Bayes Classifier
memiliki tingkat akurasi yg lebih baik dibanding model classifier lainnya”.
9
2.2 Tahapan Data Mining
Sumber:Al-Fatah, (2007:13)
a. Data cleaning
10
seperti ”nama pegawai”, ”umur”, dan sebagainya dapat di-ignore) dan tidak
konsisten.
b. Data integration
c. Data selection
informasi, maka metode yang digunakan dalam proses pengumpulan data sebagai
berikut :
1. Metode Observasi
11
Dalam hal ini yang akan dilakukan adalah melihat serta mempelajari
permasalahan yang ada dilapangan yang erat kaitannya dengan objek yang
diteliti.
Metode yang dilakukan adalah dengan cara mencari bahan yang mendukung
Januari 2013
Wilayah Frekuensi
No Jumlah Penjualan
Sumbagsel Penjualan
1 Palembang 30787 Tinggi
2 Muara enim 20567 Tinggi
3 Prabumulih 9655 Sedang
4 Indralaya 8555 Sedang
5 Sungai lilin 7659 Sedang
6 Jambi 22643 Tinggi
7 Pagaralam 7643 Sedang
8 Kayu Agung 11823 Sedang
9 Sekayu 17273 Tinggi
10 Banyuasin 5890 Sedang
11 Tugu Mulyo 14759 Sedang
12
BAB III
ALGORITMA
3.1Decision Tree
Process
Hasil
Process
13
Hasil
3.3 K-NN
Process 1
14
Proses 2
Hasil
Perbandingan hasil
Dari Sebuah studi perbandingan algoritma rawat inap dijelaskan di atas dibuat dan
grafik akurasi diplot untuk menentukan algoritma terbaik untuk prediksi rawat inap
di RSCM elektabilitas. Dari perbandingan antara pengukuran akurasi ketiga metode
15
diantara tiga algoritma yang digunakan, algoritma Decision Tree (C4.5) lah yang
memiliki performance yang paling tinggi yaitu sebesar 90,10% dan 0,999. Sehingga
dapat diambil kesimpulan bahwa algoritma Decision Tree (C4.5) memiliki
performance yang lebih baik dibandingkan Naive Bayes (NB). Sedangkan metode
yang tidak direkomendasikan untuk digunakan yaitu
K-Nearest Neighbor karena memiliki nilai AUC hanya sebesar 0.001 menunjukkan
BAB IV
KESIMPULAN
16
17