Anda di halaman 1dari 4

BAHASAN IMPLEMENTASI ALGORITMA DECISION TREE UNTUK

KLASIFIKASI PRODUK LARIS OLEH PENELITI ASMAUL HUSNAH


NASRULLAH
Defitra Hidayatullah1, M Rafi Juliansyah2, Marsellus Fransiskus Tue Karang3, Mujibbur
Rohman4, Usup Suparma5
1,2,3,4,5
Manajemen Sistem Informasi , Universitas Gunadarma, DKI Jakarta, Indonesia

1. SUMBER DATA cleaning yang melibatkan penghapusan duplikasi data,


pemeriksaan konsistensi, dan perbaikan kesalahan pada
Sumber data yang digunakan dalam penelitian berasal data. Penulis juga menyebutkan bahwa dari 450 data yang
dari penjualan dan stok barang yang diperoleh dari UD. dikumpulkan, akan dilakukan analisis untuk mendeteksi
Cipta Karya Gorontalo. Pemilihan data primer yang data yang tidak konsisten atau tidak relevan sehingga tidak
diperoleh langsung dari sumbernya menambah keandalan mengganggu pola aturan dari algoritma yang akan
dan keotentikan data. Sebanyak 450 data telah terkumpul, dibentuk.
yang mencakup periode tahun 2015-2018. Potongan jurnal Secara keseluruhan, bagian ini memberikan informasi
tersebut juga memberikan gambaran mengenai yang jelas tentang pentingnya tahap pra pengolahan data
atribut-atribut yang terdapat dalam data, seperti nomor dalam rangka mendapatkan data yang berkualitas sebelum
transaksi, tanggal transaksi, jenis barang, nama barang, melibatkan data tersebut dalam analisis lebih lanjut. Selain
merk, harga, jumlah keluar, dan stok barang. itu, penjelasan teknik-teknik yang digunakan, seperti data
Penggunaan data primer yang bersumber langsung validation dan data cleaning, memberikan gambaran
dari UD. Cipta Karya Gorontalo memberikan keuntungan bagaimana penelitian ini berusaha menjaga integritas dan
dalam hal keakuratan dan relevansi data. Dengan validitas data yang digunakan.
memfokuskan pada penjualan dan stok barang, penelitian
ini terlihat berfokus pada aspek bisnis dan logistik dari 3. PREDIKSI
UD. Cipta Karya Gorontalo. Secara keseluruhan, potongan
jurnal memberikan gambaran yang solid tentang sumber Pada bagian ini, penulis membahas tentang bagaimana
data yang digunakan, menetapkan dasar yang jelas untuk proses penentuan nilai entropy dan proses pemilihan
penelitian. Namun, pembaca mungkin akan mendapat atribut yang digunakan dalam penelitian ini. Atribut yang
manfaat lebih lanjut jika ada informasi tambahan tentang digunakan oleh penelitian ini diantaranya: Jenis Barang,
proses pengumpulan dan validasi data. Merek Barang, Harga barang dan Label atau kelas yang
akan diuji yaitu untuk mengelompokan apakah barang itu
2. PRA PENGEOLAHAN DATA laris atau tidak.
Pada bagian ini, penulis membahas tentang tahap pra
pengolahan data yang merupakan tahap awal dalam proses Pada penelitian ini untuk mengetahui nilai entropy
analisis data. Pra pengolahan data mencakup beberapa menggunakan dua persamaan seperti dibawah ini:
tahap seperti pembuangan duplikasi data, pemeriksaan
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = ∑ 𝑝𝑖. log2pi (1)
data yang inkonsisten, dan perbaikan kesalahan pada data.
Selain itu, penulis juga menyoroti pentingnya enrichment, Keterangan: S = himpunan kasus n = jumlah partisi pi =
yaitu proses memperkaya data yang sudah ada dengan data proporsi Si terhadap S
lain yang relevan. Proses ini bertujuan untuk
meningkatkan kualitas dan keberagaman data sebelum 𝐺𝑎𝑖𝑛 (𝑆,𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑ |𝑆𝑖| |𝑆| + 𝑒𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖) (2)
dilakukan analisis lebih lanjut. Namun untuk proses Keterangan: S = himpunan kasus A = atribut n = jumlah
enrichment tersebut tidak dijelaskan lebih lanjut oleh partisi atribut A |Si| = jumlah kasus pada partisi ke – i |S| =
penulis. jumlah kasus dalam s
Teknik pra pengolahan data dilakukan dalam beberapa
tahap. Pertama, terdapat teknik data validation yang Sebelum menghitung nilai entropy maka kita lihat
dilakukan untuk mengidentifikasi dan menghapus data tabel untuk setiap atribut untuk pengujian pada penelitian
yang aneh (outlier/noise), tidak konsisten, dan tidak ini:
lengkap (missing value). Contoh aplikasinya dalam
penelitian ini adalah pada dataset stok dan penjualan
barang, di mana penulis mencoba mengidentifikasi data
yang tidak konsisten atau tidak lengkap yang dapat
mengganggu hasil analisis. Kedua, terdapat proses data
No Data Jenis Merek Harga Kelas
Barang

1 Keramik Vienza 385500 Laris

2 Keramik Vienza 538500 Laris

3 Keramik Vienza 538500 Laris


Entropy Harga:

5 Plastik Sunlife 18300 Laris

6 Plastik Fori 12500 Laris

7 Kaca Vienza 520000 Laris

8 Kaca Sunlife 179000 Tidak


Laris

Selanjutnya akan diperoleh nilai gain untuk setiap


9 Keramik Sunlife 178000 Laris atribut:

10 Keramik Vienza 44500 Laris

dst

Pada Tabel diatas maka nilai entropy dapat di hitung Dari data perhitungan tadi maka didapatkan nilai gain
untuk setiap atribut yang digunakan pada penelitian ini tertinggi pada atribut jenis barang dengan nilai 0.4417
Entropy Jenis Barang: dengan seperti itu jenis barang akan dibuat akar (root) dari
pohon keputusan pada penelitian ini.

4. MODEL PREDIKSI
Penulis menggunakan tools rapidminer untuk
validasi hasil perhitungan manual. Berikut model prediksi
yang dilakukan menggunakan tools rapidminer

Entropy Merek:
Gambar 3. Hasil perhitungan
5. ANALISA

Gambar 1. Model klasifikasi menggunakan algoritma


Decision Tree C4.5

A. Merupakan dataset primer. Data yang terkumpul


sebanyak 450 data, dimana data tersebut merupakan
data stok dan penjualan UD Cipta Karya Gorontalo
yang diambil dari tahun 2015 – 2018

B. Preposes. Dilakukan data validation dan cleaning Gambar 4. Pohon Keputusan hasil Algoritma Decision
proses. Memecah data menjadi 2 yaitu data training Tree C4.5
dan data test.
Hasil penelitian yang diperoleh dari penelitian ini
C. Decision Tree. Berikut parameter yang digunakan adalah pohon keputusan yang dapat digunakan untuk
klasifikasi produk laris. Pohon keputusan tersebut
menunjukkan bahwa atribut yang mempunyai pengaruh
utama dalam penentuan produk laris adalah atribut jenis
barang, kemudian merk dan terakhir harga.

Gambar 5. Rule hasil algoritma Decision Tree C4.5


Dari pohon keputusan tersebut juga didapatkan rule
Gambar 2. Parameter yang digunakan atau aturan-aturan yang dapat digunakan untuk klasifikasi
produk laris berdasarkan atribut jenis barang, merk, dan
D. Penerapan Model. Menerapkan data training ke harga. Rule ini dapat digunakan sebagai bahan
Decision Tree pertimbangan perusahaan dagang dalam menentukan
pasokan produk berdasarkan jenis, merk, dan harga barang
E. Hasil. Berikut ini hasilnya menunjukkan nilai akurasi yang akan diperdagangkan.
yang sama dengan nilai akurasi yang dihasilkan dari Selain itu, hasil penelitian juga menunjukkan bahwa
perhitungan manual diatas yaitu sebesar 0.90 atau akurasi dari model klasifikasi yang dibuat dengan
90%. algoritma C4.5 adalah sebesar 90% dan nilai AUC 0,709.
Nilai ini termasuk dalam kategori fair classification atau
klasifikasi yang cukup.
6. KESIMPULAN Machine (SVM), atau Neural Networks untuk melihat
apakah ada peningkatan dalam performa klasifikasi.
Kesimpulan penelitian ini cukup jelas dan langsung
to-the-point. Peneliti berhasil membuat model klasifikasi
8.4 Evaluasi Menggunakan Metrik Lain
produk laris dengan menggunakan algoritma Decision
Penelitian ini menggunakan metode cross validation
Tree C4.5 dan mencapai akurasi yang cukup baik.
(confusion matrix) dan area under curve (AUC) untuk
Namun, kesimpulan ini bisa lebih kuat jika peneliti
mengevaluasi hasil klasifikasi. Mungkin akan berguna
memberikan lebih banyak konteks atau penjelasan tentang
untuk melihat metrik evaluasi lain seperti precision, recall,
bagaimana hasil ini dapat digunakan atau diterapkan dalam
atau F1-score.
praktiknya.

7. SARAN
Saran yang diberikan oleh peneliti cukup relevan dan
menunjukkan pemahaman yang baik tentang batasan
penelitian ini.
Peneliti menyarankan teknik pra pengolahan data dan
transformasi data yang lebih baik serta penggunaan
Particle Swam Optimization (PSO) atau Genetic
Algorithm (GA) untuk mengoptimasi model klasifikasi.
Saran ini menunjukkan bahwa peneliti memahami
bahwa selalu ada ruang untuk peningkatan dan optimasi
dalam penelitian ilmiah.

8. PENILAIAN KESELURUHAN
Secara keseluruhan, penelitian ini tampaknya telah
dilakukan dengan baik, dengan mempertimbangkan
beberapa faktor penting dalam pembuatan model
klasifikasi, seperti pemilihan algoritma, evaluasi model,
dan interpretasi hasil.
Namun, penelitian ini bisa ditingkatkan dengan
memberikan lebih banyak detail tentang bagaimana model
klasifikasi diterapkan pada data dan bagaimana nilai-nilai
evaluasi dihitung.
Selain itu, penelitian ini juga bisa ditingkatkan dengan
memberikan lebih banyak konteks atau penjelasan dalam
kesimpulan tentang bagaimana hasil ini dapat digunakan
atau diterapkan dalam praktik.
Beberapa aspek yang mungkin dapat ditingkatkan atau
dipertimbangkan untuk penelitian selanjutnya,
diantaranya:
8.1 Pengumpulan Data
Penelitian ini menggunakan 450 data dari UD. Cipta
Karya Gorontalo. Mungkin akan lebih baik jika penelitian
ini menggunakan data yang lebih besar.

8.2 Penggunaan Fitur Lain


Penelitian ini menggunakan empat atribut yaitu jenis
barang, merk, harga, dan kelas barang (laris atau tidak
laris) sebagai variabel klasifikasi. Mungkin ada fitur lain
yang juga berpengaruh terhadap kelas barang yang bisa
ditambahkan ke dalam model.

8.3 Penggunaan Algoritma Lain


Meskipun Decision Tree C4.5 adalah algoritma yang baik,
mungkin akan menarik untuk mencoba algoritma
klasifikasi lain seperti Random Forest, Support Vector

Anda mungkin juga menyukai