Anda di halaman 1dari 21

Review Jurnal : Implementasi

Algoritma Decision Tree Untuk


Klasifikasi Produk Laris Oleh Asmaul
Husnah Nasrullah
Kelompok 1
Defitra Hidayatullah
M Rafi Juliansyah
Marsellus Fransiskus Tue Karang
Mujibbur Rohman
Usup Suparma
Pendahuluan
Tujuan penelitian ini adalah untuk menguji akurasi dari algoritma C4.5 dalam
melakukan klasifikasi produk laris berdasarkan data stok dan penjualan barang di
PT Cipta Karya Gorontalo. Penelitian ini juga bertujuan untuk menghasilkan pohon
keputusan dan rule keputusan yang dapat digunakan sebagai bahan pertimbangan
perusahaan dalam menentukan pasokan produk berdasarkan jenis, merk, dan
harga barang yang akan diperdagangkan.
Sumber data
Sumber data yang digunakan adalah data primer dimana data tersebut di
ambil dari penjualan dan stok barang yang di peroleh dari UD Cipta Karya
Gorontalo. Pemilihan data primer yang diperoleh langsung dari sumbernya
menambah keandalan dan keotentikan data. Sebanyak 450 data telah terkumpul,
yang mencakup periode tahun 2015-2018.
Penggunaan data primer yang bersumber langsung dari UD. Cipta Karya
Gorontalo memberikan keuntungan dalam hal keakuratan dan relevansi data.
Dengan memfokuskan pada penjualan dan stok barang, penelitian ini terlihat
berfokus pada aspek bisnis dan logistik dari UD. Cipta Karya Gorontalo.

Secara keseluruhan, jurnal ini memberikan gambaran yang solid tentang


sumber data yang digunakan, menetapkan dasar yang jelas untuk penelitian.
Namun, pembaca mungkin akan mendapat manfaat lebih lanjut jika ada
informasi tambahan tentang proses pengumpulan dan validasi data.
Pra Pengolahan Data

● Data validation
○ Data stok dan penjualan barang yang dijadikan dataset akan
diidentifikasi apakah ada data yang ganjil, data yang tidak konsisten
dan data yang tidak lengkap
● Data cleaning
○ Membuang duplikasi data, memeriksa data yang tidak konsisten dan
memperbaiki kesalahan pada data
Prediksi

Pemilihan Atribut:

1. Jenis Barang
2. Merek Barang
3. Harga barang
Perhitungan Nilai Entropy

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = ∑ 𝑝𝑖. log2pi (1)

Keterangan: S = himpunan kasus n = jumlah partisi pi =


proporsi Si terhadap S
Perhitungan Nilai Gain

𝐺𝑎𝑖𝑛 (𝑆,𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑ |𝑆𝑖| |𝑆| + 𝑒𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖) (2)

Keterangan: S = himpunan kasus A = atribut n = jumlah partisi


atribut A |Si| = jumlah kasus pada partisi ke – i |S| = jumlah kasus
dalam s
Perhitungan Entropy Jenis Barang
Perhitungan Entropy Merek
Perhitungan Entropy Harga
Penentuan Nilai Gain
Model Prediksi - Rapidminer
Gambar Model klasifikasi

menggunakan algoritma

Decision Tree C4.5

di rapidminer
Model Prediksi - Rapidminer
A. Membaca data sumber yang merupakan
dataset primer berbentuk excell. Data yang
terkumpul sebanyak 450 data, dimana data
tersebut merupakan data stok dan penjualan UD
Cipta Karya Gorontalo yang diambil dari tahun
2015 – 2018

B. Preposes. Dilakukan data validation dan


cleaning proses. Memecah data menjadi 2 yaitu
data training dan data test.
Model Prediksi - Rapidminer
C. Pemilihan Decision Tree dan opsi
parameter yang digunakan di rapidminer
Model Prediksi - Rapidminer

D. Penerapan Model. Menerapkan data training ke


Decision Tree
E. Performance. Berikut ini hasilnya menunjukkan
nilai akurasi yang sama dengan nilai akurasi yang
dihasilkan dari perhitungan manual yaitu sebesar
0.90 atau 90%.
Hasil Akhir Pohon Keputusan
Rule hasil algoritma Decision Tree C4.5
Kesimpulan
1. Penelitian ini bertujuan untuk menguji akurasi algoritma Decision Tree C4.5
dalam melakukan klasifikasi produk laris berdasarkan data penjualan dan stok
barang di UD. Cipta Karya Gorontalo.
2. Penelitian ini menggunakan empat atribut yaitu jenis barang, merk, harga,
dan kelas barang (laris atau tidak laris) sebagai variabel klasifikasi.
3. Penelitian ini menggunakan metode cross validation (confusion matrix) dan
area under curve (AUC) untuk mengevaluasi hasil klasifikasi.
4. Penelitian ini menghasilkan pohon keputusan dan rule yang dapat digunakan
sebagai bahan pertimbangan perusahaan dagang dalam menentukan pasokan
produk.
5. Penelitian ini mendapatkan akurasi sebesar 90% dan nilai AUC 0.709, yang
termasuk dalam kategori fair classification (klasifikasi yang cukup).
Saran
● Diperlukan teknik pra pengolahan data dan transformasi
data yang lebih baik dengan cara memperbaiki inkonsistensi
data pada dataset.
● Penelitian ini dapat dikembangkan dengan mengoptimasi
model klasifikasi yang telah dibuat dengan menggunakan
Particle Swam Optimization (PSO) atau Genetic Algorithm.
Penilaian Keseluruhan
Penelitian ini telah dilakukan dengan baik, namun ada beberapa aspek yang mungkin dapat
ditingkatkan atau dipertimbangkan untuk penelitian selanjutnya, diantaranya:
1. Pengumpulan Data: Penelitian ini menggunakan 450 data dari UD. Cipta Karya
Gorontalo. Mungkin akan lebih baik jika penelitian ini menggunakan data yang lebih
besar.
2. Penggunaan Fitur Lain: Penelitian ini menggunakan empat atribut yaitu jenis barang,
merk, harga, dan kelas barang (laris atau tidak laris) sebagai variabel klasifikasi. Mungkin
ada fitur lain yang juga berpengaruh terhadap kelas barang yang bisa ditambahkan ke
dalam model.
3. Penggunaan Algoritma Lain: Meskipun Decision Tree C4.5 adalah algoritma yang baik,
mungkin akan menarik untuk mencoba algoritma klasifikasi lain seperti Random Forest,
Support Vector Machine (SVM), atau Neural Networks untuk melihat apakah ada
peningkatan dalam performa klasifikasi.
4. Evaluasi Menggunakan Metrik Lain: Penelitian ini menggunakan metode cross
validation (confusion matrix) dan area under curve (AUC) untuk mengevaluasi hasil
klasifikasi. Mungkin akan berguna untuk melihat metrik evaluasi lain seperti precision,
recall, atau F1-score.

Anda mungkin juga menyukai