Anda di halaman 1dari 10

Kode Mata Kuliah 132700

Nama Mata Kuliah Data Mining


Nama Angota Kelompok 1. Ariani Ananda
2. Devi Nurjanah
3. Gusti Muhammad Jafar Sidik
4. Indradi Ashari Putra
5. Jessica Althea Sutandi
Semester 4 SKS 3
Jenis Ujian UAS Pertemuan 16
Soal Studi Kasus

Studi Kasus Permasalahan:


 Ruang Lingkup yang digunakan adalah Product Purchases.
 Permasalahan yang ingin di selesaikan adalah membantu pihak retail dalam menentukan product
bundling dan product placement dari data transaksi yang hendak digunakan.
 Algoritma yang digunakan adalah Algoritma apriori. Algoritma ini digunakan agar komputer dapat
mempelajari aturan asosiasi, mencari pola hubungan antar satu atau lebih item dalam suatu
dataset.

Pada project kali ini dataset yang digunakan berasal dari data transaksi penjualan dan distribusi berbagai
macam produk/barang dari tangan supplier, distributor kepada customer tahun 2020 dan 2021 yang
memiliki total 541.909 baris x 23 kolom.
Pada data transaksi penjualan terdapat 4 variable utama yang akan digunakan dalam menyelesaikan
project market basket analytics menggunakan algoritma apriori dengan aturan asosiasi, yaitu variable
provinsi, Invoice No, Product Category dan Quantity
Pada proses pre-processing dataset retail pada studi kasus ini sendiri singkatnya adalah proses yang
dilakukan untuk mengubah / transformasi data ke dalam bentuk angka, agar sistem atau komputer
dapat memahami informasi dari dataset. Proses transformasi data dilakukan dengan menggunakan
operator Nominal to Binominal.

Sumber dataset:
https://docs.google.com/spreadsheets/d/1G_mi20NAjd56Gb5F4GUJGTj4s5MQZvlV/edit?usp=drive_lin
k&ouid=105320695462684619735&rtpof=true&sd=true
Penerapan algoritma Apriori (Rapidminer menggunakan FP-Growth): https://youtu.be/c0g8Sxo7zJY
Export data hasil transformasi data Nominal to Binominal : https://youtu.be/lfzhAr6r3WQ
Perintah Pengerjaan
1. lakukan Proses Pre-processing dataset (cleaning, transformation, dll)
2. Membangun model analisis aturan asosiasi berdasakan dataset dengan algortima
Apriori (FP-Growth) terhadap dataset yang telah siap untuk digunakan.
3. Melakukan evaluasi terhadap hasil pembentukan aturan asosisasi dengan
menggunakan metode evaluasi lift ratio.
4. Membuat hasil representasi pengetahuan (aturan asosiasi) berdasarkan 2 kebutuhan
dari studi kasus, yakni untuk melakukan product bundling dan product placement.
Pengerjaan

1. Pre-processing
A. Tahap Pre-Processing yang pertama adalah mendownload dataset yang ada, setelah
didapatkan dataset dengan file “.xlsx”.

Setelah itu bisa di lihat terlebih dahulu datasetnya, dapat dilihat bahwa ada beberapa
baris di dataset yang kosong.
B. Setelah selesai di lihat, bisa di masukan ke rapid miner dengan cara pilih “Import
Data” dibagian repository dan pilih dari komputer lalu pilih file “.xlsx” yang tadi.
Setelah itu, pastikan terlebih dahulu bahwa atribut yang dimiliki ada 23 atribut.
Setelah itu klik “Next” nantinya akan diarahkan ke tempat yang mau disimpan,
silakan dipilih sesuai yang sudah di buat. Terakhir klik “Finish”.

C. Selanjutnya kalian cukup drag and drop file yang sudah di import tadi ke halaman
kerja kalian di rapid miner.

Mungkin bisa kalian coba jalankan terlebih dahulu, untuk melihat hasilnya.
D. Selanjutnya adalah pilih fungsi “Select Atributes” untuk memilih atribut apa saja yang
akan diambil. (untuk kali ini bisa lihat ketentuan empat variable diatas).
E. Selanjutnya data yang hilang atau missing value yang berada di beberapa atribut
akan di hapuskan terlebih dahulu menggunakan fungsi “Remove Unused Values”

Untuk Parameter-nya bisa memilih “InvoiceNo” dan “Quantity”, karena di kedua


atribut tersebut ada bagian yang kosong atau tidak ada isinya.
F. Selanjutnya di tahap Pre-Prossesing akan mengubah atribut “PRODUCT_CATEGORY”
yang awalnya bertipe Nominal akan dibah ke Numerical, dengan menggunakan
fungsi “Nominal to Numerical”.

Untuk Parameter-nya bisa diubah di bagian attribute Filter Type menjadi “Single” lalu
pilih attribute-nya adalah “PRODUCT_CATEGORY”.
G. Selanjutnya untuk mempermudah proses kedepannya maka nama yang sudah di
pisahkan akan di ubah menjadi lebih pendek atau dipersingkat dengan menggunakan
fungsi “Rename by Replacing”.
Untuk Parameter-nya bisa diubah di bagian Attribute Filter Type menjadi “all” dan
untuk Replace What bisa diganti sesuai dengan kebutuhan, seperti atribut
“PRODUCT_CATEGORY”.
H. Setelah itu tahap selanjutnya adalah menggabungkan baris dari atribut “InvoiceNo”
yang sama menjadi satu baris dengan menggunakan fungsi “Pivot”.

I. Setelah digabungkan maka tahap selanjutnya adalah mengubah kembali tipe data
yang awalnya Numerical menjadi Biominal dengan fungsi “Numerical to Biominal”.

Untuk Parameter-nya bisa diubah dibagian attribute Filter Type menjadi “subset”
dan bisa pilih semua atribut kecuali atribute “InvoiceNo”.
J. Untuk mempermudah pembuatan model maka akan ada atribut yang dibuang yaitu
atribut “InvoiceNo”.

2. Membangun Model FP-Growth


A. Tahap pertama dalam membangun model adalah menambahkan fungsi “FP-Growth”.

Untuk Parameter-nya yang perlu di ubah adalah dibagian Min Support, bisa di isi
sesuai dengan kebutuhan, untuk kali ini menggunakan Min Support adalah 0,1.
B. Setelah itu bisa tambahkan fungsi “Create Associtation Rules” yang digunakan untuk
membuat evaluasi lift ration-nya.

Untuk Parameter-nya bisa diubah dibagian Criterion menjadi “lift” dan Min Criterion
Value menjadi 0,7. Untuk Min Criterion Value lebih baik di atas 0,5.
3. Evaluasi Lift Ratio
Berdasarkan Lift Ratio yang di hitung dari nilai Confidence dibagi dengan jumlah
kemunculan maka hasilnya seperti di bawah ini.

Berdasarkan gambar diatas diambil 10 baris dari 248 baris yang ada sebagai contoh,
jika dilihat berdasarkan Lift Ratio maka dapat dinilai bahwa kemunculan Premises
memiliki efek positif terhadap kemunculan Conclusion, karena nilai evaluasi Lift Ratio
semuanya melebihi nilai 1,0.
4. Representasi Penempatan Produk dan Pengelompokan Produk
No Item Strong Associtation Rules Representasi Pengetahuan
 If Kosmetik then  Item Kosmetik dan
Sabun&samphoo and Pafrum harus
Parfum ditempatkan pada rak
 If Sabun&Samphoo then yang berdekatan.
Kosmetik and Parfum  Item Kosmetik dan
Kosmetik,  If Parfum then Kosmetik Sabun&Samphoo harus
1 Sabun&Samphoo, and Sabun&Samphoo dikelompokkan dalam
Parfum satu kelompok yang sama.
 Item Parfum dan
Sabun&Samphoo harus
ditempatkan pada rak
yang berdekatan atau
sama.
 If Susu then Minuman  Item Minuman dan Susu
and Biskuit harus dikelompokan
 If Susu then Minuman menjadi satu kelompok
Minuman,  If Susu the Biskuit yang sama.
2
Biskuit, Susu  Item Susu, Biskuit, dan
Minuman harus
ditempatkan dalam rak
yang berdekatan.
 If Alat Rumah Tangga  Item Alat Rumah Tangga
then Biskuit and dan Minuman harus di
Minuman dempatkan pada rak yang
 If Biskuit then Alat berdekatan.
Alat Rumah Rumah Tangga and  Item Minuman dan Biskuit
3 Tangga, Biskuit, Minuman harus ditempatkan pada
Minuman  If Minuman the Alat rak yang berdekatan.
Rumah Tangga and  Item Alat Rumah Tangga
Biskuit dan Biskuit harus
dikelompokkan dalam
satu kelompok yang sama.
 If Biskuit then Minuman  Item Minuman dan
and Obatan Obatan harus dilekatak
 If Minuman then Biskuit pada rak yang
and Obatan berdekatan.
Biskuit,  If Obatan then Biskuit  Item Biskuit dan Obatan
4 Minuman, and Minuman harus dikelompokan pada
Obatan satu bagian yang sama.
 Item Minuman, Biskuit
dan Obatan harus
ditempatkan secara
berdekatan.
 If Sabun&Sampoo then  Item Sabun&Samphoo,
Kosmetik and Minuman Kosmetik, dan Minuman
 If Kosmetik then harus ditempatkan pada
Sabun&Samphoo and rak yang berdekatan.
Minuman  Item Sabun&Samphoo
Sabun&Samphoo,
 If Minuman then dan Kosmetik harus
5 Kosmetik,
Sabun&Samphoo and dikelompokan pada satu
Minuman
Kosmetik bagian yang sama.
 Item Minuman dan
Kosmetik harus
ditempatkan pada rak
yang berdekatan.

5. Link Vidio
https://youtu.be/Gpg3vT3hkJY

Anda mungkin juga menyukai