Anda di halaman 1dari 8

LAPORAN MINGGUAN

PRAKTIKUM DATA MINING


KELOMPOK A

Oleh :

Nama : Virgilius Daton Balamakin


NIM : 201064018
Modul Ke- : 6 (Enam)
Asisten : 1. Caecilia Safira Ferini Marcellina Mitang
2. Devi Octaviani Hasibuan
3. Qurnia Amanah Dwiadi
4. Sahlina

JURUSAN STATISTIKA
FAKULTAS SAINS TERAPAN
INSTITUT SAINS & EKNOLOGI AKPRIND
YOGYAKARTA
2023
A. DATA PERCOBAAN
Data yang digunakan dalam laporan ini adalah data yang di peroleh dari laman
web : https://www.kaggle.com/datasets/acostasg/random-shopping-cart.
B. RUMUSAN MASALAH
Bagaimana penyelesaian studi kasus dengan algoritma association rules pada data
Random Shopping cart!
C. HASIL DAN PEMBAHASAN
1. Mengindentifikasi data

2. Melihat struktur data

Berdasarkan output di atas dapat dilihat bahwa terdapat 22343 data dan 3
variabel yaitu variabel Date, Member_number, item. Untuk variabel
“Member_number” tipe datanya adalah integer. Sedangkan untuk variabel
“Date” dan “item” tipe datanya adalah karakter.
3. Membuat variabel “Member_number” menjadi tipe data karakter dan variabel
“item” menjadi faktor
4.

Berdasarkan output di atas dapat dilihat bahwa untuk variabel


“Member_number” tipe datanya sudah berubah menjadi karakter dan untuk
variabel “item” sudah berubah menjadi faktor yaitu terdapat 38 level.
5. Memilih variabel

Member_number = kode member


Item = nama barang
Kemudian mengubah data tersebut menjadi bentuk data transaksi
6. Eksplorasi data

Berdasarkan output di atas dapat dilihat bahwa :


a) Terdapat 1139 transaksi (baris) dan 37 item atau nama barang (kolom)
sehingga matriks yang terbentuk adalah ukuran atau ordo 1139 × 38.
b) Kepadatan atau densitas menunjukan persentase sel bukan nol dalam
matriks sebesar 0.3870662%.
c) Item atau nama barang yang paling sering adalah vegetables dengan
sebanyak 842, poultry sebanyak 480, ice cream sebanyak 454, cereals
sebanyak 451, lunch meat sebanyak 450 dan (other) sebanyak 14076.
d) Distribusi panjang elemen (item/transaksi): Ada 12 transaksi untuk 4
item, ada 34 transaksi untuk 5 item, ada 32 transaksi untuk 6 item, ada
41 transaksi untuk 7 item, ada 51 transaksi untuk 8 item, dan lain lain
bisa dilihat pada output diatas.
e) Nilai minimum yang diperoleh sebesar 4.00; nilai maksimum sebesar
26.00; nilai rata-rata (mean) sebesar 14.71; nilai median (Q2) sebesar
15.00; nilai kuartil pertama (Q1) sebesar 10.00 dan nilai kuartil ketiga
(Q3) sebesar 19.00.
f) Informasi item atau nama barang yang diperluas contohnya all-
purpose dengan ID transaksinya adalah 1, aluminum foil dengan ID
transaksinya adalah 10 dan bagels dengan ID transaksinya adalah 100.
7. Menampilkan frekuensi item relative untuk 10 item data teratas

Berdasarkan hasil output pada diagram batang diatas, dketahui bahwa


barang atau item dengan frekuensi terbanyak adalah vegetables.
Selanjutnya item atau barang yang menempati frekuensi terbanyak kedua
adalah poultry, selanjutnya untuk item atau barang ice cream sampai ke
item atau barang dinner rolls memiliki frekuensi yang sama.
8. Menganalisis aturan menggunakan algoritma A-Priori
a) Untuk Support-threshold = 0.05 dan Confidence-threshold = 0.1

Berdasarkan output di atas dengan menggunakan support = 0.05 dan


Confidence = 0.1 diperoleh informasi bahwa:
a. (Minval) = Nilai minimum dukungan yang harus dipenuhi
oleh itemset untuk menjadi bagian dari aturan yaitu sebesar
0.1.
b. Smax = Nilai support maksimum untuk sebuah itemset yaitu
sebesar 1.
c. Arem = parameter evaluasi aturan tambahan yang dinyatakan
dengan none artinya bahwa tidak ada nilai
d. Aval = tidak akan mengembalikan ukuran evaluasi aturan
tambahan yang dipilih dengan arem yang dinyatakan dengan
kata “FALSE”.
e. OriginalSupport = mempertimbangkan ite, LHS DAN RHS
untuk menghitung dukungan yang dinyatakan dengan
“TRUE”
f. Maxtime = jumlah waktu maksimum yang diizinkan untuk
memeriksa himpunan bagian yaitu sebesar 5
g. Minlen = jumlah minimum item yang diperlukan dalam aturan
yaitu sebesar 1
h. Maxlen = jumlah maksimum item yang ada dalam aturan yaitu
sebesar 10
i. Terdapat 1139 transaksi (baris) dan 38 item atau nama barang
(kolom)
j. Terdapat 53074 aturan atau seperangkat aturan sebanyak
53074
b) Melihat Ringkasan Data :

Berdasarkan hasil summary data asrules, diketahui bahwa model


pertama memiliki nilai minimum sebesar 1.00, nilai kuartil pertama
sebesar 3.000, nilai median sebesar 3.000, nilai mean sebesar 3.47, nilai
kuartil tiga sebesar 4.000, dan nilai maksimum sebesar 4.00.
Diketahui pada summary of quality measure, megidentifikasi
karakteristik dari parameter support, karakteristik variabel confidence,
converage, lift dan count.
Berdasarkan info mining diketahui bahwa data transaction adalah 1139,
dengan nilai support sebesar 0.05, dan confidence sebesar 0.1
c) Mendapatkan 53074 aturan yang diperoleh sebagai berikut:

Berdasarkan hasil output pada inspect (asrules), diketahui diperoleh nilai


support, confidence, coverage, lift, dan count. Untuk masing-masing
nilainya bisa dilihat diatas.
D. KESIMPULAN
Pada analisis dan pembahasan diperoleh kesimpulan bahwa:
a. Terdapat 1139 transaksi (baris) dan 37 item atau nama barang (kolom)
sehingga matriks yang terbentuk adalah ukuran atau ordo 1139 × 38.
b. Kepadatan atau densitas menunjukan persentase sel bukan nol dalam
matriks sebesar 0.3870662%.
c. Barang atau item dengan frekuensi terbanyak adalah vegetables.
Selanjutnya item atau barang yang menempati frekuensi terbanyak kedua
adalah poultry, selanjutnya untuk item atau barang ice cream sampai ke
item atau barang dinner rolls memiliki frekuensi yang sama.
d. Berdasarkan info mining diketahui bahwa data transaction adalah 1139,
dengan nilai support sebesar 0.05, dan confidence sebesar 0.1

Anda mungkin juga menyukai