USIP DataMining 195314111
USIP DataMining 195314111
Penambangan Data B
Semester Genap
Dosen Pembimbing
Dr. Ridowati Gunawan, S.Kom., M.T
I. Analisis pasar adalah teknik pemodelan berdasarkan teori bahwa jika seorang
membeli kelompok item tertentu, maka cenderung membeli kelompok item
lainnya. Teknik ini memungkinkan pengecer memahami perilaku pembelian
pembeli. Informasi ini dapat membantu pengecer mengetahui kebutuhan
pembeli dan mengubah tata letak toko sesuai dengan itu. Dengan menggunakan
analisis diferensial perbandingan hasil antara toko yang berbeda, antara
pelanggan dalam kelompok demografis yang berbeda dapat dilakukan.
b) Jika terdapat data yang sama/duplikasi, maka data yang duplikat tersebut
haruslah dihilangkan, mengapa demikian ? Termasuk kedalam langkah
mana menghilangkan data yang duplikat dalam tahapan preprosesing
tersebut ?
c) Jika terdapat 2 buah field dengan range nilai yang berbeda. Misal field
pertama antara 1-100 sementara field ke 2 antara 1-1000. Jelaskan
bagaimana proses preprosesing yang harus dilakukan.
Dikarenakan jarak data yang cukup jauh untuk melakukan perhitungan jarak,
maka data perlu di standarisasi. Data Standardization dilakukan agar jarak
datanya tidak jauh berbeda. Kemudian hitung nilai Z Score untuk menemukan
jarak paling dekat dari 2 data diatas.
Jika dikehendaki MinSupp = 40 % dan MinConf = 85% untuk dataset berikut ini : (Untuk soal 3 dan 4)
TID Itemset
112 HD External, Mic, Laser Pointer
113 HD External, Printer, Keyboard, Laser Pointer
114 HD External, Keyboard, Mic
115 Laser Pointer, HD External, Printer
116 HD External, Keyboard, Laser Pointer, Mic
117 HD External, Keyboard, Mic, Laser Pointer
118 Laser Pointer
Terdapat 7 transaksi.
C1
Itemset TID
HD External 112, 113, 114, 115, 116, 117
Mic 112, 114, 116, 117
Laser Pointer 112, 113, 115, 116, 117, 118
Printer 113, 115
Keyboard 113, 114, 116, 117
C1
Itemset TID
HD External 112, 113, 114, 115, 116, 117
Mic 112, 114, 116, 117
Laser Pointer 112, 113, 115, 116, 117, 118
Printer 113, 115
Keyboard 113, 114, 116, 117
L1
itemset TID
HD External 112, 113, 114, 115, 116, 117
Mic 112, 114, 116, 117
Laser Pointer 112, 113, 115, 116, 117, 118
Keyboard 113, 114, 116, 117
Step 3 : Cari nilai support untuk 2 itemset. Kemudian Hapus nilai support
countnya kurang dari sama dengan 3
C2
itemset TID
HD External, Mic 112, 114, 116, 117
HD External, Laser Pointer 112, 113, 115, 116, 117
HD External, Keyboard 113, 114, 116, 117
Mic, Laser Pointer 112, 116, 117
Mic, Keyboard 114, 116, 117
Laser Pointer, Keyboard 113, 116, 117
itemset TID
L2
HD External, Mic 112, 114, 116, 117
HD External, Laser Pointer 112, 113, 115, 116, 117
HD External, Keyboard 113, 114, 116, 117
Mic, Laser Pointer 112, 116, 117
Mic, Keyboard 114, 116, 117
Laser Pointer, Keyboard 113, 116, 117
Step 4 : Cari nilai support untuk 3 itemset. Kemudian Hapus nilai support
countnya kurang dari sama dengan 3
C3
itemset TID
HD External, Mic, Laser Pointer 112, 116, 117
HD External, Mic, Keyboard 114, 116, 117
HD External, Laser Pointer, Keyboard 113, 116, 117
Mic, Laser Pointer, Keyboard 116, 117
L3
itemset TID
HD External, Mic, Laser Pointer 112, 116, 117
HD External, Mic, Keyboard 114, 116, 117
HD External, Laser Pointer, Keyboard 113, 116, 117
Step 5 : Karena nilai support 4 itemset tidak memenuhi, maka langsung mencari
confidence dimulai dari L3 dan L2.
Hasil yang didapat ialah itemset yang memenuhi nilai Minimum Confidence ialah Mic,
Laser Pointer → HD External, Laser Pointer → HD External, Mic, Mic → HD External,
dan Keyboard → HD External.
C1
itemset Support
HD External 4
Mic 3
Laser Pointer 4
Printer 1
Keyboard 3
F1
Step 2 : Cari nilai support untuk 2 itemset. Dan Hapus item yang nilai support
dibawah 2.
C2
itemset Support
<(HD External) (Mic)> 1
<(Mic) (HD External)> 1
<(HD External, Mic)> 2
<(HD External) (Laser Pointer)> 3
<(Laser Pointer) (HD External)> 1
<(HD External,Laser Pointer)> 4
<(HD External) (Keyboard)> 1
<(Keyboard) (HD External)> 2
<(HD External,Keyboard)> 3
<(Mic) (Laser Pointer)> 2
<(Laser Pointer) (Mic)> 0
<(Mic, Laser Pointer)> 3
<(Mic) (Keyboard)> 1
<(Keyboard) (Mic)> 1
<(Mic,Keyboard)> 2
(Laser Pointer) (Keyboard) 0
(Keyboard) (Laser Pointer) 2
(Laser Pointer, Keyboard) 2
F2
C3
itemset Support
<(HD External, Mic), (HD External)> 1
<(HD External) , (HD External, Mic)> 1
<(HD External, Mic), (Laser Pointer)> 2
<(HD External, Laser Pointer), (HD External)> 2
<(HD External), (HD External, Laser Pointer)> 2
<(Laser Pointer) , (HD External, Mic)> 0
<(Keyboard) , (HD External, Mic)> 1
<(HD External, Keyboard), (Laser Pointer)> 3
<(Laser Pointer), (HD External, Keyboard)> 0
<(HD External, Keyboard), (Mic)> 1
<(Mic, Keyboard) , (Laser Pointer>) 2
<(Laser Pointer), (Laser Pointer , Keyboard)> 0
<(Mic, Laser Pointer) , (Keyboard)> 0
F3
<(HD External, Mic), (Laser Pointer)>, <(HD External, Laser Pointer), (HD
External)>, <(HD External), (HD External, Laser Pointer)>, <(Keyboard) , (HD
External, Mic)>, <(HD External, Keyboard), (Laser Pointer)>, <(HD External,
Keyboard), (Mic)>, <(Mic, Keyboard) , (Laser Pointer)>
Hasil Sequence Pattern yang didapat ialah Pada F3 sehingga berhenti di 3-Urutan.
Item yang memenuhi dan banyak dibeli oleh costumer ialah <(HD External, Mic),
(Laser Pointer)>, <(HD External, Laser Pointer), (HD External)>, <(HD External),
(HD External, Laser Pointer)>, <(Keyboard) , (HD External, Mic)>, <(HD External,
Keyboard), (Laser Pointer)>, <(HD External, Keyboard), (Mic)>, <(Mic, Keyboard) ,
(Laser Pointer>).