Anda di halaman 1dari 9

Ujian Sisipan

Penambangan Data B
Semester Genap

Dosen Pembimbing
Dr. Ridowati Gunawan, S.Kom., M.T

MARIO MARCELINO CARLOSA


195314111

PROGRAM STUDI INFORMATIKA


FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2022
1. Penambangan data banyak digunakan untuk berbagai hal dalam kehidupan.
Berikan 2 buah contoh penambangan data untuk kehidupan sehari-hari! (10 %)

I. Analisis pasar adalah teknik pemodelan berdasarkan teori bahwa jika seorang
membeli kelompok item tertentu, maka cenderung membeli kelompok item
lainnya. Teknik ini memungkinkan pengecer memahami perilaku pembelian
pembeli. Informasi ini dapat membantu pengecer mengetahui kebutuhan
pembeli dan mengubah tata letak toko sesuai dengan itu. Dengan menggunakan
analisis diferensial perbandingan hasil antara toko yang berbeda, antara
pelanggan dalam kelompok demografis yang berbeda dapat dilakukan.

II. Dengan komputerisasi perbankan di mana-mana sejumlah besar data


seharusnya dihasilkan dengan transaksi baru. Data mining dapat berkontribusi
untuk memecahkan masalah bisnis di bidang perbankan dan keuangan dengan
menemukan pola, sebab-akibat, dan korelasi dalam informasi bisnis dan harga
pasar yang tidak segera terlihat oleh manajer karena data volume terlalu besar
atau dihasilkan terlalu cepat untuk disaring oleh para ahli. Para manajer dapat
menemukan informasi ini untuk segmentasi, penargetan, perolehan, penahanan,
dan pemeliharaan pelanggan yang lebih baik.

2. Terdapat beberapa langkah untuk mendapatkan data yang siap untuk


ditambang, yaitu melakukan proses preprosesing.

a) Sebutkan langkah utama proses preposesing !

Langkah Utama Preprosesing :


1. Data Cleaning
2. Data Integration
3. Data Reduksi
4. Data Transformasi dan Diskritisasi
5. Data Standardization

b) Jika terdapat data yang sama/duplikasi, maka data yang duplikat tersebut
haruslah dihilangkan, mengapa demikian ? Termasuk kedalam langkah
mana menghilangkan data yang duplikat dalam tahapan preprosesing
tersebut ?

Karena data yang sama/duplikasi bisa menyebabkan ketidakbenaran data serta


informasi yang menyesatkan dikarenakan jumlah data yang tidak sesuai dengan
fakta sehingga data yang diberikan kurang akurat dan tidak dapat dipercaya.
Menghilangkan data yang duplikat masuk ke dalam tahapan Data Cleaning.

c) Jika terdapat 2 buah field dengan range nilai yang berbeda. Misal field
pertama antara 1-100 sementara field ke 2 antara 1-1000. Jelaskan
bagaimana proses preprosesing yang harus dilakukan.

Dikarenakan jarak data yang cukup jauh untuk melakukan perhitungan jarak,
maka data perlu di standarisasi. Data Standardization dilakukan agar jarak
datanya tidak jauh berbeda. Kemudian hitung nilai Z Score untuk menemukan
jarak paling dekat dari 2 data diatas.
Jika dikehendaki MinSupp = 40 % dan MinConf = 85% untuk dataset berikut ini : (Untuk soal 3 dan 4)

TID kode_plg Tanggal Nama Barang


112 105 27/03/2022 HD External
112 105 27/03/2022 Mic
112 105 27/03/2022 Laser Pointer
113 106 28/03/2022 HD External
113 106 28/03/2022 Printer
113 106 28/03/2022 Keyboard
113 106 28/03/2022 Laser Pointer
114 201 28/03/2022 HD External
114 201 28/03/2022 Keyboard
114 201 28/03/2022 Mic
115 106 29/03/2022 Laser Pointer
115 106 29/03/2022 HD External
115 106 29/03/2022 Printer
116 107 29/03/2022 HD External
116 107 29/03/2022 Keyboard
116 107 29/03/2022 Laser Pointer
116 107 29/03/2022 Mic
117 201 30/03/2022 HD External
117 201 30/03/2022 Keyboard
117 201 30/03/2022 Mic
117 201 30/03/2022 Laser Pointer
118 107 30/03/2022 Laser Pointer

3. Berdasarkan dataset yang telah diberikan, carilah aturan asosiasi berdasarkan


frequent itemset sesuai dengan kriteria yang telah ditentukan. Pilih salah satu
algoritma untuk pencarian frequent itemset (Apriori, Fp-Growth, Eclat).
Petunjuk : cari terlebih dahulu frequent pattern kemudian dilanjutkan pencarian
aturan asosiasi (35%)

Cari Frequent Pattern dengan melihat TID dan Itemset.

TID Itemset
112 HD External, Mic, Laser Pointer
113 HD External, Printer, Keyboard, Laser Pointer
114 HD External, Keyboard, Mic
115 Laser Pointer, HD External, Printer
116 HD External, Keyboard, Laser Pointer, Mic
117 HD External, Keyboard, Mic, Laser Pointer
118 Laser Pointer

Terdapat 7 transaksi.

Pencarian Aturan Asosiasi Menggunakan ECLAT dengan MinSupp = 40 %,


MinSuppCount = 3, dan MinConf = 85%.
Step 1 : Dataset diubah ke dalam bentuk Vertical Data Format dan Cari nilai
support untuk 1 itemset.

C1
Itemset TID
HD External 112, 113, 114, 115, 116, 117
Mic 112, 114, 116, 117
Laser Pointer 112, 113, 115, 116, 117, 118
Printer 113, 115
Keyboard 113, 114, 116, 117

Step 2 : Itemset yang nilai support countnya kurang dari 3 dihapus.

C1
Itemset TID
HD External 112, 113, 114, 115, 116, 117
Mic 112, 114, 116, 117
Laser Pointer 112, 113, 115, 116, 117, 118
Printer 113, 115
Keyboard 113, 114, 116, 117

L1
itemset TID
HD External 112, 113, 114, 115, 116, 117
Mic 112, 114, 116, 117
Laser Pointer 112, 113, 115, 116, 117, 118
Keyboard 113, 114, 116, 117

Step 3 : Cari nilai support untuk 2 itemset. Kemudian Hapus nilai support
countnya kurang dari sama dengan 3

C2
itemset TID
HD External, Mic 112, 114, 116, 117
HD External, Laser Pointer 112, 113, 115, 116, 117
HD External, Keyboard 113, 114, 116, 117
Mic, Laser Pointer 112, 116, 117
Mic, Keyboard 114, 116, 117
Laser Pointer, Keyboard 113, 116, 117
itemset TID
L2
HD External, Mic 112, 114, 116, 117
HD External, Laser Pointer 112, 113, 115, 116, 117
HD External, Keyboard 113, 114, 116, 117
Mic, Laser Pointer 112, 116, 117
Mic, Keyboard 114, 116, 117
Laser Pointer, Keyboard 113, 116, 117

Step 4 : Cari nilai support untuk 3 itemset. Kemudian Hapus nilai support
countnya kurang dari sama dengan 3

C3
itemset TID
HD External, Mic, Laser Pointer 112, 116, 117
HD External, Mic, Keyboard 114, 116, 117
HD External, Laser Pointer, Keyboard 113, 116, 117
Mic, Laser Pointer, Keyboard 116, 117

L3
itemset TID
HD External, Mic, Laser Pointer 112, 116, 117
HD External, Mic, Keyboard 114, 116, 117
HD External, Laser Pointer, Keyboard 113, 116, 117

Step 5 : Karena nilai support 4 itemset tidak memenuhi, maka langsung mencari
confidence dimulai dari L3 dan L2.

Rule Confidence Confidence%


HD External, Mic → S(HD External, Mic, Laser Pointer) → S(HD External, Mic) =
Laser Pointer 3/4 75%
HD External, Laser S(HD External, Mic, Laser Pointer) → S(HD External, Laser
Pointer → Mic Pointer) = 3/5 60%
Mic, Laser Pointer → HD S(HD External, Mic, Laser Pointer) → S(Mic, Laser Pointer)
External = 3/3 100%
HD External → Mic,
Laser Pointer S(HD External, Mic, Laser Pointer) → S(HD External) = 3/6 50%
Mic → HD External,
Laser Pointer S(HD External, Mic, Laser Pointer) → S(Mic) = 3/4 75%
Laser Pointer → HD
External, Mic S(HD External, Mic, Laser Pointer) → S(Laser Pointer) = 3/6 100%
HD External → Mic S(HD External, Mic) → S(HD External) = 4/6 66,00%
Mic → HD External S(HD External, Mic) → S(Mic) = 4/4 100%
HD External → Laser
Pointer S(HD External, Laser Pointer) → S(HD External) = 5/6 83%
Laser Pointer → HD
External S(HD External, Laser Pointer) → S(Laser Pointer) = 5/6 83%
HD External →
Keyboard S(HD External, Keyboard) → S(HD External) = 4/6 66%
Keyboard → HD
External S(HD External, Keyboard) → S(Keyboard) = 4/4 100%
Mic → Laser Pointer S(Mic, Laser Pointer) → S(Mic) = 3/4 75%
Laser Pointer → Mic S(Mic, Laser Pointer) → S(Laser Pointer) = 3/4 75%
Mic → Keyboard S(Mic, Keyboard) → S(Mic) = 3/4 75%
Keyboard → Mic S(Mic, Keyboard) → S(Keyboard) = 3/4 75%
Laser Pointer →
Keyboard S(Laser Pointer, Keyboard) → S(Laser Pointer) = 3/6 50%
Keyboard → Laser
Pointer S(Laser Pointer, Keyboard) → S(Keyboard) = 3/4 75%

Hasil yang didapat ialah itemset yang memenuhi nilai Minimum Confidence ialah Mic,
Laser Pointer → HD External, Laser Pointer → HD External, Mic, Mic → HD External,
dan Keyboard → HD External.

4. Berdasarkan dataset yang telah diberikan, carilah aturan asosiasi berdasarkan


sequential pattern sesuai kriteria yang telah ditentukan. Pilih salah satu algoritma
untuk mendapatkannya (GSP, SPADE) (35%)

Buat Terminologi dari tabel diatas. Urutkan sesuai costumer.

kode_plg tanggal barang yang dibeli


105 27/03/2022 HD External, Mic, Laser Pointer
28/03/2022 HD External, Printer, Keyboard, Laser Pointer
106
29/03/2022 Laser Pointer, HD External, Printer
29/03/2022 HD External, Keyboard, Laser Pointer, Mic
107
30/03/2022 Laser Pointer
28/03/2022 HD External, Keyboard, Mic
201
30/03/2022 HD External, Keyboard, Mic, Laser Pointer

Buat Sequence Pattern


kode_plg Costumer Sequence
105 <(HD External, Mic, Laser Pointer)>
<(HD External, Printer, Keyboard, Laser Pointer), (Laser Pointer, HD
106 External, Printer)>
107 <(HD External, Keyboard, Laser Pointer, Mic), (Laser Pointer)>
<(HD External, Keyboard, Mic), (HD External, Keyboard, Mic, Laser
201 Pointer)>

Mencari Aturan Asosiasi Menggunakan GSP ( General Sequence Pattern ) dengan


MinSupCount = 2.
Step 1 : Cari nilai support untuk 1 itemset. Dan Hapus item yang nilai support
dibawah 2.

C1
itemset Support
HD External 4
Mic 3
Laser Pointer 4
Printer 1
Keyboard 3

F1

<(HD External),(Mic),(Laser Pointer),(Keyboard)>

Step 2 : Cari nilai support untuk 2 itemset. Dan Hapus item yang nilai support
dibawah 2.

C2
itemset Support
<(HD External) (Mic)> 1
<(Mic) (HD External)> 1
<(HD External, Mic)> 2
<(HD External) (Laser Pointer)> 3
<(Laser Pointer) (HD External)> 1
<(HD External,Laser Pointer)> 4
<(HD External) (Keyboard)> 1
<(Keyboard) (HD External)> 2
<(HD External,Keyboard)> 3
<(Mic) (Laser Pointer)> 2
<(Laser Pointer) (Mic)> 0
<(Mic, Laser Pointer)> 3
<(Mic) (Keyboard)> 1
<(Keyboard) (Mic)> 1
<(Mic,Keyboard)> 2
(Laser Pointer) (Keyboard) 0
(Keyboard) (Laser Pointer) 2
(Laser Pointer, Keyboard) 2

F2

<(HD External, Mic)>, <(HD External) (Laser Pointer)>, <(HD External,Laser


Pointer)>, <(Keyboard) (HD External)>, <(HD External,Keyboard)>, <(Mic)
(Laser Pointer)>, <(Mic, Laser Pointer)>, <(Mic,Keyboard)>, <(Keyboard)
(Laser Pointer)>, <(Laser Pointer, Keyboard)>
Step 3 : Cari nilai support untuk 3 itemset. Dan Hapus item yang nilai support
dibawah 2.

C3
itemset Support
<(HD External, Mic), (HD External)> 1
<(HD External) , (HD External, Mic)> 1
<(HD External, Mic), (Laser Pointer)> 2
<(HD External, Laser Pointer), (HD External)> 2
<(HD External), (HD External, Laser Pointer)> 2
<(Laser Pointer) , (HD External, Mic)> 0
<(Keyboard) , (HD External, Mic)> 1
<(HD External, Keyboard), (Laser Pointer)> 3
<(Laser Pointer), (HD External, Keyboard)> 0
<(HD External, Keyboard), (Mic)> 1
<(Mic, Keyboard) , (Laser Pointer>) 2
<(Laser Pointer), (Laser Pointer , Keyboard)> 0
<(Mic, Laser Pointer) , (Keyboard)> 0

F3

<(HD External, Mic), (Laser Pointer)>, <(HD External, Laser Pointer), (HD
External)>, <(HD External), (HD External, Laser Pointer)>, <(Keyboard) , (HD
External, Mic)>, <(HD External, Keyboard), (Laser Pointer)>, <(HD External,
Keyboard), (Mic)>, <(Mic, Keyboard) , (Laser Pointer)>

Step 4 : Karena di c4 tidak ada yang memenuhi nilai minsupcount, maka


pencarian dimulai dari f3

F1 (1-Sequences) : <(HD External),(Mic),(Laser Pointer),(Keyboard)>

F2 (2-Sequences) : <(HD External, Mic)>, <(HD External) (Laser Pointer)>, <(HD


External,Laser Pointer)>, <(Keyboard) (HD External)>, <(HD
External,Keyboard)>, <(Mic) (Laser Pointer)>, <(Mic, Laser Pointer)>,
<(Mic,Keyboard)>, <(Keyboard) (Laser Pointer)>, <(Laser Pointer, Keyboard)>

F3 (3-Sequences) : <(HD External, Mic), (Laser Pointer)>, <(HD External, Laser


Pointer), (HD External)>, <(HD External), (HD External, Laser Pointer)>,
<(Keyboard) , (HD External, Mic)>, <(HD External, Keyboard), (Laser Pointer)>,
<(HD External, Keyboard), (Mic)>, <(Mic, Keyboard) , (Laser Pointer)>
Kesimpulan :

Hasil Sequence Pattern yang didapat ialah Pada F3 sehingga berhenti di 3-Urutan.
Item yang memenuhi dan banyak dibeli oleh costumer ialah <(HD External, Mic),
(Laser Pointer)>, <(HD External, Laser Pointer), (HD External)>, <(HD External),
(HD External, Laser Pointer)>, <(Keyboard) , (HD External, Mic)>, <(HD External,
Keyboard), (Laser Pointer)>, <(HD External, Keyboard), (Mic)>, <(Mic, Keyboard) ,
(Laser Pointer>).

5. Terdapat banyak formula untuk melakukan pengukuran aturan asosiasi.


Lakukan 3 pengukuran aturan asosiasi dari hasil yang diperoleh soal no. 3 atau
soal 4. Misal menggunakan pengukuran : lift. (10%)

Anda mungkin juga menyukai