PKL Implementasi Algoritma K-Means Dalam PDF
PKL Implementasi Algoritma K-Means Dalam PDF
OLEH :
DEVID SUDIRMAN
11101152630262
DIKRI HIDAYATULLAH
11101152630263
21
Devid Sudirman
1110115260262
Disetujui Oleh
(Rini Sovia,S.kom,M.kom)
NIDN :
Penguji Materi,
22
ABSTRACT
This report describe about Tanagra software application on data
mining.Tanagra is data mining software wivhcan be use to access some existing data
mining method.Data is built using excel with text type.This application use the
dataset of input.
In implementing this program algorithm test data used is the data item in the
RUMAH DEKOR.In this application,use in the application of clustering using Kmeans algorithm.
23
ABSTRAK
Laporan menjelaskan tentang aplikasi perangkat lunak tanagra pada data
mining. Tanagra adalah software data mining yang dapat digunakan untuk
mengakses beberapa metode data mining yang ada. Data dibangun menggunakan
excel deengan jenis teks data. Aplikasi ini menggunakan dataset input dataset input.
Dalam melaksanakan pengujian algoritma ini data yang dipakai adalah data
barang di CV.RUMAH DEKOR. Dalam penerapan ini, digunakan penerapan
clustering dengan menggunakan algoritma K-means.
24
KATA PENGANTAR
Segala puji hanya milik Allah SWT. Shalawat dan salam selalu
tercurahkan kepada Rasulullah SAW. Berkat limpahan dan rahmat-Nya penulis
telah mampu menyelesaikan laporan praktek kerja lapangan.
Dalam penyusunan laporan ini, tidak sedikit hambatan yang kami hadapi.
Namun kami menyadari bahwa kelancaran dalam penyusunan materi ini tidak lain
berkat bantuan, dorongan dari berbagai pihak dan kami ucapkan terima kasih kepada
kepada berbagai pihak yang telah membantu kelancaran dalam penyelesaian laporan
praktek kerja lapangan ini, diantaranya:
1. Bapak H. Herman Nawas selaku ketua Yayasan Perguruan Tinggi
Komputer Padang.
2. Bapak Dr. Sarjon Defit,S.kom,M.sc selaku rektor Universitas Putra
Indonesia YPTK Padang.
3. Bapak Julius Santony,S.kom,M.kom selaku Dekan Fakultas Ilmu
Komputer.
4. Ibu Rini Sovia,S.kom,M.kom selaku Ketua Program Studi Teknik
Informatika.
5. Bapak Eka Praja Wiyata Mandala,S.kom,M.kom selaku Sekretaris
Program Studi Teknik Informatika dan pembimbing penulis dalam
menyelesaikan laporan praktek kerja lapangan (PKL) ini.
25
Penulis
26
DAFTAR ISI
HALAMAN JUDUL
ii
ABSTRACT
iii
ABSTRAK
iv
KATA PENGANTAR
DAFTAR ISI
vii
DAFTAR GAMBAR
DAFTAR TABEL
xii
DAFTAR LAMPIRAN
BAB I PENDAHULUAN
1.3 Hipotesa
7
7
27
2.2 Clustering
11
13
13
14
14
15
17
17
18
18
18
3.2.3 Analisa
18
3.2.4 Perancangan
19
3.2.5 Implementasi
19
3.2.6 Pengujian
19
20
20
20
22
28
29
29
29
32
32
33
33
37
37
38
40
5.5.4 K-Means
41
43
49
BAB VI PENUTUP
52
6.1 Kesimpulan
52
52
6.3 Saran
53
DAFTAR PUSTAKA
54
29
DAFTAR GAMBAR
10
10
10
11
12
17
23
30
30
31
31
31
34
34
35
35
36
36
37
38
39
30
39
40
41
41
42
42
43
44
44
45
45
46
47
47
48
49
50
50
51
51
31
DAFTAR TABEL
11
24
32
BAB I
PENDAHULUAN
33
1.3 Hipotesa
Pengolahan data penjualan berdasarkan jenis barang dengan menggunakan
Algoritma K-means ini diharapkan dapat membantu pihak CV.RUMAH DECOR
dalam proses pengolahan data.
1.4 Batasan Masalah
Batasan masalah yang digunakan dalam penelitian ini adalah:
1. Data penjualan yang akan diteliti tercatat pada tahun 2013.
2. Data yang diolah hanya sebagai sampel dengan software data mining yaitu
dengan data penjualan selama 1 tahun dengan atribut tertentu.
3. Metode Algoritma K-means dilakukan berdasarkan jenis barang yang
dipasarkan
4. Data yang diolah hanya data pembeliandalam bentuk cash atau tunai.
1.5 Tujuan Penelitian
Pelaksanaan praktek kerja lapangan ini bertujuan untuk :
1. Memberikan informasi kepada pihak CV.RUMAH DECOR di Padang
mengenai pengelompokan data penjualan berdasarkan jenis barang.
2. Mengetahui jenis barang yang dipasarkan dari waktu ke waktu.
3. Sebagai sarana belajar untuk mengetahui cara pengolahan data penjualan
pada sebuah software data mining.
1.6 Manfaat Penelitian
Manfaat dari penelitian dari praktek kerja lapangan ini adalah :
1. Dapat menjadi informasi dan pengetahuan baru bagi pihak CV.RUMAH
DECOR.
2. Sebagai sistem pendukung keputusan daalam menentukan karakteristik dari
jenis barang.
34
antara
lingkungan dan rumah tinggal dalam hal konteks tersebut sangat dituntut
hadirnya tenaga profesinal untuk menangani penataan decorasi baik interior
maupun exterior. Kenyamanan lingkungan serta tempat tinggal yang tertata
dengan baik tidak terlepas dari keahlian yang profesional dalam penanganannya.
Penataan tempat tinggal yang rapi, dapat menimbulkan efek terhadap pikiran
serta kenyamanan bagi si penghuni. Adapun aspek lainnya menimbulkan
keindahan dilingkungan tempat tinggal tersebut.
Rumah Decor hadir di Padang untuk menjawab dari kebutuhan akan
penataan ruangan ( Interior ) yang didukung oleh tenaga tenaga professional
dibidangnya hingga menghadirkan apa yang menjadi idaman para penghuni
tempat tinggal. Dengan motto yang kami miliki Unggul Dalam Design dan
Mutu adalah motivator yang besar dalam memenuhi kepuasan pelanggan
1.7.2 Visi dan Misi Toko Rumah Decor
Visi :
1.
Menjadikan perusahaan
35
3.
Misi :
1.
dinikmati pelanggan
3.
4.
36
Direktur
David
General Manager
Ratulani Juwita, S.Pd
Mgr. Marketing
Mgr. Operasional
Susi Rahmatul F.
Dayat
Mgr. Keuangan
Normalisa
Ass. Marketing 1
Titiek
Mgr. Produksi
Boy Alexa
Ass. Keu
Hayati
Yusprina
Aan
Ismet
Fajar
Aini
Riri
Listra
Bento
Lina
Zul
Doni
Raka
37
BAB II
LANDASAN TEORI
38
Sumber : Jiawei Han dan Micheline kamber, Data mining: Concept and
Techniques,(San Fransisco: Morgan Kaufmann,2001).
Gambar 2.1. Proses Data Mining
Keterangan :
1. Database merupakan koleksi data yang saling berhubungan dipergunakan
secara bersama, dirancang untuk memenuhi kebutuhan informasi organisasi.
2. Pembersihan Data (Data Cleaning), pada tahap ini dilakukan pembersihan
data, meliputi data yang mengandung missing value dan data yang tidak
konsisten (inconsisten data) pada database. Keluaran tahapan ini adalah data
yang telah bersih dan siap digunakan pada proses selanjutnya, karena pada
daata mining hanya akan dapat menghasilkan nilai yang valid jika data telah
bersih. Jika ditemukan data yang mengandung missing value dan data yang
tidak konsisten lebih besar jumlahnya.
3. Integrasi Data (integration data), proses integrasi data dilakukan untuk
menggabungkan data yang sudah bersih dari missing value dan inconsistent
data dari berbagai sumber menjadi bentuk sebuah bentuk penyimpanan data
yang konheren, seperti data warehouse.
4. Task Relevan Data, tahap ini melakukan seleksi relevansi atribut dari data.
39
40
41
42
1. Partitioning Clustering.
a. Disebut juga exclusive clustering
b. Setiap data harus termasuk dalam cluster tertentu
c. Memungkinkan bagi setiap data yang termasuk cluster tertentu pada
suatu tahapan proses, pada tahapan berikutnya berpindah ke cluster
yang lain. Contoh :K-Means, residual analysis.
2. Hierarchical Clustering.
a. Setiap data harus masuk ke dalam cluster tertentu
b. Suatu data yang masuk kedalam cluster tertentu pada suatu tahapan
proses, tidak dapat berpindah ke cluster lain. Contoh: Single Linkage,
Centroid Linkage, Complete Linkage
3. Overlapping Clustering.
a. Setiap data memungkinkan termasuk ke beberapa cluster
b. Data mempunyai nilai keanggotaan (membership) pada beberapa
cluster. Contoh : Fuzzy C-means, Gaussian Mixture
4. Hybrid merupakan kombinasi dari karakteristik partitioning, overlapping
dan hierarchical.
Sumber : Jiawei Han dan Micheline kamber, Data mining: Concept and
Techniques,(San Fransisco: Morgan Kaufmann,2001).
43
metode
pengelompokan
Non
Hirarki
bertujuan
untuk
44
digunakan
di
berbagai
bidang
karena
sederhana,
mudah
45
46
47
BAB IV
ANALISA DAN PERANCANGAN
menentukan
buah
pusat
cluster
awal
dilakukan
48
49
Dimana :
X1, X2, X3,.... Xn = anggota cluster
Xp = pusat lama
4.3 Perancangan dan Proses Clustering
Pada tahap ini akan dilakukan proses utama yaitu segmentasi atau
pengelompokkan data Penjualan barang yang diakses dari database, yaitu sebuah
metode clustering algoritma K-Means. Berikut ini merupakan diagram flowchart dari
algoritma K-Means dengan asumsi bahwa parameter input adalah jumlah data set
sebanyak n data dan jumlah inisialisasi centroid K=3 sesuai dengan penelitian.
Dari banyak data penjualan yang diperoleh, diambil 14 jenis barang untuk dijadikan
sampel untuk penerapan algoritma k-means dalam penjurusan mahasiswa. Percobaan
dilakukan dengan menggunakan parameter-parameter berikut :
50
Jumlah cluster : 2
Jumlah data :14
Jumlah atribut :2
Start
Input m record, k
(jumlahcluster)
Tentukan k record
sbgcentroid
Hitungsimilaritas
Nilai
rata2
Centroid
tetap
Set of k
clusters
End
51
Nama Barang
Harga
Barang(*Rp1000)
Total
130
600
Gordyn Standard
Gordyn Beludru
Gordyb Silk
Vitrase Tile
Vitrase Organdi
Vitrase Turkie
Blind Roller
Blind Vertical
Blind Slim
Carpet Crown
Carpet Sandrio
Carpet Treasure
Carper Spontini
60
120
110
85
115
120
130
140
125
400
160
950
1750
700
570
590
300
650
550
585
70
90
79
120
105
30
Iterasi ke-1
1. Penentuan pusat awal cluster
Pusatawal
cluster
atau
centroid
didapatkansecara
random,
X = Pusat cluster
x
n
i 1
yi
52
Y = data
Dari 5 data yang dijadikan sampel telah dipilih pusa tawal cluster
yaituC1(52 , 28), dan C2 (50 , 30). Lalu dilakukan penghitungan jarak dari
sisa sampel data dengan pusat cluster yang dimisalkan dengan M(a,b),
dimana a merupakan total penjualan,dan b harga barang yang diperkecil
menjadi angka puluhan juta agar cara penghitungan lebih mudah.
M1= (130,600)
M2= (60,700)
M3= (120,570)
M4= (110,590)
M5= (85,300)
M6= (115,650)
M7=(120,550)
M8= (130,585)
M9= (140,70)
M10= (125,90)
M11= (400, 79)
M12= (160,120)
M13= (950,105)
M14= (1750,30)
53
Hitung Euclidean distance dari semua data ketiap titik pusat pertama :
D11
M1x C1x 2 M1 y C1 y 2
D12
M1x C1x 2 M1 y C1 y 2
D13
M1x C1x 2 M1 y C1 y 2
601,85
D14
M1x C1x 2 M1 y C1 y 2
620,71
D15
M1x C1x 2 M1 y C1 y 2
D16
M1x C1x 2 M1 y C1 y 2
625,18
D17
M1x C1x 2 M1 y C1 y 2
526,41
D18
M1x C1x 2 M1 y C1 y 2
562,43
D19
M1x C1x 2 M1 y C1 y 2
577,29
672,04
273,99
97,50
D110
M1x C1x 2 M1 y C1 y 2
95,77
D111
M1x C1x 2 M1 y C1 y 2
351,71
D112
M1x C1x 2 M1 y C1 y 2
141,87
D113
M1x C1x 2 M1 y C1 y 2
901,29
D114
M1x C1x 2 M1 y C1 y 2
1698,00
54
Dengan cara yang sama hitung jarak tiap titik ketitik pusat ke-2 dan kita akan
mendapatkan :
D 21
M 1x C1x 2 M 1 y C1 y 2
575,58
D 22
M 1x C1x 2 M 1 y C1 y 2
670,075
D 23
M 1x C1x 2 M 1 y C1 y 2
544,51
D 24
M 1x C1x 2 M 1 y C1 y 2
563,20
D 25
M 1x C1x 2 M 1 y C1 y 2
D 26
M 1x C1x 2 M 1 y C1 y 2
623,39
D 27
M 1x C1x 2 M 1 y C1 y 2
524,69
D 28
M 1x C1x 2 M 1 y C1 y 2
560,73
D 29
M 1x C1x 2 M 1 y C1 y 2
272,25
98,48
D 210
M 1x C1x 2 M 1 y C1 y 2
96,04
D 211
M 1x C1x 2 M 1 y C1 y 2
353,41
D 212
M 1x C1x 2 M 1 y C1 y 2
142,12
D 213
M 1x C1x 2 M 1 y C1 y 2
903,12
D 214
M 1x C1x 2 M 1 y C1 y 2
1700
18
C1
C2
M1
577,29369
575,587
M2
672,04762
670,075
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
601,8538
620,71572
273,99453
625,18237
526,41049
562,43489
97,508974
95,77578
351,71722
141,87318
901,29518
1698,0012
544,518
563,205
272,259
623,398
524,69
560,736
98,4886
96,0469
353,413
142,127
903,12
1700
{M9,M10,M11,M12,M13,M14}
:anggota C1
{M1,M2,M3,M4,M5,M6,M7,M8}
:anggota C2
Iterasi ke-2
1. Hitung titik pusat baru
Tentukan posisi centroid baru (Ck ) dengan cara menghitung nilai
rata-rata dari data-data yang ada pada centroid yang sama.
1
C k
nk
d1
19
20
D11
M1x C1x 2 M1 y C1 y 2
D12
M1x C1x 2 M1 y C1 y 2
D13
M1x C1x 2 M1 y C1 y 2
675,57
D14
M1x C1x 2 M1 y C1 y 2
849,25
D15
M1x C1x 2 M1 y C1 y 2
D16
M1x C1x 2 M1 y C1 y 2
738,60
D17
M1x C1x 2 M1 y C1 y 2
661,28
D18
M1x C1x 2 M1 y C1 y 2
679,71
D19
M1x C1x 2 M1 y C1 y 2
690,88
812,28
618,57
447,84
D110
M1x C1x 2 M1 y C1 y 2
468,27
D111
M1x C1x 2 M1 y C1 y 2
187,52
D112
M1x C1x 2 M1 y C1 y 2
429,15
D113
M1x C1x 2 M1 y C1 y 2
363,21
D114
M1x C1x 2 M1 y C1 y 2
1163,67
Dengan cara yang sama hitung jarak tiap titik ketitik pusat baru ke-2 dan kita
akan mendapatkan :
21
D 21
M 1x C1x 2 M 1 y C1 y 2
38,309
D 22
M 1x C1x 2 M 1 y C1 y 2
307,71
D 23
M 1x C1x 2 M 1 y C1 y 2
11,40
D 24
M 1x C1x 2 M 1 y C1 y 2
51,89
D 25
M 1x C1x 2 M 1 y C1 y 2
286,26
D 26
M 1x C1x 2 M 1 y C1 y 2
82,11
D 27
M 1x C1x 2 M 1 y C1 y 2
21,33
D 28
M 1x C1x 2 M 1 y C1 y 2
27,13
D 29
M 1x C1x 2 M 1 y C1 y 2
469,16
D 210
M 1x C1x 2 M 1 y C1 y 2
559,36
D 211
M 1x C1x 2 M 1 y C1 y 2
569,27
D 212
M 1x C1x 2 M 1 y C1 y 2
451,04
D 213
M 1x C1x 2 M 1 y C1 y 2
960,30
D 214
M 1x C1x 2 M 1 y C1 y 2
1727,22
22
C1
C2
M1
690,88316
38,309
M2
812,28661
307,716
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
675,57941
849,25352
618,5744
738,60649
661,28628
679,71578
447,84991
468,27251
187,52904
429,15911
363,21005
1163,6759
11,4052
51,8901
286,254
82,1132
21,3326
27,1354
469,167
559,361
569,271
451,046
960,305
1727,22
{M9,M10,M11,M12,M13,M14}
:anggota C1
{M1,M2,M3,M4,M5,M6,M7,M8}
:anggota C2
23
24
BAB V
IMPLEMENTASI DAN PENGUJIAN
data, pembelajaran
statistik,
paradigma lain seperti clustering, analisis faktorial, statistik parametrik dan non
parametrik, aturan asosiasi, feature selection, dan construction algorithms. Tanagra
1.4.50
25
Input Data
26
Output / Hasil
27
Arff
Kebanyakan data yang diolah oleh Tanagra bersumber dari data yang
di tulis dari Microssoft Excel.
Data yang di import menggunakan format TXT berupa data yang
dibuat dengan menggunakan Microssoft
28
29
2. Anda telah memasuki halaman awaldari tanagra 1.4.50, lalu Klik tombol
Next!
3. Setelah itu akan keluar halaman License Agreement dari tanagra 1.4.50.
30
31
32
33
34
35
36
Tarik ke K-means 1
37
38
39
tentu
saja
konsisten
dengan
komponen
GROUP
40
41
42
43
44
45
BAB VI
PENUTUP
6.1 Kesimpulan
Dari hasil penelitian,
46
berdasarkan algoritma K-means atribut data yang dijadikan sebagai input harus
mempunyai kategori sama. Sehingga apabila data yang diinputkan mempunyai
kategori diskrete dancontinue pengolahan data tidak dapat dilakukan.
6.3 Saran
Dari hasil penelitian dan pengolahan data yang telah di lakukan maka
kami menyarankan kepada pihak CV.Rumah Decor , agar bisa mengelompokkan
barang-barang yang ada berdasarkan jenis dan mencatat setiap penjualan yang terjadi
pada setiap jenis barang tersebut, sehingga dapat memudahkan nantinya dalam
melakukan laporan kepada atasannya terhadap barang mana yang laku terjual dan
barang yang tidak laku terjual.
47
DAFTAR PUSTAKA
http://www.metris-community.com/pengertian-data-mining-konsep-pdf/
http://prayudho.wordpress.com/2008/12/30/analisis-cluster/
(http://sartika1603.wordpress.com/)
http://ammarawirausaha.blogspot.com/2009/10/pengertian-pelanggan.html
48
LAMPIRAN
49