DISUSUN OLEH:
NAMA : Muhammad Ali Khofi
NIM : 1410651198
Puji syukur kehadirat Allah SWT karena dengan ridho dan rahmat-Nya, penulis
dapat menyelesaikan proposal tugas akhir yang berjudul Menentukan Stok Barang pada
Toko Online Menggunakan Metode Fuzzy K-Means. Banyak kesulitan dan hambatan
yang penulis temui dalam penyusunan laporan ini. Namun berkat bantuan dan bimbingan
dari berbagai pihak penulis dapat penyelesaikannya.
Dalam penyusunan proposal ini tidak terlepas dari dukungan berbagai pihak yang
memungkinkan makalah ini terselesaikan. Maka pada kesempatan kali ini penulis
mengucapkan banyak terima kasih kepada seluruh pihak yang telah memberikan
bimbingan, dukungan dan saran.
Dan semua pihak yang membantu dalam proses penyusunan proposal yang tidak
dapat disebutkan satu persatu, Harapan penulis, semoga proposal ini dapat bermanfaat
bagi semua pihak yang membaca. Akhir kata, penulis ucapkan terima kasih.
ii
DAFTAR ISI
KATA PENGANTAR.................................................................................................... ii
BAB I : PENDAHULUAN............................................................................................ 4
2.3 Clustering.......................................................................................................... 7
3.2 Kesimpulan........................................................................................................ 14
iii
BAB I
PENDAHULUAN
4
tersebut maka diperlukan suatu proses pengolahan data historis transaksi besar
diperlukan suatu teknik data mining. Teknik data mining yang akan digunakan
pada penelitian ini adalah metode K-Means. Penelitian diharapkan dapat
menghasilkan suatu informasi yang dapat mengcluster atau mengelompokan
produk yang harus memiliki jumlah stok banyak karena paling diminati
konsumen.
5
BAB II
DASAR TEORI
6
Selain definisi di atas beberapa definisi juga diberikan seperti, data
mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara
manual. (Pramudiono, 2006). Data mining adalah analisis otomatis dari data
yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau
kecenderungan yang penting yang biasanya tidak disadari keberadaannya.
(Pramudiono, 2006). Data mining merupakan analisis dari peninjauan
kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas
data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan
bermanfaat bagi pemilik data. (Larose, 2006). Data mining merupakan bidang
dari beberapa keilmuan yang menyatukan teknik dari pembelajaran mesin,
pengenalan pola, statistik, database, dan visualisasi untuk penanganan
permasalahan pengambilan informasi dari database yang besar. (Larose, 2006).
2.3 Clustering
Pada dasarnya clustering merupakan suatu metode untuk mencari dan
mengelompokkan data yang memiliki kemiripan karakteriktik (similarity) antara
satu data dengan data yang lain. Clustering merupakan salah satu metode data
mining yang bersifat tanpa arahan (unsupervised), maksudnya metode ini
diterapkan tanpa adanya latihan (taining) dan tanpa ada guru (teacher) serta tidak
memerlukan target output. Dalam data mining ada dua jenis metode clustering
yang digunakan dalam pengelompokan data, yaitu hierarchical clustering dan
non-hierarchical clustering (Santosa, 2007).
Hierarchical clustering adalah suatu metode pengelompokan data yang
dimulai dengan mengelompokkan dua atau lebih objek yang memiliki kesamaan
paling dekat. Kemudian proses diteruskan ke objek lain yang memiliki kedekatan
kedua. Demikian seterusnya sehingga cluster akan membentuk semacam pohon
dimana ada hierarki (tingkatan) yang jelas antar objek, dari yang paling mirip
sampai yang paling tidak mirip. Secara logika semua objek pada akhirnya hanya
akan membentuk sebuah cluster. Dendogram biasanya digunakan untuk
membantu memperjelas proses hierarki tersebut (Santoso, 2010).
Berbeda dengan metode hierarchical clustering, metode non-hierarchical
clustering justru dimulai dengan menentukan terlebih dahulu jumlah cluster yang
diinginkan (dua cluster, tiga cluster, atau lain sebagainya). Setelah jumlah cluster
7
diketahui, baru proses cluster dilakukan tanpa mengikuti proses hierarki. Metode
ini biasa disebut dengan K-Means Clustering (Santoso, 2010).
8
e. Tugaskan lagi setiap objek memakai pusat cluster yang baru. Jika pusat cluster
tidak berubah lagi maka proses clustering selesai. Atau, kembali ke langkah
nomor 3 sampai pusat cluster tidak berubah lagi .
9
BAB III
METODE PENELITIAN
10
11
Untuk membuat cluster pada table di atas, maka terlebih dahulu
ditentukan adalah sebagai berikut:
CENTROID AWAL
Centroid ( C ) 1 2 3
Price 0,5 1 2
Sales 200 1000 2000
3. Tempatkan setiap data atau objek ke klaster terdekat. Kedekatan dua objek
ditentukan berdasar jarak. Jarak yang dipakai pada algoritma k-Means adalah:
Euclidean distance (d).
12
No PRICE SALES C1 (PKG) C2 (PKG) C3 (PKG)
1
1.69 3638 3,538.00 2,638.00 1,638.00
2
0.42 3062 2,962.00 2,062.00 1,062.00
3
0.95 1762 1,662.00 762.00 238.00
4
0.42 999 899.00 1.16 1,001.00
5
0.85 1159 1,059.00 159.00 841.00
6
1.66 1153 1,053.00 153.00 847.00
7
1.25 538 438.00 462.00 1,462.00
8
4.21 249 149.02 751.01 1,751.00
9
2.51 736 636.00 264.00 1,264.00
10
0.85 2621 2,521.00 1,621.00 621.00
11
0.99 3621 3,521.00 2,621.00 1,621.00
12
0.65 55 45.02 945.00 1,945.00
13
14
1.66 696 596.00 304.00 1,304.00 4.
0.75 2308 2,208.00 1,308.00 308.00
15
1.16 403 303.00 597.00 1,597.00
16
0.65 1031 931.00 31.00 969.00 Dari
17
1.25 115 15.02 885.00 1,885.00
18
1.19 202 102.00 798.00 1,798.00
hasil
19
0.42 65 35.04 935.00 1,935.00
20
1.25 548 448.00 452.00 1,452.00
21
1.63 90 10.01 910.00 1,910.00
22
0.42 2545 2,445.00 1,545.00 545.00
23
2.51 976 876.00 24.05 1,024.00
24
0.42 652 552.00 348.00 1,348.00
25
1.25 109 9.03 891.00 1,891.00
26
0.85 662 562.00 338.00 1,338.00
27
0.65 2526 2,426.00 1,526.00 526.00
28
1.25 190 90.00 810.00 1,810.00
29
2.1 117 17.00 883.00 1,883.00
30
0.85 2354 2,254.00 1,354.00 354.00
36.71 35182
13
Tabel 2.3 Hasil Klasterisasi
No C2
PRICE SALES C1 (PKG) C3 (PKG) C1 C2 C3
(PKG)
1 ok
1.69 3638 3,538.00 2,638.00 1,638.00
2 ok
0.42 3062 2,962.00 2,062.00 1,062.00
3 ok
0.95 1762 1,662.00 762.00 238.00
4 ok
0.42 999 899.00 1.16 1,001.00
5 ok
0.85 1159 1,059.00 159.00 841.00
6 ok
1.66 1153 1,053.00 153.00 847.00
7 ok
1.25 538 438.00 462.00 1,462.00
8 ok
4.21 249 149.02 751.01 1,751.00
9 ok
2.51 736 636.00 264.00 1,264.00
10 ok
0.85 2621 2,521.00 1,621.00 621.00
11 ok
0.99 3621 3,521.00 2,621.00 1,621.00
12 ok
0.65 55 45.02 945.00 1,945.00
13 ok
1.66 696 596.00 304.00 1,304.00
14 ok
0.75 2308 2,208.00 1,308.00 308.00
15 ok
1.16 403 303.00 597.00 1,597.00
16 ok
0.65 1031 931.00 31.00 969.00
17 ok
1.25 115 15.02 885.00 1,885.00
18 ok
1.19 202 102.00 798.00 1,798.00
19 ok
0.42 65 35.04 935.00 1,935.00
20 ok
1.25 548 448.00 452.00 1,452.00
21 ok
1.63 90 10.01 910.00 1,910.00
22 ok
0.42 2545 2,445.00 1,545.00 545.00
23 ok
2.51 976 876.00 24.05 1,024.00
24 ok
0.42 652 552.00 348.00 1,348.00
25 ok
1.25 109 9.03 891.00 1,891.00
26 ok
0.85 662 562.00 338.00 1,338.00
27 ok
0.65 2526 2,426.00 1,526.00 526.00
28 ok
1.25 190 90.00 810.00 1,810.00
29 ok
2.1 117 17.00 883.00 1,883.00
30 ok
0.85 2354 2,254.00 1,354.00 354.00
36.71 35182 12 9 9
14
5. Setelah mendapatkan hasil dari perhitungan iterasi pertama. Hitung kembali
titik pusat (centroid) pada masing-masing cluster dengan menggunakan
perhitungan rata-rata yaitu total nilai dari data pada cluster n dimensi ke-k
dibagi jumlah data dari cluster n dimensi ke-k. maka akan mendapat centroid
baru.
CENTROID BARU
Centroid (
C) 1 2 3
Harga 1.47 1.28 0.84
223.4 896.0 2,715.2
Jumlah
2 0 2
6. Lalu, ulangi perhitungan untuk menentukan nilai cluster pada tiap data untuk
menghasilkan nilai pada Iterasi ke 2 sampai pada Iterasi ke n dengan posisi
data pada cluster tertentu tidak berubah.
15
N
PRICE SALES C1 (PKG) C2 (PKG) C3 (PKG) C1 C2 C3
o
1 1.69 3638 3,414.58 2,742.00 922.78 ok
2 0.42 3062 2,838.58 2,166.00 346.78 ok
3 0.95 1762 1,538.58 866.00 953.22 ok
4 0.42 999 775.58 103.00 1,716.22 ok
5 0.85 1159 935.58 263.00 1,556.22 ok
6 1.66 1153 929.58 257.00 1,562.22 ok
7 1.25 538 314.58 358.00 2,177.22 ok
8 4.21 249 25.73 647.01 2,466.22 ok
9 2.51 736 512.58 160.00 1,979.22 ok
1 ok
0.85 2621 2,397.58 1,725.00 94.22
0
1 ok
0.99 3621 3,397.58 2,725.00 905.78
1
1 ok
0.65 55 168.42 841.00 2,660.22
2
1 ok
1.66 696 472.58 200.00 2,019.22
3
1 ok
0.75 2308 2,084.58 1,412.00 407.22
4
1 ok
1.16 403 179.58 493.00 2,312.22
5
1 ok
0.65 1031 807.58 135.00 1,684.22
6
1 ok
1.25 115 108.42 781.00 2,600.22
7
1 ok
1.19 202 21.42 694.00 2,513.22
8
1 ok
0.42 65 158.42 831.00 2,650.22
9
2 ok
1.25 548 324.58 348.00 2,167.22
0
2 ok
1.63 90 133.42 806.00 2,625.22
1
2 ok
0.42 2545 2,321.58 1,649.00 170.22
2
2 ok
2.51 976 752.58 80.01 1,739.22
3
2 ok
0.42 652 428.58 244.00 2,063.22
4
2 ok
1.25 109 114.42 787.00 2,606.22
5
2 ok
0.85 662 438.58 234.00 2,053.22
6
2 ok
0.65 2526 2,302.58 1,630.00 189.22
7
2 ok
1.25 190 33.42 706.00 2,525.22
8
2 ok
2.1 117 106.42 779.00 2,598.22
9
3 ok
0.85 2354 2,130.58 1,458.00 361.22
0
N 12 10 8
36.71 35182
o
16
Tabel 2.5 Perhitungan Iterasi ke 3
17
3.2 Kesimpulan
Pada proses Iterasi terakhir dapat disimpulkan bahwa:
1. produk dibawah ini:
NO PRODUCT
1 ASSORTED COLOUR BIRD ORNAMENT
2 ASSORTED BOTTLE TOP MAGNETS
3 ASSORTED COLOUR MINI CASES
4 ASSORTED CREEPY CRAWLIES
5 ASSORTED COLOUR T-LIGHT HOLDER
6 ASSORTED COLOURS SILK FAN
7 ASSORTED LAQUERED INCENSE HOLDERS
8 ASSORTED TUTTI FRUTTI BRACELET
9 ASSORTED TUTTI FRUTTI PEN
18