Di Susun Oleh :
i
TUGAS AKHIR
Disusun Oleh :
Dosen Pembimbing :
1. Daryanto, S.Kom., M.Kom
2. Lutfi Ali Muharom, S.Si
Oleh :
Indri Dwi Rukmana
1210652018
Tugas Akhir Ini Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar
Sarjana Komputer (S.Kom)
di
Universitas muhammadiyah Jember
Telah diuji dan disahkan dihadapan tim penguji sidang tugas akhir, pada :
Hari : Jumat
Tanggal : 30 Januari 2015
Ruangan : Ruang Sidang Fakultas Teknik
Disetujui oleh :
Nim : 1210652018
Agama : Islam
Ambulu - Jember
Tugas Akhir ini sebagai syarat kelulusan program Sarjana (S1) untuk memperoleh gelar
Letak Merk Produk Berdasarkan Jenis Produk di Swalayan Larisso Ambulu - Jember”.
Demikian pernyataan ini saya buat dengan sesungguhnya, apabila terungkap suatu
jiplakan maka saya bersedia menerima akibat berupa sangsi akademis dan sangsi lain yang
iv
PERSEMBAHAN
Alhamdulillahirabbil alamin, akhirnya aku sampai ke titik ini. Segala puji dan syukur
kepada ALLAH SWT atas segala rakhmat dan hidayahnya yang telah memberikan
kekuatan, kesehatan dan kesabaran untuk ku dalam mengerjakan skripsi ini. Terima kasih
ku juga kepada :
1. Ayah dan Ibu tercinta yang selalu memberikanku motivasi, inspirasi, semangat dan
kasih sayangnya yang tak terhingga dalam menjalani kehidupan ini.
2. Kakak dan adikku yang telah sama-sama kita berjuang atas kehidupan yang kita
tempuh ini, teruslah berjuang untuk mencapai cita-cita kita.
6. Teman – teman kostan Greendland Cluster GO.20 yang super kocak dan konyol,
terimakasih atas canda tawa kalian serta supportnya selama ini.
v
MOTTO
“ Dia memberikan hikmah (ilmu yang berguna) kepada siapa yang dikehendaki-Nya.
Barang siapa yang mendapat hikmah itu, sesungguhnya ia telah mendapat kebajikan yang
banyak. Dan tiadalah yang menerima peringatan melainkan orang- orang yang berakal ”.
(Q.S. Al-Baqarah: 269)
“ Sesungguhnya bersama kesukaran itu ada keringanan. Karena itu bila kau sudah
selesai (mengerjakan yang lain). Dan berharaplah kepada Tuhanmu ”. (Q.S Al Insyirah : 6-8)
“ Jadilah seperti karang di lautan yang selalu kuat meskipun terus dihantam ombak
dan lakukanlah hal yang bermanfaat untuk diri sendiri dan juga untuk orang lain, karena hidup
tidak abadi ”. (Indri)
“ Kaki yang akan berjalan lebih jauh, tangan yang akan berbuat lebih banyak, mata
yang akan menatap lebih lama, leher yang akan lebih sering melihat ke atas, lapisan tekad
yang seribu kali lebih keras dari baja, dan hati yang akan bekerja lebih keras, serta mulut yang
akan selalu berdoa ”. -5cm
vi
KATA PENGANTAR
Alhamdulillahirabbil alamin, segala puji bagi Allah SWT Tuhan semesta alam atas
segala berkat, rahmat, taufik, serta hidayah-Nya sehingga penulis dapat menyelesaikan skripsi
ini dengan baik dan tepat waktu.
Tugas Akhir yang berjudul “ Implementasi Algoritma K-means Clustering Untuk
Menetukan Tata Letak Merk Produk Berdasarkan Jenis Produk di Swalayan Larisso Ambulu-
Jember ” ini dilakukan untuk memenuhi salah satu persyaratan pendidikan di Universitas
Muhammadiyah Jember Jurusan Teknik Informatika, Fakultas Teknik.
Dalam kesempatan ini, penulis menyampaikan rasa terima kasih kepada:
1. Bapak Daryanto S.Kom., M.Kom selaku dosen pembimbing 1.
2. Bapak Lutfi Ali Muharom, S.Si selaku dosen pembimbing 2.
3. Ibu Yeni Dwi Rahayu, M.Kom selaku dosen penguji 1.
4. Bapak Yulio Rahmadi, S.Kom selaku dosen penguji 2.
5. Para Dosen Fakultas Teknik Informatika, terima kasih atas semua ilmu yang telah
diberikan.
6. Keluarga penulis yang telah memberikan do’a dan juga bantuan secara moril dan materil.
7. Teman-teman yang telah mendukung dan memberi semangat kepada penulis.
8. Serta pihak-pihak yang telah membantu dan tidak dapat penulis sebutkan satu persatu.
Penulis menyadari bahwa masih banyak kekurangan dan kelemahan dalam
penyusunan skripsi ini. Oleh karena itu, kami mengharapkan kritik dan saran yang
membangun dan menambah wawasan dan wacana ilmu kami.
Akhir kata penulis berharap kerangka acuan skripsi ini dapat memberikan wawasan
dan pengetahuan kepada para pembaca pada umumnya dan pada penulis pada khususnya.
Penulis
vii
IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING
UNTUK MENENTUKAN TATA LETAK MERK PRODUK BERDASARKAN
JENIS PRODUK DI SWALAYAN LARISSO DI AMBULU – JEMBER
1.
Indri Dwi Rukmana (1210652018). 2.Daryanto S.Kom, M.Kom. 3.Lutfi Ali M, S.Si
Jurusan Teknik Informatika Falkutas Teknik Universitas Muhammadiyah Jember
indridwirukmana@gmail.com
ABSTRAK
Swalayan adalah salah satu tempat berbelanja yang dapat memberikan kenyamanan,
kebersihan, kecepatan dan kerapian produk untuk konsumennya. Banyak konsumen yang
lebih memilih berbelanja di swalayan daripada di pasar tradisional karena swalayan dapat
memberikan kenyamanan dan kerapian produknya, akan tetapi tidak sedikit dari konsumen
yang mengeluhkan masalah tata letak produk yang ada di swalayan.
Penentuan tata letak produk pada swalayan merupakan hal penting yang harus
diperhatikan oleh pihak manajemen swalayan. Pada tugas akhir ini akan dijelaskan bagaimana
implementasi algoritma k-means clustering berdasarkan kebiasaan konsumen berbelanja
untuk menghasilkan suatu model tata letak merk produk berdasarkan jenis produknya.
Penelitian ini menggunakan data yang diperoleh dari struk-struk belanja pada
swalayan larisso di Ambulu - Jember. Algoritma k-means clustering digunakan untuk
mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama
dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang
berbeda dikelompokkan ke dalam kelompok lain. Hasil dari penelitian ini menghasilkan
sebuah model tata letak merk produk berdasarkan jenis produknya yang dapat memudahkan
konsumen dalam mendapatkan barang yang dibutuhkan.
viii
IMPLEMENTATION OF K-MEANS CLUSTERING ALGORITHM
TO DETERMINE THE LAYOUT OF THE BRANDS PRODUCT BY
TYPES PRODUCT IN LARISSO SUPERMARKET AMBULU JEMBER
1.
Indri Dwi Rukmana (1210652018). 2.Daryanto S.Kom, M.Kom. 3.Lutfi Ali M, S.Si
Jurusan Teknik Informatika Falkutas Teknik Universitas Muhammadiyah Jember
indridwirukmana@gmail.com
ABSTRACT
Supermarket is one place that can provide comfort, cleanliness, speed and neatness of
products for consumers. Many consumers who prefer to shop in supermarkets than in
traditional markets because supermarkets can provide comfort and neatness of its products,
but not a bit of consumers who complained about the layout of the existing products in
supermarkets.
Determining the layout of the product at the supermarket is an important thing that
must be considered by the management of self-service. In this final project will be explained
how the implementation of k-means clustering algorithm based on consumer shopping habits
to generate a model layout of the brands products by type product.
This study uses data obtained from the receipt at the larisso supermarket in Ambulu -
Jember. K-means clustering algorithm is used to partition the data into clusters so that the data
which have similar characteristics are grouped into the same cluster and the data that have
different characteristics are grouped into another group. The results of this study resulted in a
model of the brands products layout based on the types of products that can enable customers
to obtain needed goods.
ix
DAFTAR ISI
Halaman
HALAMAN SAMPUL ................................................................................. i
HALAMAN PENGESAHAN ....................................................................... iii
PERNYATAAN ........................................................................................... iv
PERSEMBAHAN ......................................................................................... v
MOTTO ....................................................................................................... vi
KATA PENGANTAR .................................................................................. vii
ABSTRAK ................................................................................................... viii
ABSTRACT ................................................................................................. ix
DAFTAR ISI ................................................................................................ x
DAFTAR GAMBAR .................................................................................... xii
DAFTAR TABEL......................................................................................... xiv
DAFTAR LAMPIRAN ................................................................................. xvi
BAB 1. PENDAHULUAN ....................................................................... 1
1.1 Latar Belakang ............................................................................ 1
1.2 Perumusan Masalah ..................................................................... 2
1.3 Batasan Masalah .......................................................................... 2
1.4 Tujuan Penelitian ......................................................................... 2
1.5 Manfaat Penelitian ....................................................................... 2
BAB 2. TINJAUAN PUSTAKA .............................................................. 3
2.1 Definisi Swalayan ........................................................................ 3
2.2 Profil Swalayan Larisso Ambulu ................................................. 3
2.3 Tata Letak ................................................................................... 5
2.4 Data Mining ............................................................................... 6
2.4.1 Tahapan Data Mining ......................................................... 8
2.4.2 Pengelompokan Data Mining................................................ 9
2.5 Clustering .................................................................................... 12
2.5.1 Partitioning Clustering ........................................................ 14
2.6 Algoritma K-Means ..................................................................... 15
2.7 Microsoft Visual Basic.Net .......................................................... 16
x
BAB 3. METODOLOGI PENELITIAN ................................................... 18
3.1 Data Yang Digunakan .................................................................. 18
3.2 Praproses Data ............................................................................. 18
3.2.1 Penentuan Kelompok Jenis Produk...................................... 18
3.2.2 Penentuan Kelompok Berdasarkan Record .......................... 20
3.3 Cleaning Data .............................................................................. 24
3.4 Uji Coba Dengan Algoritma K-Means Clustering ........................ 26
3.4.1 Perhitungan Jarak Berdasarkan Parameter Produk ............... 30
3.4.2 Pengelompokkan Jarak Terkecil atau Minimum .................. 38
3.5 Perancangan Antar Muka Sistem ................................................. 42
3.5.1 Perancangan Flowchart Sistem ............................................ 42
3.5.2 Perancangan Tampilan Sistem............................................. 44
BAB 4. HASIL DAN PEMBAHASAN .................................................... 46
4.1 Spesifikasi Sistem ........................................................................ 46
4.2 Implementasi Sistem.................................................................... 46
4.2.1 Pengujian Sistem................................................................. 47
4.2.2 Hasil Clustering ................................................................... 69
4.2.3 Denah Tata Letak Awal dan Setelah Clustering ................... 71
BAB 5. KESIMPULAN DAN SARAN .................................................... 74
5.1 Kesimpulan ................................................................................. 74
5.2 Saran ........................................................................................... 74
DAFTAR PUSTAKA ................................................................................... 75
xi
DAFTAR GAMBAR
Halaman
2.1 Struktur Organisasi Swalayan Larisso Ambulu ........................................ 4
2.2 Kajian Umum Data Mining ..................................................................... 7
2.3 Tahapan Data Mning ............................................................................... 8
3.1 Contoh Struk Belanja .............................................................................. 19
3.2 Flowchart Sistem..................................................................................... 43
3.3 Tampilan Praposes Data .......................................................................... 44
3.4 Tampilan Proses K-Means....................................................................... 44
3.5 Tampilan Hasil ........................................................................................ 45
3.6 Tampilan Sorting Kelompok ................................................................... 45
4.1 Tampilan Proses K-Means Parameter Produk Makanan Ringan............... 47
4.2 Tampilan Hasil Pengujian Parameter Produk Makanan Ringan ............... 48
4.3 Tampilan Hasil Sorting Kelompok Parameter Produk Makanan Ringan... 49
4.4 Tampilan Proses K-Means Parameter Produk Minuman .......................... 50
4.5 Tampilan Hasil Pengujian Parameter Produk Minuman ........................... 51
4.6 Tampilan Hasil Sorting Kelompok Parameter Produk Minuman .............. 51
4.7 Tampilan Proses K-Means Parameter Produk Buah-buahan .................... 52
4.8 Tampilan Hasil Pengujian Parameter Produk Buah-buahan ..................... 53
4.9 Tampilan Hasil Sorting Kelompok Parameter Produk Buah-buahan ........ 54
4.10 Tampilan Proses K-Means Parameter Produk Perawatan ....................... 55
4.11 Tampilan Hasil Pengujian Parameter Produk Perawatan ........................ 56
4.12 Tampilan Hasil Sorting Kelompok Parameter Produk Perawatan ........... 56
4.13 Tampilan Proses K-Means Parameter Produk Bahan Dapur ................... 57
4.14 Tampilan Hasil Pengujian Parameter Produk Bahan Dapur ................... 58
4.15 Tampilan Hasil Sorting Kelompok Parameter Produk Bahan Dapur ...... 59
4.16 Tampilan Proses K-Means Parameter Produk Bahan Makanan .............. 60
4.17 Tampilan Hasil Pengujian Parameter Produk Bahan Makanan ............... 61
4.18 Tampilan Hasil Sorting Kelompok Parameter Produk Bahan Makanan .. 61
4.19 Tampilan Hasil Proses K-Means Produk Perlengkapan.......................... 62
4.20 Tampilan Hasil Pengujian Parameter Produk Perlengkapan ................... 63
xii
4.21 Tampilan Hasil Sorting Kelompok Parameter Produk Perlengkapan ...... 64
4.22 Tampilan Proses K-Means Parameter Produk Obat-obatan .................... 65
4.23 Tampilan Hasil Pengujian Parameter Produk Obat-obatan ..................... 66
4.24 Tampilan Hasil Sorting Kelompok Parameter Produk Obat-obatan ........ 66
4.25 Tampilan Proses K-Means Parameter Produk Rokok ............................. 67
4.26 Tampilan Hasil Pengujian Parameter Produk Rokok.............................. 68
4.27 Tampilan Hasil Sorting Kelompok Parameter Produk Rokok................. 69
4.28 Denah Tata Letak Awal Produk ............................................................. 71
4.29 Denah Tata Letak Merk Produk Setelah Clustering ............................... 71
xiii
DAFTAR TABEL
Halaman
3.1 Dataset Merk Produk............................................................................... 21
3.2 Dataset Penentuan Jenis Produk .............................................................. 24
3.3 Dataset Yang Telah di Cleaning .............................................................. 26
3.4 Centroid Produk Makanan Ringan .......................................................... 27
3.5 Centroid Produk Minuman ...................................................................... 27
3.6 Centroid Produk Buah-buahan ................................................................ 27
3.7 Centroid Produk Perawatan..................................................................... 28
3.8 Centroid Produk Bahan Dapur ................................................................ 28
3.9 Centroid Produk Bahan Makanan ........................................................... 28
3.10 Centroid Produk Perlengkapan .............................................................. 29
3.11 Centroid Produk Obat-obatan ................................................................ 29
3.12 Centroid Produk Rokok......................................................................... 29
3.13 Hasil Penghitungan Jarak Dengan Paramater Produk Makanan Ringan
Masing-Masing cluster............................................................................. 30
3.14 Hasil Penghitungan Jarak Dengan Paramater Produk Minuman
Masing-Masing cluster............................................................................. 31
3.15 Hasil Penghitungan Jarak Dengan Paramater Produk Buah-buahan
Masing-Masing cluster............................................................................. 32
3.16 Hasil Penghitungan Jarak Dengan Paramater Produk Perawatan
Masing-Masing cluster............................................................................. 33
3.17 Hasil Penghitungan Jarak Dengan Paramater Produk Bahan Dapur
Masing-Masing cluster............................................................................. 34
3.18 Hasil Penghitungan Jarak Dengan Paramater Produk Bahan Makanan
Masing-Masing cluster............................................................................. 35
3.19 Hasil Penghitungan Jarak Dengan Paramater Produk Perlengkapan
Masing-Masing cluster............................................................................. 36
3.20 Hasil Penghitungan Jarak Dengan Paramater Produk Obat-obatan
Masing-Masing cluster............................................................................. 37
3.21 Hasil Penghitungan Jarak Dengan Paramater Produk Rokok
xiv
Masing-Masing cluster............................................................................. 38
3.22 Anggota Data Masing-Masing Cluster Produk Makanan Ringan ........... 38
3.23 Anggota Data Masing-Masing Cluster Produk Minuman ....................... 39
3.24 Anggota Data Masing-Masing Cluster Produk Buah-buahan ................. 39
3.25 Anggota Data Masing-Masing Cluster Produk Perawatan ...................... 40
3.26 Anggota Data Masing-Masing Cluster Produk Bahan Dapur ................. 40
3.27 Anggota Data Masing-Masing Cluster Produk Bahan Makanan ............. 41
3.28 Anggota Data Masing-Masing Cluster Produk Perlengkapan ................. 41
3.29 Anggota Data Masing-Masing Cluster Produk Obat-obatan ................... 42
3.30 Anggota Data Masing-Masing Cluster Produk Rokok ........................... 42
4.1 Hasil Clustering ...................................................................................... 70
xv
DAFTAR LAMPIRAN
Halaman
Biodata Penulis ............................................................................................. 77
xvi
BAB I
PENDAHULUAN
Seiring dengan pertumbuhan ekonomi Indonesia yang maju dan berkembang pesat
khususnya di kota besar maupun kota kecil, telah terjadi perubahan diberbagai sektor,
termasuk dibidang industri dan produksi serta pada kegiatan eceran di Indonesia yang telah
berkembang menjadi usaha yang berskala besar. Perkembangan bisnis eceran yang pesat ini
tidak lepas dari faktor meningkatnya jumlah penduduk Indonesia dan juga meningkatkan
jumlah pendapatan perkapita penduduk Indonesia yang menyebabkan taraf hidup masyarakat
Indonesia semakin meningkat. Hal ini membawa dampak kepada pola perilaku belanja
seseorang, dimana semakin meningkatnya taraf hidup seseorang maka tuntutan akan tempat
berbelanja yang nyaman dan dapat menyediakan segala kebutuhan konsumen dalam satu
lokasi semakin dibutuhkan. Swalayan adalah salah satu tempat berbelanja yang dapat
memberikan kenyamanan, kebersihan, kecepatan dan kerapian produk untuk konsumennya.
Banyak konsumen yang lebih memilih berbelanja di swalayan daripada di pasar
tradisional, alasannya swalayan dapat memberikan kenyamanan dan kerapian dalam
berbelanja. Namun tidak sedikit dari para konsumen yang mengeluhkan tentang kerapian
merk produk pada swalayan, dimana tata letak merk produknya tidak strategis dan tepat,
sehingga membuat konsumen sulit untuk mendapatkan merk produk yang mereka butuhkan,
juga akan menghabiskan waktu yang cukup lama hanya untuk menemukan merk produk
tersebut. Tata letak merk produk yang strategis dan tepat dalam penataanya akan lebih mudah
dijangkau oleh konsumen dan tidak akan menghabiskan waktu. Untuk itu perlu dibuat sebuah
sistem yang dapat menentukan pola tata letak merk produk pada swalayan, yaitu dengan
dibuatnya suatu teknik clustering.
Dari beberapa teknik clustering yang paling sederhana dan umum dikenal adalah
clustering K-Means (Santosa, 2007). K-Means merupakan salah satu metode data clustering
non hirarki yang mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik
yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai
karakteristik yang berbeda dikelompokkan ke dalam kelompok lain (Agusta, 2007).
1
Berdasarkan uraian diatas, penulis berkeinginan untuk membuat suatu implementasi
algoritma K-Means Clustering untuk menentukan tata letak merk produk berdasarkan jenis
produk di swalayan Larisso Ambulu - Jember.
Berdasarkan uraian diatas, perumusan masalah dalam Tugas Akhir ini, yaitu
bagaimana mengimplementasikan algoritma K-Means Clustering untuk menentukan tata letak
merk produk berdasarkan jenis produk di swalayan Larisso Ambulu – Jember.
Batasan masalah dari Tugas Akhir yang berjudul Implementasi algoritma K-Means
Clustering untuk menetukan tata letak merk produk berdasarkan jenis produk di swalayan
Larissso Ambulu - Jember , antara lain :
1. Data yang dianalisis adalah data struk, berisi merk produk yang diperoleh dari swalayan
Larisso di Ambulu – Jember dari bulan Januari - September 2014.
2. Algoritma yang digunakan adalah algortima K-Means Clustering.
3. Perancangan program menggunakan bahasa pemrograman VB.NET.
Manfaat dari penelitian ini adalah didapatkan sebuah model tata letak merk produk
berdasarkan jenis produk di swalayan Larisso Ambulu – Jember yang dapat memudahkan
2
bagi konsumen dalam menemukan merk produk yang dibutuhkan sehingga tidak
membutuhkan waktu lama untuk mencarinya
3
BAB II
TINJAUAN PUSTAKA
Supermarket atau pasar swalayan menurut Marwan Asri (1991 : 289) adalah salah satu
bentuk usaha eceran yang menyediakan beraneka macam kebutuhan konsumen. Satu
Supermarket mungkin menjual pakaian wanita, pria, anak-anak, alat rumah tangga, alat olah
raga, perhiasan serta alat rumah tangga lainnya dan alat tulis.
Swalayan adalah sebuah toko yang menjual segala kebutuhan sehari-hari. Barang-
barang yang dijual di swalayan biasanya adalah barang-barang kebutuhan sehari-hari. Seperti
bahan makanan, minuman dan barang kebutuhan seperti tissue dan sebagainya.
Biasanya setelah berbelanja di swalayan, konsumen akan menerima struk belanjaan
dari pihak swalayan. Struk belanja digunakan oleh swalayan untuk diberikan kepada
konsumen seberapa banyak produk yang dibeli serta jumlah harga produk per unitnya serta
total dari keseluruhannya. Struk belanja ini juga merupakan bukti transaksi konsumen kepada
swalayan terhadap produk-produk apa saja yang telah dibeli.
4
bahan kebutuhan lainnya, dimana pembeli mengambil sendiri barang yang dibutuhkan dari
rak-rak yang disediakan dan nantinya membayar dikasir dan akan mendapatkan struk belanja.
Di Swalayan Larisso Ambulu memiliki ± 70 Karyawan yang terdiri dari supervisor,
bagian keuangan, personalia, dan bagian gudang. Untuk Jam kerja di Swalayan Larisso yaitu
setiap hari senin – minggu mulai pukul 09.00 – 21.00.
Struktur organisasi di Swalayan Larisso Ambulu – Jember dapat digambarkan sebagai
berikut:
5
4. Pramuniaga : Melakukan kelancaran operasional counter seperti display barang,
mengisi barang yang telah kosong ataupun barang yang baru, dan
menjaga kebersihan area kerja, kebersihan dan kerapian barang.
5. Manajer Keuangan : Bertugas mengelola keuangan swalayan (penerimaan dan
pengeluaran keuangan) seperti penggajian karyawan.
6. Staf Administrasi : Melakukan kegiatan yang berhubungan dengan kegiatan
administrasi.
7. Kepala Kasir : Memonitoring kegiatan kasir setiap harinya dan membuat laporan
keuangan.
8. Kasir : Melayani pembayaran konsumen setiap hari dan bertanggung jawab terhadap
uang setoran.
9. Personalia / umum : Melakukan kegiatan umum seperti mencatat kehadiran dan
lembur kerja karyawan, menyediakan dan mengatur jumlah tenaga kerja yang
dibutuhkan swalayan.
10. Divisi Teknik / Maintenence : Bertanggung jawab terhadap kelancaran operasional
swalayan.
11. Satpam : Bertugas menjaga keamanan swalayan.
12. Cleaning Service : Bertugas membersihkan seluruh ruangan yang ada di swalayan.
13. Kepala Gudang : Menerima barang baik dari supplier, mengecek jumlah barang yang
dikirim dan disesuaikan dengan dokumen, mengecek kebersihan dan keamanan barang
yang ada, dan mengeluarkan barang yang dibutuhkan oleh swalayan.
14. Staf Bag.EDP : Bertugas mengawasi dan melakukan kegiatan Electronic Data
Processing yaitu memasukkan atau menginput data barang-barang baru dan perubahan
harga, memasukkan data jadwal promosi berkaitan dengan barang yang dijual, serta
merapikan ulang data yang ada dikomputer.
Tata letak adalah suatu rancangan fasilitas, menganalisis, membentuk konsep, dan
mewujudkan sistem pembuatan barang atau jasa. Rancangan ini pada umumnya digambarkan
sebagai rancangan lantai, yaitu satu susunan fasilitas fisik (perlengkapan, tanah, bangunan,
dan sarana lain) untuk mengoptimalkan hubungan antara petugas pelaksana, aliran barang,
6
aliran informasi, dan tata cara yang diperlukan untuk mencapai tujuan usaha secara ekonomis
dan aman.
Tata letak merupakan satu keputusan penting yang menentukan efisiensi sebuah
operasi dalam jangka panjang. Tata letak memiliki banyak dampak strategis karena tata letak
menentukan daya saing perusahaan dalam kapasitas, proses, fleksibilitas, dan biaya, serta
kualitas lingkungan kerja, kontak pelangga, dan citra perusahaan. Tata letak yang efektif
dapat membantu organisasi mencapai sebuah strategi yang menunjang diferensiasi, biaya
rendah, atau respon cepat. Tujuan strategi tata letak adalah untuk membangun tata letak yang
ekonomis yang memenuhi kebutuhan persaingan perusahaan.
Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut
diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga
dari sejumlah besar material dasar. Karena itu data mining sebenarnya memiliki akar yang
panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning,
statistik dan database. Dengan arti lain data mining adalah proses untuk penggalian pola-pola
dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut
menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran,
pengawasan, penipuan deteksi dan penemuan ilmiah. Data mining telah digunakan selama
bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti
catatan perjalanan penumpang penerbangan, data sensus dan supermarket scanner data untuk
menghasilkan laporan riset pasar.
Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis
koleksi pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui
keterkaitan. Fakta yang tak terelakkan data mining adalah bahwa subset/set data yang
dianalisis mungkin tidak mewakili seluruh domain, dan karenanya tidak boleh berisi contoh-
contoh hubungan kritis tertentu dan perilaku yang ada di bagian lain dari domain . Untuk
mengatasi masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan
dan pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia. Dalam
7
situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama sekali,
selama konstruksi desain eksperimental.
Beberapa teknik yang sering disebut-sebut dalam literatur data mining dalam
penerapannya antara lain: clustering, classification, association rule mining, neural network,
genetic algorithm dan lain-lain. Yang membedakan persepsi terhadap data mining adalah
perkembangan teknik-teknik data mining untuk aplikasi pada database skala besar. Sebelum
populernya data mining, teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil
saja.
Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual (Moertini,
2002). Secara umum data mining memiliki beberapa kajian. Seperti yang dapat dilihat pada
Gambar 2.2, data mining merupakan pusat dari beberapa kajian. Diantaranya adalah estimasi,
seleksi variabel, clustering, visualisasi, market basket analysis dan klasifikasi. Semua kajian
tersebut termasuk ke dalam data mining.
8
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
2. Data yang akan diproses berupa data yang sangat besar.
3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin
memberikan indikasi yang bermanfaat.
Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih
objek dalam satu dimensi yang sama. Misalnya dalam dimensi produk dapat melihat
keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu, hubungan juga dapat
dilihat antara dua atau lebih atribut dan dua atau lebih objek (Ponniah, 2001). Masalah-
masalah yang sesuai untuk diselesaikan dengan teknik data mining dapat dicirikan dengan
(Piatetsky & Shapiro, 2006):
1. Memerlukan keputusan yang bersifat knowledge-based.
2. Mempunyai lingkungan yang berubah.
3. Metode yang ada sekarang bersifat sub-optimal.
4. Tersedia data yang bisa diakses, cukup dan relevan.
5. Memberikan keuntungan yang tinggi jika keputusan yang diambil tepat.
Kata mining mempunyai arti yaitu usaha untuk mendapatkan sedikit barang berharga
dari sejumlah besar material dasar. Data mining memiliki akar yang panjang dari bidang ilmu
seperti kecerdasan buatan (artificial intelegent), machine learning, statistik dan database.
Beberapa metode yang sering disebut-sebut dalam literatur data mining antara lain clustering,
classification, association rules mining, neural network, genetic algorithm dan lain-lain
(Moertini, 2002).
Di dalam tahapan data mining, data yang ada, tidak dapat langsung diolah dengan
menggunakan sistem data mining. Data tersebut harus dipersiapkan terlebih dahulu agar hasil
yang diperoleh dapat lebih maksimal, dan waktu komputasinya lebih minimal. Proses
persiapan data ini sendiri dapat mencapai 60 % dari keseluruhan proses dalam data mining.
Proses data mining secara garis besar terdiri dari 5 tahapan yaitu data selection, pre-
processing/cleaning, transformation, data mining dan interpretation/evaluation. Proses data
mining digambarkan pada Gambar 2.3 berikut:
9
Gambar 2.3 Tahapan Data Mining
(Sumber : Fayyad 1996)
Berikut ini merupakan tahapan dari proses data mining (Fayyad, 1996):
1. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum
tahap penggalian informasi dalam data mining dimulai. Data hasil seleksi yang akan
digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data
operasional.
2. Pre-processing/Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada
data yang menjadi fokus. Proses cleaning mencakup antara lain membuang duplikasi data,
memeriksa data yang inkonsisten dan memperbaiki kesalahan pada data, seperti kesalahan
cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang
sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk data mining,
seperti data atau informasi eksternal.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut
sesuai untuk proses data mining. Proses coding dalam data mining merupakan proses
kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis
data.
4. Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih
dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam
10
data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat
bergantung pada tujuan dan proses data mining secara keseluruhan.
5. Interpretation/Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam
bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan
bagian dari proses data mining yang disebut interpretation. Tahap ini mencakup
pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau
hipotesis yang ada sebelumnya.
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat
dilakukan, yaitu (Larose, 2005):
1. Deskripsi
Terkadang penelitian analisis secara sederhana ingin mencoba mencari cara untuk
menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh,
petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta
bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan
presiden. Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan
penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah
numerik daripada ke arah kategori. Model dibangun menggunakan record lengkap yang
menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada
peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel
prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien
rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level
sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam
proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan
dapat digunakan untuk kasus baru lainnya.
11
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi
nilai dari hasil akan ada di masa datang. Contoh prediksi dalam bisnis dan penelitian
adalah:
1. Prediksi harga beras dalam tiga bulan yang akan datang.
2. Prediksi presentase kenaikan kecelekaan lalu lintas tahun depan jika batas
bawah kecepatan dinaikkan.
Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula
digunakan (untuk keadaan yang tepat) untuk prediksi.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan
pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan
sedang, dan pendapatan rendah.
Contoh lain klasifikasi dalam bisnis dan penelitian adalah :
1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau
bukan.
2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit
yang baik atau buruk.
3. Mendiagnosis penyakit seorang pasien untuk mendapatkan kategori penyakit apa.
5. Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan
dan membentuk kelas objek-objek yang memiliki kemiripan. Cluster adalah kumpulan
record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan
dengan record-record dalam cluster lain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam
pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi,
atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran
mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-
kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam satu
kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok
lain akan bernilai minimal.
Contoh pengklusteran dalam bisnis dan penelitian adalah:
12
1. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan
perilaku dari gen dalam jumlah besar.
2. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu
produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar.
3. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial
dalam baik dan mencurigakan.
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu
waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
Contoh asosiasi dalam bisnis dan penelitian adalah :
1. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang
tidak pernah dibeli secara bersamaan.
2. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan
untuk memberikan respons positif terhadap penawaran upgrade layanan yang
diberikan.
2.5 Clustering
Clustering adalah metode penganalisaan data, yang sering dimasukkan sebagai salah
satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data dengan
karakteristik yang sama ke suatu ‘wilayah’ yang sama dan data dengan karakteristik yang
berbeda ke ‘wilayah’ yang lain.
Ada beberapa pendekatan yang digunakan dalam mengembangkan metode clustering.
Dua pendekatan utama adalah clustering dengan pendekatan partisi dan clustering dengan
pendekatan hirarki. Clustering dengan pendekatan partisi atau sering disebut
dengan partition-based clustering mengelompokkan data dengan memilah-milah data yang
dianalisa ke dalam cluster-cluster yang ada.
Clustering dengan pendekatan hirarki atau sering disebut dengan hierarchical
clustering mengelompokkan data dengan membuat suatu hirarki berupa dendogram dimana
data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki
yang berjauhan. Di samping kedua pendekatan tersebut, ada juga clustering dengan
pendekatan automatic mapping (Self – Organising Map/SOM).
13
Clustering (pengelompokan data) mempertimbangkan sebuah pendekatan penting
untuk mencari kesamaan dalam data dan menempatkan data yang sama ke dalam kelompok-
kelompok. Clustering membagi kumpulan data ke dalam beberapa kelompok dimana
kesamaan dalam sebuah kelompok adalah lebih besar daripada diantara kelompok-kelompok
yang lain (Rui Xu & Donald 2009). Gagasan mengenai pengelompokan data, atau clustering,
memiliki sifat yang sederhana dan dekat dengan cara berpikir manusia kapanpun kepada kita
dipresentasikan jumlah data yang besar, kita biasanya cenderung merangkumkan jumlah data
yang besar ini ke dalam sejumlah kecil kelompok-kelompok atau kategori-kategori untuk
memfasilitasi analisanya lebih lanjut. Selain dari itu, sebagian besar data yang dikumpulkan
dalam banyak masalah terlihat memiliki beberapa sifat yang melekat yang mengalami
pengelompokan-pengelompokan natural (Hammouda & Karray, 2003).
Namun demikian, penemuan pengelompokan-pengelompokan ini atau upaya untuk
mengkategorikan data adalah bukan sebuah tugas yang sederhana bagi manusia kecuali data
memiliki dimensionalitas rendah (dua atau tiga dimensi paling banyak). Inilah sebabnya
mengapa beberapa metode dalam soft computing telah dikemukakan untuk menyelesaikan
jenis masalah ini. Metode ini disebut “Metode-Metode Pengelompokan Data” (Hammouda &
Karray, 2003).
Algoritma-algoritma clustering digunakan secara ekstensif tidak hanya untuk
mengorganisasikan dan mengkategorikan data, akan tetapi juga sangat bermanfaat untuk
kompresi data dan konstruksi model. Melalui pencarian kesamaan dalam data, seseorang
dapat merepresentasikan data yang sama dengan lebih sedikit simbol. Dan juga, jika kita
dapat menemukan kelompok-kelompok data, kita dapat membangun sebuah model masalah
berdasarkan pengelompokan-pengelompokan ini (Dubes & Jain, 1988).
Clustering menunjuk pada pengelompokan record, observasi-observasi, atau kasus-
kasus ke dalam kelas-kelas objek yang sama. Cluster adalah sekumpulan record yang sama
dengan satu sama lain dan tidak sama dengan record dalam cluster lain. Clustering berbeda
dari klasifikasi dimana tidak ada variabel target untuk clustering. Tugas clustering mencoba
untuk tidak mengklasifikasikan, mengestimasi, atau memprediksi nilai variabel target (Larose,
2005). Bahkan, algoritma clustering berusaha mensegmentasikan seluruh kumpulan data ke
dalam subkelompok-subkelompok atau cluster-cluster homogen secara relatif. Dimana
kesamaan record dalam cluster dimaksimalkan dan kesamaan dengan record diluar cluster ini
diminimalkan.
14
Clustering sering dilaksanakan sebagai langkah pendahuluan dalam proses
pengumpulan data, dengan cluster-cluster yang dihasilkan digunakan sebagai input lebih
lanjut ke dalam sebuah teknik yang berbeda, seperti neural network. Karena ukuran yang
besar dari banyak database yang dipresentasikan saat ini, dapat membantu untuk
menggunakan analisa clustering terlebih dahulu, untuk mengurangi ruang pencarian untuk
algoritma-algoritma downstream. Aktivitas clustering pola khusus meliputi langkah-langkah
berikut (Dubes & Jain, 1988) :
1. Representasi pola (secara opsional termasuk ekstraksi dan/atau seleksi sifat.
2. Defenisi ukuran kedekatan pola yang tepat untuk domain data.
3. Clustering pengelompokan.
4. Penarikan data (jika dibutuhkan).
5. Pengkajian output (jika dibutuhkan).
Representasi pola merujuk pada jumlah kelas, jumlah pola-pola yang ada, dan jumlah,
tipe dan skala fitur yang tersedia untuk algoritma clustering. Beberapa informasi ini dapat
tidak bisa dikontrol oleh praktisioner. Seleksi sifat (fitur) adalah proses pengidentifikasian
subset fitur original yang paling efektif untuk digunakan dalam clustering. Ekstraksi fitur
adalah penggunaan satu atau lebih transformasi dari sifat-sifat input untuk menghasilkan sifat-
sifat baru yang lebih baik.
Secara garis besar, terdapat beberapa metode clustering data. Pemilihan metode
clustering bergantung pada tipe data dan tujuan clustering itu sendiri. Metode-metode beserta
algortima yang termasuk didalamnya adalah sebagai berikut:
1. Partitioning Methdos
Metode yang membangun berbagai partisi dan kemudian mengevaluasi partisi tersebut
dengan beberapa kriteria. Algoritma yang dipakai pada metode ini adalah K-Means, K-
Medoid, PROCLUS, CLARA, CLARANS dan PAM.
2. Hierarchical Methods
Metode yang membuat suatu penguraian secara hierarchical dari himpunan data
dengan menggunakan beberapa kriteria. Metode ini terdiri atas dua jenis, yaitu
Agglomerative yang menggunakan strategi bottom-up dan Disisive yang menggunakan
strategi top-down. Metode ini meliputi algoritma BIRCH, AGNES, DIANA, CURE dan
CHAMELEON.
15
3. Density-Based Methods
Metode ini berdasarkan konektivitas dan fungsi densitas. Metode ini meliputi
algoritma DBSCAN, OPTICS dan DENCLU.
4. Grid-Based Methods
Metode ini berdasarkan suatu struktur granularitas multi-level. Metode clustering ini
meliputi algoritma STING, WaveCluster dan CLIQUE.
5. Model-Based Methods
Suatu model dihipotesakan untuk masing-masing cluster dan ide untuk mencari best
fit dari model tersebut untuk masing-masing yang lain. Metode clustering ini meliputi
pendekatan statistik, yaitu algoritma COBWEB dan jaringan syaraf tiruan SOM.
Partitioning Clustering merupakan salah satu metode data mining yang bersifat tanpa
arahan (unsupervised). Konsep dasar dari partitioning clustering adalah membagi n jumlah
cluster ke dalam k cluster. Metode ini merupakan metode pengelompokan yang bertujuan
mengelompokkan objek sehingga jarak antara setiap objek ke pusat kelompok di dalam satu
kelompok adalah minimum.
Metode Pengelompokan :
Cluster adalah kumpulan data dimana jika objek data yang terletak didalam cluster
harus memiliki kemiripan sedangkan yang tidak berada dalam suatu cluster tidak mempunyai
kemiripan.
Jika ada n objek penelitian dengan p variabel maka sebelum dilakukan
pengelompokan data atau objek terlebih dahulu menentukan ukuran kedekatan sifat antar
data. Ukuran data yang bisa digunakan adalah jarak euclidius (euclidean distance), antara dua
objek dari p dimensi pengamatan. Jika objek pertama yang diamati adalah 𝑥= 𝑥1 ,𝑥2,…,𝑥𝑝
dan 𝑦= 𝑦1 ,𝑦2,…,𝑦𝑝 maka rumus euclidean distance adalah sebagai berikut:
(2.1)
16
dimana:
d : distance
x : 𝑥1,𝑥2,𝑥3,…,𝑥𝑝
y : 𝑦1,𝑦2,𝑦3,…,𝑦𝑝
j : merepresentasikan nilai atribut
p : dimensi data
K-Means (MacQueen, 1967) adalah salah satu dari algoritma unsupervised learning
yang paling sederhana untuk menyelesaikan masalah clustering yang telah dikenal. Prosedur
ini mengikuti cara sederhana dan mudah untuk mengklasifikasikan kumpulan data tertentu
melalui jumlah cluster tertentu (menganggap k cluster) yang telah ditetapkan sebelumnya.
Dari beberapa teknik clustering yang paling sederhana dan umum dikenal adalah
clustering k-means (Santosa, 2007). K-Means merupakan salah satu metode data clustering
non hirarki yang mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik
yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai
karakteristik yang berbeda dikelompokkan ke dalam kelompok lain (Agusta, 2007). Adapun
tujuan dari data clustering ini adalah untuk meminimalisasikan objective function yang diset
dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam
suatu cluster dan memaksimalkan variasi antar cluster.
Pada dasarnya penggunaan algoritma dalam melakukan proses clustering tergantung
dari data yang ada dan konklusi yang ingin dicapai. Untuk itu digunakan algoritma K-Means
yang didalamnya memuat aturan sebagai berikut:
1. Jumlah cluster perlu diinputkan.
2. Hanya memiliki atribut bertipe numerik.
Untuk tahapannya, algoritma k-means memilih secara acak k buah data sebagai
centroid. Kemudian, jarak antara data dan centroid dihitung dengan menggunakan Euclidean
Distance. Data dikelompokkan dalam cluster yang terkecil / berdasarkan jarak minimum
dihitung dari titik semua cluster.
17
Algoritma K-Means pada dasarnya melakukan dua proses, yaitu proses pendeteksian
lokasi pusat tiap cluster dan proses pencarian anggota dari tiap-tiap cluster. Cara kerja
algoritma K-Means:
1. Tentukan k sebagai jumlah cluster yang ingin dibentuk.
2. Bangkitkan k centroid (titik pusat cluster) secara random.
3. Hitung jarak setiap data ke masing-masing centroid.
4. Kelompokkan masing-masing objek ke dalam cluster berdasarkan jarak
minimum.
Microsoft Visual Basic. NET adalah sebuah alat untuk mengembangkan dan
membangun aplikasi yang bergerak diatas sistem NET Framework, dengan menggunakan
bahasa basic. Dengan menggunakan alat ini, para programmer dapat membangun aplikasi
windows form, aplikasi web berbasis ASP.NET, dan juga aplikasi command-line.
Alat ini dapat diperoleh secara terpisah dari beberapa produk lainnya (seperti
Microsoft Visual C++, Visual C#, atau Visual J#) atau juga dapat diperoleh secara terpadu
dalam Microsoft Visual Studio.NET. Bahasa Visual Basic.NET sendiri menganut paradigma
bahasa pemrograman berorientasi objek yang dapat dilihat sebagai evolusi dari Microsoft
Visual Basic versi sebelumnya yang diimplementasikan diatas .NET Framework.
NET Framework adalah landasan kerja bagi aplikasi – aplikasi net yang dibuat dalam
bahasa pemrograman berbasis net tanpa terpengaruh oleh bahasa pemrograman yang
digunakan didalam NET Framework ini karena semua coding yang telah dikembangkan
dalam programmer akan dieksekusi berdasarkan urutan-urutan proses bekerja yang saling
melengkapi.
Komponen – komponen pada NET.Framework adalah :
1. Common Language Runtime
Merupakan jembatan antara aplikasi net dengan sistem operasi.
2. Microsoft Intermediate Language
Merupakan bahasa program yang tidak diterjemahkan langsung kedalam bahsa biner
namun terlebih dahulu di terjemahkan kedalam bahasa Common Language Runtime
18
kemudian diterjemahkan kembali kedalam bahasa Microsoft Intermediate Language yang
baru akhirnya menghasilkan bahasa biner yang siap dijalankan.
3. Just in Time Complier
Just in Time Complier hanya melakukan komplikasi kode yang hanya dibutuhkan saja
sehingga lebih efisien.
4. Framework Class Library
Merupakan kumpulan class – class yang berjumlah ribuan didalam NET Framework.
Microsoft Visual Basic.NET terdiri dari 5 komponen utama yang tersusun dalam tiga lapisan
(layer) yaitu :
1. Visual Studio.NET
Microsoft Visual Studio.NET merupakan kumpulan perkembangan tools untuk
membangun aplikasi Web ASP, Xml Web Service, Aplikasi desktop dan Aplikasi Mobile.
Pada Aplikasi Visual Studio.NET ini bahasa-bahsa pemrograman yang digunakan seperti
Visual Basic, Visual C ++, dan Visual C.
2. Visual Basic.NET (VB NET)
Merupakan salah satu bahasa pemrograman yang bisa digunakan untuk membangun
aplikasi – apliaksi NET di Platform.
3. IDE Visual Basic
IDE (Integrated Development Environment) adalah perangkat lunak komputer yang
berfungsi untuk membantu pemrograman dalam mengembangkan perangkat lunak (tools
pendukung).
19
BAB III
METODOLOGI PENELITIAN
Pada penelitian ini data yang digunakan adalah dataset yang bertipe record,
berupa data struk belanja yang berisi merk produk pada swalayan Larisso di Ambulu –
Jember yang diperoleh mulai bulan Januari s/d September 2014. Data awal yang didapat
yaitu berupa data mentah sebanyak 16 struk belanja (120 dataset). Pada Gambar 3.1 dapat
dilihat salah satu contoh dari struk belanja. Data mentah tersebut akan diubah kedalam
bentuk record yang akan menjadi dataset sebanyak 16 record. Dataset ini terdiri dari 7
atribut. Adapun atribut-atribut yang dimaksud yaitu kode produk, nama produk, jumlah
produk, harga produk, total harga, tunai dan kembalian. Seluruh atribut pada dataset
selanjutnya akan diseleksi pada tahapan praproses data.
Tahap praproses data merupakan tahap seleksi data yang bertujuan untuk
mendapatkan data yang bersih dan siap untuk digunakan dalam penelitian. Tahapan yang
dikerjakan adalah menentukan kelompok jenis produk dan menentukan kelompok
berdasarkan record dengan tujuan untuk mempermudah pemahaman terhadap isi record. Dan
juga melakukan seleksi dengan memperhatikan konsistensi data, missing value dan redundant
data.
Seperti yang dapat dilihat pada Gambar 3.1, terdapat beberapa atribut yaitu kode
produk, nama produk, jumlah produk, harga produk, total harga, tunai dan kembalian. Dari
semua atribut tersebut hanya beberapa yang akan digunakan dan dianggap cukup memenuhi
untuk dilakukannya penelitian. Adapun atribut tersebut yaitu nama produk dan jumlah
produk.
20
Gambar 3.1 Contoh Struk Belanja
Pada swalayan banyak sekali terdapat nama-nama produk ataupun merk-merk produk
yang tidak bisa disebutkan satu-satu. Mulai dari jenis produk sampai kegunaan produk
tersebut. Oleh karena itu penulis akan membuat pengelompokkan produk berdasarkan jenis-
jenisnya. Adapun pengelompokkan jenis produk sebagai berikut:
1. Makanan Ringan
Disini semua jenis makanan ringan seperti Salt Chesee, Krupuk, Permen, Koko
Krunch, Oreo dan lain-lain akan dikelompokkan ke dalam atribut makanan ringan.
2. Minuman
Semua jenis minuman mulai dari minuman botol, minuman kaleng, sirup dan juga
termasuk semua jenis susu dikelompokkan ke dalam atribut minuman.
3. Buah-buahan
Atribut ini berisi semua jenis buah-buahan.
21
4. Perawatan
Yang termasuk pada atribut ini yaitu perawatan rambut seperti shampoo, conditioner,
vitamin rambut dan lain-lain. Perawatan kulit seperti lotion, lulur, dan lain-lain.
Perawatan mandi atau peralatan mandi seperti sabun, sikat gigi, pasta gigi dan lain-lain.
5. Bahan Dapur
Bahan dapur seperti semua jenis indomie. Bumbu-bumbu dapur seperti kecap,
saos/sambal, merica, sasa, sajiku nasigoreng, gula, garam dan lain-lain dikelompokkan
ke dalam atribut bahan dapur.
6. Bahan Makanan
Semua jenis bahan makanan mulai dari sayur-sayuran, ayam, sarden, ikan, nugget dan
juga sossis termasuk ke dalam atribut bahan makanan.
7. Perlengkapan
Jenis produk yang termasuk pada atribut ini seperti pewangi baju, pewangi lantai, sabun
pencuci piring, pengharum ruangan, baygon dan lain-lain.
8. Obat-obatan
Segala jenis obat-obatan termasuk ke dalam atribut ini.
9. Rokok
Pada atribut ini berisi semua jenis rokok.
Tahap selanjutnya adalah mengubah data mentah (struk belanja) menjadi dataset
yang berisikan semua merk produk barang yang dibeli dalam bentuk record. Semua data
mentah merk produk barang sebanyak 16 struk belanja (120 dataset) dimasukkan dengan
jumlahnya dan kemudian dikelompokkan berdasarkan jenis produknya sehingga hasilnya
dapat dilihat pada Tabel 3.1 dan Tabel 3.2 berikut :
22
Tabel 3.1 Dataset Merk Produk
Struk Makanan Minu Buah- Pera Bahan Bahan Perleng Obat- Rokok
No Ke- Ringan man buahan watan Dapur Makanan kapan obatan
1 Struk 1 6 8 0 1 11 0 4 4 0
2 Struk 2 0 11 0 0 0 0 0 0 0
3 Struk 3 0 0 0 2 5 0 2 0 0
4 Struk 4 1 0 0 1 0 0 0 0 0
5 Struk 5 5 3 0 3 0 0 3 0 0
6 Struk 6 0 4 0 3 3 0 0 0 0
7 Struk 7 0 3 0 0 3 1 2 0 3
8 Struk 8 2 0 0 0 9 1 0 0 0
9 Struk 9 1 0 0 0 3 0 1 0 0
10 Struk 10 1 0 1 2 3 0 2 0 0
11 Struk 11 0 48 15 3 0 0 2 0 4
12 Struk 12 10 25 95 30 43 0 19 0 12
13 Struk 13 97 10 10 60 0 10 20 8 0
14 Struk 14 0 0 16 12 20 5 0 23 17
15 Struk 15 0 0 10 0 0 0 48 18 10
16 Struk 16 0 2 29 7 15 8 0 16 5
Dari tabel diatas dapat dilihat dataset berjumlah 16 record struk belanja dengan 9 jenis
produk. Dataset yang dimasukkan berupa merk produk apa saja yang dibeli dan berapa
jumlah merk produk yang dibeli oleh konsumen didalam satu struk kemudian di kelompokkan
berdasarkan jenis produknya.
26
3.3 Cleaning Data
Tahap selanjutnya adalah melakukan cleaning data terhadap data yang memiliki
missing value dan redundant data. Dikatakan missing value jika atribut- atribut dalam
dataset tidak berisi nilai atau kosong, sementara itu data dikatakan redundant jika
dalam satu dataset yang sama terdapat lebih dari satu record yang berisi nilai yang sama.
Pada dataset penjualan produk ini tidak banyak terdapat data yang missing value dan
redundant, jadi penulis melakukan pembersihan data seperti:
1. Dataset yang memiliki jumlah produk diatas 40 item.
Struk 11 0 48 15 3 0 0 2 0 4
Struk 12 10 25 95 30 43 0 19 0 12
Struk 13 97 10 10 60 0 10 20 8 0
Struk 15 0 0 10 0 0 0 48 18 10
27
Struk 6 0 4 0 3 3 0 0 0 0
Struk 8 2 0 0 0 9 1 0 0 0
Struk 9 1 0 0 0 3 0 1 0 0
Setelah dilakukannya tahapan cleaning data terhadap dataset, maka didapat hasil
akhir sebanyak 6 record dengan 9 jenis produk dan mempunyai isi data yang relevan yang
dapat dilihat pada Tabel 3.3 berikut:
Tabel 3.3 Dataset yang telah di cleaning
K-Means adalah salah satu metode data clustering non hirarki yang berusaha
mempartisi data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi
data ke dalam cluster sehingga data yang memiliki karakteristik yang sama
dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang
berbeda dikelompokkan ke dalam cluster yang lain.
Tahapan clustering dengan menggunakan K-Means dimulai dengan pembentukan
cluster dimana penulis di sini membagi cluster maksimal sesuai dengan jumlah dataset,
karena nantinya setiap cluster yang diinputkan dapat memilih data sheet untuk menentukan
nilai centroid akan tetapi dengan syarat nilai centroid tidak dapat muncul dengan nilai yang
sama. Kemudian dilakukan proses penghitungan jarak dari centroid dengan menggunakan
Euclidean Distance, di mana centroid diperoleh dari objek dataset yang telah diinputkan.
28
Adapun hasil dari centroid dari masing-masing cluster yang telah diinputkan ( misal
penginputan 3 cluster) berdasarkan pengelompokkan jenis produk dapat dilihat pada tabel
berikut ini.
1. Parameter Produk Makanan Ringan
Tabel 3.4 Centroid Produk Makanan Ringan
Cluster Centroid
C1 6
C2 5
C3 0
Cluster Centroid
C1 8
C2 3
C3 2
Cluster Centroid
C1 0
C2 16
C3 29
29
4. Parameter Produk Perawatan
Tabel 3.7 Centroid Produk Perawatan
Cluster Centroid
C1 1
C2 3
C3 2
Cluster Centroid
C1 11
C2 3
C3 20
Cluster Centroid
C1 1
C2 5
C3 8
30
7. Parameter Produk Perlengkapan
Tabel 3.10 Centroid Produk Perlengkapan
Cluster Centroid
C1 4
C2 3
C3 2
Cluster Centroid
C1 4
C2 23
C3 16
Cluster Centroid
C1 3
C2 17
C3 5
Setelah diketahui nilai centroid pada masing-masing cluster, tahap selanjutnya adalah
melakukan penghitungan untuk menentukan jarak setiap data dengan centroid yang telah
dibentuk dengan menggunakan rumus euclidiance distance. Hasil dari penghitungan jarak
dengan rumus euclidiance distance ini akan berpengaruh pada penempatan setiap merk
31
produk ke cluster tertentu. Setelah hasil dari jarak setiap data diperoleh tahapan selanjutnya
adalah mengelompokkan jarak data minimum atau terkecil dari masing-masing cluster
berdasarkan parameter jenis produknya.
Penghitungan jarak berdasarkan parameter produk antara jarak data terhadap nilai
centroid masing-masing cluster menggunakan rumus euclidiance distance (2.1) yaitu:
A. Parameter Produk Makanan Ringan
1. Jarak antara struk pertama dengan centroid pertama (C1)
2 Struk 5 1 0 5
3 Struk 7 6 5 0
4 Struk 10 5 4 1
5 Struk 14 6 5 0
6 Struk 16 6 5 0
32
B. Parameter Produk Minuman
1. Jarak antara struk pertama dengan centroid pertama (C1)
2 Struk 5 5 0 1
3 Struk 7 5 0 1
4 Struk 10 8 3 2
5 Struk 14 8 3 2
6 Struk 16 6 1 0
33
Penghitungan jarak data berdasarkan paramater produk buah - buahan dengan
centroid masing-masing cluster pada 6 record selanjutnya akan disajikan dalam bentuk Tabel
3.15 berikut :
Tabel 3.15 Hasil Penghitungan Jarak Dengan Paramater
Produk Buah - buahan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 16 29
2 Struk 5 0 16 29
3 Struk 7 0 16 29
4 Struk 10 0 16 29
5 Struk 14 16 0 13
6 Struk 16 29 13 0
34
Tabel 3.16 Hasil Penghitungan Jarak Dengan Paramater
Produk Perawatan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 2 1
2 Struk 5 2 0 1
3 Struk 7 1 3 2
4 Struk 10 1 1 0
5 Struk 14 11 9 10
6 Struk 16 6 4 5
35
Tabel 3.17 Hasil Penghitungan Jarak Dengan Paramater
Produk Bahan Dapur Masing-Masing cluster
Struk
No Ke- C1 C2 C3
1 Struk 1 0 8 9
2 Struk 5 11 3 20
3 Struk 7 8 0 17
4 Struk 10 8 0 17
5 Struk 14 9 17 0
6 Struk 16 4 12 5
36
Tabel 3.18 Hasil Penghitungan Jarak Dengan Paramater
Produk Bahan Makanan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 1 5 8
2 Struk 5 1 5 8
3 Struk 7 0 4 7
4 Struk 10 1 5 8
5 Struk 14 4 0 3
6 Struk 16 7 3 0
37
Tabel 3.19 Hasil Penghitungan Jarak Dengan Paramater
Produk Perlengkapan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 1 2
2 Struk 5 1 0 1
3 Struk 7 2 1 0
4 Struk 10 2 1 0
5 Struk 14 4 3 2
6 Struk 16 4 3 2
38
Tabel 3.20 Hasil Penghitungan Jarak Dengan Paramater
Produk Obat - obatan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 19 12
2 Struk 5 4 23 16
3 Struk 7 4 23 16
4 Struk 10 4 23 16
5 Struk 14 19 0 7
6 Struk 16 12 7 0
39
Tabel 3.21 Hasil Penghitungan Jarak Dengan Paramater
Produk Rokok Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 3 17 5
2 Struk 5 3 17 5
3 Struk 7 0 14 2
4 Struk 10 3 17 5
5 Struk 14 14 0 12
6 Struk 16 2 12 0
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
40
Tabel 3.23 Anggota Data Masing-Masing Cluster
Produk Minuman
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
No Struk Ke- C1 C2 C3
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
41
Tabel 3.25 Anggota Data Masing-Masing Cluster
Produk Perawatan
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
42
Tabel 3.27 Anggota Data Masing-Masing Cluster
Produk Bahan Makanan
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
43
Tabel 3.29 Anggota Data Masing-Masing Cluster
Produk Obat –obatan
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
Flowchart sistem dibuat untuk menggambarkan bagaimana proses alur keseluruhan sistem
bekerja. Flowchart sistem dapat dilihat pada Gambar 3.2 berikut:
44
START
CLEANING DATA
INPUT PER
PARAMETER
INPUT JUMLAH
CLUSTER K
KELOMPOKKAN OBJEK
DATA BERDASARKAN
JARAK MIINIMUN KE
CENTROID
END
45
3.5.2 Perancangan Tampilan Sistem
KATEGORI JUMLAH
DATASET PRODUK
TAMPILAN CLUSTER
46
3. Tampilan Hasil
TAMPILAN HASIL
HASIL HASIL
PERHITUNGAN PENGKLUSTERAN
CLUSTER
JUMLAH CLUSTER
47
BAB IV
Pada bab ini akan dibahas hasil yang diperoleh dari pengujian yang telah dilakukan.
Data – data yang telah diperoleh, akan diolah untuk mendapatkan hasil pengelompokan merk
produk berdasarkan jenis produk yang dibeli dengan menggunakan algoritma K-Means.
Implementasi aplikasi pengelompokan merk produk dengan algoritma K-Means ini dibuat
menggunakan bahasa pemograman Visual Basic .Net. Pengujian kinerja sistem yang telah
dilakukan dengan menggunakan algoritma K-Means, yaitu penyelesaian clustering dengan
menghasilkan merk produk berdasarkan jenis produk pada cluster-nya.
Inputan data berupa data struk yang berisi merk produk dari bulan Januari s/d
September tahun 2014. Sedangkan Output yang diperoleh berupa pengelompokan merk
produk berdasarkan jenis produknya.
48
4.2.1 Pengujian Sistem
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk makanan ringan
ada penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk makanan ringan. Setelah penginputan cluster tahapan selanjutnya adalah
menentukan nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 6, nilai
centroid C2 = 5, dan nilai centroid C3 = 0. Sehingga nanti akan dilakukan penghitungan dari
masing-masing merk produk makanan ringan dengan nilai centroid yang didapatkan
menggunakan rumus jarak euclidean distance (jarak kedekatan antar data). Hasil dari
penghitungan jarak dengan menggunakan rumus euclidean distance ini akan berpengaruh
pada penempatan setiap merk produk makanan ringan ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk makanan ringan.
49
Gambar 4.2 Tampilan Hasil Pengujian Parameter
Produk Makanan Ringan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk makanan ringan dengan centroid telah didapatkan
nilai masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai
cluster C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk
mengelompokkan merk produk makanan ringan, sehingga dapat diketahui pada cluster ke
berapa penempatan merk produknya. Hasil dari pengelompokkan cluster merk produk dapat
dilihat di interface sorting kelompok berdasarkan jenis produk makanan ringan.
50
Gambar 4.3 Tampilan Hasil Sorting Kelompok Parameter
Produk Makanan Ringan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk makanan ringan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk makanan ringan sebanyak 6 item yaitu
Salt Cheese, Hello Krupuk, Hello Stick Tahu, Butter Keju, Butter Coconut dan Yupi
Gumi.
2. Dalam cluster C2 terdapat jumlah merk produk makanan ringan sebanyak 5 item yaitu
oreo, gery salut, Nissin wafer, Fenesia wafer, dan Beng-beng.
3. Dalam cluster C3 terdapat jumlah merk produk makanan ringan sebanyak 1 item yaitu
Malkis Abon.
51
Gambar 4.4 Tampilan Proses K-Means Parameter
Produk Minuman
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk minuman ada
penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk minuman. Setelah penginputan cluster tahapan selanjutnya adalah menentukan
nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 8, nilai centroid C2 = 3,
dan nilai centroid C3 = 2. Sehingga nanti akan dilakukan penghitungan dari masing-masing
merk produk minuman dengan nilai centroid yang didapatkan menggunakan rumus jarak
euclidean distance (jarak kedekatan antar data). Hasil dari penghitungan jarak dengan
menggunakan rumus euclidean distance ini akan berpengaruh pada penempatan setiap merk
produk minuman ke cluster tertentu, yang nantinya akan dapat dilihat hasilnya di interface
hasil pengujian jenis produk minuman
52
Gambar 4.5 Tampilan Hasil Pengujian Parameter
Produk Minuman
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk minuman dengan centroid telah didapatkan nilai
masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai cluster
C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk mengelompokkan
merk produk minuman, sehingga dapat diketahui pada cluster ke berapa penempatan merk
produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat di interface sorting
kelompok berdasarkan jenis produk minuman.
53
Gambar 4.6 Tampilan Hasil Sorting Kelompok Parameter
Produk Minuman
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk minuman yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk minuman sebanyak 5 item yaitu Aqua
Botol, Pocari Sweat 900 ml, Pocari Sweat 500 ml, Sprite, dan Frestea.
2. Dalam cluster C2 terdapat jumlah merk produk minuman sebanyak 2 item yaitu Susu
Milo dan Zee Susu Bag.
3. Dalam cluster C3 terdapat jumlah merk produk minuman sebanyak 1 item yaitu
Energen.
54
Gambar 4.7 Tampilan Proses K-Means Parameter
Produk Buah-buahan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk buah-buahan
ada penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk buah-buahan. Setelah penginputan cluster tahapan selanjutnya adalah
menentukan nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 0, nilai
centroid C2 = 16, dan nilai centroid C3 = 29. Sehingga nanti akan dilakukan penghitungan
dari masing-masing merk produk buah-buahan dengan nilai centroid yang didapatkan
menggunakan rumus jarak euclidean distance (jarak kedekatan antar data). Hasil dari
penghitungan jarak dengan menggunakan rumus euclidean distance ini akan berpengaruh
pada penempatan setiap merk produk buah-buahan ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk buah-buahan.
55
Gambar 4.8 Tampilan Hasil Pengujian Parameter
Produk Buah-buahan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk buah-buahan dengan centroid telah didapatkan
nilai masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai
cluster C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk
mengelompokkan merk produk buah-buahan, sehingga dapat diketahui pada cluster ke berapa
penempatan merk produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat
di interface sorting kelompok berdasarkan jenis produk buah-buahan.
56
Gambar 4.9 Tampilan Hasil Sorting Kelompok Parameter
Produk Buah-buahan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk buah-buahan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk buah-buahan sebanyak 1 item yaitu
Melon.
2. Dalam cluster C2 terdapat jumlah merk produk buah-buahan sebanyak 2 item yaitu
Apel dan Kelengkeng.
3. Dalam cluster C3 terdapat jumlah merk produk buah-buahan sebanyak 1 item yaitu
Belimbing.
57
Gambar 4.10 Tampilan Proses K-Means Parameter
Produk Perawatan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk perawatan ada
penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk perawatan. Setelah penginputan cluster tahapan selanjutnya adalah menentukan
nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 1, nilai centroid C2 = 3,
dan nilai centroid C3 = 2. Sehingga nanti akan dilakukan penghitungan dari masing-masing
merk produk perawatan dengan nilai centroid yang didapatkan menggunakan rumus jarak
euclidean distance (jarak kedekatan antar data). Hasil dari penghitungan jarak dengan
menggunakan rumus euclidean distance ini akan berpengaruh pada penempatan setiap merk
produk perawatan ke cluster tertentu, yang nantinya akan dapat dilihat hasilnya di interface
hasil pengujian jenis produk perawatan.
58
Gambar 4.11 Tampilan Hasil Pengujian Parameter
Produk Perawatan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk perawatan dengan centroid telah didapatkan nilai
masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai cluster
C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk mengelompokkan
merk produk perawatan, sehingga dapat diketahui penempatan pada cluster ke berapa merk
produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat di interface sorting
kelompok berdasarkan jenis produk perawatan.
59
Gambar 4.12 Tampilan Hasil Sorting Kelompok Parameter
Produk Perawatan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk perawatan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk perawatan sebanyak 1 item yaitu Master
Kids.
2. Dalam cluster C2 terdapat jumlah merk produk perawatan sebanyak 3 item yaitu
Pepsodent, Lux, dan Lifebuoy.
3. Dalam cluster C3 terdapat jumlah merk produk perawatan sebanyak 1 item yaitu
Handbody Marina.
60
Gambar 4.13 Tampilan Proses K-Means Parameter
Produk Bahan Dapur
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk bahan dapur ada
penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk bahan dapur. Setelah penginputan cluster tahapan selanjutnya adalah
menentukan nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 11, nilai
centroid C2 = 3, dan nilai centroid C3 = 20. Sehingga nanti akan dilakukan penghitungan dari
masing-masing merk produk bahan dapur dengan nilai centroid yang didapatkan
menggunakan rumus jarak euclidean distance (jarak kedekatan antar data). Hasil dari
penghitungan jarak dengan menggunakan rumus euclidean distance ini akan berpengaruh
pada penempatan setiap merk produk bahan dapur ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk bahan dapur.
61
Gambar 4.14 Tampilan Hasil Pengujian Parameter
Produk Bahan Dapur
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk bahan dapur dengan centroid telah didapatkan nilai
masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai cluster
C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk mengelompokkan
merk produk bahan dapur, sehingga dapat diketahui pada cluster ke berapa penempatan merk
produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat di interface sorting
kelompok berdasarkan jenis bahan dapur.
62
Gambar 4.15 Tampilan Hasil Sorting Kelompok Parameter
Produk Bahan Dapur
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk bahan dapur yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk bahan dapur sebanyak 3 item yaitu
Gula, Royco Bumbu Tempe, dan Royco Bumbu Ayam.
2. Dalam cluster C2 terdapat jumlah merk produk bahan dapur sebanyak 2 item yaitu ABC
Saos dan ABC Sambal.
3. Dalam cluster C3 terdapat jumlah merk produk bahan dapur sebanyak 1 item yaitu
Indomie Goreng.
63
Gambar 4.16 Tampilan Proses K-Means Paramater
Produk Bahan Makanan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk bahan makanan
ada penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk bahan makanan. Setelah penginputan cluster tahapan selanjutnya adalah
menentukan nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 1, nilai
centroid C2 = 5, dan nilai centroid C3 = 8. Sehingga nanti akan dilakukan penghitungan dari
masing-masing merk produk bahan dapur dengan nilai centroid yang didapatkan
menggunakan rumus jarak euclidean distance (jarak kedekatan antar data). Hasil dari
penghitungan jarak dengan menggunakan rumus euclidean distance ini akan berpengaruh
pada penempatan setiap merk produk bahan makanan ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk bahan makanan.
64
Gambar 4.17 Tampilan Hasil Pengujian Parameter
Produk Bahan Makanan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk bahan makanan dengan centroid telah didapatkan
nilai masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai
cluster C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk
mengelompokkan merk produk bahan makanan, sehingga dapat diketahui pada cluster ke
berapa penempatan merk produknya. Hasil dari pengelompokkan cluster merk produk dapat
dilihat di interface sorting kelompok berdasarkan jenis bahan makanan.
65
Gambar 4.18 Tampilan Hasil Sorting Kelompok Parameter
Produk Bahan Makanan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk bahan makanan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk bahan makanan sebanyak 1 item yaitu
Cham Seafood.
2. Dalam cluster C2 terdapat jumlah merk produk bahan makanan sebanyak 1 item yaitu
Nugget.
3. Dalam cluster C3 terdapat jumlah merk produk bahan makanan sebanyak 1 item yaitu
Sarden.
66
Gambar 4.19 Tampilan Proses K-Means Parameter
Produk Perlengkapan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk bahan
perlengkapan ada penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang
didalamnya berisi merk produk bahan perlengkapan. Setelah penginputan cluster tahapan
selanjutnya adalah menentukan nilai centroid secara random, yaitu didapatkan nilai centroid
C1 = 4, nilai centroid C2 = 3, dan nilai centroid C3 = 2. Sehingga nanti akan dilakukan
penghitungan dari masing-masing merk produk bahan perlengkapan dengan nilai centroid
yang didapatkan menggunakan rumus jarak euclidean distance (jarak kedekatan antar data).
Hasil dari penghitungan jarak dengan menggunakan rumus euclidean distance ini akan
berpengaruh pada penempatan setiap merk produk bahan perlengkapan ke cluster tertentu,
yang nantinya akan dapat dilihat hasilnya di interface hasil pengujian jenis produk bahan
perlengkapan.
67
Gambar 4.20 Tampilan Hasil Pengujian Parameter
Produk Perlengkapan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk bahan perlengkapan dengan centroid telah
didapatkan nilai masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-
masing nilai cluster C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum
untuk mengelompokkan merk produk bahan perlengkapan, sehingga dapat diketahui pada
cluster ke berapa penempatan merk produknya. Hasil dari pengelompokkan cluster merk
produk dapat dilihat di interface sorting kelompok berdasarkan jenis bahan perlengkapan.
68
Gambar 4.21 Tampilan Hasil Sorting Kelompok Parameter
Produk Perlengkapan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk bahan perlengkapan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk perlengkapan sebanyak 3 item yaitu
Laurier Maxi, Hers Protex, dan Tissue.
2. Dalam cluster C2 terdapat jumlah merk produk perlengkapan sebanyak 2 item yaitu
Molto dan Softener.
3. Dalam cluster C3 terdapat jumlah merk produk perlengkapan sebanyak 1 item yaitu
Kayu Putih.
69
Gambar 4.22 Tampilan Proses K-Means Parameter
Produk Obat-obatan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk obat-obatan ada
penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk obat-obatan. Setelah penginputan cluster tahapan selanjutnya adalah
menentukan nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 4, nilai
centroid C2 = 23, dan nilai centroid C3 = 16. Sehingga nanti akan dilakukan penghitungan
dari masing-masing merk produk obat-obatan dengan nilai centroid yang didapatkan
menggunakan rumus jarak euclidean distance (jarak kedekatan antar data). Hasil dari
penghitungan jarak dengan menggunakan rumus euclidean distance ini akan berpengaruh
pada penempatan setiap merk produk obat-obatan ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk obat-obatan.
70
Gambar 4.23 Tampilan Hasil Pengujian Parameter
Produk Obat-obatan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk obat-obatan dengan centroid telah didapatkan nilai
masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai cluster
C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk mengelompokkan
merk produk obat-obatan, sehingga dapat diketahui pada cluster ke berapa penempatan merk
produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat di interface sorting
kelompok berdasarkan jenis obat-obatan.
71
Gambar 4.24 Tampilan Hasil Sorting Kelompok Parameter
Produk Obat-obatan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk obat-obatan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk perlengkapan sebanyak 1 item yaitu
Antimo Cair.
2. Dalam cluster C2 terdapat jumlah merk produk perlengkapan sebanyak 1 item yaitu
Panadol.
3. Dalam cluster C3 terdapat jumlah merk produk perlengkapan sebanyak 1 item yaitu
Bodrex.
72
Gambar 4.25 Tampilan Proses K-Means Parameter
Produk Rokok
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk rokok ada
penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk rokok. Setelah penginputan cluster tahapan selanjutnya adalah menentukan nilai
centroid secara random, yaitu didapatkan nilai centroid C1 = 3, nilai centroid C2 = 17, dan
nilai centroid C3 = 5. Sehingga nanti akan dilakukan penghitungan dari masing-masing merk
produk rokok dengan nilai centroid yang didapatkan menggunakan rumus jarak euclidean
distance (jarak kedekatan antar data). Hasil dari penghitungan jarak dengan menggunakan
rumus euclidean distance ini akan berpengaruh pada penempatan setiap merk produk rokok
cluster tertentu, yang nantinya akan dapat dilihat hasilnya di interface hasil pengujian jenis
produk rokok.
73
Gambar 4.26 Tampilan Hasil Pengujian Parameter
Produk Rokok
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk rokok dengan centroid telah didapatkan nilai
masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai cluster
C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk mengelompokkan
merk produk rokok, sehingga dapat diketahui pada cluster ke berapa penempatan merk
produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat di interface sorting
kelompok berdasarkan jenis rokok.
74
Gambar 4.27 Tampilan Hasil Sorting Kelompok Parameter
Produk Rokok
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk rokok yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk rokok sebanyak 1 item yaitu Wismilak.
2. Dalam cluster C2 terdapat jumlah merk produk rokok sebanyak 1 item yaitu Djarum.
3. Dalam cluster C3 terdapat jumlah merk produk rokok sebanyak 1 item yaitu Promild
Berdasarkan pengujian yang telah dilakukan dalam menentukan tata letak merk produk
berdasarkan jenis produknya di swalayan Larisso Ambulu-Jember, maka dapat diperoleh hasil
sebanyak 3 cluster yaitu cluster C1, cluster C2, dan cluster C3. Dan dari masing-masing merk
produk berdasarkan jenis produknya nantinya akan menempati cluster yang telah ditentukan.
Dan untuk lebih jelasnya, hasil clustering merk produk berdasarkan jenis produknya akan
disajikan pada tabel 4.1 berikut ini :
75
Tabel 4.1 Hasil Clustering
76
4.2.3 Denah Tata Letak Awal dan Setelah Clustering
A. Tata Letak Awal Produk
Rak 4 Rak 5
Perlengkapan Buah-buahan
Perawatan
Cluster C1
Merk Produk :
Salt Cheese, Hello Krupuk Tahu, Hello Stick
Tahu, Butter Keju, Butter Coconut, Yupi
Gumi
Jenis Produk : Cluster C2
Makanan Ringan Merk Produk :
Oreo, Gery Salut, Nissin Wafer, Fenesia
Wafer, Beng-beng
Cluster C3
Merk Produk :
Malkis Abon
77
Cluster C1
Merk Produk :
Aqua Botol, Pocari Sweat 900 ml, Pocari
Sweat 300 ml, Sprite, Frestea
Jenis Produk : Cluster C2
Minuman Merk Produk :
Susu Milo, Zee Susu Bag
Cluster C3
Merk Produk :
Energen
Cluster C1
Merk Produk :
Melon
Cluster C2
Jenis Produk : Merk Produk :
Buah-buahan Apel, Kelengkeng
Cluster C3
Merk Produk :
Belimbing
Cluster C1
Merk Produk :
Master Kids
Cluster C2
Jenis Produk : Merk Produk :
Perawatan Pepsodent, Lux, Lifebuoy
Cluster C3
Merk Produk :
Handbody Marina
Cluster C1
Merk Produk :
Gula, Royco Bumbu Tempe, Royco Bumbu
Ayam
Jenis Produk : Cluster C2
Bahan Dapur Merk Produk :
ABC Saos, ABC Sambal
Cluster C3
Merk Produk :
Indomie78Goreng
Handbody Marina
Cluster C1
Merk Produk :
Champ Seafood
Cluster C2
Jenis Produk : Merk Produk :
Bahan Makanan Nugget
Cluster C3
Merk Produk :
Sarden
Cluster C1
Merk Produk :
Laurier Maxi, Hers Protex, Tissue
Cluster C2
Jenis Produk : Merk Produk :
Perlengkapan Molto, Softener
Cluster C3
Merk Produk :
Kayu Putih
Cluster C1
Merk Produk :
Antimo Cair
Cluster C2
Jenis Produk : Merk Produk :
Obat-obatan Panadol
Cluster C3
Merk Produk :
Bodrex
Cluster C1
Merk Produk :
Wismilak
Jenis Produk : Cluster C2
Rokok Merk Produk :
Djarum
Cluster C3
Merk Produk :
Promild
79
BAB V
5.1 Kesimpulan
Berdasarkan Uraian dari bab – bab sebelumnya dan pengujian yang telah dilakukan
maka dapat diambil kesimpulan sebagai berikut :
1. Dengan menerapkan algoritma K-Means Clustering didapatkan sebuah model tata letak
merk produk berdasarkan jenis produk di Swalayan Larisso Ambulu-Jember, sehingga
dapat memudahkan konsumen dalam menemukan merk produk yang akan dibelinya.
2. Penentuan tata letak merk produk berdasarkan jenis produknya terbagi menjadi 3 cluster,
yaitu cluster C1, cluster C2, dan cluster C3, yang telah dilakukan penghitungan dengan
menggunakan algoritma K-Mens Clustering, sehingga dapat diketahui pada cluster ke
berapa penempatan merk produk berdasarkan jenis produknya di Swalayan Larisso
Ambulu-Jember.
5.2 Saran
80
DAFTAR PUSTAKA
81
Professional. Jhon Willey & Sons, Inc.
roinahsmart.blogspot.com/2012/11/pengertian-microsoft-visual-basic-net.html
(diakses tanggal 27 maret 2014)
RuiXu & Donald, C.W. 2009. Clustering. John Wiley & Sons, Inc.
Santosa, B. 2007. Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis.
Yogyakarta:Graha Ilmu.
.
82
Biodata Penulis
NIM : 1210652018
Nama : Indri Dwi Rukmana
83