Umj 1x Indridwiru 1775 1 Artikel L

TUGAS AKHIR
IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING

UNTUK MENENTUKAN TATA LETAK MERK PRODUK BERDASARKAN
JENIS PRODUK DI SWALAYAN LARISSO AMBULU-JEMBER
Di Susun Oleh :
Indri Dwi Rukmana

1210652018
PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH JEMBER
2015
i
TUGAS AKHIR

Disusun Untuk Melengkapi dan Memenuhi Syarat Kelulusan Program Strata 1

Jurusan Teknik Informatika Fakultas Teknik
Universitas Muhammadiyah Jember
Disusun Oleh :
Indri Dwi Rukmana

1210652018
Dosen Pembimbing :
1. Daryanto, S.Kom., M.Kom
2. Lutfi Ali Muharom, S.Si
PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH JEMBER
2015
ii
HALAMAN PENGESAHAN

Oleh :
Indri Dwi Rukmana
1210652018
Tugas Akhir Ini Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar
Sarjana Komputer (S.Kom)
di
Universitas muhammadiyah Jember
Telah diuji dan disahkan dihadapan tim penguji sidang tugas akhir, pada :
Hari : Jumat
Tanggal : 30 Januari 2015
Ruangan : Ruang Sidang Fakultas Teknik
Disetujui oleh :
Dosen Penguji I Dosen Pembimbing I
Yeni Dwi Rahayu, M.Kom Daryanto, S.Kom., M.Kom
NPK. 11 03 590 NPK. 11 03 589

Dosen Penguji II Dosen Pembimbing II
Yulio Rahmadi, S,Kom Lutfi Ali Muharom, S.Si

NPK. 10 03 545 NPK. 10 09 550
Jember,
Mengesahkan,
Dekan Fakultas Teknik Ketua Jurusan Teknik Informatika
Ir. Rusgianto, MM iii Agung Nilogiri S.T., M.Kom

NIP. 131 863 867 NIP. 19770330 200501 1002
PERNYATAAN
Yang bertanda tangan di bawah ini :
Nama : Indri Dwi Rukmana
Nim : 1210652018
Jurusan : Teknik Informatika
Tempat dan Tanggal Lahir : Jember, 27 Juni 1989
Agama : Islam
Alamat : Perumahan Bumi Ambulu Permai blok AA.4
Ambulu - Jember
Dengan ini menyatakan dengan sesungguhmya bahwa saya benar-benar membuat
Tugas Akhir ini sebagai syarat kelulusan program Sarjana (S1) untuk memperoleh gelar
“S.Kom” Jurusan Teknik Informatika Fakultas Teknik, Universitas Muhammadiyah Jember
dengan judul “Implementasi Algoritma K-Means Clustering Untuk Menentukan Tata
Letak Merk Produk Berdasarkan Jenis Produk di Swalayan Larisso Ambulu - Jember”.
Demikian pernyataan ini saya buat dengan sesungguhnya, apabila terungkap suatu
jiplakan maka saya bersedia menerima akibat berupa sangsi akademis dan sangsi lain yang
diberikan oleh yang berwenang.
Jember, 21 Januari 2015
Indri Dwi Rukmana

1210652018
iv
PERSEMBAHAN
Alhamdulillahirabbil alamin, akhirnya aku sampai ke titik ini. Segala puji dan syukur
kepada ALLAH SWT atas segala rakhmat dan hidayahnya yang telah memberikan
kekuatan, kesehatan dan kesabaran untuk ku dalam mengerjakan skripsi ini. Terima kasih
ku juga kepada :
1. Ayah dan Ibu tercinta yang selalu memberikanku motivasi, inspirasi, semangat dan
kasih sayangnya yang tak terhingga dalam menjalani kehidupan ini.
2. Kakak dan adikku yang telah sama-sama kita berjuang atas kehidupan yang kita
tempuh ini, teruslah berjuang untuk mencapai cita-cita kita.
3. My Dear yang selalu ada di sampingku, mendengarkan semua keluh kesahku,

memberikan support, doa dan rasa cintanya yang tulus kepadaku.
4. Para dosen-dosen ku, terutama pembimbingku di Universitas Muhammadiyah Jember

yang tak pernah lelah dan sabar memberikan bimbingan dan arahan kepada ku.
5. Teman – teman seperjuanganku yang selalu memberiku semangat.
6. Teman – teman kostan Greendland Cluster GO.20 yang super kocak dan konyol,
terimakasih atas canda tawa kalian serta supportnya selama ini.
v
MOTTO
“ Dia memberikan hikmah (ilmu yang berguna) kepada siapa yang dikehendaki-Nya.
Barang siapa yang mendapat hikmah itu, sesungguhnya ia telah mendapat kebajikan yang
banyak. Dan tiadalah yang menerima peringatan melainkan orang- orang yang berakal ”.
(Q.S. Al-Baqarah: 269)
“ Sesungguhnya bersama kesukaran itu ada keringanan. Karena itu bila kau sudah
selesai (mengerjakan yang lain). Dan berharaplah kepada Tuhanmu ”. (Q.S Al Insyirah : 6-8)
“ Bersabar, Berusaha, dan Bersyukur. Bersabar dalam berusaha, berusaha dengan

pantang menyerah dan bersyukur atas apa yang telah diperoleh ”. (Indri)
“ Jadilah seperti karang di lautan yang selalu kuat meskipun terus dihantam ombak
dan lakukanlah hal yang bermanfaat untuk diri sendiri dan juga untuk orang lain, karena hidup
tidak abadi ”. (Indri)
“ Kaki yang akan berjalan lebih jauh, tangan yang akan berbuat lebih banyak, mata
yang akan menatap lebih lama, leher yang akan lebih sering melihat ke atas, lapisan tekad
yang seribu kali lebih keras dari baja, dan hati yang akan bekerja lebih keras, serta mulut yang
akan selalu berdoa ”. -5cm
vi
KATA PENGANTAR
Alhamdulillahirabbil alamin, segala puji bagi Allah SWT Tuhan semesta alam atas
segala berkat, rahmat, taufik, serta hidayah-Nya sehingga penulis dapat menyelesaikan skripsi
ini dengan baik dan tepat waktu.
Tugas Akhir yang berjudul “ Implementasi Algoritma K-means Clustering Untuk
Menetukan Tata Letak Merk Produk Berdasarkan Jenis Produk di Swalayan Larisso Ambulu-
Jember ” ini dilakukan untuk memenuhi salah satu persyaratan pendidikan di Universitas
Muhammadiyah Jember Jurusan Teknik Informatika, Fakultas Teknik.
Dalam kesempatan ini, penulis menyampaikan rasa terima kasih kepada:
1. Bapak Daryanto S.Kom., M.Kom selaku dosen pembimbing 1.
2. Bapak Lutfi Ali Muharom, S.Si selaku dosen pembimbing 2.
3. Ibu Yeni Dwi Rahayu, M.Kom selaku dosen penguji 1.
4. Bapak Yulio Rahmadi, S.Kom selaku dosen penguji 2.
5. Para Dosen Fakultas Teknik Informatika, terima kasih atas semua ilmu yang telah
diberikan.
6. Keluarga penulis yang telah memberikan do’a dan juga bantuan secara moril dan materil.
7. Teman-teman yang telah mendukung dan memberi semangat kepada penulis.
8. Serta pihak-pihak yang telah membantu dan tidak dapat penulis sebutkan satu persatu.
Penulis menyadari bahwa masih banyak kekurangan dan kelemahan dalam
penyusunan skripsi ini. Oleh karena itu, kami mengharapkan kritik dan saran yang
membangun dan menambah wawasan dan wacana ilmu kami.
Akhir kata penulis berharap kerangka acuan skripsi ini dapat memberikan wawasan
dan pengetahuan kepada para pembaca pada umumnya dan pada penulis pada khususnya.
Jember, 21 Januari 2014
Penulis
vii
JENIS PRODUK DI SWALAYAN LARISSO DI AMBULU – JEMBER
1.
Indri Dwi Rukmana (1210652018). 2.Daryanto S.Kom, M.Kom. 3.Lutfi Ali M, S.Si
Jurusan Teknik Informatika Falkutas Teknik Universitas Muhammadiyah Jember
indridwirukmana@gmail.com
ABSTRAK
Swalayan adalah salah satu tempat berbelanja yang dapat memberikan kenyamanan,
kebersihan, kecepatan dan kerapian produk untuk konsumennya. Banyak konsumen yang
lebih memilih berbelanja di swalayan daripada di pasar tradisional karena swalayan dapat
memberikan kenyamanan dan kerapian produknya, akan tetapi tidak sedikit dari konsumen
yang mengeluhkan masalah tata letak produk yang ada di swalayan.
Penentuan tata letak produk pada swalayan merupakan hal penting yang harus
diperhatikan oleh pihak manajemen swalayan. Pada tugas akhir ini akan dijelaskan bagaimana
implementasi algoritma k-means clustering berdasarkan kebiasaan konsumen berbelanja
untuk menghasilkan suatu model tata letak merk produk berdasarkan jenis produknya.
Penelitian ini menggunakan data yang diperoleh dari struk-struk belanja pada
swalayan larisso di Ambulu - Jember. Algoritma k-means clustering digunakan untuk
mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama
dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang
berbeda dikelompokkan ke dalam kelompok lain. Hasil dari penelitian ini menghasilkan
sebuah model tata letak merk produk berdasarkan jenis produknya yang dapat memudahkan
konsumen dalam mendapatkan barang yang dibutuhkan.
Kata Kunci: tata letak merk produk ; algoritma k-means clustering.
viii
IMPLEMENTATION OF K-MEANS CLUSTERING ALGORITHM
TO DETERMINE THE LAYOUT OF THE BRANDS PRODUCT BY
TYPES PRODUCT IN LARISSO SUPERMARKET AMBULU JEMBER
1.
Indri Dwi Rukmana (1210652018). 2.Daryanto S.Kom, M.Kom. 3.Lutfi Ali M, S.Si
Jurusan Teknik Informatika Falkutas Teknik Universitas Muhammadiyah Jember
indridwirukmana@gmail.com
ABSTRACT
Supermarket is one place that can provide comfort, cleanliness, speed and neatness of
products for consumers. Many consumers who prefer to shop in supermarkets than in
traditional markets because supermarkets can provide comfort and neatness of its products,
but not a bit of consumers who complained about the layout of the existing products in
supermarkets.
Determining the layout of the product at the supermarket is an important thing that
must be considered by the management of self-service. In this final project will be explained
how the implementation of k-means clustering algorithm based on consumer shopping habits
to generate a model layout of the brands products by type product.
This study uses data obtained from the receipt at the larisso supermarket in Ambulu -
Jember. K-means clustering algorithm is used to partition the data into clusters so that the data
which have similar characteristics are grouped into the same cluster and the data that have
different characteristics are grouped into another group. The results of this study resulted in a
model of the brands products layout based on the types of products that can enable customers
to obtain needed goods.
Keywords: brands product layout; k-means clustering algorithm.
ix
DAFTAR ISI
Halaman
HALAMAN SAMPUL ................................................................................. i
HALAMAN PENGESAHAN ....................................................................... iii
PERNYATAAN ........................................................................................... iv
PERSEMBAHAN ......................................................................................... v
MOTTO ....................................................................................................... vi
KATA PENGANTAR .................................................................................. vii
ABSTRAK ................................................................................................... viii
ABSTRACT ................................................................................................. ix
DAFTAR ISI ................................................................................................ x
DAFTAR GAMBAR .................................................................................... xii
DAFTAR TABEL......................................................................................... xiv
DAFTAR LAMPIRAN ................................................................................. xvi
BAB 1. PENDAHULUAN ....................................................................... 1
1.1 Latar Belakang ............................................................................ 1
1.2 Perumusan Masalah ..................................................................... 2
1.3 Batasan Masalah .......................................................................... 2
1.4 Tujuan Penelitian ......................................................................... 2
1.5 Manfaat Penelitian ....................................................................... 2
BAB 2. TINJAUAN PUSTAKA .............................................................. 3
2.1 Definisi Swalayan ........................................................................ 3
2.2 Profil Swalayan Larisso Ambulu ................................................. 3
2.3 Tata Letak ................................................................................... 5
2.4 Data Mining ............................................................................... 6
2.4.1 Tahapan Data Mining ......................................................... 8
2.4.2 Pengelompokan Data Mining................................................ 9
2.5 Clustering .................................................................................... 12
2.5.1 Partitioning Clustering ........................................................ 14
2.6 Algoritma K-Means ..................................................................... 15
2.7 Microsoft Visual Basic.Net .......................................................... 16
x
BAB 3. METODOLOGI PENELITIAN ................................................... 18
3.1 Data Yang Digunakan .................................................................. 18
3.2 Praproses Data ............................................................................. 18
3.2.1 Penentuan Kelompok Jenis Produk...................................... 18
3.2.2 Penentuan Kelompok Berdasarkan Record .......................... 20
3.3 Cleaning Data .............................................................................. 24
3.4 Uji Coba Dengan Algoritma K-Means Clustering ........................ 26
3.4.1 Perhitungan Jarak Berdasarkan Parameter Produk ............... 30
3.4.2 Pengelompokkan Jarak Terkecil atau Minimum .................. 38
3.5 Perancangan Antar Muka Sistem ................................................. 42
3.5.1 Perancangan Flowchart Sistem ............................................ 42
3.5.2 Perancangan Tampilan Sistem............................................. 44
BAB 4. HASIL DAN PEMBAHASAN .................................................... 46
4.1 Spesifikasi Sistem ........................................................................ 46
4.2 Implementasi Sistem.................................................................... 46
4.2.1 Pengujian Sistem................................................................. 47
4.2.2 Hasil Clustering ................................................................... 69
4.2.3 Denah Tata Letak Awal dan Setelah Clustering ................... 71
BAB 5. KESIMPULAN DAN SARAN .................................................... 74
5.1 Kesimpulan ................................................................................. 74
5.2 Saran ........................................................................................... 74
DAFTAR PUSTAKA ................................................................................... 75
xi
DAFTAR GAMBAR
Halaman
2.1 Struktur Organisasi Swalayan Larisso Ambulu ........................................ 4
2.2 Kajian Umum Data Mining ..................................................................... 7
2.3 Tahapan Data Mning ............................................................................... 8
3.1 Contoh Struk Belanja .............................................................................. 19
3.2 Flowchart Sistem..................................................................................... 43
3.3 Tampilan Praposes Data .......................................................................... 44
3.4 Tampilan Proses K-Means....................................................................... 44
3.5 Tampilan Hasil ........................................................................................ 45
3.6 Tampilan Sorting Kelompok ................................................................... 45
4.1 Tampilan Proses K-Means Parameter Produk Makanan Ringan............... 47
4.2 Tampilan Hasil Pengujian Parameter Produk Makanan Ringan ............... 48
4.3 Tampilan Hasil Sorting Kelompok Parameter Produk Makanan Ringan... 49
4.4 Tampilan Proses K-Means Parameter Produk Minuman .......................... 50
4.5 Tampilan Hasil Pengujian Parameter Produk Minuman ........................... 51
4.6 Tampilan Hasil Sorting Kelompok Parameter Produk Minuman .............. 51
4.7 Tampilan Proses K-Means Parameter Produk Buah-buahan .................... 52
4.8 Tampilan Hasil Pengujian Parameter Produk Buah-buahan ..................... 53
4.9 Tampilan Hasil Sorting Kelompok Parameter Produk Buah-buahan ........ 54
4.10 Tampilan Proses K-Means Parameter Produk Perawatan ....................... 55
4.11 Tampilan Hasil Pengujian Parameter Produk Perawatan ........................ 56
4.12 Tampilan Hasil Sorting Kelompok Parameter Produk Perawatan ........... 56
4.13 Tampilan Proses K-Means Parameter Produk Bahan Dapur ................... 57
4.14 Tampilan Hasil Pengujian Parameter Produk Bahan Dapur ................... 58
4.15 Tampilan Hasil Sorting Kelompok Parameter Produk Bahan Dapur ...... 59
4.16 Tampilan Proses K-Means Parameter Produk Bahan Makanan .............. 60
4.17 Tampilan Hasil Pengujian Parameter Produk Bahan Makanan ............... 61
4.18 Tampilan Hasil Sorting Kelompok Parameter Produk Bahan Makanan .. 61
4.19 Tampilan Hasil Proses K-Means Produk Perlengkapan.......................... 62
4.20 Tampilan Hasil Pengujian Parameter Produk Perlengkapan ................... 63
xii
4.21 Tampilan Hasil Sorting Kelompok Parameter Produk Perlengkapan ...... 64
4.22 Tampilan Proses K-Means Parameter Produk Obat-obatan .................... 65
4.23 Tampilan Hasil Pengujian Parameter Produk Obat-obatan ..................... 66
4.24 Tampilan Hasil Sorting Kelompok Parameter Produk Obat-obatan ........ 66
4.25 Tampilan Proses K-Means Parameter Produk Rokok ............................. 67
4.26 Tampilan Hasil Pengujian Parameter Produk Rokok.............................. 68
4.27 Tampilan Hasil Sorting Kelompok Parameter Produk Rokok................. 69
4.28 Denah Tata Letak Awal Produk ............................................................. 71
4.29 Denah Tata Letak Merk Produk Setelah Clustering ............................... 71
xiii
DAFTAR TABEL
Halaman
3.1 Dataset Merk Produk............................................................................... 21
3.2 Dataset Penentuan Jenis Produk .............................................................. 24
3.3 Dataset Yang Telah di Cleaning .............................................................. 26
3.4 Centroid Produk Makanan Ringan .......................................................... 27
3.5 Centroid Produk Minuman ...................................................................... 27
3.6 Centroid Produk Buah-buahan ................................................................ 27
3.7 Centroid Produk Perawatan..................................................................... 28
3.8 Centroid Produk Bahan Dapur ................................................................ 28
3.9 Centroid Produk Bahan Makanan ........................................................... 28
3.10 Centroid Produk Perlengkapan .............................................................. 29
3.11 Centroid Produk Obat-obatan ................................................................ 29
3.12 Centroid Produk Rokok......................................................................... 29
3.13 Hasil Penghitungan Jarak Dengan Paramater Produk Makanan Ringan
Masing-Masing cluster............................................................................. 30
3.14 Hasil Penghitungan Jarak Dengan Paramater Produk Minuman
3.15 Hasil Penghitungan Jarak Dengan Paramater Produk Buah-buahan
3.16 Hasil Penghitungan Jarak Dengan Paramater Produk Perawatan
3.17 Hasil Penghitungan Jarak Dengan Paramater Produk Bahan Dapur
3.18 Hasil Penghitungan Jarak Dengan Paramater Produk Bahan Makanan
3.19 Hasil Penghitungan Jarak Dengan Paramater Produk Perlengkapan
3.20 Hasil Penghitungan Jarak Dengan Paramater Produk Obat-obatan
3.21 Hasil Penghitungan Jarak Dengan Paramater Produk Rokok
xiv
3.22 Anggota Data Masing-Masing Cluster Produk Makanan Ringan ........... 38
3.23 Anggota Data Masing-Masing Cluster Produk Minuman ....................... 39
3.24 Anggota Data Masing-Masing Cluster Produk Buah-buahan ................. 39
3.25 Anggota Data Masing-Masing Cluster Produk Perawatan ...................... 40
3.26 Anggota Data Masing-Masing Cluster Produk Bahan Dapur ................. 40
3.27 Anggota Data Masing-Masing Cluster Produk Bahan Makanan ............. 41
3.28 Anggota Data Masing-Masing Cluster Produk Perlengkapan ................. 41
3.29 Anggota Data Masing-Masing Cluster Produk Obat-obatan ................... 42
3.30 Anggota Data Masing-Masing Cluster Produk Rokok ........................... 42
4.1 Hasil Clustering ...................................................................................... 70
xv
DAFTAR LAMPIRAN
Halaman
Biodata Penulis ............................................................................................. 77
xvi
BAB I
PENDAHULUAN
1.1 Latar Belakang
Seiring dengan pertumbuhan ekonomi Indonesia yang maju dan berkembang pesat
khususnya di kota besar maupun kota kecil, telah terjadi perubahan diberbagai sektor,
termasuk dibidang industri dan produksi serta pada kegiatan eceran di Indonesia yang telah
berkembang menjadi usaha yang berskala besar. Perkembangan bisnis eceran yang pesat ini
tidak lepas dari faktor meningkatnya jumlah penduduk Indonesia dan juga meningkatkan
jumlah pendapatan perkapita penduduk Indonesia yang menyebabkan taraf hidup masyarakat
Indonesia semakin meningkat. Hal ini membawa dampak kepada pola perilaku belanja
seseorang, dimana semakin meningkatnya taraf hidup seseorang maka tuntutan akan tempat
berbelanja yang nyaman dan dapat menyediakan segala kebutuhan konsumen dalam satu
lokasi semakin dibutuhkan. Swalayan adalah salah satu tempat berbelanja yang dapat
memberikan kenyamanan, kebersihan, kecepatan dan kerapian produk untuk konsumennya.
Banyak konsumen yang lebih memilih berbelanja di swalayan daripada di pasar
tradisional, alasannya swalayan dapat memberikan kenyamanan dan kerapian dalam
berbelanja. Namun tidak sedikit dari para konsumen yang mengeluhkan tentang kerapian
merk produk pada swalayan, dimana tata letak merk produknya tidak strategis dan tepat,
sehingga membuat konsumen sulit untuk mendapatkan merk produk yang mereka butuhkan,
juga akan menghabiskan waktu yang cukup lama hanya untuk menemukan merk produk
tersebut. Tata letak merk produk yang strategis dan tepat dalam penataanya akan lebih mudah
dijangkau oleh konsumen dan tidak akan menghabiskan waktu. Untuk itu perlu dibuat sebuah
sistem yang dapat menentukan pola tata letak merk produk pada swalayan, yaitu dengan
dibuatnya suatu teknik clustering.
Dari beberapa teknik clustering yang paling sederhana dan umum dikenal adalah
clustering K-Means (Santosa, 2007). K-Means merupakan salah satu metode data clustering
non hirarki yang mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik
yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai
karakteristik yang berbeda dikelompokkan ke dalam kelompok lain (Agusta, 2007).
1
Berdasarkan uraian diatas, penulis berkeinginan untuk membuat suatu implementasi
algoritma K-Means Clustering untuk menentukan tata letak merk produk berdasarkan jenis
produk di swalayan Larisso Ambulu - Jember.
1.2 Perumusan Masalah
Berdasarkan uraian diatas, perumusan masalah dalam Tugas Akhir ini, yaitu
bagaimana mengimplementasikan algoritma K-Means Clustering untuk menentukan tata letak
merk produk berdasarkan jenis produk di swalayan Larisso Ambulu – Jember.
1.3 Batasan Masalah
Batasan masalah dari Tugas Akhir yang berjudul Implementasi algoritma K-Means
Clustering untuk menetukan tata letak merk produk berdasarkan jenis produk di swalayan
Larissso Ambulu - Jember , antara lain :
1. Data yang dianalisis adalah data struk, berisi merk produk yang diperoleh dari swalayan
Larisso di Ambulu – Jember dari bulan Januari - September 2014.
2. Algoritma yang digunakan adalah algortima K-Means Clustering.
3. Perancangan program menggunakan bahasa pemrograman VB.NET.
1.4 Tujuan Penelitian
Tujuan dari Tugas Akhir ini adalah :

1. Membuat sebuah model untuk menentukan tata letak merk produk berdasarkan jenis
produk pada swalayan.
2. Menerapkan K-Means Clustering dalam menentukan tata letak merk produk berdasarkan
jenis produk pada swalayan.
1.5 Manfaat Penelitian
Manfaat dari penelitian ini adalah didapatkan sebuah model tata letak merk produk
berdasarkan jenis produk di swalayan Larisso Ambulu – Jember yang dapat memudahkan
2
bagi konsumen dalam menemukan merk produk yang dibutuhkan sehingga tidak
membutuhkan waktu lama untuk mencarinya
3
BAB II
TINJAUAN PUSTAKA
2.1 Defenisi Swalayan
Supermarket atau pasar swalayan menurut Marwan Asri (1991 : 289) adalah salah satu
bentuk usaha eceran yang menyediakan beraneka macam kebutuhan konsumen. Satu
Supermarket mungkin menjual pakaian wanita, pria, anak-anak, alat rumah tangga, alat olah
raga, perhiasan serta alat rumah tangga lainnya dan alat tulis.
Swalayan adalah sebuah toko yang menjual segala kebutuhan sehari-hari. Barang-
barang yang dijual di swalayan biasanya adalah barang-barang kebutuhan sehari-hari. Seperti
bahan makanan, minuman dan barang kebutuhan seperti tissue dan sebagainya.
Biasanya setelah berbelanja di swalayan, konsumen akan menerima struk belanjaan
dari pihak swalayan. Struk belanja digunakan oleh swalayan untuk diberikan kepada
konsumen seberapa banyak produk yang dibeli serta jumlah harga produk per unitnya serta
total dari keseluruhannya. Struk belanja ini juga merupakan bukti transaksi konsumen kepada
swalayan terhadap produk-produk apa saja yang telah dibeli.
2.2 Profil Swalayan Larisso Ambulu
Ambulu adalah sebuah kecamatan di Kabupaten Jember, Provinsi Jawa Timur,

Indonesia. Wilayah selatan kecamatan ini berbatasan dengan Samudra Hindia. Kecamatan
Ambulu mempunyai luas wilayah 104,56 km2 dengan ketinggian rata-rata 18 m dari atas
permukaan laut.
Di kecamatan Ambulu terdapat salah satu pusat perbelanjaan/swalayan yang menjadi
tempat favorit masyarakat sekitar maupun masyarakat dari luar kecamatan untuk berbelanja,
yaitu Swalayan Larisso yang berlokasi di Jl. Watu Ulo no.21 Ambulu, sekitar ± 30 km atau 30
menit dari pusat kota Jember. Swalayan ini didirikan pertengahan tahun 2010, dan sekarang
ini telah berkembang pesat karena merupakan satu-satunya tempat perbelanjaan yang
memiliki harga relatif murah dibanding dengan supermarket lainnya. Di Swalayan ini
menyediakan berbagai macam kebutuhan konsumen mulai dari bahan makanan, minuman dan
4
bahan kebutuhan lainnya, dimana pembeli mengambil sendiri barang yang dibutuhkan dari
rak-rak yang disediakan dan nantinya membayar dikasir dan akan mendapatkan struk belanja.
Di Swalayan Larisso Ambulu memiliki ± 70 Karyawan yang terdiri dari supervisor,
bagian keuangan, personalia, dan bagian gudang. Untuk Jam kerja di Swalayan Larisso yaitu
setiap hari senin – minggu mulai pukul 09.00 – 21.00.
Struktur organisasi di Swalayan Larisso Ambulu – Jember dapat digambarkan sebagai
berikut:
Gambar 2.1 Struktur Organisasi Swalayan Larisso Ambulu

Jobdesk masing – masing bagian yaitu :
1. Direktur : Bertugas memimpin dan menjalankan Swalayan, mengangkat dan
memberhentikan karyawan, serta bertanggung jawab terhadap keuntungan dan
kerugian perusahaan.
2. Supervisor Swalayan : Bertugas mengatur kerjanya para bawahannya, membuat job
desk para bawahanya (staf), bertanggung jawab atas hasil kerja bawahanya (staf),
memberi motivasi ke bawahanya (staf), memberikan breafing, serta membuat rencana
pekerjaan untuk kedepannya yaitu rencana kerja harian,mingguan,bulanan,dan
tahunan.
3. Junior Supervisor : Mengawasi, mengarahkan dan membimbing seluruh divisi / bagian
yang menjadi tanggung jawabnya agar dapat melaksanakan tugas dengan baik.
5
4. Pramuniaga : Melakukan kelancaran operasional counter seperti display barang,
mengisi barang yang telah kosong ataupun barang yang baru, dan
menjaga kebersihan area kerja, kebersihan dan kerapian barang.
5. Manajer Keuangan : Bertugas mengelola keuangan swalayan (penerimaan dan
pengeluaran keuangan) seperti penggajian karyawan.
6. Staf Administrasi : Melakukan kegiatan yang berhubungan dengan kegiatan
administrasi.
7. Kepala Kasir : Memonitoring kegiatan kasir setiap harinya dan membuat laporan
keuangan.
8. Kasir : Melayani pembayaran konsumen setiap hari dan bertanggung jawab terhadap
uang setoran.
9. Personalia / umum : Melakukan kegiatan umum seperti mencatat kehadiran dan
lembur kerja karyawan, menyediakan dan mengatur jumlah tenaga kerja yang
dibutuhkan swalayan.
10. Divisi Teknik / Maintenence : Bertanggung jawab terhadap kelancaran operasional
swalayan.
11. Satpam : Bertugas menjaga keamanan swalayan.
12. Cleaning Service : Bertugas membersihkan seluruh ruangan yang ada di swalayan.
13. Kepala Gudang : Menerima barang baik dari supplier, mengecek jumlah barang yang
dikirim dan disesuaikan dengan dokumen, mengecek kebersihan dan keamanan barang
yang ada, dan mengeluarkan barang yang dibutuhkan oleh swalayan.
14. Staf Bag.EDP : Bertugas mengawasi dan melakukan kegiatan Electronic Data
Processing yaitu memasukkan atau menginput data barang-barang baru dan perubahan
harga, memasukkan data jadwal promosi berkaitan dengan barang yang dijual, serta
merapikan ulang data yang ada dikomputer.
2.3 Tata Letak
Tata letak adalah suatu rancangan fasilitas, menganalisis, membentuk konsep, dan
mewujudkan sistem pembuatan barang atau jasa. Rancangan ini pada umumnya digambarkan
sebagai rancangan lantai, yaitu satu susunan fasilitas fisik (perlengkapan, tanah, bangunan,
dan sarana lain) untuk mengoptimalkan hubungan antara petugas pelaksana, aliran barang,
6
aliran informasi, dan tata cara yang diperlukan untuk mencapai tujuan usaha secara ekonomis
dan aman.
Tata letak merupakan satu keputusan penting yang menentukan efisiensi sebuah
operasi dalam jangka panjang. Tata letak memiliki banyak dampak strategis karena tata letak
menentukan daya saing perusahaan dalam kapasitas, proses, fleksibilitas, dan biaya, serta
kualitas lingkungan kerja, kontak pelangga, dan citra perusahaan. Tata letak yang efektif
dapat membantu organisasi mencapai sebuah strategi yang menunjang diferensiasi, biaya
rendah, atau respon cepat. Tujuan strategi tata letak adalah untuk membangun tata letak yang
ekonomis yang memenuhi kebutuhan persaingan perusahaan.
2.4 Data Mining
Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut
diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga
dari sejumlah besar material dasar. Karena itu data mining sebenarnya memiliki akar yang
panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning,
statistik dan database. Dengan arti lain data mining adalah proses untuk penggalian pola-pola
dari data. Data mining menjadi alat yang semakin penting untuk mengubah data tersebut
menjadi informasi. Hal ini sering digunakan dalam berbagai praktek profil, seperti pemasaran,
pengawasan, penipuan deteksi dan penemuan ilmiah. Data mining telah digunakan selama
bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti
catatan perjalanan penumpang penerbangan, data sensus dan supermarket scanner data untuk
menghasilkan laporan riset pasar.
Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis
koleksi pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui
keterkaitan. Fakta yang tak terelakkan data mining adalah bahwa subset/set data yang
dianalisis mungkin tidak mewakili seluruh domain, dan karenanya tidak boleh berisi contoh-
contoh hubungan kritis tertentu dan perilaku yang ada di bagian lain dari domain . Untuk
mengatasi masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan
dan pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia. Dalam
7
situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama sekali,
selama konstruksi desain eksperimental.
Beberapa teknik yang sering disebut-sebut dalam literatur data mining dalam
penerapannya antara lain: clustering, classification, association rule mining, neural network,
genetic algorithm dan lain-lain. Yang membedakan persepsi terhadap data mining adalah
perkembangan teknik-teknik data mining untuk aplikasi pada database skala besar. Sebelum
populernya data mining, teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil
saja.
Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu
kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual (Moertini,
2002). Secara umum data mining memiliki beberapa kajian. Seperti yang dapat dilihat pada
Gambar 2.2, data mining merupakan pusat dari beberapa kajian. Diantaranya adalah estimasi,
seleksi variabel, clustering, visualisasi, market basket analysis dan klasifikasi. Semua kajian
tersebut termasuk ke dalam data mining.
Gambar 2.2 Kajian Umum Data Mining

( Sumber : Santosa 2007 )
Data mining merupakan bidang dari beberapa bidang keilmuan yang menyatukan
teknik dari pembelajaran mesin, pengenalan pola, statistik, database dan visualisasi untuk
penanganan permasalahan pengambilan informasi dari database yang besar (Larose, 2005).
Data mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan
tujuan untuk menemukan pola atau kecendrungan yang penting yang biasanya tidak disadari
keberadaannya (Moertini, 2002). Hal-hal penting yang terkait dengan data mining adalah
(Luthfi & Kusrini, 2009):
8
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
2. Data yang akan diproses berupa data yang sangat besar.
3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin
memberikan indikasi yang bermanfaat.
Hubungan yang dicari dalam data mining dapat berupa hubungan antara dua atau lebih
objek dalam satu dimensi yang sama. Misalnya dalam dimensi produk dapat melihat
keterkaitan pembelian suatu produk dengan produk yang lain. Selain itu, hubungan juga dapat
dilihat antara dua atau lebih atribut dan dua atau lebih objek (Ponniah, 2001). Masalah-
masalah yang sesuai untuk diselesaikan dengan teknik data mining dapat dicirikan dengan
(Piatetsky & Shapiro, 2006):
1. Memerlukan keputusan yang bersifat knowledge-based.
2. Mempunyai lingkungan yang berubah.
3. Metode yang ada sekarang bersifat sub-optimal.
4. Tersedia data yang bisa diakses, cukup dan relevan.
5. Memberikan keuntungan yang tinggi jika keputusan yang diambil tepat.
Kata mining mempunyai arti yaitu usaha untuk mendapatkan sedikit barang berharga
dari sejumlah besar material dasar. Data mining memiliki akar yang panjang dari bidang ilmu
seperti kecerdasan buatan (artificial intelegent), machine learning, statistik dan database.
Beberapa metode yang sering disebut-sebut dalam literatur data mining antara lain clustering,
classification, association rules mining, neural network, genetic algorithm dan lain-lain
(Moertini, 2002).
2.4.1 Tahapan Data Mining
Di dalam tahapan data mining, data yang ada, tidak dapat langsung diolah dengan
menggunakan sistem data mining. Data tersebut harus dipersiapkan terlebih dahulu agar hasil
yang diperoleh dapat lebih maksimal, dan waktu komputasinya lebih minimal. Proses
persiapan data ini sendiri dapat mencapai 60 % dari keseluruhan proses dalam data mining.
Proses data mining secara garis besar terdiri dari 5 tahapan yaitu data selection, pre-
processing/cleaning, transformation, data mining dan interpretation/evaluation. Proses data
mining digambarkan pada Gambar 2.3 berikut:
9
Gambar 2.3 Tahapan Data Mining
(Sumber : Fayyad 1996)
Berikut ini merupakan tahapan dari proses data mining (Fayyad, 1996):
1. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum
tahap penggalian informasi dalam data mining dimulai. Data hasil seleksi yang akan
digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data
operasional.
2. Pre-processing/Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada
data yang menjadi fokus. Proses cleaning mencakup antara lain membuang duplikasi data,
memeriksa data yang inkonsisten dan memperbaiki kesalahan pada data, seperti kesalahan
cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang
sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk data mining,
seperti data atau informasi eksternal.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut
sesuai untuk proses data mining. Proses coding dalam data mining merupakan proses
kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis
data.
4. Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih
dengan menggunakan teknik atau metode tertentu. Teknik, metode atau algoritma dalam
10
data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat
bergantung pada tujuan dan proses data mining secara keseluruhan.
5. Interpretation/Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam
bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan
bagian dari proses data mining yang disebut interpretation. Tahap ini mencakup
pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau
hipotesis yang ada sebelumnya.
2.4.2 Pengelompokan Data Mining
Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat
dilakukan, yaitu (Larose, 2005):
1. Deskripsi
Terkadang penelitian analisis secara sederhana ingin mencoba mencari cara untuk
menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh,
petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta
bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan
presiden. Deskripsi dari pola dan kecenderungan sering memberikan kemungkinan
penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah
numerik daripada ke arah kategori. Model dibangun menggunakan record lengkap yang
menyediakan nilai dari variabel target sebagai nilai prediksi. Selanjutnya, pada
peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel
prediksi. Sebagai contoh, akan dilakukan estimasi tekanan darah sistolik pada pasien
rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level
sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam
proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan
dapat digunakan untuk kasus baru lainnya.
11
3. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi
nilai dari hasil akan ada di masa datang. Contoh prediksi dalam bisnis dan penelitian
adalah:
1. Prediksi harga beras dalam tiga bulan yang akan datang.
2. Prediksi presentase kenaikan kecelekaan lalu lintas tahun depan jika batas
bawah kecepatan dinaikkan.
Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula
digunakan (untuk keadaan yang tepat) untuk prediksi.
4. Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan
pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, pendapatan
sedang, dan pendapatan rendah.
Contoh lain klasifikasi dalam bisnis dan penelitian adalah :
1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau
bukan.
2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit
yang baik atau buruk.
3. Mendiagnosis penyakit seorang pasien untuk mendapatkan kategori penyakit apa.
5. Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan
dan membentuk kelas objek-objek yang memiliki kemiripan. Cluster adalah kumpulan
record yang memiliki kemiripan satu dengan yang lainnya dan memiliki ketidakmiripan
dengan record-record dalam cluster lain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam
pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi, mengestimasi,
atau memprediksi nilai dari variabel target. Akan tetapi, algoritma pengklusteran
mencoba untuk melakukan pembagian terhadap keseluruhan data menjadi kelompok-
kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record dalam satu
kelompok akan bernilai maksimal, sedangkan kemiripan dengan record dalam kelompok
lain akan bernilai minimal.
Contoh pengklusteran dalam bisnis dan penelitian adalah:
12
1. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan
perilaku dari gen dalam jumlah besar.
2. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu
produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar.
3. Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial
dalam baik dan mencurigakan.
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu
waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
Contoh asosiasi dalam bisnis dan penelitian adalah :
1. Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang yang
tidak pernah dibeli secara bersamaan.
2. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan
untuk memberikan respons positif terhadap penawaran upgrade layanan yang
diberikan.
2.5 Clustering
Clustering adalah metode penganalisaan data, yang sering dimasukkan sebagai salah
satu metode Data Mining, yang tujuannya adalah untuk mengelompokkan data dengan
karakteristik yang sama ke suatu ‘wilayah’ yang sama dan data dengan karakteristik yang
berbeda ke ‘wilayah’ yang lain.
Ada beberapa pendekatan yang digunakan dalam mengembangkan metode clustering.
Dua pendekatan utama adalah clustering dengan pendekatan partisi dan clustering dengan
pendekatan hirarki. Clustering dengan pendekatan partisi atau sering disebut
dengan partition-based clustering mengelompokkan data dengan memilah-milah data yang
dianalisa ke dalam cluster-cluster yang ada.
Clustering dengan pendekatan hirarki atau sering disebut dengan hierarchical
clustering mengelompokkan data dengan membuat suatu hirarki berupa dendogram dimana
data yang mirip akan ditempatkan pada hirarki yang berdekatan dan yang tidak pada hirarki
yang berjauhan. Di samping kedua pendekatan tersebut, ada juga clustering dengan
pendekatan automatic mapping (Self – Organising Map/SOM).
13
Clustering (pengelompokan data) mempertimbangkan sebuah pendekatan penting
untuk mencari kesamaan dalam data dan menempatkan data yang sama ke dalam kelompok-
kelompok. Clustering membagi kumpulan data ke dalam beberapa kelompok dimana
kesamaan dalam sebuah kelompok adalah lebih besar daripada diantara kelompok-kelompok
yang lain (Rui Xu & Donald 2009). Gagasan mengenai pengelompokan data, atau clustering,
memiliki sifat yang sederhana dan dekat dengan cara berpikir manusia kapanpun kepada kita
dipresentasikan jumlah data yang besar, kita biasanya cenderung merangkumkan jumlah data
yang besar ini ke dalam sejumlah kecil kelompok-kelompok atau kategori-kategori untuk
memfasilitasi analisanya lebih lanjut. Selain dari itu, sebagian besar data yang dikumpulkan
dalam banyak masalah terlihat memiliki beberapa sifat yang melekat yang mengalami
pengelompokan-pengelompokan natural (Hammouda & Karray, 2003).
Namun demikian, penemuan pengelompokan-pengelompokan ini atau upaya untuk
mengkategorikan data adalah bukan sebuah tugas yang sederhana bagi manusia kecuali data
memiliki dimensionalitas rendah (dua atau tiga dimensi paling banyak). Inilah sebabnya
mengapa beberapa metode dalam soft computing telah dikemukakan untuk menyelesaikan
jenis masalah ini. Metode ini disebut “Metode-Metode Pengelompokan Data” (Hammouda &
Karray, 2003).
Algoritma-algoritma clustering digunakan secara ekstensif tidak hanya untuk
mengorganisasikan dan mengkategorikan data, akan tetapi juga sangat bermanfaat untuk
kompresi data dan konstruksi model. Melalui pencarian kesamaan dalam data, seseorang
dapat merepresentasikan data yang sama dengan lebih sedikit simbol. Dan juga, jika kita
dapat menemukan kelompok-kelompok data, kita dapat membangun sebuah model masalah
berdasarkan pengelompokan-pengelompokan ini (Dubes & Jain, 1988).
Clustering menunjuk pada pengelompokan record, observasi-observasi, atau kasus-
kasus ke dalam kelas-kelas objek yang sama. Cluster adalah sekumpulan record yang sama
dengan satu sama lain dan tidak sama dengan record dalam cluster lain. Clustering berbeda
dari klasifikasi dimana tidak ada variabel target untuk clustering. Tugas clustering mencoba
untuk tidak mengklasifikasikan, mengestimasi, atau memprediksi nilai variabel target (Larose,
2005). Bahkan, algoritma clustering berusaha mensegmentasikan seluruh kumpulan data ke
dalam subkelompok-subkelompok atau cluster-cluster homogen secara relatif. Dimana
kesamaan record dalam cluster dimaksimalkan dan kesamaan dengan record diluar cluster ini
diminimalkan.
14
Clustering sering dilaksanakan sebagai langkah pendahuluan dalam proses
pengumpulan data, dengan cluster-cluster yang dihasilkan digunakan sebagai input lebih
lanjut ke dalam sebuah teknik yang berbeda, seperti neural network. Karena ukuran yang
besar dari banyak database yang dipresentasikan saat ini, dapat membantu untuk
menggunakan analisa clustering terlebih dahulu, untuk mengurangi ruang pencarian untuk
algoritma-algoritma downstream. Aktivitas clustering pola khusus meliputi langkah-langkah
berikut (Dubes & Jain, 1988) :
1. Representasi pola (secara opsional termasuk ekstraksi dan/atau seleksi sifat.
2. Defenisi ukuran kedekatan pola yang tepat untuk domain data.
3. Clustering pengelompokan.
4. Penarikan data (jika dibutuhkan).
5. Pengkajian output (jika dibutuhkan).
Representasi pola merujuk pada jumlah kelas, jumlah pola-pola yang ada, dan jumlah,
tipe dan skala fitur yang tersedia untuk algoritma clustering. Beberapa informasi ini dapat
tidak bisa dikontrol oleh praktisioner. Seleksi sifat (fitur) adalah proses pengidentifikasian
subset fitur original yang paling efektif untuk digunakan dalam clustering. Ekstraksi fitur
adalah penggunaan satu atau lebih transformasi dari sifat-sifat input untuk menghasilkan sifat-
sifat baru yang lebih baik.
Secara garis besar, terdapat beberapa metode clustering data. Pemilihan metode
clustering bergantung pada tipe data dan tujuan clustering itu sendiri. Metode-metode beserta
algortima yang termasuk didalamnya adalah sebagai berikut:
1. Partitioning Methdos
Metode yang membangun berbagai partisi dan kemudian mengevaluasi partisi tersebut
dengan beberapa kriteria. Algoritma yang dipakai pada metode ini adalah K-Means, K-
Medoid, PROCLUS, CLARA, CLARANS dan PAM.
2. Hierarchical Methods
Metode yang membuat suatu penguraian secara hierarchical dari himpunan data
dengan menggunakan beberapa kriteria. Metode ini terdiri atas dua jenis, yaitu
Agglomerative yang menggunakan strategi bottom-up dan Disisive yang menggunakan
strategi top-down. Metode ini meliputi algoritma BIRCH, AGNES, DIANA, CURE dan
CHAMELEON.
15
3. Density-Based Methods
Metode ini berdasarkan konektivitas dan fungsi densitas. Metode ini meliputi
algoritma DBSCAN, OPTICS dan DENCLU.
4. Grid-Based Methods
Metode ini berdasarkan suatu struktur granularitas multi-level. Metode clustering ini
meliputi algoritma STING, WaveCluster dan CLIQUE.
5. Model-Based Methods
Suatu model dihipotesakan untuk masing-masing cluster dan ide untuk mencari best
fit dari model tersebut untuk masing-masing yang lain. Metode clustering ini meliputi
pendekatan statistik, yaitu algoritma COBWEB dan jaringan syaraf tiruan SOM.
2.5.1 Partitioning Clustering
Partitioning Clustering merupakan salah satu metode data mining yang bersifat tanpa
arahan (unsupervised). Konsep dasar dari partitioning clustering adalah membagi n jumlah
cluster ke dalam k cluster. Metode ini merupakan metode pengelompokan yang bertujuan
mengelompokkan objek sehingga jarak antara setiap objek ke pusat kelompok di dalam satu
kelompok adalah minimum.
Metode Pengelompokan :
Cluster adalah kumpulan data dimana jika objek data yang terletak didalam cluster
harus memiliki kemiripan sedangkan yang tidak berada dalam suatu cluster tidak mempunyai
kemiripan.
Jika ada n objek penelitian dengan p variabel maka sebelum dilakukan
pengelompokan data atau objek terlebih dahulu menentukan ukuran kedekatan sifat antar
data. Ukuran data yang bisa digunakan adalah jarak euclidius (euclidean distance), antara dua
objek dari p dimensi pengamatan. Jika objek pertama yang diamati adalah 𝑥= 𝑥1 ,𝑥2,…,𝑥𝑝
dan 𝑦= 𝑦1 ,𝑦2,…,𝑦𝑝 maka rumus euclidean distance adalah sebagai berikut:
(2.1)
16
dimana:
d : distance
x : 𝑥1,𝑥2,𝑥3,…,𝑥𝑝
y : 𝑦1,𝑦2,𝑦3,…,𝑦𝑝
j : merepresentasikan nilai atribut
p : dimensi data
2.6 Algoritma K-Means
K-Means (MacQueen, 1967) adalah salah satu dari algoritma unsupervised learning
yang paling sederhana untuk menyelesaikan masalah clustering yang telah dikenal. Prosedur
ini mengikuti cara sederhana dan mudah untuk mengklasifikasikan kumpulan data tertentu
melalui jumlah cluster tertentu (menganggap k cluster) yang telah ditetapkan sebelumnya.
Dari beberapa teknik clustering yang paling sederhana dan umum dikenal adalah
clustering k-means (Santosa, 2007). K-Means merupakan salah satu metode data clustering
non hirarki yang mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik
yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai
karakteristik yang berbeda dikelompokkan ke dalam kelompok lain (Agusta, 2007). Adapun
tujuan dari data clustering ini adalah untuk meminimalisasikan objective function yang diset
dalam proses clustering, yang pada umumnya berusaha meminimalisasikan variasi di dalam
suatu cluster dan memaksimalkan variasi antar cluster.
Pada dasarnya penggunaan algoritma dalam melakukan proses clustering tergantung
dari data yang ada dan konklusi yang ingin dicapai. Untuk itu digunakan algoritma K-Means
yang didalamnya memuat aturan sebagai berikut:
1. Jumlah cluster perlu diinputkan.
2. Hanya memiliki atribut bertipe numerik.
Untuk tahapannya, algoritma k-means memilih secara acak k buah data sebagai
centroid. Kemudian, jarak antara data dan centroid dihitung dengan menggunakan Euclidean
Distance. Data dikelompokkan dalam cluster yang terkecil / berdasarkan jarak minimum
dihitung dari titik semua cluster.
17
Algoritma K-Means pada dasarnya melakukan dua proses, yaitu proses pendeteksian
lokasi pusat tiap cluster dan proses pencarian anggota dari tiap-tiap cluster. Cara kerja
algoritma K-Means:
1. Tentukan k sebagai jumlah cluster yang ingin dibentuk.
2. Bangkitkan k centroid (titik pusat cluster) secara random.
3. Hitung jarak setiap data ke masing-masing centroid.
4. Kelompokkan masing-masing objek ke dalam cluster berdasarkan jarak
minimum.
2.7 Microsoft Visual Basic.NET
Microsoft Visual Basic. NET adalah sebuah alat untuk mengembangkan dan
membangun aplikasi yang bergerak diatas sistem NET Framework, dengan menggunakan
bahasa basic. Dengan menggunakan alat ini, para programmer dapat membangun aplikasi
windows form, aplikasi web berbasis ASP.NET, dan juga aplikasi command-line.
Alat ini dapat diperoleh secara terpisah dari beberapa produk lainnya (seperti
Microsoft Visual C++, Visual C#, atau Visual J#) atau juga dapat diperoleh secara terpadu
dalam Microsoft Visual Studio.NET. Bahasa Visual Basic.NET sendiri menganut paradigma
bahasa pemrograman berorientasi objek yang dapat dilihat sebagai evolusi dari Microsoft
Visual Basic versi sebelumnya yang diimplementasikan diatas .NET Framework.
NET Framework adalah landasan kerja bagi aplikasi – aplikasi net yang dibuat dalam
bahasa pemrograman berbasis net tanpa terpengaruh oleh bahasa pemrograman yang
digunakan didalam NET Framework ini karena semua coding yang telah dikembangkan
dalam programmer akan dieksekusi berdasarkan urutan-urutan proses bekerja yang saling
melengkapi.
Komponen – komponen pada NET.Framework adalah :
1. Common Language Runtime
Merupakan jembatan antara aplikasi net dengan sistem operasi.
2. Microsoft Intermediate Language
Merupakan bahasa program yang tidak diterjemahkan langsung kedalam bahsa biner
namun terlebih dahulu di terjemahkan kedalam bahasa Common Language Runtime
18
kemudian diterjemahkan kembali kedalam bahasa Microsoft Intermediate Language yang
baru akhirnya menghasilkan bahasa biner yang siap dijalankan.
3. Just in Time Complier
Just in Time Complier hanya melakukan komplikasi kode yang hanya dibutuhkan saja
sehingga lebih efisien.
4. Framework Class Library
Merupakan kumpulan class – class yang berjumlah ribuan didalam NET Framework.
Microsoft Visual Basic.NET terdiri dari 5 komponen utama yang tersusun dalam tiga lapisan
(layer) yaitu :
1. Visual Studio.NET
Microsoft Visual Studio.NET merupakan kumpulan perkembangan tools untuk
membangun aplikasi Web ASP, Xml Web Service, Aplikasi desktop dan Aplikasi Mobile.
Pada Aplikasi Visual Studio.NET ini bahasa-bahsa pemrograman yang digunakan seperti
Visual Basic, Visual C ++, dan Visual C.
2. Visual Basic.NET (VB NET)
Merupakan salah satu bahasa pemrograman yang bisa digunakan untuk membangun
aplikasi – apliaksi NET di Platform.
3. IDE Visual Basic
IDE (Integrated Development Environment) adalah perangkat lunak komputer yang
berfungsi untuk membantu pemrograman dalam mengembangkan perangkat lunak (tools
pendukung).
19
BAB III
METODOLOGI PENELITIAN
3.1 Data yang Digunakan
Pada penelitian ini data yang digunakan adalah dataset yang bertipe record,
berupa data struk belanja yang berisi merk produk pada swalayan Larisso di Ambulu –
Jember yang diperoleh mulai bulan Januari s/d September 2014. Data awal yang didapat
yaitu berupa data mentah sebanyak 16 struk belanja (120 dataset). Pada Gambar 3.1 dapat
dilihat salah satu contoh dari struk belanja. Data mentah tersebut akan diubah kedalam
bentuk record yang akan menjadi dataset sebanyak 16 record. Dataset ini terdiri dari 7
atribut. Adapun atribut-atribut yang dimaksud yaitu kode produk, nama produk, jumlah
produk, harga produk, total harga, tunai dan kembalian. Seluruh atribut pada dataset
selanjutnya akan diseleksi pada tahapan praproses data.
3.2 Praproses Data
Tahap praproses data merupakan tahap seleksi data yang bertujuan untuk
mendapatkan data yang bersih dan siap untuk digunakan dalam penelitian. Tahapan yang
dikerjakan adalah menentukan kelompok jenis produk dan menentukan kelompok
berdasarkan record dengan tujuan untuk mempermudah pemahaman terhadap isi record. Dan
juga melakukan seleksi dengan memperhatikan konsistensi data, missing value dan redundant
data.
3.2.1 Penentuan Kelompok Jenis Produk
Seperti yang dapat dilihat pada Gambar 3.1, terdapat beberapa atribut yaitu kode
produk, nama produk, jumlah produk, harga produk, total harga, tunai dan kembalian. Dari
semua atribut tersebut hanya beberapa yang akan digunakan dan dianggap cukup memenuhi
untuk dilakukannya penelitian. Adapun atribut tersebut yaitu nama produk dan jumlah
produk.
20
Gambar 3.1 Contoh Struk Belanja
Pada swalayan banyak sekali terdapat nama-nama produk ataupun merk-merk produk
yang tidak bisa disebutkan satu-satu. Mulai dari jenis produk sampai kegunaan produk
tersebut. Oleh karena itu penulis akan membuat pengelompokkan produk berdasarkan jenis-
jenisnya. Adapun pengelompokkan jenis produk sebagai berikut:
1. Makanan Ringan
Disini semua jenis makanan ringan seperti Salt Chesee, Krupuk, Permen, Koko
Krunch, Oreo dan lain-lain akan dikelompokkan ke dalam atribut makanan ringan.
2. Minuman
Semua jenis minuman mulai dari minuman botol, minuman kaleng, sirup dan juga
termasuk semua jenis susu dikelompokkan ke dalam atribut minuman.
3. Buah-buahan
Atribut ini berisi semua jenis buah-buahan.
21
4. Perawatan
Yang termasuk pada atribut ini yaitu perawatan rambut seperti shampoo, conditioner,
vitamin rambut dan lain-lain. Perawatan kulit seperti lotion, lulur, dan lain-lain.
Perawatan mandi atau peralatan mandi seperti sabun, sikat gigi, pasta gigi dan lain-lain.
5. Bahan Dapur
Bahan dapur seperti semua jenis indomie. Bumbu-bumbu dapur seperti kecap,
saos/sambal, merica, sasa, sajiku nasigoreng, gula, garam dan lain-lain dikelompokkan
ke dalam atribut bahan dapur.
6. Bahan Makanan
Semua jenis bahan makanan mulai dari sayur-sayuran, ayam, sarden, ikan, nugget dan
juga sossis termasuk ke dalam atribut bahan makanan.
7. Perlengkapan
Jenis produk yang termasuk pada atribut ini seperti pewangi baju, pewangi lantai, sabun
pencuci piring, pengharum ruangan, baygon dan lain-lain.
8. Obat-obatan
Segala jenis obat-obatan termasuk ke dalam atribut ini.
9. Rokok
Pada atribut ini berisi semua jenis rokok.
3.2.2 Penentuan Kelompok Berdasarkan Record
Tahap selanjutnya adalah mengubah data mentah (struk belanja) menjadi dataset
yang berisikan semua merk produk barang yang dibeli dalam bentuk record. Semua data
mentah merk produk barang sebanyak 16 struk belanja (120 dataset) dimasukkan dengan
jumlahnya dan kemudian dikelompokkan berdasarkan jenis produknya sehingga hasilnya
dapat dilihat pada Tabel 3.1 dan Tabel 3.2 berikut :
22
Tabel 3.1 Dataset Merk Produk
NO STRUK MERK PRODUK JUMLAH

1 Struk 1 Gula 6
2 Struk 1 Aqua Botol 1
3 Struk 1 Pocari Sweat 900 ML 1
4 Struk 1 Pocari Sweat 500 ML 1
5 Struk 1 Sprite 2
6 Struk 1 Frestea Botol 1
7 Struk 1 Salt Cheese 1
8 Struk 1 Kecap Bango 1
9 Struk 1 Hello Krupuk 1
10 Struk 1 Hello Stick Tahu 1
11 Struk 1 Butter Keju 1
12 Struk 1 Yupi Gummy 1
13 Struk 1 Sasa Tepung 1
14 Struk 1 Royco Bumbu Tempe 2
15 Struk 1 Laurier Maxi 1
16 Struk 1 Royco Bumbu Ayam 1
17 Struk 1 Antimo Cair 4
18 Struk 1 Tissue 1
19 Struk 1 Butter Coconut 1
20 Struk 1 Master Kids 1
22 Struk 1 Hers Protex 1
23 Struk 2 Zee Susu Bag 1
24 Struk 2 Zee Susu Sachet 10
25 Struk 3 Hers Protex 1
26 Struk 3 Tepung Vergo 1
29 Struk 3 Sajiku Nasgor 2
30 Struk 3 Baby Shampoo 1
31 Struk 3 Clear Shampoo 1
32 Struk 4 Koko Krunch 1
33 Struk 4 Handbody Marina 1
34 Struk 5 Susu Milo 1
35 Struk 5 Softener 1
23
37 Struk 5 Oreo 1
38 Struk 5 Gery Saluut 1
39 Struk 5 Nissin Wafer 1
40 Struk 5 Beng-beng 1
41 Struk 5 Fenesia Wafer 1
42 Struk 5 Molto 2
43 Struk 5 Lifebuoy 1
44 Struk 5 Pepsodent 1
45 Struk 5 Lux 1
46 Struk 6 Kecap Bango 1
50 Struk 6 Pucelle 1
53 Struk 7 Kayu Putih 2
55 Struk 7 Wismilak 3
56 Struk 7 ABC Saos 2
57 Struk 7 ABC Sambal 1
58 Struk 7 Champ Seafood 1
59 Struk 8 Gula 2
60 Struk 8 Champ Sosis 1
61 Struk 8 Fenesia Wafer 1
62 Struk 8 Sarimie Goreng 5
63 Struk 8 Indomie Goreng 1
64 Struk 8 Sasa Tepung 1
65 Struk 8 Yupi Gummy 1
67 Struk 9 Oreo 1
68 Struk 9 Nutrijel 1
69 Struk 9 Agarasa 2
70 Struk 10 Kayu Putih 2
71 Struk 10 Gula 2
72 Struk 10 Malkis Abon 1
73 Struk 10 Melon 1
74 Struk 10 ABC Sambal 1
24
75 Struk 10 Handbody Marina 2
76 Struk 11 Apel 10
78 Struk 11 G-Mild 1
79 Struk 11 Top Kopi 48
80 Struk 11 Mama Lemon 2
81 Struk 11 Jeruk 5
82 Struk 11 Dji Sam Soe 2
83 Struk 12 Strowbery 35
84 Struk 12 G-Mild 6
85 Struk 12 Nissin Wafer 10
86 Struk 12 Mizone 25
87 Struk 12 Apel 25
88 Struk 12 Anggur 35
89 Struk 12 Nivea 30
91 Struk 12 Mama Lemon 19
92 Struk 13 Sunlight 10
93 Struk 13 So Nice 10
94 Struk 13 Baygon 10
95 Struk 13 Mixagrip 8
96 Struk 13 Casablanca Parfum 52
97 Struk 13 Beng-beng 97
99 Struk 13 Jeruk 10
100 Struk 13 Nuvo 8
101 Struk 14 Apel 6
102 Struk 14 Kelengkeng 10
104 Struk 14 Nugget 5
105 Struk 14 Panadol 23
106 Struk 14 Lux 12
107 Struk 14 Djarum 17
108 Struk 15 Koyo Cabe 5
109 Struk 15 Djarum 10
110 Struk 15 Konimex 13
111 Struk 15 Superpel 19
112 Struk 15 Stella 29
25
113 Struk 15 Melon 10
114 Struk 16 Energen 2
115 Struk 16 Promild 5
116 Struk 16 Sarden 8
118 Struk 16 Bodrex 16
119 Struk 16 Belimbing 29
Tabel 3.2 Dataset Penentuan Jenis Produk
Struk Makanan Minu Buah- Pera Bahan Bahan Perleng Obat- Rokok
No Ke- Ringan man buahan watan Dapur Makanan kapan obatan
1 Struk 1 6 8 0 1 11 0 4 4 0
2 Struk 2 0 11 0 0 0 0 0 0 0
3 Struk 3 0 0 0 2 5 0 2 0 0
4 Struk 4 1 0 0 1 0 0 0 0 0
5 Struk 5 5 3 0 3 0 0 3 0 0
6 Struk 6 0 4 0 3 3 0 0 0 0
7 Struk 7 0 3 0 0 3 1 2 0 3
8 Struk 8 2 0 0 0 9 1 0 0 0
9 Struk 9 1 0 0 0 3 0 1 0 0
10 Struk 10 1 0 1 2 3 0 2 0 0
11 Struk 11 0 48 15 3 0 0 2 0 4
12 Struk 12 10 25 95 30 43 0 19 0 12
13 Struk 13 97 10 10 60 0 10 20 8 0
14 Struk 14 0 0 16 12 20 5 0 23 17
15 Struk 15 0 0 10 0 0 0 48 18 10
16 Struk 16 0 2 29 7 15 8 0 16 5
Dari tabel diatas dapat dilihat dataset berjumlah 16 record struk belanja dengan 9 jenis
produk. Dataset yang dimasukkan berupa merk produk apa saja yang dibeli dan berapa
jumlah merk produk yang dibeli oleh konsumen didalam satu struk kemudian di kelompokkan
berdasarkan jenis produknya.
26
3.3 Cleaning Data
Tahap selanjutnya adalah melakukan cleaning data terhadap data yang memiliki
missing value dan redundant data. Dikatakan missing value jika atribut- atribut dalam
dataset tidak berisi nilai atau kosong, sementara itu data dikatakan redundant jika
dalam satu dataset yang sama terdapat lebih dari satu record yang berisi nilai yang sama.
Pada dataset penjualan produk ini tidak banyak terdapat data yang missing value dan
redundant, jadi penulis melakukan pembersihan data seperti:
1. Dataset yang memiliki jumlah produk diatas 40 item.
Makanan Minu Buah- Pera Bahan Bahan Perleng Obat-

Struk Ke- Ringan man buahan watan Dapur Makanan kapan obatan Rokok
Struk 11 0 48 15 3 0 0 2 0 4
Struk 12 10 25 95 30 43 0 19 0 12
Struk 13 97 10 10 60 0 10 20 8 0
Struk 15 0 0 10 0 0 0 48 18 10
2. Pada dataset hanya terdapat satu produk saja yang dibeli.

Struk 2 0 11 0 0 0 0 0 0 0
3. Pada dataset hanya terdapat dua produk saja yang dibeli

Struk 4 1 0 0 1 0 0 0 0 0
4. Pada dataset hanya terdapat tiga produk saja yang dibeli

Struk 3 0 0 0 2 5 0 2 0 0
27
Struk 6 0 4 0 3 3 0 0 0 0
Struk 8 2 0 0 0 9 1 0 0 0
Struk 9 1 0 0 0 3 0 1 0 0
Setelah dilakukannya tahapan cleaning data terhadap dataset, maka didapat hasil
akhir sebanyak 6 record dengan 9 jenis produk dan mempunyai isi data yang relevan yang
dapat dilihat pada Tabel 3.3 berikut:
Tabel 3.3 Dataset yang telah di cleaning
No Struk Makanan Minu Buah- Pera Bahan Bahan Perleng Obat-

Ke- Ringan man buahan watan Dapur Makanan kapan obatan Rokok
1 Struk 1 6 8 0 1 11 0 4 4 0
2 Struk 5 5 3 0 3 0 0 3 0 0
3 Struk 7 0 3 0 0 3 1 2 0 3
4 Struk 10 1 0 1 2 3 0 2 0 0
5 Struk 14 0 0 16 12 20 5 0 23 17
6 Struk 16 0 2 29 27 15 8 0 16 5
3.4 Uji Coba dengan Algoritma K-Means Clustering
K-Means adalah salah satu metode data clustering non hirarki yang berusaha
mempartisi data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi
data ke dalam cluster sehingga data yang memiliki karakteristik yang sama
dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang
berbeda dikelompokkan ke dalam cluster yang lain.
Tahapan clustering dengan menggunakan K-Means dimulai dengan pembentukan
cluster dimana penulis di sini membagi cluster maksimal sesuai dengan jumlah dataset,
karena nantinya setiap cluster yang diinputkan dapat memilih data sheet untuk menentukan
nilai centroid akan tetapi dengan syarat nilai centroid tidak dapat muncul dengan nilai yang
sama. Kemudian dilakukan proses penghitungan jarak dari centroid dengan menggunakan
Euclidean Distance, di mana centroid diperoleh dari objek dataset yang telah diinputkan.
28
Adapun hasil dari centroid dari masing-masing cluster yang telah diinputkan ( misal
penginputan 3 cluster) berdasarkan pengelompokkan jenis produk dapat dilihat pada tabel
berikut ini.
1. Parameter Produk Makanan Ringan
Tabel 3.4 Centroid Produk Makanan Ringan
Cluster Centroid
C1 6
C2 5
C3 0
2. Parameter Produk Minuman

Tabel 3.5 Centroid Produk Minuman
Cluster Centroid
C1 8
C2 3
C3 2
3. Parameter Produk Buah-buahan

Tabel 3.6 Centroid Produk Buah-buahan
Cluster Centroid
C1 0
C2 16
C3 29
29
4. Parameter Produk Perawatan
Tabel 3.7 Centroid Produk Perawatan
Cluster Centroid
C1 1
C2 3
C3 2
5. Parameter Produk Bahan Dapur

Tabel 3.8 Centroid Produk Bahan Dapur
Cluster Centroid
C1 11
C2 3
C3 20
6. Parameter Produk Bahan Makanan

Tabel 3.9 Centroid Produk Bahan Makanan
Cluster Centroid
C1 1
C2 5
C3 8
30
7. Parameter Produk Perlengkapan
Tabel 3.10 Centroid Produk Perlengkapan
Cluster Centroid
C1 4
C2 3
C3 2
8. Parameter Produk Obat-obatan

Tabel 3.11 Centroid Produk Obat-obatan
Cluster Centroid
C1 4
C2 23
C3 16
9. Parameter Produk Rokok

Tabel 3.12 Centroid Produk Rokok
Cluster Centroid
C1 3
C2 17
C3 5
Setelah diketahui nilai centroid pada masing-masing cluster, tahap selanjutnya adalah
melakukan penghitungan untuk menentukan jarak setiap data dengan centroid yang telah
dibentuk dengan menggunakan rumus euclidiance distance. Hasil dari penghitungan jarak
dengan rumus euclidiance distance ini akan berpengaruh pada penempatan setiap merk
31
produk ke cluster tertentu. Setelah hasil dari jarak setiap data diperoleh tahapan selanjutnya
adalah mengelompokkan jarak data minimum atau terkecil dari masing-masing cluster
berdasarkan parameter jenis produknya.
3.4.1 Penghitungan jarak berdasarkan parameter jenis produk
Penghitungan jarak berdasarkan parameter produk antara jarak data terhadap nilai
centroid masing-masing cluster menggunakan rumus euclidiance distance (2.1) yaitu:
A. Parameter Produk Makanan Ringan
1. Jarak antara struk pertama dengan centroid pertama (C1)
d (1,1) = √(6 - 6) 2 = √ (0) 2 = 0
2. Jarak antara struk pertama dengan centroid kedua (C2)
d (1,2) = √(6 -5) 2 = √ (1) 2 = 1
3. Jarak antara struk pertama dengan centroid ketiga (C3)
d (1,3) = √(6 - 0) 2 = √ (6) 2 = 6
Penghitungan jarak data berdasarkan paramater produk makanan ringan dengan

centroid masing-masing cluster pada 6 record selanjutnya akan disajikan dalam bentuk Tabel
3.13 berikut :
Tabel 3.13 Hasil Penghitungan Jarak Dengan Paramater
Produk Makanan Ringan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 1 6
2 Struk 5 1 0 5
3 Struk 7 6 5 0
4 Struk 10 5 4 1
5 Struk 14 6 5 0
6 Struk 16 6 5 0
32
B. Parameter Produk Minuman
d (1,1) = √(8 - 8) 2 = √ (0) 2 = 0
d (1,2) = √(8 - 3) 2 = √ (5) 2 = 5
d (1,3) = √(8 - 2) 2 = √ (6) 2 = 6
Penghitungan jarak data berdasarkan paramater produk minuman dengan centroid

masing-masing cluster pada 6 record selanjutnya akan disajikan dalam bentuk Tabel 3.14
berikut :
Produk Minuman Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 5 6
2 Struk 5 5 0 1
3 Struk 7 5 0 1
4 Struk 10 8 3 2
5 Struk 14 8 3 2
6 Struk 16 6 1 0
C. Parameter Produk Buah - buahan

d (1,1) = √(0 - 0) 2 = √ (0) 2 = 0
d (1,2) = √(0 - 16) 2 = √ (-16) 2 = 16
d (1,3) = √(0 - 29) 2 = √ (-29) 2 = 29
33
Penghitungan jarak data berdasarkan paramater produk buah - buahan dengan
centroid masing-masing cluster pada 6 record selanjutnya akan disajikan dalam bentuk Tabel
3.15 berikut :
Produk Buah - buahan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 16 29
2 Struk 5 0 16 29
3 Struk 7 0 16 29
4 Struk 10 0 16 29
5 Struk 14 16 0 13
6 Struk 16 29 13 0
D. Parameter Produk Perawatan

d (1,1) = √(1 - 1) 2 = √ (0) 2 = 0
d (1,2) = √(1 - 3) 2 = √ (-2) 2 = 2
d (1,3) = √(1 - 2) 2 = √ (-1) 2 = 1
Penghitungan jarak data berdasarkan paramater produk perawatan dengan centroid

berikut :
34
Produk Perawatan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 2 1
2 Struk 5 2 0 1
3 Struk 7 1 3 2
4 Struk 10 1 1 0
5 Struk 14 11 9 10
6 Struk 16 6 4 5
E. Parameter Produk Bahan Dapur

d (1,1) = √(11 - 11) 2 = √ (0) 2 = 0
d (1,2) = √(11 - 3) 2 = √ (8) 2 = 8
d (1,3) = √(11 - 20) 2 = √ (-9) 2 = 9
Penghitungan jarak data berdasarkan paramater produk bahan dapur dengan

centroid masing-masing cluster pada 6 record selanjutnya akan disajikan dalam bentuk
Tabel 3.17 berikut :
35
Produk Bahan Dapur Masing-Masing cluster
Struk
No Ke- C1 C2 C3
1 Struk 1 0 8 9
2 Struk 5 11 3 20
3 Struk 7 8 0 17
4 Struk 10 8 0 17
5 Struk 14 9 17 0
6 Struk 16 4 12 5
F. Parameter Produk Bahan Makanan

d (1,1) = √(0 - 1) 2 = √ (-1) 2 = 1
d (1,2) = √(0 - 5) 2 = √ (-5) 2 = 5
d (1,3) = √(0 - 8) 2 = √ (-8) 2 = 8
Penghitungan jarak data berdasarkan paramater produk bahan makanan dengan

36
Produk Bahan Makanan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 1 5 8
2 Struk 5 1 5 8
3 Struk 7 0 4 7
4 Struk 10 1 5 8
5 Struk 14 4 0 3
6 Struk 16 7 3 0
G. Parameter Produk Perlengkapan

d (1,1) = √(4 - 4) 2 = √ (0) 2 = 0
d (1,2) = √(4 - 3) 2 = √ (1) 2 = 1
d (1,3) = √(4 - 2) 2 = √ (2) 2 = 2
Penghitungan jarak data berdasarkan paramater produk perlengkapan dengan

37
Produk Perlengkapan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 1 2
2 Struk 5 1 0 1
3 Struk 7 2 1 0
4 Struk 10 2 1 0
5 Struk 14 4 3 2
6 Struk 16 4 3 2
H. Parameter Produk Obat - obatan

d (1,1) = √(4 - 4) 2 = √ (0) 2 = 0
d (1,2) = √(4 - 23) 2 = √ (-19) 2 = 19
d (1,3) = √(4 - 16) 2 = √ (-12) 2 = 12
Penghitungan jarak data berdasarkan paramater produk obat - obatan dengan

38
Produk Obat - obatan Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 0 19 12
2 Struk 5 4 23 16
3 Struk 7 4 23 16
4 Struk 10 4 23 16
5 Struk 14 19 0 7
6 Struk 16 12 7 0
I. Parameter Produk Rokok

d (1,1) = √(0 - 3) 2 = √ (-3) 2 = 3
d (1,2) = √(0 - 17) 2 = √ (-17) 2 = 17
d (1,3) = √(0 - 5) 2 = √ (-5) 2 = 5
Penghitungan jarak data berdasarkan paramater produk rokok dengan centroid

berikut :
39
Produk Rokok Masing-Masing cluster
Struk
No C1 C2 C3
Ke-
1 Struk 1 3 17 5
2 Struk 5 3 17 5
3 Struk 7 0 14 2
4 Struk 10 3 17 5
5 Struk 14 14 0 12
6 Struk 16 2 12 0
3.4.2 Pengelompokkan Jarak Terkecil atau Minimum
Setelah melakukan penghitungan jarak data dengan masing-masing cluster, tahapan

selanjutnya adalah mengelompokkan jarak terkecil atau minimum disetiap masing-masing
cluster. Seperti pada Tabel 3.14, untuk data yang pertama atau struk pertama jarak yang
terkecil yaitu 0 dan terletak pada (C1). Maka data pertama akan menjadi anggota dari
cluster pertama. Untuk lebih jelasnya anggota data awal untuk masing-masing cluster
akan disajikan pada Tabel - tabel berikut:
Tabel 3.22 Anggota Data Masing-Masing Cluster

Produk Makanan Ringan
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
40
Produk Minuman
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16

Produk Buah - buahan
No Struk Ke- C1 C2 C3
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
41
Produk Perawatan
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16

Produk Bahan Dapur
Struk
No Ke- C1 C2 C3
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
42
Produk Bahan Makanan
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16

Produk Perlengkapan
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
43
Produk Obat –obatan
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16

Produk Rokok
Struk
No C1 C2 C3
Ke-
1 Struk 1
2 Struk 5
3 Struk 7
4 Struk 10
5 Struk 14
6 Struk 16
3.5 Perancangan Antarmuka Sistem
Pada perancangan antarmuka sistem ini akan dibahas bagaimana perancangan

flowchart sistem dan perancangan tampilan sistem.
3.5.1 Perancangan Flowchart Sistem
Flowchart sistem dibuat untuk menggambarkan bagaimana proses alur keseluruhan sistem
bekerja. Flowchart sistem dapat dilihat pada Gambar 3.2 berikut:
44
START
UPLOAD DATA STRUK
CLEANING DATA
INPUT PER
PARAMETER
INPUT JUMLAH
CLUSTER K
TENTUKAN HITUNG JARAK OBJEK

CENTROID DATA KE CENTROID
KELOMPOKKAN OBJEK
DATA BERDASARKAN
JARAK MIINIMUN KE
CENTROID
END
Gambar 3.2 Flowchart Sistem
45
3.5.2 Perancangan Tampilan Sistem
Perancangan tampilan digunakan untuk menggambarkan aplikasi yang sebenarnya.

Beberapa model tampilan implementasi dalam penelitian ini sebagai berikut :
1. Tampilan Praposes Data
TAMPILAN PRAPOSES DATA
CARI LOKASI DATASET
CARI KATEGORI DATASET
KATEGORI JUMLAH
DATASET PRODUK
Gambar 3.3 Tampilan Praposes Data
2. Tampilan Proses K-Means
TAMPILAN PROSES K-MEANS

PROSES
TAMPILAN CLEANING DATA
BANYAK CLUSTER PILIH PARAMETER
TAMPILAN CLUSTER
Gambar 3.4 Tampilan Proses K-Means
46
3. Tampilan Hasil
TAMPILAN HASIL
HASIL HASIL
PERHITUNGAN PENGKLUSTERAN
CLUSTER
Gambar 3.5 Tampilan Hasil
4. Tampilan Sorting Kelompok
TAMPILAN HASIL AKHIR
JUMLAH CLUSTER
HASIL PENGELOMPOKAN STRUK
Gambar 3.6 Tampilan Sorting Kelompok
47
BAB IV
HASIL DAN PEMBAHASAN
Pada bab ini akan dibahas hasil yang diperoleh dari pengujian yang telah dilakukan.
Data – data yang telah diperoleh, akan diolah untuk mendapatkan hasil pengelompokan merk
produk berdasarkan jenis produk yang dibeli dengan menggunakan algoritma K-Means.
Implementasi aplikasi pengelompokan merk produk dengan algoritma K-Means ini dibuat
menggunakan bahasa pemograman Visual Basic .Net. Pengujian kinerja sistem yang telah
dilakukan dengan menggunakan algoritma K-Means, yaitu penyelesaian clustering dengan
menghasilkan merk produk berdasarkan jenis produk pada cluster-nya.
4.1 Spesifikasi Sistem
Spesifikasi minimum sistem Hardware dan Software yang dibutuhkan untuk

menjalankan aplikasi sistem pengelompokan merk produk berdasarkan jenis produk dengan
menggunakan algoritma K-Means antara lain:
1. Hardware dan Software untuk pembuatan aplikasi :
a. Hardware :
1. Notebook Acer Intel Duel Core 2.66 HZ
2. Memory 1024 GB
b. Software :
1. Windows 7 Home Basic
2. Net Framework 4
3. DotnetBar 10.04
4.2 Implementasi Sistem
Inputan data berupa data struk yang berisi merk produk dari bulan Januari s/d
September tahun 2014. Sedangkan Output yang diperoleh berupa pengelompokan merk
produk berdasarkan jenis produknya.
48
4.2.1 Pengujian Sistem
A. Pengujian Menggunakan Parameter Produk Makanan Ringan

Dari hasil pengujian dengan menggunakan parameter Produk Makanan Ringan, maka
didapat gambaran sebagai berikut.
Gambar 4.1 Tampilan Proses K-Means Parameter

Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk makanan ringan
ada penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk makanan ringan. Setelah penginputan cluster tahapan selanjutnya adalah
menentukan nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 6, nilai
centroid C2 = 5, dan nilai centroid C3 = 0. Sehingga nanti akan dilakukan penghitungan dari
masing-masing merk produk makanan ringan dengan nilai centroid yang didapatkan
menggunakan rumus jarak euclidean distance (jarak kedekatan antar data). Hasil dari
penghitungan jarak dengan menggunakan rumus euclidean distance ini akan berpengaruh
pada penempatan setiap merk produk makanan ringan ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk makanan ringan.
49
Gambar 4.2 Tampilan Hasil Pengujian Parameter
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa penghitungan dengan menggunakan
jarak euclidean distance dari merk produk makanan ringan dengan centroid telah didapatkan
nilai masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai
cluster C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk
mengelompokkan merk produk makanan ringan, sehingga dapat diketahui pada cluster ke
berapa penempatan merk produknya. Hasil dari pengelompokkan cluster merk produk dapat
dilihat di interface sorting kelompok berdasarkan jenis produk makanan ringan.
50
Gambar 4.3 Tampilan Hasil Sorting Kelompok Parameter
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa hasil pengelompokkan merk produk
berdasarkan jenis produk makanan ringan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk makanan ringan sebanyak 6 item yaitu
Salt Cheese, Hello Krupuk, Hello Stick Tahu, Butter Keju, Butter Coconut dan Yupi
Gumi.
oreo, gery salut, Nissin wafer, Fenesia wafer, dan Beng-beng.
Malkis Abon.
B. Pengujian Menggunakan Parameter Produk Minuman

Dari hasil pengujian dengan menggunakan parameter Produk Minuman, maka didapat
gambaran sebagai berikut.
51
Produk Minuman
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk minuman ada
penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang didalamnya berisi
merk produk minuman. Setelah penginputan cluster tahapan selanjutnya adalah menentukan
nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 8, nilai centroid C2 = 3,
dan nilai centroid C3 = 2. Sehingga nanti akan dilakukan penghitungan dari masing-masing
merk produk minuman dengan nilai centroid yang didapatkan menggunakan rumus jarak
euclidean distance (jarak kedekatan antar data). Hasil dari penghitungan jarak dengan
menggunakan rumus euclidean distance ini akan berpengaruh pada penempatan setiap merk
produk minuman ke cluster tertentu, yang nantinya akan dapat dilihat hasilnya di interface
hasil pengujian jenis produk minuman
52
Produk Minuman
Keterangan :
jarak euclidean distance dari merk produk minuman dengan centroid telah didapatkan nilai
masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-masing nilai cluster
C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum untuk mengelompokkan
merk produk minuman, sehingga dapat diketahui pada cluster ke berapa penempatan merk
produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat di interface sorting
kelompok berdasarkan jenis produk minuman.
53
Produk Minuman
Keterangan :
berdasarkan jenis produk minuman yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk minuman sebanyak 5 item yaitu Aqua
Botol, Pocari Sweat 900 ml, Pocari Sweat 500 ml, Sprite, dan Frestea.
2. Dalam cluster C2 terdapat jumlah merk produk minuman sebanyak 2 item yaitu Susu
Milo dan Zee Susu Bag.
3. Dalam cluster C3 terdapat jumlah merk produk minuman sebanyak 1 item yaitu
Energen.
C. Pengujian Menggunakan Parameter Produk Buah-buahan

Dari hasil pengujian dengan menggunakan parameter Produk Buah-buahan, maka
54
Produk Buah-buahan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk buah-buahan
merk produk buah-buahan. Setelah penginputan cluster tahapan selanjutnya adalah
centroid C2 = 16, dan nilai centroid C3 = 29. Sehingga nanti akan dilakukan penghitungan
dari masing-masing merk produk buah-buahan dengan nilai centroid yang didapatkan
pada penempatan setiap merk produk buah-buahan ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk buah-buahan.
55
Produk Buah-buahan
Keterangan :
jarak euclidean distance dari merk produk buah-buahan dengan centroid telah didapatkan
mengelompokkan merk produk buah-buahan, sehingga dapat diketahui pada cluster ke berapa
penempatan merk produknya. Hasil dari pengelompokkan cluster merk produk dapat dilihat
di interface sorting kelompok berdasarkan jenis produk buah-buahan.
56
Produk Buah-buahan
Keterangan :
berdasarkan jenis produk buah-buahan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk buah-buahan sebanyak 1 item yaitu
Melon.
Apel dan Kelengkeng.
Belimbing.
D. Pengujian Menggunakan Parameter Produk Perawatan

Dari hasil pengujian dengan menggunakan parameter Produk Perawatan, maka didapat
57
Produk Perawatan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk perawatan ada
merk produk perawatan. Setelah penginputan cluster tahapan selanjutnya adalah menentukan
nilai centroid secara random, yaitu didapatkan nilai centroid C1 = 1, nilai centroid C2 = 3,
dan nilai centroid C3 = 2. Sehingga nanti akan dilakukan penghitungan dari masing-masing
merk produk perawatan dengan nilai centroid yang didapatkan menggunakan rumus jarak
euclidean distance (jarak kedekatan antar data). Hasil dari penghitungan jarak dengan
menggunakan rumus euclidean distance ini akan berpengaruh pada penempatan setiap merk
produk perawatan ke cluster tertentu, yang nantinya akan dapat dilihat hasilnya di interface
hasil pengujian jenis produk perawatan.
58
Produk Perawatan
Keterangan :
jarak euclidean distance dari merk produk perawatan dengan centroid telah didapatkan nilai
merk produk perawatan, sehingga dapat diketahui penempatan pada cluster ke berapa merk
kelompok berdasarkan jenis produk perawatan.
59
Produk Perawatan
Keterangan :
berdasarkan jenis produk perawatan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk perawatan sebanyak 1 item yaitu Master
Kids.
2. Dalam cluster C2 terdapat jumlah merk produk perawatan sebanyak 3 item yaitu
Pepsodent, Lux, dan Lifebuoy.
3. Dalam cluster C3 terdapat jumlah merk produk perawatan sebanyak 1 item yaitu
Handbody Marina.
E. Pengujian Menggunakan Parameter Produk Bahan Dapur

Dari hasil pengujian dengan menggunakan parameter Produk Bahan Dapur, maka
60
Produk Bahan Dapur
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk bahan dapur ada
merk produk bahan dapur. Setelah penginputan cluster tahapan selanjutnya adalah
masing-masing merk produk bahan dapur dengan nilai centroid yang didapatkan
pada penempatan setiap merk produk bahan dapur ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk bahan dapur.
61
Produk Bahan Dapur
Keterangan :
jarak euclidean distance dari merk produk bahan dapur dengan centroid telah didapatkan nilai
merk produk bahan dapur, sehingga dapat diketahui pada cluster ke berapa penempatan merk
kelompok berdasarkan jenis bahan dapur.
62
Produk Bahan Dapur
Keterangan :
berdasarkan jenis produk bahan dapur yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk bahan dapur sebanyak 3 item yaitu
Gula, Royco Bumbu Tempe, dan Royco Bumbu Ayam.
2. Dalam cluster C2 terdapat jumlah merk produk bahan dapur sebanyak 2 item yaitu ABC
Saos dan ABC Sambal.
3. Dalam cluster C3 terdapat jumlah merk produk bahan dapur sebanyak 1 item yaitu
Indomie Goreng.
F. Pengujian Menggunakan Parameter Produk Bahan Makanan

Dari hasil pengujian dengan menggunakan parameter Produk Bahan Makanan, maka
63
Gambar 4.16 Tampilan Proses K-Means Paramater
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk bahan makanan
merk produk bahan makanan. Setelah penginputan cluster tahapan selanjutnya adalah
masing-masing merk produk bahan dapur dengan nilai centroid yang didapatkan
pada penempatan setiap merk produk bahan makanan ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk bahan makanan.
64
Keterangan :
jarak euclidean distance dari merk produk bahan makanan dengan centroid telah didapatkan
mengelompokkan merk produk bahan makanan, sehingga dapat diketahui pada cluster ke
berapa penempatan merk produknya. Hasil dari pengelompokkan cluster merk produk dapat
dilihat di interface sorting kelompok berdasarkan jenis bahan makanan.
65
Keterangan :
berdasarkan jenis produk bahan makanan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk bahan makanan sebanyak 1 item yaitu
Cham Seafood.
Nugget.
Sarden.
G. Pengujian Menggunakan Parameter Produk Perlengkapan

Dari hasil pengujian dengan menggunakan parameter Produk Perlengkapan, maka
66
Produk Perlengkapan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk bahan
perlengkapan ada penginputan 3 cluster yaitu cluster C1, cluster C2, dan cluster C3 yang
didalamnya berisi merk produk bahan perlengkapan. Setelah penginputan cluster tahapan
selanjutnya adalah menentukan nilai centroid secara random, yaitu didapatkan nilai centroid
C1 = 4, nilai centroid C2 = 3, dan nilai centroid C3 = 2. Sehingga nanti akan dilakukan
penghitungan dari masing-masing merk produk bahan perlengkapan dengan nilai centroid
yang didapatkan menggunakan rumus jarak euclidean distance (jarak kedekatan antar data).
Hasil dari penghitungan jarak dengan menggunakan rumus euclidean distance ini akan
berpengaruh pada penempatan setiap merk produk bahan perlengkapan ke cluster tertentu,
yang nantinya akan dapat dilihat hasilnya di interface hasil pengujian jenis produk bahan
perlengkapan.
67
Produk Perlengkapan
Keterangan :
jarak euclidean distance dari merk produk bahan perlengkapan dengan centroid telah
didapatkan nilai masing-masing cluster, seperti tampilan gambaran diatas dan dari masing-
masing nilai cluster C1, C2, dan C3 akan di tentukan jarak paling terkecil atau minimum
untuk mengelompokkan merk produk bahan perlengkapan, sehingga dapat diketahui pada
cluster ke berapa penempatan merk produknya. Hasil dari pengelompokkan cluster merk
produk dapat dilihat di interface sorting kelompok berdasarkan jenis bahan perlengkapan.
68
Produk Perlengkapan
Keterangan :
berdasarkan jenis produk bahan perlengkapan yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk perlengkapan sebanyak 3 item yaitu
Laurier Maxi, Hers Protex, dan Tissue.
Molto dan Softener.
Kayu Putih.
H. Pengujian Menggunakan Parameter Produk Obat-obatan

Dari hasil pengujian dengan menggunakan parameter Produk Obat-obatan, maka
69
Produk Obat-obatan
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk obat-obatan ada
merk produk obat-obatan. Setelah penginputan cluster tahapan selanjutnya adalah
centroid C2 = 23, dan nilai centroid C3 = 16. Sehingga nanti akan dilakukan penghitungan
dari masing-masing merk produk obat-obatan dengan nilai centroid yang didapatkan
pada penempatan setiap merk produk obat-obatan ke cluster tertentu, yang nantinya akan
dapat dilihat hasilnya di interface hasil pengujian jenis produk obat-obatan.
70
Produk Obat-obatan
Keterangan :
jarak euclidean distance dari merk produk obat-obatan dengan centroid telah didapatkan nilai
merk produk obat-obatan, sehingga dapat diketahui pada cluster ke berapa penempatan merk
kelompok berdasarkan jenis obat-obatan.
71
Produk Obat-obatan
Keterangan :
berdasarkan jenis produk obat-obatan yaitu sebagai berikut :
Antimo Cair.
Panadol.
Bodrex.
I. Pengujian Menggunakan Parameter Produk Rokok

Dari hasil pengujian dengan menggunakan parameter Produk Rokok, maka didapat
72
Produk Rokok
Keterangan :
Dari hasil gambaran diatas dapat diketahui bahwa berdasarkan produk rokok ada
merk produk rokok. Setelah penginputan cluster tahapan selanjutnya adalah menentukan nilai
centroid secara random, yaitu didapatkan nilai centroid C1 = 3, nilai centroid C2 = 17, dan
nilai centroid C3 = 5. Sehingga nanti akan dilakukan penghitungan dari masing-masing merk
produk rokok dengan nilai centroid yang didapatkan menggunakan rumus jarak euclidean
distance (jarak kedekatan antar data). Hasil dari penghitungan jarak dengan menggunakan
rumus euclidean distance ini akan berpengaruh pada penempatan setiap merk produk rokok
cluster tertentu, yang nantinya akan dapat dilihat hasilnya di interface hasil pengujian jenis
produk rokok.
73
Produk Rokok
Keterangan :
jarak euclidean distance dari merk produk rokok dengan centroid telah didapatkan nilai
merk produk rokok, sehingga dapat diketahui pada cluster ke berapa penempatan merk
kelompok berdasarkan jenis rokok.
74
Produk Rokok
Keterangan :
berdasarkan jenis produk rokok yaitu sebagai berikut :
1. Dalam cluster C1 terdapat jumlah merk produk rokok sebanyak 1 item yaitu Wismilak.
2. Dalam cluster C2 terdapat jumlah merk produk rokok sebanyak 1 item yaitu Djarum.
3. Dalam cluster C3 terdapat jumlah merk produk rokok sebanyak 1 item yaitu Promild
4.2.2 Hasil Clustering
Berdasarkan pengujian yang telah dilakukan dalam menentukan tata letak merk produk
berdasarkan jenis produknya di swalayan Larisso Ambulu-Jember, maka dapat diperoleh hasil
sebanyak 3 cluster yaitu cluster C1, cluster C2, dan cluster C3. Dan dari masing-masing merk
produk berdasarkan jenis produknya nantinya akan menempati cluster yang telah ditentukan.
Dan untuk lebih jelasnya, hasil clustering merk produk berdasarkan jenis produknya akan
disajikan pada tabel 4.1 berikut ini :
75
Tabel 4.1 Hasil Clustering
JENIS PRODUK CLUSTER C1 CLUSTER C2 CLUSTER C3

Salt Cheese Oreo Malkis Abon
Hello Krupuk Gery Salut
Hello Stick Tahu Nissin Wafer
Makanan Ringan
Butter Keju Fenesia Wafer
Butter Coconut Beng-beng
Yupi Gumi
Aqua Botol Susu Milo Energen
Pocari Sweat 900 ml Zee Susu Bag
Minuman Pocari Sweat 300 ml
Sprite
Frestea
Melon Apel Belimbing
Buah-Buahan
Kelengkeng
Master Kids Pepsodent Handbody Marina
Perawatan Lux
Lifebuoy
Gula ABC Saos Indomie Goreng
Bahan Dapur Royco Bumbu Tempe ABC Sambal
Royco Bumbu Ayam
Bahan Makanan Champ Seafood Nugget Sarden
Laurier Maxi Molto Kayu Putih
Perlengkapan Hers Protex Softener
Tissue
Obat-obatan Antimo Cair Panadol Bodrex
Rokok Wismilak Djarum Promild
76
4.2.3 Denah Tata Letak Awal dan Setelah Clustering
A. Tata Letak Awal Produk
Rak 1 Rak 2 Rak 3

Makanan Ringan Obat-obatan Bahan Dapur
Minuman Rokok Bahan Makanan
Rak 4 Rak 5
Perlengkapan Buah-buahan
Perawatan
Gambar 4.28 Denah Tata Letak Awal Produk

Keterangan :
Dari gambar diatas dapat di peroleh gambaran tata letak awal di Swalayan Larisso Ambulu-
Jember yaitu sebagai berikut :
1. Di dalam Rak 1 berisi semua jenis produk makanan ringan dan minuman.
2. Di dalam Rak 2 berisi semua jenis produk obat-obatan dan rokok.
3. Di dalam Rak 3 berisi semua jenis produk bahan dapur dan bahan makanan.
4. Di dalam Rak 4 berisi semua jenis produk perlengkapan dan perawatan.
5. Di dalam Rak 5 berisi semua jenis produk buah-buahan.
B. Tata Letak Merk Produk Setelah Clustering
Cluster C1
Merk Produk :
Salt Cheese, Hello Krupuk Tahu, Hello Stick
Tahu, Butter Keju, Butter Coconut, Yupi
Gumi
Jenis Produk : Cluster C2
Makanan Ringan Merk Produk :
Oreo, Gery Salut, Nissin Wafer, Fenesia
Wafer, Beng-beng
Cluster C3
Merk Produk :
Malkis Abon
77
Cluster C1
Merk Produk :
Aqua Botol, Pocari Sweat 900 ml, Pocari
Sweat 300 ml, Sprite, Frestea
Minuman Merk Produk :
Susu Milo, Zee Susu Bag
Cluster C3
Merk Produk :
Energen
Cluster C1
Merk Produk :
Melon
Cluster C2
Jenis Produk : Merk Produk :
Buah-buahan Apel, Kelengkeng
Cluster C3
Merk Produk :
Belimbing
Cluster C1
Merk Produk :
Master Kids
Cluster C2
Perawatan Pepsodent, Lux, Lifebuoy
Cluster C3
Merk Produk :
Handbody Marina
Cluster C1
Merk Produk :
Gula, Royco Bumbu Tempe, Royco Bumbu
Ayam
Bahan Dapur Merk Produk :
ABC Saos, ABC Sambal
Cluster C3
Merk Produk :
Indomie78Goreng
Handbody Marina
Cluster C1
Merk Produk :
Champ Seafood
Cluster C2
Bahan Makanan Nugget
Cluster C3
Merk Produk :
Sarden
Cluster C1
Merk Produk :
Laurier Maxi, Hers Protex, Tissue
Cluster C2
Perlengkapan Molto, Softener
Cluster C3
Merk Produk :
Kayu Putih
Cluster C1
Merk Produk :
Antimo Cair
Cluster C2
Obat-obatan Panadol
Cluster C3
Merk Produk :
Bodrex
Cluster C1
Merk Produk :
Wismilak
Rokok Merk Produk :
Djarum
Cluster C3
Merk Produk :
Promild
Gambar 4. 29 Denah Tata Letak Merk Produk Setelah Clustering
79
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan Uraian dari bab – bab sebelumnya dan pengujian yang telah dilakukan
maka dapat diambil kesimpulan sebagai berikut :
1. Dengan menerapkan algoritma K-Means Clustering didapatkan sebuah model tata letak
merk produk berdasarkan jenis produk di Swalayan Larisso Ambulu-Jember, sehingga
dapat memudahkan konsumen dalam menemukan merk produk yang akan dibelinya.
2. Penentuan tata letak merk produk berdasarkan jenis produknya terbagi menjadi 3 cluster,
yaitu cluster C1, cluster C2, dan cluster C3, yang telah dilakukan penghitungan dengan
menggunakan algoritma K-Mens Clustering, sehingga dapat diketahui pada cluster ke
berapa penempatan merk produk berdasarkan jenis produknya di Swalayan Larisso
Ambulu-Jember.
5.2 Saran
Mengingat masih banyaknya hal-hal yang belum dapat diimplementasikan pada

penelitian ini, maka penulis mempertimbangkan beberapa saran untuk perbaikan dalam
skripsi ini, yaitu :
1. Untuk mendapatkan hasil yang lebih variatif penelitian ini dapat juga dikembangkan
dengan teknik data mining yang lain seperti algoritma Hierarchical Clustering,
algoritma K-Nearest Neighbor atau algoritma Fuzzy Clustering.
2. Untuk mendapatkan akurasi nilai yang lebih akurat, dapat digunakan algoritma K-
Nearest Neighbor. Karena algoritma ini memiliki keakuratan yang lebih tinggi
dibandingkan dengan algoritma K-Means
80
DAFTAR PUSTAKA
Asri, Marwan. Marketing, Edisi 2. Yogyakarta : AMP YKPN, 1991.

Agusta, Y. 2007. K-means penerapan, permasalahan dan metode terkait. Jurnal Sistem dan
Informatika Vol.3 : 47-60.
Dubes, R. C. & Jain, A. K. 1988. Algorithms For Clustering Data. New Jersey: Prentice
Hall
Fayyad, U. M. 1996. Advances In Knowledge Discovery and Data Mining. Camberidge.
MA: The MIT Press.
Hammouda, K. & Karray, F. 2003. A Comparative Study of Data Clustering Techniques.
Canada: University of Waterloo.
Han, J. and Kamber, M, 2006. Data Mining Concepts and Techniques Second Edition.
Morgan Kauffman, San Francisco.
http://analisis-proses-bisnis-koperasi.blogspot.com/2013/04/pengertian-data-mining-text-
mining-dan.html (diakses tanggal 27 maret 2014)
http://frestiaannurjanah.blogspot.com/2013/01/tata-letak-proses-produk.html (diakses tanggal
19 Desember 2014)
http://pojokambulu.wordpress.com/2012/08/05/ambulu-jember/ (diakses tanggal 19 Desember
2014 )
http://romisatriawahono.net/2012/08/07/kiat-menyusun-kerangka-pemikiran-penelitian/
(diakses tanggal 20 Desember 2014)
http://yudiagusta.wordpress.com/clustering/ (diakses tanggal 27 maret 2014)
Kusrini & Luthfi, E. T. 2009. Algoritma Data Mining. Yogyakarta: Andi.
Larose, D. T. 2005. Discovering Knowledge In Data: An Introduction To Data Mining. Jhon
Willey & Sons, Inc.
MacQueen, J.B. 1967. Some Methods For Classification and Analysis of Multivariate
Observations. 5-th Berkeley Symposium on Mathematical Statistics and Probability.
Berkeley, University of California Press. (pp. 1:281-297).
Moertini, V. S. 2002. Data mining sebagai solusi bisnis. Integral, vol 7 no.1. 87
Piatetsky, G. & Shapiro. 2006. An Introduction Machine Learning, data mining, and
Knowledge discovery, Course in data mining Kdnuggets.
Ponniah, P. 2001. Datawarehouse Fundamentals: A Comprehensive Guide For IT
81
Professional. Jhon Willey & Sons, Inc.
roinahsmart.blogspot.com/2012/11/pengertian-microsoft-visual-basic-net.html
(diakses tanggal 27 maret 2014)
RuiXu & Donald, C.W. 2009. Clustering. John Wiley & Sons, Inc.
Santosa, B. 2007. Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis.
Yogyakarta:Graha Ilmu.
.
82
Biodata Penulis
NIM : 1210652018
Nama : Indri Dwi Rukmana
Judul TA : IMPLEMENTASI ALGORITMA

K-MEANS CLUSTERING UNTUK MENENTUKAN TATA
LETAK MERK PRODUK BERDASARKAN JENIS PRODUK
DI SWALAYAN LARISSO AMBULU - JEMBER
Tempat Lahir : Jember

Tanggal Lahir : 27/06/1989
Jenis Kelamin : Perempuan
Alamat : Perum Bumi Ambulu Permai Blok AA.4 Ambulu
No. Telepon : 085236131539
Angkatan : 2012
Fakultas : Teknik
Jurusan : S1-Teknik Informatika
Dosen Pembimbing I : Daryanto S.Kom.,M.Kom
Dosen Pembimbing II : Lutfi Ali Muharom, S.Si
83

Umj 1x Indridwiru 1775 1 Artikel L

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Umj 1x Indridwiru 1775 1 Artikel L

Diunggah oleh

Hak Cipta:

Format Tersedia

TUGAS AKHIR

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING

Indri Dwi Rukmana

PROGRAM STUDI TEKNIK INFORMATIKA

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING

Disusun Untuk Melengkapi dan Memenuhi Syarat Kelulusan Program Strata 1

Indri Dwi Rukmana

PROGRAM STUDI TEKNIK INFORMATIKA

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING

Dosen Penguji I Dosen Pembimbing I

Yeni Dwi Rahayu, M.Kom Daryanto, S.Kom., M.Kom

NPK. 11 03 590 NPK. 11 03 589

Yulio Rahmadi, S,Kom Lutfi Ali Muharom, S.Si

Ir. Rusgianto, MM iii Agung Nilogiri S.T., M.Kom

Yang bertanda tangan di bawah ini :

Nama : Indri Dwi Rukmana

Jurusan : Teknik Informatika

Tempat dan Tanggal Lahir : Jember, 27 Juni 1989

Alamat : Perumahan Bumi Ambulu Permai blok AA.4

Dengan ini menyatakan dengan sesungguhmya bahwa saya benar-benar membuat

“S.Kom” Jurusan Teknik Informatika Fakultas Teknik, Universitas Muhammadiyah Jember

dengan judul “Implementasi Algoritma K-Means Clustering Untuk Menentukan Tata

diberikan oleh yang berwenang.

Jember, 21 Januari 2015

Indri Dwi Rukmana

3. My Dear yang selalu ada di sampingku, mendengarkan semua keluh kesahku,

4. Para dosen-dosen ku, terutama pembimbingku di Universitas Muhammadiyah Jember

5. Teman – teman seperjuanganku yang selalu memberiku semangat.

“ Bersabar, Berusaha, dan Bersyukur. Bersabar dalam berusaha, berusaha dengan

Jember, 21 Januari 2014

Kata Kunci: tata letak merk produk ; algoritma k-means clustering.

Keywords: brands product layout; k-means clustering algorithm.

1.1 Latar Belakang

1.2 Perumusan Masalah

1.3 Batasan Masalah

1.4 Tujuan Penelitian

Tujuan dari Tugas Akhir ini adalah :

1.5 Manfaat Penelitian

2.1 Defenisi Swalayan

2.2 Profil Swalayan Larisso Ambulu

Ambulu adalah sebuah kecamatan di Kabupaten Jember, Provinsi Jawa Timur,

Gambar 2.1 Struktur Organisasi Swalayan Larisso Ambulu

2.3 Tata Letak

2.4 Data Mining

Gambar 2.2 Kajian Umum Data Mining

2.4.1 Tahapan Data Mining

2.4.2 Pengelompokan Data Mining

2.5.1 Partitioning Clustering

2.6 Algoritma K-Means

2.7 Microsoft Visual Basic.NET

3.1 Data yang Digunakan

3.2 Praproses Data

3.2.1 Penentuan Kelompok Jenis Produk

3.2.2 Penentuan Kelompok Berdasarkan Record

NO STRUK MERK PRODUK JUMLAH

Tabel 3.2 Dataset Penentuan Jenis Produk

Makanan Minu Buah- Pera Bahan Bahan Perleng Obat-

2. Pada dataset hanya terdapat satu produk saja yang dibeli.

Makanan Minu Buah- Pera Bahan Bahan Perleng Obat-

3. Pada dataset hanya terdapat dua produk saja yang dibeli

Makanan Minu Buah- Pera Bahan Bahan Perleng Obat-

4. Pada dataset hanya terdapat tiga produk saja yang dibeli

No Struk Makanan Minu Buah- Pera Bahan Bahan Perleng Obat-