Anda di halaman 1dari 67

IMPLEMENTASI ALGORITMA K-MEANS DALAM PENCATATAN

BARANG YANG LAKU TERJUAL PADA CV.RUMAH DECOR

LAPORAN PRAKTEK KERJA LAPANGAN


TEKNIK INFORMATIKA STRATA 1

OLEH :

DEVID SUDIRMAN

11101152630262

DIKRI HIDAYATULLAH

11101152630263

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS ILMU KOMPUTER
UNIVERSITAS PUTRA INDONESIA YPTK
PADANG
2014

21

LEMBAR PENGESAHAN PENGUJI

Devid Sudirman

1110115260262

Dikri Hidayatullah 1110115260263

PROGRAM STUDI TEKNIK INFORMATIKA

Praktek Kerja Lapangan ini telah dinyatakan LULUS oleh


Penguji Materi Program Studi Strata 1 Ilmu Komputer
Program Studi Teknik Informatika
Universitas Putra Indonesia YPTK Padang

Padang, Mei 2014


Mengetahui,

Disetujui Oleh

Ketua Program Studi,

(Rini Sovia,S.kom,M.kom)
NIDN :

Penguji Materi,

(Eka Praja Wiyata Mandala,S.kom,M.kom)


NIDN :

22

ABSTRACT
This report describe about Tanagra software application on data
mining.Tanagra is data mining software wivhcan be use to access some existing data
mining method.Data is built using excel with text type.This application use the
dataset of input.
In implementing this program algorithm test data used is the data item in the
RUMAH DEKOR.In this application,use in the application of clustering using Kmeans algorithm.

Keyword : K-means,Clustering,Data Mining.

23

ABSTRAK
Laporan menjelaskan tentang aplikasi perangkat lunak tanagra pada data
mining. Tanagra adalah software data mining yang dapat digunakan untuk
mengakses beberapa metode data mining yang ada. Data dibangun menggunakan
excel deengan jenis teks data. Aplikasi ini menggunakan dataset input dataset input.
Dalam melaksanakan pengujian algoritma ini data yang dipakai adalah data
barang di CV.RUMAH DEKOR. Dalam penerapan ini, digunakan penerapan
clustering dengan menggunakan algoritma K-means.

Kata kunci : K-means, Clustering, Data Mining.

24

KATA PENGANTAR

Segala puji hanya milik Allah SWT. Shalawat dan salam selalu
tercurahkan kepada Rasulullah SAW. Berkat limpahan dan rahmat-Nya penulis
telah mampu menyelesaikan laporan praktek kerja lapangan.
Dalam penyusunan laporan ini, tidak sedikit hambatan yang kami hadapi.
Namun kami menyadari bahwa kelancaran dalam penyusunan materi ini tidak lain
berkat bantuan, dorongan dari berbagai pihak dan kami ucapkan terima kasih kepada
kepada berbagai pihak yang telah membantu kelancaran dalam penyelesaian laporan
praktek kerja lapangan ini, diantaranya:
1. Bapak H. Herman Nawas selaku ketua Yayasan Perguruan Tinggi
Komputer Padang.
2. Bapak Dr. Sarjon Defit,S.kom,M.sc selaku rektor Universitas Putra
Indonesia YPTK Padang.
3. Bapak Julius Santony,S.kom,M.kom selaku Dekan Fakultas Ilmu
Komputer.
4. Ibu Rini Sovia,S.kom,M.kom selaku Ketua Program Studi Teknik
Informatika.
5. Bapak Eka Praja Wiyata Mandala,S.kom,M.kom selaku Sekretaris
Program Studi Teknik Informatika dan pembimbing penulis dalam
menyelesaikan laporan praktek kerja lapangan (PKL) ini.

25

6. Orang Tua penulis yang selalu memberikan semangat dan dukungan


kepada penulis dalam penyelesaian laporan praktek kerja lapangan
(PKL) ini.
7. Teman-teman Teknik Informatika yang sama-sama memberikan
bantuan, masukan, dan sarannya demi penyelesaian laporan praktek
kerja laporan (PKL) ini.
Dan masih banyak lagi pihak-pihak lain yang tidak mungkin penulis
sebutkan satu persatu atas semua bantuan yang telah diberikan kepada penulis.
Penulis mengharapkan semoga laporan kerja lapangan (PKL) ini dapat
memberikan manfaat bagi penulis sendiri dan par pembaca. Semoga Allah SWT
selalu mencurahkan rahmat dan karunia-Nya kepada kita semua.

Padang ,Mei 2014

Penulis

26

DAFTAR ISI

HALAMAN JUDUL

HALAMAN PENGESAHAN PENGUJI

ii

ABSTRACT

iii

ABSTRAK

iv

KATA PENGANTAR

DAFTAR ISI

vii

DAFTAR GAMBAR

DAFTAR TABEL

xii

DAFTAR LAMPIRAN
BAB I PENDAHULUAN

1.1 Latar Belakang Masalah

1.2 Perumusan Masalah

1.3 Hipotesa

1.4 Batasan Masalah

1.5 Tujuan Penelitian

1.6 Manfaat Penelitian

1.7 Gambaran Umum Perusahaan

1.7.1 Latar Belakang CV.Rumah Decor

1.7.2 Visi dan Misi Toko Rumah Decor

1.7.3 Struktur Organisasi CV.Rumah Decor

BAB II LANDASAN TEORI


2.1 Konsep Dasar Data Mining

7
7

27

2.1.1 Defenisi Data Mining

2.1.2 Kategori Data Mining

2.1.3 Proses Data Mining

2.2 Clustering

2.2.1 Proses Clustering

2.2.2 Karakteristik Clustering

11

2.2.3 Metode Pengelompokan

13

2.2.4 Analisa Cluster

13

2.3 Algoritma K-Means

14

2.3.1 Defenisi K-Means

14

2.3.2 Proses K-Means

15

BAB III METODOLOGI PENELITIAN

17

3.1 Kerangka Penelitian

17

3.2 Tahapan Penelitian

18

3.2.1 Penelitian Pendahuluan

18

3.2.2 Pengumpulan Data

18

3.2.3 Analisa

18

3.2.4 Perancangan

19

3.2.5 Implementasi

19

3.2.6 Pengujian

19

BAB IV ANALISA DAN PERANCANGAN

20

4.1 Analisa Penjualan pada CV.Rumah Decor

20

4.2 Analisis Clustering dengan Algoritma K-Means

20

4.3 Perancangan dan Proses Clustering

22

28

BAB V IMPLEMENTASI DAN PENGUJIAN


5.1 Analisis Software Data mining Tanagra 1.4.50

29
29

5.1.1 Pengenalan Tampilan Dari Tanagra

29

5.1.2 Pengujian Sistem dan Penjelasan Bentuk data yang di olah

32

5.2 Panduan Penggunaan (User Guide)

32

5.3 Spesifikasi Minimum Software Data Mining Tanagra 1.4.50

33

5.4 Tahap Instalasi Software Tanagra 1.4.50

33

5.5 Pengujian Sistem dan Penjelasan

37

5.5.1 Input Dataset

37

5.5.2 Descriptive statistics

38

5.5.3 The Active Variables

40

5.5.4 K-Means

41

5.5.5 Interpretation Of Groups

43

5.5.6 Export Dataset

49

BAB VI PENUTUP

52

6.1 Kesimpulan

52

6.2 Keterbatasan Sistem

52

6.3 Saran

53

DAFTAR PUSTAKA

54

29

DAFTAR GAMBAR

Gambar 1.1 Struktur Organisasi CV.Rumah Decor

Gambar 2.1 Proses Data Mining

Gambar 2.2 Data Sebelum di Klasterisasi

10

Gambar 2.3 Klasterisasi Berdasarkan Kesamaan Warna

10

Gambar 2.4 Klasterisasi Berdasarkan Kesamaan Bentuk

10

Gambar 2.5 Klasterisasi Berdasarkan Kesamaan Jarak

11

Gambar 2.6 Karakteristik Klasterisasi

12

Gambar 3.1 Kerangka Penelitian

17

Gambar 4.1 Flowchart Proses K-Means

23

Gambar 5.1 Bentuk GUI

30

Gambar 5.2 Input Data

30

Gambar 5.3 Komponen Tanagra

31

Gambar 5.4 Diagram Tanagra

31

Gambar 5.5 Output Tanagra

31

Gambar 5.6 Tanagra 1.4.50 Setup

34

Gambar 5.7 License Agreemant

34

Gambar 5.8 Choose Install Location

35

Gambar 5.9 Ready to Install

35

Gambar 5.10 Installing Progres

36

Gambar 5.11 Tanagra 1.4.50 Finishing

36

Gambar 5.12 Input Dataset

37

Gambar 5.13 Data Description

38

Gambar 5.14 Define Status Define 1 Target

39

30

Gambar 5.15 Define Status 1 Input

39

Gambar 5.16 Tampilan UNIVARIATE CONT STAT

40

Gambar 5.17 Tampilan Standardize

41

Gambar 5.18 Define Status 2 Input

41

Gambar 5.19 Parameter K-Means

42

Gambar 5.20 View K-Means

42

Gambar 5.21 View Dataset

43

Gambar 5.22 Define Status 3 Target

44

Gambar 5.23 Define Status 3 input

44

Gambar 5.24 View Group Characterization

45

Gambar 5.25 Define Status 4 Target

45

Gambar 5.26 Define Status 4 Input

46

Gambar 5.27 View Contingensy Chi Square 1

47

Gambar 5.28 View Scatterplot 1

47

Gambar 5.29 Principal Component Analysis

48

Gambar 5.30 View Scatterplot 2

49

Gambar 5.31 Define Status 5 Input

50

Gambar 5.32 Parameters Export Dataset 1

50

Gambar 5.33 View Output

51

Gambar 5.34 Tampilan Output

51

31

DAFTAR TABEL

Tabel 2.1 Perbedaan Klasifikasi dan Klasterisasi

11

Tabel 4.1 Data penjualan yang akan di hitung

24

32

BAB I
PENDAHULUAN

1.1 Latar Belakang Masalah


Dengan kemajuan perekonomian yang sangat pesat pada saat sekarang ini
membuat orang-orang berlomba-belomba untuk meningkatkan fasilitas dalam
rumahnya. Banyak sekali toko-toko atau pun perusahaan-perusahaan yang menjual
berbagai macam fasilitas tersebut, salah satunya CV.Rumah Decor.
Dalam hal ini rumah decor menyediakan berbagai macam furnitur untuk
memperindah rumah seperti gorden, karpet, kursi, wallpaper dan lain sebagainya.
Semakin banyak nya konsumen yang selalu memesan barang-barang yang
disediakan membuat para karyawannya tidak sempat melakukan pencatatan terhadap
persediaan barang.
Sehingga menyebabkan para karyawan kebingungan dalam hal menyiapkan
laporan yang akan disampaikan kepada atasan nya terhadap penjualan yang terus
terjadi, dan tidak sedikit para karyawan yang mendapatkan teguran dari atasannya.
Maka dari itu kami menangkat judul diatas agar kami bisa membantu
menyelesaikan masalah yang di hadapi oleh toko Rumah Decor terkait dengan
pencatatan barang-barang yang laku terjual maupun barang-barang yang tidak laku
terjual agar atasannya bisa menerima data yang akurat.
1.2 Perumusan Masalah
Masalah yang akan diteliti berkaitan dengan proses pengolahan data
penjualan tentang bagaimana menghasilkan informasi serta pengetahuan yang
bermanfaat melalui software data mining menggunakan metode clustering dengan
algoritma K-means pada data penjualan dari CV.RUMAH DECOR.

33

1.3 Hipotesa
Pengolahan data penjualan berdasarkan jenis barang dengan menggunakan
Algoritma K-means ini diharapkan dapat membantu pihak CV.RUMAH DECOR
dalam proses pengolahan data.
1.4 Batasan Masalah
Batasan masalah yang digunakan dalam penelitian ini adalah:
1. Data penjualan yang akan diteliti tercatat pada tahun 2013.
2. Data yang diolah hanya sebagai sampel dengan software data mining yaitu
dengan data penjualan selama 1 tahun dengan atribut tertentu.
3. Metode Algoritma K-means dilakukan berdasarkan jenis barang yang
dipasarkan
4. Data yang diolah hanya data pembeliandalam bentuk cash atau tunai.
1.5 Tujuan Penelitian
Pelaksanaan praktek kerja lapangan ini bertujuan untuk :
1. Memberikan informasi kepada pihak CV.RUMAH DECOR di Padang
mengenai pengelompokan data penjualan berdasarkan jenis barang.
2. Mengetahui jenis barang yang dipasarkan dari waktu ke waktu.
3. Sebagai sarana belajar untuk mengetahui cara pengolahan data penjualan
pada sebuah software data mining.
1.6 Manfaat Penelitian
Manfaat dari penelitian dari praktek kerja lapangan ini adalah :
1. Dapat menjadi informasi dan pengetahuan baru bagi pihak CV.RUMAH
DECOR.
2. Sebagai sistem pendukung keputusan daalam menentukan karakteristik dari
jenis barang.

34

3. Dapat memberikan informasi bagi pihak CV.RUMAH DECOR tentang


penjualan yang dapat dalam pertahunnya.
1.7 Gambaran Umum Perusahaan
1.7.1 Latar Belakang CV.Rumah Decor
Di era pembangunan saat ini sangat dibutuhkan hadirnya tempat
tinggal yang berorientasi

kepada kenyamanan serta keserasian

antara

lingkungan dan rumah tinggal dalam hal konteks tersebut sangat dituntut
hadirnya tenaga profesinal untuk menangani penataan decorasi baik interior
maupun exterior. Kenyamanan lingkungan serta tempat tinggal yang tertata
dengan baik tidak terlepas dari keahlian yang profesional dalam penanganannya.
Penataan tempat tinggal yang rapi, dapat menimbulkan efek terhadap pikiran
serta kenyamanan bagi si penghuni. Adapun aspek lainnya menimbulkan
keindahan dilingkungan tempat tinggal tersebut.
Rumah Decor hadir di Padang untuk menjawab dari kebutuhan akan
penataan ruangan ( Interior ) yang didukung oleh tenaga tenaga professional
dibidangnya hingga menghadirkan apa yang menjadi idaman para penghuni
tempat tinggal. Dengan motto yang kami miliki Unggul Dalam Design dan
Mutu adalah motivator yang besar dalam memenuhi kepuasan pelanggan
1.7.2 Visi dan Misi Toko Rumah Decor
Visi :
1.

Menjadikan perusahaan

handal dan selalu menggali kemampuan

Sumber Daya Manusia


2.

Selalu menjaga komitmen yang sudah digariskan perusahaan yaitu


Unggul Dalam Design dan Mutu.

35

3.

Selalu menjaga Kualitas dan Disiplin Waktu

Misi :
1.

Menciptakan Sumber Daya Manusia

yang beriman dan bertaqwa

kepada Tuhan Yang Maha Esa dan Responsibility


2.

Menjadikan karya yang dihasilkan

selalu maksimal dan dapat

dinikmati pelanggan
3.

Menggali kemampuan serta kineja yang terukur dan terarah sesuai


prosedur yang digariskan perusahaan

4.

Meningkatkan pendapatan perusahaan serta Sumber Daya Manusia


yang mendukung setiap kegiatan perusahaan

36

1.7.3 Struktur Organisasi CV.Rumah Decor

Direktur
David

General Manager
Ratulani Juwita, S.Pd

Mgr. Marketing

Mgr. Operasional

Susi Rahmatul F.

Dayat

Mgr. Keuangan
Normalisa

Ass. Marketing 1
Titiek

Mgr. Produksi
Boy Alexa

Ass. Keu
Hayati

Yusprina

Aan

Ismet

Fajar

Aini

Riri

Listra

Bento

Lina

Zul

Doni

Gambar 1.1 Struktur Organisasi CV.Rumah Decor

Raka

37

BAB II
LANDASAN TEORI

2.1 Konsep Dasar Data Mining


2.1.1 Defenisi Data Mining
Data Mining merupakan proses pencarian pola dan relasi-relasi yang
tersembungi dalam sejumlah data yang besar dengan tujuan untuk melakukan
klasifikasi, estimasi, prediksi, association rule, clustering dan visualisasi.
2.1.2 Kategori Data Mining
Secara garis besar data mining dapat dikelompokan menjadi 2
kategori utama, yaitu :
1. Deskripsi Mining, yaitu proses untuk menemukan karakteristik
penting dari datta dalam suatu basis data. Teknik data mning yang
termasuk deskripsi mining adalah clustering, association, dan squental
mining.
2. Prediksi Mining, yaitu proses untuk menemukan pola dari data
dengan menggunakan variabel lain dimasa depan. Salah satu teknik
yang terdapat dalam prediksi mining adalah klasifikasi.
2.1.3 Proses Data Mining
Secara sederhana data mining biasa dikatakan sebagai proses
menyaring atau menambang pengetahuan dari sejumlah data yang sangat
besar. Istilah lain untuk data mining adalah Knowledge Discovery In
Database atau KDD. Walaupun sebenarnya data mining sendiri adalah bagian
dari tahapan proses dalam KDD seperti yang terlihat pada gambar :

38

Sumber : Jiawei Han dan Micheline kamber, Data mining: Concept and
Techniques,(San Fransisco: Morgan Kaufmann,2001).
Gambar 2.1. Proses Data Mining
Keterangan :
1. Database merupakan koleksi data yang saling berhubungan dipergunakan
secara bersama, dirancang untuk memenuhi kebutuhan informasi organisasi.
2. Pembersihan Data (Data Cleaning), pada tahap ini dilakukan pembersihan
data, meliputi data yang mengandung missing value dan data yang tidak
konsisten (inconsisten data) pada database. Keluaran tahapan ini adalah data
yang telah bersih dan siap digunakan pada proses selanjutnya, karena pada
daata mining hanya akan dapat menghasilkan nilai yang valid jika data telah
bersih. Jika ditemukan data yang mengandung missing value dan data yang
tidak konsisten lebih besar jumlahnya.
3. Integrasi Data (integration data), proses integrasi data dilakukan untuk
menggabungkan data yang sudah bersih dari missing value dan inconsistent
data dari berbagai sumber menjadi bentuk sebuah bentuk penyimpanan data
yang konheren, seperti data warehouse.
4. Task Relevan Data, tahap ini melakukan seleksi relevansi atribut dari data.

39

Setelah seleksi data, tahap selanjutnya adalah transformasi.


5. Data Mining, merupakan proses mengeksplorasi dan menganalisa daata
dalam jumlah yang besar yang bertujuan untuk menemukan suatu pola yang
menarik dari data yang tersimpan dalam jumlah besar dan aturan yang
berarti. Tahap ini merupakan inti dari tahapan KDD yang dilakukan untuk
menganalisis data yang telah dibersihkan.
6. Evalusi merupakan tahapan yang dikerjakan dalam penelitian dengan tujuan
untuk memperoleh informasi yang terdapat pada hasil data yang di proses
dari Algoritma K-means.
7. Knowledge, tahapan ini adalah penggunaan visualisasi untuk menunjukan
hasil dari pengolahan data kepada pengguna yang berupa model atau
karakteristik data sehingga mudah dipahami oleh pengguna.
2.2 Clustering
Clustering merupakan salah satu bagian dari teknik data mining yaitu
sekumpulan objek yang mempunyai kesamaan diantara anggotanya dan memiliki
ketidaksamaan dengan objek lain pada cluster lainnya, dengan kata lain sebuah
cluster adalah sekumpulan objek yang digabung bersama karena persamaan atau
kedekatannya.
2.2.1 Proses Clustering
Clustering adalah proses membuat pengelompokkan sehingga semua
anggota dari setiap partisi mempunyai persamaan berdasarkan matrik
tertentu.

Berikut menunjukkan contoh data yang akan dilakukan klasterisasi :

40

Gambar 2.2 Data Sebelum di Klasterisasi


Jika data dilakukan clustering (pengelompokkan) berdasarkan warna,
maka pengelompokkannya seperti yang terlihat pada gambar

Gambar 2.3 Klasterisasi Berdasarkan Kesamaan Warna


Jika data dilakukan clustering (pengelompokkan) berdasarkan bentuk,
maka pengelompokannya dapat dilihat seperti gambar

Gambar 2.4 Klasterisasi Berdasarkan Kesamaan Bentuk


Selain dengan menggunakan similaritas (kesamaan) berdasarkan
bentuk dan warna, clustering juga bisa dilakukan dengan menggunakan
similaritas berdasarkan jarak, artinya data yang memiliki jarak berdekatan
akan membentuk satu cluster, contohnya seperti dapat dilihat pada gambar

41

Gambar 2.5 Klasterisasi Berdasarkan Kesamaan Jarak


Ada beberapa perbedaan antara metode klasifikasi dan metode
clustering, dimana pada dasarnya terdapat tiga poin perbedaan yaitu :
data,label dan analisa hasil.
Perbedaan tersebut dapat ditabelkan seperti table berikut:
Tabel 2.1 Perbedaan Klasifikasi dan Klasterisasi

Data supervised pada klasifikasi artinya data melalui pembelajaran


terbimbing, sedangkan data unsupervised pada klasterisasi artinya data tidak
melalui pembelajaran terbimbing. Analisa hasil pada klasterisasi dinyatakan
dengan variance yang menunjukkan variansi data dalam satu cluster,
sedangkan klasifikasi analisa hasil diukur menggunakan rasio kesalahan
(error ratio). Pada dataset yang digunakan oleh klasifikasi terdapat satu
attribut (label) yang berfungsi sebagai attribut target, sedangkan dataset pada
klasterisasi tidak terdapat attribut (label) sebagai attribut target.
2.2.2 Karakteristik Clustering
Ada beberapa karakteristik dari clustering, masing-masing akan
dijelaskan berikut ini

42

1. Partitioning Clustering.
a. Disebut juga exclusive clustering
b. Setiap data harus termasuk dalam cluster tertentu
c. Memungkinkan bagi setiap data yang termasuk cluster tertentu pada
suatu tahapan proses, pada tahapan berikutnya berpindah ke cluster
yang lain. Contoh :K-Means, residual analysis.
2. Hierarchical Clustering.
a. Setiap data harus masuk ke dalam cluster tertentu
b. Suatu data yang masuk kedalam cluster tertentu pada suatu tahapan
proses, tidak dapat berpindah ke cluster lain. Contoh: Single Linkage,
Centroid Linkage, Complete Linkage
3. Overlapping Clustering.
a. Setiap data memungkinkan termasuk ke beberapa cluster
b. Data mempunyai nilai keanggotaan (membership) pada beberapa
cluster. Contoh : Fuzzy C-means, Gaussian Mixture
4. Hybrid merupakan kombinasi dari karakteristik partitioning, overlapping
dan hierarchical.

Sumber : Jiawei Han dan Micheline kamber, Data mining: Concept and
Techniques,(San Fransisco: Morgan Kaufmann,2001).

43

Gambar 2.6 Karakteristik Klasterisasi

2.2.3 Metode Pengelompokan


Metode pengelompokan pada dasarnya ada dua, yaitu metode
pengelompokan Hirarki (Hirarchical Clustering Method) dan metode non
Hirarki (Non Hirarchical Clustering Method). Metode pengelompokan hirarki
digunakan apabila belum ada informasi jumlah kelompok yang akan dipilih.
Sedangkan

metode

pengelompokan

Non

Hirarki

bertujuan

untuk

mengelompokkan n objek kedalam k kelompok (k<n), dimana nilai k telah


ditentukan sebelumnya.Salah satu prosedur pengelompokan pada Non
Hirarki adalah dengan menggunakan metode k-means.Metode ini merupakan
metode pengelompokan yang bertujuan untuk mengelompokkan objek
sedemikian hingga jarak tiap-tiap objek ke pusat kelompok didalam suatu
kelompok adalah minimum.
2.2.4 Analisa Cluster
Analisis cluster adalah suatu analisis statistik yang bertujuan
memisahkan obyek kedalam beberapa kelompok yang mempunyai sifat
berbeda antar kelompok yang satu dengan yang lain. Dalam analisis ini tiaptiap kelompok bersifat homogen antar anggota dalam kelompok atau variasi
obyek dalam kelompok yang terbentuk sekecil mungkin.
Tujuan utama analisis cluster menggabungkan objek-objek yang
mempunyai kesamaan ke dalam sebuah kelompok atau cluster. Untuk
mencapai tujuan itu kita harus menjawab tiga pertanyaan, yaitu :
1. Bagaimana kita mengukur tingkat kesamaan ?
2. Bagaimana kita membentuk cluster ?

44

3. Berapa banyak cluster yang akan kita bentuk ?


Pengambilan keputusan dengan analisis cluster memiliki 6 tahapan,
yaitu : menentukan tujuan analisis cluster, menentukan desain penelitian
analisis cluster, menentukan asumsi analisis cluster, menurunkan clustercluster dan memperkirakan overall fit, menginterpretasi hasil analisis cluster,
mengukur tingkat validasi hasil analisis cluster.
2.3 Algoritma K-Means
2.3.1 Defenisi K-Means
Algorima K-Means adalah metode clustering non hierarchical
berbasis jarak yang membagi data kedalam cluster dan algoritma ini bekerja
pada atribut numerik. Algoritma K-Means termasuk dalaam partitioning
clustering yang memisahkan data ke daerah bagian yang terpisah. Algoritma
K-Means sangat terkenal karena kemudahannya dan kemampuannya untuk
mengklaster data besar dan outlier dengan sangat cepat.
K-Means merupakan metode klasterisasi yang sangat terkenal dan
banyak

digunakan

di

berbagai

bidang

karena

sederhana,

mudah

diimplementasikan, memiliki kemampuan untuk mengkluster data yang


besar, mampu menangani data outlier dan kompleksitas waktunya linear
O(nKT) dengan n adaalah jumlah dokumen, K adaalah jumlah kluster, dan T
adalah jumlah iterasi. Dalam Algoritma K-Means, setiap data harus termasuk
dapat berpindah ke cluster yang lain. Pada dasaarnya penggunaan Algoritma
K-Means dalam melakukan proses clustering tergantung dari data yang ada
dan konklusi yang ingin dicapai. Untuk itu digunakan Algoritma K-Means
yang di dalamnya memuat aturan sebagai berikut :

45

1. Jumlah cluster yang perlu diinputkan


2. Hanya memiliki atribut bertipe numerik
Algoritma K-Means pada awalnya mengambil sebagian dari
banyaknya komponen dari populasi untuk dijadikan pusat cluster awal. Pada
step ini pusat cluster dipilih secara acak dari sekumpulan populasi data.
Berikutnya K-Means menguji masing-masing komponen didalam populasi
data dan menandai komponen tersebut ke salah satu pusat cluster yang telah
didefenisikan tergantung dari jarak minimum antar komponen dengan tiaptiap pusat cluster. Posisi pusat cluster akan dihitung kembali sampai semua
komponen data digolongkan kedalam tiap-tiap cluster dan terakhir akan
terbentuk posisi cluster baru.
2.3.2 Proses K-Means
Algoritma K-Means pada dasarnya melakukan 2 proses yakni proses
pendeteksian lokasi pusat cluster dan proses pencarian anggota dari tiap-tiap
cluster dan proses pencarian anggota dari tiap-tiap cluster. Proses Algoritma
K-Means sebagai berikut :
1. Tentukan K sebagai jumlah cluster yang ingin dibentuk.
2. Bangkitkan K centroids (titik pusat cluster) awal secara random.
3. Hitung jarak setiap data ke masing-masing centroids.
4. Setiap data memilih centroids yang terdekat.
5. Tentukan posisi centroids baru dengan cara menghitung nilai rata-rata
dari data-data yang terletak pada centroids yang sama.
6. Kembali ke langkah 3 jika posisi centroids baru dengan centroids
lama tidak sama.

46

Berdasarkan cara kerjanya Algoritma K-Means memiliki karakteristik


sebagai berikut :
1. K-Means sangat cepat dalam proses clustering.
2. K-Means sangat sensitif dalam pada proses pembangkitan centroids
awal secara random.
3. Memungkinkan suatu cluster tidak mempunyai anggota.
4. Hasil clustering dengan K-Means bersifat tidak unik (selalu berubahubah) terkadang baik, terkadang jelek.
Adapun tujuan daari daata clustering ini adalah untuk meminimalisasikan
objective function yang diset daalam proses clustering, yang padaa umumnya
berusaha meminimalisasikan variasi didalam suatu cluster dan memaksimalkan
variasi antar cluster. Ada dua cara pengalokasian data kembali ke dalam masingmasing cluster padaa saat proses iterasi clustering. K-Means dalam
pengalokasian data ke dalam masing-masing cluster dapat dilakukan dengan 2
cara yaitu Hard K-Means dan Fuzzy K-Means. Perbedaan dari kedua metode
tersebut terletak pada asumsi yang dipakai sebagai dasar dari pengalokasian data.
Hard disini dalam artian suatu data secara tegas atau pasti dinyatakan sebagai
anggota satu cluster tertentu daan tidak menjadi anggota cluster yang lain.
Sedangkan fuzzy diartikan masing-masing data mempunyai nilai kemungkinan
untuk dapat bergabung ke setiap cluster yang ada.

47

BAB IV
ANALISA DAN PERANCANGAN

4.1 Analisa Data Penjualan pada CV.Rumah Decor


CV.Rumah Decor memiliki data-data yang berkaitan dengan aktifitas di
perusahaan tersebut. Salah satuya adalah data yang digunakan untuk mencatat
transaksi yang terjadi di perusahaan tersebut. Terdiri dari beberapa atribut misal
nama-nama barang, jumlah barang, harga barang, total penjualan selama bulan juli
desember 2013
4.2 Analisis Clustering dengan Algoritma K-Means
K-Means termasuk dalam metode data mining partitioning clustering yaitu
setiap data harus masuk dalam cluster tertentu dan memungkinkan bagi setiap data
yang masuk dalam cluster tertentu pada suatu tahapan proses, pada tahapan
berikutnya berpindah ke cluster yang lain. K-means memisahkan data ke K daerah
bagian terpisah, dimana K adalah bilangan integer positif. Algoritma K-means sangat
terkenal karena kemudahan dan kemampuanna untuk mengkasifikasi data besar dan
outlier dengan sangat cepat.
Berikut ini adalah langkah-langkah algoritma K-means :
1. Penentuan Cluster Awal
Dalam

menentukan

buah

pusat

cluster

awal

dilakukan

pembangkitan bilangan random yang merepresentasikan urutan data


input. Pusat awal cluster didapatkan dari data sendiri bukan dengan
menentukan titik baru, yaitu dengan random pusat awal dari data.

48

2. Perhitungan Jarak dengan Pusat Cluster


Untuk mengukur jarak antar data dengan pussat cluster digunakan
Euclidian distance, algoritma perhitungan jarak data dengan pusat
cluster:
1. Ambil nilai data dan nilai pusat cluster
2. Hitung Euclidian distance data dengan tiap pusat cluster.
3. Pengelompokan Data
Jarak hasil perhitungan akan dilakukan perbandingan dan dipilih jarak
terdekat antara data dengan pusat cluster, jarak ini menunjukkan
bahwa data tersebut berada dalam satu kelompok dengan pusat cluster
terdekat.
Algoritma pengelompokkan data :
a. Ambil nilai jarak tiap pusat cluster dengan data
b. Cari nilai jarak terkecil
c. Kelompokkan data dengan pusat cluster yang memiliki jarak
terkecil.
4. Penentuan Pusat Cluster Baru
Untuk mendapatkan pusat cluster baru bisa dihitung dari rata-rata
nilai anggota cluster dan pusat cluster. Pusat cluster yang baru
digunakan untuk melakukan iterasi selanjutnya, jika hasil yang
didapatkan belum konvergen. Proses iterasi akan berhenti jika telah

49

memenuhi maksimum iterasi yang dimasukkan oleh user atau hasil


yang dicapai sudah konvergen (pusat cluster baru sama dengan pusat
cluster lama).
Algoritma penentuan pusat cluster :
a. Cari jumlah anggota tiap cluster
b. Hitung pusat baru dengan rumus

Dimana :
X1, X2, X3,.... Xn = anggota cluster
Xp = pusat lama
4.3 Perancangan dan Proses Clustering
Pada tahap ini akan dilakukan proses utama yaitu segmentasi atau
pengelompokkan data Penjualan barang yang diakses dari database, yaitu sebuah
metode clustering algoritma K-Means. Berikut ini merupakan diagram flowchart dari
algoritma K-Means dengan asumsi bahwa parameter input adalah jumlah data set
sebanyak n data dan jumlah inisialisasi centroid K=3 sesuai dengan penelitian.
Dari banyak data penjualan yang diperoleh, diambil 14 jenis barang untuk dijadikan
sampel untuk penerapan algoritma k-means dalam penjurusan mahasiswa. Percobaan
dilakukan dengan menggunakan parameter-parameter berikut :

50

Jumlah cluster : 2
Jumlah data :14
Jumlah atribut :2

Start

Input m record, k
(jumlahcluster)

Tentukan k record
sbgcentroid

Hitungsimilaritas

Hitungnilai ratarata masing2 cluster

Nilai
rata2
Centroid
tetap

Set of k
clusters

End

Gambar 4.1 Flowchart Proses K-Means


Pada table dibawah ini merupakan sampel data yang digunakan untuk melakukan
percobaan perhitungan manual.

51

Tabel 4.1 Data penjualan yang akan di hitung

Nama Barang

Harga
Barang(*Rp1000)

Total

Gordyn Black Out

130

600

Gordyn Standard
Gordyn Beludru
Gordyb Silk
Vitrase Tile
Vitrase Organdi
Vitrase Turkie
Blind Roller
Blind Vertical
Blind Slim
Carpet Crown
Carpet Sandrio
Carpet Treasure
Carper Spontini

60
120
110
85
115
120
130
140
125
400
160
950
1750

700
570
590
300
650
550
585
70
90
79
120
105
30

Iterasi ke-1
1. Penentuan pusat awal cluster
Pusatawal

cluster

atau

centroid

didapatkansecara

random,

untukpenentuanawal cluster di asumsikan :


Pusat Cluster 1: (52. 28)
Pusat Cluster 2: (50. 30)
2. Perhitungan jarak pusat cluster
Untuk mengukur jarak antara data dengan pusat cluster digunakan
Euclidian distance, kemudian akan didapatkan matrik jarak sebagai berikut :
Rumus euclidian distance : d | x y |

X = Pusat cluster

x
n

i 1

yi

52

Y = data
Dari 5 data yang dijadikan sampel telah dipilih pusa tawal cluster
yaituC1(52 , 28), dan C2 (50 , 30). Lalu dilakukan penghitungan jarak dari
sisa sampel data dengan pusat cluster yang dimisalkan dengan M(a,b),
dimana a merupakan total penjualan,dan b harga barang yang diperkecil
menjadi angka puluhan juta agar cara penghitungan lebih mudah.
M1= (130,600)
M2= (60,700)
M3= (120,570)
M4= (110,590)
M5= (85,300)
M6= (115,650)
M7=(120,550)
M8= (130,585)
M9= (140,70)
M10= (125,90)
M11= (400, 79)
M12= (160,120)
M13= (950,105)
M14= (1750,30)

53

Hitung Euclidean distance dari semua data ketiap titik pusat pertama :

D11

M1x C1x 2 M1 y C1 y 2

130 522 600 282

D12

M1x C1x 2 M1 y C1 y 2

60 522 700 282

D13

M1x C1x 2 M1 y C1 y 2

120 522 570 282

601,85

D14

M1x C1x 2 M1 y C1 y 2

110 522 590 282

620,71

D15

M1x C1x 2 M1 y C1 y 2

85 522 300 282

D16

M1x C1x 2 M1 y C1 y 2

115 522 650 282

625,18

D17

M1x C1x 2 M1 y C1 y 2

120 522 550 282

526,41

D18

M1x C1x 2 M1 y C1 y 2

130 522 585 282

562,43

D19

M1x C1x 2 M1 y C1 y 2

140 522 70 282

577,29
672,04

273,99

97,50

D110

M1x C1x 2 M1 y C1 y 2

125 522 90 282

95,77

D111

M1x C1x 2 M1 y C1 y 2

400 522 79 282

351,71

D112

M1x C1x 2 M1 y C1 y 2

160 522 120 282

141,87

D113

M1x C1x 2 M1 y C1 y 2

950 522 105 282

901,29

D114

M1x C1x 2 M1 y C1 y 2

1750 522 30 282

1698,00

54

Dengan cara yang sama hitung jarak tiap titik ketitik pusat ke-2 dan kita akan
mendapatkan :
D 21

M 1x C1x 2 M 1 y C1 y 2

130 502 600 302

575,58

D 22

M 1x C1x 2 M 1 y C1 y 2

60 502 700 302

670,075

D 23

M 1x C1x 2 M 1 y C1 y 2

120 502 570 302

544,51

D 24

M 1x C1x 2 M 1 y C1 y 2

110 502 590 302

563,20

D 25

M 1x C1x 2 M 1 y C1 y 2

85 502 300 302

D 26

M 1x C1x 2 M 1 y C1 y 2

115 502 650 302

623,39

D 27

M 1x C1x 2 M 1 y C1 y 2

120 502 550 302

524,69

D 28

M 1x C1x 2 M 1 y C1 y 2

130 502 585 302

560,73

D 29

M 1x C1x 2 M 1 y C1 y 2

140 502 70 302

272,25

98,48

D 210

M 1x C1x 2 M 1 y C1 y 2

125 502 90 302

96,04

D 211

M 1x C1x 2 M 1 y C1 y 2

400 502 79 302

353,41

D 212

M 1x C1x 2 M 1 y C1 y 2

160 502 120 302

142,12

D 213

M 1x C1x 2 M 1 y C1 y 2

950 502 105 302

903,12

D 214

M 1x C1x 2 M 1 y C1 y 2

1750 502 30 302

1700

18

Dari hasil penghitungan Euclidean distance, kita dapat membandingkan :


Tabel 4.2 Hasil Iterasi 1

C1

C2

M1

577,29369

575,587

M2

672,04762

670,075

M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14

601,8538
620,71572
273,99453
625,18237
526,41049
562,43489
97,508974
95,77578
351,71722
141,87318
901,29518
1698,0012

544,518
563,205
272,259
623,398
524,69
560,736
98,4886
96,0469
353,413
142,127
903,12
1700

{M9,M10,M11,M12,M13,M14}

:anggota C1

{M1,M2,M3,M4,M5,M6,M7,M8}

:anggota C2

Iterasi ke-2
1. Hitung titik pusat baru
Tentukan posisi centroid baru (Ck ) dengan cara menghitung nilai
rata-rata dari data-data yang ada pada centroid yang sama.
1
C k
nk

d1

19

Dimana nk adalah jumlah dokumen dalam cluster k dan di adalah


dokumen dalam cluster k.

Sehingga didapatkan titik pusat atau centroid yang baru yaitu :


C1= (587,5 , 82,3) C2= (108,75 , 568,1)
2. Perhitungan jarak pusat cluster
Hitung Euclidean distance dari semua data ketitik pusat yang baru
(C1, C2) seperti yang telah dilakukan pada tahap 1 Setelah hasil perhitungan
kita dapatkan, kemudian bandingkan hasil tersebut. Jika hasil posisi cluster
pada iterasi ke 2 sama dengan posisi iterasi pertama, maka proses dihentikan,
namun jika tidak proses dilanjutkan ke iterasi ke 3.

20

D11

M1x C1x 2 M1 y C1 y 2

130 587,52 600 82,32

D12

M1x C1x 2 M1 y C1 y 2

60 587,52 700 82,32

D13

M1x C1x 2 M1 y C1 y 2

120 587,52 570 82,32

675,57

D14

M1x C1x 2 M1 y C1 y 2

110 587,52 590 82,32

849,25

D15

M1x C1x 2 M1 y C1 y 2

85 587,52 300 82,32

D16

M1x C1x 2 M1 y C1 y 2

115 587,52 650 82,32

738,60

D17

M1x C1x 2 M1 y C1 y 2

120 587,52 550 82,32

661,28

D18

M1x C1x 2 M1 y C1 y 2

130 587,52 585 82,32

679,71

D19

M1x C1x 2 M1 y C1 y 2

140 587,52 70 82,32

690,88
812,28

618,57

447,84

D110

M1x C1x 2 M1 y C1 y 2

125 587,52 90 82,32

468,27

D111

M1x C1x 2 M1 y C1 y 2

400 587,52 79 82,32

187,52

D112

M1x C1x 2 M1 y C1 y 2

160 587,52 120 82,32

429,15

D113

M1x C1x 2 M1 y C1 y 2

950 587,52 105 82,32

363,21

D114

M1x C1x 2 M1 y C1 y 2

1750 587,52 30 82,32

1163,67

Dengan cara yang sama hitung jarak tiap titik ketitik pusat baru ke-2 dan kita
akan mendapatkan :

21

D 21

M 1x C1x 2 M 1 y C1 y 2

130 108,752 600 568,12

38,309

D 22

M 1x C1x 2 M 1 y C1 y 2

60 108,752 700 568,12

307,71

D 23

M 1x C1x 2 M 1 y C1 y 2

120 108,752 570 568,12

11,40

D 24

M 1x C1x 2 M 1 y C1 y 2

110 108,752 590 568,12

51,89

D 25

M 1x C1x 2 M 1 y C1 y 2

85 108,752 300 568,12

286,26

D 26

M 1x C1x 2 M 1 y C1 y 2

115 108,752 650 568,12

82,11

D 27

M 1x C1x 2 M 1 y C1 y 2

120 108,752 550 568,12

21,33

D 28

M 1x C1x 2 M 1 y C1 y 2

130 108,752 585 568,12

27,13

D 29

M 1x C1x 2 M 1 y C1 y 2

140 108,752 70 568,12

469,16

D 210

M 1x C1x 2 M 1 y C1 y 2

125 108,752 90 568,12

559,36

D 211

M 1x C1x 2 M 1 y C1 y 2

400 108,752 79 568,12

569,27

D 212

M 1x C1x 2 M 1 y C1 y 2

160 108,752 120 568,12

451,04

D 213

M 1x C1x 2 M 1 y C1 y 2

950 108,752 105 568,12

960,30

D 214

M 1x C1x 2 M 1 y C1 y 2

1750 108,752 30 568,12

1727,22

22

Karena pada Iterasi ke-2 posisi cluster tidak berubah/sama dengan


posisi cluster pada iterasi pertama maka proses iterasi dihentikan.
Tabel 4.3 Hasil Iterasi 2

C1

C2

M1

690,88316

38,309

M2

812,28661

307,716

M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14

675,57941
849,25352
618,5744
738,60649
661,28628
679,71578
447,84991
468,27251
187,52904
429,15911
363,21005
1163,6759

11,4052
51,8901
286,254
82,1132
21,3326
27,1354
469,167
559,361
569,271
451,046
960,305
1727,22

{M9,M10,M11,M12,M13,M14}

:anggota C1

{M1,M2,M3,M4,M5,M6,M7,M8}

:anggota C2

23

Gambar 4.2 Hasil Pengelompokan data


Kesimpulan
Barang dengan jenis Blind Roller, Blind Vertical, Blind Slim, Carpet Crown,
Carpet Sandrio, Carpet Treasure, Carpet Spontini merupakan anggota C1 dan
termasuk barang yang tidak laris.
Barang dengan jenis Gordyn Black Out, Gordyn Standard, Gordyn
Beludru.Gordyn Silk, Vitrase Tile, Vitrase Organdi, Vitrase Turkie
merupakan anggota C2 dan termasuk barang yang laris.

24

BAB V
IMPLEMENTASI DAN PENGUJIAN

5.1 Analisis Software Data mining Tanagra 1.4.50


Tanagra 1.4.50 adalah software data mining yang diperlukan untuk keperluan
akademik dan riset. Di dalamnya disediakan beberapa metoda data mining mulai dari
mengekplorasi dan mengelompokkan analisis

data, pembelajaran

statistik,

pembelajaran mesin, dan database.


Software ini merupakan suksesor dari sebuah software lain yang bernama
SPINA yang mengimplementasikan bermacam algoritma pembelajaran terkontrol,
khususnya konstruksi pohon keputusan visual yang interaktif. Unjuk kerja Tanagra
1.4.50

lebih baik, di mana selain memiliki beberapa pembelajaran terkontrol juga

paradigma lain seperti clustering, analisis faktorial, statistik parametrik dan non
parametrik, aturan asosiasi, feature selection, dan construction algorithms. Tanagra
1.4.50

merupakan suatu proyek open source di mana semua peneliti dapat

mengakses source codenya, dan menambahkan algoritma mereka sendiri,sejauh dia


setuju dan menyesuaikan dengan lisensi pendistribusian softwarenya.
5.1.1 Pengenalan Tampilan Dari Tanagra

Bentuk GUI dari Tanagra 1.4.50

25

Gambar 5.1 Bentuk GUI

Input Data

Gambar 5.2 Input Data

Komponen / Operator Tanagra 1.4.50

26

Gambar 5.3 Komponen Tanagra

Diagram Data Mining

Gambar 5.4 Diagram Tanagra

Output / Hasil

Gambar 5.5 Output Tanagra

27

5.1.2. Pengujian Sistem dan Penjelasan Bentuk data yang di olah


Format data yang di import untuk di jadikan sumber oleh Tanagra
1.4.50 ada 3 jenis :
1. Microssoft Excel (*xls)
2. Text (*txt)
3.

Arff

Kebanyakan data yang diolah oleh Tanagra bersumber dari data yang
di tulis dari Microssoft Excel.
Data yang di import menggunakan format TXT berupa data yang
dibuat dengan menggunakan Microssoft

Excel kemudian di ekspor ke

dalam notepad (txt).Data yang formatnya Arff (Attribute-Relation File


Format) ini merupakan format yang digunakan oleh Weka dan Tanagra
juga bisa digunakan langsung.
5.2 Panduan Penggunaan (User Guide)
Berikut ini adalah cara penggunaan program data mining Tanagra 1.4.50
menggunakan metode clustering dengan Algoritma K-means.
1. Buka Tanagra 1.4.50, lalu pilih File kemudian New.
2. Inputkan data set yang ingin diolah. Data yang bisa di inputkan berformat
*xls(Microsoft Excel), *txt (Text) dan *aff.
3. Kemudian data set akan muncul pada kolom diagram analysis.
4. Klik Define status untuk memilih atribut diinput atau dijadikan target dan
ilustratif.
5. Kemudian pilih komponen tanagra sesuai metode yang diinginkan.

28

5.3 Spesifikasi Minimum Software Data Mining Tanagra 1.4.50


Spesifikasi perangkat keras (hardware) yang dibutuhkan dalam menginstal
sofware Tanagra 1.4.50 dengan minimum spesifikasi :
1. Processor Pentium dengan kecepatan 2 Ghz
2. Monitor 14
3. Harddisk Drive 80 Gb
4. RAM 512MB
5. CD ROM drive
6. Keyboard
7. Mouse
8. Printer
Perangkat lunak yang dibutuhkan untuk menginstal Tanagra 1.4.50 adalah :
1. Sistem operasi menggunakan Windows XP / 7.
2. Software data mining Tanagra 1.4.50.
3. Pengolahan data siswa menggunakan Microsoft Excel.
5.4 Tahap Instalasi Software Tanagra 1.4.50
1. Setelah klik master tanagra 1.4.50 akan keluar tampilan sebagai berikut:

Gambar 5.6. tanagra 1.4.50 Setup

29

2. Anda telah memasuki halaman awaldari tanagra 1.4.50, lalu Klik tombol
Next!
3. Setelah itu akan keluar halaman License Agreement dari tanagra 1.4.50.

Gambar 5.7. License Agreemant


4. Pilih bottom I accept the agreement dan klik tombol Next setelah itu akan
keluar tampilan sebagai berikut:

Gambar 5.8. Choose Install Location


5. Aturlah Destination Folder sesuai keinginan anda,dan klik tombol Next

30

Gambar 5.9. Ready to Install

6. Proses instalasi sedang berlangsung seperti tampilan di bawah ini.

Gambar 5.10. Installing Progres


7. Setelah proses instalasi selesai, maka muncul tampilan seperti di bawah
ini.

31

Gambar 5.11. tanagra 1.4.50 Finishing

5.5 Pengujian Sistem dan Penjelasan


Berikut langkah-langkah pemakaian software data mining Tanagra 1.4.50
dalam pengolahan data penjualan berdasarkan jenis barang menggunakan clustering
dengan algoritma K-means berikut :
5.5.1 Input Dataset
Penulis menggunakan data penjualan furnitur pada CV.Rumah Decor
sebagai dataset, file data menggambarkan karektaristik dari data CV.Rumah
Decor. Variabel aktif yang ikut penciptaaan cluster adalah nama barang, jenis
barang, harga barang,dan penjualan barang selama enam bulan. Yang
digunakan untuk memperkuat interpretasi dari cluster adalah jumlah
penjualan perbulan selama enam bulan. Data yang di inputkan hanya berupa
sampel pada tahun 2013.
Setelah Tanagra 1.4.50 dijalankan, masukkan data dengan cara klik
File => New, maka akan menampilkan data acces atau dataset.

32

Gambar 5.12. Input Dataset


Kemudian klik kanan pada dataset dan klik execute, sehingga keluar tampilan
berikut

Gambar 5.13. Data Description


5.5.2 Descriptive statistics
Descriptive statistics adalah gambaran dari karakteristik utama dari
data set. Dalam mengolah data tersebut penulis menambahkan Define Status
kedalam diagram dari komponen Tanagra, dengan cara drag ke arah data set.
Kemudian klik kanan Define Status pilih parameter, lalu inputkan atribut yang
berkategori Continue (C) dan target yang berkategori (D).

33

Gambar 5.14 Define Status Define 1 Target

Gambar 5.15 Define Status 1 Input


Tambahkan komponen More Univariate Cont Stat (tab Statistis). Tarik More
Univariate Cont Stat dan letakkan di Difine Status 1 kemudian klik kanan view.

34

Gambar 5.16 Tampilan Univariate


5.5.3The Active Variables
Kita standarisasikan variabel sebelum menampilkan pendekatan Kmeans. Tujuannya adalah untuk mengeliminasi ketidaksesuaian antara
variabel.

Tambahkan komponen Standarizedi Feature Construction tab ke

diagram. Lalu klik kanan padaStandarize pilih menu view.

Gambar 5.17 Tampilan Standardize


5.5.4 K-Means
Kita ingin mentransformasikan variabel untuk menganalisis. Masukkan
komponen Difine Status baru ke diagram, atur input.

35

Gambar 5.18 Define Status 2 Input


Insert komponen K-means di Clustering tab. Klik kanan pilih
Parameters.

Gambar 5.19 Parameter K-Means


Atur nilai cluster menjadi 2 grup.Pada DistanceNormalization, pilih
none, lalu ok. Klik kanan pada K-means, pilih view.

36

Gambar 5.20 View K-Means


5.5.5 Interpretation Of Groups
Pada tahap ini merupakan langkah awal pada proses clustering. Yang mana
kita akan menginterpretasikan kelompok dan menentukan karakteristik setiap
cluster dan membedakan satu sama lain.

Tambahkan View Dataset (tab Data Visualization)

Tarik ke K-means 1

Klik kanan view

Gambar 5.21 View Dataset

37

Masukkan komponen Difine Status baru ke dalam diagram, sehingga


terbentuk Difine Status 3, klik kanan Parameters. Data awal sebagai input
dan Cluster K-Means 1 menjadi target.

Gambar 5.22 Define Status 3 Target

Gambar 5.23 Define Status 3 input

38

Tambahkan Komponen GroupCharacterization pada tab Statistic.

Gambar 5.24 View Group Characterization


Tambahkan lagi komponen Difine Status baru ke dalam diagram,
sehingga terbentuk Difine Status 4. Data nama dijadikan target dan Cluster
K-Means 1 dijadikan input.

Gambar 5.25 Define Status 4 Target

39

Gambar 5.26 Define Status 4 Input


Tambahkan komponen Contigency Chi-Square pada Non parametic
Statisticstab ke diagram. Klik kanan lalu pilih menu view.
Hasilnya

tentu

saja

konsisten

dengan

komponen

GROUP

CHARACTERIZATION. Disini terdapat informasi yang berkaitan tentang


asosiasi. Kita dapat memeriksa jika asosiasinya signifikan dengan statistik
dan juga bisa menampilkan hasil dari presentasi baris dan kolom.

Gambar 5.27 View Contingensy Chi Square 1

40

Scatter plot berguna untuk mendapatkan posisi kelompok sesuai dua


variabel secara bersamaan. Cara lain menyorot kesimpulan adalah dengan
representasi grafik. Scatter plot perangkat yang sangat mudah digunakan di
konteks ini. Kita dapat memposisikan cluster menurut suatu variabel. Kita
dapat memeriksa interaksi antara variabel.
Tambahkan komponen Scatterplot pada data visualitation tab.Klik
kanan view.

Gambar 5.28 View Scatterplot 1


Untuk mengambil pertimbangan interaksi antara dua variabel, kita
gunakan principal component analysis (PCA) dan atur representasi grafik di
dua faktor. Tambahkan komponen Principal Componen Analysis (tab
Factorial Analysis).

41

Gambar 5.29 Principal Component Analysis 1


Setelah itu tambahkan lagi komponen scatterplot 2

Gambar 5.30 View Scatterplot 2


5.5.6 Export Dataset
Langkah terakhir dari analisis ini, kita ingin mengekspor dataset
dengan penambahan kolom yang mengindikasikan setiap anggota cluster.
Tanagra dapat membuat file data dalam format Text File dengan tab separator.
Tapi sebelumnya tambahkan komponen Define Status atur input dan
outputnya.

42

Gambar 5.31 Define Status 5 Input


Tambahkan komponen Export dataset pada Data Visualization tab ke
diagram. Klik kanan setting parameter pastikan atribut input yang harus di
eksport, kita juga bisa mengganti nama file lalu validasikan dan klik kanan
view.

Gambar 5.32 Parameters Export Dataset 1


Hasil data berupa text field yang dapat kita tentukan tempat
penyimpanan dan formatnya.

43

Gambar 5.33 View Output


File data baru output.txt

Gambar 5.34 Tampilan Output

44

45

BAB VI
PENUTUP

6.1 Kesimpulan
Dari hasil penelitian,

dapat disimpulkan bahwa pengolahan data

penjualan pada CV.Rumah Decor menggunakan metode Clustering dengan


algoritma K-means dapat digunakan untuk mengelompokkan data penjualan
berdasarkan jenis barang.
Dari data yang diolah berdasarkan jenis barang, diinputkan sampel data
sebanyak 14 data dengan. Jumlah penjualan selama enam bulan(x) dan harga barang
yang ada untuk dipasarkan kepada konsumen (y) diperoleh 2 (dua) kelompok data
telah tercluster, sebagai berikut:
1. Cluster 1 (C1) terdiri dari enam data
Barang dengan jenis Blind Roller, Blind Vertical, Blind Slim, Carpet
Crown, Carpet Sandrio, Carpet Treasure, Carpet Spontini
yang kurang laku terjual, karna angka penjualan dalam perhitungan
selama enam bulan dengan total 1.079 meter (juli-desember 2013)
2. Cluster 2 (C2) terdiri dari delapan data
Barang dengan jenis Gordyn Black Out, Gordyn Standard, Gordyn
Beludru.Gordyn Silk, Vitrase Tile, Vitrase Organdi, Vitrase Turkie
yang laku terjual, karna angka penjualan dalam enam bulan mencapai
total 3960 meter (juli-desember 2013).
6.2 Keterbatasan Sistem
Berdasarkan penelitian yang telah dilakukan penggunaan software data
mining Tanagra 1.4.38 kurang efektif dilakukan, karena data yang dapat diolah

46

berdasarkan algoritma K-means atribut data yang dijadikan sebagai input harus
mempunyai kategori sama. Sehingga apabila data yang diinputkan mempunyai
kategori diskrete dancontinue pengolahan data tidak dapat dilakukan.

6.3 Saran
Dari hasil penelitian dan pengolahan data yang telah di lakukan maka
kami menyarankan kepada pihak CV.Rumah Decor , agar bisa mengelompokkan
barang-barang yang ada berdasarkan jenis dan mencatat setiap penjualan yang terjadi
pada setiap jenis barang tersebut, sehingga dapat memudahkan nantinya dalam
melakukan laporan kepada atasannya terhadap barang mana yang laku terjual dan
barang yang tidak laku terjual.

47

DAFTAR PUSTAKA
http://www.metris-community.com/pengertian-data-mining-konsep-pdf/
http://prayudho.wordpress.com/2008/12/30/analisis-cluster/
(http://sartika1603.wordpress.com/)

http://ammarawirausaha.blogspot.com/2009/10/pengertian-pelanggan.html

48

LAMPIRAN

<<Berisi Lampiran yang disertakan bersama Laporan Praktek Kerja


Lapangan>><<Berisi Lampiran yang disertakan bersama Laporan Praktek Kerja
Lapangan>><<Berisi Lampiran yang disertakan bersama Laporan Praktek Kerja
Lapangan>><<Berisi Lampiran yang disertakan bersama Laporan Praktek Kerja
Lapangan>>

49

Anda mungkin juga menyukai