Identifikasi Buah

PROYEK AKHIR
IMAGE CLUSTERING BERDASARKAN

WARNA UNTUK IDENTIFIKASI BUAH
DENGAN METODE VALLEY TRACING
HELMY HASNIAWATI
NRP. 7403 040 015
Dosen Pembimbing :
Ali Ridho Barakbah, S.Kom
NIP. 132 297 799
Nana Ramadijanti, S.Kom, M.Kom

NIP. 132 206 161
JURUSAN TEKNOLOGI INFORMASI

POLITEKNIK ELEKTRONIKA NEGERI SURABAYA
SURABAYA 2007
PROYEK AKHIR
IMAGE CLUSTERING BERDASARKAN WARNA

UNTUK IDENTIFIKASI BUAH DENGAN METODE
VALLEY TRACING
HELMY HASNIAWATI
NRP. 7403 040 015
Dosen Pembimbing :
Ali Ridho Barakbah, S.Kom
NIP. 132 297 799
Nana Ramadijanti, S.Kom, M.Kom

NIP. 132 206 161
JURUSAN TEKNOLOGI INFORMASI

POLITEKNIK ELEKTRONIKA NEGERI SURABAYA
SURABAYA 2007
ABSTRAK
Proyek akhir ini bertujuan untuk membangun program aplikasi yang

dapat mengenali buah-buahan. Ciri yang digunakan dalam identifikasi
buah adalah ciri warna (fitur R, G, dan B). Selanjutnya dilakukan
clustering dengan metode Single Linkage Hierarchical Method (SLHM)
terhadap ciri warna yang diperoleh. Dalam clustering, umumnya harus
dilakukan inisialisasi jumlah cluster yang diinginkan terlebih dahulu,
padahal pada beberapa kasus clustering, user bahkan tidak tahu berapa
banyak cluster yang bisa dibangun. Untuk itu, dalam proyek akhir ini
diaplikasikan metode Valley Tracing. Metode ini merupakan constraint
yang akan melakukan identifikasi terhadap pergerakan variance dari tiap
tahap pembentukan cluster, dan menganalisa polanya untuk membentuk
suatu cluster secara otomatis (automatic clustering). Jumlah cluster yang
diperoleh menunjukkan jumlah buah yang diidentifikasi, kemudian
nama buah masig-masing diperoleh dengan membandingkan nilai
centroid tiap cluster dengan nilai centroid data training yang sebelumnya
telah disimpan dalam database dan mempunyai label nama buah.
Image Clustering dengan metode valley tracing dalam membentuk
cluster secara otomatis mempunyai keakuratan sebesar 55 %. Sedangkan
hasil identifikasinya mempunyai keakuratan mencapai 74,1 %.
Kata kunci : Pengenalan buah, SLHM, Image Clustering, Clustering

Otomatis, Valley Tracing.
iii
ABSTRACT
This final project was made to build an application program which

has a capability to identify a group of fruit. The basic characteristic to be
processed , was colour feature (R, G, and B). Then those feature was
clustered or grouped using hierarchical clustering called Single Linkage
Hierarchical Method (SLHM). In clustering, commonly we have to
initialize how many cluster that we want to build first. Meanwhile, in
some clustering cases the users has not any idea to determine the
number of clusters. Hence, in this final project we proposed a new
approach called Valley Tracing to overcame that problem. This metode
act as constraint which is identify the moving variance from each stage
of cluster construction and analyze the pattern to perform an automatic
clustering. Number of cluster represents number of identified fruits, and
the fruit’s name obtained by comparing between centroid value of each
cluster and centroid value of training set which was stored in database
and labeled by fruit’s name.
The accuracy of appliying valley tracing method in image clustering
to build a cluster automatically was 55 %. Meanwhile, the accuracy of
its identification computed 74,1%.
Keyword : Fruit Identification , SLHM, Image Clustering, Automatic

Clustering, Valley Tracing.
iv
KATA PENGANTAR
Assalamu’alaikum Wr. Wb.
Alhamdulillah, segala puji syukur kehadirat Illahi Robbi Allah

SWT yang telah melimpahkan rahmat, hidayah serta karunia-Nya yang
tiada henti. Tiada lupa Shalawat dan salam semoga senantiasa
tercurahkan kepada Rasulullah Muhammad SAW beserta keluarga, para
sahabat serta seluruh pengikutnya sehingga penulis dapat menyelesaikan
buku laporan Tugas Akhir ini dengan judul :
IMAGE CLUSTERING BERDASARKAN WARNA UNTUK

IDENTIFIKASI BUAH DENGAN METODE VALLEY
TRACING
Tugas akhir ini disusun untuk melengkapi persyaratan

akademik dalam penyelesaian program pendidikan Diploma IV Jurusan
Teknologi Informasi di Politeknik Elektronika Negeri Surabaya ITS.
Dengan selesainya buku laporan proyek akhir ini, penulis
berharap semoga buku ini dapat membawa manfaat pembaca umumnya
dan juga bagi penulis pada khususnya serta semua pihak yang
berkepentingan. Penulis juga berharap agar proyek akhir ini dapat
dikembangkan lebih lanjut sehingga dapat benar-benar digunakan
sebaik-baiknya untuk mendukung perkembangan ilmu pengetahuan.
Penulis menyadari bahwa penulis adalah manusia biasa yang
tidak luput dari kesalahan dan kekurangan. Untuk itu, kritikan dan saran
yang bersifat membangun kami harapkan untuk perbaikan selanjutnya.
Wassalamu’alaikum Wr. Wb.
Surabaya, Juli 2007
Penulis
v
UCAPAN TERIMA KASIH
Melalui kesempatan ini, penulis ingin menyampaikan ungkapan

rasa terima kasih dari dalam hati atas terselesainya tugas akhir ini.
Khususnya rasa syukur kepada Allah SWT yang telah banyak
memberikan kekuatan dan rahmad-Nya kepada penulis. Juga tak lupa
penulis ucapkan terima kasih kepada :
1. Aba dan ibu, adikku dan keluarga besar bani yusuf yang telah
memberikan dukungan doa, motivasi, materiil, kasih sayang dan
segala-galanya yang tidak akan pernah bisa terukur nilainya.
2. Bapak Dr. Ir. Titon Dutono, M.Eng selaku Direktur Politeknik
Elektronika Negeri Surabaya.
3. Bapak Iwan Syarief, M.Kom selaku Ketua Jurusan Teknik
Informatika.
4. Bapak Ali Ridho Barakbah, S.Kom dan ibu Nana Ramadijanti,
S.Kom, M. Kom selaku dosen pembimbing yang telah dengan sabar
dan arif memberikan ilmu, pengarahan, bimbingan, dan masukan-
masukan kepada penulis selama mengerjakan Tugas Akhir ini.
5. Para dosen penguji proyek akhir yang turut menyempurnakan tugas
proyek akhir ini.
6. Mas Perumdos M2 for supporting me no matter what, yang selalu
ngingetin dan marahin aku, serta semua doa, bantuan dan
pengertiannya, viel dank, sehr verliebt für immer und ewig.
7. Seluruh Bapak Ibu dosen PENS-ITS yang telah membagikan
ilmunya, mohon maaf penulis tidak dapat menyebutkan satu-
persatu.
8. Komunitas D4-IT 2003 (Cangkrukan Community), ical, yeye, isna,
nia, c.phan, andri, sixta, c.wan, c.rud, ary, jonathan, coy, noor, desi,
uul, danang, vie, wuwu, fian, khakha, ukin, bagus, ruby, we are so
a happy family even more, zu vergessen nicht. Luv u all
9. TMB 95 Community, yanti, pasth, cebee, oks + ryo, novi, bwat
keceriaan, kegilaan, tangis, dan tawa. Suwun bantuane.
10. Revi, Wulan, especially for sending a time to help me, viel dank.
11. De Ayhiel material ’05, da direpotin mulu ma mbaknya, viel dank
12. Semua pihak yang telah membantu dalam penyelesaian tugas akhir
ini yang tidak dapat penulis sebutkan satu-persatu.
vi
DAFTAR ISI
HALAMAN JUDUL........................................................................ i
LEMBAR PENGESAHAN ............................................................ ii
ABSTRAK.................................................................. . .................... iii
ABSTRACT................................................................ ..................... iv
KATA PENGANTAR..................................................................... v
UCAPAN TERIMA KASIH........................................................... vi
DAFTAR ISI.................................................................................... vii
DAFTAR GAMBAR....................................................................... ix
DAFTAR TABEL............................................................................ xi
BAB I PENDAHULUAN
1.1 Latar Belakang ................................................................. 1
1.2 Tujuan ............................................................................. 1
1.3 Rumusan Masalah ........................................................... 2
1.4 Batasan Masalah....................................................... ....... 2
1.5 Sistematika Penulisan...................................................... 2
BAB II DASAR TEORI

2.1 Pengertian Clustering ....................................................... 5
2.2 Karakteristik Clustering.................................................... 6
2.3 Algoritma Clustering ........................................................ 6
2.4 Analisa Cluster ................................................................. 12
2.5 Identifikasi Pola Pergerakan Varian ................................. 13
2.6 Konsep Warna .................................................................. 16
BAB III PERANCANGAN SISTEM

3.1 Blok Diagram Sistem ....................................................... 17
3.2 Pengambilan Gambar ........................................................ 18
3.2.1 Capture....................................................................... 18
3.2.2 Perencanaan Data ...................................................... 19
3.3 Ekstraksi Warna.......... ....................................................... 20
3.4 Proses Learning ................................................................ 21
3.5 Proses Identifikasi ............................................................ 23
BAB IV ANALISA HASIL SISTEM

4.1 Spesifikasi Training........................................................... 27
4.1.1 Pengambilan Grand Centroid Jeruk........................... 27
4.1.2 Pengambilan Grand Centroid Apel........................... 27
vii
4.1.3 Pengambilan Grand Centroid Pear............................. 28
4.1.4 Pengambilan Grand Centroid Anggur........................ 29
4.1.5 Pengambilan Grand Centroid mangga....................... 29
4.2 Analisa Keseluruhan Data Training.................................... 30
4.3 Pengujian Sistem Identifikasi Buah.................................... 30
BAB V PENUTUP
5.1 Kesimpulan ...................................................................... . 59
5.2 Saran-saran....................................................................... . 60
DAFTAR PUSTAKA ..................................................................... . 61

PROFIL PENULIS......................................................................... . 63
viii
DAFTAR GAMBAR
Gambar 2.1 Ilustrasi Clustering.................................................... 5

Gambar 2.2 Ilustrasi Algoritma K-means .................................... 7
Gambar 2.3 Ilustrasi kelemahan K-means.................................... 7
Gambar 2.4 Ilustrasi Algoritma Hierarchical Clustering.............. 8
Gambar 2.5 Ilustrasi Single Linkage............................................ 9
Gambar 2.6 Ilustrasi Centroid Linkage ........................................ 10
Gambar 2.7 Ilustrasi Complete Linkage....................................... 11
Gambar 2.8 Ilustrasi Average Linkage......................................... 11
Gambar 2.9 Pergerakan Variance pada tiap Tahap
pembentukan cluster................................................. 13
Gambar 2.10 Pola nilai beda Hill-climbing.................................... 14
Gambar 2.11 Pola nilai beda Valley-tracing .................................. 14
Gambar 2.12 Konsep Warna .......................................................... 16
Gambar 3.1 Blok diagram sistem ................................................. 17
Gambar 3.2 Gambar apel ukuran 32x32....................................... 19
Gambar 3.3 Gambar jeruk ukuran 32x32 ..................................... 19
Gambar 3.4 Gambar pear ukuran 32x32 ...................................... 19
Gambar 3.5 Gambar anggur ukuran 32x32 .................................. 19
Gambar 3.6 Gambar mangga ukuran 32x32................................. 20
Gambar 3.7 Gambar input ukuran 32x32 .................................... 20
Gambar 3.8 Ekstraksi Warna........................................................ 20
Gambar 3.9 Blok Diagram Proses Learning................................. 21
Gambar 3.10 Blok Diagram Proses Identifikasi............................. 24
Gambar 3.11 GUI Proses Training Data Identifikasi ..................... 25
Gambar 4.1 Pengambilan Grand Centroid Jeruk.......................... 27
Gambar 4.2 Pengambilan Grand Centroid Apel........................... 28
Gambar 4.3 Pengambilan Grand Centroid Pear ........................... 28
Gambar 4.4 Pengambilan Grand Centroid Anggur ...................... 29
Gambar 4.5 Pengambilan Grand Centroid Mangga ..................... 29
Gambar 4.6 Pengujian terhadap gambar 1 ................................... 31
Gambar 4.7 Grafik Nilai Beda Tinggi gambar 1 .......................... 31
Gambar 4.13 Grafik Nilai Beda Tinggi gambar 4. ......................... 36
Gambar 4.14 Pengujian terhadap gambar 5 .................................. 37
ix
Gambar 4.15 Grafik Nilai Beda Tinggi gambar 5 ....................... 37
Gambar 4.16 Pengujian terhadap gambar 6................................. 38
Gambar 4.21 Grafik Nilai Beda Tinggi gambar 8. ...................... 42
Gambar 4.24 Pengujian terhadap gambar 10............................... 45
Gambar 4.25 Grafik Nilai Beda Tinggi gambar 10 ..................... 45
Gambar 4.31 Grafik Nilai Beda Tinggi gambar 13. .................... 49
Gambar 4.41 Grafik Nilai Beda Tinggi gambar 18. .................... 54
x
DAFTAR TABEL
Tabel 2.1 Kemungkinan pola Valley-tracing

mencapai global optimum .............................................. 15
Tabel 3.1 Grand Centroid............................................................... 23
Tabel 4.1 Grand Centroid Masing-masing Buah............................ 30
Tabel 4.2 Nilai centroid hasil clustering gambar input 1 ............... 32
Tabel 4.11 Nilai centroid hasil clustering gambar input 10 ............. 46
Tabel 4.12 Nilai centroid hasil clustering gambar input 11 ............. 47
Tabel 4.13 Akurasi Identifikasi Terhadap 20 Percobaan ................. 57
xi
xii
BAB I
PENDAHULUAN
1.1 LATAR BELAKANG
Dewasa ini perkembangan teknologi informasi berkembang

sangat pesat. Hal ini diikuti pula dengan banyaknya penelitian-penelitian
baru dalam bidang tersebut, diantaranya adalah yang berkaitan dengan
object recognition (pengenalan objek). Aplikasi object recognition yang
telah ada salah satunya adalah proses identifikasi / pengenalan buah
berdasarkan ciri warna. Pada pengenalan buah berdasarkan ciri warna
sebelumnya, sistem hanya mampu mengidentifikasi objek buah tunggal
[1]. Sistem yang dibangun belum mampu mengenali objek berupa
sekumpulan buah. Sehingga dibutuhkan suatu solusi untuk
permasalahan tersebut.
Dalam proyek akhir ini akan dibangun aplikasi image
clustering untuk mengidentifikasi buah berdasarkan warna. Dalam
clustering, umumnya harus dilakukan inisialisasi jumlah cluster yang
diinginkan terlebih dahulu, padahal pada beberapa kasus clustering, user
bahkan tidak tahu berapa banyak cluster yang bisa dibangun. Untuk itu,
dalam proyek akhir ini diaplikasikan metode Valley Tracing yang
mampu menyelesaikan masalah tersebut. Metode ini bisa melakukan
clustering secara otomatis (Automatic Clustering) terhadap fitur warna
berupa R,G,B dari buah dengan memanfaatkan Single Linkage
Hierarchical Method (SLHM), yaitu mendeteksi pergerakan varian
pada tiap tahap pembentukan clusternya untuk menemukan global
optimum sehingga bisa dibangun cluster secara otomatis (automatic
Clustering) [2]. Nilai centroid masing-masing hasil clustering
selanjutnya akan digunakan untuk mengidentifikasi jenis buah.
1.2 TUJUAN
Tujuan dari pembuatan proyek akhir ini adalah untuk

merancang dan membangun suatu aplikasi yang mampu mengenali atau
mengidentifikasi sekumpulan buah berdasarkan ciri warna. Serta
mampu menyumbangkan suatu metode baru dalam bidang object
recognition dengan memanfaatkan proses clustering.
1
2
1.3 RUMUSAN MASALAH
Permasalahan utama pada proyek akhir bagaimana membangun

sistem identifikasi buah, dari permasalahan ini akan dibahas 3
permasalahan yang penting yaitu :
- Bagaimana mengidentifikasi berapa jenis buah dalam gambar input.
- Bagaimana mengidentifikasi jenis buah apa saja yang ada pada
gambar input.
- Bagaimana menerapkan metode Valley Tracing untuk membangun
cluster secara otomatis (Automatic Clustering).
1.4 BATASAN MASALAH
Batasan pada proyek akhir ini adalah sebagai berikut :

- Objek yang digunakan adalah buah. Buah yang digunakan sebagai
objek adalah buah dengan warna-warna dominan, dan jenisnya
adalah : apel Washington, jeruk mandarin, mangga gadung, Pear,
dan Anggur.
- Obyek yang digunakan sudah tersimpan dalam format JPG, dengan
ukuran 32x32.
- Proses pembelajaran (learning process) menggunakan algoritma K-
means dengan inisialisasi jumlah cluster adalah 3.
- Software dirancang menggunakan java.
- Ciri yang dipakai adalah ciri warna dengan fitur R,G, dan B.
- Warna dasar tempat meletakkan objek tetap (background putih).
- Clustering menggunakan Single Linkage Hierarchichal Method
(SLHM) .
1.5 SISTEMATIKA PENULISAN
Sistematika pembahasan dari proyek ini adalah sebagai

berikut :
BAB 1: PENDAHULUAN
Dalam bab ini dijelaskan tentang latar belakang, tujuan,
rumusan masalah, batasan masalah, metodologi dan sistematika
penulisan.
3
BAB 2: TEORI PENUNJANG

Dalam bab ini dijelaskan tentang landasan teori yang
digunakan sebagai penunjang dalam pembuatan proyek akhir ini.
BAB 3: PERANCANGAN SISTEM
Membahas secara detail dari perencanaan dan pembuatan sistem
proyek akhir. Diantaranya adalah perencanaan GUI, pengaplikasian
clustering dengan SLHM, dll.
BAB 4: ANALISA HASIL SISTEM

Membahas tentang pengujian dari sistem yang telah dibuat beserta
analisanya. Pengujian dilakukan dengan akurasi jumlah pembentukan
cluster secara otomatis dan identifikasi jenis buah dengan euqlidean
distance.
BAB 5: PENUTUP
Bab ini berisi tentang kesimpulan dari keseluruhan pengerjaan
proyek akhir dan saran-saran untuk memperbaiki kelemahan sistem
yang telah dibuat demi pengembangan dan penyempurnaan di waktu
mendatang.
4
********** Halaman ini sengaja dikosongkan**********

BAB II
DASAR TEORI
2.1 PENGERTIAN CLUSTERING
Clustering adalah suatu cara menganalisa data dengan cara

mengelompokkan objek kedalam kelompok-kelompok berdasar suatu
kesamaan tertentu [1]. Bisa juga diartikan sebagai proses untuk
mendefinisikan pemetaan/mapping f:DÆC dari beberapa data D={t1, t2,
…… tn} kedalam beberapa cluster C={ c1, c2,…., cn} berdasarkan kesamaan
antar ti [2]. Sebuah cluster adalah sekumpulan obyek yang digabung
bersama karena persamaan atau kedekatannya [3]. Sedangkan Image
clustering ( pengelompokkan gambar ) adalah proses untuk membagi
atau mengelompokkan suatu image ke dalam beberapa bagian yang
berbeda, dimana pada tiap bagian yang berbeda tersebut anggotanya
mempunyai kesamaan khusus (homogen) [4]. Clustering biasa
digunakan pada banyak bidang, seperti : data mining, pattern
recognition (pengenalan pola), image classification (pengklasifikasian
gambar), ilmu biologi, pemasaran, perencanaan kota, pencarian
dokumen, dan lain sebagainya.
Clustering berdasar warna
Clustering berdasar bentuk
Gambar 2.1 Ilustrasi clustering
5
6
2.2 KARAKTERISTIK CLUSTERING
Karakteristik clustering dibagi menjadi 4, yaitu :

1. Partitioning clustering
Partitioning clustering disebut juga exclusive clustering, dimana
setiap data harus termasuk ke cluster tertentu. Karakteristik tipe ini
juga memungkinkan bagi setiap data yang termasuk cluster tertentu
pada suatu tahapan proses, pada tahapan berikutnya berpindah ke
cluster yang lain.
Contoh : K-Means, residual analysis.
2. Hierarchical clustering
Pada hierarchical clustering, Setiap data harus termasuk ke cluster
tertentu. Dan suatu data yang termasuk ke cluster tertentu pada suatu
tahapan proses, tidak dapat berpindah ke cluster lain pada tahapan
berikutnya.
Contoh: Single Linkage, Centroid Linkage,Complete Linkage,
Average Linkage.
3. Overlapping clustering
Dalam overlapping clustering, setiap data memungkinkan termasuk
ke beberapa cluster. Data mempunyai nilai keanggotaan
(membership) pada beberapa cluster.
Contoh: Fuzzy C-means, Gaussian Mixture.
4. Hybrid
Karakteristik hybrid adalah Mengawinkan karakteristik dari
partitioning, overlapping dan hierarchical.
2.3 ALGORITMA CLUSTERING
Ada beberapa algoritma yang sering digunakan dalam

clustering, yaitu :
1. K-Means
Termasuk partitioning clustering yang memisahkan data ke k daerah
bagian yang terpisah. K-means algorithm sangat terkenal karena
kemudahan dan kemampuannya untuk mengklaster data besar dan
data outlier dengan sangat cepat. Sesuai dengan karakteristik
partitioning clustering, Setiap data harus termasuk ke cluster
tertentu, dan Memungkinkan bagi setiap data yang termasuk cluster
tertentu pada suatu tahapan proses, pada tahapan berikutnya
berpindah ke cluster yang lain.
Algoritma K-Means :
1. Menentukan k sebagai jumlah cluster yang ingin dibentuk
7
2. Membangkitkan k centroids (titik pusat cluster) awal secara

random
3. Menghitung jarak setiap data ke masing-masing centroids
4. Setiap data memilih centroids yang terdekat
5. Menentukan posisi centroids baru dengan cara menghitung nilai
rata-rata dari data-data yang memilih pada centroid yang sama.
6. Kembali ke langkah 3 jika posisi centroids baru dengan centroids
lama tidak sama.
Gambar 2.2 Ilustrasi Algoritma K-means
Karakteristik K-Means :
• K-means sangat cepat dalam proses clustering
• K-means sangat sensitif pada pembangkitan centroids awal
secara random
• Memungkinkan suatu cluster tidak mempunyai anggota
• Hasil clustering dengan K-means bersifat tidak unik ( selalu
berubah-ubah) - terkadang baik, terkadang jelek.
• K-means sangat sulit untuk mencapai global optimum
Gambar 2.3 Ilustrasi kelemahan K-means

8
2. Hierarchical Clustering
Dengan metode ini, data tidak langsung dikelompokkan kedalam
beberapa cluster dalam 1 tahap, tetapi dimulai dari 1 cluster yang
mempunyai kesamaan, dan berjalan seterusnya selama beberapa
iterasi, hingga terbentuk beberapa cluster tertentu [2].
Arah hierarchical clustering dibagi 2, yaitu :
a) Divisive
- Dari 1 cluster ke k cluster
- Pembagian dari atas ke bawah (top to down division)
b) Agglomerative
- Dari N cluster ke k cluster
- Penggabungan dari bawah ke atas (down to top merge).
Algoritma Hierarchical clustering :
1. Menentukan k sebagai jumlah cluster yang ingin dibentuk
2. Setiap data dianggap sebagai cluster. Kalau N = jumlah data dan
c=jumlah cluster, berarti ada c=N.
3. Menghitung jarak antar cluster
4. Cari 2 cluster yang mempunyai jarak antar cluster yang paling
minimal dan gabungkan (berarti c=c-1).
5. Jika c>k, kembali ke langkah 3.
4 5 4 5 4 5
3 3 3
1 2 1 2 1 2
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Gambar 2.4 Ilustrasi Algoritma Hierarchical Clustering
Penghitungan jarak antar obyek, maupun antar clusternya dilakukan

dengan Euclidian distance, khususnya untuk data numerik [2].
Untuk data 2 dimensi, digunakan persamaan sebagai berikut :
9
d (x,y) = n
(2.1)
∑
2
x i − y i
i = 1
Algoritma hierarchical clustering banyak diaplikasikan pada metode

peng-clusteran berikut :
1. Single Linkage Hierarchical Method (SLHM)
Single Linkage adalah proses pengclusteran yang didasarkan
pada jarak terdekat antar obyeknya ( minimum distance) [5].
Metode SLHM sangat bagus untuk melakukan analisa pada tiap
tahap pembentukan cluster. Metode ini juga sangat cocok untuk
dipakai pada kasus shape independent clustering, karena
kemampuannya untuk membentuk pattern/pola tertentu dari
cluster. Sedangkan untuk kasus condensed clustering, metode ini
tidak bagus.
Algoritma Single Linkage Hierarchical Method :
1. Diasumsikan setiap data dianggap sebagai cluster. Kalau
n=jumlah data dan c=jumlah cluster, berarti ada c=n.
2. Menghitung jarak antar cluster dengan Euclidian distance.
3. Mencari 2 cluster yang mempunyai jarak antar cluster yang
paling minimal dan digabungkan (merge) kedalam cluster
baru (sehingga c=c-1)
4. Kembali ke langkah 3, dan diulangi sampai dicapai cluster
yang diinginkan.
7
Cluster 2
6 6
5 5
4
Jarak cluster 1
4
ke cluster 2
3 =
Jarak data 3 ke
2 3
data 4
1 1 2 Cluster 1
1 2 3 4 5 6 7
Gambar 2.5 Ilustrasi Single Linkage

10
2. Centroid Linkage Hierarchical Method

Centroid Linkage adalah proses pengclusteran yang didasarkan
pada jarak antar centroidnya [6]. Metode ini bagus untuk
memperkecil variance within cluster karena melibatkan centroid
pada saat penggabungan antar cluster. Metode ini juga baik untuk
data yang mengandung outlier.
Algoritma Centroid Linkage Hierarchical Method :
3. Mencari 2 cluster yang mempunyai jarak centroid antar cluster
yang paling minimal dan digabungkan (merge) kedalam cluster
baru (sehingga c=c-1)
yang diinginkan.
7
Cluster 2
6 6
Jarak cluster 1
5 5 ke cluster 2
=
4 4
Jarak centroid
3 cluster 1 ke
centroid
2 3
cluster 2
1 1 2 Cluster 1
1 2 3 4 5 6 7
Gambar 2.6 Ilustrasi Centroid Linkage
3. Complete Linkage Hierarchical Method

Complete Linkage adalah proses pengclusteran yang didasarkan
pada jarak terjauh antar obyeknya ( maksimum distance) [6].
Metode ini baik untuk kasus clustering dengan normal data set
distribution. Akan tetapi, metode ini tidak cocok untuk data yang
mengandung outlier.
Algoritma Complete Linkage Hierarchical Method :
11
3. Mencari 2 cluster yang mempunyai jarak antar cluster yang

paling maksimal / terjauh dan digabungkan (merge) kedalam
cluster baru (sehingga c=c-1)
yang diinginkan.
7
Cluster 2
6 6
a
5 5
Jarak cluster 1
ke cluster 2
4 4 =
3 Jarak data 1 ke
data 6
2 3
1 1 2 Cluster 1
1 2 3 4 5 6 7
Gambar 2.7 Ilustrasi Complete Linkage
4. Average Linkage Hierarchical Method

Average Linkage adalah proses pengclusteran yang didasarkan
pada jarak rata-rata antar obyeknya ( average distance) [6].
Metode ini relatif yang terbaik dari metode-metode hierarchical.
Namun, ini harus dibayar dengan waktu komputasi yang paling
tinggi dibandingkan dengan metode-metode hierarchical yang lain.
7
Cluster 2 Jarak cluster 1 ke
6 6
a
cluster 2
5 5 =
∑ Jarak antar data
4 4 nxm
3
Dimana :
2 3 n=jumlah data cluster 1
Cluster 1 m=jumlah data cluster 2
1 1 2
1 2 3 4 5 6 7
Gambar 2.8 Ilustrasi Average Linkage

12
2.4 ANALISA CLUSTER
Analisa cluster adalah suatu teknik analisa multivariate (banyak

variabel) untuk mencari dan mengorganisir informasi tentang variabel
tersebut sehingga secara relatif dapat dikelompokkan dalam bentuk yang
homogen dalam sebuah cluster [3]. Secara umum, bisa dikatakan
sebagai proses menganalisa baik tidaknya suatu proses pembentukan
cluster. Analisa cluster bisa diperoleh dari kepadatan cluster yang
dibentuk (cluster density). Kepadatan suatu cluster bisa ditentukan
dengan variance within cluster (Vw) dan variance between cluster (Vb).
Varian tiap tahap pembentukan cluster bisa dihitung dengan
rumus :
1 n
( ) (2.2)
∑ yi − y c
2
Vc 2 =
nc − 1 i =1
Dimana,
Vc2 = varian pada cluster c
c = 1..k, dimana k = jumlah cluster
nc = jumlah data pada cluster c
yi = data ke-i pada suatu cluste
yi = rata-rata dari data pada suatu cluster
Selanjutnya dari nilai varian diatas, kita bisa menghitung nilai variance
within cluster (Vw) dengan rumus :
1 c (2.3)
Vw = ∑ (ni − 1) ⋅ Vi 2
N − c i =1
Dimana,
N = Jumlah semua data
ni = Jumlah data cluster i
Vi= Varian pada cluster i
Dan nilai variance between cluster (Vb) dengan rumus :
1
( ) (2.4)
c
∑
2
Vb = ni y i − y
c −1 i =1
Dimana,
y = rata-rata dari y i
Salah satu metode yang digunakan untuk menentukan cluster yang ideal
adalah batasan variance [7], yaitu dengan menghitung kepadatan
13
cluster berupa variance within cluster (Vw) dan variance between

cluster (Vb) [8,1]. Cluster yang ideal mempunyai Vw minimum yang
merepresentasikan internal homogenity dan maksimum Vb yang
menyatakan external homogenity.
V =
Vw (2.5)
Vb
Meskipun minimum Vw menunjukkan nilai cluster yang ideal, tetapi
pada beberapa kasus kita tidak bisa menggunakannya secara langsung
untuk mencapai global optimum. Jika kita paksakan, maka solusi yang
dihasilkan akan jatuh pada local optima.
2.5 IDENTIFIKASI POLA PERGERAKAN VARIAN
Identifikasi pola pergerakan varian merupakan metode untuk

memperoleh cluster yang mencapai global optimum, yang mampu
mengatasi masalah dari minimum V. Gambar 2.6 menunjukkan
pergerakan varian pada tiap tahap pembentukan cluster, dimana dari
gambar tersebut terlihat bahwa global optimum berada pada tahap ke 15,
dengan 6 total cluster.
Gambar 2.9 Pergerakan Variance pada tiap

Tahap Pembentukan cluster
Berikut tahap untuk menemukan global optimum dari tahap

pembentukan cluster :
a) Mendeskripsikan semua pola dari pergerakan varian, seperti
gambar 2.6 diatas.
b) Menganalisa kemungkinan global optimum yang berada pada
tempat yang tepat.
c) Melihat posisi dari global optimum yang mungkin.
Posisi yang mungkin untuk menemukan global optimum pada
pergerakan varian, dikelompokkan menjadi 2, yaitu :
14
1. Hill-climbing
Pada Hill-climbing didefinisikan bahwa kemungkinan mencapai
global optimum terletak pada tahap ke-i, jika memenuhi persamaan
berikut :
vi +1 > α .vi (2.6)
Dimana, α adalah nilai tinggi.
Nilai tinggi digunakan untuk menentukan seberapa mungkin metode
ini mencapai global optimum. Nilai α yang biasa digunakan adalah
2,3, dan 4.
Persamaan diatas, diperoleh berdasar analisa pergerakan varian pola
Hill-climbing berikut:
Gambar 2.10 Pola nilai beda Hill-climbing
2. Valley-tracing
Pada Valley-tracing didefinisikan bahwa kemungkinan mencapai
global optimum terletak pada tahap ke-i, jika memenuhi persamaan
berikut :
( v i −1 ≥ v i ) ∩ ( v > vi ) (2.7)
i +1
Dimana i = 1…n, dan n tahap terakhir pembentukan cluster.

Persamaan diatas, diperoleh berdasar analisa pergerakan varian pola
Valley-tracing berikut :
Gambar 2.11 Pola nilai beda Valley-tracing

Berikut tabel yang menunjukkan pola-pola Valley-tracing yang mungkin
mencapai global optimum [9]. Pola yang mungkin ditandai dengan
simbol √.
15
Tabel 1. Tabel kemungkinan pola

Valley-tracing mencapai global optimum
Selanjutnya, baik dengan pendekatan metode valley-tracing maupun

hill-climbing dilakukan identifikasi perbedaan nilai tinggi (∂) pada tiap
tahap, yang didefinisikan dengan :
∂
( )
= v i +1 − v i + ( v i −1 − v i ) (2.8)
= (v i + 1 + v i − 1 ) − (2 × v i )
Nilai ∂ digunakan untuk menghindari local optima, dimana persamaan

ini diperoleh dari maksimum ∂ yang dipenuhi pada persamaan 7.
Untuk membentuk cluster secara otomatis, yaitu cluster yang mencapai
global optima, digunakan nilai λ sebagai threshold, sehingga cluster
secara otomatis terbentuk ketika memenuhi :
max (∂) ≥ λ (2.9)
Untuk mengetahui keakuratan dari suatu metode pembentukan cluster

pada hierarchical method, baik menggunakan valley-tracing maupun
hill-climbing, digunakan persamaan sebagai berikut :
16
φ = max (∂ ) (2.10)
nilaiterde katke max (∂ )
Dimana nilaiterde katke max (∂ ) adalah nilai kandidat max(∂)
sebelumnya. Nilai φ yang lebih besar dari 2, menunjukkan cluster yang
terbentuk merupakan cluster yang well-separated (terpisah dengan
baik).
2.6 KONSEP WARNA
Warna pokok [3] dalam pengelolaan citra terdiri dari 3 (tiga)

unsur, yaitu merah (R), hijau (H), dan biru (B). Jika warna-warna pokok
tersebut digabungkan, maka akan menghasilkan warna lain.
Penggabungan tersebut bergantung pada warna pokok yang tiap-tiap
warna memiliki nilai 256 (8 bit).
(255, 0, 0)
(255, 255, 0)
(255, 255, 255)
(0, 255, 0)
(0, 0, 255)
(128,128,128)
(255, 0, 255)
(0, 0, 0)
Gambar 2.12 Konsep Warna
Warna yang dideskripsikan dengan RGB adalah pemetaan yang

mengacu pada panjang gelombang dari RGB. Pemetaan menghasilkan
nuansa warna untuk masing-masing R, G, dan B. Masing-masing R, G,
dan B didiskritkan dalam skala 256, sehingga RGB akan memiliki
indeks antara 0 sampai 255.
BAB III
PERANCANGAN SISTEM
Pada bab ini pembahasan materi difokuskan pada perancangan dan

pembuatan sistem yang merupakan pokok pembahasan dari Tugas Akhir.
3.1. BLOK DIAGRAM SISTEM
Ekstraksi warna Ekstraksi warna

(RGB tiap pixel) (RGB tiap pixel)
Image Training Image Input
Proses Learning Clustering

(Cari Centroid Rata-rata) otomatis
Identifikasi centroid
hasil dengan centroid
Data Base Buah
Output berupa banyak

jenis buah dan namanya
Gambar 3.1 Blok Diagram Sistem
Gambar 3.1 menunjukkan gambaran sistem secara keseluruhan.

Berupa proses learning, dan proses identifikasi gambar. Pada proses
learning, data gambar buah yang ditraining merupakan data gambar
masing-masing buah atau buah tunggal, yang selanjutnya masuk ke proses
learning (pembelajaran) untuk mendapatkan nilai centroid buah, yang
17
18
kemudian satu persatu centroid buah disimpan dalam database, dan diberi
label sesuai dengan nama buah yang bersangkutan. Image input atau
gambar input, dalam hal ini merupakan gambar sekumpulan buah yang
akan diidentifikasi, selanjutnya diproses dengan metode Single Linkage
Hierarchical method (SLHM) yang dioptimasi dengan metode valley-
tracing sehingga mampu melakukan clustering secara otomatis sebanyak
jumlah jenis buah yang ada pada gambar input. Setelah dilakukan proses
clustering otomatis, maka akan didapat nilai centroid dari masing-masing
hasil cluster. Nilai centroid hasil ini kemudian dicari kedekatannya dengan
nilai centoid data training yang sebelumnya telah disimpan pada database
dengan Euclidean distance. Dari proses tersebut akan diketahui jumlah
jenis buah yang ada pada gambar dan namanya yang diperoleh dari label
pada database dan kemudian di-outputkan.
3.2. PENGAMBILAN GAMBAR
3.2.1 CAPTURE
Proses capture adalah proses pengambilan gambar melalui
kamera. Teknik pengambilan gambar yang digunakan adalah meletakkan
buah yang akan dikenali pada tempat yang disediakan di depan kamera.
Kamera yang digunakan adalah kamera digital. Gambar yang akan kita
pakai dibagi menjadi dua kategori, yaitu gambar test/input dan gambar
training. Dilakukan cara yang berbeda pula terhadap cara capture kedua
kategori tersebut.
Pada gambar training, masing-masing jenis buah yang dipakai
sebagai gambar training, dilakukan 5 kali capture dengan posisi buah
diubah-ubah. Sedangkan gambar input tidak ada aturan, kecuali bahwa
gambar input merupakan capture kumpulan buah, bukan capture buah
tunggal seperti pada training.
Dalam mengcapture gambar dari kamera , ada beberapa hal yang
harus diperhatikan , yaitu :
• Spesifikasi Kamera
Kamera yang digunakan untuk mengambil gambar adalah kamera
digital. Jarak kamera dengan buah saat identifikasi adalah tetap .
• Seting Kamera
Seting kamera untuk gambar training dan gambar input untuk
identifikasi harus sama, agar buah dapat dikenali.
• Seting Tempat
Seting tempat meletakkan obyek tetap, yaitu background warna putih
19
3.2.2 PERENCANAAN DATA

Perencanaan data sistem ini menggunakan format file gambar
dengan ektensi JPG. Dari proses capture diatas selanjutnya file gambar
tersebut diubah ukuran filenya sehingga menjadi ukuran yang kecil supaya
dalam proses tidak memperlama kinerja sistem yang dibuat. Pengubahan
file gambar disesuaikan dengan ukuran 32x32, baik pada gambar training
maupun gambar input.
Jumlah gambar yang digunakan adalah sebanyak 35, yang merupakan
hasil capture diatas, dengan rincian :
Gambar training :
a) Gambar apel (Washington) sebanyak 5.
Gambar 3.2 Gambar apel ukuran 32x32
b) Gambar jeruk (Clemenville) sebanyak 5.
Gambar 3.3 Gambar jeruk ukuran 32x32
c) Gambar pear sebanyak 5.
Gambar 3.4 Gambar pear ukuran 32x32
d) Gambar anggur sebanyak 5.
Gambar 3.5 Gambar anggur ukuran 32x32

20
e) Gambar mangga sebanyak 5.
Gambar 3.6 Gambar mangg ukuran 32x32
Gambar input/test
Gambar input berupa 10 buah gambar kumpulan buah.
Gambar 3.7 Gambar input ukuran 32x32
3.3. EKSTRAKSI WARNA
Proses ini dilakukan baik pada proses learning maupun proses

identifikasi untuk mengambil fitur warna berupa R,G, dan B dari gambar,
yang mana fitur inilah yang akan diproses lebih lanjut untuk didapatkan
nilai centroidnya sebagai acuan baik untuk data training maupun untuk
proses identifikasi.
Gambar 3.8 Ekstraksi Warna

21
Berikut potongan program untuk mendapatkan nilai R,G, dan B dari

tiap piksel gambar yang diberikan.
img1.getRGB(0,0,width,height,pixel,0,width);
for (int y=0;y<width;y++){
for (int x=0;x<height;x++){
c = pixel[x+height*y];
r = (c & 0x00ff0000) >> 16;
g = (c & 0x0000ff00) >> 8;
b = c & 0x000000ff;
data[m][0]= r;
data[m][1]= g;
data[m][2]= b;
3.4. PROSES LEARNING
K-Means
Clustering
Gambar 3.9 Blok Diagram Proses Learning
Gambar 3.9 menggambarkan blok diagram proses learning,

dimana setelah gambar diekstraksi warnanya, sehingga didapat nilai
R,G,dan B, selanjutnya nilai tersebut di-cluster oleh system dengan
menggunakan algoritma K-means seperti yang telah dijelaskan pada bab
sebelumnya., dengan inisialisasi jumlah cluster sebanyak 3, yang
merepresentasikan buah, background, dan bayang-bayang. Dari proses
22
tersebut, akan diperoleh 3 buah nilai centroid, yaitu nilai centroid buah itu
sendiri, nilai centroid background dan nilai centroid bayang-bayang.
Karena yang kita ingin dapatkan hanya nilai centroid dari buah, maka
dilakukan proses menghilangkan background dan bayang-bayang.
Algoritmanya sebagai berikut :
1. Dari 3 centroid yang didapat, masing-masing hitung nilai member/
anggotanya
2. Bandingkan ketiganya, yang paling kecil anggotanya (minimum)
diabaikan atau dibuang, karena centroid dengan jumlah anggota kecil
merepresentasikan nilai noise.
3. Pada 2 sisa centroid yang ada, dilakukan pengukur jarak masing-
masing nilai R,G,B-nya terhadap nilai 255,255,255 (representasi nilai
putih/background) dengan euqlidean distance.
4. Bandingkan keduanya, nilai jarak terkecil (minimum) diabaikan
karena dekat dengan nilai putih (255,255,255), diasumsikan sebagai
background. Centroid yang tersisa itulah centroid buah yang dicari.
/* ----- eliminasi noise ----- */
min3=minvar[0];
for (int j=1;j<3;j++){
if (minvar[j]< min3)
min3=minvar[j];
}
/*----- Eliminasi background putih ----- */
tempcentro = new int[3][3];
double[] sum = new double[3];
for (int y=0;y<cluster;y++){
if ( minvar[y]!= min3 ){
sum[y]=0 ;
for (int i=0;i<3;i++){
tempcentro[y][i] = 255;
sum[y] = sum[y]+ Math.pow((
tempcentro[y][i]- centAwal[y][i]),2);
}
sum[y]=Math.round((float)Math.sqrt(sum[y]));
}
else
sum[y]=0 ;
}
max1 = (int) sum[0];max2 = 0 ;
for (int y=0;y<cluster;y++){
if (sum[y] > max1){
max1 = (int) sum[y];
max2 = y;
}
}
23
Diatas adalah potongan program yang digunakan untuk mengeliminasi

noise/ bayang-bayang dan background sehingga diperoleh hanya 1
centroid, yaitu centroid buah.
Selanjutnya, niilai yang disimpan dalam database adalah nilai grand
centroid, bukan nilai centroid. Nilai grand centroid adalah nilai rata-rata
dari beberapa centroid. Untuk mendapatkan grand centroid dalam system
ini, user diharapkan terhadap 1 jenis buah training dilakukan 5 kali load
gambar buah tersebut, dimana gambar buah dengan posisi yang berbeda-
beda. Hal ini dilakukan untuk menangani kemungkinan centroid yang
berbeda pada tiap kali pengambilan centoid suatu jenis buah. Nilai rata-
rata dari 5 kali pengambilan sample buah inilah yang disebut grand
centroid, dan diberi label sesuai dengan nama buah yang bersangkutan,
selanjutnya disimpan dalam database. Berikut table database yang
digunakan.
Tabel 3.1 Tabel Database Grand Centroid
R G B Buah
80 28 30 Apel
115 68 37 Jeruk
132 31 34 Anggur
...... ..... ......... ..............
3.5. PROSES IDENTIFIKASI
Gambar 3.10 berikut menggambarkan blok diagram proses

identifikasi, dimana setelah gambar diekstraksi warnanya, sehingga
didapat nilai R,G,dan B, selanjutnya nilai tersebut di-cluster oleh system
dengan menggunakan algoritma Single Linkage Hierarchical Method yang
juga mengaplikasikan metode valley tracing untuk membentuk cluster
secara otomatis.. Disinilah proses pembentukan cluster terjadi. Cluster
terbentuk dari sebesar n-1, dimana n adalah jumlah data, sampai n=2.
Pada tiap tahap pembentukan cluster dilakukan penghitungan nilai beda
tinggi ∂. Nilai tersebut dihitung dengan cara terlebih dahulu melakukan
pengecekan dengan metode valley tracing, jika memenuhi, maka nilai ∂
dihitung. Selanjutnya pada nilai ∂max itulah cluster yang optimal
24
terbentuk. Dari cluster yang terbentuk diperolehlah nilai centroid. Masuk

ke proses identifikasi, nilai centroid hasil dihitung kedekatannya dengan
nilai centroid masing-masing data learning menggunakan euqlidean
distance. Nilai jarak yang paling minimal dipilih dengan representasi
label pada data training.
Single linkage
Hierarchical
Method
Output Jumlah jenis dan

nama buah
Gambar 3.10 Blok Diagram Proses Identifikasi
Pada gambar desain GUI gambar 3.11 terdapat 11 bagian yang merupakan
informasi dalam menjalankan proses training dan identifikasi buah.
1. Untuk menampilkan gambar training yang akan diproses
2. Keseluruhan proses clustering dengan K-Means, dengan hasil nilai
centroid buah training.
3. Menampilkan nilai grand centroid, setelah penekanan tombol save
4. Nama buah yang akan dipakai sebagai label atas hasil grand centroid
yang diperoleh dari suatu gambar training.
5. Untuk menyimpan nilai grand centroid dan label pada database, juga
menampilkan nilai grand centroid dari gambar training.
6. Untuk menghapus data dari database, dengan cara select data dari list
yang digunakan menampilkan database.
25
7. Menampilkan isi dari database, dan bisa dihapus dengan memilih

data pada bagian ini
8. Untuk menampilkan gambar input yang akan diidentifikasi
9. Keseluruhan proses clustering dengan Single Linkage
Hierarchical Method, penghitungan varian, sampai didapat nilai
centroid gambar input secara otomatis.
10. Untuk menampilkan output berupa jumlah macam buah yang ada
pada gambar input.
11. Menampilkan banyak proses, untuk proses learning ditampilkan
nilai centroid tiap gambar training sebelum di rata-rata menjadi
grand centroid. Sedang untuk proses identifikasi akan
ditampilkan nilai varian dari tiap tahap pembentukan clusternya,
nilai beda tinggi (∂).
12. Menampilkan nama-nama buah yang berhasil diidentifikasi
13. Menampilkan nilai centroid dari masing-masing cluster yang
terbentuk.
1 8
2 9
3
10
4
12
5 6
11
7
13
Gambar 3.11 GUI Proses Training Dan Identifikasi

26
*Halaman ini sengaja dikosongkan*

BAB IV
ANALISA HASIL SISTEM
4.1. SPESIFIKASI TRAINING

Pada bab ini dimaksudkan untuk mengetahui keseluruhan
pengujian dari perencanaan hasil program yang telah dibuat. Dimana
pertama kali kita lakukan proses learning terhadap masing-masing
gambar image yang akan digunakan dalam identifikasi buah, yaitu apel,
jeruk, pear, anggur, dan mangga.
4.1.1 Pengambilan Grand Centroid Jeruk
Gambar 4.1 Pengambilan Grand Centroid Jeruk

Nilai R=172, G=102, B=56 , merepresentasikan buah jeruk.
4.1.2 Pengambilan Grand Centroid Apel
Nilai R=73, G=53, B=62 , merepresentasikan buah apel.
27
28
Gambar 4.2 Pengambilan Grand Centroid Apel
4.1.3 Pengambilan Grand Centroid Pear
Gambar 4.3 Pengambilan Grand Centroid Pear

Nilai R=143, G=141, B=97 , merepresentasikan buah pear.
29
4.1.4 Pengambilan Grand Centroid Anggur
Gambar 4.4 Pengambilan Grand Centroid Anggur

Nilai R=37, G=28, B=30 , merepresentasikan buah anggur.
4.1.5 Pengambilan Grand Centroid Mangga
Gambar 4.5 Pengambilan Grand Centroid Mangga

30
Nilai R=146, G=151, B=47 , merepresentasikan buah anggur.
4.2. ANALISA KESELURUHAN DATA TRAINING.

Lima macam buah ditraining untuk didapat nilai centroid
masing-masing. Masing-masing buah dicoba sebanyak lima kali, yang
kemudian dari 5 macam buah terhadap 5 kali percobaan diperoleh nilai
centroid masing-masing buah yang kemudian di-labeli dengan nama
buah yang bersangkutan dan disimpan dalam database. Berikut ini
adalah tabel nilai grand centroid dari masing-masing buah, dimana telah
dilakukan sebanyak 5 kali percobaan masing-masingnya.
Tabel 4.1 Grand Centroid Masing-masing Buah
R G B Buah
58 31 37 Apel
174 108 66 Jeruk
146 151 47 Mangga
143 141 97 Pear
37 28 30 Anggur
Pada tiap percobaan pengambilan gambar, meskipun terhadap satu

gambar yang sama, terkadang diperoleh hasil centroid yang berbeda, hal
ini dikarenakan kelemahan metode K-Mean, dimana centroid awalnya
dibangkitkan secara random, tetapi hal itu tidak menjadi masalah, karena
nilai yang dipakai nantinya adalah nilai grand centroid, yang mana
merupakan nilai rata-rata centroid tiap buah. K-mean digunakan dalam
proses training karena proses komputasinya yang sangat cepat.
Semakin banyak training yang dilakukan pada 1 jenis buah, akan
semakin baik representasi nilai grand centroid terhadap buah tersebut.
4.3. PENGUJIAN SISTEM IDENTIFIKASI BUAH

Berikut adalah pengujian sistem terhadap identifikasi buah. Dari 10
percobaan yang dilakukan berikut ini, akan dianalisa bagaimana metode
valley tracing bekerja mendeteksi pergerakan varian, dengan bertindak
sebagai constraint melalui nilai beda tinggi (∂). Pada beberapa kasus
cluster yang terbentuk tidak tepat, hal ini dikaranakan kualitas gambar
yang tidak baik sehingga mengandung pixel-pixel yang mengganggu
sehingga membentuk cluster yang tidak diinginkan. Karena kualitas
31
gambar yang dipakai mempengaruhi kinerja sistem. Dimana pixel-pixel

yang dihasilkan mempengaruhi kinerja clustering.
Pengujian 1 :
Gambar 4.6 Pengujian terhadap gambar 1

Dari gambar 4.6 diperoleh 5 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max. Berikut grafik nilai ∂.
N ilai B eda Tinggi
500
400
Nilai Beda Tinggi
300
200
100
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r
Gambar 4.7 Grafik Nilai Beda Tinggi gambar 1

Berikut nilai centroid dari 5 cluster yang terbentuk :
32
Tabel 4.2 Nilai centroid hasil clustering gambar input 1

Cluster R G B Identifikasi Centroid
1 178 156 162 Pear
2 210 194 212 Background
3 87 51 33 Mangga
4 223 100 23 Jeruk
5 57 50 15 Apel
Pengujian terhadap gambar input diatas adalah benar 100%, dimana
didalamnya terbentuk 5 cluster. Secara kasat mata bisa kita lihat bahwa
gambar input diatas memang membentuk 5 cluster, dengan rincian tiap
cluster mewakili background, buah jeruk, buah apel , buah pear dan
buah mangga. Tabel 4.2 menyajikan masing-masing nilai centroid
cluster dan hasil identifikasinya, yaitu dengan menghitung nilai
kedekatan masing-masing centroid hasil dengan centroid training
menggunakan euqlidean distance.
Pada pengujian 1, jumlah buah terdeteksi benar adalah 4 dari 4 jenis
buah, yang diidentifikasi sebagai buah jeruk, buah apel , buah pear dan
buah mangga, proses identifikasi tepat 100%.
Pengujian 2 :

33
mempunyai nilai ∂max. Berikut grafik nilai ∂.
N ilai B eda Tinggi
800
700
Nilai Beda Tinggi
600
500
400
300
200
100
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p Pe m be ntuka n Cluste r

2 117 83 17 Jeruk
3 94 85 63 Pear
4 46 55 10 Mangga

centroid cluster mewakili background, buah jeruk, buah pear dan buah
mangga. Tabel 4.3 menyajikan masing-masing nilai centroid cluster dan
hasil identifikasinya, yaitu dengan menghitung nilai kedekatan masing-
masing centroid hasil dengan centroid training menggunakan euqlidean
distance.
Pada pengujian 2, jumlah buah terdeteksi benar adalah 3, yang
diidentifikasi sebagai buah jeruk, buah pear dan buah mangga, proses
identifikasi tepat 100%.
34
Pengujian 3 :

mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 3. Berikut grafik nilai ∂.
N ilai B eda Tinggi
5000
4000
Nilai Beda Tinggi
3000
2000
1000
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

35

2 44 19 18 Apel
3 44 42 44 Anggur

centroid cluster mewakili background, buah apel dan buah anggur.
Tabel 4.4 menyajikan masing-masing nilai centroid cluster dan hasil
identifikasinya, yaitu dengan menghitung nilai kedekatan masing-
distance.
diidentifikasi sebagai buah apel dan buah anggur, proses identifikasi
tepat 100%.
Pengujian 4 :

36
N ilai B ed a T ing gi
6000
5000
Nilai Beda Tinggi
4000
3000
2000
1000
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

2 81 62 17 Mangga
3 154 113 90 Jeruk

centroid cluster mewakili background, buah mangga dan buah jeruk.
Tabel 4.5 menyajikan masing-masing nilai centroid cluster dan hasil
distance.
diidentifikasi sebagai buah mangga dan buah jeruk, proses identifikasi
tepat 100%.
37
Pengujian 5 :

Nilai Beda Tinggi
3000
2500
Nilai Beda Tinggi
2000
1500
1000
500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Tahap Pembentukan Cluster

38

2 190 158 95 Jeruk
3 50 31 28 Apel
4 115 40 33 Anggur
centroid cluster mewakili background, buah apel, buah anggur dan buah
jeruk. Tabel 4.6 menyajikan masing-masing nilai centroid cluster dan
distance.
diidentifikasi sebagai buah apel, buah anggur dan buah jeruk, proses
Pengujian 6 :

39
N ilai B eda Tinggi
800
700
Nilai Beda Tinggi
600
500
400
300
200
100
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

2 125 53 26 Jeruk
3 247 156 79 Pear
4 73 9 9 Apel
Pengujian terhadap gambar input diatas adalah benar, dimana

centroid cluster mewakili background, buah apel, buah anggur dan buah
distance.
diidentifikasi sebagai buah apel, buah pear dan buah jeruk. Proses
pembentukan cluster yang menandai jumlah buah tepat sebesar 100%,
proses identifikasi tepat 100%.
40
Pengujian 7 :

N ilai B eda Tinggi
800
700
Nilai Beda Tinggi
600
500
400
300
200
100
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

41

2 116 29 22 Apel
3 173 41 2 Jeruk
4 254 170 2 Pear

centroid cluster mewakili background, buah apel, buah pear dan buah
distance.
diidentifikasi sebagai buah apel, buah pear dan buah jeruk, proses
Pengujian 8 :
Gambar
nilai ∂ yang pada Pengujian terhadap
4.20diepresentasikan
program gambar
dengan 8 Cluster yang
theta.
42

N ilai B ed a T in gg i
3500
3000
Nilai Beda Tinggi
2500
2000
1500
1000
500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

2 162 70 26 Apel
3 167 187 207 Pear
Pengujian terhadap gambar input diatas adalah benar dalam hal

pembentukan cluster otomatisnya, dimana didalamnya terbentuk 3
cluster. Secara kasat mata bisa kita lihat bahwa gambar input diatas
memang membentuk 3 cluster, dengan rincian tiap centroid cluster
mewakili background, buah apel dan buah jeruk. Tabel 4.9 menyajikan
masing-masing nilai centroid cluster dan hasil identifikasinya, yaitu
dengan menghitung nilai kedekatan masing-masing centroid hasil
dengan centroid training menggunakan euqlidean distance.
buah, yang diidentifikasi sebagai buah apel. Buah kedua yang
seharusnya adalah buah jeruk, salah teridentifikasi sebagai buah pear,
hal ini dikarenakan nilai centroid cluster ke-3 memiliki kedekatan lebih
dengan nilai centroid buah pear daripada nilai centroid buah jeruk.
Proses pembentukan cluster yang menandai jumlah buah tepat sebesar
100%, proses identifikasi tepat 50%.
43
Pengujian 9 :

2500
2000
Nilai Beda Tinggi
1500
1000
500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

44

2 110 78 67 Apel
3 156 171 84 Pear
4 253 157 48 Jeruk

mewakili background, buah apel, buah mangga, dan buah jeruk. Tabel
4.10 menyajikan masing-masing nilai centroid cluster dan hasil
distance.
buah, yang diidentifikasi sebagai buah apel dan buah jeruk. Buah
ketiga yang seharusnya adalah buah mangga, salah teridentifikasi
sebagai buah pear, hal ini dikarenakan nilai centroid cluster ke-3
memiliki kedekatan lebih dengan nilai centroid buah pear daripada nilai
centroid buah mangga. Kesalahan tersebut bisa jadi karena centroid
dalam data training kurang presisi dalam mewakili centroid suatu jenis
buah, dalam hal ini buah mangga. Proses pembentukan cluster yang
menandai jumlah buah, tepat sebesar 100%, proses identifikasi tepat
66,7%.
Pengujian 10 :
45

3000
2500
Nilai Beda Tinggi
2000
1500
1000
500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

46

2 48 23 36 Apel
3 121 113 77 Mangga
mewakili background, buah apel, dan buah pear. Tabel 4.11 menyajikan
masing-masing nilai centroid cluster dan hasil identifikasinya, yaitu
dengan menghitung nilai kedekatan masing-masing centroid hasil
dengan centroid training menggunakan euqlidean distance.
buah, yang diidentifikasi sebagai buah apel. Buah kedua yang
seharusnya adalah buah pear, salah teridentifikasi sebagai buah mangga,
Proses pembentukan cluster yang menandai jumlah buah, tepat sebesar
100%. Proses identifikasi tepat 50%.
Pengujian 11 :

47
N ilai B eda Ting gi
300
250
Nilai Beda Tinggi
200
150
100
50
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

2 73`` 47 48 Apel
3 219 119 61 Jeruk
Pengujian terhadap gambar input diatas seharusnya terbentuk 4 cluster.

dimana tiap centroid cluster mewakili background, buah apel, buah
jeruk, dan buah pear. Tabel 4.12 menyajikan masing-masing nilai
centroid cluster dan hasil identifikasinya, yaitu dengan menghitung nilai
kedekatan masing-masing centroid hasil dengan centroid training
menggunakan euqlidean distance.
buah, yang diidentifikasi sebagai buah apel dan jeruk. Buah ketiga
yang seharusnya adalah buah pear, tidak teridentifikasi karena kesalahan
pembentukan cluster otomatis, dimana seharusnya terbentuk 4 cluster,
tetapi hanya terbentuk 3 cluster, sehingga 1 buah tidak teridentifikasi.
Proses pembentukan cluster yang menandai jumlah buah, tepat sebesar
75%. Proses identifikasi tepat 66,7%.
48
Pengujian 12 :

nilai ∂ yang pada program diepresentasikan dengan theta. Pada
percobaan ini kemungkinan tidak tercapainya cluster optimal sangat
besar, dimana nilai ∂max terdapat pada tahap pembentukan cluster
sebanyak 17. Berikut grafik nilai ∂.
N ilai B eda Tingg i
160
140
Nilai Beda Tinggi
120
100
80
60
40
20
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

49

jeruk, dan buah mangga, sehingga buah yang dikenali jauh lebih banyak
daripada buah sesungguhnya.
Pada pengujian 12, Proses pembentukan cluster yang menandai jumlah
buah, tepat hanya sebesar 23,5%. Proses identifikasi tepat 100%.
Pengujian 13 :

Tahap pembentukan cluster gambar 13 sebanyak 5.Berikut grafik nilai ∂
N ilai B eda Tinggi
2500
2000
Nilai Beda Tinggi
1500
1000
500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p Pe m be ntuka n Cluste r

50

jeruk, dan buah anggur, tetapi ternyata cluster yang terbentuk adalah 5,
sehingga buah yang dikenali lebih banyak daripada buah sesungguhnya.
Pada pengujian 13, proses pembentukan cluster yang menandai jumlah
buah, tepat sebesar 80 %. Proses identifikasi juga tepat sebesar 66,7%.
Pengujian 14 :

N ilai B ed a Tin gg i
1400
1200
Nilai Beda Tinggi
1000
800
600
400
200
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

51

jeruk, dan buah anggur, tetapi ternyata cluster yang terbentuk adalah 5,
sehingga buah yang dikenali lebih banyak daripada buah sesungguhnya.
Pada pengujian 14, proses pembentukan cluster yang menandai jumlah
buah, tepat sebesar 80 %. Proses identifikasi juga tepat sebesar 66,7%.
Pengujian 15 :

N ilai B eda Tinggi
800
700
Nilai Beda Tinggi
600
500
400
300
200
100
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

52

jeruk, buah mangga dan buah pear, tetapi ternyata cluster yang terbentuk
adalah 3. Jumlah buah terdeteksi benar adalah 1 dari 4 jenis buah, yang
diidentifikasi sebagai buah mangga. Proses pembentukan cluster yang
menandai jumlah buah, tepat sebesar 75%. Proses identifikasi tepat
hanya sebesar 25%.
Pengujian 16 :

N ilai B eda Tinggi
160
140
Nilai Beda Tinggi
120
100
80
60
40
20
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3

53

jeruk, buah mangga,buah anggur dan buah pear, tetapi ternyata cluster
yang terbentuk adalah 4. Jumlah buah terdeteksi benar adalah 3 dari 5
jenis buah, yang diidentifikasi sebagai buah apel, buah jeruk, dan buah
pear. Proses pembentukan cluster yang menandai jumlah buah, tepat
sebesar 66,7 %. Proses identifikasi tepat sebesar 60 %.
Pengujian 17 :

N ilai B eda Tinggi
3500
3000
Nilai Beda Tinggi
2500
2000
1500
1000
500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

54

dimana tiap centroid cluster mewakili background, buah apel, dan buah
anggur, tetapi ternyata cluster yang terbentuk adalah 5. Jumlah buah
terdeteksi benar adalah 1 dari 2 jenis buah, yang diidentifikasi sebagai
buah apel. Proses pembentukan cluster yang menandai jumlah buah,
tepat sebesar 60 %. Proses identifikasi tepat sebesar 50 %.
Pengujian 18 :

N ilai B eda Tinggi
2500
2000
Nilai Beda Tinggi
1500
1000
500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

55

anggur, tetapi ternyata cluster yang terbentuk adalah 3. Jumlah buah
buah mangga. Proses pembentukan cluster yang menandai jumlah buah,
tepat sebesar 75 %. Proses identifikasi tepat sebesar 33,3 %.
Pengujian 19 :

N ilai B eda Tinggi
1600
1400
Nilai Beda Tinggi
1200
1000
800
600
400
200
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

56

pear, tetapi ternyata cluster yang terbentuk adalah 4. Jumlah buah
buah pear dan buah apel. Proses pembentukan cluster yang menandai
jumlah buah, tepat sebesar 75 %. Proses identifikasi tepat 100 %.
Pengujian 20 :

N ilai B eda Tinggi
1600
1400
Nilai Beda Tinggi
1200
1000
800
600
400
200
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2

57

mewakili background, buah apel, buah jeruk dan buah anggur.
buah, yang diidentifikasi sebagai buah apel dan buah jeruk. Proses
pembentukan cluster yang menandai jumlah buah, tepat sebesar 100%.
Proses identifikasi tepat 66,7%.
Berikut tabel hasil analisa proses pendeteksian jumlah buah dan

identifikasi jenis buah berdasarkan 20 pengujian diatas.
Tabel 4.12 Akurasi Identifikasi Terhadap 20 Percobaan
Identifikasi Gambar
Identifikasi Gambar Oleh Sistem
Sebenarnya
Jumlah
Jumlah Jenis buah
Jenis Buah buah
Buah teridentifikasi
terdeteksi
2 Apel, anggur 2 Apel, anggur
2 Jeruk, mangga 2 Jeruk, mangga
2 Jeruk, apel 2 Apel, pear
2 Apel, pear 2 Apel, mangga
2 Pear, apel 3 Pear, apel, jeruk
Pear, mangga, jeruk,
2 Apel, anggur 4
apel
3 Apel, jeruk, pear 2 Apel, jeruk
Apel, jeruk,
3 2 Pear, mangga
mangga
3 Jeruk, apel, anggur 3 Apel, jeruk, pear
3 Jeruk, apel, anggur 3 Jeruk,apel,anggur
3 Jeruk, apel, pear 3 Jeruk, apel, pear
3 Jeruk, apel, pear 3 Jeruk, apel, pear
Mangga, jeruk,
3 3 Mangga, jeruk, pear
pear
Mangga, apel,
3 3 Apel, pear, jeruk
jeruk
Jeruk, apel, mangga,
3 Jeruk, apel, anggur 4
pear
58
Jeruk, apel, pear,

3 Apel, anggur, jeruk 4
mangga
Apel, jeruk,
3 17 Apel, jeruk, mangga
mangga
Apel, mangga,
4 2 Mangga, anggur
pear, jeruk
apel, jeruk, pear, apel, jeruk, pear,
4 4
mangga mangga
Apel, mangga,
5 3 Apel, jeruk, pear
jeruk, pear, anggur
Dari 20 pengujian yang dilakukan terhadap sistem, keakuratan

pembentukan cluster secara otomatis yang merepresentasikan jumlah
buah adalah sebesar 55 %. Sedang identifikasi buahnya mempunyai
keakuratan sebesar 74,1 %. Kesalahan pembentukan cluster umumnya
dikarenakan kualitas gambar yang tidak bagus sehingga pixel noise
membentuk cluster yang tidak seharusnya ada, sehingga berakibat pada
kesalahan pendeteksian jumlah buah. Sedang kesalahan identifikasi
pada umumnya dikarenakan kurang akurasinya representasi nilai
centroid data training yang dijadikan acuan proses identifikasi.
BAB V
PENUTUP
5.1 KESIMPULAN
Pada bagian ini akan diulas tentang kesimpulan dari seluruh

percobaan dan pengujian software identifikasi buah dengan
memanfaatkan metode valley tracing.
Pada image clustering dibutuhkan data-data yang terpisah
dengan baik (well-separated) untuk mendapatkan hasil cluster yang
tepat, pembuatan algoritma yang bagus penggunaan metode untuk
membangun cluster secara otomatis.
Berikut beberapa kesimpulan yang dapat diambil dari percobaan
dan pengujian proyek akhir ini :
1. Proses identifikasi buah dengan Metode valley tracing dalam image
clustering mampu membentuk cluster secara otomatis dengan
keakuratan sebesar 55 %. Sedangkan hasil identifikasinya
mempunyai keakuratan mencapai 74,1 %.
2. Untuk medapatkan cluster yang tepat pada saat pengclusteran
otomatis terhadap data fitur R,G,B. Kualitas gambar juga
menentukan tepat tidaknya hasil cluster.
5.2 SARAN – SARAN
Hasil yang dicapai dari proyek akhir ini belum sempurna.

Untuk meningkatkan hasil yang dicapai, maka diperlukan :
1. Pre-processing terhadap image yang akan diproses dengan
clustering, hal ini untuk mereduksi pixel-pixel yang mengganggu
yang mengakibatkan terbentuknya cluster yang tidak diinginkan.
2. Penggunaan algoritma clustering yang lebih ampuh untuk
membentuk cluster, yang mampu menangani data yang
mengandung outlier (dalam hal ini pixel yang mengganggu).
3. Pengambilan gambar dengan pencahayaan yang bagus, agar
diperoleh kualitas gambar yang bagus.
59
60
* Halaman ini sengaja dikosongkan*

DAFTAR PUSTAKA
[1] W.H. Ming, C.J. Hou, Cluster analysis and visualization,

Workshop on Statistics and Machine Learning, Institute of
Statistical Science, Academia Sinica, 2004.Achmad Basuki,
Setiawardhana, “Histogram warna pada image”, PENS-ITS,
Surabaya.
[2] A.R. Barakbah, K. Arai, Determining Constraints of Moving
Variance to Find Global Optimum and Make Automatic
Clustering, In. IES 2004, Politeknik Elektronika Negeri
Surabaya, ITS.
[3] http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_h
tml/index.html
[4] http://www.w3.org/TR/REC-html40
[5] G. Karypis, E.H. Han, V. Kumar, Chameleon: a hierarchical
clustering algorithm using dynamic modeling, IEEE Computer:
Special Issue on Data Analysis and Mining 32(8):68W5, 1999.
[6] A.R. barakbah, Clustering, In. Workshop Data Mining 2006,
Jurusan Teknologi Informasi Politeknik Elektronika Negeri
Surabaya,ITS.
[7] C.J. Veenman, M.J.T. Reinders, E. Backer, A maximum
variance cluster algorithm, IEEE Transactions on Pattern
Analysis and Machine Intelligence, vol. 24, no. 9, pp. 1273-
1280, 2002.
[8] S. Ray, R.H. Turi, Determination of number of clusters in k-
means clustering and application in colour image
segmentation, 4th ICAPRDT Proc., pp.137-143, 1999.
[9] A.R. Barakbah, K. Arai, Identifying moving variance to make
automatic clustering for normal data set, In. Proc. IECI Japan
Workshop 2004 (IJW 2004), Musashi Institute of Technology,
Tokyo.
61
62
* Halaman ini sengaja dikosongkan*

63
PROFIL PENULIS
Nama : Helmy Hasniawati

Tanggal
: 19 Juli 1985
lahir
Orang tua : Drs. Hasan Ahmadi
Alamat : Gg. Merpati Putih Rt.1 / Rw. 2
No.457 Sugio- Lamongan 62256
Telepon : (0322) 458351 / 0856-48029209
Hoby : Nonton, Musik, Nulis, Baca
e-mail : luvmieq@yahoo.com
Motto : Do the best, then Allah do The rest
Riwayat : - Politeknik Elektronika Negeri
Pendidikan Surabaya-ITS, tahun 2003-2007
- SMU Negeri 2 Lamongan, tahun
2000 - 2003
- SLTP Negeri 1 Babat, tahun
1997 - 2000
- SDN Sugio 2, tahun 1991-1997

Identifikasi Buah

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Identifikasi Buah

Diunggah oleh

Hak Cipta:

Format Tersedia

PROYEK AKHIR

IMAGE CLUSTERING BERDASARKAN

Nana Ramadijanti, S.Kom, M.Kom

JURUSAN TEKNOLOGI INFORMASI

IMAGE CLUSTERING BERDASARKAN WARNA

Nana Ramadijanti, S.Kom, M.Kom

JURUSAN TEKNOLOGI INFORMASI

Proyek akhir ini bertujuan untuk membangun program aplikasi yang

Kata kunci : Pengenalan buah, SLHM, Image Clustering, Clustering

This final project was made to build an application program which

Keyword : Fruit Identification , SLHM, Image Clustering, Automatic

Alhamdulillah, segala puji syukur kehadirat Illahi Robbi Allah

IMAGE CLUSTERING BERDASARKAN WARNA UNTUK

Tugas akhir ini disusun untuk melengkapi persyaratan

Wassalamu’alaikum Wr. Wb.

Surabaya, Juli 2007

Melalui kesempatan ini, penulis ingin menyampaikan ungkapan

BAB II DASAR TEORI

BAB III PERANCANGAN SISTEM

BAB IV ANALISA HASIL SISTEM

DAFTAR PUSTAKA ..................................................................... . 61

Gambar 2.1 Ilustrasi Clustering.................................................... 5

Tabel 2.1 Kemungkinan pola Valley-tracing

1.1 LATAR BELAKANG

Dewasa ini perkembangan teknologi informasi berkembang

Tujuan dari pembuatan proyek akhir ini adalah untuk

1.3 RUMUSAN MASALAH

Permasalahan utama pada proyek akhir bagaimana membangun

1.4 BATASAN MASALAH

Batasan pada proyek akhir ini adalah sebagai berikut :

1.5 SISTEMATIKA PENULISAN

Sistematika pembahasan dari proyek ini adalah sebagai

BAB 2: TEORI PENUNJANG

BAB 4: ANALISA HASIL SISTEM

********** Halaman ini sengaja dikosongkan**********

2.1 PENGERTIAN CLUSTERING

Clustering adalah suatu cara menganalisa data dengan cara

Clustering berdasar warna

Clustering berdasar bentuk

Gambar 2.1 Ilustrasi clustering

2.2 KARAKTERISTIK CLUSTERING

Karakteristik clustering dibagi menjadi 4, yaitu :

2.3 ALGORITMA CLUSTERING

Ada beberapa algoritma yang sering digunakan dalam

2. Membangkitkan k centroids (titik pusat cluster) awal secara

Gambar 2.2 Ilustrasi Algoritma K-means

Gambar 2.3 Ilustrasi kelemahan K-means

Gambar 2.4 Ilustrasi Algoritma Hierarchical Clustering

Penghitungan jarak antar obyek, maupun antar clusternya dilakukan

Algoritma hierarchical clustering banyak diaplikasikan pada metode

Gambar 2.5 Ilustrasi Single Linkage

2. Centroid Linkage Hierarchical Method

Gambar 2.6 Ilustrasi Centroid Linkage

3. Complete Linkage Hierarchical Method

3. Mencari 2 cluster yang mempunyai jarak antar cluster yang

Gambar 2.7 Ilustrasi Complete Linkage

4. Average Linkage Hierarchical Method

Gambar 2.8 Ilustrasi Average Linkage

2.4 ANALISA CLUSTER

Analisa cluster adalah suatu teknik analisa multivariate (banyak

Dan nilai variance between cluster (Vb) dengan rumus :

cluster berupa variance within cluster (Vw) dan variance between

2.5 IDENTIFIKASI POLA PERGERAKAN VARIAN

Halaman ini sengaja dikosongkan

Halaman ini sengaja dikosongkan