Anda di halaman 1dari 75

PROYEK AKHIR

IMAGE CLUSTERING BERDASARKAN


WARNA UNTUK IDENTIFIKASI BUAH
DENGAN METODE VALLEY TRACING

HELMY HASNIAWATI
NRP. 7403 040 015

Dosen Pembimbing :
Ali Ridho Barakbah, S.Kom
NIP. 132 297 799

Nana Ramadijanti, S.Kom, M.Kom


NIP. 132 206 161

JURUSAN TEKNOLOGI INFORMASI


POLITEKNIK ELEKTRONIKA NEGERI SURABAYA
SURABAYA 2007
PROYEK AKHIR

IMAGE CLUSTERING BERDASARKAN WARNA


UNTUK IDENTIFIKASI BUAH DENGAN METODE
VALLEY TRACING

HELMY HASNIAWATI
NRP. 7403 040 015

Dosen Pembimbing :
Ali Ridho Barakbah, S.Kom
NIP. 132 297 799

Nana Ramadijanti, S.Kom, M.Kom


NIP. 132 206 161

JURUSAN TEKNOLOGI INFORMASI


POLITEKNIK ELEKTRONIKA NEGERI SURABAYA
SURABAYA 2007
ABSTRAK

Proyek akhir ini bertujuan untuk membangun program aplikasi yang


dapat mengenali buah-buahan. Ciri yang digunakan dalam identifikasi
buah adalah ciri warna (fitur R, G, dan B). Selanjutnya dilakukan
clustering dengan metode Single Linkage Hierarchical Method (SLHM)
terhadap ciri warna yang diperoleh. Dalam clustering, umumnya harus
dilakukan inisialisasi jumlah cluster yang diinginkan terlebih dahulu,
padahal pada beberapa kasus clustering, user bahkan tidak tahu berapa
banyak cluster yang bisa dibangun. Untuk itu, dalam proyek akhir ini
diaplikasikan metode Valley Tracing. Metode ini merupakan constraint
yang akan melakukan identifikasi terhadap pergerakan variance dari tiap
tahap pembentukan cluster, dan menganalisa polanya untuk membentuk
suatu cluster secara otomatis (automatic clustering). Jumlah cluster yang
diperoleh menunjukkan jumlah buah yang diidentifikasi, kemudian
nama buah masig-masing diperoleh dengan membandingkan nilai
centroid tiap cluster dengan nilai centroid data training yang sebelumnya
telah disimpan dalam database dan mempunyai label nama buah.
Image Clustering dengan metode valley tracing dalam membentuk
cluster secara otomatis mempunyai keakuratan sebesar 55 %. Sedangkan
hasil identifikasinya mempunyai keakuratan mencapai 74,1 %.

Kata kunci : Pengenalan buah, SLHM, Image Clustering, Clustering


Otomatis, Valley Tracing.

iii
ABSTRACT

This final project was made to build an application program which


has a capability to identify a group of fruit. The basic characteristic to be
processed , was colour feature (R, G, and B). Then those feature was
clustered or grouped using hierarchical clustering called Single Linkage
Hierarchical Method (SLHM). In clustering, commonly we have to
initialize how many cluster that we want to build first. Meanwhile, in
some clustering cases the users has not any idea to determine the
number of clusters. Hence, in this final project we proposed a new
approach called Valley Tracing to overcame that problem. This metode
act as constraint which is identify the moving variance from each stage
of cluster construction and analyze the pattern to perform an automatic
clustering. Number of cluster represents number of identified fruits, and
the fruit’s name obtained by comparing between centroid value of each
cluster and centroid value of training set which was stored in database
and labeled by fruit’s name.
The accuracy of appliying valley tracing method in image clustering
to build a cluster automatically was 55 %. Meanwhile, the accuracy of
its identification computed 74,1%.

Keyword : Fruit Identification , SLHM, Image Clustering, Automatic


Clustering, Valley Tracing.

iv
KATA PENGANTAR
Assalamu’alaikum Wr. Wb.

Alhamdulillah, segala puji syukur kehadirat Illahi Robbi Allah


SWT yang telah melimpahkan rahmat, hidayah serta karunia-Nya yang
tiada henti. Tiada lupa Shalawat dan salam semoga senantiasa
tercurahkan kepada Rasulullah Muhammad SAW beserta keluarga, para
sahabat serta seluruh pengikutnya sehingga penulis dapat menyelesaikan
buku laporan Tugas Akhir ini dengan judul :

IMAGE CLUSTERING BERDASARKAN WARNA UNTUK


IDENTIFIKASI BUAH DENGAN METODE VALLEY
TRACING

Tugas akhir ini disusun untuk melengkapi persyaratan


akademik dalam penyelesaian program pendidikan Diploma IV Jurusan
Teknologi Informasi di Politeknik Elektronika Negeri Surabaya ITS.
Dengan selesainya buku laporan proyek akhir ini, penulis
berharap semoga buku ini dapat membawa manfaat pembaca umumnya
dan juga bagi penulis pada khususnya serta semua pihak yang
berkepentingan. Penulis juga berharap agar proyek akhir ini dapat
dikembangkan lebih lanjut sehingga dapat benar-benar digunakan
sebaik-baiknya untuk mendukung perkembangan ilmu pengetahuan.
Penulis menyadari bahwa penulis adalah manusia biasa yang
tidak luput dari kesalahan dan kekurangan. Untuk itu, kritikan dan saran
yang bersifat membangun kami harapkan untuk perbaikan selanjutnya.

Wassalamu’alaikum Wr. Wb.

Surabaya, Juli 2007

Penulis

v
UCAPAN TERIMA KASIH

Melalui kesempatan ini, penulis ingin menyampaikan ungkapan


rasa terima kasih dari dalam hati atas terselesainya tugas akhir ini.
Khususnya rasa syukur kepada Allah SWT yang telah banyak
memberikan kekuatan dan rahmad-Nya kepada penulis. Juga tak lupa
penulis ucapkan terima kasih kepada :

1. Aba dan ibu, adikku dan keluarga besar bani yusuf yang telah
memberikan dukungan doa, motivasi, materiil, kasih sayang dan
segala-galanya yang tidak akan pernah bisa terukur nilainya.
2. Bapak Dr. Ir. Titon Dutono, M.Eng selaku Direktur Politeknik
Elektronika Negeri Surabaya.
3. Bapak Iwan Syarief, M.Kom selaku Ketua Jurusan Teknik
Informatika.
4. Bapak Ali Ridho Barakbah, S.Kom dan ibu Nana Ramadijanti,
S.Kom, M. Kom selaku dosen pembimbing yang telah dengan sabar
dan arif memberikan ilmu, pengarahan, bimbingan, dan masukan-
masukan kepada penulis selama mengerjakan Tugas Akhir ini.
5. Para dosen penguji proyek akhir yang turut menyempurnakan tugas
proyek akhir ini.
6. Mas Perumdos M2 for supporting me no matter what, yang selalu
ngingetin dan marahin aku, serta semua doa, bantuan dan
pengertiannya, viel dank, sehr verliebt für immer und ewig.
7. Seluruh Bapak Ibu dosen PENS-ITS yang telah membagikan
ilmunya, mohon maaf penulis tidak dapat menyebutkan satu-
persatu.
8. Komunitas D4-IT 2003 (Cangkrukan Community), ical, yeye, isna,
nia, c.phan, andri, sixta, c.wan, c.rud, ary, jonathan, coy, noor, desi,
uul, danang, vie, wuwu, fian, khakha, ukin, bagus, ruby, we are so
a happy family even more, zu vergessen nicht. Luv u all
9. TMB 95 Community, yanti, pasth, cebee, oks + ryo, novi, bwat
keceriaan, kegilaan, tangis, dan tawa. Suwun bantuane.
10. Revi, Wulan, especially for sending a time to help me, viel dank.
11. De Ayhiel material ’05, da direpotin mulu ma mbaknya, viel dank
12. Semua pihak yang telah membantu dalam penyelesaian tugas akhir
ini yang tidak dapat penulis sebutkan satu-persatu.

vi
DAFTAR ISI

HALAMAN JUDUL........................................................................ i
LEMBAR PENGESAHAN ............................................................ ii
ABSTRAK.................................................................. . .................... iii
ABSTRACT................................................................ ..................... iv
KATA PENGANTAR..................................................................... v
UCAPAN TERIMA KASIH........................................................... vi
DAFTAR ISI.................................................................................... vii
DAFTAR GAMBAR....................................................................... ix
DAFTAR TABEL............................................................................ xi

BAB I PENDAHULUAN
1.1 Latar Belakang ................................................................. 1
1.2 Tujuan ............................................................................. 1
1.3 Rumusan Masalah ........................................................... 2
1.4 Batasan Masalah....................................................... ....... 2
1.5 Sistematika Penulisan...................................................... 2

BAB II DASAR TEORI


2.1 Pengertian Clustering ....................................................... 5
2.2 Karakteristik Clustering.................................................... 6
2.3 Algoritma Clustering ........................................................ 6
2.4 Analisa Cluster ................................................................. 12
2.5 Identifikasi Pola Pergerakan Varian ................................. 13
2.6 Konsep Warna .................................................................. 16

BAB III PERANCANGAN SISTEM


3.1 Blok Diagram Sistem ....................................................... 17
3.2 Pengambilan Gambar ........................................................ 18
3.2.1 Capture....................................................................... 18
3.2.2 Perencanaan Data ...................................................... 19
3.3 Ekstraksi Warna.......... ....................................................... 20
3.4 Proses Learning ................................................................ 21
3.5 Proses Identifikasi ............................................................ 23

BAB IV ANALISA HASIL SISTEM


4.1 Spesifikasi Training........................................................... 27
4.1.1 Pengambilan Grand Centroid Jeruk........................... 27
4.1.2 Pengambilan Grand Centroid Apel........................... 27

vii
4.1.3 Pengambilan Grand Centroid Pear............................. 28
4.1.4 Pengambilan Grand Centroid Anggur........................ 29
4.1.5 Pengambilan Grand Centroid mangga....................... 29
4.2 Analisa Keseluruhan Data Training.................................... 30
4.3 Pengujian Sistem Identifikasi Buah.................................... 30

BAB V PENUTUP
5.1 Kesimpulan ...................................................................... . 59
5.2 Saran-saran....................................................................... . 60

DAFTAR PUSTAKA ..................................................................... . 61


PROFIL PENULIS......................................................................... . 63

viii
DAFTAR GAMBAR

Gambar 2.1 Ilustrasi Clustering.................................................... 5


Gambar 2.2 Ilustrasi Algoritma K-means .................................... 7
Gambar 2.3 Ilustrasi kelemahan K-means.................................... 7
Gambar 2.4 Ilustrasi Algoritma Hierarchical Clustering.............. 8
Gambar 2.5 Ilustrasi Single Linkage............................................ 9
Gambar 2.6 Ilustrasi Centroid Linkage ........................................ 10
Gambar 2.7 Ilustrasi Complete Linkage....................................... 11
Gambar 2.8 Ilustrasi Average Linkage......................................... 11
Gambar 2.9 Pergerakan Variance pada tiap Tahap
pembentukan cluster................................................. 13
Gambar 2.10 Pola nilai beda Hill-climbing.................................... 14
Gambar 2.11 Pola nilai beda Valley-tracing .................................. 14
Gambar 2.12 Konsep Warna .......................................................... 16
Gambar 3.1 Blok diagram sistem ................................................. 17
Gambar 3.2 Gambar apel ukuran 32x32....................................... 19
Gambar 3.3 Gambar jeruk ukuran 32x32 ..................................... 19
Gambar 3.4 Gambar pear ukuran 32x32 ...................................... 19
Gambar 3.5 Gambar anggur ukuran 32x32 .................................. 19
Gambar 3.6 Gambar mangga ukuran 32x32................................. 20
Gambar 3.7 Gambar input ukuran 32x32 .................................... 20
Gambar 3.8 Ekstraksi Warna........................................................ 20
Gambar 3.9 Blok Diagram Proses Learning................................. 21
Gambar 3.10 Blok Diagram Proses Identifikasi............................. 24
Gambar 3.11 GUI Proses Training Data Identifikasi ..................... 25
Gambar 4.1 Pengambilan Grand Centroid Jeruk.......................... 27
Gambar 4.2 Pengambilan Grand Centroid Apel........................... 28
Gambar 4.3 Pengambilan Grand Centroid Pear ........................... 28
Gambar 4.4 Pengambilan Grand Centroid Anggur ...................... 29
Gambar 4.5 Pengambilan Grand Centroid Mangga ..................... 29
Gambar 4.6 Pengujian terhadap gambar 1 ................................... 31
Gambar 4.7 Grafik Nilai Beda Tinggi gambar 1 .......................... 31
Gambar 4.8 Pengujian terhadap gambar 2 ................................... 32
Gambar 4.9 Grafik Nilai Beda Tinggi gambar 2 .......................... 33
Gambar 4.10 Pengujian terhadap gambar 3 ................................... 34
Gambar 4.11 Grafik Nilai Beda Tinggi gambar 3 .......................... 34
Gambar 4.12 Pengujian terhadap gambar 4 ................................... 35
Gambar 4.13 Grafik Nilai Beda Tinggi gambar 4. ......................... 36
Gambar 4.14 Pengujian terhadap gambar 5 .................................. 37

ix
Gambar 4.15 Grafik Nilai Beda Tinggi gambar 5 ....................... 37
Gambar 4.16 Pengujian terhadap gambar 6................................. 38
Gambar 4.17 Grafik Nilai Beda Tinggi gambar 6 ....................... 39
Gambar 4.18 Pengujian terhadap gambar 7................................. 40
Gambar 4.19 Grafik Nilai Beda Tinggi gambar 7 ....................... 40
Gambar 4.20 Pengujian terhadap gambar 8................................. 41
Gambar 4.21 Grafik Nilai Beda Tinggi gambar 8. ...................... 42
Gambar 4.22 Pengujian terhadap gambar 9................................. 43
Gambar 4.23 Grafik Nilai Beda Tinggi gambar 9 ....................... 43
Gambar 4.24 Pengujian terhadap gambar 10............................... 45
Gambar 4.25 Grafik Nilai Beda Tinggi gambar 10 ..................... 45
Gambar 4.26 Pengujian terhadap gambar 11............................... 46
Gambar 4.27 Grafik Nilai Beda Tinggi gambar 11 ..................... 47
Gambar 4.28 Pengujian terhadap gambar 12............................... 48
Gambar 4.29 Grafik Nilai Beda Tinggi gambar 12 ..................... 48
Gambar 4.30 Pengujian terhadap gambar 13............................... 49
Gambar 4.31 Grafik Nilai Beda Tinggi gambar 13. .................... 49
Gambar 4.32 Pengujian terhadap gambar 14............................... 50
Gambar 4.33 Grafik Nilai Beda Tinggi gambar 14 ..................... 50
Gambar 4.34 Pengujian terhadap gambar 15............................... 51
Gambar 4.35 Grafik Nilai Beda Tinggi gambar 15 ..................... 51
Gambar 4.36 Pengujian terhadap gambar 16............................... 52
Gambar 4.37 Grafik Nilai Beda Tinggi gambar 16 ..................... 52
Gambar 4.38 Pengujian terhadap gambar 17............................... 53
Gambar 4.39 Grafik Nilai Beda Tinggi gambar 17 ..................... 53
Gambar 4.40 Pengujian terhadap gambar 18............................... 54
Gambar 4.41 Grafik Nilai Beda Tinggi gambar 18. .................... 54
Gambar 4.42 Pengujian terhadap gambar 19............................... 55
Gambar 4.43 Grafik Nilai Beda Tinggi gambar 19 ..................... 55
Gambar 4.44 Pengujian terhadap gambar 20............................... 56
Gambar 4.45 Grafik Nilai Beda Tinggi gambar 20 ..................... 56

x
DAFTAR TABEL

Tabel 2.1 Kemungkinan pola Valley-tracing


mencapai global optimum .............................................. 15
Tabel 3.1 Grand Centroid............................................................... 23
Tabel 4.1 Grand Centroid Masing-masing Buah............................ 30
Tabel 4.2 Nilai centroid hasil clustering gambar input 1 ............... 32
Tabel 4.3 Nilai centroid hasil clustering gambar input 2 ............... 33
Tabel 4.4 Nilai centroid hasil clustering gambar input 3 ............... 35
Tabel 4.5 Nilai centroid hasil clustering gambar input 4 ............... 36
Tabel 4.6 Nilai centroid hasil clustering gambar input 5 ............... 38
Tabel 4.7 Nilai centroid hasil clustering gambar input 6 ............... 39
Tabel 4.8 Nilai centroid hasil clustering gambar input 7 ............... 41
Tabel 4.9 Nilai centroid hasil clustering gambar input 8 ............... 42
Tabel 4.10 Nilai centroid hasil clustering gambar input 9 ............... 44
Tabel 4.11 Nilai centroid hasil clustering gambar input 10 ............. 46
Tabel 4.12 Nilai centroid hasil clustering gambar input 11 ............. 47
Tabel 4.13 Akurasi Identifikasi Terhadap 20 Percobaan ................. 57

xi
xii
BAB I
PENDAHULUAN

1.1 LATAR BELAKANG

Dewasa ini perkembangan teknologi informasi berkembang


sangat pesat. Hal ini diikuti pula dengan banyaknya penelitian-penelitian
baru dalam bidang tersebut, diantaranya adalah yang berkaitan dengan
object recognition (pengenalan objek). Aplikasi object recognition yang
telah ada salah satunya adalah proses identifikasi / pengenalan buah
berdasarkan ciri warna. Pada pengenalan buah berdasarkan ciri warna
sebelumnya, sistem hanya mampu mengidentifikasi objek buah tunggal
[1]. Sistem yang dibangun belum mampu mengenali objek berupa
sekumpulan buah. Sehingga dibutuhkan suatu solusi untuk
permasalahan tersebut.
Dalam proyek akhir ini akan dibangun aplikasi image
clustering untuk mengidentifikasi buah berdasarkan warna. Dalam
clustering, umumnya harus dilakukan inisialisasi jumlah cluster yang
diinginkan terlebih dahulu, padahal pada beberapa kasus clustering, user
bahkan tidak tahu berapa banyak cluster yang bisa dibangun. Untuk itu,
dalam proyek akhir ini diaplikasikan metode Valley Tracing yang
mampu menyelesaikan masalah tersebut. Metode ini bisa melakukan
clustering secara otomatis (Automatic Clustering) terhadap fitur warna
berupa R,G,B dari buah dengan memanfaatkan Single Linkage
Hierarchical Method (SLHM), yaitu mendeteksi pergerakan varian
pada tiap tahap pembentukan clusternya untuk menemukan global
optimum sehingga bisa dibangun cluster secara otomatis (automatic
Clustering) [2]. Nilai centroid masing-masing hasil clustering
selanjutnya akan digunakan untuk mengidentifikasi jenis buah.

1.2 TUJUAN

Tujuan dari pembuatan proyek akhir ini adalah untuk


merancang dan membangun suatu aplikasi yang mampu mengenali atau
mengidentifikasi sekumpulan buah berdasarkan ciri warna. Serta
mampu menyumbangkan suatu metode baru dalam bidang object
recognition dengan memanfaatkan proses clustering.

1
2

1.3 RUMUSAN MASALAH

Permasalahan utama pada proyek akhir bagaimana membangun


sistem identifikasi buah, dari permasalahan ini akan dibahas 3
permasalahan yang penting yaitu :
- Bagaimana mengidentifikasi berapa jenis buah dalam gambar input.
- Bagaimana mengidentifikasi jenis buah apa saja yang ada pada
gambar input.
- Bagaimana menerapkan metode Valley Tracing untuk membangun
cluster secara otomatis (Automatic Clustering).

1.4 BATASAN MASALAH

Batasan pada proyek akhir ini adalah sebagai berikut :


- Objek yang digunakan adalah buah. Buah yang digunakan sebagai
objek adalah buah dengan warna-warna dominan, dan jenisnya
adalah : apel Washington, jeruk mandarin, mangga gadung, Pear,
dan Anggur.
- Obyek yang digunakan sudah tersimpan dalam format JPG, dengan
ukuran 32x32.
- Proses pembelajaran (learning process) menggunakan algoritma K-
means dengan inisialisasi jumlah cluster adalah 3.
- Software dirancang menggunakan java.
- Ciri yang dipakai adalah ciri warna dengan fitur R,G, dan B.
- Warna dasar tempat meletakkan objek tetap (background putih).
- Clustering menggunakan Single Linkage Hierarchichal Method
(SLHM) .

1.5 SISTEMATIKA PENULISAN

Sistematika pembahasan dari proyek ini adalah sebagai


berikut :

BAB 1: PENDAHULUAN
Dalam bab ini dijelaskan tentang latar belakang, tujuan,
rumusan masalah, batasan masalah, metodologi dan sistematika
penulisan.
3

BAB 2: TEORI PENUNJANG


Dalam bab ini dijelaskan tentang landasan teori yang
digunakan sebagai penunjang dalam pembuatan proyek akhir ini.
BAB 3: PERANCANGAN SISTEM
Membahas secara detail dari perencanaan dan pembuatan sistem
proyek akhir. Diantaranya adalah perencanaan GUI, pengaplikasian
clustering dengan SLHM, dll.

BAB 4: ANALISA HASIL SISTEM


Membahas tentang pengujian dari sistem yang telah dibuat beserta
analisanya. Pengujian dilakukan dengan akurasi jumlah pembentukan
cluster secara otomatis dan identifikasi jenis buah dengan euqlidean
distance.

BAB 5: PENUTUP
Bab ini berisi tentang kesimpulan dari keseluruhan pengerjaan
proyek akhir dan saran-saran untuk memperbaiki kelemahan sistem
yang telah dibuat demi pengembangan dan penyempurnaan di waktu
mendatang.
4

********** Halaman ini sengaja dikosongkan**********


BAB II
DASAR TEORI

2.1 PENGERTIAN CLUSTERING

Clustering adalah suatu cara menganalisa data dengan cara


mengelompokkan objek kedalam kelompok-kelompok berdasar suatu
kesamaan tertentu [1]. Bisa juga diartikan sebagai proses untuk
mendefinisikan pemetaan/mapping f:DÆC dari beberapa data D={t1, t2,
…… tn} kedalam beberapa cluster C={ c1, c2,…., cn} berdasarkan kesamaan
antar ti [2]. Sebuah cluster adalah sekumpulan obyek yang digabung
bersama karena persamaan atau kedekatannya [3]. Sedangkan Image
clustering ( pengelompokkan gambar ) adalah proses untuk membagi
atau mengelompokkan suatu image ke dalam beberapa bagian yang
berbeda, dimana pada tiap bagian yang berbeda tersebut anggotanya
mempunyai kesamaan khusus (homogen) [4]. Clustering biasa
digunakan pada banyak bidang, seperti : data mining, pattern
recognition (pengenalan pola), image classification (pengklasifikasian
gambar), ilmu biologi, pemasaran, perencanaan kota, pencarian
dokumen, dan lain sebagainya.

Clustering berdasar warna

Clustering berdasar bentuk

Gambar 2.1 Ilustrasi clustering

5
6

2.2 KARAKTERISTIK CLUSTERING

Karakteristik clustering dibagi menjadi 4, yaitu :


1. Partitioning clustering
Partitioning clustering disebut juga exclusive clustering, dimana
setiap data harus termasuk ke cluster tertentu. Karakteristik tipe ini
juga memungkinkan bagi setiap data yang termasuk cluster tertentu
pada suatu tahapan proses, pada tahapan berikutnya berpindah ke
cluster yang lain.
Contoh : K-Means, residual analysis.
2. Hierarchical clustering
Pada hierarchical clustering, Setiap data harus termasuk ke cluster
tertentu. Dan suatu data yang termasuk ke cluster tertentu pada suatu
tahapan proses, tidak dapat berpindah ke cluster lain pada tahapan
berikutnya.
Contoh: Single Linkage, Centroid Linkage,Complete Linkage,
Average Linkage.
3. Overlapping clustering
Dalam overlapping clustering, setiap data memungkinkan termasuk
ke beberapa cluster. Data mempunyai nilai keanggotaan
(membership) pada beberapa cluster.
Contoh: Fuzzy C-means, Gaussian Mixture.
4. Hybrid
Karakteristik hybrid adalah Mengawinkan karakteristik dari
partitioning, overlapping dan hierarchical.

2.3 ALGORITMA CLUSTERING

Ada beberapa algoritma yang sering digunakan dalam


clustering, yaitu :
1. K-Means
Termasuk partitioning clustering yang memisahkan data ke k daerah
bagian yang terpisah. K-means algorithm sangat terkenal karena
kemudahan dan kemampuannya untuk mengklaster data besar dan
data outlier dengan sangat cepat. Sesuai dengan karakteristik
partitioning clustering, Setiap data harus termasuk ke cluster
tertentu, dan Memungkinkan bagi setiap data yang termasuk cluster
tertentu pada suatu tahapan proses, pada tahapan berikutnya
berpindah ke cluster yang lain.
Algoritma K-Means :
1. Menentukan k sebagai jumlah cluster yang ingin dibentuk
7

2. Membangkitkan k centroids (titik pusat cluster) awal secara


random
3. Menghitung jarak setiap data ke masing-masing centroids
4. Setiap data memilih centroids yang terdekat
5. Menentukan posisi centroids baru dengan cara menghitung nilai
rata-rata dari data-data yang memilih pada centroid yang sama.
6. Kembali ke langkah 3 jika posisi centroids baru dengan centroids
lama tidak sama.

Gambar 2.2 Ilustrasi Algoritma K-means

Karakteristik K-Means :
• K-means sangat cepat dalam proses clustering
• K-means sangat sensitif pada pembangkitan centroids awal
secara random
• Memungkinkan suatu cluster tidak mempunyai anggota
• Hasil clustering dengan K-means bersifat tidak unik ( selalu
berubah-ubah) - terkadang baik, terkadang jelek.
• K-means sangat sulit untuk mencapai global optimum

Gambar 2.3 Ilustrasi kelemahan K-means


8

2. Hierarchical Clustering
Dengan metode ini, data tidak langsung dikelompokkan kedalam
beberapa cluster dalam 1 tahap, tetapi dimulai dari 1 cluster yang
mempunyai kesamaan, dan berjalan seterusnya selama beberapa
iterasi, hingga terbentuk beberapa cluster tertentu [2].
Arah hierarchical clustering dibagi 2, yaitu :
a) Divisive
- Dari 1 cluster ke k cluster
- Pembagian dari atas ke bawah (top to down division)
b) Agglomerative
- Dari N cluster ke k cluster
- Penggabungan dari bawah ke atas (down to top merge).
Algoritma Hierarchical clustering :
1. Menentukan k sebagai jumlah cluster yang ingin dibentuk
2. Setiap data dianggap sebagai cluster. Kalau N = jumlah data dan
c=jumlah cluster, berarti ada c=N.
3. Menghitung jarak antar cluster
4. Cari 2 cluster yang mempunyai jarak antar cluster yang paling
minimal dan gabungkan (berarti c=c-1).
5. Jika c>k, kembali ke langkah 3.

4 5 4 5 4 5

3 3 3

1 2 1 2 1 2

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

Gambar 2.4 Ilustrasi Algoritma Hierarchical Clustering

Penghitungan jarak antar obyek, maupun antar clusternya dilakukan


dengan Euclidian distance, khususnya untuk data numerik [2].
Untuk data 2 dimensi, digunakan persamaan sebagai berikut :
9

d (x,y) = n
(2.1)

2
x i − y i
i = 1

Algoritma hierarchical clustering banyak diaplikasikan pada metode


peng-clusteran berikut :
1. Single Linkage Hierarchical Method (SLHM)
Single Linkage adalah proses pengclusteran yang didasarkan
pada jarak terdekat antar obyeknya ( minimum distance) [5].
Metode SLHM sangat bagus untuk melakukan analisa pada tiap
tahap pembentukan cluster. Metode ini juga sangat cocok untuk
dipakai pada kasus shape independent clustering, karena
kemampuannya untuk membentuk pattern/pola tertentu dari
cluster. Sedangkan untuk kasus condensed clustering, metode ini
tidak bagus.
Algoritma Single Linkage Hierarchical Method :
1. Diasumsikan setiap data dianggap sebagai cluster. Kalau
n=jumlah data dan c=jumlah cluster, berarti ada c=n.
2. Menghitung jarak antar cluster dengan Euclidian distance.
3. Mencari 2 cluster yang mempunyai jarak antar cluster yang
paling minimal dan digabungkan (merge) kedalam cluster
baru (sehingga c=c-1)
4. Kembali ke langkah 3, dan diulangi sampai dicapai cluster
yang diinginkan.

7
Cluster 2
6 6
5 5
4
Jarak cluster 1
4
ke cluster 2
3 =
Jarak data 3 ke
2 3
data 4
1 1 2 Cluster 1

1 2 3 4 5 6 7

Gambar 2.5 Ilustrasi Single Linkage


10

2. Centroid Linkage Hierarchical Method


Centroid Linkage adalah proses pengclusteran yang didasarkan
pada jarak antar centroidnya [6]. Metode ini bagus untuk
memperkecil variance within cluster karena melibatkan centroid
pada saat penggabungan antar cluster. Metode ini juga baik untuk
data yang mengandung outlier.
Algoritma Centroid Linkage Hierarchical Method :
1. Diasumsikan setiap data dianggap sebagai cluster. Kalau
n=jumlah data dan c=jumlah cluster, berarti ada c=n.
2. Menghitung jarak antar cluster dengan Euclidian distance.
3. Mencari 2 cluster yang mempunyai jarak centroid antar cluster
yang paling minimal dan digabungkan (merge) kedalam cluster
baru (sehingga c=c-1)
4. Kembali ke langkah 3, dan diulangi sampai dicapai cluster
yang diinginkan.
7
Cluster 2
6 6
Jarak cluster 1
5 5 ke cluster 2
=
4 4
Jarak centroid
3 cluster 1 ke
centroid
2 3
cluster 2
1 1 2 Cluster 1

1 2 3 4 5 6 7

Gambar 2.6 Ilustrasi Centroid Linkage

3. Complete Linkage Hierarchical Method


Complete Linkage adalah proses pengclusteran yang didasarkan
pada jarak terjauh antar obyeknya ( maksimum distance) [6].
Metode ini baik untuk kasus clustering dengan normal data set
distribution. Akan tetapi, metode ini tidak cocok untuk data yang
mengandung outlier.
Algoritma Complete Linkage Hierarchical Method :
1. Diasumsikan setiap data dianggap sebagai cluster. Kalau
n=jumlah data dan c=jumlah cluster, berarti ada c=n.
2. Menghitung jarak antar cluster dengan Euclidian distance.
11

3. Mencari 2 cluster yang mempunyai jarak antar cluster yang


paling maksimal / terjauh dan digabungkan (merge) kedalam
cluster baru (sehingga c=c-1)
4. Kembali ke langkah 3, dan diulangi sampai dicapai cluster
yang diinginkan.
7
Cluster 2
6 6
a
5 5
Jarak cluster 1
ke cluster 2
4 4 =
3 Jarak data 1 ke
data 6
2 3

1 1 2 Cluster 1

1 2 3 4 5 6 7

Gambar 2.7 Ilustrasi Complete Linkage

4. Average Linkage Hierarchical Method


Average Linkage adalah proses pengclusteran yang didasarkan
pada jarak rata-rata antar obyeknya ( average distance) [6].
Metode ini relatif yang terbaik dari metode-metode hierarchical.
Namun, ini harus dibayar dengan waktu komputasi yang paling
tinggi dibandingkan dengan metode-metode hierarchical yang lain.

7
Cluster 2 Jarak cluster 1 ke
6 6
a
cluster 2
5 5 =
∑ Jarak antar data
4 4 nxm
3
Dimana :
2 3 n=jumlah data cluster 1
Cluster 1 m=jumlah data cluster 2
1 1 2

1 2 3 4 5 6 7

Gambar 2.8 Ilustrasi Average Linkage


12

2.4 ANALISA CLUSTER

Analisa cluster adalah suatu teknik analisa multivariate (banyak


variabel) untuk mencari dan mengorganisir informasi tentang variabel
tersebut sehingga secara relatif dapat dikelompokkan dalam bentuk yang
homogen dalam sebuah cluster [3]. Secara umum, bisa dikatakan
sebagai proses menganalisa baik tidaknya suatu proses pembentukan
cluster. Analisa cluster bisa diperoleh dari kepadatan cluster yang
dibentuk (cluster density). Kepadatan suatu cluster bisa ditentukan
dengan variance within cluster (Vw) dan variance between cluster (Vb).
Varian tiap tahap pembentukan cluster bisa dihitung dengan
rumus :

1 n
( ) (2.2)
∑ yi − y c
2
Vc 2 =
nc − 1 i =1
Dimana,
Vc2 = varian pada cluster c
c = 1..k, dimana k = jumlah cluster
nc = jumlah data pada cluster c
yi = data ke-i pada suatu cluste
yi = rata-rata dari data pada suatu cluster
Selanjutnya dari nilai varian diatas, kita bisa menghitung nilai variance
within cluster (Vw) dengan rumus :

1 c (2.3)
Vw = ∑ (ni − 1) ⋅ Vi 2
N − c i =1
Dimana,
N = Jumlah semua data
ni = Jumlah data cluster i
Vi= Varian pada cluster i

Dan nilai variance between cluster (Vb) dengan rumus :

1
( ) (2.4)
c


2
Vb = ni y i − y
c −1 i =1

Dimana,
y = rata-rata dari y i
Salah satu metode yang digunakan untuk menentukan cluster yang ideal
adalah batasan variance [7], yaitu dengan menghitung kepadatan
13

cluster berupa variance within cluster (Vw) dan variance between


cluster (Vb) [8,1]. Cluster yang ideal mempunyai Vw minimum yang
merepresentasikan internal homogenity dan maksimum Vb yang
menyatakan external homogenity.
V =
Vw (2.5)
Vb
Meskipun minimum Vw menunjukkan nilai cluster yang ideal, tetapi
pada beberapa kasus kita tidak bisa menggunakannya secara langsung
untuk mencapai global optimum. Jika kita paksakan, maka solusi yang
dihasilkan akan jatuh pada local optima.

2.5 IDENTIFIKASI POLA PERGERAKAN VARIAN

Identifikasi pola pergerakan varian merupakan metode untuk


memperoleh cluster yang mencapai global optimum, yang mampu
mengatasi masalah dari minimum V. Gambar 2.6 menunjukkan
pergerakan varian pada tiap tahap pembentukan cluster, dimana dari
gambar tersebut terlihat bahwa global optimum berada pada tahap ke 15,
dengan 6 total cluster.

Gambar 2.9 Pergerakan Variance pada tiap


Tahap Pembentukan cluster

Berikut tahap untuk menemukan global optimum dari tahap


pembentukan cluster :
a) Mendeskripsikan semua pola dari pergerakan varian, seperti
gambar 2.6 diatas.
b) Menganalisa kemungkinan global optimum yang berada pada
tempat yang tepat.
c) Melihat posisi dari global optimum yang mungkin.
Posisi yang mungkin untuk menemukan global optimum pada
pergerakan varian, dikelompokkan menjadi 2, yaitu :
14

1. Hill-climbing
Pada Hill-climbing didefinisikan bahwa kemungkinan mencapai
global optimum terletak pada tahap ke-i, jika memenuhi persamaan
berikut :
vi +1 > α .vi (2.6)
Dimana, α adalah nilai tinggi.
Nilai tinggi digunakan untuk menentukan seberapa mungkin metode
ini mencapai global optimum. Nilai α yang biasa digunakan adalah
2,3, dan 4.
Persamaan diatas, diperoleh berdasar analisa pergerakan varian pola
Hill-climbing berikut:

Gambar 2.10 Pola nilai beda Hill-climbing

2. Valley-tracing
Pada Valley-tracing didefinisikan bahwa kemungkinan mencapai
global optimum terletak pada tahap ke-i, jika memenuhi persamaan
berikut :
( v i −1 ≥ v i ) ∩ ( v > vi ) (2.7)
i +1

Dimana i = 1…n, dan n tahap terakhir pembentukan cluster.


Persamaan diatas, diperoleh berdasar analisa pergerakan varian pola
Valley-tracing berikut :

Gambar 2.11 Pola nilai beda Valley-tracing


Berikut tabel yang menunjukkan pola-pola Valley-tracing yang mungkin
mencapai global optimum [9]. Pola yang mungkin ditandai dengan
simbol √.
15

Tabel 1. Tabel kemungkinan pola


Valley-tracing mencapai global optimum

Selanjutnya, baik dengan pendekatan metode valley-tracing maupun


hill-climbing dilakukan identifikasi perbedaan nilai tinggi (∂) pada tiap
tahap, yang didefinisikan dengan :


( )
= v i +1 − v i + ( v i −1 − v i ) (2.8)
= (v i + 1 + v i − 1 ) − (2 × v i )

Nilai ∂ digunakan untuk menghindari local optima, dimana persamaan


ini diperoleh dari maksimum ∂ yang dipenuhi pada persamaan 7.
Untuk membentuk cluster secara otomatis, yaitu cluster yang mencapai
global optima, digunakan nilai λ sebagai threshold, sehingga cluster
secara otomatis terbentuk ketika memenuhi :

max (∂) ≥ λ (2.9)

Untuk mengetahui keakuratan dari suatu metode pembentukan cluster


pada hierarchical method, baik menggunakan valley-tracing maupun
hill-climbing, digunakan persamaan sebagai berikut :
16

φ = max (∂ ) (2.10)
nilaiterde katke max (∂ )
Dimana nilaiterde katke max (∂ ) adalah nilai kandidat max(∂)
sebelumnya. Nilai φ yang lebih besar dari 2, menunjukkan cluster yang
terbentuk merupakan cluster yang well-separated (terpisah dengan
baik).

2.6 KONSEP WARNA

Warna pokok [3] dalam pengelolaan citra terdiri dari 3 (tiga)


unsur, yaitu merah (R), hijau (H), dan biru (B). Jika warna-warna pokok
tersebut digabungkan, maka akan menghasilkan warna lain.
Penggabungan tersebut bergantung pada warna pokok yang tiap-tiap
warna memiliki nilai 256 (8 bit).

(255, 0, 0)

(255, 255, 0)

(255, 255, 255)

(0, 255, 0)

(0, 0, 255)

(128,128,128)

(255, 0, 255)

(0, 0, 0)

Gambar 2.12 Konsep Warna

Warna yang dideskripsikan dengan RGB adalah pemetaan yang


mengacu pada panjang gelombang dari RGB. Pemetaan menghasilkan
nuansa warna untuk masing-masing R, G, dan B. Masing-masing R, G,
dan B didiskritkan dalam skala 256, sehingga RGB akan memiliki
indeks antara 0 sampai 255.
BAB III
PERANCANGAN SISTEM

Pada bab ini pembahasan materi difokuskan pada perancangan dan


pembuatan sistem yang merupakan pokok pembahasan dari Tugas Akhir.

3.1. BLOK DIAGRAM SISTEM

Ekstraksi warna Ekstraksi warna


(RGB tiap pixel) (RGB tiap pixel)
Image Training Image Input

Proses Learning Clustering


(Cari Centroid Rata-rata) otomatis

Identifikasi centroid
hasil dengan centroid

Data Base Buah

Output berupa banyak


jenis buah dan namanya

Gambar 3.1 Blok Diagram Sistem

Gambar 3.1 menunjukkan gambaran sistem secara keseluruhan.


Berupa proses learning, dan proses identifikasi gambar. Pada proses
learning, data gambar buah yang ditraining merupakan data gambar
masing-masing buah atau buah tunggal, yang selanjutnya masuk ke proses
learning (pembelajaran) untuk mendapatkan nilai centroid buah, yang

17
18

kemudian satu persatu centroid buah disimpan dalam database, dan diberi
label sesuai dengan nama buah yang bersangkutan. Image input atau
gambar input, dalam hal ini merupakan gambar sekumpulan buah yang
akan diidentifikasi, selanjutnya diproses dengan metode Single Linkage
Hierarchical method (SLHM) yang dioptimasi dengan metode valley-
tracing sehingga mampu melakukan clustering secara otomatis sebanyak
jumlah jenis buah yang ada pada gambar input. Setelah dilakukan proses
clustering otomatis, maka akan didapat nilai centroid dari masing-masing
hasil cluster. Nilai centroid hasil ini kemudian dicari kedekatannya dengan
nilai centoid data training yang sebelumnya telah disimpan pada database
dengan Euclidean distance. Dari proses tersebut akan diketahui jumlah
jenis buah yang ada pada gambar dan namanya yang diperoleh dari label
pada database dan kemudian di-outputkan.

3.2. PENGAMBILAN GAMBAR

3.2.1 CAPTURE
Proses capture adalah proses pengambilan gambar melalui
kamera. Teknik pengambilan gambar yang digunakan adalah meletakkan
buah yang akan dikenali pada tempat yang disediakan di depan kamera.
Kamera yang digunakan adalah kamera digital. Gambar yang akan kita
pakai dibagi menjadi dua kategori, yaitu gambar test/input dan gambar
training. Dilakukan cara yang berbeda pula terhadap cara capture kedua
kategori tersebut.
Pada gambar training, masing-masing jenis buah yang dipakai
sebagai gambar training, dilakukan 5 kali capture dengan posisi buah
diubah-ubah. Sedangkan gambar input tidak ada aturan, kecuali bahwa
gambar input merupakan capture kumpulan buah, bukan capture buah
tunggal seperti pada training.
Dalam mengcapture gambar dari kamera , ada beberapa hal yang
harus diperhatikan , yaitu :
• Spesifikasi Kamera
Kamera yang digunakan untuk mengambil gambar adalah kamera
digital. Jarak kamera dengan buah saat identifikasi adalah tetap .
• Seting Kamera
Seting kamera untuk gambar training dan gambar input untuk
identifikasi harus sama, agar buah dapat dikenali.
• Seting Tempat
Seting tempat meletakkan obyek tetap, yaitu background warna putih
19

3.2.2 PERENCANAAN DATA


Perencanaan data sistem ini menggunakan format file gambar
dengan ektensi JPG. Dari proses capture diatas selanjutnya file gambar
tersebut diubah ukuran filenya sehingga menjadi ukuran yang kecil supaya
dalam proses tidak memperlama kinerja sistem yang dibuat. Pengubahan
file gambar disesuaikan dengan ukuran 32x32, baik pada gambar training
maupun gambar input.
Jumlah gambar yang digunakan adalah sebanyak 35, yang merupakan
hasil capture diatas, dengan rincian :
ƒ Gambar training :
a) Gambar apel (Washington) sebanyak 5.

Gambar 3.2 Gambar apel ukuran 32x32

b) Gambar jeruk (Clemenville) sebanyak 5.

Gambar 3.3 Gambar jeruk ukuran 32x32

c) Gambar pear sebanyak 5.

Gambar 3.4 Gambar pear ukuran 32x32

d) Gambar anggur sebanyak 5.

Gambar 3.5 Gambar anggur ukuran 32x32


20

e) Gambar mangga sebanyak 5.

Gambar 3.6 Gambar mangg ukuran 32x32

ƒ Gambar input/test
Gambar input berupa 10 buah gambar kumpulan buah.

Gambar 3.7 Gambar input ukuran 32x32

3.3. EKSTRAKSI WARNA

Proses ini dilakukan baik pada proses learning maupun proses


identifikasi untuk mengambil fitur warna berupa R,G, dan B dari gambar,
yang mana fitur inilah yang akan diproses lebih lanjut untuk didapatkan
nilai centroidnya sebagai acuan baik untuk data training maupun untuk
proses identifikasi.

Gambar 3.8 Ekstraksi Warna


21

Berikut potongan program untuk mendapatkan nilai R,G, dan B dari


tiap piksel gambar yang diberikan.

img1.getRGB(0,0,width,height,pixel,0,width);
for (int y=0;y<width;y++){
for (int x=0;x<height;x++){
c = pixel[x+height*y];
r = (c & 0x00ff0000) >> 16;
g = (c & 0x0000ff00) >> 8;
b = c & 0x000000ff;
data[m][0]= r;
data[m][1]= g;
data[m][2]= b;

3.4. PROSES LEARNING

K-Means
Clustering

Gambar 3.9 Blok Diagram Proses Learning

Gambar 3.9 menggambarkan blok diagram proses learning,


dimana setelah gambar diekstraksi warnanya, sehingga didapat nilai
R,G,dan B, selanjutnya nilai tersebut di-cluster oleh system dengan
menggunakan algoritma K-means seperti yang telah dijelaskan pada bab
sebelumnya., dengan inisialisasi jumlah cluster sebanyak 3, yang
merepresentasikan buah, background, dan bayang-bayang. Dari proses
22

tersebut, akan diperoleh 3 buah nilai centroid, yaitu nilai centroid buah itu
sendiri, nilai centroid background dan nilai centroid bayang-bayang.
Karena yang kita ingin dapatkan hanya nilai centroid dari buah, maka
dilakukan proses menghilangkan background dan bayang-bayang.
Algoritmanya sebagai berikut :
1. Dari 3 centroid yang didapat, masing-masing hitung nilai member/
anggotanya
2. Bandingkan ketiganya, yang paling kecil anggotanya (minimum)
diabaikan atau dibuang, karena centroid dengan jumlah anggota kecil
merepresentasikan nilai noise.
3. Pada 2 sisa centroid yang ada, dilakukan pengukur jarak masing-
masing nilai R,G,B-nya terhadap nilai 255,255,255 (representasi nilai
putih/background) dengan euqlidean distance.
4. Bandingkan keduanya, nilai jarak terkecil (minimum) diabaikan
karena dekat dengan nilai putih (255,255,255), diasumsikan sebagai
background. Centroid yang tersisa itulah centroid buah yang dicari.
/* ----- eliminasi noise ----- */
min3=minvar[0];
for (int j=1;j<3;j++){
if (minvar[j]< min3)
min3=minvar[j];
}
/*----- Eliminasi background putih ----- */
tempcentro = new int[3][3];
double[] sum = new double[3];
for (int y=0;y<cluster;y++){
if ( minvar[y]!= min3 ){
sum[y]=0 ;
for (int i=0;i<3;i++){
tempcentro[y][i] = 255;
sum[y] = sum[y]+ Math.pow((
tempcentro[y][i]- centAwal[y][i]),2);
}
sum[y]=Math.round((float)Math.sqrt(sum[y]));
}
else
sum[y]=0 ;
}
max1 = (int) sum[0];max2 = 0 ;
for (int y=0;y<cluster;y++){
if (sum[y] > max1){
max1 = (int) sum[y];
max2 = y;
}
}
23

Diatas adalah potongan program yang digunakan untuk mengeliminasi


noise/ bayang-bayang dan background sehingga diperoleh hanya 1
centroid, yaitu centroid buah.
Selanjutnya, niilai yang disimpan dalam database adalah nilai grand
centroid, bukan nilai centroid. Nilai grand centroid adalah nilai rata-rata
dari beberapa centroid. Untuk mendapatkan grand centroid dalam system
ini, user diharapkan terhadap 1 jenis buah training dilakukan 5 kali load
gambar buah tersebut, dimana gambar buah dengan posisi yang berbeda-
beda. Hal ini dilakukan untuk menangani kemungkinan centroid yang
berbeda pada tiap kali pengambilan centoid suatu jenis buah. Nilai rata-
rata dari 5 kali pengambilan sample buah inilah yang disebut grand
centroid, dan diberi label sesuai dengan nama buah yang bersangkutan,
selanjutnya disimpan dalam database. Berikut table database yang
digunakan.
Tabel 3.1 Tabel Database Grand Centroid

R G B Buah
80 28 30 Apel
115 68 37 Jeruk
132 31 34 Anggur
...... ..... ......... ..............

3.5. PROSES IDENTIFIKASI

Gambar 3.10 berikut menggambarkan blok diagram proses


identifikasi, dimana setelah gambar diekstraksi warnanya, sehingga
didapat nilai R,G,dan B, selanjutnya nilai tersebut di-cluster oleh system
dengan menggunakan algoritma Single Linkage Hierarchical Method yang
juga mengaplikasikan metode valley tracing untuk membentuk cluster
secara otomatis.. Disinilah proses pembentukan cluster terjadi. Cluster
terbentuk dari sebesar n-1, dimana n adalah jumlah data, sampai n=2.
Pada tiap tahap pembentukan cluster dilakukan penghitungan nilai beda
tinggi ∂. Nilai tersebut dihitung dengan cara terlebih dahulu melakukan
pengecekan dengan metode valley tracing, jika memenuhi, maka nilai ∂
dihitung. Selanjutnya pada nilai ∂max itulah cluster yang optimal
24

terbentuk. Dari cluster yang terbentuk diperolehlah nilai centroid. Masuk


ke proses identifikasi, nilai centroid hasil dihitung kedekatannya dengan
nilai centroid masing-masing data learning menggunakan euqlidean
distance. Nilai jarak yang paling minimal dipilih dengan representasi
label pada data training.

Single linkage
Hierarchical
Method

Output Jumlah jenis dan


nama buah

Gambar 3.10 Blok Diagram Proses Identifikasi

Pada gambar desain GUI gambar 3.11 terdapat 11 bagian yang merupakan
informasi dalam menjalankan proses training dan identifikasi buah.
1. Untuk menampilkan gambar training yang akan diproses
2. Keseluruhan proses clustering dengan K-Means, dengan hasil nilai
centroid buah training.
3. Menampilkan nilai grand centroid, setelah penekanan tombol save
4. Nama buah yang akan dipakai sebagai label atas hasil grand centroid
yang diperoleh dari suatu gambar training.
5. Untuk menyimpan nilai grand centroid dan label pada database, juga
menampilkan nilai grand centroid dari gambar training.
6. Untuk menghapus data dari database, dengan cara select data dari list
yang digunakan menampilkan database.
25

7. Menampilkan isi dari database, dan bisa dihapus dengan memilih


data pada bagian ini
8. Untuk menampilkan gambar input yang akan diidentifikasi
9. Keseluruhan proses clustering dengan Single Linkage
Hierarchical Method, penghitungan varian, sampai didapat nilai
centroid gambar input secara otomatis.
10. Untuk menampilkan output berupa jumlah macam buah yang ada
pada gambar input.
11. Menampilkan banyak proses, untuk proses learning ditampilkan
nilai centroid tiap gambar training sebelum di rata-rata menjadi
grand centroid. Sedang untuk proses identifikasi akan
ditampilkan nilai varian dari tiap tahap pembentukan clusternya,
nilai beda tinggi (∂).
12. Menampilkan nama-nama buah yang berhasil diidentifikasi
13. Menampilkan nilai centroid dari masing-masing cluster yang
terbentuk.

1 8

2 9

3
10
4
12
5 6

11
7
13

Gambar 3.11 GUI Proses Training Dan Identifikasi


26

*Halaman ini sengaja dikosongkan*


BAB IV
ANALISA HASIL SISTEM

4.1. SPESIFIKASI TRAINING


Pada bab ini dimaksudkan untuk mengetahui keseluruhan
pengujian dari perencanaan hasil program yang telah dibuat. Dimana
pertama kali kita lakukan proses learning terhadap masing-masing
gambar image yang akan digunakan dalam identifikasi buah, yaitu apel,
jeruk, pear, anggur, dan mangga.

4.1.1 Pengambilan Grand Centroid Jeruk

Gambar 4.1 Pengambilan Grand Centroid Jeruk


Nilai R=172, G=102, B=56 , merepresentasikan buah jeruk.

4.1.2 Pengambilan Grand Centroid Apel

Nilai R=73, G=53, B=62 , merepresentasikan buah apel.

27
28

Gambar 4.2 Pengambilan Grand Centroid Apel

4.1.3 Pengambilan Grand Centroid Pear

Gambar 4.3 Pengambilan Grand Centroid Pear


Nilai R=143, G=141, B=97 , merepresentasikan buah pear.
29

4.1.4 Pengambilan Grand Centroid Anggur

Gambar 4.4 Pengambilan Grand Centroid Anggur


Nilai R=37, G=28, B=30 , merepresentasikan buah anggur.

4.1.5 Pengambilan Grand Centroid Mangga

Gambar 4.5 Pengambilan Grand Centroid Mangga


30

Nilai R=146, G=151, B=47 , merepresentasikan buah anggur.

4.2. ANALISA KESELURUHAN DATA TRAINING.


Lima macam buah ditraining untuk didapat nilai centroid
masing-masing. Masing-masing buah dicoba sebanyak lima kali, yang
kemudian dari 5 macam buah terhadap 5 kali percobaan diperoleh nilai
centroid masing-masing buah yang kemudian di-labeli dengan nama
buah yang bersangkutan dan disimpan dalam database. Berikut ini
adalah tabel nilai grand centroid dari masing-masing buah, dimana telah
dilakukan sebanyak 5 kali percobaan masing-masingnya.
Tabel 4.1 Grand Centroid Masing-masing Buah
R G B Buah
58 31 37 Apel
174 108 66 Jeruk
146 151 47 Mangga
143 141 97 Pear
37 28 30 Anggur

Pada tiap percobaan pengambilan gambar, meskipun terhadap satu


gambar yang sama, terkadang diperoleh hasil centroid yang berbeda, hal
ini dikarenakan kelemahan metode K-Mean, dimana centroid awalnya
dibangkitkan secara random, tetapi hal itu tidak menjadi masalah, karena
nilai yang dipakai nantinya adalah nilai grand centroid, yang mana
merupakan nilai rata-rata centroid tiap buah. K-mean digunakan dalam
proses training karena proses komputasinya yang sangat cepat.
Semakin banyak training yang dilakukan pada 1 jenis buah, akan
semakin baik representasi nilai grand centroid terhadap buah tersebut.

4.3. PENGUJIAN SISTEM IDENTIFIKASI BUAH


Berikut adalah pengujian sistem terhadap identifikasi buah. Dari 10
percobaan yang dilakukan berikut ini, akan dianalisa bagaimana metode
valley tracing bekerja mendeteksi pergerakan varian, dengan bertindak
sebagai constraint melalui nilai beda tinggi (∂). Pada beberapa kasus
cluster yang terbentuk tidak tepat, hal ini dikaranakan kualitas gambar
yang tidak baik sehingga mengandung pixel-pixel yang mengganggu
sehingga membentuk cluster yang tidak diinginkan. Karena kualitas
31

gambar yang dipakai mempengaruhi kinerja sistem. Dimana pixel-pixel


yang dihasilkan mempengaruhi kinerja clustering.

Pengujian 1 :

Gambar 4.6 Pengujian terhadap gambar 1


Dari gambar 4.6 diperoleh 5 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max. Berikut grafik nilai ∂.
N ilai B eda Tinggi

500

400
Nilai Beda Tinggi

300

200

100

0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.7 Grafik Nilai Beda Tinggi gambar 1


Berikut nilai centroid dari 5 cluster yang terbentuk :
32

Tabel 4.2 Nilai centroid hasil clustering gambar input 1


Cluster R G B Identifikasi Centroid
1 178 156 162 Pear
2 210 194 212 Background
3 87 51 33 Mangga
4 223 100 23 Jeruk
5 57 50 15 Apel
Pengujian terhadap gambar input diatas adalah benar 100%, dimana
didalamnya terbentuk 5 cluster. Secara kasat mata bisa kita lihat bahwa
gambar input diatas memang membentuk 5 cluster, dengan rincian tiap
cluster mewakili background, buah jeruk, buah apel , buah pear dan
buah mangga. Tabel 4.2 menyajikan masing-masing nilai centroid
cluster dan hasil identifikasinya, yaitu dengan menghitung nilai
kedekatan masing-masing centroid hasil dengan centroid training
menggunakan euqlidean distance.
Pada pengujian 1, jumlah buah terdeteksi benar adalah 4 dari 4 jenis
buah, yang diidentifikasi sebagai buah jeruk, buah apel , buah pear dan
buah mangga, proses identifikasi tepat 100%.

Pengujian 2 :

Gambar 4.8 Pengujian terhadap gambar 2


33

Dari gambar 4.8 diperoleh 4 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max. Berikut grafik nilai ∂.

N ilai B eda Tinggi

800
700
Nilai Beda Tinggi

600
500
400
300
200
100
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p Pe m be ntuka n Cluste r

Gambar 4.9 Grafik Nilai Beda Tinggi gambar 2

Berikut nilai centroid dari 4 cluster yang terbentuk :


Tabel 4.3 Nilai centroid hasil clustering gambar input 2
Cluster R G B Identifikasi Centroid
1 153 150 142 Background
2 117 83 17 Jeruk
3 94 85 63 Pear
4 46 55 10 Mangga

Pengujian terhadap gambar input diatas adalah benar 100%, dimana


didalamnya terbentuk 4 cluster. Secara kasat mata bisa kita lihat bahwa
gambar input diatas memang membentuk 4 cluster, dengan rincian tiap
centroid cluster mewakili background, buah jeruk, buah pear dan buah
mangga. Tabel 4.3 menyajikan masing-masing nilai centroid cluster dan
hasil identifikasinya, yaitu dengan menghitung nilai kedekatan masing-
masing centroid hasil dengan centroid training menggunakan euqlidean
distance.
Pada pengujian 2, jumlah buah terdeteksi benar adalah 3, yang
diidentifikasi sebagai buah jeruk, buah pear dan buah mangga, proses
identifikasi tepat 100%.
34

Pengujian 3 :

Gambar 4.10 Pengujian terhadap gambar 3


Dari gambar 4.10 diperoleh 3 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 3. Berikut grafik nilai ∂.
N ilai B eda Tinggi

5000

4000
Nilai Beda Tinggi

3000

2000

1000

0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.11 Grafik Nilai Beda Tinggi gambar 3

Berikut nilai centroid dari 3 cluster yang terbentuk :


35

Tabel 4.4 Nilai centroid hasil clustering gambar input 3


Cluster R G B Identifikasi Centroid
1 168 165 168 Background
2 44 19 18 Apel
3 44 42 44 Anggur

Pengujian terhadap gambar input diatas adalah benar 100%, dimana


didalamnya terbentuk 3 cluster. Secara kasat mata bisa kita lihat bahwa
gambar input diatas memang membentuk 3 cluster, dengan rincian tiap
centroid cluster mewakili background, buah apel dan buah anggur.
Tabel 4.4 menyajikan masing-masing nilai centroid cluster dan hasil
identifikasinya, yaitu dengan menghitung nilai kedekatan masing-
masing centroid hasil dengan centroid training menggunakan euqlidean
distance.
Pada pengujian 3, jumlah buah terdeteksi benar adalah 2, yang
diidentifikasi sebagai buah apel dan buah anggur, proses identifikasi
tepat 100%.

Pengujian 4 :

Gambar 4.12 Pengujian terhadap gambar 4


36

Dari gambar 4.12 diperoleh 3 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 3. Berikut grafik nilai ∂.

N ilai B ed a T ing gi

6000

5000
Nilai Beda Tinggi

4000

3000

2000

1000

0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.13 Grafik Nilai Beda Tinggi gambar 4


Berikut nilai centroid dari 3 cluster yang terbentuk :
Tabel 4.5 Nilai centroid hasil clustering gambar input 4
Cluster R G B Identifikasi Centroid
1 148 145 149 Background
2 81 62 17 Mangga
3 154 113 90 Jeruk

Pengujian terhadap gambar input diatas adalah benar 100%, dimana


didalamnya terbentuk 3 cluster. Secara kasat mata bisa kita lihat bahwa
gambar input diatas memang membentuk 3 cluster, dengan rincian tiap
centroid cluster mewakili background, buah mangga dan buah jeruk.
Tabel 4.5 menyajikan masing-masing nilai centroid cluster dan hasil
identifikasinya, yaitu dengan menghitung nilai kedekatan masing-
masing centroid hasil dengan centroid training menggunakan euqlidean
distance.
Pada pengujian 4, jumlah buah terdeteksi benar adalah 2, yang
diidentifikasi sebagai buah mangga dan buah jeruk, proses identifikasi
tepat 100%.
37

Pengujian 5 :

Gambar 4.14 Pengujian terhadap gambar 5


Dari gambar 4.14 diperoleh 4 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 4. Berikut grafik nilai ∂.

Nilai Beda Tinggi

3000
2500
Nilai Beda Tinggi

2000
1500
1000

500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Tahap Pembentukan Cluster

Gambar 4.15 Grafik Nilai Beda Tinggi gambar 5


38

Berikut nilai centroid dari 4 cluster yang terbentuk :


Tabel 4.6 Nilai centroid hasil clustering gambar input 5
Cluster R G B Identifikasi Centroid
1 226 225 224 Background
2 190 158 95 Jeruk
3 50 31 28 Apel
4 115 40 33 Anggur
Pengujian terhadap gambar input diatas adalah benar 100%, dimana
didalamnya terbentuk 4 cluster. Secara kasat mata bisa kita lihat bahwa
gambar input diatas memang membentuk 4 cluster, dengan rincian tiap
centroid cluster mewakili background, buah apel, buah anggur dan buah
jeruk. Tabel 4.6 menyajikan masing-masing nilai centroid cluster dan
hasil identifikasinya, yaitu dengan menghitung nilai kedekatan masing-
masing centroid hasil dengan centroid training menggunakan euqlidean
distance.
Pada pengujian 5, jumlah buah terdeteksi benar adalah 3, yang
diidentifikasi sebagai buah apel, buah anggur dan buah jeruk, proses
identifikasi tepat 100%.

Pengujian 6 :

Gambar 4.16 Pengujian terhadap gambar 6


39

Dari gambar 4.16 diperoleh 4 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 4. Berikut grafik nilai ∂.
N ilai B eda Tinggi

800
700
Nilai Beda Tinggi

600
500
400
300
200
100
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.17 Grafik Nilai Beda Tinggi gambar 6

Berikut nilai centroid dari 4 cluster yang terbentuk :


Tabel 4.7 Nilai centroid hasil clustering gambar input 6
Cluster R G B Identifikasi Centroid
1 196 200 184 Background
2 125 53 26 Jeruk
3 247 156 79 Pear
4 73 9 9 Apel

Pengujian terhadap gambar input diatas adalah benar, dimana


didalamnya terbentuk 4 cluster. Secara kasat mata bisa kita lihat bahwa
gambar input diatas memang membentuk 4 cluster, dengan rincian tiap
centroid cluster mewakili background, buah apel, buah anggur dan buah
jeruk. Tabel 4.7 menyajikan masing-masing nilai centroid cluster dan
hasil identifikasinya, yaitu dengan menghitung nilai kedekatan masing-
masing centroid hasil dengan centroid training menggunakan euqlidean
distance.
Pada pengujian 6, jumlah buah terdeteksi benar adalah 3, yang
diidentifikasi sebagai buah apel, buah pear dan buah jeruk. Proses
pembentukan cluster yang menandai jumlah buah tepat sebesar 100%,
proses identifikasi tepat 100%.
40

Pengujian 7 :

Gambar 4.18 Pengujian terhadap gambar 7


Dari gambar 4.18 diperoleh 4 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 4. Berikut grafik nilai ∂.
N ilai B eda Tinggi

800
700
Nilai Beda Tinggi

600
500
400
300
200
100
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.19 Grafik Nilai Beda Tinggi gambar 7


Berikut nilai centroid dari 4 cluster yang terbentuk :
Tabel 4.8 Nilai centroid hasil clustering gambar input 7
41

Cluster R G B Identifikasi Centroid


1 251 208 138 Background
2 116 29 22 Apel
3 173 41 2 Jeruk
4 254 170 2 Pear

Pengujian terhadap gambar input diatas adalah benar 100%, dimana


didalamnya terbentuk 4 cluster. Secara kasat mata bisa kita lihat bahwa
gambar input diatas memang membentuk 4 cluster, dengan rincian tiap
centroid cluster mewakili background, buah apel, buah pear dan buah
jeruk. Tabel 4.7 menyajikan masing-masing nilai centroid cluster dan
hasil identifikasinya, yaitu dengan menghitung nilai kedekatan masing-
masing centroid hasil dengan centroid training menggunakan euqlidean
distance.
Pada pengujian 7, jumlah buah terdeteksi benar adalah 3, yang
diidentifikasi sebagai buah apel, buah pear dan buah jeruk, proses
identifikasi tepat 100%.

Pengujian 8 :

Dari gambar 4.20 diperoleh 3 buah cluster. Nilai tersebut didapat dari
Gambar
nilai ∂ yang pada Pengujian terhadap
4.20diepresentasikan
program gambar
dengan 8 Cluster yang
theta.
42

dianggap optimal merupakan tahap pembentukan cluster yang


mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 3. Berikut grafik nilai ∂.
N ilai B ed a T in gg i

3500
3000
Nilai Beda Tinggi

2500
2000
1500
1000
500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.21 Grafik Nilai Beda Tinggi gambar 8


Berikut nilai centroid dari 3 cluster yang terbentuk :
Tabel 4.9 Nilai centroid hasil clustering gambar input 8
Cluster R G B Identifikasi Centroid
1 238 248 250 Background
2 162 70 26 Apel
3 167 187 207 Pear

Pengujian terhadap gambar input diatas adalah benar dalam hal


pembentukan cluster otomatisnya, dimana didalamnya terbentuk 3
cluster. Secara kasat mata bisa kita lihat bahwa gambar input diatas
memang membentuk 3 cluster, dengan rincian tiap centroid cluster
mewakili background, buah apel dan buah jeruk. Tabel 4.9 menyajikan
masing-masing nilai centroid cluster dan hasil identifikasinya, yaitu
dengan menghitung nilai kedekatan masing-masing centroid hasil
dengan centroid training menggunakan euqlidean distance.
Pada pengujian 8, jumlah buah terdeteksi benar adalah 1 dari 2 jenis
buah, yang diidentifikasi sebagai buah apel. Buah kedua yang
seharusnya adalah buah jeruk, salah teridentifikasi sebagai buah pear,
hal ini dikarenakan nilai centroid cluster ke-3 memiliki kedekatan lebih
dengan nilai centroid buah pear daripada nilai centroid buah jeruk.
Proses pembentukan cluster yang menandai jumlah buah tepat sebesar
100%, proses identifikasi tepat 50%.
43

Pengujian 9 :

Gambar 4.22 Pengujian terhadap gambar 9


Dari gambar 4.22 diperoleh 4 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 4. Berikut grafik nilai ∂.
N ilai B ed a T in gg i

2500

2000
Nilai Beda Tinggi

1500

1000

500

0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.23 Grafik Nilai Beda Tinggi gambar 9


Berikut nilai centroid dari 4 cluster yang terbentuk :
Tabel 4.10 Nilai centroid hasil clustering gambar input 9
44

Cluster R G B Identifikasi Centroid


1 222 220 196 Background
2 110 78 67 Apel
3 156 171 84 Pear
4 253 157 48 Jeruk

Pengujian terhadap gambar input diatas adalah benar dalam hal


pembentukan cluster otomatisnya, dimana didalamnya terbentuk 3
cluster. Secara kasat mata bisa kita lihat bahwa gambar input diatas
memang membentuk 3 cluster, dengan rincian tiap centroid cluster
mewakili background, buah apel, buah mangga, dan buah jeruk. Tabel
4.10 menyajikan masing-masing nilai centroid cluster dan hasil
identifikasinya, yaitu dengan menghitung nilai kedekatan masing-
masing centroid hasil dengan centroid training menggunakan euqlidean
distance.
Pada pengujian 8, jumlah buah terdeteksi benar adalah 2 dari 3 jenis
buah, yang diidentifikasi sebagai buah apel dan buah jeruk. Buah
ketiga yang seharusnya adalah buah mangga, salah teridentifikasi
sebagai buah pear, hal ini dikarenakan nilai centroid cluster ke-3
memiliki kedekatan lebih dengan nilai centroid buah pear daripada nilai
centroid buah mangga. Kesalahan tersebut bisa jadi karena centroid
dalam data training kurang presisi dalam mewakili centroid suatu jenis
buah, dalam hal ini buah mangga. Proses pembentukan cluster yang
menandai jumlah buah, tepat sebesar 100%, proses identifikasi tepat
66,7%.

Pengujian 10 :
45

Gambar 4.24 Pengujian terhadap gambar 10


Dari gambar 4.24 diperoleh 3 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 3. Berikut grafik nilai ∂.

N ilai B ed a T in gg i

3000

2500
Nilai Beda Tinggi

2000

1500

1000

500

0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.25 Grafik Nilai Beda Tinggi gambar 10


Berikut nilai centroid dari 3 cluster yang terbentuk :
Tabel 4.11 Nilai centroid hasil clustering gambar input 10
46

Cluster R G B Identifikasi Centroid


1 184 194 194 Background
2 48 23 36 Apel
3 121 113 77 Mangga
Pengujian terhadap gambar input diatas adalah benar dalam hal
pembentukan cluster otomatisnya, dimana didalamnya terbentuk 3
cluster. Secara kasat mata bisa kita lihat bahwa gambar input diatas
memang membentuk 3 cluster, dengan rincian tiap centroid cluster
mewakili background, buah apel, dan buah pear. Tabel 4.11 menyajikan
masing-masing nilai centroid cluster dan hasil identifikasinya, yaitu
dengan menghitung nilai kedekatan masing-masing centroid hasil
dengan centroid training menggunakan euqlidean distance.
Pada pengujian 8, jumlah buah terdeteksi benar adalah 1 dari 2 jenis
buah, yang diidentifikasi sebagai buah apel. Buah kedua yang
seharusnya adalah buah pear, salah teridentifikasi sebagai buah mangga,
Proses pembentukan cluster yang menandai jumlah buah, tepat sebesar
100%. Proses identifikasi tepat 50%.

Pengujian 11 :

Gambar 4.26 Pengujian terhadap gambar 11


47

Dari gambar 4.24 diperoleh 3 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Cluster yang
dianggap optimal merupakan tahap pembentukan cluster yang
mempunyai nilai ∂max, dimana nilai ∂max terdapat pada tahap
pembentukan cluster sebanyak 3. Berikut grafik nilai ∂.
N ilai B eda Ting gi

300

250
Nilai Beda Tinggi

200
150

100

50

0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.27 Grafik Nilai Beda Tinggi gambar 11

Berikut nilai centroid dari 3 cluster yang terbentuk :


Tabel 4.12 Nilai centroid hasil clustering gambar input 11
Cluster R G B Identifikasi Centroid
1 226 213 207 Background
2 73`` 47 48 Apel
3 219 119 61 Jeruk

Pengujian terhadap gambar input diatas seharusnya terbentuk 4 cluster.


dimana tiap centroid cluster mewakili background, buah apel, buah
jeruk, dan buah pear. Tabel 4.12 menyajikan masing-masing nilai
centroid cluster dan hasil identifikasinya, yaitu dengan menghitung nilai
kedekatan masing-masing centroid hasil dengan centroid training
menggunakan euqlidean distance.
Pada pengujian 11, jumlah buah terdeteksi benar adalah 2 dari 3 jenis
buah, yang diidentifikasi sebagai buah apel dan jeruk. Buah ketiga
yang seharusnya adalah buah pear, tidak teridentifikasi karena kesalahan
pembentukan cluster otomatis, dimana seharusnya terbentuk 4 cluster,
tetapi hanya terbentuk 3 cluster, sehingga 1 buah tidak teridentifikasi.
Proses pembentukan cluster yang menandai jumlah buah, tepat sebesar
75%. Proses identifikasi tepat 66,7%.
48

Pengujian 12 :

Gambar 4.28 Pengujian terhadap gambar 12


Dari gambar 4.24 diperoleh 17 buah cluster. Nilai tersebut didapat dari
nilai ∂ yang pada program diepresentasikan dengan theta. Pada
percobaan ini kemungkinan tidak tercapainya cluster optimal sangat
besar, dimana nilai ∂max terdapat pada tahap pembentukan cluster
sebanyak 17. Berikut grafik nilai ∂.
N ilai B eda Tingg i

160
140
Nilai Beda Tinggi

120
100
80
60
40
20
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.29 Grafik Nilai Beda Tinggi gambar 12


49

Pengujian terhadap gambar input diatas seharusnya terbentuk 4 cluster.


dimana tiap centroid cluster mewakili background, buah apel, buah
jeruk, dan buah mangga, sehingga buah yang dikenali jauh lebih banyak
daripada buah sesungguhnya.
Pada pengujian 12, Proses pembentukan cluster yang menandai jumlah
buah, tepat hanya sebesar 23,5%. Proses identifikasi tepat 100%.

Pengujian 13 :

Gambar 4.30 Pengujian terhadap gambar 13


Tahap pembentukan cluster gambar 13 sebanyak 5.Berikut grafik nilai ∂
N ilai B eda Tinggi

2500

2000
Nilai Beda Tinggi

1500

1000

500

0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p Pe m be ntuka n Cluste r

Gambar 4.31 Grafik Nilai Beda Tinggi gambar 13


50

Pengujian terhadap gambar input diatas seharusnya terbentuk 4 cluster.


dimana tiap centroid cluster mewakili background, buah apel, buah
jeruk, dan buah anggur, tetapi ternyata cluster yang terbentuk adalah 5,
sehingga buah yang dikenali lebih banyak daripada buah sesungguhnya.
Pada pengujian 13, proses pembentukan cluster yang menandai jumlah
buah, tepat sebesar 80 %. Proses identifikasi juga tepat sebesar 66,7%.

Pengujian 14 :

Gambar 4.32 Pengujian terhadap gambar 14

Tahap pembentukan cluster gambar 14 sebanyak 5.Berikut grafik nilai ∂


N ilai B ed a Tin gg i

1400
1200
Nilai Beda Tinggi

1000
800
600
400
200
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.33 Grafik Nilai Beda Tinggi gambar 14


51

Pengujian terhadap gambar input diatas seharusnya terbentuk 4 cluster.


dimana tiap centroid cluster mewakili background, buah apel, buah
jeruk, dan buah anggur, tetapi ternyata cluster yang terbentuk adalah 5,
sehingga buah yang dikenali lebih banyak daripada buah sesungguhnya.
Pada pengujian 14, proses pembentukan cluster yang menandai jumlah
buah, tepat sebesar 80 %. Proses identifikasi juga tepat sebesar 66,7%.

Pengujian 15 :

Gambar 4.34 Pengujian terhadap gambar 15


Tahap pembentukan cluster gambar 15 sebanyak 3.Berikut grafik nilai ∂

N ilai B eda Tinggi

800
700
Nilai Beda Tinggi

600
500
400
300
200
100
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.35 Grafik Nilai Beda Tinggi gambar 15


52

Pengujian terhadap gambar input diatas seharusnya terbentuk 5 cluster.


dimana tiap centroid cluster mewakili background, buah apel, buah
jeruk, buah mangga dan buah pear, tetapi ternyata cluster yang terbentuk
adalah 3. Jumlah buah terdeteksi benar adalah 1 dari 4 jenis buah, yang
diidentifikasi sebagai buah mangga. Proses pembentukan cluster yang
menandai jumlah buah, tepat sebesar 75%. Proses identifikasi tepat
hanya sebesar 25%.

Pengujian 16 :

Gambar 4.36 Pengujian terhadap gambar 16


Tahap pembentukan cluster gambar 16 sebanyak 4.Berikut grafik nilai ∂
N ilai B eda Tinggi

160
140
Nilai Beda Tinggi

120
100
80
60
40
20
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3
Ta ha p P e m be ntuka n Cluste r

Gambar 4.37 Grafik Nilai Beda Tinggi gambar 16


53

Pengujian terhadap gambar input diatas seharusnya terbentuk 6 cluster.


dimana tiap centroid cluster mewakili background, buah apel, buah
jeruk, buah mangga,buah anggur dan buah pear, tetapi ternyata cluster
yang terbentuk adalah 4. Jumlah buah terdeteksi benar adalah 3 dari 5
jenis buah, yang diidentifikasi sebagai buah apel, buah jeruk, dan buah
pear. Proses pembentukan cluster yang menandai jumlah buah, tepat
sebesar 66,7 %. Proses identifikasi tepat sebesar 60 %.

Pengujian 17 :

Gambar 4.38 Pengujian terhadap gambar 17


Tahap pembentukan cluster gambar 17 sebanyak 4.Berikut grafik nilai ∂
N ilai B eda Tinggi

3500
3000
Nilai Beda Tinggi

2500
2000
1500
1000
500
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.39 Grafik Nilai Beda Tinggi gambar 17


54

Pengujian terhadap gambar input diatas seharusnya terbentuk 3 cluster.


dimana tiap centroid cluster mewakili background, buah apel, dan buah
anggur, tetapi ternyata cluster yang terbentuk adalah 5. Jumlah buah
terdeteksi benar adalah 1 dari 2 jenis buah, yang diidentifikasi sebagai
buah apel. Proses pembentukan cluster yang menandai jumlah buah,
tepat sebesar 60 %. Proses identifikasi tepat sebesar 50 %.

Pengujian 18 :

Gambar 4.40 Pengujian terhadap gambar 18


Tahap pembentukan cluster gambar 18 sebanyak 3.Berikut grafik nilai ∂
N ilai B eda Tinggi

2500

2000
Nilai Beda Tinggi

1500

1000

500

0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.41 Grafik Nilai Beda Tinggi gambar 18


55

Pengujian terhadap gambar input diatas seharusnya terbentuk 4 cluster.


dimana tiap centroid cluster mewakili background, buah apel, dan buah
anggur, tetapi ternyata cluster yang terbentuk adalah 3. Jumlah buah
terdeteksi benar adalah 1 dari 3 jenis buah, yang diidentifikasi sebagai
buah mangga. Proses pembentukan cluster yang menandai jumlah buah,
tepat sebesar 75 %. Proses identifikasi tepat sebesar 33,3 %.

Pengujian 19 :

Gambar 4.42 Pengujian terhadap gambar 19


Tahap pembentukan cluster gambar 19 sebanyak 4.Berikut grafik nilai ∂
N ilai B eda Tinggi

1600
1400
Nilai Beda Tinggi

1200
1000
800
600
400
200
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.43 Grafik Nilai Beda Tinggi gambar 19


56

Pengujian terhadap gambar input diatas seharusnya terbentuk 3 cluster.


dimana tiap centroid cluster mewakili background, buah apel, dan buah
pear, tetapi ternyata cluster yang terbentuk adalah 4. Jumlah buah
terdeteksi benar adalah 2 dari 2 jenis buah, yang diidentifikasi sebagai
buah pear dan buah apel. Proses pembentukan cluster yang menandai
jumlah buah, tepat sebesar 75 %. Proses identifikasi tepat 100 %.

Pengujian 20 :

Gambar 4.44 Pengujian terhadap gambar 20


Tahap pembentukan cluster gambar 20 sebanyak 4.Berikut grafik nilai ∂
N ilai B eda Tinggi

1600
1400
Nilai Beda Tinggi

1200
1000
800
600
400
200
0
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2
Ta ha p P e m be ntuka n Cluste r

Gambar 4.45 Grafik Nilai Beda Tinggi gambar 20


57

Pengujian terhadap gambar input diatas adalah benar dalam hal


pembentukan cluster otomatisnya, dimana didalamnya terbentuk 4
cluster. Secara kasat mata bisa kita lihat bahwa gambar input diatas
memang membentuk 4 cluster, dengan rincian tiap centroid cluster
mewakili background, buah apel, buah jeruk dan buah anggur.
Pada pengujian 20, jumlah buah terdeteksi benar adalah 2 dari 3 jenis
buah, yang diidentifikasi sebagai buah apel dan buah jeruk. Proses
pembentukan cluster yang menandai jumlah buah, tepat sebesar 100%.
Proses identifikasi tepat 66,7%.

Berikut tabel hasil analisa proses pendeteksian jumlah buah dan


identifikasi jenis buah berdasarkan 20 pengujian diatas.
Tabel 4.12 Akurasi Identifikasi Terhadap 20 Percobaan
Identifikasi Gambar
Identifikasi Gambar Oleh Sistem
Sebenarnya
Jumlah
Jumlah Jenis buah
Jenis Buah buah
Buah teridentifikasi
terdeteksi
2 Apel, anggur 2 Apel, anggur
2 Jeruk, mangga 2 Jeruk, mangga
2 Jeruk, apel 2 Apel, pear
2 Apel, pear 2 Apel, mangga
2 Pear, apel 3 Pear, apel, jeruk
Pear, mangga, jeruk,
2 Apel, anggur 4
apel
3 Apel, jeruk, pear 2 Apel, jeruk
Apel, jeruk,
3 2 Pear, mangga
mangga
3 Jeruk, apel, anggur 3 Apel, jeruk, pear
3 Jeruk, apel, anggur 3 Jeruk,apel,anggur
3 Jeruk, apel, pear 3 Jeruk, apel, pear
3 Jeruk, apel, pear 3 Jeruk, apel, pear
Mangga, jeruk,
3 3 Mangga, jeruk, pear
pear
Mangga, apel,
3 3 Apel, pear, jeruk
jeruk
Jeruk, apel, mangga,
3 Jeruk, apel, anggur 4
pear
58

Jeruk, apel, pear,


3 Apel, anggur, jeruk 4
mangga
Apel, jeruk,
3 17 Apel, jeruk, mangga
mangga
Apel, mangga,
4 2 Mangga, anggur
pear, jeruk
apel, jeruk, pear, apel, jeruk, pear,
4 4
mangga mangga
Apel, mangga,
5 3 Apel, jeruk, pear
jeruk, pear, anggur

Dari 20 pengujian yang dilakukan terhadap sistem, keakuratan


pembentukan cluster secara otomatis yang merepresentasikan jumlah
buah adalah sebesar 55 %. Sedang identifikasi buahnya mempunyai
keakuratan sebesar 74,1 %. Kesalahan pembentukan cluster umumnya
dikarenakan kualitas gambar yang tidak bagus sehingga pixel noise
membentuk cluster yang tidak seharusnya ada, sehingga berakibat pada
kesalahan pendeteksian jumlah buah. Sedang kesalahan identifikasi
pada umumnya dikarenakan kurang akurasinya representasi nilai
centroid data training yang dijadikan acuan proses identifikasi.
BAB V
PENUTUP

5.1 KESIMPULAN

Pada bagian ini akan diulas tentang kesimpulan dari seluruh


percobaan dan pengujian software identifikasi buah dengan
memanfaatkan metode valley tracing.
Pada image clustering dibutuhkan data-data yang terpisah
dengan baik (well-separated) untuk mendapatkan hasil cluster yang
tepat, pembuatan algoritma yang bagus penggunaan metode untuk
membangun cluster secara otomatis.
Berikut beberapa kesimpulan yang dapat diambil dari percobaan
dan pengujian proyek akhir ini :
1. Proses identifikasi buah dengan Metode valley tracing dalam image
clustering mampu membentuk cluster secara otomatis dengan
keakuratan sebesar 55 %. Sedangkan hasil identifikasinya
mempunyai keakuratan mencapai 74,1 %.
2. Untuk medapatkan cluster yang tepat pada saat pengclusteran
otomatis terhadap data fitur R,G,B. Kualitas gambar juga
menentukan tepat tidaknya hasil cluster.

5.2 SARAN – SARAN

Hasil yang dicapai dari proyek akhir ini belum sempurna.


Untuk meningkatkan hasil yang dicapai, maka diperlukan :
1. Pre-processing terhadap image yang akan diproses dengan
clustering, hal ini untuk mereduksi pixel-pixel yang mengganggu
yang mengakibatkan terbentuknya cluster yang tidak diinginkan.
2. Penggunaan algoritma clustering yang lebih ampuh untuk
membentuk cluster, yang mampu menangani data yang
mengandung outlier (dalam hal ini pixel yang mengganggu).
3. Pengambilan gambar dengan pencahayaan yang bagus, agar
diperoleh kualitas gambar yang bagus.

59
60

* Halaman ini sengaja dikosongkan*


DAFTAR PUSTAKA

[1] W.H. Ming, C.J. Hou, Cluster analysis and visualization,


Workshop on Statistics and Machine Learning, Institute of
Statistical Science, Academia Sinica, 2004.Achmad Basuki,
Setiawardhana, “Histogram warna pada image”, PENS-ITS,
Surabaya.
[2] A.R. Barakbah, K. Arai, Determining Constraints of Moving
Variance to Find Global Optimum and Make Automatic
Clustering, In. IES 2004, Politeknik Elektronika Negeri
Surabaya, ITS.
[3] http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_h
tml/index.html
[4] http://www.w3.org/TR/REC-html40
[5] G. Karypis, E.H. Han, V. Kumar, Chameleon: a hierarchical
clustering algorithm using dynamic modeling, IEEE Computer:
Special Issue on Data Analysis and Mining 32(8):68W5, 1999.
[6] A.R. barakbah, Clustering, In. Workshop Data Mining 2006,
Jurusan Teknologi Informasi Politeknik Elektronika Negeri
Surabaya,ITS.
[7] C.J. Veenman, M.J.T. Reinders, E. Backer, A maximum
variance cluster algorithm, IEEE Transactions on Pattern
Analysis and Machine Intelligence, vol. 24, no. 9, pp. 1273-
1280, 2002.
[8] S. Ray, R.H. Turi, Determination of number of clusters in k-
means clustering and application in colour image
segmentation, 4th ICAPRDT Proc., pp.137-143, 1999.
[9] A.R. Barakbah, K. Arai, Identifying moving variance to make
automatic clustering for normal data set, In. Proc. IECI Japan
Workshop 2004 (IJW 2004), Musashi Institute of Technology,
Tokyo.

61
62

* Halaman ini sengaja dikosongkan*


63

PROFIL PENULIS

Nama : Helmy Hasniawati


Tanggal
: 19 Juli 1985
lahir
Orang tua : Drs. Hasan Ahmadi
Alamat : Gg. Merpati Putih Rt.1 / Rw. 2
No.457 Sugio- Lamongan 62256
Telepon : (0322) 458351 / 0856-48029209
Hoby : Nonton, Musik, Nulis, Baca
e-mail : luvmieq@yahoo.com
Motto : Do the best, then Allah do The rest
Riwayat : - Politeknik Elektronika Negeri
Pendidikan Surabaya-ITS, tahun 2003-2007
- SMU Negeri 2 Lamongan, tahun
2000 - 2003
- SLTP Negeri 1 Babat, tahun
1997 - 2000
- SDN Sugio 2, tahun 1991-1997

Anda mungkin juga menyukai