Anda di halaman 1dari 9

KLASIFIKASI BAWANG BERBASIS CITRA DIGITAL

MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER


Pitaloka (125150200111091), Fatimah Nadia Zanzabila (125150201111051) ,Setia Harti
(125150201111060), Iis Setyarini(125150201111062), Ika Nurrohmah(125150201111069)
Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya
Jl. Veteran No.8 Malang, Informatika, Gedung A PTIIK UB
Email : pitalokaexe99@gmail.com, fanazbil@gmail.com, setyaharty@gmail.com, iis.setya21@gmail.com,
ikanurrohmah60@gmail.com

ABSTRAK
Kemajuan teknologi komputer saat ini sangatlah pesat. Teknologi komputer dikembangkan agar dapat
melakukan proses pengenalan suatu pola, sebagaimana kemampuan yang dimiliki manusia. Sistem pengenalan
pola banyak dimanfaatkan saat ini, contohnya seperti pengenalan sidik jari dan telapak tangan. Disini kami
mencoba mengklasifikasikan jenis bawang dengan menggunakan metode naive bayes classifier. Bawang
merupakan sesuatu yang selalu kita jumpai dalam kehidupan sehari-hari lebih tepatnya dalam dunia dapur atau
untuk memasak. Metode teori keputusan naive bayes adalah metode pengklasifikasian paling sederhana dari
model pengklasifikasian yang ada dengan menggunakan konsep peluang, dimana diasumsikan bahwa setiap
atribut contoh (data sampel) bersifat saling lepas satu sama lain berdasarkan atribut kelas. Mengklasifikasikan
jenis bawang dengan menggunakan metode naive bayes classifier ini diharapkan dapat menggantikan cara
mendeteksi jenis bawang secara manual. Pengklasifikasian ini akan mengklasifikasikan jenis bawang
berdasarkan fitur-fitur yang dimiliki oleh bawang tersebut. Dalam melakukan pengklasifikasian ini, ada lima
fitur yang digunakan yaitu warna R (Red), G (Green), B (Blue), Diameter, dan Panjang dari bawang tersebut.
Pengklasifikasian jenis bawang yang kami lakukan ini berbasis citra yang mempunyai dataset 100 dengan empat
kelas yaitu kelas bawang merah, kelas bawang putih, kelas bawang bombay, dan kelas bawang prei. Selanjutnya
data-data tersebut diolah dengan menggunakan metode Naive Bayes Classifier yaitu dengan menghitung
Probabilitas Prior, Probabilitas Likelihood dan yang terakhir Probabilitas Posterior. Disini pengklasifikasian
jenis bawang di bagi menjadi tiga skenario, skenario 1 yaitu perbandingannya 80 : 20, 80% data training dan
20% data testing, skenario 2 yaitu perbandingannya 70 : 30, 70% data training dan 30% data testing, dan
skenario 3 yaitu perbandingannya 50 : 50, 50% data training dan 50% data testing. Data pengujian di bagi
menjadi 2 yaitu secara urut dan random. Hasil akurasi skenario 1 secara urut adalah 95.0% dan secara random
adalah 95% , hasil akurasi skenario 2 secara urut adalah 93,33% dan secara random adalah 96,67%, dan hasil
akurasi skenario 3 secara urut adalah 90.0% dan secara random 92,0%. Hasil akurasi ini bisa berubah-ubah
pada setiap percobaan,tetapi tidak begitu banyak perubahan yang terjadi.
Kata kunci : metode teori naive bayes classifier, berbasis citra, klasifikasi bawang

1. PENDAHULUAN
Saat ini perkembangan teknologi sangatlah
pesat,
terutama
dalam
pemanfaatan
komputerisasi dalam menyelesaikan masalah
agar lebih efektif. Salah satunya pembuatan
sistem informasi dalam proses pengenalan suatu
pola. Sistem pengenalan pola banyak
dimanfaatkan saat ini, seperti pengenalan sidik
jari dan telapak tangan yang berupa citra,
pengelompokan umbi-umbi an (dalam kasus ini
bawang) yang berbasis citra.
Bawang merupakan istilah umum bagi
sekelompok tumbuhan penting bagi manusia
yang termasuk dalam genus Allium. Umbi, daun,
atau bunga bawang dimanfaatkan sebagai
sayuran atau sebagai rempah-rempah, tergantung
bagaimana kita memandangnya. Bawang sendiri

memiliki spesies yang beragam seperti bawang


merah, bawang putih, bawang bombay, bawang
dayak, bawang lanang dll. Namun dalam hal ini
kami hanya mengklasifikasikan bawang kedalam
empat kelas, yaitu bawang merah, bawang putih,
bawang bombay, dan bawang prei.
Warna menjadi salah satu ciri yang mudah
diketahui untuk membedakan jenis bawang.
Dalam
penelitian
ini
menerapkan
pengkasifikasian objek. Klasifikasi bertujuan
untuk menetapkan kelas
yang
telah
ditetapkan untuk setiap contoh. Salah satu
metode pengklasifikasian yang digunakan adalah
algoritma Nave Bayes Classifier untuk
mengklasifikasikan bawang dalam kelas bawang

merah, kelas bawang putih,kelas


Bombay atau kelas bawang Prei.

bawang

Kelebihan menggunakan metode Nave Bayes


Classifier diantaranya metode yang relatif mudah
untuk
diimplemetasikan
karena
tidak
menggunakan optimasi numerik, perhitungan
matriks dan lainnya,efisien dalam pelatihan dan
penggunaannya,bisa menggunakan data binary
atau polinom dan akurasi yang dihasilkan relatif
tinggi.Sehingga
dengan
adanya
metode
pengklasifikasian ini,
kami
ingin
mengembangkan suatu program yang berguna
untuk mendeteksi jenis bawang.

P (C j | A1 , A2 ,..., An )

P ( A1 , A2 ,..., An | C j ) P(C j )
P ( A1 , A2 ,..., An )

P( A | C ) P(C )
i

i 1

P ( A1 , A2 ,..., An )

d = {A1, A2, , An} data (d) dengan fitur


(A1 sampai An) C merupakan kelas .
Setelah probabilitas posterior ditemukan
selanjutnya yaitu menentukan kelas yang sesuai
dengan data uji dengan melihat perhitungan hasil
kelas mana yang memiliki nilai terbesar.

1.1 Citra Digital


2. MODEL, ANALISIS, DESAIN, DAN
IMPLEMENTASI
Pada penelitian ini metode yang digunakan
dalam mengklasifikasikan bawang merah,
bawang putih,bawang bombay dan bawang
prei yaitu dengan mengunakan metode
algoritma Nave Bayes.
Naive bayes classifier adalah suatu
klasifikasi berpeluang sederhana berdasarkan
aplikasi teorema Bayes dengan asumsi antar
variabel penjelas saling bebas (independen).
Dalam hal ini, diasumsikan bahwa kehadiran
atau ketiadaan dari suatu kejadian tertentu dari
suatu kelompok tidak berhubungan dengan
kehadiran atau ketiadaan dari kejadian lainnya.
Ada dua proses penting yang dilakukan saat
melakukan klasifikasi. Proses yang pertama
adalah learning (training) yaitu proses
pembelajaran menggunakan training set dan
proses yang kedua adalah proses testing yaitu
menguji model menggunakan data training.
Sebelum
menjelaskan
Nave
Bayes
Classifier ini, akan dijelaskan terlebih dahulu
Teorema Bayes yang menjadi dasar dari
metode tersebut. Pada teorema Bayes, bila
terdapat dua kejadian yang terpisah (misalkan
A dan B), maka teorema Bayes dirumuskan
sebagai berikut:
-

Menghitung Probabilitas Prior

Menghitung Probabilitas Likelihood

Menghitung Probabilitas Posterior

P (d | C j ) P( A1 , A2 ,..., An | C j ) P ( A1 | C j ) P ( A2 | C j )....P( An | C j )

Citra digital adalah gambar dua dimensi


yang dapat ditampilkan pada layar monitor
computer sebagai himpunan berhingga (diskrit)
nilai digital yang disebut pixel (picture elements).
Pixel adalah elemen citra yang memiliki nilai yang
menunjukkanintensitaswarna.
Banyaknya nilai yang dapat digunakan dalam
kuantisasi citra bergantung kepada kedalaman
pixel, yaitu banyaknya bit yang digunakan untuk
merepresentasikan
intensitas
warna
pixel.
Kedalaman pixel sering disebut juga kedalaman
warna. Citra digital yang memiliki kedalaman pixel
n bit disebut juga citra n-bit.

1.2 Gray Scale


Gray scaling adalah proses mengubah warna
citra kesisi keabu-abuanya atau mengubah derajat
keabuan citra.Metode standar untuk melakukan ini
adalah dengan merata-ratakan niai Red (R), Green
(G), dan Blue (B) dari tiap warna pada pixel.
Citra dalam skala abu-abu memiliki variasi
warna 0 255, dan berukuran 1x8 bit. Tentu saja
berbeda dengan citra biner yang hanya memiliki
warna hitam dan putih hanya memiliki komponen
warna 0 dan 1 saja.

1.3 Max Filter


Max filter berfungsi untuk mengurangi noisi
pada citra. Pada saat proses capture (pengambilan
gambar), ada beberapa gangguan yang mungkin
terjadi, seperti kamera tidak fokus atau munculnya
bintik-bintik yang bisa jadi disebabkan oleh proses
capture yang tidak sempurna. Setiap gangguan pada
citra dinamakan dengan noise. Noise pada citra
tidak hanya terjadi karena ketidak-sempurnaan
dalam proses capture, tetapi bisa juga disebabkan
oleh kotoran-kotoran yang terjadi pada citra.

1.4 Threshold

Thresholding digunakan untuk mengatur


jumlah derajat keabuan yang ada pada citra. Dengan
menggunakan thresholding maka derajat keabuan
bisa diubah sesuai keinginan. Misalkan diinginkan
menggunakan derajat keabuan 16, maka tinggal
membagi nilai derajat keabuan dengan 16. Proses
thresholding ini pada dasarnya adalah proses
pengubahan kuantisasi pada suatu gambar citra
digital menjadi 0 dan 255 (two level image), sehingga
untuk melakukan thresholding dengan derajat
keabuan dapat digunakan rumus:
Gambar 2. bawang putih

dimana :
w = nilai derajat keabuan sebelum thresholding
x = nilai derajat keabuan setelah thresholding

1.5 KELAS OBJEK


1. Bawang Merah

Gambar 1. bawang merah


Bawang merah (Allium cepa L. Kelompok
Aggregatum) adalah sejenis tanaman yang menjadi
bumbu berbagai masakan Asia Tenggara dan dunia.
Bawang merah merupakan bawang yang berwarna
merah keunguan. Bawang merah dipercaya memiliki
kandungan zat yang sangat berguna bagi tubuh kita
seperti kalsium, zat besi dan vitamin C yang berguna
dalam penyembuhan gangguan kesehatan seperti
demam, batuk dan kencing manis.

2. Bawang Putih

Bawang putih adalah nama tanaman dari genus


Allium sekaligus nama dari umbi yang dihasilkan.
Bawang putih berwarna putih dan memiliki berbagai
kandungan zat yang berguna bagi kesehatan. Bawang
putih dipercaya memiliki kandungan potassium,
kalsium, vitamin A,B,C dan zat antioksidan. Semua
kandungan ini meningkatkan kekebalan tubuh
sebagai penawar racun, mengurangi serangan kanker,
menghambat penuaan tubuh dan meningkatkan
insulin darah.

3. Bawang Bombay

Gambar 3. Bawang bombay


Bawang Bombay (Latin: Allium Cepa Linnaeus)
adalah jenis bawang yang paling banyak dan luas
dibudidayakan, dipakai sebagai bumbu maupun
bahan masakan, berbentuk bulat besar dan berdaging
tebal. Bawang bombay merupakan jenis bawang yang
memiliki perpaduan bawang merah dan bawang
putih. Dari bentuknya menyerupai bawang merah
namun ukurannya lebih besar. Tetapi dari warna
maupun aromanya menyerupai bawang putih.
Bawang bombay berguna meningkatkan kolesterol
baik, menekan kolesterol darah, mencegah
penggumpalan antitrombotik.

4. Bawang Prei

Gambar 4. Bawang prei

1.

Pengambilan gambar
Mengambil
gambar
bawang
,
disarankan gambar bawang dengan
ukuran minimal 100*100 pixel agar
warnanya bisa terlihat dengan jelas.

2.

Pengelompokan gambar bawang


Bawang dikelompokkan sesuai jenisnya
yaitu bawang putih, bawang merah,
bawang bombay atau bawang prei.

3.

Pembagian ratio dataset


Dalam percobaan ini terdapat 100 data
gambar bawang yang selanjutnya akan
dijadikan data Training dan data
Testing.perbandingan ratio ada 3
macam yaitu:
- Ratio 80:20
80% sebagai data training dan 20%
sebagai data testing. Sehingga dari
dataset 100 kita bagi menjadi 80 data
training dan 20 data testing.

Bawang Prei / Daun Bawang merupakan jenis


sayuran dari kelompok bawang yang banyak
digunakan dalam masakan. Daun bawang sebenarnya
istilah umum yang dapat terdiri dari spesiesyang
berbeda. Jenis yang paling umum dijumpai adalah
bawang daun (Allium fistulosum).

1.6 FITUR OBJEK


Bawang akan diklasifikasikan menjadi 4
kelas yaitu Bawang Merah, Bawang Putih,
Bawang Bombay dan Bawang Prei. Fitur
yang akan digunakan adalah fitur diameter,
fitur panjang dan fitur warna (RGB)
bawang.
Biasanya ukuran bawang putih utuh
akan lebih besar daripada bawang merah
karena 1 bawang putih bisa terdiri dari
beberapa siung bawang sehingga dalam
penelitian ini citra bawang putih kita buat 2
macam yaitu bawang putih utuh dan bawang
putih siungan. Untuk bawang bombay
ukurannya bisa sama atau lebih besar dan
lebih daripada yang lain sehingga fitur
ukuran dan tidak bisa menjadi pembeda
antara bawang merah,bawang putih,bawang
bombay. Untuk fitur ukuran hanya bawang
prei yang paling mudah dibedakan karena
bawang prei memiliki ukuran yang lebih
panjang dari yang lainnya.
Warna bawang merah adalah lebih kemerah
merahan dibanding bawang Bombay, bawang
Bombay
berwarna
coklat
kemerah-merahan.
Sedangkan warna bawang putih adalah dominan
putih dan bawang bombay memiliki warna putih di
akarnya dan hijau dibagian batangny sehingga fitur
warna dapat digunakan.

3. SCENARIO UJI COBA


Langkah langkah pemrosesan:

4.

Ratio70:30
70% sebagai data training dan 30%
sebagai data testing. Sehingga dari
dataset 100 kita bagi menjadi 70 data
training dan 30 data testing.

Ratio 50:50
50% sebagai data training dan 50%
sebagai data testing. Sehingga dari
dataset 100 kita bagi menjadi 50 data
training dan 50 data testing.
Pencatatan fitur-fitur bawang
Ada beberapa fitur yang kita gunakan
untuk membedakan jenis bawang yaitu
diameter,panjang dan warna RGB.
Dataset yang sudah kita siapkan
selanjutnya kita cari fitur-fiturnya yaitu
dengan mengukur panjang, diameter
dan RGB gambar.

Tabel 1. Perhitungan fitur pada 80


dataset training .

5.

Menghitung Probabilitas Prior


Ada empat kelas yang kita gunakan
yaitu bawang merah, putih, bombay dan
prei, dan setiap kelas dihitung
probabilitas Priornya.
Contoh pada salah satu data pada
skenario 1:
Prob. Prior
P(merah) = 20/80
P(putih) = 20/80
P(bombay) = 20/80
P(prei) = 20/80

6.

Menghitung Probabilitas Likelihood


Ada empat kelas yang kita gunakan
yaitu bawang merah, putih, bombay dan
prei, dan setiap kelas dihitung
probabilitas Likelihoodnya.
Contoh pada salah satu data pada
skenario 1:
Prob. Likelihood
P(x|merah) =
0.008479337662095916
0.014770795541149954
0.012735385404615098
0.006987077891621734
0.009422447371415905
P(x|putih) =
5.323151629014583E-7
1.803419918345637E-10
5.951268655739503E-7
0.005502996810130748
0.007728094771325075
P(x|bombay) =
3.9488676521940983E-7
1.2762404750751938E-6
0.005058662218953606
0.007461698578396929
0.007315418543278945
P(x|prei) =
0.008613791379511534
2.6189325280326818E-6
0.0016994283514097284
0.002474130736571475
0.004205187698990955

7.

Menghitung Probabilitas Posterior


Ada empat kelas yang kita gunakan
yaitu bawang merah, putih, bombay dan
prei, dan setiap kelas dihitung
probabilitas Posteriornya.
Contoh pada salah satu data pada
skenario 1:
Prob. Posterior
P(merah|x) = 2.7225225774464423E-11
P(putih|x) = 5.999180545323852E-28
P(bombay|x) = 3.436074967410917E20

P(prei|x) = 9.848600590900304E-17
8.

Menentukan keputusan
Hasil klasifikasi data yang di testing
contoh : data yang diuji masuk kelas
bawang merah.

9.

Menghitung hasil akurasi


Hasil akurasi tiap skenario didapatkan
dari perbandingan antara persepsi
manusia ( human perception) dengan
hasil klasifikasi sistem.

4. HASIL UJI COBA


Pada uji coba ini kita melakukan kombinasi
rasio perbandingan data training dan testing.
Skenario 1 yaitu 80:20 , Skenario 2 yaitu
70:30 dan Skenario 3 yaitu 50:50 dengan
metode data secara urut dan random. Hal ini
kami lakukan untuk menguji apakah metode
yang digunakan tersebut tetap bisa handal pada
berbagai situasi data keluhan. Berikut beberapa
hasil proses pelatihan yang didapatkan.

Gambar 7. Hasil Testing Skenario 3 [50:50]


secara urut
Hasil diatas yaitu pengklasifikasian data secara
urut dimana data yang di Training dan Testing kita
ambil secara urut berdasarkan penamaaan/
penomoran gambar sehingga dari beberapa
percobaan program yang dijalankan menghasilkan
akurasi data yang relatif sama.

Gambar 8. Hasil Testing Skenario 1 [80:20]


secara random
Gambar 5. Hasil Testing Skenario 1
[80:20] secara urut

Gambar 9. Hasil Testing Skenario 2 [70:30]


secara random

Gambar 6. Hasil Testing Skenario 2


[70:30] secara urut

98.00%
96.00%
94.00%
92.00%
90.00%
88.00%

Gambar 10. Hasil Testing Skenario 3 [50:50]


secara random
Hasil diatas yaitu pengklasifikasian data secara
random dimana data yang di Training dan Testing
kita ambil secara sehingga dari beberapa
percobaan program yang dijalankan menghasilkan
akurasi data yang berbeda-beda.

Urut
Random

Gambar 13. Kurva hasil percobaan pertama

98.00%
96.00%
94.00%
92.00%

Urut

90.00%

Random

88.00%

Gambar 14. Kurva hasil percobaan kedua

Gambar 11. Hasil seluruh Testing


secara urut dan random pada percobaan
pertama

Salah satu faktor yang mempengaruhi besar


kecilnya nilai akurasi adalah semakin banyaknya
data training yang digunakan dalam setiap proses
pengujian dan juga metode yang digunakan yaitu
urut atau random. Dari pengujian tersebut
didapatkan rasio terbaiknya adalah [80:20].
Kemudian untuk rata-rata keseluruhan nilai
akurasinya adalah 95,6 %. Nilai rata-rata ini dapat
dikatakan masih sangat optimal dan layak untuk
digunakan sebagai rekomendasi bahwa sistem
yang dibuat tersebut memiliki tingkat persepsi
yang hampir mendekati dengan analisis persepsi
manusia.

5. KESIMPULAN DAN SARAN


1.1 Kesimpulan

Gambar 12. Hasil seluruh Testing


secara urut dan random pada percobaan
kedua

Pada beberapa kali percobaan, ternyata hasil


akurasi data yang dihasilkan bisa berubahubah. Ini dikarenakan jumlah data Training dan
Testing yang berbeda-beda yaitu dengan ratio
80:20, 70:30 dan 50:50. Selain itu, faktor
metode pemasukan data juga mempengaruhi
hasil dari akurasi data. Metode pemasukan data
secara urut relatif menghasilkan akurasi data
yang sama sedangkan metode secara random/
acak lebih menghasilkan akurasi yang berbeda-

beda tiap percobaan. Akan tetapi, dari hasil


rata-rata akurasi yang dihasilkan dari program
ini dapat dikatakan masih sangat optimal dan
layak untuk digunakan sebagai rekomendasi
bahwa system/program yang kita buat tersebut
memiliki tingkat persepsi yang hampir
mendekati dengan analisis persepsi manusia.

1.2 Saran
Karena dalam penelitian ini, kami hanya
menggunakan 100 dataset maka diharapkan
untuk
penelitian
selanjutnya
dapat
menambahkan dataset bawang sebagai data
training dan testing
dalam jumlah yang
cukup / lebih besar untuk pengujian yang lebih
optimal. Selain itu, juga diharapkan
menggunakan
kombinasi
metode
pengkalasifikasian yang lain misalnya naive
bayes clasifier dengan PCA atau Naive Bayes
clasifier dengan PDA.

6. DAFTAR PUSTAKA
http://en.wikipedia.org/wiki/Naive_Bayes_cl
assifier diakses pada 30 Mei 2014
http://users3.jabry.com/luxky/Bayes.asp
diakses pada 30 Mei 2014
www.informatika.unsyiah.ac.id/tfa/dm/dmbayesian-classifier.pdf
diakses pada 31 Mei 2014
http://repository.usu.ac.id/bitstream/123456789
/20106/4/Chapter%20I.pdf diakses pada
tanggal 31 Mei 2014
http://repository.usu.ac.id/bitstream/123456789
/16877/4/Chapter%20II.pdf
diakses pada tanggal 31 Mei 2014
http://www.pps.unud.ac.id/thesis/pdf_thesis/un
ud-211-1184866289-tesis.pdf
diakses pada tanggal 31 Mei 2014
http://id.wikipedia.org/wiki/Bawang_merah
diakses pada 30 Mei 2014
http://id.wikipedia.org/wiki/Bawang_putih
diakses pada 30 Mei 2014
http://id.wikipedia.org/wiki/Daun_bawang
diakses pada 30 Mei 2014
http://id.wikipedia.org/wiki/Bawang_bombai
diakses pada 30 Mei 2014