Anda di halaman 1dari 5

JURNAL INFORMATIKA, Vol. 6 No. 1 April 2019, pp.

18~22
ISSN: 2355-6579
E-ISSN: 2528-2247 18

Penerapan Algoritma Naïve Bayes untuk Rekomendasi


Pakaian Wanita

Ratih Yulia Hayuningtyas

STMIK Nusa Mandiri/Teknik Informatika


Email: ratih.ryl@nusamandiri.ac.id

Abstrak
Banyak kegiatan jual beli yang dilakukan secara online yang tentunya sangat memudahkan
bagi para pembeli. Salah satunya yaitu pembelian pakaian wanita, dalam memilih sebuah
pakaian terkadang sebagai wanita merasa sangat membingungkan, dikarenakan banyak pilihan
yang menarik. Selain itu ada beberapa faktor yang menjadi pertimbangan seperti tipe tubuh,
bahan, model, warna dan harga. Dari faktor tersebut dibutuhkan sistem untuk rekomendasi
pada saat pembelian pakaian wanita terutama yang dilakukan secara online. Algoritma Naïve
Bayes merupakan pengklasifikasian probabilistik sederhana yang menghitung sekumpulan
probabilitas dengan menjumlahkan frekuensi. Dengan Naïve Bayes diharapkan dapat
memberikan keputusan yang akurat dalam menentukan rekomendasi pakaian wanita dengan
atribut yang sudah ditentukan seperti style, price, rating, size, season, neckline, sleevelength,
waiseline, material, fabrictype, decoration, patterntype, recommendation.

Abstract
Many activities buying and selling are carried out online, which of is very easy to buyer. One of
them in the purchases of women’s clothing, in choosing a clothing somestime feels very
confusing because there are many interesting choice. Apart of there are several factors that
considered such as body type, material, model, color and price. From the factors is needed
system for recommendations when purchasing women’s clothing, especially those online. Naïve
Bayes Algorithm is simple probabilitc classification that calculates set of probabilities by
summing frequencies. The Naïve Bayes is expected to provide accurate decisions in
determining recommendations for women’s clothing such as style, price, rating, size, season,
neckline, sleevelength, waiseline, material, fabrictype, decoration, patterntype,
recommendation.

Keywords: Naïve Bayes, Rekomendasi

stok dari barang yang dijual masih tersedia


1. Pendahuluan atau tidak dan yang lebih penting lagi yaitu
Sebagian dari wanita terkadang dalam kualitas dari pakaiannya.
memilih pakaian sangat membingungkan. Kecocokan seseorang dalam memilih
Seperti pada saat melakukan pembelian sebuah pakaian dapat dipengaruhi oleh
pakaian pasti membutuhkan masukan atau beberapa faktor seperti tipe tubuh yang
pendapat dari orang lain mengenai baju dimiliki. Tipe tubuh ini banyak macamnya
yang akan dipilih, dimulai dari model, seperti tipe apel, pear, persegi, dan jam
harga, bahan, ukuran dan sebagainya yang pasir (Mariana, Setiawan, & Irawan, 2015).
sesuai. Hal seperti ini sering membuat Selain itu, harus melihat deskripsi dari
sebagian orang menjadi kesulitan dan pakaian dan ulasan dari pakaian yang akan
membingungkan untuk memilih sebuah dibeli seperti bahan dari pakaian, model,
pakaian. warna, harga, corak dan rating dari para
Sudah banyak penjualan yang pembeli yang sudah membeli pakaian
dilakukan secara online, tentunya sangat tersebut. Itu semua sangat dibutuhkan
memudahkan bagi para pembeli untuk tidak sebagai rekomendasi pada saat melakukan
datang lagi ke sebuah toko. Tetapi untuk pembelian pakaian secara online. Untuk itu
membeli pakaian secara online harus dibutuhkan suatu sistem yang dapat
melihat terlebih dahulu kualitas dan membantu dalam menentukan
kuantitas dari barang yang dijual. Seperti rekomendasi pakaian.

http://ejournal.bsi.ac.id/ejurnal/index.php/ji/article/view/4685
19

Sistem pendukung keputusan Proses utama saat metode ditereapkan


merupakan sistem informasi interaktif yang untuk menemukan pengetahuan atau
menyediakan informasi, pemodelan dan informasi dari data.
pemanipulasian data. Sistem ini digunakan f. Pattern Evaluation
untuk membantu dalam pengambilan Untuk mengidentifikasi pola-pola
keputusan (Suryadi & Harahap, 2018) menarik kedalam knowledge based
Pada penelitian ini menggunakan yang ditemukan.
metode Naive Bayes dalam menentukan g. Knowledge presentation
rekomendasi pakaian wanita. Naive bayes Pengetahuan mengenai metode yang
merupakan metode untuk klasifikasi yang digunakan untuk memperoleh
menghitung probabilistik dengan dengan pengetahuan yang diperoleh pengguna
menjumlahkan frekuensi dan kombinasi
nilai dari dataset yang diberikan untuk 2. Metode Penelitian
menentukan probabilitas hasil (Medkhar, Metode Naïve Bayes merupakan
Bote, & Deshmukh, 2013) metode yang memanfaatkan metode
Selain itu, menurut (Saleh, 2015) probabilitas dan statistik yang dikemukakan
Naive Bayes merupakan sebuah oleh ilmuwan Inggris Thomas Bayes. Naïve
pengklasifikasian probabilistik sederhana Bayes merupakan metode
yang menghitung sekumpulan probabilitas pengklasifikasian yang sangat sederhana
dengan menjumlahkan frekuensi dan dengan mengasumsikan klasifikasi atribut.
kombinasi nilai dari dataset yang diberikan. Dengan metode Naive Bayes terlebih
Algoritma Naive Bayes merupakan dahulu mencari Nilai Probabilitas dan
metode data mining yang termasuk likelihood maksimum dari setiap atribut
kedalam sepuluh klasifikasi data mining untuk masing-masing kelas (Karthika &
yang paling popular diantara algoritma- Sairam, 2015).
algoritma lainnya (Saputra, Taufik, 2.1 Probabilitas Prior
Ramdhani, Oktapian, & Marsusanti, 2018) Persamaan dari probabilitas prior:
Data mining sendiri memiliki arti P(H)= Nj
menganalisis data dari perspektif yang N
berbeda dan meringkasnya menjadi Dimana:
informasi yang berguna (Medkhar et al., Nj : Jumlah data pada suatu class
2013) N : Jumlah total data
Data mining memiliki beberapa 2.2 Probabilitas Posterior
tahapan yaitu data cleaning, data Persamaan dari teorema bayes
integration, data transformation, teknik data (Saputra et al., 2018):
mining, patern evaluation, knowledge
presentation (Peling, Arnawan, Arthawan, & P(H|X) = P(X|H).P(H)
Janardana, 2017). P(X)
Tahapan data mining ada 6 dengan
penjelasan sebagai beirkut (Meilani & Dimana:
Susanti, 2015): X : Data dengan class yang belum
a. Data Cleaning diketahui
Proses menghilangkan data yang tidak H : Hipotesis data merupakan suatu
konsisten atau data yang tidak relevan class spesifik
b. Data Integration P(H|X) : Probabilitas Hipotesis H
Penggabungan atau mengkombinasikan berdasarkan kondisi X (posterior
sebuah data dari beberapa sumber. probabilitas)
c. Data Selection P (H) :Probabilitas hipotesis H (prior
Pemilihan data dari sekumpulan data probabilitas)
operasional sebelum mendapatkan P(X|H) : probabilitas X berdasarkan kondisi
inforamsi knowledge discovery in pada hipotesis H
database. P(X) : Probabilitas X
d. Data Transformation
Data diubah atau digabung ke dalam Penentuan class dilakukan dengan
format yang sesuai untuk diproses cara membandingkan nilai probabilitas
dalam data mining. suatu sampel berada di class yang satu
e. Data Mining dengan nilai probabilitas suatu sampel
berada di class yang lain.

JURNAL INFORMATIKA Vol. 6 No. 1, April 2019


20

Untuk menentukan class yang cocok Medium, Very-High


dari suatu sampel dilakukan dengan cara Rating 0–5
membandingkan nilai posterior untuk Size Free, L, M, S, Small, XL
masing-masing class, dan mengambil class Season Automn, Autumn,
dengan nilai posterior yang tertinggi. Spring, Summer, Winter
Neckline Backless, Boat-neck,
3. Hasil dan Pembahasan Bowneck, Halter,
Data yang digunakan dalam penelitian Mandarin-collor, Null, o-
ini diperoleh dari UCI Machine Learning neck, Open, Peterpan-
Repository. Jumlah Data collor, Ruffled, Scoop,
Dresses_attribute_sales sebanyak 500 Slash-neck, Sqare-
data, dalam penentuan rekomendasi collor, Sweetheart,
menggunakan atribut yang terdiri dari 12 Turndowncollor, V-Neck
atribut dan 1 atribut yang digunakan untuk Sleevelength Butterfly, Caps-leeves,
class rekomendasi. Atribut yang digunakan Full, Half, Halfsleeves,
yaitu style, price, rating, size, season, Null, Petal, Short,
neckline, sleevelength, waiseline, matrial, Sleeveless,
fabrictype, decoration, pattern type dan Threequarter,
recommendation. Dari data Thressqatar,
dresses_attribute_sales, ada 290 data gaun Turndowncollor,
yang tidak rekomended untuk dibeli dan Urndowncollor
ada 210 data gaun yang rekomended untuk Waiseline Dropped, Empire,
dibeli. Natural, Null, Princess
3.1 Probabilitas Prior Material Acrylic, Cashmere,
Nilai probabilitas prior dihitung Chiffonfabric, Cotton,
berdasarkan data masa lalu. Total semua Knitting, lace, linen,
data 500 dengan class yang berbeda, 290 lycra, Microfiber,
dengan class 0 yang artinya tidak Milksilk, Mix, Modal,
rekomended, dan 210 dengan class 1 yang Model, Null, Nylon,
artinya rekomended. Nilai probabilitas prior Other, Polyster, Rayon,
digunakan untuk menghitung nilai Shiffon, Silk, Sill,
probabilitas prior dari setiap atribut. Spandex, Viscos, Wool.
Fabrictype Batik, Broadcloth,
Tabel 1. Atribut chiffon, Corduroy,
No Nama Atribut Status Atribut Dobby, Flannel, Jersey,
1 Style Diketahui Knitted, Knitting, lace,
2 Price Diketahui null, Organza, Other,
3 Rating Diketahui Poplin, Satin, Shiffon,
4 Size Diketahui Terry, Tulle, Woolen
5 Season Diketahui Decoration Applique, Beading, Bow,
6 Neckline Diketahui Button
7 Sleevelength Diketahui Patterntype Animal, dot, geometric,
8 Waiseline Diketahui null, patchwork, plaid,
9 Material Diketahui print, solid, striped
10 Fabrictype Diketahui Recommendation Ya, Tidak
11 Decoration Diketahui
12 Patterntype Diketahui Diketahui data tes untuk menghitung
13 Recommendation Dicari nilai probabilitas di setiap atribut. Berikut
adalah data tes yang ada dapat dilihat pada
Tabel 2. Nilai Atribut tabel 3.3
Nama Atribut Nilai Atribut
Style Bohemian, Brief, Tabel 3. Data Tes
Casual, Cute, Fashion, Dress_Id 919930954
Flare, Novelty, OL, Style Casual
Party, Sexy, Vintage, Price Low
Work Rating 4,4
Price Average, High, Low, Size Free

JURNAL INFORMATIKA Vol. 6 No. 1, April 2019


21

Season Summer Decorat Lace 32 210 0,15


Neckline V-Neck ion (Ya)
SleeveLength Short Lace 38 290 0,13
Waiseline Empire (Tidak)
Material Cotton Pattern Solid 79 210 0,38
FabricType Chiffon Type (Ya)
Decoration Lace Solid 124 290 0,43
PatternType Solid (Tidak)
Recommendation ?
3.2 Probabilitas Posterior
Tabel 4. Nilai Probabilitas Prior Atribut Perhitungan pada probabilitas
Atribut Nilai Atribut Jumlah P posterior digunakan untuk menentukan
Data (X|C) class terhadap data baru yang akan
Style Casual 89 210 0,42 diklasifikasikan. Berikut adalah perhitungan
(Ya) probabilitas posterior dari data tes pada
Casual 143 290 0,49 tabel 3.3:
(Tidak) P(X|Recommendation) =
Price Low 72 210 0,34 P(Casual|Recommendation) *
(Ya) P(Low|Recommendation) *
Low 102 290 0,35 P(4,4|Recommendation) *
P(Free|Recommendation) *
(Tidak)
P(Summer|Recommendation) *
Rating 4,4 6 210 0,03
P(V-Neck|Recommendation) *
(Ya)
P(Short|Recommendation) *
4,4 21 290 0,07
P(Empire|Recommendation) *
(Tidak)
P(Cotton|Recommendation) *
Size Free 77 210 0,37 P(Chiffon|Recommendation) *
(Ya)
P(Lace|Recommendation) *
Free 96 290 0,33 P(Solid|Recommendation) *
(Tidak) = 0,42*0,34*0,03*0,37*0,26*0,29*0,13*
Season Summ 54 210 0,26 0,22*0,30*0,27*0,15*0,38*210
er (Ya) = 0,00000320
Summ 106 290 0,37
er P(X|NonRecommendation) =
(Tidak) P(Casual|NonRecommendation) *
Necklin V- 60 210 0,29 P(Low|NonRecommendation) *
e Neck P(4,4|NonRecommendation) *
(Ya) P(Free|NonRecommendation) *
V- 64 290 0,22 P(Summer|NonRecommendation) *
Neck P(V-Neck|NonRecommendation) *
(Tidak) P(Short|NonRecommendation) *
SleeveL Short 27 210 0,13 P(Empire|NonRecommendation) *
ength (Ya) P(Cotton|NonRecommendation) *
Short 69 290 0,24 P(Chiffon|NonRecommendation) *
(Tidak) P(Lace|NonRecommendation) *
Waiseli Empire 47 210 0,22 P(Solid|NonRecommendation) *
ne (Ya) = 0,49*0,35*0,07*0,33*0,37*0,22*0,24*
Empire 57 290 0,20 0,20*0,30*0,27*0,13*0,43*290
(Tidak) = 0,00002080
Material Cotton 64 210 0,30
(Ya) 4. Kesimpulan
Cotton 88 290 0,30 Dapat ditarik kesimpulan dari
(Tidak) penelitian ini sebagai berikut:
Fabric Chiffon 57 210 0,27 a. Melihat hasil dari probabilitas posterior
Type (Ya) bahwa P(X|Recommendation) lebih kecil
Chiffon 78 290 0,27 di bandingkan hasil
(Tidak) P(X|NonRecommendation), maka dapat

JURNAL INFORMATIKA Vol. 6 No. 1, April 2019


22

diketahui bahwa data tes ini termasuk Meilani, B. D., & Susanti, N. (2015).
data NonRecommendation. Aplikasi Data Mining Untuk
b. Naïve Bayes merupakan metode yang Menghasilkan Pola Kelulusan Siswa
dapat membantu dalam menyelesaikan Ddengan Metode Naive Bayes. Jurnal
masalah klasifikasi seperti rekomendasi Ilmiah NERO, 1(3), 182–189.
pakaian wanita. Peling, I. B. A., Arnawan, I. N., Arthawan, I.
c. Naïve Bayes sangat baik digunakan P. A., & Janardana, I. (2017).
untuk mendukung penunjang keputusan. Implementation of Data Mining To
d. Metode Naïve Bayes merupakan Predict Period of Students Study
metode klasifikasi dengan teorema Using Naive Bayes Algorithm.
bayes yang dikenal dengan ilmu International Journal of Engineering
probabilitas. and Emerging Technology, 2(1), 53–
57.
Referensi Saleh, A. (2015). Implementasi Metode
Karthika, S., & Sairam, N. (2015). A Naïve Klasifikasi Naive Bayes Dalam
Bayesian Classifier for Educational Memprediksi Besarnya Penggunaan
Qualification. Indian Journal of Listrik Rumah Tangga. CITEC
Science and Technology, 8(16), 1–5. Journal, 2(3), 207–217.
http://doi.org/10.17485/ijst/2015/v8i16/ http://doi.org/doi.org/10.24076/citec.20
62055 15v2i3.49
Mariana, P., Setiawan, H., & Irawan, P. L. Saputra, R. A., Taufik, A. R., Ramdhani, L.
T. (2015). Implementasi Augmented S., Oktapian, R., & Marsusanti, E.
Reality Untuk Visualisasi Pakaian (2018). Sistem Pendukung Keputusan
Wanita. SMATIKA Jurnal2, 5(2), 51– Dalam Menentukan Metode
57. Kontrasepsi Menggunakan Algoritma
Medkhar, D. S., Bote, M. P., & Deshmukh, Naive Bayes. SNIT 2018, 106–111.
S. D. (2013). Heart Disease Prediction Suryadi, A., & Harahap, E. (2018). Sistem
System Using Naive Bayes. Rekomendasi Penerimaan Mahasiswa
International Journal Of Enhanced Baru Menggunakan Naive Bayes
Research In Science Technology & Classifier Di Institut Pendidikan
Engineering, 2(3), 1–5. Indonesia. JOUTICA, 3(2), 171–182.
http://doi.org/10.1093/infdis/139.2.232

JURNAL INFORMATIKA Vol. 6 No. 1, April 2019

Anda mungkin juga menyukai