Anda di halaman 1dari 9

KLASIFIKASI KENDARAAN RODA EMPAT Oleh: Muthia Deliana

(1608107010028)
DENGAN METODE NAIVE BAYES
PENDAHULUAN
Memilih kendaraan roda empat yang aman dan terbaik merupakan hal yang sangat
penting. Pengembangan mobil sampai sekarang ini semaking bersaing satu sama
lain, oleh karena itu konsumen perlu mengetahui karakteristik mobil yang masuk ke
dalam kategori mobil yang paling baik. Sistem pendukung keputusan yang tepat
diperlukan untuk suatu pendekatan ilmiah yang digunakan untuk memilih mobil yang
ditawarkan.
TINJAUAN PUSTAKA
Mobil adalah kendaraan darat yang digerakkan oleh tenaga mesin, beroda
empat atau lebih yang biasanya menggunakan bahan bakar minyak untuk
menghidupkan mesinnya.
Data mining adalah proses yang menggunakan teknik statistika, matematika,
kecerdasan buatan, dan machine learning untuk mengekstraksi dan juga
mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait
dari berbagai database besar
Naive Bayes merupakan pengklasifikasian dengan metode probabilitas dan
statistik dengan persamaannya yaitu:
METODE PENELITIAN
Penelitian ini menggunakan metode Naïve Bayes. Pada penelitian ini data yang digunakan adalah data evaluasi
kendaraan roda empat yang didapat dari Machine Learning Repository UCI.
Dilakukan beberapa langkah yaitu:
Pengumpulan data:
a. data yang dikumpulkan merupakan data kendaraan roda empat dari Machine Learning Repository UCI
b. Total data 1728 data dengan 6 atribut dan terdapat 4 kelas yaitu unacceptable (tidak terpenuhi), acceptable
(terpenuhi), good (bagus), very good (sangat bagus).
Pembersihan data:
a. Data Validation, mengidentifikasikan dan menghapus data yang ganjil atau redudansi
b. Data integration dan transformation, meningkatkan akurasi dan efisiensi algoritma
c. Data size reduction, memperoleh dataset dengan jumlah atribut yang sedikit namun informatif.
Dari proses pengolahan awal data, diperoleh sebanyak 1728 data dengan 1210 data dengan kelas
“unacc”, 384 data dengan kelas “acc”, 69 data dengan kelas “good” dan 65 data dengan kelas “vgood”.
Implementasi dan Pengujian
a. Data yang sudah diacak dimasukkan ke dalam tool weka sebagai data training dan data testing
untuk diuji
b. Setelah mendapatkan hasil, maka dilakukan pengukuran akurasi
c. Uji dengan metode kinerja Confussion Matrix, sehingga evaluasi dari confussion matrix akan
menghasilkan nilai akurasi, precission dan recall yang akurat.

Nilai Akurasi
Persentase jumlah record
data yang diklarifikasikan
dengan benar oleh suatu
algoritma klasifikasi
Nilai Presisi
proposisi kasus
dengan hasil
Nilai Recall diagnosa positif.
digunakan untuk
membandingkan True
Positive dengan tupel
positif.
HASIL DAN PEMBAHASAN
Berdasarkan data yang ada, maka setelah dilakukan pengujian data dimana data terdiri dari
atribut yaitu:
 Buying / Harga Mobil
 Maintenance
 Doors / Pintu
 Persons / Muatan Orang
 Luggage Bot / Besar Bagasi
 Safety / Keamanan
Data yang diperoleh sebesar 1728 data kendaraan roda empat. Data tersebut diacak kemudian
diperiksa apabila masih mengandung duplikasi dan inkonsistensi data dengan cara dilakukan replace
missing.
Langkah berikutnya ialah membagi data ke dalam dua bagian yaitu data training sebesar 75%
dan data testing sebesar 25%, sehingga data training berjumlah 1296 data dan data testing
berjumlah 432 data.
Data training dan testing kemudian diuji pada tool weka. Dari hasil eksperimen yang dilakukan
didapatkan hasil kecocokan data testing yang dimasukkan ke dalam confussion matrix.
True True acc True True
unacc good vgood

Pred. 304 10 0 0
unacc

Pred. acc 16 65 2 0

Pred. 0 17 5 0
good

Pred. 0 6 0 7
vgood

Nilai akurasi dihitung dengan persamaan:

𝑇𝑃 + 𝑇𝑁
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 =
𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁

381
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑥 100% = 88.194444% 8.2
432
Nilai presisi dihitung dengan persamaan:

5
𝑇𝑃 𝑃𝑟𝑒𝑠𝑖𝑠𝑖 𝑈𝑛𝑎𝑐𝑐𝑎𝑝𝑡𝑎𝑏𝑙𝑒 𝑢𝑛𝑎𝑐𝑐 𝑃𝑟𝑒𝑠𝑖𝑠𝑖 𝐺𝑜𝑜𝑑 = 𝑥 100% = 71.4285%
𝑃𝑟𝑒𝑠𝑖𝑠𝑖 = 304 7
𝑇𝑃 + 𝐹𝑃 = 𝑥 100% = 95.0%
320

7
𝑃𝑟𝑒𝑠𝑖𝑠𝑖 𝐴𝑐𝑐𝑒𝑝𝑡𝑎𝑏𝑙𝑒 𝑎𝑐𝑐 𝑃𝑟𝑒𝑠𝑖𝑠𝑖 𝑉𝑒𝑟𝑦 𝐺𝑜𝑜𝑑 = 𝑥 100% = 100%
65 7
= 𝑥 100% = 66.326531%
98

Nilai recall dihitung dengan persamaan:

5
𝑇𝑃 𝑅𝑒𝑐𝑎𝑙𝑙 𝑈𝑛𝑎𝑐𝑐𝑎𝑝𝑡𝑎𝑏𝑙𝑒 𝑢𝑛𝑎𝑐𝑐 𝑅𝑒𝑐𝑎𝑙𝑙 𝐺𝑜𝑜𝑑 = 𝑥 100% = 22.72%%
𝑅𝑒𝑐𝑎𝑙𝑙 = 304
22
𝑇𝑃 + 𝐹𝑁
= 𝑥 100% = 96.81%
314
7
𝑅𝑒𝑐𝑎𝑙𝑙 𝐴𝑐𝑐𝑒𝑝𝑡𝑎𝑏𝑙𝑒 𝑎𝑐𝑐 𝑅𝑒𝑐𝑎𝑙𝑙 𝑉𝑒𝑟𝑦 𝐺𝑜𝑜𝑑 = 𝑥 100% = 53.84%
13
65
= 𝑥 100% = 78.3%
83

Dari pengujian 432 data uji didapatkan akurasi sebesar 88.19% dengan nilai recall sebesar 88.2% dan presisi sebesar 88.4%.
Hal ini menunjukkan bahwa penggunaan metode naive bayes dalam menentukan kelayakan kendaraan roda empat dapat
digunakan sebagai sistem klasifikasi kendaraan roda empat.
KESIMPULAN
Dari hasil pengujian menunjukkan bahwa klasifikasi kendaraan roda empat dengan
menggunakan metode naïve bayes sehingga mendapatkan nilai akurasi sebesar 88.19% ,
nilai presisi sebesar 88.4% dan nilai recall sebesar 88.2%.

Dari hasil penelitian dan pengujian yang dilakukan, maka metode yang diusulkan pada
klasifikasi kendaraan roda empat dengan menggunakan metode naïve bayes dapat
digunakan untuk menentukan baik dan buruknya kondisi kendaraan roda empat.

Anda mungkin juga menyukai