Anda di halaman 1dari 6

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Jurnal TEM. Volume 8, Edisi 1, Halaman 113-118, ISSN 2217-8309, DOI: 10.18421/TEM81-16, Februari 2019.

Prediksi Harga Mobil menggunakan Mesin


Teknik Pembelajaran
Enis Gegic, Becir Isakovic, Dino Keco, Zerina Masetic, Jasmin Kevric
Universitas Internasional Burch, Sarajevo, Bosnia dan Herzegovina

Abstrak -Prediksi harga mobil telah menjadi area meningkat di masa mendatang. Ini menambah signifikansi
penelitian yang sangat diminati, karena tambahan pada masalah prediksi harga mobil.
membutuhkan usaha dan pengetahuan yang nyata Prediksi harga mobil yang akurat melibatkan
dari pakar lapangan. Sejumlah besar atribut pengetahuan ahli, karena harga biasanya bergantung pada
berbeda diperiksa untuk prediksi yang andal dan
banyak fitur dan faktor yang berbeda. Biasanya, yang
akurat. Untuk membuat model prediksi harga mobil
paling signifikan adalah merek dan model, usia, tenaga
bekas di Bosnia dan Herzegovina, kami menerapkan
tiga teknik pembelajaran mesin (Jaringan Syaraf kuda, dan jarak tempuh. Jenis bahan bakar yang digunakan
Tiruan, Mesin Vektor Dukungan, dan Hutan Acak). pada mobil serta konsumsi bahan bakar per mil sangat
Namun, teknik tersebut diterapkan untuk bekerja mempengaruhi harga mobil karena sering terjadi
sebagai ansambel. Data yang digunakan untuk perubahan harga bahan bakar. Berbagai fitur seperti warna
prediksi dikumpulkan dari portal web autopijaca.ba eksterior, nomor pintu, jenis transmisi, dimensi, keamanan,
menggunakan web scraper yang ditulis dalam kondisi udara, interior, apakah memiliki navigasi atau tidak
bahasa pemrograman PHP. Kinerja masing-masing juga akan mempengaruhi harga mobil. Dalam makalah ini,
algoritma yang berbeda kemudian dibandingkan kami menerapkan metode dan teknik yang berbeda untuk
untuk menemukan satu yang paling sesuai dengan
mencapai presisi yang lebih tinggi dari prediksi harga mobil
kumpulan data yang tersedia. Model prediksi akhir
bekas.
diintegrasikan ke dalam aplikasi Java. Lebih-lebih
lagi, Makalah ini disusun sebagai berikut: Bagian II berisi
pekerjaan terkait di bidang prediksi harga mobil bekas.
Kata kunci –prediksi harga mobil, support vector
Pada bagian III, metodologi penelitian dari penelitian
machine, klasifikasi, machine learning.
kami dijelaskan. Bagian IV menguraikan berbagai
algoritme pembelajaran mesin dan memeriksa
1. Perkenalan
kinerjanya masing-masing untuk memprediksi harga
Prediksi harga mobil entah bagaimana menjadi masalah mobil bekas. Terakhir, di bagian V, diberikan kesimpulan
yang menarik dan populer. Sesuai informasi yang diperoleh dari pekerjaan kami, bersama dengan rencana kerja ke
dari Badan Pusat Statistik BiH, tercatat sebanyak 921.456 unit depan.
kendaraan pada tahun 2014 dimana 84% diantaranya adalah
kendaraan pribadi [1]. Angka ini meningkat sebesar 2,7% sejak 2. Pekerjaan Terkait
tahun 2013 dan kemungkinan tren ini akan terus berlanjut,
Memprediksi harga mobil bekas telah dipelajari
serta jumlah mobil akan terus bertambah.
secara luas dalam berbagai penelitian. Listian
membahas, dalam makalahnya yang ditulis untuk tesis
DOI: 10.18421/TEM81-16 Magister [2], bahwa model regresi yang dibangun
https://dx.doi.org/10.18421/TEM81-16 dengan menggunakan Support Vector Machines (SVM)
dapat memprediksi harga mobil yang disewakan
Penulis yang sesuai:Enis Gegic, dengan presisi yang lebih baik daripada regresi
Universitas Internasional Burch, Sarajevo, Bosnia dan
multivariat atau regresi berganda sederhana. Hal ini
Herzegovina
dikarenakan Support Vector Machine (SVM) lebih baik
Surel:enis.gegic@ibu.edu.ba
dalam menangani dataset dengan dimensi yang lebih
Diterima: 29 Maret 2018. banyak dan tidak terlalu rentan terhadap overfitting dan
Diterima: 28 Januari 2019. underfitting. Kelemahan dari penelitian ini adalah
Diterbitkan: 27 Februari 2019. perubahan regresi sederhana dengan regresi SVM yang
lebih maju tidak ditunjukkan pada indikator dasar
© 2019 Enis Gegic dkk; diterbitkan oleh seperti mean, varians atau standar deviasi.
UIKTEN. Karya ini dilisensikan di bawah Lisensi Creative Pendekatan lain diberikan oleh Richardson dalam bukunya
Commons Attribution-NonCommercial-NoDerivs. 3.0 karya tesis [3]. Teorinya adalah produsen mobil memproduksi
mobil yang lebih tahan lama. Richardson menerapkan analisis
Artikel adalah diterbitkan dengan Membuka Mengakses regresi berganda dan mendemonstrasikan bahwa mobil hybrid
padawww.temjournal.com mempertahankan nilainya lebih lama dari itu

Jurnal TEM – Volume 8 / Nomor 1 / 2019. 113


Jurnal TEM. Volume 8, Edisi 1, Halaman 113-118, ISSN 2217-8309, DOI: 10.18421/TEM81-16, Februari 2019.

mobil tradisional. Ini berakar pada masalah lingkungan penulis setup mampu mencapai akurasi prediksi
tentang iklim dan memberikan efisiensi bahan bakar yang sebesar 98%.
lebih tinggi. Dalam pekerjaan terkait yang ditunjukkan di atas,
Wu dkk. [4] melakukan studi prediksi harga mobil, penulis mengusulkan model prediksi berdasarkan
dengan menggunakan sistem berbasis pengetahuan algoritma pembelajaran mesin tunggal. Namun, terlihat
neuro-fuzzy. Mereka mempertimbangkan atribut bahwa pendekatan algoritme pembelajaran mesin tunggal
berikut: merek, tahun produksi, dan jenis mesin. Model tidak memberikan hasil prediksi yang luar biasa dan dapat
prediksi mereka menghasilkan hasil yang serupa ditingkatkan dengan menggabungkan berbagai metode
dengan model regresi sederhana. Selain itu, mereka pembelajaran mesin dalam ansambel.
membuat sistem pakar bernama ODAV (Optimal
Distribution of Auction Vehicles) karena tingginya 3. Bahan dan Metode
permintaan penjualan mobil di akhir tahun leasing oleh
dealer mobil. Sistem ini memberikan wawasan tentang Pendekatan prediksi harga mobil yang diusulkan dalam makalah ini
harga terbaik untuk kendaraan, serta lokasi di mana terdiri dari beberapa langkah, ditunjukkan pada Gambar 1.
harga terbaik dapat diperoleh. Model regresi
berdasarkan algoritma pembelajaran mesin k-nearest
neighbor digunakan untuk memprediksi harga sebuah
mobil. Sistem ini memiliki kecenderungan untuk
menjadi sangat sukses karena lebih dari dua juta
kendaraan dipertukarkan melaluinya [5].
Gonggie [6] mengusulkan model yang dibangun
menggunakan JST (Jaringan Syaraf Tiruan) untuk prediksi
harga mobil bekas. Dia mempertimbangkan beberapa Gambar 1. Diagram blok klasifikasi secara keseluruhan
atribut: jarak tempuh yang ditempuh, estimasi masa pakai proses
mobil, dan merek. Model yang diusulkan dibangun agar
dapat menangani hubungan nonlinier dalam data yang Data dikumpulkan dari portal web lokal untuk jual
tidak terjadi pada model sebelumnya yang menggunakan beli mobil autopijaca.ba [9], selama musim dingin,
teknik regresi linier sederhana. Model non-linier mampu karena interval waktu itu sendiri berdampak tinggi
memprediksi harga mobil dengan presisi yang lebih baik pada harga mobil di Bosnia dan Herzegovina. Atribut
daripada model linier lainnya. berikut diambil untuk setiap mobil:
Selanjutnya, Pudaruth [7] menerapkan berbagai algoritma merek, model, kondisi mobil, bahan
bakar, tahun pembelajaran mesin, yaitu: k-nearest manufaktur, daya dalam kilowatt, tipe transmisi, jarak
tetangga, analisis regresi linier berganda, pohon tempuh, warna, kota, negara bagian, jumlah pintu,
keputusan dan naïve bayes untuk prediksi harga mobil di penggerak empat roda (ya/tidak), rusak (ya/tidak),
Mauritius. Kumpulan data yang digunakan untuk membuat navigasi (ya/tidak), jok kulit (ya/tidak ), alarm (ya/tidak),
model prediksi dikumpulkan secara manual dari surat pelek aluminium (ya/tidak), AC digital (ya/tidak), sensor
kabar lokal dalam waktu kurang dari satu bulan, karena parkir (ya/tidak), lampu xenon (ya/tidak), buka kunci
waktu dapat berdampak nyata pada harga mobil. Ia jarak jauh (ya/tidak), kaca spion elektrik (ya/tidak),
mempelajari atribut berikut: merek, model, kapasitas pemanas jok (ya/tidak), atap panorama (ya/tidak), cruise
kubik, jarak tempuh dalam kilometer, tahun produksi, control (ya/tidak), abs (ya/tidak), esp (ya/tidak), asr (ya /
warna eksterior, tipe transmisi, dan harga. Namun, penulis no) dan harga dinyatakan dalam BAM (Bosnia Mark).
menemukan bahwa Naive Bayes dan Decision Tree tidak
Karena pengumpulan data secara manual adalah tugas
dapat memprediksi dan mengklasifikasikan nilai numerik.
yang memakan waktu, terutama bila ada banyak catatan yang
Selain itu, jumlah instance dataset yang terbatas tidak
harus diproses, sebuah “pengikis web” sebagai bagian dari
dapat memberikan kinerja klasifikasi yang tinggi, yaitu
penelitian ini dibuat untuk menyelesaikan pekerjaan ini secara
akurasi kurang dari 70%.
otomatis dan mengurangi waktu pengumpulan data.
Noor dan Jan [8] membangun model prediksi harga
Pengikisan web adalah teknik terkenal untuk mengekstraksi
mobil dengan menggunakan regresi linier berganda.
informasi dari situs web dan menyimpan data ke dalam file
Kumpulan data dibuat selama periode dua bulan dan
atau basis data lokal. Ekstraksi data manual memakan waktu
menyertakan fitur-fitur berikut: harga, kapasitas kubik,
dan oleh karena itu web scraper digunakan untuk melakukan
warna eksterior, tanggal pemasangan iklan, jumlah
pekerjaan ini dalam waktu singkat. Pencakar web diprogram
penayangan iklan, power steering, jarak tempuh dalam
untuk situs web tertentu dan dapat meniru pengguna biasa
kilometer, tipe pelek, tipe transmisi, tipe mesin, kota, kota
dari sudut pandang situs web.
terdaftar, model, versi, tahun pembuatan dan model.
Setelah menerapkan pemilihan fitur, penulis hanya Setelah data mentah dikumpulkan dan disimpan
mempertimbangkan jenis mesin, harga, tahun model dan ke database lokal, langkah preprocessing data
model sebagai fitur masukan. Dengan yang diberikan diterapkan. Banyak atribut yang jarang dan tidak

114 Jurnal TEM – Volume 8 / Nomor 1 / 2019.


Jurnal TEM. Volume 8, Edisi 1, Halaman 113-118, ISSN 2217-8309, DOI: 10.18421/TEM81-16, Februari 2019.

berisi informasi yang berguna untuk prediksi. Oleh Warna mobil dinormalisasi menjadi set tetap dari
karena itu, diputuskan untuk menghapusnya dari 15 warna berbeda. Atribut berkelanjutan seperti
dataset. Atribut "negara bagian", "kota", dan "rusak" "millage", "year of manufacturing", "power in
telah dihapus seluruhnya. kilowatts" dan "price" diubah menjadi nilai kategori
menggunakan interval cluster yang telah ditentukan.
Tabel 1. Sampel kumpulan data yang telah diproses dalam format CSV Millage diubah menjadi lima kategori berbeda, tahun
kekuatan

tahun pelayaran
mil kulit
di dalam
merek model harga
pria
bahan bakar
kilowat kontrol
ts
volkswagen golf2 Diesel 45-55 l7 l4 TIDAK TIDAK 0-1500

volkswagen golf2 Bensin 0-45 l7 l4 TIDAK TIDAK 0-1500

mengarungi pengawal Bensin 45-55 l7 l1 TIDAK TIDAK 0-1500

mengarungi pesta Bensin 55-65 l4 l2 TIDAK TIDAK 0-1500

mercedes-benz 190 Bensin 45-55 l7 l4 TIDAK TIDAK 0-1500

volkswagen jetta Diesel 0-45 l7 l5 TIDAK TIDAK 0-1500

mengarungi fokus Bensin 55-65 l6 l4 TIDAK TIDAK 0-1500

perintah punto Diesel 65-75 l5 l4 TIDAK TIDAK 0-1500

volkswagen golf2 Bensin 65-75 l7 l4 TIDAK TIDAK 0-1500

Kumpulan data mentah yang dikumpulkan berisi 1105 sampel. manufaktur telah diubah menjadi tujuh kategori
Karena data dikumpulkan menggunakan web scraper, banyak dan daya dalam kilowatt diubah menjadi sebelas
sampel yang hanya memiliki sedikit atribut. Untuk membersihkan kategori. Atribut harga telah dikategorikan ke
sampel ini, skrip PHP yang membaca data tergores dari database, dalam 15 kategori berbeda berdasarkan kisaran
melakukan pembersihan dan menyimpan sampel yang harga. Kategori ini ditunjukkan pada Tabel 2 dan
dibersihkan ke dalam file CSV. File CSV tersebut nantinya prinsip serupa diterapkan pada atribut lainnya.
digunakan untuk memuat data ke WEKA, perangkat lunak untuk Proses transformasi data ini mengubah masalah
membangun model pembelajaran mesin [10]. pembelajaran mesin prediksi regresi menjadi
Setelah proses pembersihan, kumpulan data telah masalah klasifikasi.
dikurangi menjadi 797 sampel. Secara khusus, semua
Tabel 2. Klasifikasi harga berdasarkan rentang harga
merek yang memiliki kurang dari 10 sampel dan harganya
lebih tinggi dari 60.000 BAM telah dihapus karena masalah Dari Ke Kelas
kelas miring.
500 2000 500-2000
2000 3500 2000-3500
Keseluruhan proses pembuatan dataset ditunjukkan pada
Gambar 2.
3500 5000 3500-5000
5000 6500 5000-6500
6500 8000 6500-8000
8000 9500 8000-9500
9500 11000 9500-11000
11000 14000 11000-14000
14000 17000 14000-17000
17000 20000 17000-20000
20000 25000 20000-25000
25000 30000 25000-30000
30000 60000 30000-60000
Gambar 2. Alur kerja pengumpulan dan transformasi data
diagram

Jurnal TEM – Volume 8 / Nomor 1 / 2019. 115


Jurnal TEM. Volume 8, Edisi 1, Halaman 113-118, ISSN 2217-8309, DOI: 10.18421/TEM81-16, Februari 2019.

4. Implementasi dan Evaluasi Model Himpunan data. Atribut ini membagi mobil menjadi
tiga kategori harga: murah (harga < 12.000 BAM),
Pendekatan classifier pembelajaran mesin tunggal
sedang (12.000 BAM <= harga < 24.000 BAM) dan
yang telah digunakan dalam semua penelitian sebelumnya
mahal (24.000 BAM <= harga).
juga diuji dalam penelitian ini. Seluruh kumpulan data
Metode ensemble menggabungkan tiga algoritma
yang dikumpulkan dalam penelitian ini telah dibagi
pembelajaran mesin yang diterapkan pada percobaan
menjadi pelatihan (90%) dan pengujian (10%) subset dan
pertama sebagai pengklasifikasi tunggal: RF, SVM, dan JST.
model Jaringan Syaraf Tiruan, Support Vector Machine dan
Algoritma Random Forest diterapkan pada seluruh dataset,
Random Forest dibangun.
untuk menguji seberapa akurat pengklasifikasi dapat
Hutan acak (RF) juga dikenal sebagai hutan keputusan acak termasuk dalam
mengkategorikan sampel menjadi kelas mobil murah, sedang, dan
kategori metode ansambel. RF dapat digunakan untuk masalah klasifikasi dan
mahal. RF adalah estimator meta yang cocok dengan sejumlah
regresi. Algoritma tersebut dikembangkan oleh Ho sebagai perbaikan overfitting
pengklasifikasi pohon keputusan pada berbagai subsampel dari
dari algoritma pohon keputusan [11]. Jaringan Syaraf Tiruan adalah model
kumpulan data dan menggunakan rata-rata untuk meningkatkan
pembelajaran mesin yang mencoba memecahkan masalah dengan cara yang sama
akurasi prediktif dan kontrol over-fitting [15].
seperti yang dilakukan otak manusia. Alih-alih neuron, JST menggunakan neuron
Fitur berikut digunakan untuk membangun model:
buatan yang juga dikenal sebagai perceptron. Di otak manusia, neuron terhubung
merek, model, kondisi mobil, bahan bakar, usia,
dengan akson sedangkan di ANN matriks tertimbang digunakan untuk koneksi
kilowatt, transmisi, mil, warna, pintu, penggerak, jok
antar neuron buatan. Informasi berjalan melalui neuron menggunakan koneksi di
kulit, navigasi, alarm, pelek aluminium, AC digital, AC
antara mereka, dari satu neuron informasi berjalan ke semua neuron yang
manual, sensor parkir , xenon, remote unlock, panas
terhubung dengannya. Menyesuaikan bobot antar sistem neuron dapat dilatih dari
kursi, atap panorama, cruise control, abs, asr, esp dan
contoh masukan [12]. Support Vector Machine dapat digunakan untuk
harga.
menyelesaikan masalah klasifikasi dan regresi. Untuk kumpulan data input, SVM
Sebelum langkah pelatihan model, harga atribut numerik
dapat membuat keputusan biner dan memutuskan di antara dua kategori mana
dikonversi menjadi kelas nominal yang ditunjukkan pada Tabel 4.
sampel input termasuk. Algoritma SVM dilatih untuk melabeli data input menjadi

dua kategori yang dibagi dengan area seluas mungkin antar kategori [12]. Dalam Tabel 4. Kategori nominal atribut harga mobil
kasus ketika input data tidak diberi label, algoritma SVM tidak dapat diterapkan.
Dari Ke Kelas
Untuk data yang tidak berlabel perlu diterapkan metode unsupervised learning dan
0 12000 murah
SVM implementasinya disebut Support Vector Clustering (SVC) [13][14]. Algoritma

SVM dilatih untuk melabeli data input menjadi dua kategori yang dibagi dengan
12000 24000 sedang
area seluas mungkin antar kategori [12]. Dalam kasus ketika input data tidak diberi 24000 …. mahal
label, algoritma SVM tidak dapat diterapkan. Untuk data yang tidak berlabel perlu

diterapkan metode unsupervised learning dan SVM implementasinya disebut


Kemudian, pengklasifikasi RF diterapkan, dan hasilnya
Support Vector Clustering (SVC) [13][14]. Algoritma SVM dilatih untuk melabeli data diperoleh (Tabel 5.).
input menjadi dua kategori yang dibagi dengan area seluas mungkin antar kategori

[12]. Dalam kasus ketika input data tidak diberi label, algoritma SVM tidak dapat
Tabel 5. Hasil klasifikasi dengan RF classifier
diterapkan. Untuk data yang tidak berlabel perlu diterapkan metode unsupervised
Jenis evaluasi % dari benar
learning dan SVM implementasinya disebut Support Vector Clustering (SVC) [13] rahasia
[14].
Validasi silang
85.82
dengan 10 lipatan

persentase 90%.
Tabel 3. Hasil akurasi pendekatan classifier tunggal 88.75
membelah

Penggolong Ketepatan Kesalahan


Kedua pengklasifikasi, SVM dan ANN selanjutnya
diterapkan pada setiap kumpulan data kategori harga:
RF 41,18% 8,04%
kumpulan data mobil murah, sedang, dan mahal.

JST 42,35% 7,05%


4.1 Menerapkan klasifikasi pada dataset murah menggunakan
SVM 48,23% 10,53% algoritma SVM dan JST

Dataset murah dibagi menjadi 2 kelas nominal,


Hasil yang ditunjukkan pada Tabel 3 mengkonfirmasi bahwa
ditunjukkan pada Tabel 6.
pendekatan classifier pembelajaran mesin tunggal tidak dapat
diandalkan untuk memprediksi harga mobil. Oleh karena itu, Tabel 6. Kelas nominal dalam dataset Murah
dalam makalah ini diusulkan metode ansambel untuk prediksi
Dari Ke Kelas
harga mobil. Untuk menerapkan ansambel pengklasifikasi
0 6000 0-6000
pembelajaran mesin, atribut baru "peringkat harga" dengan nilai:
murah, sedang, dan mahal telah ditambahkan ke
6000 12000 6000-12000

116 Jurnal TEM – Volume 8 / Nomor 1 / 2019.


Jurnal TEM. Volume 8, Edisi 1, Halaman 113-118, ISSN 2217-8309, DOI: 10.18421/TEM81-16, Februari 2019.

Secara total, 230 sampel dataset Murah dimasukkan Tabel 11. Hasil akurasi SVM dan ANN pada
ke algoritma SVM dan JST. dataset Mahal
Setelah menjalankan SVM dan JST pada dataset yang Jenis evaluasi SVM JST
diberikan, diperoleh hasil sebagai berikut: Validasi silang dengan 79.72 75
10 lipatan
Tabel 7. Hasil akurasi SVM dan ANN pada dataset
Pembagian persentase 90%. 90.48 85.71
Cheap
Jenis evaluasi SVM JST
Setelah model dibangun, mereka telah dirakit menjadi
Validasi silang dengan 86.96 83.91 sistem prediksi akhir, ditunjukkan pada Gambar. 3. Untuk
10 lipatan
kasus pemisahan dataset 90%, SVM mencapai akurasi
Pembagian persentase 90%. 86.96 73.91 tertinggi dalamMurahDanMahalsubset, sementara JST
berkinerja lebih baik diSedangbagian.

4.2 Menerapkan Klasifikasi pada dataset Sedang


menggunakan algoritma SVM dan JST

Model ini dilatih lebih lanjut padaSedang Himpunan


data. Untuk tujuan ini, atributhargadiperingkat menjadi 2
kelas, ditunjukkan pada Tabel 8. Gambar 3. Model prediksi kasus split 90%.

Tabel 8. Kelas nominal pada dataset Sedang Sistem prediksi akhir telah dimasukkan ke dalam
aplikasi Java swing GUI untuk prediksi harga mobil. GUI
Dari Ke Kelas
aplikasi sederhana yang ditunjukkan pada Gambar 4
12000 15000 12.000-18.000
memungkinkan calon pembeli mobil memperkirakan harga
18000 21000 18000-24000
mobil yang diinginkan.
Model prediksi yang diusulkan telah dievaluasi pada
Setelah menerapkan algoritma Multilayer Perceptron pada dataset, subset uji dan model mencapai akurasi keseluruhan
kami mendapatkan hasil sebagai berikut. sebesar 87,38%. Ini membuktikan bahwa kombinasi
beberapa pengklasifikasi pembelajaran mesin
Tabel 9. Hasil akurasi SVM dan ANN pada dataset
memperkuat kinerja klasifikasi secara keseluruhan.
Moderate
Jenis evaluasi SVM JST
Validasi silang 78.65 76.41
dengan 10 lipatan

persentase 90%. 83.33 86.11


membelah

4.3 Menerapkan Klasifikasi pada Dataset Mahal Menggunakan


Algoritma SVM

Untuk dataset sebelumnya, model dilatih


pada dataset Mahal. Untuk itu, harga atribut
dikelompokkan menjadi 2 kelas.

Tabel 10. Kelas nominal untuk dataset Mahal Gambar 4. Antarmuka pengguna grafis dari aplikasi Java
untuk prediksi harga mobil
Dari Ke Kelas
24000 28000 24000-32000
5. Kesimpulan
32000 36000 32000-...
Prediksi harga mobil bisa menjadi tugas yang menantang
karena banyaknya atribut yang harus dipertimbangkan untuk
Algoritma SVM dan ANN selanjutnya diterapkan
prediksi yang akurat. Langkah utama dalam proses prediksi
pada dataset Mahal dan hasilnya diperoleh.
adalah pengumpulan dan pemrosesan awal data. Dalam
penelitian ini, skrip PHP dibangun untuk menormalkan,
menstandarisasi, dan membersihkan data untuk menghindari
kebisingan yang tidak perlu untuk algoritme pembelajaran
mesin.

Jurnal TEM – Volume 8 / Nomor 1 / 2019. 117


Jurnal TEM. Volume 8, Edisi 1, Halaman 113-118, ISSN 2217-8309, DOI: 10.18421/TEM81-16, Februari 2019.

Pembersihan data adalah salah satu proses yang


meningkatkan kinerja prediksi, namun tidak cukup untuk [6] Gongqi, S., Yansong, W., & Qiang, Z. (2011, Januari).
kasus kumpulan data yang kompleks seperti yang ada Model Baru Prediksi Nilai Residu Mobil Bekas
dalam penelitian ini. Menerapkan algoritma mesin tunggal
Berbasis BP Neural Network dan Nonlinear Curve
Fit. Di dalamMengukur Teknologi dan Otomasi
pada akurasi kumpulan data kurang dari 50%. Oleh karena
Mekatronika (ICMTMA), Konferensi Internasional
itu, ansambel dari beberapa algoritma pembelajaran
Ketiga 2011 tentang(Vol. 2, hlm. 682-685). IEEE.
mesin telah diusulkan dan kombinasi metode ML ini
memperoleh akurasi sebesar 92,38%. Ini adalah [7] Pudaruth, S. (2014). Memprediksi harga mobil bekas
peningkatan yang signifikan dibandingkan dengan menggunakan teknik machine learning.Int. J.Inf.
pendekatan metode pembelajaran mesin tunggal. Namun, Komputer. Technol,4(7), 753-764.
kelemahan dari sistem yang diusulkan adalah ia [8] Noor, K., & Jan, S. (2017). Sistem Prediksi Harga
menghabiskan lebih banyak sumber daya komputasi Kendaraan dengan Teknik Machine Learning.
daripada algoritma pembelajaran mesin tunggal. Jurnal Internasional Aplikasi Komputer,167(9),
Meskipun, sistem ini telah mencapai kinerja yang mencengangkan
27-31.
[9] Autopijaca BiH. (nd), dari:https:// Diperoleh
dalam masalah prediksi harga mobil, tujuan kami untuk penelitian
www.autopijaca.ba . 10, 2018]. [diakses Agustus
mendatang adalah menguji sistem ini agar berhasil bekerja dengan
berbagai kumpulan data. Kami akan memperluas data pengujian kami
[10] Weka 3 - Penambangan Data dengan Perangkat Lunak
dengan set data mobil bekas eBay [16] dan OLX [17] dan memvalidasi Pembelajaran Mesin Sumber Terbuka di Jawa. (nd), Diperoleh
pendekatan yang diusulkan. dari: https://www.cs.waikato.ac.nz/ml/weka/ .
[04 Agustus 2018].
[11] Ho, TK (1995, Agustus). Hutan keputusan acak. Di
Referensi dalamAnalisis dan pengakuan dokumen, 1995.,
[1] Agencija za statistiku BiH. (nd), diambil dari:http:// prosiding konferensi internasional ketiga tentang(
www.bhas.ba . 2018.] [diakses 18 Juli Vol. 1, hlm. 278-282). IEEE.
[12] Russell, S. (2015).Kecerdasan Buatan: Pendekatan
[2] Listiani, M. (2009).Mendukung regresi vektor Modern(edisi ke-3). PE.
analisis untuk prediksi harga pada aplikasi [13] Ben-Hur, A., Horn, D., Siegelmann, HT, & Vapnik,
leasing mobil(Disertasi doktor, tesis master, TU V.(2001). Mendukung pengelompokan vektor.Jurnal
Hamburg-Harburg). penelitian pembelajaran mesin,2(Des), 125-137.
[3] Richardson, MS (2009). Penentu nilai jual kembali [14] Aizerman, MA (1964). Landasan teori metode fungsi
mobil bekas. Diterima dari: potensial dalam pembelajaran pengenalan pola.
https://digitalcc.coloradocollege.edu/islandora/object / Otomatisasi dan kendali jarak jauh,25, 821- 837.
coccc%3A1346 [diakses: 1 Agustus 2018.]
[4] Wu, JD, Hsu, CC, & Chen, HC (2009). Sistem pakar [15] 3.2.4.3.1. sklearn.ensemble.RandomForestClassifier
peramalan harga mobil bekas menggunakan — dokumentasi scikit-learn 0.19.2. (td).
inferensi adaptif neuro-fuzzy.Sistem Pakar Diperoleh dari: http://scikit-
dengan Aplikasi,36(4), 7809-7817. learn.org/stable/modules/generated/sklearn.ensemble .
[5]Du, J., Xie, L., & Schroeder, S. (2009). Makalah Berhadiah RandomForestClassifier.html [diakses: Agustus
Praktek—PIN Optimal Distribution of Auction 30, 2018].
Vehicles System: Menerapkan Peramalan Harga, [16] Digunakan mobil basis data. (t) Diperoleh
Estimasi Elastisitas, dan Algoritma Genetika pada dari: https://www.kaggle.com/orgesleka/used-
Kendaraan Bekas Distribusi.Pemasaran carsdatabase. [diakses: 04 Juni 2018].
Sains,28(4), 637-644. [17] OLX. (nd), Diperoleh dari: https://olx.ba.
[diakses 05 Agustus 2018].

118 Jurnal TEM – Volume 8 / Nomor 1 / 2019.

Anda mungkin juga menyukai