TINJAUAN PUSTAKA
Bab ini mengenai istilah dan pengertian secara umum yang berhubungan
besar. Padahal, kedua istilah ini memiliki konsep yang berbeda, namun saling
berkaitan. Salah satu fase dari keseluruhan proses KDD adalah penambangan
dilakukan sebelum tahap ekstraksi data di KDD dimulai. Data terpilih yang
digunakan dalam proses penambangan data disimpan dalam file yang terpisah
dilakukan proses pembersihan pada data yang menjadi fokus KDD. Proses
(tipografi)
3. Transform coding adalah transformasi data terpilih agar sesuai untuk proses
data mining. Proses pengkodean KDD adalah proses kreatif dan sangat
bergantung pada jenis atau model data yang diambil dari database.
4. Data mining adalah pencarian pola atau informasi menarik dari data terpilih
algoritma data mining sangat bervariasi. Memilih metode atau algoritma yang
harus disajikan dalam bentuk yang mudah dipahami oleh pihak yang
berkepentingan. Langkah ini merupakan bagian dari proses KDD yang disebut
rendering. Pada fase ini kami memeriksa apakah formula atau informasi yang
Database
menemukan keteraturan, pola, atau hubungan dalam data dalam jumlah besar.
dan mengidentifikasi informasi yang berguna dan informasi terkait dari basis
Data mining adalah proses yang menggunakan satu atau lebih teknik
data mining. Dalam konteks ini, data mining merupakan langkah dari proses
KDD.
A evaluasi [prediktif]
B. pengelompokan [deskriptif]
D. Regresi [prediktif]
e. Deteksi anomali [audio] Karena data mining adalah proses berantai, ini
harus dilakukan proses pembersihan terhadap data yang menjadi fokus KDD.
memeriksa data yang tidak konsisten, dan memperbaiki kesalahan pada data
yaitu “pengayaan” data yang ada dengan data lain yang penting dan
database, tetapi juga dari beberapa database atau file teks. Integrasi data
Nama, jenis produk, nomor pelanggan dan lain-lain. Integrasi data harus
masa mendatang. Misalnya, jika ternyata integrasi data berbasis jenis produk
3. Pemilihan data (data selection) Karena tidak semua data dalam database
sering digunakan, hanya data yang cocok untuk analisis yang dicari dari
pelanggan saja.
bentuk yang sesuai untuk diproses dalam data mining. Beberapa metode data
beberapa metode standar, seperti analisis asosiasi, hanya dapat menerima data
input kategorikal. Oleh karena itu, data harus dibagi menjadi beberapa interval
waktu dalam bentuk angka numerik yang berurutan. Proses ini sering disebut
transformasi data.
5. proses mining adalah proses yang paling penting saat menggunakan metode
untuk menemukan informasi tersembunyi dan berharga dalam data.
ditemukan Pada langkah ini, hasil teknik data mining dievaluasi dalam bentuk
pola tipikal dan model prediksi untuk menilai apakah hipotesis yang ada
terpenuhi.
yang telah mereka terima. Langkah terakhir dalam proses data mining adalah
diperoleh. Terkadang harus ada orang yang tidak mengetahui data mining.
Oleh karena itu, menyajikan hasil data mining dalam bentuk informasi yang
dapat dipahami oleh siapa saja merupakan langkah penting dalam data
2.1.3 Klasifikasi
data mining yang paling umum digunakan dalam berbagai aplikasi. Dua jenis
data latihan dan data uji. Data pelatihan adalah data yang digunakan oleh
mengklasifikasikan data lain, yaitu data uji. Dua data artikel teks digunakan,
dibagi menjadi data pelatihan dan data uji. (Ardi Ramdani, 2022)
Dan Menurut (Setio, 2020) Klasifikasi adalah teknik data mining yang
data uji ke dalam kelompok atau kelas yang telah ditentukan sebelumnya.
algoritma yang cocok untuk klasifikasi atau prediksi. Pohon keputusan adalah
algoritma yang cocok untuk klasifikasi atau prediksi. sebuah pohon yang terdiri
dari beberapa bagian, yaitu root node, internal node, dan terminal node. Sebuah
keputusan berbentuk pohon yang terdiri dari beberapa bagian yaitu root node,
di mana setiap simpul internal mewakili atribut yang akan diuji, setiap cabang
mewakili hasil pengujian atribut, dan simpul daun mewakili kelas atau
membedakan kelas data satu sama lain untuk memprediksi data yang belum
algoritma ID3, input berupa sampel training, label training dan atribut.
antara lain bisa mengatasi missing value, bisa mengatasi continu data, dan
pruning. Sebuah objek yang diklasifikasikan dalam pohon harus dites nilai
Dari nilai Entropy tersebut kemudian dihitung nilai information gain (IG)
masing-masing atribut. Entropy (S) merupakan jumlah bit yang diperkirakan
dibutuhkan untuk dapat mengekstrak suatu kelas (+ atau -) dari sejumlah data
acak pada ruang sampel S. Entropy dapat dikatakan sebagai kebutuhan bit
untuk menyatakan suatu kelas. Semakin kecil nilai Entropy maka akan
didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada. Untuk
berikut.
|Si|
Gain ( A )=Entropi ( S )−∑ ❑i
n
x Entropi ( Si )
|S|
Di mana :
S : himpunan kasus
A : atribut
berikut.
n
Entropi ( S )=∑ −¿ pi∗log 2 pi ¿
i=1
Di mana :
S : himpunan kasus
A : fitur
N : jumlah partisi S
sebagai berikut :
d. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang
bahasa hirarki kelas Java dengan menggunakan metode berorientasi objek dan
pembelajaran mesin. Perangkat lunak ini ditulis dalam hierarki kelas Java
kode pemrograman apa pun. Banyak metode data mining yang dapat dilakukan
dengan WEKA, salah satunya adalah pohon keputusan yang populer. Pohon
keputusan adalah salah satu metode klasifikasi yang paling menarik, yang
keputusan terdiri dari simpul-simpul yang membentuk pohon berakar dan setiap
simpul memiliki input tunggal. Node keluaran disebut node uji. Node lain
disebut node keputusan atau seringkali node daun. Setiap node internal berbagi
dua atau lebih subruang sesuai dengan kelas atribut dan dibagi sesuai dengan
nilai kelas kasus. Kasus-kasus ini membentuk pohon keputusan yang mengarah
diagram alir di mana setiap simpul internal mewakili pengujian atribut, setiap
cabang mewakili hasil pengujian, dan simpul daun mewakili pohon keputusan.
dimulai dari simpul akar (titik awal) dari mana pengguna bertindak. Dari
(Pujiono., 2013)
Teori ini membahas istilah dan pengertian secara khusus berkaitan dengan
pelaksaan penelitian.
hasil yang diamati dengan harapan, sejauh mana tingkat yang dirasakan dari
produk dan jasa memenuhi harapan pelanggan atau pembeli. Jika aktivitas
pengalaman masa lalu, komentar kerabat, serta janji dan informasi dari pemasar
2.2.2 Thrift
anak muda adalah bisnis hemat. Kata hemat berasal dari kata flori yang berarti
tumbuh atau maju, sedangkan bahasa hemat berarti penggunaan uang atau
barang lain secara benar dan efisien. Menabung juga bisa diartikan sebagai
membeli barang bekas, namun kegiatan ini tidak hanya sekedar membeli barang
bekas, tetapi juga berarti kepuasan pribadi terhadap barang bagus dengan
budget lebih kecil atau dengan harga yang murah 6 Menabung juga bisa disebut
bisnis. mulai dari baju import hingga baju, topi, sepatu dan celana. Namun ia
menjual barang dengan beberapa merk ternama seperti Nike, Adidas, Dickies,
telah melarang pembelian dan penjualan pakaian bekas impor dengan berbagai
sehat. Namun kini lebih populer terutama di kalangan anak muda. Hal itu juga
bermula dari urgensi kebutuhan masyarakat yang membuat toko barang bekas
semakin populer. Minat yang kuat dari pedagang dan konsumen semakin
merasakan manfaat dari dapat mendaur ulang pakaian bekas sambil tetap
Algoritman C4.5 pada data kepuasan pelanggan Gojek yang telah dilakukan
ini dapat dikatakan baik dan berhasil, karena sudah terlihat jelas bahwa nilai
akurasi yang tinggi dan semakin meningkat sehingga dapat dikatakan akurat.
baik.
pelayanan terbaik.
algoritma C4.5
dipandang sebagai sesuatu hal yang sangat penting dan berharga karena
tujuan yang diinginkan, hal ini membuat setiap orang berlomba untuk
memperoleh informasi.
yang menarik dalam pengambilan keputusan. Selain itu, pohon keputusan yang
Penumpang Bus Rapid Transit (BRT) Trans Semarang” yang dilakukan oleh
(Febriarini & Astuti, 2019) penggunaan jenis Algoritma dari C4.5 sangat
algoritma dari C4.5 terbukti dapat membantu pihak dari restoran dalam fokus
11. Dari penelitian ”Algoritma C4.5 Untuk Mengetahui Kepuasan Jamaah Masjid
Darul Hijrah Terhadap Program Dan Fasilitas DKM” yang dilakukan oleh
(Warsino, 2018) didapatkan informasi bahwa pada saat melakukan proses dari
data mining dapat diketahui hasil yang menjelaskan mengenai perilaku dan juga
mengenai persepsi dari jamaah yang berasal dari Masjid terhadap kualitas dari
program, kualitas dari pelayanan, dan manfaat dari fasilitas serta bentuk
hasil yang baik karena dapat menghasilkan aturan pohon keputusan yang
konsumen.
Metode Algoritma C.45” yang dilakukan oleh (Indah Lestari & Defit, 2021)
nilai atau menentukan tingkat kepuasan masyarakat pada tahun 2021 secara
tepat.
2.4 Kerangka Pemikiran
Dibawah ini adalah kerangka pemikiran dari pengkajian dan juga penjelasanya.
Data pembeli yang diperoleh dari hasil data riwayat penjualan fashion
trift (pakaian bekas) dalam satu tahun di Toko Barang Bekas Svf Collection
digunakan sebagai data input dalam proses survei, dan pengolahan data
Hasil olahan diuji dengan aplikasi WEKA dan didapatkan hasil berupa skor