Bab Ii Revisi

BAB II
TINJAUAN PUSTAKA
2.1. Teori Umum
Bab ini mengenai istilah dan pengertian secara umum yang berhubungan
dengan pelaksana penelitian.
2.1.1. Knowledge Discovery in Database (KDD)
Menurut (Marlina, 2018), istilah data mining dan Knowledge Discovery
in Database (KDD) sering digunakan secara bergantian untuk
menggambarkan proses penggalian informasi tersembunyi dalam database
besar. Padahal, kedua istilah ini memiliki konsep yang berbeda, namun saling
berkaitan. Salah satu fase dari keseluruhan proses KDD adalah penambangan
data. Proses KDD dapat digambarkan sebagai berikut:
1. Pemilihan data : Pemilihan data (seleksi) dari data operasional harus
dilakukan sebelum tahap ekstraksi data di KDD dimulai. Data terpilih yang
digunakan dalam proses penambangan data disimpan dalam file yang terpisah
dari basis data operasional.
2. Preprocessing/Cleaning : Sebelum data mining dapat dilakukan, harus
dilakukan proses pembersihan pada data yang menjadi fokus KDD. Proses
pembersihan meliputi menghapus duplikat data, memeriksa data yang tidak
konsisten dan memperbaiki kesalahan pada data seperti kesalahan cetak
(tipografi)
3. Transform coding adalah transformasi data terpilih agar sesuai untuk proses
data mining. Proses pengkodean KDD adalah proses kreatif dan sangat
bergantung pada jenis atau model data yang diambil dari database.
4. Data mining adalah pencarian pola atau informasi menarik dari data terpilih
dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau
algoritma data mining sangat bervariasi. Memilih metode atau algoritma yang
tepat sangat bergantung pada tujuan dan keseluruhan proses KDD.
5. Interpretasi/evaluasi : Model data yang dibuat oleh proses data mining
harus disajikan dalam bentuk yang mudah dipahami oleh pihak yang
berkepentingan. Langkah ini merupakan bagian dari proses KDD yang disebut
rendering. Pada fase ini kami memeriksa apakah formula atau informasi yang
ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.

Gambar 2.1 Proses Data Mining Dalam Penemuan Pengetahuan Dalam
Database
2.1.2 Data Mining
Data mining, sering disebut knowledge discovery in database (KDD),
adalah kegiatan yang mengumpulkan dan menggunakan data historis untuk
menemukan keteraturan, pola, atau hubungan dalam data dalam jumlah besar.
Database Discovery (KDD) pada dasarnya adalah proses menemukan
informasi yang berguna dari kumpulan data. A. Berstein dkk. juga
mendefinisikan database retrieval (KDD) sebagai hasil dari proses penelitian
yang mencakup berbagai prosedur algoritmik untuk memproses data,
membangun model data, dan memanipulasi model. Menurut Turban dalam
bukunya Sistem Pendukung Keputusan dan Sistem Cerdas, data mining
adalah istilah yang menggambarkan pencarian informasi dalam basis data.
Penambangan data adalah proses yang menggunakan teknik statistik,
matematika, kecerdasan buatan, dan pembelajaran mesin untuk mengekstraksi
dan mengidentifikasi informasi yang berguna dan informasi terkait dari basis
data besar (Elisa, 2018).
Data mining adalah proses yang menggunakan satu atau lebih teknik
pembelajaran komputer (pembelajaran mesin) untuk menganalisis dan
mengekstrak data (informasi) secara otomatis. Definisi lain termasuk
pembelajaran induktif, yaitu proses menciptakan definisi umum dari konsep

dengan mengamati contoh konkrit dari konsep yang dipelajari. Penemuan
Pengetahuan dalam Database (KDD) adalah penerapan metode ilmiah untuk
data mining. Dalam konteks ini, data mining merupakan langkah dari proses
KDD.
Beberapa teknik dan fungsi data mining adalah sebagai berikut:
A evaluasi [prediktif]
B. pengelompokan [deskriptif]
C. Penemuan Aturan Asosiasi [deskriptif]
D. Regresi [prediktif]
e. Deteksi anomali [audio] Karena data mining adalah proses berantai, ini
dibagi menjadi beberapa langkah. Fase-fase ini bersifat interaktif, pengguna
terlibat baik secara langsung maupun melalui perantara KDD.
Tahapan data mining dibagi menjadi enam bagian, yaitu:
1. Sanitasi Data (Data Sanitization) Sebelum data mining dapat dilakukan,
harus dilakukan proses pembersihan terhadap data yang menjadi fokus KDD.
Proses pembersihan mencakup hal-hal seperti menghapus data duplikat,
memeriksa data yang tidak konsisten, dan memperbaiki kesalahan pada data
seperti kesalahan Cetak (tipografi) Selain itu dilakukan proses pengayaan
yaitu “pengayaan” data yang ada dengan data lain yang penting dan
diperlukan untuk KDD, seperti data atau informasi eksternal.
2. Integrasi data (data integration) Integrasi data adalah penggabungan data
dari database yang berbeda ke dalam database baru. Informasi yang

dibutuhkan untuk data mining seringkali tidak hanya berasal dari satu
database, tetapi juga dari beberapa database atau file teks. Integrasi data
dilakukan untuk atribut yang mengidentifikasi entitas unik, seperti atribut
Nama, jenis produk, nomor pelanggan dan lain-lain. Integrasi data harus
dilakukan dengan hati-hati, karena kesalahan dalam integrasi data dapat
menyebabkan hasil yang tidak jelas dan bahkan menyesatkan tindakan di
masa mendatang. Misalnya, jika ternyata integrasi data berbasis jenis produk
menggabungkan produk dari kategori yang berbeda, muncul korelasi antar
produk yang sebenarnya tidak ada.
3. Pemilihan data (data selection) Karena tidak semua data dalam database
sering digunakan, hanya data yang cocok untuk analisis yang dicari dari
database. Misalnya, jika keahlian berbelanja orang sedang diperiksa, nama
pelanggan tidak boleh digunakan dalam analisis keranjang belanja, cukup ID
pelanggan saja.
4. Transformasi data (data transformation) Data diubah atau dibawa ke dalam
bentuk yang sesuai untuk diproses dalam data mining. Beberapa metode data
mining memerlukan format data tertentu sebelum dapat digunakan. Misalnya,
beberapa metode standar, seperti analisis asosiasi, hanya dapat menerima data
input kategorikal. Oleh karena itu, data harus dibagi menjadi beberapa interval
waktu dalam bentuk angka numerik yang berurutan. Proses ini sering disebut
transformasi data.
5. proses mining adalah proses yang paling penting saat menggunakan metode
untuk menemukan informasi tersembunyi dan berharga dalam data.
6. Pattern Evaluation, mengidentifikasi pola-pola menarik pada database yang
ditemukan Pada langkah ini, hasil teknik data mining dievaluasi dalam bentuk
pola tipikal dan model prediksi untuk menilai apakah hipotesis yang ada
terpenuhi.
7. Penyajian informasi (presentasi informasi), Ini adalah penyajian dan
visualisasi informasi tentang metode dimana pengguna menerima informasi
yang telah mereka terima. Langkah terakhir dalam proses data mining adalah
bagaimana merumuskan keputusan atau tindakan dari hasil analisis yang
diperoleh. Terkadang harus ada orang yang tidak mengetahui data mining.
Oleh karena itu, menyajikan hasil data mining dalam bentuk informasi yang
dapat dipahami oleh siapa saja merupakan langkah penting dalam data
mining. Dalam representasi ini, visualisasi juga dapat membantu dalam
mengkomunikasikan hasil data mining (Eska, 2016).
2.1.3 Klasifikasi
Klasifikasi adalah teknik klasifikasi yang merupakan salah satu teknik
data mining yang paling umum digunakan dalam berbagai aplikasi. Dua jenis
informasi diperlukan untuk proses klasifikasi:
data latihan dan data uji. Data pelatihan adalah data yang digunakan oleh
algoritma data mining untuk mempelajari metrik klasifikasi untuk
mengklasifikasikan data lain, yaitu data uji. Dua data artikel teks digunakan,
dibagi menjadi data pelatihan dan data uji. (Ardi Ramdani, 2022)
Dan Menurut (Setio, 2020) Klasifikasi adalah teknik data mining yang
mengklasifikasikan data ke dalam kelompok atau kategori yang telah
ditentukan. Klasifikasi adalah teknik pembelajaran terawasi yang
membutuhkan data pelatihan berlabel untuk membuat aturan yang membagi
data uji ke dalam kelompok atau kelas yang telah ditentukan sebelumnya.
Teknik klasifikasi yang digunakan meliputi pohon keputusan, pengklasifikasi
berbasis aturan, jaringan saraf, mesin pendukung, dan pengklasifikasi naif
Bayesian. Setiap teknik menggunakan algoritme pembelajaran untuk
mengidentifikasi model yang menyediakan hubungan paling tepat antara
atribut dan pengidentifikasi kelas dari data input.
2.1.4 Pohon keputusan (Decision tree)
Menurut (Tangkelayuk, 2022), pohon keputusan merupakan algoritma
yang banyak digunakan untuk pengambilan keputusan. Pohon keputusan adalah
algoritma yang cocok untuk klasifikasi atau prediksi. Pohon keputusan adalah
algoritma yang cocok untuk klasifikasi atau prediksi. sebuah pohon yang terdiri
dari beberapa bagian, yaitu root node, internal node, dan terminal node. Sebuah
pohon keputusan terdiri dari simpul-simpul keputusan yang dihubungkan oleh
cabang-cabang dari simpul akar ke simpul daun (akhir). Model pohon
keputusan berbentuk pohon yang terdiri dari beberapa bagian yaitu root node,
internal node, dan terminal node.

Pohon keputusan adalah bagan alur yang mirip dengan struktur pohon,
di mana setiap simpul internal mewakili atribut yang akan diuji, setiap cabang
mewakili hasil pengujian atribut, dan simpul daun mewakili kelas atau
distribusi kelas tertentu. Istilah pohon keputusan mengacu pada proses
menemukan kumpulan pola atau fungsi yang menggambarkan dan
membedakan kelas data satu sama lain untuk memprediksi data yang belum
memiliki kelas data tertentu (eka satria, 2020).
2.1.5 Algoritma C4.5
Algoritma C4.5 yaitu sebuah algoritma yang digunakan untuk
membangun decision tree (pengambilan keputusan). Algoritma C.45 adalah
salah satu algoritma induksi pohon keputusan yaitu ID3 (Iterative
Dichotomiser 3). ID3 dikembangkan oleh J. Ross Quinlan. Dalam prosedur
algoritma ID3, input berupa sampel training, label training dan atribut.
Algoritma C4.5 merupakan pengembangan dari ID3.
Beberapa pengembangan yang dilakukan pada C4.5 adalah sebagai
antara lain bisa mengatasi missing value, bisa mengatasi continu data, dan
pruning. Sebuah objek yang diklasifikasikan dalam pohon harus dites nilai
Entropy-nya. Entropy adalah ukuran dari teori informasi yang dapat
mengetahui karakteristik dari impuryt dan homogenity dari kumpulan data.
Dari nilai Entropy tersebut kemudian dihitung nilai information gain (IG)
masing-masing atribut. Entropy (S) merupakan jumlah bit yang diperkirakan
dibutuhkan untuk dapat mengekstrak suatu kelas (+ atau -) dari sejumlah data
acak pada ruang sampel S. Entropy dapat dikatakan sebagai kebutuhan bit
untuk menyatakan suatu kelas. Semakin kecil nilai Entropy maka akan
semakin Entropy digunakan dalam mengekstrak suatu kelas. Entropy
digunakan untuk mengukur ketidak aslian S. Untuk memilih atribut akar,
didasarkan pada nilai gain tertinggi dari atribut-atribut yang ada. Untuk
menghitung gain digunakan rumus seperti yang tertera dalam persamaan
berikut.
|Si|
Gain ( A )=Entropi ( S )−∑ ❑i
n
x Entropi ( Si )
|S|
Rumus 2.1 Perhitungan Gain
Di mana :
S : himpunan kasus
A : atribut
N : jumlah partisi atribut A
|Si| : jumlah kasus pada partisi ke-i
|S| : jumlah kasus dalam S
Sementara itu, perhitungan nilai entropi dapat dilihat pada persamaan 2
berikut.
n
Entropi ( S )=∑ −¿ pi∗log 2 pi ¿
i=1
Rumus 2.2 Rumus Entropy
Di mana :
S : himpunan kasus
A : fitur
N : jumlah partisi S
pi : proporsi dari Si terhadap S
Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah
sebagai berikut :
a. Pilih atribut sebagai akar.
b. Buat cabang untuk tiap-tiap nilai.
c. Bagi kasus dalam cabang.
d. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang
memiliki kelas yang sama.(Elisa, 2018)
2.1.6 WEKA (Waikato Environment for Knowledge Analysis)
Weka Serangkaian alat pembelajaran mesin praktis WEKA adalah
aplikasi yang diproduksi oleh University of Waikato di Selandia Baru. Untuk
penelitian, pembelajaran dan kebutuhan aplikasi lainnya. WEKA dapat
memecahkan masalah data mining di dunia nyata. Khususnya dalam klasifikasi

berdasarkan penerapan machine learning. Perangkat lunak ini dibuat dengan
bahasa hirarki kelas Java dengan menggunakan metode berorientasi objek dan
dapat berjalan di semua platform (Saputra, 2023).
WEKA adalah seperangkat alat pembelajaran mesin yang praktis.
WEKA adalah singkatan dari Waikato Environment for Knowledge Analysis,
yang dibuat di Universitas Waikato di Selandia Baru untuk penelitian,
pendidikan, dan berbagai aplikasi. WEKA dapat memecahkan masalah
penambangan data dunia nyata, terutama klasifikasi yang mendasari pendekatan
pembelajaran mesin. Perangkat lunak ini ditulis dalam hierarki kelas Java
dengan metode berorientasi objek dan bekerja di hampir semua platform
WEKA mudah digunakan dan di implementasikan di berbagai tingkatan. Ada
algoritma pembelajaran canggih yang dapat diterapkan ke kumpulan data dari
baris perintah. WEKA mencakup alat untuk pemrosesan data, klasifikasi,
regresi, pengelompokan, aturan asosiasi, dan visualisasi. Pengguna dapat
melakukan praproses data, memasukkannya ke dalam model pembelajaran, dan
menganalisis pengklasifikasi yang dihasilkan dan kinerjanya tanpa menulis
kode pemrograman apa pun. Banyak metode data mining yang dapat dilakukan
dengan WEKA, salah satunya adalah pohon keputusan yang populer. Pohon
keputusan adalah salah satu metode klasifikasi yang paling menarik, yang
melibatkan pembuatan pohon keputusan yang terdiri dari simpul-simpul akar
yang dihubungkan oleh cabang-cabang dari simpul akar ke simpul daun
(kepala). Di simpul keputusan, atribut diuji dan setiap hasil mengarah ke

cabang. Setiap cabang diarahkan ke simpul lain atau simpul akhir untuk
pengambilan keputusan. Menurut Maimon dan Rokach, pohon keputusan
adalah metode klasifikasi yang dinyatakan sebagai partisi rekursif. Pohon
keputusan terdiri dari simpul-simpul yang membentuk pohon berakar dan setiap
simpul memiliki input tunggal. Node keluaran disebut node uji. Node lain
disebut node keputusan atau seringkali node daun. Setiap node internal berbagi
dua atau lebih subruang sesuai dengan kelas atribut dan dibagi sesuai dengan
nilai kelas kasus. Kasus-kasus ini membentuk pohon keputusan yang mengarah
pada pemecahan masalah. Pohon keputusan adalah struktur pohon seperti
diagram alir di mana setiap simpul internal mewakili pengujian atribut, setiap
cabang mewakili hasil pengujian, dan simpul daun mewakili pohon keputusan.
untuk mendapatkan informasi untuk pengambilan keputusan. Pohon keputusan
dimulai dari simpul akar (titik awal) dari mana pengguna bertindak. Dari
simpul akar ini, pengguna memecahkan pohon keputusan sesuai dengan
algoritme. Hasil akhirnya berupa pohon keputusan, dimana setiap cabang
menunjukkan kemungkinan skenario dari keputusan dan hasil yang dibuat
(Pujiono., 2013)
2.2 Teori Khusus
Teori ini membahas istilah dan pengertian secara khusus berkaitan dengan
pelaksaan penelitian.
2.2.1 Kepuasan Pelanggan

Kepuasan adalah tingkat perasaan setelah membandingkan kinerja atau
hasil yang diamati dengan harapan, sejauh mana tingkat yang dirasakan dari
produk dan jasa memenuhi harapan pelanggan atau pembeli. Jika aktivitas
menjelaskan bahwa kualitas layanan adalah kesesuaian dan kemampuan untuk
menggunakan karakteristik umum produk dan layanan yang ditawarkan untuk
memenuhi kebutuhan dan harapan yang diinginkan konsumen dengan
karakteristik atau faktor seperti: tampilan langsung, perhatian pribadi karyawan
kepada konsumen, daya tanggap, kehandalan dan jaminan Jika kinerja
memenuhi harapan, pelanggan puas. Harapan pelanggan dapat dibentuk oleh
pengalaman masa lalu, komentar kerabat, serta janji dan informasi dari pemasar
dan pesaing (Riyani, 2021).
Konsumen yang puas memiliki kehandalan yang tinggi dan tidak
berpindah ke tempat lain, bahkan ikut mempromosikan tempat ini kepada
kerabat atau teman, calon konsumen lainnya. Kepercayaan adalah harapan
seseorang bahwa ia dapat mempercayai bahasa seseorang (Elisa, 2018).
2.2.2 Thrift
Salah satu bisnis yang paling aktif di masyarakat, terutama di kalangan
anak muda adalah bisnis hemat. Kata hemat berasal dari kata flori yang berarti
tumbuh atau maju, sedangkan bahasa hemat berarti penggunaan uang atau
barang lain secara benar dan efisien. Menabung juga bisa diartikan sebagai
membeli barang bekas, namun kegiatan ini tidak hanya sekedar membeli barang
bekas, tetapi juga berarti kepuasan pribadi terhadap barang bagus dengan
budget lebih kecil atau dengan harga yang murah 6 Menabung juga bisa disebut
bisnis. mulai dari baju import hingga baju, topi, sepatu dan celana. Namun ia
menjual barang dengan beberapa merk ternama seperti Nike, Adidas, Dickies,
dll. Meski dalam beberapa tahun terakhir menjadi pemberitaan, pemerintah
telah melarang pembelian dan penjualan pakaian bekas impor dengan berbagai
alasan, salah satunya adalah kepedulian pemerintah terhadap penampilan yang
sehat. Namun kini lebih populer terutama di kalangan anak muda. Hal itu juga
bermula dari urgensi kebutuhan masyarakat yang membuat toko barang bekas
semakin populer. Minat yang kuat dari pedagang dan konsumen semakin
meningkatkan bisnis pakaian bekas karena masyarakat setempat dapat
merasakan manfaat dari dapat mendaur ulang pakaian bekas sambil tetap
memiliki nilai jual kembali yang baik (Richard Oliver, 2021).
2.3 Penelitian Terdahulu
Peneliti juga menemukan beberapa hasil penelitian terdahulu yang berkaitan
dengan menganalisa menggunakan algoritma C4.5 yang dirangkum yaitu :
1. Dari penelitian ”Implementasi data mining menggunakan algoritma C.45
untuk memprediksi kepuasan pelanggan” yang dilakukan oleh
(Nugraha.,2020) Didapatkan informasi Berdasarkan hasil analisis cara
menerapakan algoritma C4.5 pada data kepuasan pelanggan Gojek adalah
dengan menggunakan Aplikasi Rapid Minner sehingga mendapatkan pohon

keputsan dari data pelanggan Gojek. Hasil dari percobaan penerapan
Algoritman C4.5 pada data kepuasan pelanggan Gojek yang telah dilakukan
penulis sebanyak 3 kali, maka dapat di ketauhi bahwa percobaan 1, 2, dan 3
ini dapat dikatakan baik dan berhasil, karena sudah terlihat jelas bahwa nilai
akurasi yang tinggi dan semakin meningkat sehingga dapat dikatakan akurat.
Algoritma C4.5 pada kepuasan pelanggan Gojek dapat diterapkan dengan
baik.
2. Dari penelitian “Analisa Tingkat Kepuasan Masyarakat Terhadap Pelayanan
Pengadilan Agama Pematangsiantar Menggunakan Algoritma C4.5” yang
dilakukan oleh (Pribadi., 2020) didapatkan informasi bahwa menggunakan
Algoritma C.45 metode ini membuat klasifikasi lebih sederhana,mudah dan
juga tingkat akurasi yang tinggi.penelitian ini dapat memberikan informasi
kepada Pengadilan Agama Pematangsiantar dalam mengevaluasi kebijakan
dan pelayanan. Penelitian ini juga diharapkan dapat memberikan masukan
kepada pihak Pengadilan Agama Pematangsiantar dalam melakukan
pelayanan terbaik.
3. Dari penelitian “Index Kepuasan Pelanggan Informa dengan Menggunakan
Algoritma C.45 Amanda” yang dilakukan oleh (Febriyani, Prayoga
Nurdiawan, 2021) didapatkan informasi bahwa bahwa dengan penggunaan
jenis algoritma C4.5 terbukti mengevaluasi kepuasan pelayanan, artinya
pelayanan sebagai kunci keberhasilan Karena jika tidak demikian, maka
perusahaan akan ditinggal oleh pelangganny.

4. Dari penelitian “Prediksi Tingkat Kepuasan Pelayanan Online Menggunakan
Metode Algoritma C.45” yang dilakukan oleh(Indah Lestari Defit, 2021)
didapatkan informasi bahwa untuk mengetahui tingkat kepuasan pada kantor
Dinas Kependudukan dan Pencatatan Sipil Kota Padang. Metode yang
digunakan pada penelitian ini yaitu metode prediksi dengan menggunakan
algoritma C4.5
5. Dari penelitian “Prediksi Profit Pada Perusahaan Dengan Klasifikasi
Algoritma C4.5” yang dilakukan oleh(Elisa, 2018) didapatkan informasi
bahwa dengan algoritma C4.5 mengolah data-data dari rencana anggaran
biaya konsultan perencana untuk memprediksi profit perusahaan. Data
mining merupakan sebuah teknik untuk menggali informasi baru dari
tumpukan atau gudang data, sebagaimana yang kita ketahui informasi
dipandang sebagai sesuatu hal yang sangat penting dan berharga karena
dengan menguasai informasi maka dengan mudah untuk mencapai sebuah
tujuan yang diinginkan, hal ini membuat setiap orang berlomba untuk
memperoleh informasi.
6. Dari penelitian “Penerapan Data Mining Algoritma C4.5 untuk Mengetahui
Tingkat Kepuasan Konsumen di Hotel Grand Zuri Dumai ” yang dilakukan
oleh (Desyanti, 2018) didapatkan informasi bahwa Menggunakan Algoritma
C45 untuk menilai kepuasan pelayanan konsumen terhadap pelayanan di
Hotel Grand Zuri Dumai.Setelah dilakukan penelitian diperoleh hasil Jika

Pelayanan sangat puas, keramahan sangat ramah, kenyamanan nyaman lalu
fasilitas puas maka konsumen sangat puas.
7. Dari penelitian “Penerapan Algoritma C.45 Untuk Menentukan Tingkat
Kepuasan Pelanggan Kartu Telkomsel Prabayar” yang dilakukan oleh
(Sikumbang, 2022) didapatkan informasi bahwa menerapkan metode
Algoritma C.45 dalam memutuskan kepuasan pelanggan terhadap
penggunaan kartu Telkomsel prabayar.
8. Dari penelitian ”Data Mining Menggunakan Algoritma C4.5 Untuk
Memprediksi Kepuasan Mahasiswa Terhadap Kinerja Dosen Di Kota Batam
yang dilakukan(Yulia anggia, 2019) didapatkan informasi bahwa data mining
dengan menggunakan algoritma C4.5 dapat digunakan untuk melakukan
klasifikasi terhadap data dan pencarian pola sehingga menghasilkan informasi
yang menarik dalam pengambilan keputusan. Selain itu, pohon keputusan yang
didapatkan melalui perhitungan manual algoritma C4.5 memiliki hasil yang
sama dengan pohon keputusan yang dihasilkan aplikasi WEKA dengan
persentase akurasi sebesar 94,12 persen.
9. Dari penelitian “Penerapan Algoritma C4.5 untuk Prediksi Kepuasan
Penumpang Bus Rapid Transit (BRT) Trans Semarang” yang dilakukan oleh
(Febriarini & Astuti, 2019) penggunaan jenis Algoritma dari C4.5 sangat
bermanfaat saat peneliti ingin melakukan proses klasifikasi atau
pengelompokkan data dengan jumlah yang sangat banyak dan dapat
mengasilkan nilai yang akurat.

10. Dari penelitian “Penerapan Data Mining Untuk Menganalisis Kepuasan
Konsumen Menggunakan Metode Algoritma C4.5” yang dilakukan oleh
(Takalapeta, 2018) didapatkan informasi bahwa dengan penggunaan jenis
algoritma dari C4.5 terbukti dapat membantu pihak dari restoran dalam fokus
peningkatan pelayanan terhadap konsumen dan memberikan masukan informasi
yang penting dalam menetapkan kebijakan.
11. Dari penelitian ”Algoritma C4.5 Untuk Mengetahui Kepuasan Jamaah Masjid
Darul Hijrah Terhadap Program Dan Fasilitas DKM” yang dilakukan oleh
(Warsino, 2018) didapatkan informasi bahwa pada saat melakukan proses dari
data mining dapat diketahui hasil yang menjelaskan mengenai perilaku dan juga
mengenai persepsi dari jamaah yang berasal dari Masjid terhadap kualitas dari
program, kualitas dari pelayanan, dan manfaat dari fasilitas serta bentuk
hubungan dari setiap jamaan yang terdapat dalam Masjid.
12. Dari Penelitian dengan judul “Klasifikasi Data Minning Menggunakan
Algoritma C4.5 Terhadap Kepuasan Pelanggan Sewa Kamera Cikarang” yang
dilakukan (Faisal, 2019) menunjukkan bahwa penggunaan algoritma C4.5 pada
data mining memudahkan peneliti dalam memperoleh informasi mengenai
kepuasan pelanggan dan menghasilkan akurasi tinggi yang mencapai 95 persen.
13. Dari Penelitian dengan judul “Analisis Kepuasan Konsumen Terhadap
Pelayanan Bengkel Menggunakan Metode Algoritma C4.5” yang dilakukan
oleh (Alawiah,2021)menyatakan bahwa Algoritma C4.5 terbukti dapat

dipergunakan untuk klasifikasi kepuasan konsumen pada bengkel Zul Keluarga
Jaya Pematang siantar dengan tingkat akurasi sebesar 94 persen.
14. Dari Penelitian dengan judul “Analisa Kepuasan Konsumen Menggunakan
Algoritma C4.5” yang dilakukan(Azwanti & Elisa, 2020) menyatakan bahwa
algoritma C4.5 merupakan algoritma data mining yang mampu memberikan
hasil yang baik karena dapat menghasilkan aturan pohon keputusan yang
mudah dipahami serta memiliki fungsi dalam menganalisis kepuasan
konsumen.
15. Dari penelitian “Prediksi Tingkat Kepuasan Pelayanan Online Menggunakan
Metode Algoritma C.45” yang dilakukan oleh (Indah Lestari & Defit, 2021)
didapatkan informasi bahwa dengan algoritma C4.5 dapat memprediksi suatu
nilai atau menentukan tingkat kepuasan masyarakat pada tahun 2021 secara
tepat.
2.4 Kerangka Pemikiran
Dibawah ini adalah kerangka pemikiran dari pengkajian dan juga penjelasanya.
Gambar 2.2 Kerangka Pemikiran
Data pembeli yang diperoleh dari hasil data riwayat penjualan fashion
trift (pakaian bekas) dalam satu tahun di Toko Barang Bekas Svf Collection
digunakan sebagai data input dalam proses survei, dan pengolahan data
dilakukan melalui metode algoritma C4.5 dengan metode algoritma C4.5
Hasil olahan diuji dengan aplikasi WEKA dan didapatkan hasil berupa skor
kepuasan pelanggan penjualan fashion bekas di Svf Collection Thrift .

Bab Ii Revisi

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab Ii Revisi

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB II

2.1. Teori Umum

dengan pelaksana penelitian.

2.1.1. Knowledge Discovery in Database (KDD)

Menurut (Marlina, 2018), istilah data mining dan Knowledge Discovery

in Database (KDD) sering digunakan secara bergantian untuk

menggambarkan proses penggalian informasi tersembunyi dalam database

data. Proses KDD dapat digambarkan sebagai berikut:

1. Pemilihan data : Pemilihan data (seleksi) dari data operasional harus

dari basis data operasional.

2. Preprocessing/Cleaning : Sebelum data mining dapat dilakukan, harus

pembersihan meliputi menghapus duplikat data, memeriksa data yang tidak

konsisten dan memperbaiki kesalahan pada data seperti kesalahan cetak

dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau

tepat sangat bergantung pada tujuan dan keseluruhan proses KDD.

5. Interpretasi/evaluasi : Model data yang dibuat oleh proses data mining

ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.

2.1.2 Data Mining

Data mining, sering disebut knowledge discovery in database (KDD),

adalah kegiatan yang mengumpulkan dan menggunakan data historis untuk

Database Discovery (KDD) pada dasarnya adalah proses menemukan

informasi yang berguna dari kumpulan data. A. Berstein dkk. juga

mendefinisikan database retrieval (KDD) sebagai hasil dari proses penelitian

yang mencakup berbagai prosedur algoritmik untuk memproses data,

membangun model data, dan memanipulasi model. Menurut Turban dalam

bukunya Sistem Pendukung Keputusan dan Sistem Cerdas, data mining

adalah istilah yang menggambarkan pencarian informasi dalam basis data.

Penambangan data adalah proses yang menggunakan teknik statistik,

matematika, kecerdasan buatan, dan pembelajaran mesin untuk mengekstraksi

data besar (Elisa, 2018).

pembelajaran komputer (pembelajaran mesin) untuk menganalisis dan

mengekstrak data (informasi) secara otomatis. Definisi lain termasuk

pembelajaran induktif, yaitu proses menciptakan definisi umum dari konsep

Pengetahuan dalam Database (KDD) adalah penerapan metode ilmiah untuk

Beberapa teknik dan fungsi data mining adalah sebagai berikut:

C. Penemuan Aturan Asosiasi [deskriptif]

dibagi menjadi beberapa langkah. Fase-fase ini bersifat interaktif, pengguna

terlibat baik secara langsung maupun melalui perantara KDD.

Tahapan data mining dibagi menjadi enam bagian, yaitu:

1. Sanitasi Data (Data Sanitization) Sebelum data mining dapat dilakukan,

Proses pembersihan mencakup hal-hal seperti menghapus data duplikat,

seperti kesalahan Cetak (tipografi) Selain itu dilakukan proses pengayaan

diperlukan untuk KDD, seperti data atau informasi eksternal.

2. Integrasi data (data integration) Integrasi data adalah penggabungan data

dari database yang berbeda ke dalam database baru. Informasi yang

dilakukan untuk atribut yang mengidentifikasi entitas unik, seperti atribut

dilakukan dengan hati-hati, karena kesalahan dalam integrasi data dapat

menyebabkan hasil yang tidak jelas dan bahkan menyesatkan tindakan di

menggabungkan produk dari kategori yang berbeda, muncul korelasi antar

produk yang sebenarnya tidak ada.

database. Misalnya, jika keahlian berbelanja orang sedang diperiksa, nama

pelanggan tidak boleh digunakan dalam analisis keranjang belanja, cukup ID

4. Transformasi data (data transformation) Data diubah atau dibawa ke dalam

mining memerlukan format data tertentu sebelum dapat digunakan. Misalnya,

6. Pattern Evaluation, mengidentifikasi pola-pola menarik pada database yang

7. Penyajian informasi (presentasi informasi), Ini adalah penyajian dan

visualisasi informasi tentang metode dimana pengguna menerima informasi

bagaimana merumuskan keputusan atau tindakan dari hasil analisis yang

mining. Dalam representasi ini, visualisasi juga dapat membantu dalam

mengkomunikasikan hasil data mining (Eska, 2016).

Klasifikasi adalah teknik klasifikasi yang merupakan salah satu teknik

informasi diperlukan untuk proses klasifikasi:

algoritma data mining untuk mempelajari metrik klasifikasi untuk