KASUS DATA MINING

PENERAPAN KASUS PADA DATA MINING
Pertumbuhan data yang ekplosif disimpan dalam database-database sementara yang

bersifat operasional. Dengan berjalannya waktu, database tersebut menjadi gudang data atau lebih
dikenal dengan data warehouse. Di dalam data warehouse ini tersimpan banyak sekali data yang
telah direkap setiap harinya. Melalui data-data ini lah terdapat informasi yang harus digali untuk
menunjang proses bisnis yang ada dalam menjalankan visi misi perusahaan.
Dibutuhkan suatu teknik untuk menggali informasi yang terdapat pada data warehouse
tersebut. Lahirlah data mining, yaitu suatu teknik untuk meng-ekstrasi suatu pola dari data. Data
mining diterapkan dengan paradigma untuk melihat informasi yang tersembunyi. Proses pencarian
ini dilakukan secara otomatis terhadap pola dalam data dengan jumlah besar dengan menggunakan
teknik-teknik seperti klasifikasi, clustering, dll. Data mining adalah suatu multidisiplin ilmu yang
kompleks dan beririsan dengan ilmu lain seperti statistika, database, information retrieval, machine
learning, pattern recognition, algoritma dan ilmu lainnya.
Data mining yang diartikan sebagai penggalian data merupakan suatu proses pencarian
otomatis terhadap pola dalam data yang melibatkan data dalam jumlah besar dengan menggunakan
perangkat seperti clustering, pengelompokan, dll. Data mining diterapkan dengan tujuan untuk
menemukan informasi yang “tersembunyi” didalam data, oleh sebab itu data mining juga dikenal
dengan nama Knowledge Discovery in Database (KDD)
Sebagai contoh kasus data mining yang terjadi yaitu data transaksi disebuah supermarket
dapat berjumlah ribuan dalam periode singkat dan terus bertambah. Seringkali perusahaan hanya
membiarkan data tersebut menggunung untuk laporan transaksi, tetapi dengan data mining kita
dapat menggali informasi yang sangat berharga dari data tersebut, misalnya asosiasi antar produk
yang dapat digunakan untuk menentukan tata letak produk, dapat juga digunakan untuk
menentukan daftar barang yang telah kadaluarsa.
Sebagai contoh lain kasus data mining yaitu misalnya dalam bidang pemasaran, sebelum
sebuah perusahaan mengeluarkan suatu produk baru kepasaran, perusahaan tersebut harus
memiliki informasi tentang kecenderungan pelanggan untuk membeli produk yang akan di
keluarkan. Perkiraan (hypothesis) dapat disusun untuk mengidentifikasikan pelanggan yang
potensial dan karakteristik dari pelanggan yang ada. Data-data tentang pembelian pelanggan
sebelumnya dan data tentang keadaan pelanggan, dapat digunakan untuk melakukan perbandingan
antara pembelian dan karakteristik pelanggan untuk menetapkan dan menguji target yang telah
diperkirakan sebelumnya. Dari keseluruhan operasi yang ada selanjutnya dapat dilakukan
penyaringan dengan cermat sehingga jumlah perkiraan (hypothesys) yang sebelumnya banyak
akan menjadi semakin berkurang sesuai dengan keadaan yang sebenarnya.Permasalahan utama
dengan model ini adalah tidak ada informasi baru yang dapat dibuat, melainkan hanya pembuktian
atau melemahkan perkiraan (hypothesys) dengan data-data yang ada sebelumnya. Datadata yang
ada pada model ini hanya digunakan untuk membuktikan mendukung perkiraan (hypothesis) yang
telah diambil sebelumnya. Jadi model ini sepenuhnya tergantung pada kemampuan user untuk
melakukan analisa terhadap permasalahan yang ingin digali dan diperoleh informasinya.
Pengertian, Fungsi, Proses dan Tahapan Data Mining

1. Pengertian Data Mining
Data Mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan
buatan, machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat
dan pengetahuan yang terkait dari berbagai database besar (Turban dkk. 2005). Terdapat beberapa
istilah lain yang memiliki makna sama dengan data mining, yaitu Knowledge discovery in
databases (KDD), ekstraksi pengetahuan (knowledge extraction), Analisa data/pola (data/pattern
analysis), kecerdasan bisnis (business intelligence) dan data archaeology dan data dredging
(Larose, 2005) Kemampuan Data mining untuk mencari informasi bisnis yang berharga dari basis
data yang sangat besar, dapat dianalogikan dengan penambangan logam mulia dari lahan
sumbernya, teknologi ini dipakai untuk :
1. Prediksi trend dan sifat-sifat bisnis, dimana data mining mengotomatisasi proses pencarian
informasi pemprediksi di dalam basis data yang besar.
2. Penemuan pola-pola yang tidak diketahui sebelumnya, dimana data mining menyapu basis
data, kemudian mengidentifikasi pola-pola yang sebelumnya tersembunyi dalam satu
sapuan.
3. Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi.
Berikut ini beberapa definisi data mining dari beberapa sumber (Larose, 2005):
• Data mining adalah proses menemukan sesuatu yang bermakna dari suatu korelasi baru, pola dan
tren yang ada dengan cara memilah-milah data berukuran besar yang disimpan dalam repositori,
menggunakan teknologi pengenalan pola serta teknik matematika dan statistik.
• Data mining adalah analisis pengamatan database untuk menemukan hubungan yang tidak
terduga dan untuk meringkas data dengan cara atau metode baru yang dapat dimengerti
dan bermanfaat kepada pemilik data.
• Data mining merupakan bidang ilmu interdisipliner yang menyatukan teknik pembelajaran
dari mesin (machine learning), pengenalan pola (pattern recognition), statistik, database,
dan visualisasi untuk mengatasi masalah ekstraksi informasi dari basis data yang besar.
• Data mining diartikan sebagai suatu proses ekstraksi informasi berguna dan potensial dari
sekumpulan data yang terdapat secara implisit dalam suatu basis data.
2. Fungsi Data Mining

Data mining mempunyai fungsi yang penting untuk membantu mendapatkan informasi yang
berguna serta meningkatkan pengetahuan bagi pengguna. Pada dasarnya, data mining mempunyai
empat fungsi dasar yaitu:
1. Fungsi Prediksi (prediction). Proses untuk menemukan pola dari data dengan
menggunakan beberapa variabel untuk memprediksikan variabel lain yang tidak diketahui
jenis atau nilainya.
2. Fungsi Deskripsi (description). Proses untuk menemukan suatu karakteristik penting dari
data dalam suatu basis data.
3. Fungsi Klasifikasi (classification). Klasifikasi merupakan suatu proses untuk menemukan
model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang
digunakan untuk mendeskripsikan data yang penting serta dapat meramalkan
kecenderungan data pada masa depan.
4. Fungsi Asosiasi (association). Proses ini digunakan untuk menemukan suatu hubungan
yang terdapat pada nilai atribut dari sekumpulan data.
3. Proses Data Mining Dan Metode Beserta Tekniknya

Proses yang umumnya dilakukan oleh data mining antara lain: deskripsi, prediksi, estimasi,
klasifikasi, clustering dan asosiasi. Secara rinci proses data mining dijelaskan sebagai berikut
(Larose, 2005) :
a. Deskripsi
Deskripsi bertujuan untuk mengidentifikasi pola yang muncul secara berulang pada suatu data dan
mengubah pola tersebut menjadi aturan dan kriteria yang dapat mudah dimengerti oleh para ahli
pada domain aplikasinya. Aturan yang dihasilkan harus mudah dimengerti agar dapat dengan
efektif meningkatkan tingkat pengetahuan (knowledge) pada sistem. Tugas deskriptif merupakan
tugas data mining yang sering dibutuhkan pada teknik postprocessing untuk melakukan validasi
dan menjelaskan hasil dari proses data mining. Postprocessing merupakan proses yang digunakan
untuk memastikan hanya hasil yang valid dan berguna yang dapat digunakan oleh pihak yang
berkepentingan.
b. Prediksi
Prediksi memiliki kemiripan dengan klasifikasi, akan tetapi data diklasifikasikan berdasarkan
perilaku atau nilai yang diperkirakan pada masa yang akan datang. Contoh dari tugas prediksi
misalnya untuk memprediksikan adanya pengurangan jumlah pelanggan dalam waktu dekat dan
prediksi harga saham dalam tiga bulan yang akan datang.
c. Estimasi
Estimasi hampir sama dengan prediksi, kecuali variabel target estimasi lebih ke arah numerik dari
pada ke arah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari
variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari
variabel target dibuat berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi
tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, berat
badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi
dalam proses pembelajaran akan menghasilkan model estimasi.
d. Klasifikasi
Klasifikasi merupakan proses menemukan sebuah model atau fungsi yang mendeskripsikan dan
membedakan data ke dalam kelas-kelas. Klasifikasi melibatkan proses pemeriksaan karakteristik
dari objek dan memasukkan objek ke dalam salah satu kelas yang sudah didefinisikan sebelumnya.
e. Clustering
Clustering merupakan pengelompokan data tanpa berdasarkan kelas data tertentu ke dalam kelas
objek yang sama. Sebuah kluster adalah kumpulan record yang memiliki kemiripan suatu dengan
yang lainnya dan memiliki ketidakmiripan dengan record dalam kluster lain. Tujuannya adalah
untuk menghasilkan pengelompokan objek yang mirip satu sama lain dalam kelompok-kelompok.
Semakin besar kemiripan objek dalam suatu cluster dan semakin besar perbedaan tiap cluster maka
kualitas analisis cluster semakin baik.
f. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam suatu waktu.
Dalam dunia bisnis lebih umum disebut analisis keranjang belanja (market basket analisys). Tugas
asosiasi berusaha untuk mengungkap aturan untuk mengukur hubungan antara dua atau lebih
atribut.
3.1 Atribute Importance (AI)

Attribute Importance (AI) memberi peringkat atribut dengan menghilangkan atribut yang
berulang, tidak relevan, atau tidak informatif dan mengidentifikasi atribut yang mungkin memiliki
pengaruh yang paling tinggi dalam membuat prediksi.
Gambar 2. AI menggunakan algoritma Minimum Description Length (MDL).

Algoritma MDL mempertimbangkan setiap atribut sebagai model prediktif sederhana dari
kelas target. Teknik AI digunakan untuk mengoptimalkan analisa model classification dengan
mengurangi atribut yang digunakan dan akan meningkatkan kecepatan dan akurasi saat
membangun model.
3.2. Naive Bayes Algorithm (Classification)

Classification adalah proses untuk Menemukan model Atau fungsi yang atau membedakan
konsep atau kelas data, Dengan tujuan untuk dapat memperkirakan Kelas dari Suatu objek yang
labelnya tidak Berupa aturan “jika--‐maka”. Dalam Teknik classification terdapat beberapa
Algoritma yang Bisa digunakan antara lain decision tree, Naive
bayes , adaptive naive bayes,logistic regression dan support vector machine. Bayesian
Classification didasarkan pada Teorema Bayesian. Konsep dasar teori bayes itu pada dasarnya
adalah peluang bersyarat P(H∣X). Dimana dalam Bayesian H adalah posterior dan X adalah prior.
Prior adalah pengetahuan kita tentang karakteristik suatu parameter (bisa dibaca sebagai
pengalaman di masa lalu atas suatu parameter atau juga bisa berdasarkan teori), sedangkan
posterior adalah karakteristik yang akan kita duga pada kejadian yang akan datang.
Teorema Bayesian berguna untuk melakukan kalkulasi probabilitas posterior, P(H|X), dari
P(H), P(X) dan P(X|H). Teori Bayes adalah sebagai berikut : P(H|X) =P(X|H)P(H) P(X)
Proses classification biasanya dibagi menjadi dua fase : learning dan test. Pada fase learning,
sebagian data yang telah diketahui kelas datanya diumpankan untuk membentuk model perkiraan.
Kemudian pada fase test model yang sudah terbentuk diuji dengan sebagian data lainnya untuk
mengetahui akurasi dari model tersebut. Bila akurasinya mencukupi model ini dapat dipakai untuk
prediksi kelas data yang belum diketahui. [3]
Jelaskan algoritma Classification lainnya , yaitu : decision tree, adaptive naive bayes,
logistic regression dan support vector machine. Bagaimana penerapannya dalam kasus.
3.3 Decision Tree

Decision Tree (Pohon Keputusan) adalah pohon dimana setiap cabangnyamenunjukkan
pilihan diantara sejumlah alternatif pilihan yang ada, dan setiapdaunnya menunjukkan keputusan
yang dipilih.Decision tree biasa digunakan untuk mendapatkan informasi untuk
tujuanpengambilan sebuah keputusan. Decision tree dimulai dengan sebuah root node(titik awal)
yang dipakai oleh user untuk mengambil tindakan. Dari node root ini,user memecahnya sesuai
dengan algoritma decision tree. Hasil akhirnya adalahsebuah decision tree dengan setiap
cabangnya menunjukkan kemungkinansekenario dari keputusan yang diambil serta hasilnya
Contoh Pemanfaatan Decision Tree
• Diagnosa beberapa penyakit seperti kanker, hipertensi, stroke.
• Menentukan apakah dengan kondisi yang ada layak untuk bermaintenis atau tidak
• Menentukan apakah sebuah investasi bisnis layak dilakukan atau tidak
• Pemilihan pegawai teladan sesuai dengan kriteria tertentu
• Deteksi gangguan pada komputer atau jaringan komputer
• Pemilihan produk seperti rumah, kendaraan dan lain lain
3.4 Adaptive Naive Bayes

Naive Bayes merupakan algoritma pembelajaran untuk klasifikasi dengan efisiensi
komputasi dan akurasi yang baik, khususnya untuk dimensi dan jumlah data yang besar. Akan
tetapi performa algoritma ini akan menurun ketika antar atribut tidak memiliki keterkaitan satu
sama lain. Beberapa solusi untuk menyelesaikan permasalahan ini yaitu dengan structure
extension, pemilihan atribut, pembobotan pada masing-masing atribut, instance weighting,
pembelajaran lokal, dan sebagainya. Dalam paper tersebut, penulis membahas teknik pembobotan
(Weighting) atribut pada klasifikasi Naive Bayes (NB) dengan menggunakan Artificial Immune
System (AIS), disingkat AISWNB.
Metode ini digunakan untuk menghitung bobot optimal antar atribut, yaitu penentuan bobot
secara mandiri dalam menentukan independensi atribut sehingga probabilitas masing-masing
atribut bisa ditentukan dengan lebih akurat. Keunggulan dari metode ini yaitu mampu
menyesuaikan bobot berdasarkan atribut secara mandiri karena metode ini mengadopsi cara kerja
sistem imun, yaitu melalui proses penggandaan diri, pembelahan, mutasi, dan memory. Metode
ini mampu memilih bobot yang baik selama proses pembelajaran sehingga performa Naive Bayes
dapat ditingkatkan. Penelitian dilakukan dengan membandingkan 36 jenis data pembelajaran
dalam mengklasifikasikan 6 kelompok gambar. Hasil penelitian ini yaitu performa, akurasi, dan
estimasi probabilitas Naive Bayes lebih bagus daripada metode-metode lainnya.
3.5 Logistic Regression

Regresi logistic merupakan salah satu analisi multivariate, yang berguna untuk
memprediksi dependent variabel berdasarkan variabel independen. Atau bisa juga sebagai salah
satu jenis regresi yang menghubungkan antara satu atau beberapa variabel independen (variabel
bebas) dengan variabel dependen yang berupa kategori; biasanya 0 dan 1. Jenis variabel
independen berupa kategori inilah yang membedakan regresi logistik dengan regresi berganda atau
regresi linear lainnya.
Nilai kategori biasanya tertulis 0 dan 1, saat artikel ini ditulis, kebanyakan peneliti
menggunakan regresi logistik untuk memproses 2 kategori saja. 0 biasanya digunakan untuk
kategori “tidak” atau “belum”. Sedangkan angka 1 biasanya digunakan untuk mendeskripsikan
responden yang bersesuaian dengan maksud penelitian.
Konsep Regresi logistik merupakan alternative uji jika asumsi multivariate normal
distribution pada variabel bebasnya tidak bisa terpenuhi ketika akan dilakukan analisis
diskriminan. Tidak terpenuhinya asumsi ini dikarenakan variabel bebas merupakan campuran
antara variabel kontinyu (metric) dan kategorial (non metric). Misalnya, probabilitas bahwa orang
yang menderita serangan jantung pada waktu tertentu dapat diprediksi dari informasi usia,
kebiasaan merokok, jenis kelamin, dan lainnya.
3.6 Support Vector Machine
Support Vector Machine (SVM) pertama kali diperkenalkan oleh Vapnik pada tahun 1992
sebagai rangkaian harmonis konsep-konsep unggulan dalam bidang pattern recogn ition. Sebagai
salah satu metode pattern recognition, usia SVM terbilang masih relatif muda. Walaupun demikian
, evaluasi kemampuannya dalam berbagai aplikasinya menempatkannya sebagai state of the art
dalam pattern recognition, dan dewasa ini merupakan salah satu tema yang berkembang dengan
pesat. SVM adalah metode learning machine yang bekerja atas prinsip Structural Risk
Minimization (SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan dua buah
class pada input space. Tulisan ini membahas teori dasar SVM dan aplikasinya dalam bioinf
ormatika, khususnya pada analisa ekspresi gen yang diperoleh dari analisa microarray
Sedangkan Menurut Santoso (2007) Support vector machine (SVM) adalah suatu teknik
untuk melakukan prediksi, baik dalam kasus klasifikasi maupun regresi. SVM berada dalam satu
kelas dengan Artificial Neural Network (ANN) dalam hal fungsi dan kondisi permasalahan yang
bisa diselesaikan. Keduanya masuk dalam kelas supervised learning.
Dalam penelitian ini, teknik SVM digunakan untuk menemukan fungsi pemisah(klasifier)
yang optimal yang bisa memisahkan dua set data dari dua kelas yang berbeda. Penggunaan teknik
machine learning tersebut, karena performansinya yang meyakinkan dalam memprediksi kelas
suatu data baru. Teori SVM dimulai dengan kasus klasifikasi yang secara linier bisa dipisahkan.
Dalam hal ini fungsi pemisah yang dicari adalah fungsi linier. Fungsi ini bisa didefinisikan sebagai;
g(x) := sgn(f(x)) (2.1)
dengan (2,2)
atau (2.3)
dimana x, w ∈
and b ∈
Masalah klasifikasi ini bisa dirumuskan set parameter (w, b) sehingga f(xi) =< w, x > +b =
yi untuk semua i. Teknik SVM berusaha menemukan fungsi pemisah (klasifier/hyperplane) terbaik
diantara fungsi yang tidak terbatas jumlahnya untuk memisahkan dua macam obyek. Hyperplane
terbaik adalah hyperplane yang terletak di tengah-tengah antara dua set obyek dari dua kelas.
Mencari hyperplane terbaik ekuivalen dengan memaksimalkan margin atau jarak antara dua set
obyek dari kelas yang berbeda. Jika adalah hyperplane-pendukung (supporting hyperplane) dari
kelas dan hyperplane-pendukung dari kelas
, margin antara dua kelas dapat dihitung dengan mencari jarak antara kedua hyperplane-pendukung
dari kedua kelas. Secara spesifik
4. Data Mining - Tahap Tahapan Knowladge Discovery In Database (KDD)
4.1 Knowladge Discovery In Database (KDD)
1. KDD berhubungan dengan teknik integrasi dan penemuan ilmiah, interprestasi dan
visualisasi dari pola-pola sejumlah kumpulan data.
2. Knowledge discovery in databases (KDD) adalah keseluruhan proses non-trivial untuk

mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan
bersifat sah, baru, dapat bermanfaat dan dapat dimengerti.
4.2 Tahapan Proses KDD
Tahapan yang dilakukan pada proses data mining diawali dari seleksi data dari data sumber ke
data target, tahap preprocessing untuk memperbaiki kualitas data, transformasi, data mining serta
tahap interpretasi dan evaluasi yang menghasilkan output berupa pengetahuan baru yang
diharapkan memberikan kontribusi yang lebih baik. Secara detail dijelaskan sebagai berikut
(Fayyad, 1996):
Gambar 1. Tahapan Data Mining
1. Data selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum tahap
penggalian informasi dalam KDD dimulai. Data hasil seleksi yang digunakan untuk proses data
mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
2. Pre-processing / cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada data
yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data,
memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai
untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat
tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.
4. Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan
menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining
sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan
proses KDD secara keseluruhan.
5. Interpretation / evalution
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang
mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian dari proses KDD
yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang
ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
6. Penerapan KDD pada toko swalayan

Selama ini banyak organisasi atau perusahaan-perusahan besar telah mengumpulkan data
sekian tahun lamanya (data pembelian, data penjualan, data transaksi dan sebagainya). Hampir
semua data tersebut dimasukkan dengan menggunakan aplikasi komputer untuk menangani
transaksi sehari-hari. Sebagai contoh, toko swalayan setiap hari merekam transaksi penjualan
barang, database penjualan tersebut bisa mencapai beberapa GigaByte setiap harinya untuk sebuah
toko swalayan berskala nasional.
Pertumbuhan yang pesat dari akumulasi data itu telah menciptakan kondisi yang disebut
sebagai “kebanjiran data tetapi miskin informasi” karena data yang terkumpul tidak dapat
digunakan untuk aplikasi yang berguna, tidak jarang kumpulan data tersebut dibiarkan begitu saja
seakan-akan menjadi kuburan data (data tombs). Kebutuhan akan suatu data menjadi sangat
penting untuk pengambilan keputusan yang cepat dan akurat.
Dengan kondisi seperti ini, pelaku bisnis tidak dapat memprediksi atau menebak target pasar
sehingga memungkinkan toko swalayan tersebut tidak mengalami peningkatan dalam melakukan
penjualan.
Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data
telah jauh meninggalkan kemampuan untuk menganalisis, meringkas dan mengekstraksi
“pengetahuan” dari data. Sementara para pelaku bisnis memiliki kebutuhan-kebutuhan untuk
memanfaatkan “gudang data” yang sudah dimilikinya.
Dengan melakukan tahapan-tahapan Knowledge Discovery in Database (KDD) dapat
meramalkan tren dan sifat-sifat perilaku bisnis yang sangat berguna untuk mendukung
pengambilan keputusan penting. Sebagai contoh beberapa solusi yang bisa diselesaikan
diantaranya yaitu menebak target pasar, yaitu dengan melakukan pengelompokan dari model-
model pembeli dan melakukan klasifikasi setiap pembeli dari kebiasaan membeli, dari tingkat
penghasilan dan karakteristik lainnya.
Selain itu, pelaku bisnis dapat melihat profil customer untuk mengetahui kelompok
konsumen tertentu misalnya suka membeli produk apa saja serta mengidentifikasi produk-produk
apa saja yang terbaik untuk setiap kelompok konsumen sehingga bisa menyusun faktor-faktor apa
saja yang dapat menarik konsumen baru untuk bergabung atau membeli.
Daftar Pustaka :
• Turban, E, 2005, Decision Support Systems and Intelligent Systems Edisi Bahasa Indonesia
Jilid 1. Andi: Yogyakarta.
• Larose, Daniel T. 2005. Discovering Knowledge in Data : An Introduction to Data Mining. John
Willey & Sons, Inc.
• ayyad, Usama. 1996. Advances in Knowledge Discovery and Data Mining. MIT Press.

KASUS DATA MINING

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

KASUS DATA MINING

Diunggah oleh

Hak Cipta:

Format Tersedia

PENERAPAN KASUS PADA DATA MINING

Pertumbuhan data yang ekplosif disimpan dalam database-database sementara yang

Pengertian, Fungsi, Proses dan Tahapan Data Mining

2. Fungsi Data Mining

3. Proses Data Mining Dan Metode Beserta Tekniknya

3.1 Atribute Importance (AI)

Gambar 2. AI menggunakan algoritma Minimum Description Length (MDL).

3.2. Naive Bayes Algorithm (Classification)

3.3 Decision Tree

• Diagnosa beberapa penyakit seperti kanker, hipertensi, stroke.

• Menentukan apakah sebuah investasi bisnis layak dilakukan atau tidak

• Pemilihan pegawai teladan sesuai dengan kriteria tertentu

• Deteksi gangguan pada komputer atau jaringan komputer

• Pemilihan produk seperti rumah, kendaraan dan lain lain

3.4 Adaptive Naive Bayes

3.5 Logistic Regression

3.6 Support Vector Machine

4.1 Knowladge Discovery In Database (KDD)

2. Knowledge discovery in databases (KDD) adalah keseluruhan proses non-trivial untuk

Gambar 1. Tahapan Data Mining

6. Penerapan KDD pada toko swalayan

Anda mungkin juga menyukai