ISSN 2339-210X
ABSTRAK
PT Suriatama Mahkota Kencana merupakan perusahaan besar yang bergerak di bidang retail, salah satu aset utama yang
dimilikiadalah banyaknya data yang tersimpan kerena terlalu bayanaknya data sebagian barang sering terjadi kelebihan dan
kekurangan stok, salah satunya underwear jika perusahaan memilikijumlah barang yang lebih banyak dibandingkan dengan
jumlahpermintaan, maka dapat mengakibatkan kerugian biaya karena barang tersebut tidak terjual.Data maining adalah proses
yang mempekerjakan satu atau lebih teknik pembelajaran komputer ( machine learnig) untuk menganalisis dan mengetahui
pengeathuan( knowladge) secara otomatis. Data maining berisi pencarian trendatau pola yang dinginkan dalam basis data besar
untuk membantu pengambilankeputusan diwaktu yang akan datang. Market base analysis adalah suatu metodeyang dapat
membantu dalam mining data yang melakukan analisis terhadap prilaku konsumen secara spesifik dari suatu
golongan/kelompok tertentu.Hasil pda penggunaan metode ini adalah memenuhi data-data yang kosong dan memaksimalkan
data-data yang berlebihan agar tidak terjadi barang yang berlebihan stok maupun kekurangan stok.
learnng) adalah proses pembentukan defenisi- berbeda maka akan didapatkan korelasi antar
defenisi konsep umum yang dilakukan dengan cara produk yang sebenarnya tidak ada.
mengobservasi contoh-contoh spesifik dari konsep- 3. Seleksi Data (Data Selection)
konsep yang akan dipelajari. Knowledge Discovery in Data yang ada pada database sering kali tidak
data mining merupakan satu langkah dari proses semuanya dipakai, oleh karena itu hanya data
KDD. yang sesuai untuk dianalisis yang akan diambil
Data mining merupakan proses iteratif dan dari database. Sebagai contoh, sebuah kasus yang
interaktif untuk menemukan pola atau model baru meneliti faktor kecenderungan orang membeli
yang sahih (sempurna), bermanfaat dan dapat dalam kasus market basket analysis, tidak perlu
dimengerti dalam satu databaseyang sangat besar mengambil nama pelanggan, cukup dengan id
(massive database). Data miningberisi pencarian pelanggan saja.
trend atau pola yang diinginkan dalam databasebesar 4. Transformasi data (Data Transformation)
untuk membantu pengambilan keputusan diwaktu Data diubah atau digabung ke dalam format yang
yang akan datang. Pola-pola ini dikenali oleh sesuai untuk diproses dalam data mining.
perangkat tertentu yang dapat memberikan suatu Beberapa metode data mining membutuhkan
analisa data yang berguna dan berwawasan yang format data yang khusus sebelum bisa
kemudian dapat dipelajari dengan lebih teliti, yang diaplikasikan. Sebagai contoh beberapa metode
mungkin saja menggunakan perangkat pendukung standar seperti analisis asosiasi dan clustering
keputusan yang lainnya (Fajar Astuti hermawati, hanya bisa menerima input data kategorikal.
2013). Karenanya data berupa angka numerik yang
Tahapan Data Mining dalam aplikasinya, data berlanjut perlu dibagi-bagi menjadi beberapa
mining sebenarnya merupakan bagian dari interval. Proses ini sering disebut transformasi
Knowledge Discovery in Database (KDD), bukan data.
sebagai teknologi yang utuh berdiri sendiri. Data 5. Proses mining,
mining merupakan suatu bagian langkah yang penting Merupakan suatu proses utama saat metode
dalam KDD terutama berkaitan dengan ekstraksi dan diterapkan untuk menemukan pengetahuan
perhitungan pola-pola dari data yang ditelaah. berharga dan tersembunyi dari data.
1. Pembersihan data (data cleaning) 6. Evaluasi pola (pattern evaluation),
Pembersihan data merupakan proses Untuk mengidentifikasi pola-pola menarik
menghilangkan noise dan data yang tidak kedalam knowledge based yang ditemukan.
konsisten atau data tidak relevan. Pada umumnya Dalam tahap ini hasil dari teknik data mining
data yang diperoleh, baik dari database suatu berupa pola-pola yang khas maupun model
perusahaan maupun hasil eksperimen, memiliki prediksi dievaluasi untuk menilai apakah hipotesa
isian-isian yang tidak sempurna seperti data yang yang ada memang tercapai. Bila ternyata hasil
hilang, data yang tidak valid atau juga hanya yang diperoleh tidak sesuai hipotesa ada beberapa
sekedar salah ketik. Selain itu, ada juga atribut- alternatif yang dapat diambil seperti
atribut data yang tidak relevan dengan hipotesa menjadikannya umpan balik untuk memperbaiki
data mining yang dimiliki. Data-data yang tidak proses data mining, mencoba metode data mining
relevan itu juga lebih baik dibuang. Pembersihan lain yang lebih sesuai, atau menerima hasil ini
data juga akan mempengaruhi performasi dari sebagai suatu hasil yang di luar dugaan yang
teknik data mining karena data yang ditangani mungkin bermanfaat.
akan berkurang jumlah dan kompleksitasnya. 7. Presentasi pengetahuan (knowledge presentation)
2. Integrasi data (data integration) Merupakan visualisasi dan penyajian
Integrasi data merupakan penggabungan data dari pengetahuan mengenai metode yang digunakan
berbagai database ke dalam satu database baru. untuk memperoleh pengetahuan yang diperoleh
Tidak jarang data yang diperlukan untuk data pengguna. Tahap terakhir dari proses data mining
mining tidak hanya berasal dari satu database adalah bagaimana memformulasikan keputusan
tetapi juga berasal dari beberapa database atau file atau aksi dari hasil analisis yang didapat. Ada
teks. Integrasi data dilakukan pada atribut-aribut kalanya hal ini harus melibatkan orang-orang
yang mengidentifikasikan entitas-entitas yang yang tidak memahami data mining. Karenanya
unik seperti atribut nama, jenis produk, nomor presentasi hasil data mining dalam bentuk
pelanggan dan lainnya. Integrasi data perlu pengetahuan yang bisa dipahami semua orang
dilakukan secara cermat karena kesalahan pada adalah satu tahapan yang diperlukan dalam proses
integrasi data bisa menghasilkan hasil yang data mining. Dalam presentasi ini, visualisasi juga
menyimpang dan bahkan menyesatkan bisa membantu mengkomunikasikan hasil data
pengambilan aksi nantinya. Sebagai contoh bila mining.
integrasi data berdasarkan jenis produk ternyata
menggabungkan produk dari kategori yang
72
Majalah Ilmiah INTI, Volume 5, Nomor 1, Oktober 2017
ISSN 2339-210X