NIM : 20200801433
==============================================================================
1. Knowledge Discovery in Database Process (KDD) adalah salah satu metode yang bisa
digunakan dalam melakukan data mining. Fayyed et al. (1996) mendefinisikan KDD
sebagai proses dari menggunakan metode data mining untuk mencari informasi-
informasi yang berharga, pola yang ada di dalam data, yang melibatkan algoritma untuk
mengidentifikasi pola pada data. Dunham (2003) meringkas proses KDD dari berbagai
step, yaitu: seleksi data, pra-proses data, transformasi data, data mining, dan yang
terakhir interpretasi dan evaluasi.
1. Data Cleansing, Proses dimana data diolah lalu dipilih data yang dianggap bisa
dipakai.
2. Data Integration, Proses menggabungkan data yang dianggap berulang akan
digabungkan menjadi satu.
3. Selection, Proses seleksi atau pemilihan data yang dianggap relevan terhadap
analisis.
4. Data Trasnformation, Proses transformasi data terpilih ke dalam bentuk mining
procedure.
5. Data Mining, Proses dimana dilakukan beragam teknik untuk mengekstrak
pola-pola potensial menghasilkan data yang berguna.
6. Pattern Evolution, Proses dimana pola-pola yang telah diidentifikasi
berdasarkan measure yang diberikan.
7. Knowledge Presentation, Proses paling akhir dari proses KDD, Data-data yang
sudah diproses divisualisasikan agar lebih mudah dipahami oleh pengguna dan
diharapkan bisa diambil Tindakan berdasarkan analisis.
2. Data mining adalah suatu proses pengumpulan informasi dan data yang penting
dalam jumlah yang besar atau big data. Dalam proses ini seringkali memanfaatkan
beberapa metode, seperti matematika, statistika dan pemanfaatan teknologi
artificial intelligence (AI). Pengertian data mining ini juga dikenal dengan istilah
lain, seperti Knowledge Discovery in Databases (KDD) dan Data Analysis.
Mengumpulkan Data
Tahapan dari pengumpulan data ini berawal dari merapikan data mentah dan hasilnya
berupa pengetahuan atau informasi yang sudah diolah. Di antaranya adalah data
cleansing (buang data yang tak diperlukan), data integration (proses integrasi), selection
(memilih data yang relevan sebelum proses) dan data transformation atau transformasi
data yang dipilih.
Menyiapkan Data
Masuk ke tahap berikutnya yaitu data mining, fungsinya untuk mengekstrak berbagai
pola yang berpotensi dalam mendapatkan data yang berguna. Selain itu dilakukan juga
pattern evolution sebagai pola dari proses menarik data yang sudah ditemukan
berdasarkan penekanan yang diberikan. Knowledge presentation dengan visualisasi
data.
Proses Modeling
Memasuki proses penambangan data dengan menerapkan predictive modeling yang
terdiri dari dua teknik, yakni classification dan value prediction. Adapula database
segmentation, merupakan partisi database menjadi sejumlah bagian atau segmen,
hingga cluster atau perekaman yang sama. Digunakan pula link analysis untuk
menghubungkan record satu dengan lainnya.
Evaluasi Data
Menggunakan teknik deviation detection, yakni identifikasi outlier dengan
mengekspresikan deviasi dari ekspektasi yang ada. Kemudian dilakukan nearest
neighbour yang dipakai untuk memprediksi pengelompokan, teknik tertua dalam data
mining. Dan terakhir clustering, mengklasifikasikan data berdasarkan kriteria masing-
masing.
Penyajian Data
Digunakan model prediktif seperti decision tree, digambarkan layaknya seperti pohon
karena setiap node di dalam struktur pohon mewakili sebuah pertanyaan yang
digunakan untuk menggolongkan data bisa didapat dari jurnal data mining.