Anda di halaman 1dari 4

Nama : Muhammad Mumtaz Al – Haitami

NIM : 20200801433

==============================================================================

1. Knowledge Discovery in Database Process (KDD) adalah salah satu metode yang bisa
digunakan dalam melakukan data mining. Fayyed et al. (1996) mendefinisikan KDD
sebagai proses dari menggunakan metode data mining untuk mencari informasi-
informasi yang berharga, pola yang ada di dalam data, yang melibatkan algoritma untuk
mengidentifikasi pola pada data. Dunham (2003) meringkas proses KDD dari berbagai
step, yaitu: seleksi data, pra-proses data, transformasi data, data mining, dan yang
terakhir interpretasi dan evaluasi.

1. Data Cleansing, Proses dimana data diolah lalu dipilih data yang dianggap bisa
dipakai.
2. Data Integration, Proses menggabungkan data yang dianggap berulang akan
digabungkan menjadi satu.
3. Selection, Proses seleksi atau pemilihan data yang dianggap relevan terhadap
analisis.
4. Data Trasnformation, Proses transformasi data terpilih ke dalam bentuk mining
procedure.
5. Data Mining, Proses dimana dilakukan beragam teknik untuk mengekstrak
pola-pola potensial menghasilkan data yang berguna.
6. Pattern Evolution, Proses dimana pola-pola yang telah diidentifikasi
berdasarkan measure yang diberikan.
7. Knowledge Presentation, Proses paling akhir dari proses KDD, Data-data yang
sudah diproses divisualisasikan agar lebih mudah dipahami oleh pengguna dan
diharapkan bisa diambil Tindakan berdasarkan analisis.

2. Data mining adalah suatu proses pengumpulan informasi dan data yang penting
dalam jumlah yang besar atau big data. Dalam proses ini seringkali memanfaatkan
beberapa metode, seperti matematika, statistika dan pemanfaatan teknologi
artificial intelligence (AI). Pengertian data mining ini juga dikenal dengan istilah
lain, seperti Knowledge Discovery in Databases (KDD) dan Data Analysis.

 Fungsi Data Mining :


Deskriptif
Deskriptif lebih kepada merujuk ke fungsi dalam pemahaman data, hal ini membuat
pengolahnya bisa teliti lebih mendalam. Tujuan dari proses ini adalah untuk
menemukan pola dan karakteristik yang terdapat pada data. Fungsi deskriptif
dimanfaatkan sebagai pattern tertentu yang awalnya tidak terlihat di dalam data.
 Prediktif
Fungsi terkait dengan proses yang nantinya digunakan untuk mengetahui pola khusus
dari data yang digunakan. Pola ini bisa ditemukan dari beberapa variabel dalam data,
ketika sudah menemukan pola, maka pola yang digunakan dipakai untuk
memperkirakan variabel lain dan masih belum diketahui nilainya karena itu disebut
fungsi prediktif.
 Asosiasi
Fungsi asosiasi adalah fungsi data mining yang dapat diproses untuk melakukan
identifikasi relasi atau hubungan dari setiap data yang ada. Data ini bisa merupakan data
dahulu maupun data yang didapat saat ini.
 Klasifikasi
Klasifikasi dilakukan untuk sebagai cara menyimpulkan beberapa pengertian
karakteristik dari suatu grup atau kelompok data. Seperti data pelanggan yang tak lagi
menggunakan produk, karena menganggap produk kompetitor memberi manfaat lebih
banyak dan customer value untuk para pelanggan.
 Clustering
Clustering merupakan fungsi yang mengarah pada proses identifikasi kelompok,
kemudian produk atau barang yang memiliki karakteristik khusus. Biasanya digunakan
dalam mengetahui kelompok-kelompok tertentu dalam penyebarannya.
 Peramalan
Disebut juga dengan teknik forecasting  yang dipakai untuk memperoleh gambaran
mengenai nilai dari suatu data di masa mendatang, Forecasting dan peramalan ini bisa
dilakukan dengan pengumpulan informasi dalam jumlah yang besar, contoh penerapan
forecasting merupakan data terkait peramalan jumlah permintaan terhadap produk
tertentu.
 Sequencing
Sequencing merupakan fungsi terakhir dari data mining, proses identifikasi setiap
hubungan yang berbeda dalam periode waktu tertentu. Kemudian sequencing
merupakan data pelanggan ketika melakukan repeat purchase suatu produk yang terjadi
atau dilakukan secara berulang pada pelanggan.

Tahapan Daxta Mining :

Mengumpulkan Data
Tahapan dari pengumpulan data ini berawal dari merapikan data mentah dan hasilnya
berupa pengetahuan atau informasi yang sudah diolah. Di antaranya adalah data
cleansing (buang data yang tak diperlukan), data integration (proses integrasi), selection
(memilih data yang relevan sebelum proses) dan data transformation atau transformasi
data yang dipilih.
Menyiapkan Data
Masuk ke tahap berikutnya yaitu data mining, fungsinya untuk mengekstrak berbagai
pola yang berpotensi dalam mendapatkan data yang berguna. Selain itu dilakukan juga
pattern evolution sebagai pola dari proses menarik data yang sudah ditemukan
berdasarkan penekanan yang diberikan. Knowledge presentation dengan visualisasi
data.
Proses Modeling
Memasuki proses penambangan data dengan menerapkan predictive modeling yang
terdiri dari dua teknik, yakni classification dan value prediction. Adapula database
segmentation, merupakan partisi database menjadi sejumlah bagian atau segmen,
hingga cluster atau perekaman yang sama. Digunakan pula link analysis untuk
menghubungkan record satu dengan lainnya.
Evaluasi Data
Menggunakan teknik deviation detection, yakni identifikasi outlier dengan
mengekspresikan deviasi dari ekspektasi yang ada. Kemudian dilakukan nearest
neighbour yang dipakai untuk memprediksi pengelompokan, teknik tertua dalam data
mining. Dan terakhir clustering, mengklasifikasikan data berdasarkan kriteria masing-
masing.
Penyajian Data
Digunakan model prediktif seperti decision tree, digambarkan layaknya seperti pohon
karena setiap node di dalam struktur pohon mewakili sebuah pertanyaan yang
digunakan untuk menggolongkan data bisa didapat dari jurnal data mining.

Anda mungkin juga menyukai