Anda di halaman 1dari 2

Syukron Rushadi

Computer Engineering University of Sriwijaya


Sharing Knowledge for Everyone

Pengenalan Teknik Data Mining


Dengan meningkatnya sejumlah data yang disimpan dalam bentuk file, database dan
repositori lain, sangat penting untuk mengembangkan suatu sarana yang kuat dalam
melakukan analisa data untuk memperoleh pengetahuan yang penting dari sebagian besar
jumlah data yang besar dengan cara mengekstraksi data tersebut sehingga mempermudah
dalam pembuatan keputusan.
Data mining (langkah proses analisa Penjelajahan Pengetahuan dalam basis data
atau KDD) adalah salah satu kedisiplinan cabang ilmu komputer sebagai proses komputasi
penjelajahan pola dalam kumpulan data dengan menyertakan metode kecerdasan buatan,
meachine learning, statistik dan sistem database, dengan tujuan keseluruhan prosesnya
adalah untuk mengekstrak informasi dari kumpulan data dan mengubahnya menjadi
sekumpulan struktur data yang dapat dimengerti dan digunakan. Data mining juga
mneyertakan aspek basis data dan manajemen data, pra-pemrosesan data, model dan
pertimbangan kesimpulan, pemrosesan penjelajahan struktur, visualisasi dan pembaharuan
online.
Tugas sebenarnya dari data mining adalah analisa otomatis ataupun semi-otomatis
data dengan kuantitas yang besar untuk mengekstrak pola yang sebelumnya tidak diketahui
termasuk pengelompokan rekaman data (analisa kluster), rekaman dat tak biasa (deteksi
kelainan), dan dependensi. Pada umumnya melibatkan teknik basis data seperti spatial
indices. Pola ini nantinya bisa dilihat sebagai kesimpulan dari data input, dan mungkin dapat
digunakan pada analisa lebih lanjut. Sebagai contoh dalam machine learning dan analisa
prediksi.
Dalam pengerjaan tugasnya, teknik data mining dapat dikelompokan dalam 4 kelas

Association rule learning teknik pencarian antar variabel yang saling berhubungan.
Association rule memiliki 2 bagian yaitu if dan then. If adalah variabel yang
ditemukan pada data, lalu then ditemukan dalam kombinasi dengan if. Beberapa
algoritma yang populer adalah apriori, partition, FP-Growth dan ECLAT

Clustering - Teknik ini menemukan kelompok dan struktur pada data seperti objek
yng berada pada kelompok yang sama. Tugas clustering terdiri dalam pembagian
kumpulan contoh dari pemberian domain, dideskripsikan melalui jumlah nilai atribut
diskrit atau kontinyu, kedalam kumpulan kluster berbasis pada kemiripannya, dan
membuat permodelan yang bisa memetakan contoh yang berubah-ubah dari
domain yang sama pada cluster tersebut, bisa dipertimbangkan menjadi 2 sub-tugas
yaitu Cluster information, mengidentifikasi kelompok yang memiliki kesamaan dalam
menganalisa data dan cluster modeling, membuat model untuk memprediksi
id.linkedin.com/in/syukronrushadi

Syukron Rushadi
Computer Engineering University of Sriwijaya
Sharing Knowledge for Everyone

keanggotaan cluster. Dengan cluster mengidentifikasi subtask pertama yang


digunakan sebagai kelas. Ini bisa menunjukan, prinsip menggunakan algoritma
klasifikasi apapun yang tersedia, biasanya lebih sesuai untuk tidak memisahkan dua
subtask lebih dulu, dan kebanyakan algoritma kluster mengoperasikan kedua cluster
information dan cluster modelling, memungkinknan untuk menggunakan kriteria
digunakan untuk cluster sesudah itu menggunakan kembali agar cluster mampu
untuk memprediksi keanggotaan. Kumpulan data memungkinkan objek dengan lebih
banyak attribut. Pengklasifikasian dilakukan melalui pemilihan atribut yang tepat dan
berhubungan untuk pemilihan secara hati-hati suatu referensi dan semata mata
bergantung pada area yang mengenai pengguna. Oleh karena itu, klasifikasi
memainkan aturan yang lebih pasti dalam membentuk relasi antara bermacammacam item dalam semi atau kumpulan data tak terstruktur. Untuk langkah analisa
cluster yang merupakan subjek luas dan karenanya banyak algoritma cluster yang
tersedia untuk pengelompokan kumpulan data. Beberapa contoh algoritma yang
digunakan adalah K-means, Expectation Maximization, DBSCAN dan Fuzzy C Means.

Classification Klasifikasi merupakan salah satu dasar teori pemrosesan yang


digunakan untuk mengatur dan menerapkan pengetahuan kita tentang dunia.
Umumnya terdapat di kedua kehidupan sehari-hari dlaam bisnis, dimana
memungkinkan untuk mengklasifikasi pelanggan, pegawai, transaksi, toko,
perangkat, dokumen atau tipe hal lain apapun yang dimasukan kedalam kelas yang
berarti yang belum terdefinisi.

id.linkedin.com/in/syukronrushadi

Anda mungkin juga menyukai