DATA MINING
“Perkembangan data mining dan hubungan dengan data analyst dan data scientist”
SUGIYANTORO 171220464
Puji syukur kehadirat Tuhan Yang Maha Esa yang telah memberikan taufik dan hidayahnya,
sehingga kami mampu menyelesaikan makalah ini dengan judul “ Data Mining“.
Namun penyusun menyadari bahwa dalam penyusunan makalah ini masih jauh dari kesempurnaa.
Maka dari itu penyusun mengharapkan saran dan kritik yang sifatnya membangun kesempurnaan
makalah ini.
Dalam penyusunan makalah ini tidak lepas dari berbagai pihak. Dari itu penyusun menyampaikan
rasa terimakasih kepada semua pihak yang telah membantu sehinnga makalah ini dapat
diselesaikan tepat pada waktunya.
Semoga makalah ini bermanfaat bagi penulis pada khususnya dan bagi pembaca pada umumnya.
DAFTAR ISI
HALAMAN JUDUL.......................................................................................................... i
KATA PENGANTAR........................................................................................................ ii
DAFTA R ISI..................................................................................................................... iii
BAB I PENDAHULUAN.................................................................................................. 1
A. Latar Belakang........................................................................................... ......... 1
B. Tujuan......................................................................................................... ......... 1
C. Rumusan Masalah....................................................................................... ......... 2
BAB II PEMBAHASAN.......................................................................................... ......... 3
A. Pengertian Data Mining....................................................................................... 3
B. Fungsi dan Tujuan Data Mining................................................................. ......... 3
1. Fungsi Data Mining....................................................................................... 3
2. Tujuan Data Mining.............................................................................. ......... 4
C. Penerapan Data Mining........................................................................................ 5
D. Metodologi Data Mining..................................................................................... 6
E. Proses Data Mining.............................................................................................. 7
F. Teknik Data Mining.................................................................................... ......... 8
BAB III PENUTUP............................................................................................................ 13
A. Kesimpulan.......................................................................................................... 13
B. Saran.................................................................................................................... 13
DAFTAR PUSTAKA............................................................................................... ......... 14
BAB 1
PENDAHULUAN
A. Latar Belakang
Penyimpanan dokumen secara digital berkembang dengan pesat seiring meningkatnya
penggunaan komputer. Kondisi tersebut memunculkan masalah untuk mengakses informasi yang
diinginkan secara akurat dan cepat. Oleh karena itu, walaupun sebagian besar dokumen digital
tersimpan dalam bentuk teks dan berbagai algoritma yang efisien untuk pencarian teks telah
dikembangkan, teknik pencarian terhadap seluruh isi dokumen yang tersimpan bukanlah solusi
yang tepat mengingat pertumbuhan ukuran data yang tersimpan umumnya. Pencarian informasi
(Information Retrieval) adalah salah satu cabang ilmu yang menangani masalah ini yang bertujuan
untuk membantu pengguna dalam menemukan informasi yang relevan dengan kebutuhan mereka
dalam waktu singkat. Aplikasi pencarian informasi yang telah ada salah satunya adalah web
mining untuk pencarian berdasarkan kata kunci dengan teknik clustering. Selain itu, pada dokumen
dilakukan juga text mining dan perhitungan jumlah kata, dari jumlah kata tersebut dilakukan
pengklusteran dengan metode CLHM (Centroid Linkage Hierarchical Method). Untuk jumlah
klusternya, pemakai tidak mengetahui berapa jumlah yang tepat untuk mengklusterkan dokumen-
dokumen tersebut. Untuk itu, dipakailah metode Hill Climbing yang bertugas untuk melakukan
identifikasi terhadap pergerakan varian dari tiap tahap pembentukan kluster dan menganalisa
polanya sehingga jumlah kluster akan terbentuk secara otomatis. Penggunaan text mining,
pengklusteran dengan CLHM dan proses Hill Climbing Automatic Clustering sangat memudahkan
pemakai karena menghasilkan kluster secara otomatis dan tepat dengan waktu yang cepat.
B. Tujuan
1. Untuk memenuhi tugas mata kuliah Sistem Manajemen Basis Data.
2. Untuk mengetahui lebih luas tentang Data Mining.
3. Untuk menambah pengetahuan.
C. Rumusan Masalah
1. Apa yang dimaksud dengan Data Mining ?
2. Apa fungsi dan tujuan dari Data Mining ?
3. Bagaimana penerapan Data Mining dalam kehidupan?
BAB II
PEMBAHASAN
c. Exploratory
Menganalisis data untuk hubungan yang baru yang tidak di harapkan, seperti halnya pola apa yang
cocok untuk kasus penggelapan kartu kredit.
PENUTUP
A. Kesimpulan
Pada proses Data Mining hal yang paling penting adalah pada tahap “Data Mining” dengan
menggunakan teknik-teknik yang diaplikasikan untuk mengekstrak pola-pola potensial yang
berguna.
B. Saran
Berikut adalah saran yang mungkin perlu dilakukan dalam pengembangan selanjutnya dimasa
yang akan datang terhadap aplikasi data mining dengan metode clustering:
· Dimasa yang akan datang dalam pengembangan selanjutnya, guna lebih memaksimalkan
pendukung keputusan yang akan diambil, misalkan untuk kepentingan memudahkan kegiatan
promosi bisa ditambahkan sebuah fasilitas berupa fasilitah pengiriman email kepada customer
· Dalam studi kasus ini, item yang digunakan sebagai data proses dalam pembentuk sebuah
cluster hanya didasarkan pada satu item saja yaitu pembacaan frekuensi id customer yang ada
ditabel transaksi berdasarkan id customer yang ada ditabel customer. Pada pengembangan
selanjutnya disarankan untuk pengambilan data proses tidak hanya berdasarkan satu item saja,
mungkin juga bisa dilakukan dengan pembacaan lebih dari satu item. Misalnya id barang
ataupun total harga yang dibayarkan untuk transaksinya, sehingga bisa diketahui barang apa saja
yang biasa dibeli customer pada sebuah klaster maupun besarnya jumlah total harga yang
dibayarkan oleh customer terhadap transaksi yang dilakukannya. Dengan demikian klaster yang
dibentuk tidak hanya tiga klaster tapi mungkin lebih dari pada itu dan informasi yang
didapatkanpun menjadi lebih banyak.
DAFTAR PUSTAKA