DM:
1. 1.Definisi data mining :
Data mining adalah suatu proses yang digunakan untuk mencari informasi dan knowledge
yang berguna, dimana diperoleh dari data-data yang dimiliki. Dari buku Data Mining
Technique yang dikarang oleh Berry and Linoff, proses terjadinya data mining dapat
dideskripsikan sebagai virtous cycle. Didasari oleh pengembangan berkelanjutan dari
proses bisnis serta didorong oleh penemuan knowledge ditindaklanjuti dengan
pengambilan tindakan dari penemuan tersebut.
2.Tujuan dan kegunaan data mining
2.Data warehouse adalah tempat penyimpanan data yang berorientasi pada subjek,
terintegrasi, tidak mudah berubah, dan memiliki rentang waktu, yang diambil dari
database operasional, historis, dan eksternal, yang diproses agar dapat dianalisis untuk
mendukung proses pengambilan keputusan.
OLAP adalah teknologi yang menggunkana sekumpulan prinsip kerangka kerja dimensional
yang memakai data agregat untuk menyediakan akses cepat kepada informasi strategis
sehingga dapat dipakai untuk melakukan analisis tingkat lanjut dalam untuk mendukung
proses pengambilan keputusan.
3.Definisi Cluster
Cluster adalah sebuah area pada grafik terminal trading, di situ beberapa peristiwa khusus dapat
diamati. Cluster dapat berupa harga ataupun waktu. Cluster harga dapat diamati melalui
berbagai metode seperti yang diterapkan pada analisis teknikal, yakni ditunjukkan melalui harga
yang sama pada sebuah pembalikan. Sedangkan cluster waktu ditunjukkan melalui pembalikan
waktu dan tidak berhubungan dengan harga.
2. Clustering
Clustering juga disebut sebagai segmentation. Metoda ini digunakan untuk mengidentifikasi
kelompok alami dari sebuah kasus yang di dasarkan pada sebuah kelompok atribut,
mengelompokkan data yang memiliki kemiripan atribut.
3. Association
Association juga disebut sebagai Market Basket Analysis. Sebuah problem bisnis yang khas adalah
menganalisa tabel transaksi penjualan dang mengidentifikasi produk-produk yang seringkali dibeli
bersamaan oleh customer, misalnya apabila orang membeli sambal, biasanya juga dia membeli
kecap.
4. Regression
Metode Regression mirip dengan metode Classification, yang membedakannya adalah metode
regression tidak bisa mencari pola yang dijabarkan sebagai class (kelas).
Metoda regression bertujuan untuk mecari pola dan menentukan sebuah nilai numerik.
5. Forecasting
Forecasting juga adalah metode data mining yang sangat penting. Contohnya digunakan untuk
menjawab pertanyaan seperti berikut:
Seperti apa jadinya nilai saham dari Microsoft Corporation (pada NASDAQ, disimbolkan sebagai
MSFT) pada keesokan hari?
6. Sequence Analysis
Sequence Anlysis digunakan untuk mencari pola pada serangkaian kejadian yang disebut dengan
Sequence. Sebagai contoh sebuah DNA terdiri dari rangaian bagian: A, G, C, dan T. dan rangkaian klik
pada sebuah website berisi rentetan URL. Pada kejadian nyata anda mungkin memodelkan
pembelian oleh pelanggan sebagai sebuah sequence (rangkaian) data, rangkaian tersebut adalah:
7. Deviation Analysis
Deviation Analysis digunakan untuk mencari kasus yang bertindak sangat berbeda dari normalnya.
Deviation analysis pengguaannya sangat luas, yang paling umum menggunakan metode ini adalah
pendeteksian penyalah gunaan Kartu kredit. Mengidentifikasi kasus yang tidak normal diantara
jutaan transaksi adalah pekerjaan yang sangat menantang. Penggunaan yang lainnya misalnya,
pendeteksian gangguan jaringan komputer, analisa kesalahan produksi, dan lain-lain.