DATA MINING
DI SUSUN OLEH :
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH JAKARTA
DATA MINING
1.1.1 Pengertian
1. Classification (klasifikasi), merupakan proses penemuan model atau fungsi yang
menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Metode yang
digunakan antara lain Neural Network, Decision Tree, k-Nearest Neighbor, dan Naive
Bayes.
Pada persoalan klasifikasi, kita memiliki sejumlah kasus (sampel data) dan ingin
mempresiksi beberapa class yang ada pada sampel data tersebut.
Tiap isntan data berisi banyak atribut, dimana masing-masing atribut memiliki
satu dari beberapa kemungkinan nilai.
Hanya satu atribut diantara banyak aribut tersebut yang disebut atribut target,
sedangkan atribut yang lain disebut sebagai atribut prediktor.
2. Clustering (pengelompokan), yaitu pengelompokan mengidentifikasi data yang memiliki
karakteristik tertentu. Metode dalam fungsi ini diantaranya Hierarchical Clustering,
metode K-Means, dan Self Organizing Map (SOM)
Sering disebut "Market Basket Analysis" yang digunakan untk menemukan relasi
atau korelasi diantara himpunan item-item.
Fungsi ini paling banyak digunakan untuk menganalisa data dalam rangka
keperluan strategi pemasaran, desain katalog, dan proses pembuatan keputusan
bisnis.
Bisa dinyatakan sebagai, misal : "70 % dari orang-orang yang memebeli mie,
juice dan saus akan membeli juga roti tawar."
1.1.3 Perbedaan
Metode klasifikasi jumlah pengelompokkan itemnya sudah ditentukan banyaknya
kelompok, metode klastering pengelompokkan itemnya sesuai dengan jenis item,
Sedangkan metode asosiasi itemnya saling berhubungan dengan beberapa item.
Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi
Cluster 3 berisi populasi berusia tua dengan pendapatan yang relatif rendah.
Clustering adalah metode data mining yang Unsupervised, karena tidak ada satu
atributpun yang digunakan untuk memandu proses pembelajaran, jadi seluruh atribut
input diperlakukan sama. Kebanyakan Algoritma Clustering membangun sebuah model
melalui serangkaian pengulangan dan berhenti ketika model tersebut telah memusat atau
berkumpul (batasan dari segmentasi ini telah stabil).
3. Association
Association juga disebut sebagai Market Basket Analysis. Sebuah problem bisnis yang
khas adalah menganalisa tabel transaksi penjualan dang mengidentifikasi produk-produk
yang seringkali dibeli bersamaan oleh customer, misalnya apabila orang membeli sambal,
biasanya juga dia membeli kecap. Kesamaan yang ada dari data pembelian digunakan
untuk mengidentifikasi kelompok kesamaan dari produk dan kebiasaan apa yang terjadi
guna kepentingan cross-selling seperti gambar dibawah ini.
Ketika orang membeli pepsi atau coke, biasanya dia membeli juice
4. Regression
5. Forecasting
Forecasting adalah metode data mining yang sangat penting. Contohnya digunakan untuk
menjawab pertanyaan seperti berikut:
Seperti apa jadinya nilai saham dari Microsoft Corporation (pada NASDAQ, disimbolkan
sebagai MSFT) pada keesokan hari?
6. Sequence Analysis
Sequence Anslysis digunakan untuk mencari pola pada serangkaian kejadian yang disebut
dengan Sequence. Sebagai contoh sebuah DNA terdiri dari rangaian bagian: A, G, C, dan
T. dan rangkaian klik pada sebuah website berisi rentetan URL. Pada kejadian nyata anda
mungkin memodelkan pembelian oleh pelanggan sebagai sebuah sequence (rangkaian)
data, rangkaian tersebut adalah:
Baik Sequence maupun time-series data mempunyai kemiripan, mereka sama sama
berisi tinjauan berdekatan yang urutannya bergantung. Bedanya adalah sebuah time-
series berisi data bertipe numerik, dan sebuah sequence series berisi bagian yang khas.
Gambar ini menunjukan rangkaian klik pada sebuah website berita. Setiap node adalah
sebuah kategori URL. Dan garis melambangkan transisi antar kategori URL tersebut.
Setiap transisi di kelompokan dengan sebuah bobot yang menggambarkan
kemungkinan transisi antara satu URL dan URL yang lain.
3.1.1 Pengertian
Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan
dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. Dalam
beberapa implementasi data warehouse, data mart adalah miniature data warehouse. Data
mart sering digunakan untuk memberikan informasi kepada segmen fungsional organisasi.
3.1.2 Perbedaan Dengan Data Mining
Data mining sekumpulan data yang sangat besar diolah menjadi satu sehingga bermanfaat
untuk memprediksi masa depan, Sedangkan data mart sekumpulan informasi yang
clisimpan di dalam basis data yang menunjang proses pengambilan keputusan perusahaan
DAFTAR PUSTAKA
https://ellymunig.wordpress.com/2014/03/24/metode-data-mining/
http://funpreuner.blogspot.co.id/2011/02/pertemuan-1-pengertian-dan-macam-macam.html
http://yayanhendrian.blogspot.co.id/2013/05/metode-klasifikasi-asosiasi-dan.html
Sumber : http://ishwara.us/metode-data-mining/