Anda di halaman 1dari 5

24/11/2021

Data Mining Apa itu Data Mining?

1 2

Manusia Memproduksi Data


Apa itu Data Mining?
Manusia memproduksi beragam • Disiplin ilmu yang mempelajari metode untuk
data yang jumlah dan ukurannya mengekstrak pengetahuan atau menemukan pola
sangat besar dari suatu data yang besar
• Astronomi
• Bisnis
• Kedokteran
• Ekonomi
• Olahraga
• Cuaca
Himpunan Metode Data
• Financial Pengetahuan
Data Mining
• …

3 4

Metode dalam Data Mining


Definisi Data Mining
Tugas
Data Mining
• Melakukan ekstraksi untuk mendapatkan informasi penting yang
sifatnya implisit dan sebelumnya tidak diketahui, dari suatu data
Predictive Descriptive
• Kegiatan yang meliputi pengumpulan, pemakaian data historis untuk
menemukan keteraturan, pola dan hubungan dalam set data
berukuran besar Classification Clustering

Time Series
Association Rule
Analysis

Regression Sequence Discovery

1
24/11/2021

Predictive - Classification
• Menemukan fungsi atau model yang membedakan kelas
data
• Fungsi atau model tsb dapat berbentuk aturan if-else,
descision tree, formula matematika, atau neural network
• Tujuannya untuk memperkirakan kelas dari suatu objek
yang labelnya tidak diketahui
• Algoritma : Decision Tree (C4.5), Artificial Neural
Network, Naïve Bayes, Genetic Algorithm, Fuzzy, Case-
Based Reasoning, k-Nearest Neighbor
• Supervised Method

Contoh Contoh Lain..

Metode Pohon Keputusan Lanj..

2
24/11/2021

Predictive – Time Series Analysis Contoh : Prediksi dalam pasar saham


• Time series data : sekuens data yang nilainya • garis yang tegas adalah
berubah setiap interval waktu tertentu. time-series data
• Time series data dapat dipresentasikan dalam bentuk sebenarnya dari nilai
grafik atau kurva yang menunjukkan fungsi sebuah saham Microsoft, dan
variabel data terhadap satuan waktu. garis putus-putus adalah
• Metode : Neural Network (model Backpropagation, time series model yang
multi layer perceptron) memprediksi nilai saham
berdasarkan nilai saham
• Aplikasi : memprediksikan indeks harga saham pada masa lalu.

Predictive - Regression Descriptive - Clustering


• Regression vs Classification : • Mengidentifikasi kelompok alami dari data
• Regression diterapkan untuk mengklasifikasikan target data berdasarkan kemiripan atribut
numerik
• Classification untuk mengklasifikasikan target data kategorial • Disebut juga Segmentation
• Aplikasi : prediksi nilai penjualan yang akan datang • Unsupervised Method : tidak satupun atribut yang
berdasarkan trend data penjualan tahun sebelumnya. digunakan untuk memandu proses pembelajaran
(tidak ada label)
• Algoritma : Support Vector Machine (SVM), Generalized
Linear Model (GLM) • Algoritma : k-Means, k-Medoid, Fuzzy C-Means,
Subtractive, Mountain, Hierarki

Contoh : Data Pelanggan Contoh

• Terdiri dari dua atribut, yaitu Age


(Umur) dan Income (Pendapatan).
• Algoritma Clustering
mengelompokkan kelompok data
kedalam tiga segment berdasarkan
kedua atribut ini.
• Cluster 1 : populasi berusia muda
dengan pendapatan rendah
• Cluster 2 : populasi berusia
menengah dengan pendapatan yang
lebih tinggi
• Cluster 3 : populasi berusia tua
dengan pendapatan yang relatif
rendah.

3
24/11/2021

Lanj.. Descriptive – Association Rule


• Disebut juga Market Basket Analysis.
• Menganalisa tabel transaksi penjualan dan
mengidentifikasi produk-produk yang seringkali dibeli
bersamaan oleh customer
• Untuk mengidentifikasi kelompok kesamaan dari
produk dan kebiasaan apa yang terjadi guna
kepentingan cross-selling
• Untuk mencari produk apa yang biasanya terjual
bersamaan
• Untuk mencari tahu apa aturan yang menyebabkan
kesamaan tersebut.

Contoh Contoh Lain


• Ketika orang membeli
susu, dia biasanya
membeli keju
• Ketika orang membeli
pepsi atau coke,
biasanya dia membeli
juice

4
24/11/2021

Descriptive – Sequence Analysis Contoh : Rangkaian Klik pada Sebuah


Website Berita
• Digunakan untuk mencari pola pada serangkaian
kejadian yang disebut dengan Sequence. • Setiap node adalah sebuah
• Contoh rangkaian klik pada sebuah website berisi kategori URL.
rentetan URL. • Garis melambangkan transisi
• Implementasi : memodelkan pembelian oleh antar kategori URL tersebut.
pelanggan sebagai sebuah sequence (rangkaian) data • Setiap transisi dikelompokan
: dengan sebuah bobot yang
• Pertama-tama seorang pelanggan membeli komputer menggambarkan kemungkinan
• kemudian membeli speaker transisi antara satu URL dan URL
• dan akhirnya membeli sebuah webcam. yang lain.

Masalah-Masalah di Data Mining


• Jumlah data yang banyak

• Keragaman data

• Kompleksitas data
• Aliran data
• Struktur data
• Asal data
• Software

• Kebutuhan aplikasi

27

Anda mungkin juga menyukai