Tugas Data Mining Alifyana Urmaa
Tugas Data Mining Alifyana Urmaa
Data mining adalah serangkaian proses atau metode untuk menggali nilai tambah dari
suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara
manual.sedangkan kata mining sendiri berarti usaha mendapatkan sedikit barang berharga
dari sejumlah material dasar.dengan demikian data mining dapat di artikan pula proses untuk
menggali pola pola dari data dan data mining menjadi alat yang semakin penting untuk
mengubah data tersebut menjadi informasi.data mining sering digunakan dalam berbagai
praktek profil seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah.
1. Classification
Algoritma Data Mining yang membutuhkan variabel target untuk belajar (sampai
mendapatkan rule / pola yang berlaku pada data tersebut) kita standarkan dengan sebutan
dengan Supervised Algorithm. Yang termasuk kepada Classification Algorithm adalah
Decision Trees, Neural Network dan Naives Bayes.
2. Clustering
Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi
Cluster 3 berisi populasi berusia tua dengan pendapatan yang relatif rendah.
Clustering adalah metode data mining yang Unsupervised, karena tidak ada satu atributpun
yang digunakan untuk memandu proses pembelajaran, jadi seluruh atribut input diperlakukan
sama. Kebanyakan Algoritma Clustering membangun sebuah model melalui serangkaian
pengulangan dan berhenti ketika model tersebut telah memusat atau berkumpul (batasan dari
segmentasi ini telah stabil).
3. Association
Association juga disebut sebagai Market Basket Analysis. Sebuah problem bisnis
yang khas adalah menganalisa tabel transaksi penjualan dang mengidentifikasi produk-
produk yang seringkali dibeli bersamaan oleh customer, misalnya apabila orang membeli
sambal, biasanya juga dia membeli kecap. Kesamaan yang ada dari data pembelian
digunakan untuk mengidentifikasi kelompok kesamaan dari produk dan kebiasaan apa yang
terjadi guna kepentingan cross-selling seperti contoh dibawah ini.
4. Regression
Sebuah Teknik Linear Line-fitting sederhana adalah sebuah contoh dari Regression, dimana
hasilnya adalah sebuah fungsi untuk menentukan hasil yang berdasarkan nilai dari input.
Bentuk yang lebih canggih dari regression sudah mendukung input berupa kategori, jadi tidak
hanya input berupa numerik. Teknik paling popular yang digunakan untuk regression adalah
linear regression dan logistic regression. Teknik lain yang didukung oleh SQL Server Data
mining adalah Regression Trees (bagian dari dari algoritma Microsoft Decission Trees) dan
Neural Network.
5. Forecasting
Forecasting adalah metode data mining yang sangat penting. Contohnya digunakan
untuk menjawab pertanyaan seperti berikut:
- Seperti apa jadinya nilai saham dari Microsoft Corporation (pada NASDAQ,
disimbolkan sebagai MSFT) pada keesokan hari?
Gambar diatas menunjukkan dua kurva, garis yang tegas adalah time-series data sebenarnya
dari nilai saham Microsoft, dan garis putus-putus adalah time series model yang memprediksi
nilai saham berdasarkan nilai saham pada masa lalu.
6. Sequence Analysis
Sequence Anlysis digunakan untuk mencari pola pada serangkaian kejadian yang
disebut dengan Sequence. Sebagai contoh sebuah DNA terdiri dari rangaian bagian: A, G, C,
dan T. dan rangkaian klik pada sebuah website berisi rentetan URL. Pada kejadian nyata anda
mungkin memodelkan pembelian oleh pelanggan sebagai sebuah sequence (rangkaian) data,
rangkaian tersebut adalah:
Pertama-tama Seorang pelanggan membeli komputer
Baik Sequence maupun time-series data mempunyai kemiripan, mereka sama sama
berisi tinjauan berdekatan yang urutannya bergantung. Bedanya adalah sebuah time-series
berisi data bertipe numerik, dan sebuah sequence series berisi bagian yang khas.
Gambar ini menunjukan rangkaian klik pada sebuah website berita. Setiap node adalah
sebuah kategori URL. Dan garis melambangkan transisi antar kategori URL tersebut. Setiap
transisi di kelompokan dengan sebuah bobot yang menggambarkan kemungkinan transisi
antara satu URL dan URL yang lain.
Referensi dari :
1. https://id.scribd.com/doc/98263865/Jurnal-Implementasi-Data-Mining-Dengan-
Metode-Clustering-Untuk-Melakukan-1
2. https://id.scribd.com/doc/168341703/jurnal-datamining