Anda di halaman 1dari 8

MAKALAH SISTEM BASIS DATA

DATA MINING

DI SUSUN OLEH :

Denanda Neisila Hermawan


2013470022
Teknik Informatika

FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH JAKARTA
DATA MINING

1.1 Metode metode Data Mining

1.1.1 Pengertian
1. Classification (klasifikasi), merupakan proses penemuan model atau fungsi yang
menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Metode yang
digunakan antara lain Neural Network, Decision Tree, k-Nearest Neighbor, dan Naive
Bayes.

Pada persoalan klasifikasi, kita memiliki sejumlah kasus (sampel data) dan ingin
mempresiksi beberapa class yang ada pada sampel data tersebut.
Tiap isntan data berisi banyak atribut, dimana masing-masing atribut memiliki
satu dari beberapa kemungkinan nilai.
Hanya satu atribut diantara banyak aribut tersebut yang disebut atribut target,
sedangkan atribut yang lain disebut sebagai atribut prediktor.
2. Clustering (pengelompokan), yaitu pengelompokan mengidentifikasi data yang memiliki
karakteristik tertentu. Metode dalam fungsi ini diantaranya Hierarchical Clustering,
metode K-Means, dan Self Organizing Map (SOM)

Teknik yang berguna untuk mengeksplorasi data


digunakan pada saat banyak kasus dan tidak memiliki pengelompokan secara
alami. (Dalam hal ini algoritma data mining dapat digunakan untuk mencari
pengelompokan yang ada pada peta).
Clustering model berbeda dari model prediktif dikarenakan pada clustering tidak
perlu ada atribut target.
Clustering juga dapat diorganisasi ke dalam sturktur hirarkikal akan
mendefinisikan taksonomi dari data.
3. Association (asosiasi), dinamakan juga analisis keranjang pasar dimana fungsi ini
mengidentifikasi item-item produk yang kemungkinan dibeli konsumen bersamaan
dengan produk lain. Metode atau algoritma dalam fungsi ini adalah Apriori, Generalized
Sequential Pattern (GSP), FP-Growth dan GRI algorithm

Sering disebut "Market Basket Analysis" yang digunakan untk menemukan relasi
atau korelasi diantara himpunan item-item.
Fungsi ini paling banyak digunakan untuk menganalisa data dalam rangka
keperluan strategi pemasaran, desain katalog, dan proses pembuatan keputusan
bisnis.
Bisa dinyatakan sebagai, misal : "70 % dari orang-orang yang memebeli mie,
juice dan saus akan membeli juga roti tawar."

1.1.2 Contoh Data Mining


1. Classification (klasifikasi)

Model klasifikasi yang dibangun untuk mengkategorisasikan aplikasi-aplikasi bank


sebagai aplikasi yang aman atau beresiko
Model predikasi yang dibangun untuk memprediksikan pengeluaran konsumen
berdasarkan pendapatan dan pekerjaannya.
2. Clustering (pengelompokan)
Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu
produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar.
Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku finansial
dalam baik dan mencurigakan
3. Association (asosiasi)
Meneliti jumlah pelanggan dari suatu perusahaan telekomunikasi seluler yang
diharapkan untuk memberikan respons positif terhadap penawaran upgrade layanan
yang diberikan.
Menemukan barang dalam supermarket yang dibeli secara bersamaan dan barang
yang tidak pernah dibeli secara bersamaan.

1.1.3 Perbedaan
Metode klasifikasi jumlah pengelompokkan itemnya sudah ditentukan banyaknya
kelompok, metode klastering pengelompokkan itemnya sesuai dengan jenis item,
Sedangkan metode asosiasi itemnya saling berhubungan dengan beberapa item.

2.1 Teknik Data Mining


1. Classification
Classification adalah tindakan untuk memberikan kelompok pada setiap keadaan. Setiap
keadaan berisi sekelompok atribut, salah satunya adalah class attribute. Metode ini butuh
untuk menemukan sebuah model yang dapat menjelaskan class attribute itu sebagai
fungsi dari input attribute.

Contoh kasus College Plan


Class adalah attribute CollegePlans yang berisi dua pernyataan, Yes dan No,
perhatikan ini. Sebuah Classification Model akan menggunakan atribut lain dari kasus
tersebut (input attribut; yaitu kolom IQ, Gender, ParentIncome, dan
ParentEncouragement) untuk dapat menentukan pola (pattern) class (Output Attribute;
yaitu Kolom CollegePlans yang berisi Yes atau No).
Algoritma Data Mining yang membutuhkan variabel target untuk belajar (sampai
mendapatkan rule / pola yang berlaku pada data tersebut) kita standarkan dengan sebutan
dengan Supervised Algorithm. Yang termasuk kepada Classification Algorithm adalah
Decision Trees, Neural Network dan Naives Bayes.
2. Clustering
Clustering juga disebut sebagai segmentation. Metoda ini digunakan untuk
mengidentifikasi kelompok alami dari sebuah kasus yang di dasarkan pada sebuah
kelompok atribut, mengelompokkan data yang memiliki kemiripan atribut. Gambar ini
menunjukkan kelompok data pelanggan sederhana yang berisi dua atribut, yaitu Age
(Umur) dan Income (Pendapatan). Algoritma Clustering mengelompokkan kelompok
data kedalam tiga segment berdasarkan kedua atribut ini.

Cluster 1 berisi populasi berusia muda dengan pendapatan rendah

Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi
Cluster 3 berisi populasi berusia tua dengan pendapatan yang relatif rendah.

Clustering adalah metode data mining yang Unsupervised, karena tidak ada satu
atributpun yang digunakan untuk memandu proses pembelajaran, jadi seluruh atribut
input diperlakukan sama. Kebanyakan Algoritma Clustering membangun sebuah model
melalui serangkaian pengulangan dan berhenti ketika model tersebut telah memusat atau
berkumpul (batasan dari segmentasi ini telah stabil).

3. Association
Association juga disebut sebagai Market Basket Analysis. Sebuah problem bisnis yang
khas adalah menganalisa tabel transaksi penjualan dang mengidentifikasi produk-produk
yang seringkali dibeli bersamaan oleh customer, misalnya apabila orang membeli sambal,
biasanya juga dia membeli kecap. Kesamaan yang ada dari data pembelian digunakan
untuk mengidentifikasi kelompok kesamaan dari produk dan kebiasaan apa yang terjadi
guna kepentingan cross-selling seperti gambar dibawah ini.

Beberapa hal dapat kita baca, misalnya :

Ketika orang membeli susu, dia biasanya membeli keju

Ketika orang membeli pepsi atau coke, biasanya dia membeli juice

Didalam istilah association, setiap item dipertimbangkan sebagai informasi.


Metode association memiliki dua tujuan:

Untuk mencari produk apa yang biasanya terjual bersamaan


Untuk mencari tahu apa aturan yang menyebabkan kesamaan tersebut.

4. Regression

Metode Regression mirip dengan metode Classification, yang membedakannya


adalah metode regression tidak bisa mencari pola yang dijabarkan sebagai class (kelas).
Metoda regression bertujuan untuk mecari pola dan menentukan sebuah nilai numerik.
Sebuah Teknik Linear Line-fitting sederhana adalah sebuah contoh dari
Regression, dimana hasilnya adalah sebuah fungsi untuk menentukan hasil yang
berdasarkan nilai dari input. Bentuk yang lebih canggih dari regression sudah mendukung
input berupa kategori, jadi tidak hanya input berupa numerik. Teknik paling popular yang
digunakan untuk regression adalah linear regression dan logistic regression. Teknik lain
yang didukung oleh SQL Server Data mining adalah Regression Trees (bagian dari dari
algoritma Microsoft Decission Trees) dan Neural Network.
Regression digunakan untuk memecahkan banyak problem bisnis, contohnya
untuk memperkirakan metode distribusi, kapasitas distribusi, musim dan untuk
memperkirakan kecepatan angin berdasarkan temperatur, tekanan udara, dan kelembaban.

5. Forecasting

Forecasting adalah metode data mining yang sangat penting. Contohnya digunakan untuk
menjawab pertanyaan seperti berikut:

Seperti apa jadinya nilai saham dari Microsoft Corporation (pada NASDAQ, disimbolkan
sebagai MSFT) pada keesokan hari?

Sebanyak apa penjualan produk tertentu pada bulan depan?

6. Sequence Analysis
Sequence Anslysis digunakan untuk mencari pola pada serangkaian kejadian yang disebut
dengan Sequence. Sebagai contoh sebuah DNA terdiri dari rangaian bagian: A, G, C, dan
T. dan rangkaian klik pada sebuah website berisi rentetan URL. Pada kejadian nyata anda
mungkin memodelkan pembelian oleh pelanggan sebagai sebuah sequence (rangkaian)
data, rangkaian tersebut adalah:

Pertama-tama Seorang pelanggan membeli komputer

kemudian membeli speaker

dan akhirnya membeli sebuah webcam.

Baik Sequence maupun time-series data mempunyai kemiripan, mereka sama sama
berisi tinjauan berdekatan yang urutannya bergantung. Bedanya adalah sebuah time-
series berisi data bertipe numerik, dan sebuah sequence series berisi bagian yang khas.
Gambar ini menunjukan rangkaian klik pada sebuah website berita. Setiap node adalah
sebuah kategori URL. Dan garis melambangkan transisi antar kategori URL tersebut.
Setiap transisi di kelompokan dengan sebuah bobot yang menggambarkan
kemungkinan transisi antara satu URL dan URL yang lain.

3.1 Data Mart

3.1.1 Pengertian
Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan
dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. Dalam
beberapa implementasi data warehouse, data mart adalah miniature data warehouse. Data
mart sering digunakan untuk memberikan informasi kepada segmen fungsional organisasi.
3.1.2 Perbedaan Dengan Data Mining
Data mining sekumpulan data yang sangat besar diolah menjadi satu sehingga bermanfaat
untuk memprediksi masa depan, Sedangkan data mart sekumpulan informasi yang
clisimpan di dalam basis data yang menunjang proses pengambilan keputusan perusahaan

4.1 Perbedaan Data Mining dan Data Warehouse


Teknologi data warehouse digunakan untuk melakukan OLAP (On-line Analytical
Processing) , sedangkan data mining digunakan untuk melakukan information discovery
yang informasinya lebih ditujukan untuk seorang Data Analyst dan Business Analyst
(dengan ditambah visualisasi tentunya). Dalam prakteknya, data mining juga mengambil
data dari data warehouse. Hanya saja aplikasi dari data mining lebih khusus dan lebih
spesifik dibandingkan OLAP mengingat database bukan satu-satunya bidang ilmu yang
mempengaruhi data mining.

DAFTAR PUSTAKA
https://ellymunig.wordpress.com/2014/03/24/metode-data-mining/

http://funpreuner.blogspot.co.id/2011/02/pertemuan-1-pengertian-dan-macam-macam.html

http://yayanhendrian.blogspot.co.id/2013/05/metode-klasifikasi-asosiasi-dan.html

Sumber : http://ishwara.us/metode-data-mining/

Anda mungkin juga menyukai