Anda di halaman 1dari 3

TUGAS 4

DATA MINING

Tugas ini Disusun Untuk Memenuhi Mata Kuliah


DATA MINING
DosenPengampu :IRA ZULFA, S.T.,M.CS

Disusun oleh :
Hamdi Abdullah
(190401051)

FAKULTAS TEKNIK

PRODI TEKNIK INFORMATIKA

UNIVERSITAS GAJAH PUTIH TAKENGON


TAHUN 2022 / 2023
Carilah dua metode data mining yang kamu minati dan jelaskan !

1. Metode K-Means
K-means merupakan salah satu algoritma yang bersifat unsupervised learning. K-Means memiliki
fungsi untuk mengelompokkan data ke dalam data cluster. Algoritma ini dapat menerima data tanpa
ada kategori label. K-Means Clustering Algoritma juga merupakan metode non-hierarchy. Metode
Algoritma Clustering adalah mengelompokkan beberapa data ke dalam kelompok yang menjelaskan
data dalam satu kelompok memiliki karakteristik yang sama dan memiliki karakteristik yang berbeda
dengan data yang ada pada kelompok lain. Cluster Sampling adalah teknik pengambilan sampel di
mana unit-unit populasi dipilih secara acak dari kelompok yang sudah ada yang disebut 'cluster, nah
Clustering atau klasterisasi adalah salah satu masalah yang menggunakan teknik unsupervised
learning.

K-Means Clustering adalah suatu metode penganalisaan data atau metode Data Mining yang
melakukan proses pemodelan unssupervised learning dan menggunakan metode yang
mengelompokan data berbagai partisi.

K Means Clustering memiliki tujuan yaitu meminimalisasi fungsi objek yang telah di atur pada proses
klasterisasi. Dengan cara minimalisir variasi antar 1 cluster dengan maksimalisasi variasi dengan data
di cluster lainnya.

K means clustering merupakan metode algoritma dasar yang diterapkan sebagai berikut:

 Menentukan jumlah cluster.


 Secara acak mendistribusikan data cluster.
 Menghitung rata rata dari data yang ada di cluster..
 Menggunakan langkah baris 3 kembali sesuai nilai treshold.
 Menghitung jarak antara data dan nilai centroid (K berarti pengelompokan).
 Distance space dapat diimplementasikan untuk menghitung jarak data dan centroid. Contoh
penghitungan jarak yang sering digunakan adalah manhattan/city block distance.

Tujuan

Algoritma Clustering (K-Means) memiliki tujuan untuk meminimalisasikan fungsi tujuan yang telah
di set dalam proses clustering. Tujuan tersebut dilakukan dengan cara meminimalisasi data variasi
yang ada di dalam cluster dan memaksimalkan data variasi yang ada di cluster lainnya.

Karakteristik K-Means Cluster:

 Pengelompokan cepat dalam proses.


 Sensitif terhadap nilai centroid.
 Hasil dari Kmeans selalu berubah ubah(dikarenakan tidak unik).
 Sulit meraih global optimum.
 Kekurangan dari pengelompokan K-Means.

Kekurangan :

 model cluster berbeda ditemukan.


 sulit untuk memilih jumlah cluster yang tepat.
 Tumpang tindih.
 Kegagalan dalam pertemuan.
2. Metode SVM (Support Vector Machine)
Adalah teknik utama yang dioperasikan dalam penambangan data. Teknik ini sering diterapkan pada
sejumlah besar kumpulan data untuk memecahkan suatu masalah dalam suatu penelitian. Klasifikasi
ini sendiri merupakan metode pemisahan dan pengelompokan data yang melibatkan data latih dengan
menggunakan algoritma klasifikasi.

Support Vector Machine atau SVM adalah algoritme pembelajaran mesin yang diawasi yang dapat
digunakan untuk klasifikasi dan regresi. Cara kerja SVM didasarkan pada SRM atau Structural Risk
Minimization yang dirancang untuk mengolah data menjadi Hyperplane yang mengklasifikasikan
ruang input menjadi dua kelas. Teori SVM diawali dengan pengelompokan kasus-kasus linier yang
dapat dipisahkan dengan hyperplane dan dibagi menurut kelasnya.

Konsep SVM diawali dengan masalah klasifikasi dua kelas sehingga membutuhkan set pelatihan
positif dan negatif. SVM akan berusaha mendapatkan hyperplane (pemisah) sebaik mungkin untuk
memisahkan kedua kelas dan memaksimalkan margin kedua kelas tersebut. Berikut adalah visualisasi
klasifikasi SVM dengan mencari hyperplane yang membedakan kedua kelas tersebut:

Ada 2 metode dalam support vector machine:

 Metode Linear
Model linier memiliki sifat penting baik dari aspek komputasi dan analitis. Penggunaan model
linier dengan pendekatan parametrik dalam metode klasik memiliki aplikasi praktis yang
terbatas karena kutukan dimensionalitas.

Terdapat 2 pendekatan dalam metode linier: pendekatan alternatif adalah membuat fungsi
basis adaptif terhadap data latih dengan sejumlah fungsi basis yang telah ditentukan,
pendekatan nonparametrik yaitu mendefinisikan data latih sebagai basis pusat.

 Metode Kernel
Fungsi kernel adalah fungsi k yang untuk semua vektor masukan x, z akan memenuhi syarat k
(x,1= φ (x) Tφ (z) dimana φ (.) Merupakan fungsi pemetaan dari ruang masukan ke ruang
fitur. Fungsi kernel adalah untuk mengimplementasikan model dalam ruang dimensi yang
lebih tinggi tanpa harus menentukan fungsi pemetaan dari ruang masukan ke ruang fitur.
Salah satu contoh fungsi kernel yang banyak digunakan adalah Gaussian radial basis function
(RBF), yaitu: k (x, x ‘) = φ (|| xx’ ||) = exp (- || xx ‘|| 2 / 2s2) di mana x ‘adalah “inti” yang
dipilih dari data pelatihan.

Anda mungkin juga menyukai