Anda di halaman 1dari 2

TUGAS CO 4

NAMA : Felix Ogustino


NIM : 17/412636/PA/17955

2 Algoritma Clustering (K-MEANS CLUSTERING, K-MEDIAN CLUSTERING)


1 Algoritma Prediksi (LINEAR REGRESSION)

K-MEANS CLUSTERING

K-Means Clustering merupakan salah satu algoritma ​Unsupervised Learning atau


pembelajaran tanpa ada label atau target (​unlabelled data)​ . Tujuan dari algoritma ini
adalah mengelompokan n data dengan sistem partisi ke beberapa kelompok atau
kluster sebanyak K variabel dengan melihat kemiripan fitur-fitur data sehingga
mendapatkan pola unik dari data. K kluster atau kelompok tidak ada yang tumpang
tindih atau yang beririsan sehingga suatu data pasti masuk hanya ke satu kluster
atau kelompok tertentu.

Dalam Algoritma ini pertama sekali yang harus dilakukan adalah menentukan
banyaknya kluster atau menentukan variabel K. Penentuan banyaknya kluster
tergantung pada kasus permasalahan. Setelah itu menentukan ​centroid ​atau pusat
dari masing-masing kluster tersebut. Penentuan pusat kluster dapat dilakukan
dengan berbagai cara seperti penentuan secara ​random​ dan metode lain.

Setiap data yang ada dimasukkan ke dalam kluster berdasarkan jarak square
euclidean terkecil ke sentroid dari masing-masing kluster. Setelah mengkategorikan
setiap data ke kluster yang ada, sentroid dari masing-masing kluster akan diupdate
dengan menghitung rata rata nilai pada kluster tersebut. Langkah-langkah diatas
akan diulangi hingga memenuhi kriteria tertentu. Demikian Algoritma K-Means
Clustering.

LINEAR REGRESSION

Linear Regression merupakan salah satu algoritma ​Supervised Learning atau


pembelajaran dengan label atau target (​labelled data)​ dimana target atau labelnya
adalah suatu nilai kontinu. Tujuan dari metode ini adalah memprediksi nilai kontinu
jika diberikan suatu sampel data dengan terlebih dahulu membuat suatu garis linear
yang dijadikan sebagai acuan untuk memprediksi. Model ini mencari hubungan
linear antara variabel independen ​x atau input dengan variabel dependen ​y a ​ tau
target. Garis linear yang dibuat oleh algoritma ini dapat dimodelkan dengan
persamaan linear biasa seperti berikut
Dimana y merupakan ​ouput​, x merupakan ​input, theta1 adalah gradien dan theta2 adalah
intercept.​ Algoritma ini mencoba untuk menemukan nilai theta1 dan theta2 yang paling
optimal sehingga mendapatkan suatu garis linear yang dapat merepresentasikan data
secara baik dan tepat. Cara menemukan theta1 dan theta2 yang optimal adalah dengan
menggunakan algoritma ​Gradient Descent yang mana meminimalkan ​Cost Function (​Mean
Square Error​) dari kedua koefisien tersebut.

K-MEDIAN CLUSTERING

K-Median Clustering merupakan salah satu algoritma ​Unsupervised Learning atau


pembelajaran tanpa ada label atau target (​unlabelled data​) yang mirip dengan
algoritma K-Means Clustering. K-Median Clustering lebih baik digunakan untuk
mengatasi data ​outlier​. Tujuan dari algoritma ini sama dengan algoritma K-Means
Clustering yaitu mengelompokan n data dengan sistem partisi ke beberapa
kelompok atau kluster sebanyak K variabel dengan melihat kemiripan fitur-fitur data
sehingga mendapatkan pola unik dari data. K kluster atau kelompok tidak ada yang
tumpang tindih atau yang beririsan sehingga suatu data pasti masuk hanya ke satu
kluster atau kelompok tertentu. Perbedaannya terhadap K-Means Clustering
terdapat didalam cara mengelompokkan suatu data.

Dalam Algoritma ini pertama sekali yang harus dilakukan mirip dengan K-Means
Clustering yaitu menentukan banyaknya kluster atau menentukan variabel K.
Penentuan banyaknya kluster tergantung pada kasus permasalahan. Setelah itu
menentukan ​centroid ​atau pusat dari masing-masing kluster tersebut. Penentuan
pusat kluster dapat dilakukan dengan berbagai cara seperti penentuan secara
random​ dan metode lain.

Setiap data yang ada dimasukkan ke dalam kluster berdasarkan jarak manhattan
terkecil ke sentroid dari masing-masing kluster, tidak berdasarkan jarak euclidean
yang digunakan oleh K-Means Clustering. Setelah mengkategorikan setiap data ke
kluster yang ada, sentroid dari masing-masing kluster akan di​update ​dengan
mengambil nilai median pada kluster tersebut​, disini letak perbedaannya dengan
K-Means Clustering. Langkah-langkah diatas akan diulangi hingga memenuhi
kriteria tertentu. Demikian Algoritma K-Median Clustering.

Anda mungkin juga menyukai