Anda di halaman 1dari 17

CLASSICAL PROGRAMMING

VS MACHINE LEARNING

Orang menulis rule dalam


bentuk kode aplikasi

Model (komputer) dilatih


menggunakan data

Mehra, Sidharth & Hasanuzzaman, Mohammed. (2020). Detection of


Offensive Language in Social Media Posts
LINEAR REGRESSION

y = y actual
ŷ = y predicted
ӯ = y mean
Source: A general introduction to data analytics - Moreira, et al (2019)
K-Nearest Neighbors
Confusion Matrix
https://www.youtube.com/c/AnakAI
https://www.youtube.com/c/AnakAI
https://www.youtube.com/c/AnakAI
https://www.youtube.com/c/AnakAI
ROC & AUC

https://www.youtube.com/c/AnakAI
Kapan Perlu Menggunakan
Unsupervised Learning?

 Tidak ada variabel respon/target yang jelas


 Untuk mengekstrak struktur dari data
 Tidak ada struktur/pola yang terlihat
 Jika perlu digunakan ekstraksi fitur
Ekstraksi fitur adalah proses membuat yang
baru fitur dari yang sudah ada Fitur baru ini
bahkan bisa lebih kuat dari fitur asli.

Sumber: Denny, PhD


Clustering Evaluation
“A good clustering results should have compact and separated clusters”

Silhouette Coefficient combines ideas of both


cohesion and separation, but for individual
points, as well as clusters and clustering

For an individual point, i


o a = average distance of i to the points in the
same cluster
o b = min (average distance of i to points in
another cluster)

silhouette coefficient of i:
Elbow Method
Silhouette Scores
The major difference
between elbow and
silhouette scores is that
elbow only calculates the
euclidean distance
whereas silhouette takes
into account variables
such as variance,
skewness, high-low
differences, etc
OVERFITTING VS UNDERFITTING

• Model yang baik adalah model yang tidak underfitting maupun


overfitting.
https://www.youtube.com/c/AnakAI

Anda mungkin juga menyukai