Anda di halaman 1dari 12

Machine learning

03
Modul ke:

Materi Minggu 3: Supervised learning dan Decision Tree


Buku Acuan: A. C. Muller dan S. Guido, Introduction to Machine Learning with Python.
California: O’ Reilly Media Inc, 2016.
Fakultas
FASILKOM I Putu Edy Suardiyana Putra, Ph.D.

Program Studi
Teknik
Informatika
Supervised learning
• Topik minggu ini akan membahas materi tentang supervised
learning dan salah satu algoritma supervised learning yaitu
Decision Tree.
• Supervised learning merupakan kategori machine learning
yang membutuhkan “contoh data” untuk ”belajar”
(supervised). Contoh data ini sering disebut dengan labelled
training set (training set yang berlabel).
• Training set ini akan digunakan untuk melatih komputer dalam
memprediksi sesuatu.
• Supervised learning terbagi menjadi 2 kategori:
– Klasifikasi
– Regresi
• Pertemuan kali ini akan membahas tentang kategori klasifikasi.
Supervised learning (2)
• Berikut contoh ilustrasi proses belajar dari supervised learning
(kategori klasifikasi). Output dari proses ini akan kita sebut
sebagai “model”.

Contoh data sapi

Contoh data sapi

Contoh data sapi


Supervised learning (3)

• Setelah mendapat model, maka langkah


selanjutnya adalah mengklasifikasikan data
yang belum memiliki label (unlabelled
dataset).
Sapi

Unlabelled
dataset Bukan sapi
Decision Tree

• Decision Tree merupakan salah satu algoritma


yang masuk ke dalam kategori supervised
learning.
• Decision Tree bisa digunakan untuk klasifikasi
maupun regresi.
• Secara konsep, decision tree digambarkan
sebagai sebuah pohon, di mana node/daun
nya merepresentasikan sebuah pertanyaan
dan cabangnya akan menghubungkan kita ke
pertanyaan-pertanyaan selanjutnya.
Decision Tree (DT)

Contoh decision tree untuk mengklasifikasikan data hewan menjadi 4 kategori


Implementasi DT

• Pada slide ini, akan dipaparkan bagaimana


melakukan implementasi DT dengan
menggunakan Python.
• Bagi yang tertarik untuk mendalami formula
matematika dari DT, silahkan baca .pdf yang
terlampir di e-learning.
• Slide ini akan membahas implementasi DT
menggunakan Python.
• Library yang diperlukan adalah Scikit-learn
(https://scikit-learn.org/)
Contoh
• Pada contoh kali ini, kita akan membuat
sebuah model yang mampu membedakan
antara manusia dan sapi menggunakan DT.
• Fitur yang digunakan adalah jumlah kaki,
jumlah tangan, dan berat badan
• Adapun training set yang diperlukan adalah:
No. Jumlah kaki Jumlah Berat Label
tangan badan
1 2 2 50 kg Manusia
2 2 2 45 kg Manusia
3 4 0 300 kg Sapi
4 4 0 255 kg Sapi
Contoh (2)

• Untuk menguji model ini, maka dipersiapkan


sebuah unlabelled data di bawah ini:
No. Jumlah kaki Jumlah Berat Label
tangan badan
1 2 2 30 kg ?

• Di contoh kali ini kita akan memprediksi label


data di atas. Apakah manusia atau sapi?
Contoh (3)
• Berikut contoh code-nya. Dari hasil code ini,
dapat dilihat bahwa unlabelled data tersebut
merupakan data manusia
Latihan

• Dengan menggunakan DT dari Scikit-learn,


silahkan prediksi unlabelled data berikut
(gunakan training set yang ada di slide 8):

No. Jumlah kaki Jumlah Berat Label


tangan badan
1 2 2 30 kg ?
2 4 0 332 kg ?
3 2 2 150 kg ?
Terima Kasih
I Putu Edy Suardiyana Putra, Ph.D.

Anda mungkin juga menyukai