Q
Q
Kelas : 7SIC5
1. Perbedaan yang harus dikenali oleh Data Scientist adalah output dari keduanya. Supervised
Learning merupakan proses pengelompokan data yang telah memiliki label dan akan
dikelompokkan berdasarkan labelnya. Untuk mendapatkan label tentunya harus melakukan
proses training terlebih dahulu. Contohnya, kita memiliki 3 kriteria dengan skalanya masing
masing. Misalkan Suhu tinggi (1), batuk (0), sesak napas (0) maka corona (0), dimana angka 1
menunjukkan "ya" dan angka 0 menujukkan "tidak".
Sedangkan Unsupervised Learning merupakan proses pengelompokan data yang tidak
memiliki label. Sehingga kita bebas menentukan berapa jumlah kelompok data yang akan
dibuat, misalnya menjadi 2, 3 atau seterusnya. Tentunya dalam pengelompokan ini juga
berdasarkan karakteristiknya yang sama. Nah, untuk outputnya sendiri tentunya akan
berbeda dengan supervised learning. Karena outputnya belum diketahui, maka kita dapat
membuatnya sendiri dengan mengelompokkannya.
2. Object X masuk ke Class II
3. If attr A <= 50 and Attr C < 20 Then Class I
If attr A <= 50 and Attr C >= 20 and Attr B = 10 Then Class I
If attr A <= 50 and Attr C >= 20 and Attr B = 0 Then Class II
If attr A < 5 and Attr B = 0 Then Class I
If attr A < 5 and Attr B = 10 and Attr A < 20 Then Class II
If attr A < 5 and Attr B = 10 and Attr A >= 20 Then Class III
4. Akurasi = TP + TN / Total
= 5800 + 2900 / 10000
= 87%
Kasus:
1. Root adalah gini terkecil: atribut ‘Jenis Mobil’
ID 21?
P(21 | Class C0) = 0.4 * 0.1 * 0.2 * 0.5 = 0.004
P(21 | Class C1) = 0.5 * 0.7 * 0.2 * 0.5 = 0.035